Responsable : 
Emad, Amin

Établissement : 
Université McGill

Année de concours : 
2021-2022

La plupart des tissus sont établis dans les premières semaines suivant la conception, durant l’embryogenèse humaine. Au cours de cette période, des changements radicaux surviennent dans les programmes d’expression génique des cellules, orchestrés par un réseau de régulation transcriptionnelle (RRT) complexe composé de facteurs de transcription (FT) et de leurs gènes cibles. Les erreurs qui surviennent pendant cette période cruciale dans ces programmes causent de graves complications de la grossesse et des anomalies congénitales. L’élucidation de ces RRT est essentielle à une compréhension de base des mécanismes de formation des différents tissus humains, qui constitue le fondement pour l’étude des complications liées à la grossesse et à la naissance. Toutefois, en raison de considérations techniques, juridiques et éthiques, on dispose de peu de données sur les différents stades de l’embryogenèse humaine, qui se limitent aux profils instantanés d’expression génique (EXG) d’un petit nombre d’échantillons in vitro. Le déchiffrement de ces RRT nécessite donc des techniques de calcul avancées à même de surmonter les limites relatives aux données, d’intégrer différents types de données non appariées et de différencier clairement les mécanismes de régulation généraux de ceux relatifs à la lignée.

Je propose d’élaborer une telle approche, basée sur des techniques avancées d’apprentissage automatique (AA), et d’identifier les mécanismes de régulation en jeu dans la différenciation des divers tissus durant l’embryogenèse humaine. J’utiliserai une approche multiomique sur des lignées cellulaires correspondant à différents stades de l’embryogenèse. La nouvelle approche consistera en un cadre AA qui permettra d’intégrer différents types de données provenant de sources multiples, de modéliser l’effet simultané de plusieurs FT sur chaque gène cible présumé et de saisir l’influence de ces gènes dans l’embryogenèse. Contrairement à d’autres méthodes de reconstitution des RRT qui sont habituellement indépendantes du phénotype, mon approche intégrera directement l’information phénotypique dans la procédure de reconstitution des RRT afin de distinguer les relations de régulation liées à la filiation de celles d’ordre général.

Ce projet contribuera à l’avancement des connaissances dans de nombreuses disciplines, comme la biologie computationnelle, le développement embryonnaire, la biologie de la régulation et la recherche sur cellules souches. Le projet favorisera une compréhension de base des mécanismes biologiques de l’embryogenèse humaine, permettra d’identifier les principaux régulateurs de l’embryogenèse qui jouent des rôles importants dans les anomalies congénitales et établira une base pour l’étude de ces anomalies. De plus, il ouvrira la porte à la mise au point de thérapies par cellules souches pour le remplacement des tissus et la médecine régénérative. L’application de l’approche proposée ira bien au-delà de la compréhension de l’embryogenèse: cette méthode (qui sera mise en œuvre sous forme de logiciel accessible au public) fera progresser les outils actuels de reconstitution des réseaux de régulation et mettra en jeu de nouvelles approches d’analyse des données multiomiques provenant de différentes sources. Ainsi, il permettra aux biologistes expérimentaux de générer de nouvelles hypothèses afin de mieux comprendre la régulation des gènes liés à un résultat phénotypique et d’identifier de nouvelles cibles pour leurs expériences.