Illustration prédire les phénotypes
Prédire

Prédire

Axe 2 : Prédiction des phénotypes et réponses aux changements de champs de contraintes

Cet axe porte sur la prédiction des phénotypes de la cellule à l’individu et à la population, de leurs fonctionnalités et des réponses aux changements de champs de contraintes (environnement biotique et abiotique, modes de gestion, pratiques).

L’un des défis de la biologie numérique tient à l’élaboration, la comparaison et l’amélioration de méthodes d’apprentissage, en les adaptant de façon à intégrer les données multi-sources (omiques, capteurs, environnement, données issues de démarches participatives). La modélisation de processus biologiques et physiologiques permettant le développement d’approches prédictives et la simulation de systèmes biologiques complexes constituent également des enjeux majeurs. Il s’agit notamment de tester la robustesse de modèles construits dans l’axe 1, en les soumettant à des conditions fluctuantes (internes ou externes).

Ces recherches incluent des approches prédictives reposant sur la modélisation, l’assimilation de données et le couplage entre les approches dites « datadriven » et « concept-driven », en tenant compte  des dimensions essentielles de la prédiction que sont la planification, la quantification des incertitudes et l’évaluation de la qualité prédictive.

Thématiques de recherche

  • La prédiction génomique ;
  • La prise en compte de l’ensemble des facteurs transmissibles - qu’ils soient génétiques ou non - dans la prédiction du potentiel d’un individu à transmettre ses caractéristiques à sa descendance ;
  • L’application de ces méthodes pour identifier des bio-marqueurs d’état ou de potentiel des organismes (niveau de résistance, niveau de stress, …), ou des cibles génétiques pour l’optimisation de réseaux métaboliques ;
  • La prédiction des impacts de scénarios complexes d’exposition chimique et biologique sur la physiologie (de l’échelle de la cellule à celle de l'individu) ;
  • La mobilisation des informations d’état (phénotype, génome, environnement) et des connaissances sur les processus aux échelles des organismes (et infra) pour prédire le fonctionnement et les trajectoires de populations à différentes échelles spatiales et/ou temporelles.

Défis méthodologiques

  • Sélectionner les méthodes d’apprentissage les mieux adaptées à un problème donné, déterminer leurs apports et de leurs limites pour détecter des structures complexes ou des signaux faibles dans les données ;
  • Construire et simuler des modèles intégratifs avec de bonnes capacités prédictives, permettant de distinguer les effets de facteurs confondus dans les données ;
  • Accéder à des quantités non observables par l’inversion de modèles (e.g. estimation de la valeur de traits) ;
  • Accroître la qualité et la robustesse de la prédiction (avec les questions sous-jacentes de planification et d’échantillonnage, d’évaluation de l’incertitude, de prise en compte de changements d’environnements).

Dans ce dossier

Illustration thèse confinancée

Thèse de Fanny Mollandin (GABI, soutenue en 2022). La sélection génomique a été mise en œuvre avec succès dans de nombreux programmes d'élevage au cours de la dernière décennie. L'un des moyens proposé récemment pour l'améliorer est l'utilisation de la biologie sous-jacente comme source complémentaire d'informations pour guider les prédictions pour les traits complexes.

Illustration thèse confinancée

Thèse de Camille Juigné (PEGASE, soutenue en 2023). Les phénotypes individuels d’intérêt susceptibles de contribuer à des systèmes de productions animales durables sont sous la dépendance de caractères complexes, au sens où un grand nombre de voies biologiques internes à l’animal sont impliquées. A l’échelle de l’organisme animal, il est important de définir quels sont les éléments-clés susceptibles de jouer un rôle pivot dans le contrôle du caractère et les interdépendances entre les réseaux d’entités biologiques qui y contribuent.

Illustration thèse confinancée

Thèse d'Annaig de Walsche (GQE, 2022-2025). La détection de régions du génome (QTL, quantitative trait loci) associées à une variable réponse d’intérêt (phénotype) est un objectif classique de la statistique génétique, afin de reconstituer l’architecture génétique qui sous-tend la variabilité du phénotype. L’objectif de cette thèse est de développer un ensemble de méthodes pour la détection de QTLs à partir de panels caractérisés dans des expérimentations multi-environnements

Thèse de Clémentine Borrelli (SVQV, 2022-2025). La viticulture française doit aujourd’hui faire face aux effets du changement climatique avec une contrainte croissante portant sur la diminution de l’utilisation des produits phytosanitaires. Une des solutions pour y parvenir est la création de nouvelles variétés résistantes aux maladies. L’objectif de cette thèse est de mettre au point des modèles de prédiction de la valeur génétique de ces variétés résistantes.

Thèse de Felicia Maviane-Macia (LIMPE, 2022-2025). Ce travail vise à développer des outils logiciels afin de mieux comprendre la dynamique d’apparition des symptômes foliaires causés par des microorganismes pathogènes sur Arabidopsis et sur la vigne

Illustration thèse confinancée

Thèse d'Elfried Salanon (UNH, 2022-2025). Cette thèse vise à étudier les trajectoires d’installation du syndrome métabolique (SMet), devenu un enjeu important de santé publique du fait de sa prévalence croissante, en particulier dans la population âgée souffrant de maladies chroniques.

Thèse d'Antoine Bourlier (PRC, 2022-2025). L’essor de méthodes d’imagerie cérébrale génère une masse considérable de données morphologiques et fonctionnelles. Pour autant, leur exploration puis leur comparaison au cours du temps pour un individu, entre individus, et plus encore entre espèces différentes n’ont pu être que partielles. Cette thèse vise à créer de nouveaux algorithmes d’analyses et de comparaisons anatomo-fonctionnelles d’encéphales à l’aide de méthodes classiques (théorie des graphes) mais aussi plus récentes.

Thèse d’Elise Jorge (GenPhyse, 2023-2025). Ce travail de thèse, à l’interface entre à l’interface en statistique, biologie moléculaire et génomique fonctionnelle, propose de développer une méthode d’analyse différentielle de données Hi-C pour identifier les zones de modification de la structure génomique 3 D.

Thèse d'Alexandre Asset (BREED /MIA-PS, 2024 - 2026). Dans la continuité du parcours EPINUM, cette thèse propose d’utiliser des approches d’IA pour améliorer la prédiction phénotypique à partir de données épigénétiques.

OBAMA © Pexels Sarai Zuno

La sélection génétique animale a connu une véritable révolution depuis quelques années, grâce à l’avènement de la génomique, qui a permis sélectionner plus facilement certains phénotypes essentiels aux programmes de sélection. Cependant, relier des variations génétiques détectées à des caractères phénotypiques d’intérêt reste toujours compliqué. Le projet interdisciplinaire OBAMA propose de combiner l’IA et la génomique pour mieux comprendre l’influence des facteurs génétiques sur les phénotypes chez le porc.

  • 1 (current)