Illustration prédire les phénotypes
Prédire

Prédire

Axe 2 : Prédiction des phénotypes et réponses aux changements de champs de contraintes

Cet axe porte sur la prédiction des phénotypes de la cellule à l’individu et à la population, de leurs fonctionnalités et des réponses aux changements de champs de contraintes (environnement biotique et abiotique, modes de gestion, pratiques).

L’un des défis de la biologie numérique tient à l’élaboration, la comparaison et l’amélioration de méthodes d’apprentissage, en les adaptant de façon à intégrer les données multi-sources (omiques, capteurs, environnement, données issues de démarches participatives). La modélisation de processus biologiques et physiologiques permettant le développement d’approches prédictives et la simulation de systèmes biologiques complexes constituent également des enjeux majeurs. Il s’agit notamment de tester la robustesse de modèles construits dans l’axe 1, en les soumettant à des conditions fluctuantes (internes ou externes).

Ces recherches incluent des approches prédictives reposant sur la modélisation, l’assimilation de données et le couplage entre les approches dites « datadriven » et « concept-driven », en tenant compte  des dimensions essentielles de la prédiction que sont la planification, la quantification des incertitudes et l’évaluation de la qualité prédictive.

Thématiques de recherche

  • La prédiction génomique ;
  • La prise en compte de l’ensemble des facteurs transmissibles - qu’ils soient génétiques ou non - dans la prédiction du potentiel d’un individu à transmettre ses caractéristiques à sa descendance ;
  • L’application de ces méthodes pour identifier des bio-marqueurs d’état ou de potentiel des organismes (niveau de résistance, niveau de stress, …), ou des cibles génétiques pour l’optimisation de réseaux métaboliques ;
  • La prédiction des impacts de scénarios complexes d’exposition chimique et biologique sur la physiologie (de l’échelle de la cellule à celle de l'individu) ;
  • La mobilisation des informations d’état (phénotype, génome, environnement) et des connaissances sur les processus aux échelles des organismes (et infra) pour prédire le fonctionnement et les trajectoires de populations à différentes échelles spatiales et/ou temporelles.

Défis méthodologiques

  • Sélectionner les méthodes d’apprentissage les mieux adaptées à un problème donné, déterminer leurs apports et de leurs limites pour détecter des structures complexes ou des signaux faibles dans les données ;
  • Construire et simuler des modèles intégratifs avec de bonnes capacités prédictives, permettant de distinguer les effets de facteurs confondus dans les données ;
  • Accéder à des quantités non observables par l’inversion de modèles (e.g. estimation de la valeur de traits) ;
  • Accroître la qualité et la robustesse de la prédiction (avec les questions sous-jacentes de planification et d’échantillonnage, d’évaluation de l’incertitude, de prise en compte de changements d’environnements).

Dans ce dossier

Aujourd’hui, l’agriculture doit faire face à de nombreux défis, parmi lesquels le développement de certains pathogènes lié à la diminution de l’utilisation d’intrants dans un objectif d’agriculture durable ou aux effets du changement climatique. Dans ce contexte, de nombreuses questions se posent à court terme sur les capacités adaptatives de ces bio-agresseurs. Un insecte ravageur résistera t-il à la prochaine vague de chaleur ? Ou sera-t-il au contraire très affecté par la hausse des températures et cessera t-il d’être une menace ?

En génétique des plantes et des animaux, les programmes de sélection visent à identifier des individus dont les performances (rendement, résistance aux maladies ou à un stress environnemental) répondent à des critères préalablement définis. Cette sélection peut nécessiter l’acquisition de données, au champ ou en élevage, qui peut être coûteuse ou longue à réaliser. Le projet DeepPhenomic propose une alternative à cette technique.

Illustration thèse confinancée

Thèse de Maxime Delmas (Toxalim, soutenue en 2022). Les études en métabolomiques visent à extraire une signature métabolique (liste de métabolites) liée à une condition expérimentale particulière. Ces signatures permettent d'identifier des biomarqueurs ou de classer des individus, mais leur interprétation biologique et physiologique reste un défi. Ceci est essentiel, par exemple, lorsque l'objectif est d'associer les signatures métaboliques à des effets pathologiques potentiels.

Pour survivre, les plantes doivent puiser dans le sol de l'eau et de nombreux nutriments. Ces ressources sont inégalement réparties et les plantes doivent explorer le sol pour les trouver. Cette exploration nécessite l'extension des racines, ce qui représente un développement coûteux pour la plante.

Thèse de Felicia Maviane-Macia (LIMPE, soutenue en 2025). Ce travail vise à développer des outils logiciels afin de mieux comprendre la dynamique d’apparition des symptômes foliaires causés par des microorganismes pathogènes sur Arabidopsis et sur la vigne

Thèse d'Antoine Bourlier (PRC, 2022-2025). L’essor de méthodes d’imagerie cérébrale génère une masse considérable de données morphologiques et fonctionnelles. Pour autant, leur exploration puis leur comparaison au cours du temps pour un individu, entre individus, et plus encore entre espèces différentes n’ont pu être que partielles. Cette thèse vise à créer de nouveaux algorithmes d’analyses et de comparaisons anatomo-fonctionnelles d’encéphales à l’aide de méthodes classiques (théorie des graphes) mais aussi plus récentes.

Thèse de Clémentine Borrelli (SVQV, soutenue en 2025). La viticulture française doit aujourd’hui faire face aux effets du changement climatique avec une contrainte croissante portant sur la diminution de l’utilisation des produits phytosanitaires. Une des solutions pour y parvenir est la création de nouvelles variétés résistantes aux maladies. Cette thèse vise à décrypter le déterminisme génétique des populations du programme INRAE-ResDur en combinant analyses QTL et GWAS avec des modèles de prédiction génomiques, phénotypiques et métabolomiques, afin d’optimiser les stratégies de sélection de nouvelles variétés de vigne résistantes aux maladies.

Illustration thèse confinancée

Thèse d'Annaig de Walsche (GQE, soutenue en 2025). La détection de régions du génome (QTL, quantitative trait loci) associées à une variable réponse d’intérêt (phénotype) est un objectif classique de la statistique génétique, afin de reconstituer l’architecture génétique qui sous-tend la variabilité du phénotype. L’objectif de cette thèse est de développer un ensemble de méthodes pour la détection de QTLs à partir de panels caractérisés dans des expérimentations multi-environnements

Illustration thèse confinancée

Thèse d'Elfried Salanon (UNH, soutenue en 2025). Cette thèse vise à étudier les trajectoires d’installation du syndrome métabolique (SMet), devenu un enjeu important de santé publique du fait de sa prévalence croissante, en particulier dans la population âgée souffrant de maladies chroniques.

Thèse de Noémien Maillard (2023 - 2025, UMR GenPhyse). La compréhension des liens entre génotype et phénotype chez les animaux d’élevage est essentielle pour accompagner la transition agroécologique. Ce travail de thèse vise à évaluer des modèles d’apprentissage profond, entraînés chez l'homme ou la souris, pour mieux comprendre le rôle de variants non codants chez les animaux d’élevage.

  • 1 (current)