bandeau general DIGIT-BIO V4.jpg
Thèse de Noémien Maillard (2023 - 2025)

Intelligence Artificielle pour la Génétique Translationnelle en Agronomie

Thèse de Noémien Maillard (2023 - 2025, UMR GenPhyse). La compréhension des liens entre génotype et phénotype chez les animaux d’élevage est essentielle pour accompagner la transition agroécologique. Ce travail de thèse vise à évaluer des modèles d’apprentissage profond, entraînés chez l'homme ou la souris, pour mieux comprendre le rôle de variants non codants chez les animaux d’élevage.

  • Date de démarrage : Septembre 2023
  • Unité d'accueil : GenPhyse
  • Centre INRAE : Occitanie Toulouse
  • École doctorale : Sciences Ecologiques, Vétérinaires, Agronomiques et Bioingéniéries (SEVAB)
  • Discipline / Spécialité : Bioinformatique, Deep Learning, Génétique
  • Directeurs de thèse : DEMARS Julie (UMR GenPhyse), MOURAD Raphaël (MIA-T)
  • Financement : PEPR Agroécologie et Numérique

La caractérisation génomique et fonctionnelle des animaux d’élevage apparait comme un levier pour la transition agroécologique via, entre autres, l’identification des liens génotype-phénotype. Les études d'association pangénome ont identifié des milliers de variants associés à des caractères agronomiques complexes.

Cependant, la majorité de ces variants ont été trouvés dans des régions génomiques non codantes, empêchant la compréhension du mécanisme biologique sous-jacent. Prédire les processus moléculaires basés sur la séquence d'ADN à l’aide des méthodes par apprentissage profond représente une approche prometteuse pour comprendre le rôle de ces variants non codants. L'apprentissage supervisé nécessite des séquences d'ADN associées à des données fonctionnelles pour l'entraînement, dont la quantité est fortement limitée chez les espèces d’élevage mais disponibles chez l’Homme. Ces espèces étant phylogénétiquement proches, on peut poser l’hypothèse que les mécanismes qui régulent leurs gènes sont proches.

Ce projet de thèse vise à :

  1. Évaluer la capacité de réseaux de neurones entraînés chez l’Homme et la souris à prédire des annotations fonctionnelles chez les espèces d’élevage ;
  2. Prédire l’impact de variants de régions génomiques associées à des caractères d’intérêt agronomique, afin de prioriser ces variants pour validation fonctionnelle en laboratoire. 
photo de Noemien Maillard © Noemien Maillard

Contact