Illustration thèse confinancée
Thèse de Fanny Mollandin (2019 - 2022)

Incorporating known functional annotations into Bayesian genomic prediction models

Thèse de Fanny Mollandin (GABI, soutenue en 2022). La sélection génomique a été mise en œuvre avec succès dans de nombreux programmes d'élevage au cours de la dernière décennie. L'un des moyens proposé récemment pour l'améliorer est l'utilisation de la biologie sous-jacente comme source complémentaire d'informations pour guider les prédictions pour les traits complexes.

  • Thèse cofinancée
  • Dates : Octobre 2019 - novembre 2022
  • Unité d'accueilUMR GABI
  • Centre INRAE : Jouy en Josas
  • Université : Paris-Saclay
  • École doctorale : ABIES
  • Discipline / Spécialité : Mathématiques appliquées
  • Directrice de thèse : Andrea Rau (INRAE, GABI)
  • Encadrant(es) : Pascal Croiseau (INRAE, GABI)
  • Financement : Métaprogramme DIGIT-BIO / GENE-SWitCH (H2020 European Project)
  • Axe du métaprogramme : Axe 2 (Prédiction des phénotypes et réponses aux changements de champs de contraintes)

Résumé

La disponibilité généralisée et la baisse des coûts des technologies de génotypage à haut débit et de séquençage génomique ont ouvert la voie à des méthodes d'évaluation génomique, qui ont accéléré la mise en œuvre de l'évaluation génomique dans l'élevage pour de nombreuses espèces.

Les méthodes d'évaluation génomique partagent un objectif commun, à savoir estimer avec précision un phénotype ou une valeur d'élevage estimée à partir des effets d'un ensemble de polymorphismes nucléotidiques (single nucleotide polymorphisms ; SNP), c’est-à-dire de variations d’un nucléotide sur le génome. Les modèles de prédiction bayésiens ont rapidement été adoptés, capable d’évaluer simultanément les effets des SNPs, tout en étant flexibles. Ils ont aussi l’avantage de pouvoir incorporer des informations sur la distribution des SNPs par leur loi a priori.Une piste d'amélioration potentielle de ces modèles réside dans la hiérarchisation des SNPs potentiellement causaux. À cette fin, plusieurs actions et projets internationaux, dont le projet européen GENE-SWitCH, ont récemment commencé à concentrer des efforts importants pour mieux caractériser les processus fonctionnels intermédiaires reliant les génotypes aux phénotypes quantitatifs. En particulier, l'objectif est de compléter les données de génotypage par des données d'annotation fonctionnelle, telles que le niveau de méthylation ou l'accessibilité de la chromatine dans plusieurs tissus et à des stades de développement pertinents, afin de mieux identifier les SNP causaux. Un défi majeur dans l'exploitation de ces données fonctionnelles réside dans la gestion de leur hétérogénéité et de leur complexité.Dans ce projet de thèse, l’objectif est de développer et de valider des modèles bayésiens de prédiction génomique capables de pondérer les SNPs en fonction des informations extraites de ces annotations fonctionnelles. Nous visons à la fois une meilleure capacité prédictive et une meilleure interprétabilité des résultats. Dans ce but, nous avons étendu le modèle BayesRC, dans lesquelles les signaux des SNPs sont partitionnés en fonction d’une catégorisation disjointe, pour pouvoir utiliser des données d’annotations hétérogènes et chevauchantes. Nous proposons deux nouveaux modèles, BayesRCπ et BayesRC+, respectivement reposant sur une modélisation stochastique ou cumulative des annotations multiples, afin de prendre en considération les SNPs multi-annotés. Ces modèles ont été appliqués à des données simulées et réelles, et plusieurs façons de construire et d’interpréter les annotations ont été proposés.

Contact

Publications

  • Fanny Mollandin, Hélène Gilbert, Pascal Croiseau, Andrea Rau, 2022, Accounting for overlapping annotations in genomic prediction models of complex traits, https://doi.org/10.1186/s12859-022-04914-5, BMC Bioinformatics (publié)
  • Fanny Mollandin, Hélène Gilbert, Pascal Croiseau, Andrea Rau, 2022, Capitalizing on complex annotations in Bayesian genomic prediction for a backcross population of growing pigs (publié, short paper)
  • Fanny Mollandin, Andrea Rau, Pascal Croiseau, 2021, An evaluation of the interpretability and predictive performance of the BayesR model for genomic prediction. https://doi.org/10.1101/2020.10.23.351700, G3 (publié)

Communications

  • Fanny Mollandin, Hélène Gilbert, Pascal Croiseau, Andrea Rau, 2021, Exploiting prior knowledge into genomic prediction models with BayesRCO (poster), European Mathematical Genetics Meeting, Cambridge (UK)
  • Fanny Mollandin, Hélène Gilbert, Pascal Croiseau, Andrea Rau, 2020, Evaluating the predictive power and interpretability of the BayesR genomic prediction model (poster), Congrès Européen des Productions Animales (EAAP), Virtuel
  • Fanny Mollandin, Hélène Gilbert, Pascal Croiseau, Andrea Rau, 2022, Capitalizing on complex annotations in Bayesian genomic prediction for a backcross population of growing pigs, WCGALP (Rotterdam, Netherlands)
  • Fanny Mollandin, Hélène Gilbert, Pascal Croiseau, Andrea Rau, 2021, Extension of Bayesian genomic prediction models for the integration of functional annotations, Congrès Européen des Productions Animales (EAAP) (Davos, Switzerland)
  • Fanny Mollandin, Hélène Gilbert, Pascal Croiseau, Andrea Rau, 2022, Accounting for overlapping annotations as biological priors in genomic prediction models of complex traits, Séminaire MIA Paris-Saclay (Virtuel)
  • Baber Ali, Pascal Croiseau, Fanny Mollandin, 2021, Using a priori biological information to evaluate the ability of BayesRC model in genomic prediction, Congrès Européen des Productions Animales (EAAP) (Davos, Switzerland)
  • Fanny Mollandin, Pascal Croiseau, Andrea Rau, 2021, Evaluating the interpretability of SNP effect size classes in Bayesian genomic prediction models, European Mathematical Genetics Meeting (Virtuel)