Consortium Behind the Count her (2022 - 2023)

Modéliser l’héritabilité des caractères à partir de données de comptage

La compréhension du déterminisme génétique d’un caractère, c’est-à-dire de l'ensemble des gènes impliqués dans l'élaboration et l'expression de ce caractère, est un enjeu majeur pour mieux appréhender les processus biologiques et appuyer les programmes d’amélioration génétique.

Contexte et enjeux

Le récent développement des outils de génotypage et de séquençage massif, qui permettent le séquençage rapide de plusieurs milliers à millions de molécules d'ADN ou d’ARN simultanément, ont considérablement accru la puissance des dispositifs expérimentaux dans ce domaine, entraînant de nouveaux enjeux d’analyse de données massives de séquençage.

Dans ce contexte, l’une des problématiques émergentes est l'analyse de données qui correspondent à un nombre d’évènements observés (données de comptage). En effet, l'analyse de ce type de données par des modèles linéaires généralisés hiérarchiques est notoirement difficile, en particulier lorsqu'il s'agit d'estimer l'héritabilité des caractères.

Le consortium Behind the count'her propose d'utiliser des développements statistiques récents pour adapter un modèle permettant d'estimer des paramètres génétiques. Il s'appuiera sur deux cas d'application dans le domaine de l’élevage : la distribution des recombinaisons le long du génome et la diversité du méta-génome ruminal.

Objectifs

Des partenaires du consortium ont récemment proposé un modèle statistique flexible pour les données de comptage, basé sur la distribution Poisson-lognormale, qui permet de modéliser et d’estimer en temps raisonnable des effets complexes : structure de covariance, clustering et réduction de dimension, inférence de réseaux … Cependant, l'adaptation de ce modèle au contexte de l'inférence de paramètres génétiques demande des développements spécifiques.

Le consortium Behind The Count Her propose donc de réunir des équipes de génétique quantitative et de statistique pour développer conjointement de nouveaux modèles statistiques pour l'analyse de données de comptage.

Les développements s'appuieront sur deux contextes d'études permettant de balayer un large spectre d'applications :

  • La modélisation de données de répartition des crossing-overs sur le génome lors de la méiose (pour laquelle les gènes impliqués et leurs variations restent inconnus dans de nombreuses espèces).
  • L’analyse de la diversité du méta-génome entre individus et l’utilisation de ces résultats pour mesurer l'effet du microbiote sur d'autres caractères.

Les ambitions du consortium Behind the Count'her sont à la fois méthodologiques et génétiques. Le consortium permettra à la fois de lever des verrous méthodologiques pour l'exploitation efficace des données de comptage et fournira également de nouvelles connaissances sur les effets génétiques des phénotypes de recombinaison et du microbiote.

Contacts :

Acteurs du projets

Unités INRAE impliquées - Expertise

Département MathNum

Expertise

UMR MIA Paris Saclay

Modélisation statistique

UMR MAIAGE

Modélisation statistique, Génomique Evolutive

Département GA

UMR GenPhyse

Métagénomique, Génétique, statistique

Partenaires extérieurs

Université de Paris

Expertise

LPSM

Modélisation Statistique

 

Voir aussi

Références 

  • J. Chiquet, M. Mariadassou and S. Robin: The Poisson-lognormal model as a versatile framework for the joint analysis of species abundances, Frontiers in Ecology and Evolution, 2021.
  • S. Fresco, C. Marie-Etancelin, A. Meynadier, G. Martinez-Boggio: Variation in Rumen Bacteria of Lacaune Dairy Ewes From One Week to the Next, Frontiers in Microbiology, 2022
  • H. Vassilief, M. Id Bella, D. Hazard, F. Tortereau, T. Faraut, S.E. Johnston, B. Servin: Sex differences in recombination maps are associated with differential hotspot usage in Sheep. Proceedings of the World Congress on Genetics Applied to Livestock Production, Rotterdam, 2022.