Modéliser l’héritabilité des caractères à partir de données de comptage

La compréhension du déterminisme génétique d’un caractère, c’est-à-dire de l'ensemble des gènes impliqués dans l'élaboration et l'expression de ce caractère, est un enjeu majeur pour mieux appréhender les processus biologiques et appuyer les programmes d’amélioration génétique.

Contexte et enjeux

Le récent développement des outils de génotypage et de séquençage massif, qui permettent le séquençage rapide de plusieurs milliers à millions de molécules d'ADN ou d’ARN simultanément, ont considérablement accru la puissance des dispositifs expérimentaux dans ce domaine, entraînant de nouveaux enjeux d’analyse de données massives de séquençage.

Dans ce contexte, l’une des problématiques émergentes est l'analyse de données qui correspondent à un nombre d’évènements observés (données de comptage). En effet, l'analyse de ce type de données par des modèles linéaires généralisés hiérarchiques est notoirement difficile, en particulier lorsqu'il s'agit d'estimer l'héritabilité des caractères.

Le consortium Behind the count'her propose d'utiliser des développements statistiques récents pour adapter un modèle permettant d'estimer des paramètres génétiques. Il s'appuiera sur deux cas d'application dans le domaine de l’élevage : la distribution des recombinaisons le long du génome et la diversité du méta-génome ruminal.

Objectifs

Des partenaires du consortium ont récemment proposé un modèle statistique flexible pour les données de comptage, basé sur la distribution Poisson-lognormale, qui permet de modéliser et d’estimer en temps raisonnable des effets complexes : structure de covariance, clustering et réduction de dimension, inférence de réseaux … Cependant, l'adaptation de ce modèle au contexte de l'inférence de paramètres génétiques demande des développements spécifiques.

Le consortium Behind The Count Her propose donc de réunir des équipes de génétique quantitative et de statistique pour développer conjointement de nouveaux modèles statistiques pour l'analyse de données de comptage.

Les développements s'appuieront sur deux contextes d'études permettant de balayer un large spectre d'applications :

La modélisation de données de répartition des crossing-overs sur le génome lors de la méiose (pour laquelle les gènes impliqués et leurs variations restent inconnus dans de nombreuses espèces).
L’analyse de la diversité du méta-génome entre individus et l’utilisation de ces résultats pour mesurer l'effet du microbiote sur d'autres caractères.

Les ambitions du consortium Behind the Count'her sont à la fois méthodologiques et génétiques. Le consortium permettra à la fois de lever des verrous méthodologiques pour l'exploitation efficace des données de comptage et fournira également de nouvelles connaissances sur les effets génétiques des phénotypes de recombinaison et du microbiote.

Contacts :

Bertrand Servin

Acteurs du projets

Unités INRAE impliquées - Expertise

Département MathNum	Expertise
UMR MIA Paris Saclay	Modélisation statistique
UMR MAIAGE	Modélisation statistique, Génomique Evolutive
Département GA
UMR GenPhyse	Métagénomique, Génétique, statistique

Partenaires extérieurs

Université de Paris	Expertise
LPSM	Modélisation Statistique

Publications

Poster

Batardiere B., Kwon J., Chiquet J. pyPLNmodels: A Python package to analyze multivariate high-dimensional count data. 2025. HAL : hal-04738542v2.

Voir aussi

Références

J. Chiquet, M. Mariadassou and S. Robin: The Poisson-lognormal model as a versatile framework for the joint analysis of species abundances, Frontiers in Ecology and Evolution, 2021.
S. Fresco, C. Marie-Etancelin, A. Meynadier, G. Martinez-Boggio: Variation in Rumen Bacteria of Lacaune Dairy Ewes From One Week to the Next, Frontiers in Microbiology, 2022
H. Vassilief, M. Id Bella, D. Hazard, F. Tortereau, T. Faraut, S.E. Johnston, B. Servin: Sex differences in recombination maps are associated with differential hotspot usage in Sheep. Proceedings of the World Congress on Genetics Applied to Livestock Production, Rotterdam, 2022.

Date de modification : 10 juillet 2026 | Date de création : 11 octobre 2022 | Rédaction : Com

Nom du cookie	Finalité	Durée de conservation
Cookies de sessions CAS et PHP	Identifiants de connexion, sécurisation de session	Session
Tarteaucitron	Sauvegarde vos choix en matière de consentement des cookies	12 mois

Nom du cookie

Finalité

Durée de conservation

Cookies de sessions CAS et PHP

Identifiants de connexion, sécurisation de session

Session

Tarteaucitron

Sauvegarde vos choix en matière de consentement des cookies

12 mois

Nom du cookie	Finalité	Durée de conservation
atid	Tracer le parcours du visiteur afin d’établir les statistiques de visites.	13 mois
atuserid	Stocker l'ID anonyme du visiteur qui se lance dès la première visite du site	13 mois
atidvisitor	Recenser les numsites (identifiants unique d'un site) vus par le visiteur et stockage des identifiants du visiteur.	13 mois

Nom du cookie

Finalité

Durée de conservation

atid

Tracer le parcours du visiteur afin d’établir les statistiques de visites.

13 mois

atuserid

Stocker l'ID anonyme du visiteur qui se lance dès la première visite du site

13 mois

atidvisitor

Recenser les numsites (identifiants unique d'un site) vus par le visiteur et stockage des identifiants du visiteur.

13 mois