Projet exploratoire DINAMIC (2022 - 2023)

Etude de la plasticité des réseaux biologiques hétérogènes par les modèles à copules

La biologie intégrative se base sur l'étude de réseaux biologiques complexes. Comprendre la plasticité des réseaux d'interactions biologiques due à la variabilité phénotypique, environnementale ou interventionnelle est un enjeu important dans des domaines aussi variés que la génomique ou la nutrition humaine. De telles études intègrent souvent des comparaisons entre groupes contrastés, incluant des variables de diverses natures (continues, comptages, binaires, …). Ces données dites « de type mixte » peuvent être difficiles à analyser de manière unifiée. Alors que les modèles probabilistes multivariés représentent un cadre solide pour déduire les interrelations entre les variables continues, un modèle analogue pour les données de type mixte reste à définir.

Contexte et enjeux

Une approche particulièrement prometteuse, mais encore inexplorée à cette fin, est l'utilisation de modèles de copules paramétriques, qui peuvent être utilisés pour coupler des variables de natures disparates. Un modèle à copules permet de décomplexifier les relations entre plusieurs mesures : un modèle plus simple est défini indépendamment pour chaque variable, et une fonction dite « copule » est ensuite construite pour les lier. Ces modèles peuvent ainsi être utilisés pour coupler des variables de natures disparates. Le développement d'un tel modèle sous forme graphique et efficace en temps de calcul représente donc un défi méthodologique ouvert pour l'inférence de réseaux génériques à partir de données de type mixte.

Objectifs

le projet DINAMIC, vise à développer et à implémenter un cadre multivarié innovant et largement applicable basé sur des copules et une vraisemblance par paires aléatoires (Mazo et al., 2021) pour l'analyse différentielle de réseaux de type mixte.

Ces développements méthodologiques s’appuieront sur une succession de trois applications couvrant plusieurs thématiques de recherche à INRAE ​​:

  • réseaux de santé cognitive chez des seniors suite à l'introduction de suppléments nutritionnels;
  • réseaux phénotypiques en réaction à un stress thermique dans des lignées de maïs structurées selon leur proximité génétique ;
  • réseaux multi-omiques du sperme dans des groupes de taureaux à fertilité contrastée.

Chaque application motivera une facette distincte de notre approche, mettant en évidence la valeur ajoutée de notre collaboration interdisciplinaire. Pour combiner des développements statistiques théoriquement solides et efficaces en calcul avec des hypothèses de modélisation pertinentes alignées avec la biologie sous-jacente, le projet DINAMIC s’appuie sur un cycle continu d'interactions entre les méthodologistes et les experts du domaine.

Notre modèle multivarié de réseaux de type mixte correspondra à une nouvelle approche de biologie numérique, avec le potentiel de générer de nouvelles connaissances sur la plasticité des réseaux dans une large variété de disciplines scientifiques.

Contact :

Andrea Rau, GABI

Acteurs du projet

Unités INRAE impliquées

Département BAP

Expertise

UMR GABI

Biostatistique

 

UMR Transfrontalière BIoEcoAgro

Génétique quantitative, génomique végétale

 

UMR GQE Le Moulon

Analyse omique

 

Département MathNum

UMR MaIAge

Statistiques, mathématiques

 

Département PHASE

UMR BREED

Génomique animale

 

Département ALIM-H

UMR NutriNeuro

Nutrition humaine

 

Partenaires extérieurs

Grèce

Expertise

Athens University of Economics and Business

Statistique et méthodologique

PUBLICATIONS

  • Gildas Mazo, Dimitris Karlis, Andrea Rau. A randomized pairwise likelihood method for complex statistical inferences. Journal of the American Statistical Association, 2023, ⟨10.1080/01621459.2023.2257367⟩. ⟨hal-03126620v5⟩ 

COMMUNICATIONS

  • Mazo, G. Karlis, D., and Rau, A. (2022) Modeling count data with copulas. Statistical Methods for Post Genomic Data (SMPGD), online.
  • Andrea Rau, Gildas Mazo, Dimitris Karlis. A randomized pairwise likelihood method for complex statistical inferences. Séminaire statistique de Paris, Feb 2022, Paris, France. ⟨hal-04173240⟩ 
  • Rau, A., on behalf of the DINAMIC consortium (2022-09-13) Poster: DINAMIC: Differential network analysis of mixed-type data with copulas. Journées Scientifiques du Département de Génétique Animale, Bordeaux.
  • Rau, A., on behalf of the DINAMIC consortium (2022-12-08) DINAMIC: Differential network analysis of mixed-type data with copulas. Métaprogramme DIGIT-BIO seminar, Lyon.
  • Gildas Mazo, Dimitris Karlis, Andrea Rau. A randomized pairwise likelihood method for complex statistical inferences. Workshop on Dependence Modeling, Sep 2022, Agistri, Greece. ⟨hal-04249010⟩ 

 Package R

rpl R package: https://github.com/andreamrau/rpl