Consortium MIMS (2022 - 2023)

Regards Méthodologiques Croisés pour l’Intégration de données Multi-sources

En biologie, comme dans d’autres domaines scientifiques, l’intégration de données multi-sources est plus que jamais d’actualité. En effet, les données collectées sont de plus en plus complexes et leur volume ne cesse de croître, du fait du développement des plateformes analytiques, des techniques d'imagerie ou de l'essor des données omiques.

Contexte et enjeux

Ce contexte a stimulé la recherche de nouvelles méthodes permettant de réaliser l’analyse conjointe de plusieurs tableaux de données (données structurées, multi-blocs, multi-voies) dans de nombreux domaines, comme par exemple :

  • En Machine Learning, où plusieurs approches sont considérées pour le traitement de données multisources (factorisation matricielle, approche probabiliste).
  • En chimiométrie, où différentes methodes sont proposées pour établir une cartographie chimique d’échantillons à l’aide de plusieurs techniques analytiques  (généralisations de l’analyse canonique, algorithme NIPALS et décompositions tensorielles)
  • En bioinformatique, où les approches méthodologiques intégratives permettent de dresser une image la plus complète possible de la dynamique des systèmes moléculaires. 

Devant la multitude d‘approches proposées (et de méthodes qui en résultent), l’utilisateur non spécialiste peut rester perplexe. Par ailleurs, si ces approches sont nombreuses, peu d’entre elles ont une visée prédictive.

Afin de contribuer à relever le défi de l’analyse et l’exploitation de ces données multi-sources dans une perspective exploratoire, mais également prédictive, il est indispensable de croiser différents regards, pratiques et paradigmes pour opérer un rapprochement entre ces différentes approches. Il est également nécessaire de favoriser la collaboration entre « générateurs de méthodes » et « générateurs de données » dans les différents domaines d’applications.

 C’est le défi que propose de relever le consortium MIMS, en regroupant une communauté interdisciplinaire, travaillant autour des approches d'analyse et d'intégration de données multi-sources

Objectifs

MIMS est un consortium pluridisciplinaire rassemblant plus de 60 chercheurs, qui a pour objectif de mener une réflexion sur l’analyse et l’exploitation de données multi sources, aussi bien dans une perspective exploratoire que prédictive.

Ce consortium regroupe des compétences pluridisciplinaires : traitement de l’information, sciences biologique et analytique. La mise en œuvre de cette pluridisciplinarité et son animation s’appuieront sur un partage de données, de pratiques et de méthodes entre les partenaires, dans le but de formaliser un projet scientifique pour relever un défi commun : l’analyse optimale des données multi-sources dans une finalité exploratoire et prédictive.

Contacts :

Acteurs du projets

Unités INRAE impliquées

Département TRANSFORM

Expertise

USC StatSC

Sensométrie, Chimiométrie, Statistique, Imagerie multispectrale

UR BIA

Chimiométrie, informatique

UR QuaPA

Volatolomique, Chimiométrie IRM, Analyse des données, Analyse d’images Système & data management

UMR SPO

Chimiométrie

LBE

biostatistique, machine learning

Département MATHNUM

UMR ITAP

Chimiométrie 

UMR MAIAGE

Méthodes statistiques en génétique quantitative, Analyse de données omiques

Département ALIM-H

CSGA Centre des Sciences du Goût et de l'Alimentation

Chimiométrie

UNH Unité Nutrition Humaine

Bioinformatique, metabolomique, Chimiométrie

PhAN

Nutrition périnatale et maladies métaboliques, Bioinformatique, Analyse de données, métagénomique et métabolomique

LABERCA

Métabolomique, Chimiométrie, Expologie, Epidémiologie

Département MICA

Micalis

Biologie/ Microbiote/ Analyse de données

Prose

Fermentation industrielle/ Génie des procédés

Département ECODIV

BioForA

Génétique quantitative/Modélisation

LBLGC

Physiologie

Département BAP

AGAP Institut

Génétique quantitative, Génomique, Biochimie, Génétique évolutive, Sélection, Ecophysiologiste, Biostatistique, Bioinformatique

Département PHASE

UMR SELMET

Biométrie, Chimiométrie, Machine Learning, Agronomie

Partenaires extérieurs

Faculté des Sciences, Paris

Expertise

Centre Boreli

Apprentissage non supervisé, statistique, réseaux des graphes, Bioinformatique

INRIA

Equipe projet LORIA

Découverte des connaissances, Sciences de la vie

Université de Genève

Sciences Analytiques

Métabolomique, Chimiométrie

Université de Toulouse

Institut de mathématique  de Toulouse

Statistique, analyse et intégration de données multi-omiques

ANSES

Laboratoire de Ploufragan-Plouzané

Statistique, méthodes multi-blocs Epidémiologie

CNAM

EPN6 - Mathématiques et Statistique

Analyse de données complexes hétérogènes, Méthodes Clusterwise, Classification en grande dimension

Université de Paris-Saclay

Signaux et Statistique

Analyse de données multiblocs, tensorielles (en grande dimension),  Modèles à équations structurelles

Université de Montpellier

Institut Montpellierain Alexander Grothendieck

Modèles à composantes supervisées / classification

ADLIN (partenaire privé)

ADLIN

Finance, Stratégie, Multi-omiques, Bioinformatique, Transcriptomique, Visualisation

Institut du vin et de la vigne

IFV

Chimiométrie/Chimie analytique

Voir aussi

  • Bersanelli, M, Mosca E, Remondini D. et al. Methods for the integration of multi-omics data: mathematical aspects. BMC Bioinformatics 17, S15 (2016). https://doi.org/10.1186/s12859-015-0857-9
  • Boccard J,   Schvartz D, Codesido S, Hanafi M,   Gagnebin Y, Ponte B, Jourdan F, Rudaz S.  (2021). Gaining insights into metabolic networks using chemometrics and bioinformatics: chronic kidney disease as a clinical model. Frontiers in Molecular Biosciences 8, 682559.
  • Boutalbi R,  Labiod L, Nadif M. (2021): Implicit consensus clustering from multiple graphs. Data Min. Knowl. Discov. 35(6): 2313-2340
  • Hanafi M, Kiers H. A. L. (2006). Analysis of K sets of data, with differential emphasis on agreement between and within sets. Computational Statistics and Data Analysis. (51), 3, 1491-1508.
  • Eicher T, Kinnebrew G, Patt A, Spencer K, Ying K, Ma Q, Machiraju R, Mathé AEA. Metabolomics and Multi-Omics Integration: A Survey of Computational Methods and Resources. Metabolites. 2020 May 15;10(5):202. doi: 10.3390/metabo10050202. PMID: 32429287; PMCID: PMC7281435.