Illustration thèse confinancée
Thèse d'Ekaterina Tomilina (2022 - 2025)

Modèles à copules pour l'inférence de réseaux de régulation multi-omiques

Thèse d'Ekaterina Tomilina (MaIAGE, 2022-2025). La biologie des systèmes est basée sur l’analyse de données complexes, de grande dimension et de natures très diverses. Un enjeu majeur est de comprendre les liens d’interactions et de régulation entre les différents types de données omiques mesurées. Cette thèse propose une modélisation conjointe de données multi-omiques en s'appuyant sur la théorie des copules.

  • Thèse cofinancée
  • Date de démarrage : octobre 2022
  • Unité d'accueil : UR 1404 MaIAGE (Mathématiques et Informatique Appliquées du Génome à l'Environnement)
  • Centre INRAE : Jouy-en-Josas
  • Université : Université Paris Saclay
  • École doctorale : Ecole Doctorale EDMH
  • Discipline / Spécialité : Mathématiques aux interfaces
  • Directeurs de thèse : Gildas MAZO (INRAE, MaIAGE), Florence JAFFREZIC (INRAE, GABI), Andrea Rau (INRAE, GABI)
  • Financement : Métaprogramme DIGIT-BIO / École Doctorale EDMH
  • Axe du métaprogramme : axe 1 (Décryptage multi-échelle des fonctions du vivant : régulations et intégration)

Résumé

Aujourd’hui, peu de méthodes permettent de faire une modélisation conjointe de ces différents types. Un problème majeur vient de l’hétérogénéité des données. Certaines peuvent aisément être modélisées avec des lois gaussiennes (données transcriptomiques par puces à ADN), d’autres sont continues mais non-gaussiennes (données épigénomiques par puces de profilage de méthylation), et d’autres encore sont discrètes (données transcriptomiques et épigénomiques par séquençage, génotypage). Or, les modèles mathématiques et statistiques dépendent fortement de la nature des données ; c’est la raison pour laquelle les modélisations proposées jusqu’à présent ont été réalisées principalement pour chaque type de données indépendamment.

Dans cette thèse, nous proposerons une modélisation conjointe de données multi-omiques en nous appuyant sur la théorie des copules. Ces dernières permettent de modéliser les interactions entre variables aléatoires de différentes natures et sont donc bien adaptées à notre objectif. Plusieurs enjeux méthodologiques seront étudiés afin d’étendre cette méthode à l’inférence de réseaux de régulation multi-omiques.  La modélisation proposée sera appliquée à des problématiques biologiques étudiées à INRAE, en particulier dans le cadre de projets du Département de Génétique Animale.

Contact

Ekaterina Tomilina

 

 

Publications

 

Articles

Ekaterina Tomilina, Gildas Mazo, Florence Jaffrézic. A semi-parametric Gaussian copula model for heterogeneous network inference: an application to multi-omics data. 2024. ⟨hal-04847648⟩

Communications (conférences, congrès)

  • Ekaterina Tomilina, Gildas Mazo, Florence Jaffrézic. Méthodes à copules pour l'inférence de réseaux de régulation multi-omiques. Colloque Jeunes Probabilistes et Statisticiens, groupe Modélisation Aléatoire et Statistique de la Société de Mathématiques Appliquées et Industrielles, Oct 2023, Saint Pierre d'Oléron, France. ⟨hal-04308489⟩
  • Ekaterina Tomilina, Gildas Mazo, Florence Jaffrezic. Gaussian copula estimation for heterogeneous data. European Meeting of Statisticians, Jul 2023, Warsaw (POLAND), Poland. . ⟨hal-04308470⟩
  • Ekaterina Tomilina, Gildas Mazo, Florence Jaffrezic. Copula-based models for multi-omic network inference. Compstat 2024, Aug 2024, Giessen, Germany. ⟨hal-04683480⟩
  • Ekaterina Tomilina, Gildas Mazo, Florence Jaffrezic. Copula-based models for multi-omics network inference. Journée des Statistiques 2024, Société Française de Statistique, May 2024, Bordeaux, France. ⟨hal-04598167⟩

Logiciels

Voir aussi

  • Naviguer dans un océan d’informations hétérogènes... Ekaterina Tomilina, doctorante co-financée par DIGIT-BIO, était en finale du concours 2023 ‘Ma Thèse en 180 Secondes’ à l’Université Paris-Saclay : voir la vidéo
  • Projet exploratoire DINAMICSEtude de la plasticité des réseaux biologiques hétérogènes par les modèles à copules