Illustration thèse confinancée
Thèse d'Ekaterina Tomilina (2022 - 2025)

Modèles à copules pour l'inférence de réseaux de régulation multi-omiques

Thèse d'Ekaterina Tomilina (MaIAGE, 2022-2025). La biologie des systèmes est basée sur l’analyse de données complexes, de grande dimension et de natures très diverses. Un enjeu majeur est de comprendre les liens d’interactions et de régulation entre les différents types de données omiques mesurées. Cette thèse propose une modélisation conjointe de données multi-omiques en s'appuyant sur la théorie des copules.

  • Thèse cofinancée
  • Date de démarrage : octobre 2022
  • Unité d'accueil : UR 1404 MaIAGE (Mathématiques et Informatique Appliquées du Génome à l'Environnement)
  • Centre INRAE : Jouy-en-Josas
  • Université : Université Paris Saclay
  • École doctorale : Ecole Doctorale EDMH
  • Discipline / Spécialité : Mathématiques aux interfaces
  • Directeurs de thèse : Gildas MAZO (INRAE, MaIAGE), Florence JAFFREZIC (INRAE, GABI), Andrea Rau (INRAE, GABI)
  • Financement : Métaprogramme DIGIT-BIO / École Doctorale EDMH
  • Axe du métaprogramme : axe 1 (Décryptage multi-échelle des fonctions du vivant : régulations et intégration)

Résumé

Aujourd’hui, peu de méthodes permettent de faire une modélisation conjointe de ces différents types. Un problème majeur vient de l’hétérogénéité des données. Certaines peuvent aisément être modélisées avec des lois gaussiennes (données transcriptomiques par puces à ADN), d’autres sont continues mais non-gaussiennes (données épigénomiques par puces de profilage de méthylation), et d’autres encore sont discrètes (données transcriptomiques et épigénomiques par séquençage, génotypage). Or, les modèles mathématiques et statistiques dépendent fortement de la nature des données ; c’est la raison pour laquelle les modélisations proposées jusqu’à présent ont été réalisées principalement pour chaque type de données indépendamment.

Dans cette thèse, nous proposerons une modélisation conjointe de données multi-omiques en nous appuyant sur la théorie des copules. Ces dernières permettent de modéliser les interactions entre variables aléatoires de différentes natures et sont donc bien adaptées à notre objectif. Plusieurs enjeux méthodologiques seront étudiés afin d’étendre cette méthode à l’inférence de réseaux de régulation multi-omiques.  La modélisation proposée sera appliquée à des problématiques biologiques étudiées à INRAE, en particulier dans le cadre de projets du Département de Génétique Animale.

Contact

Ekaterina Tomilina

Voir aussi

Naviguer dans un océan d’informations hétérogènes... Ekaterina Tomilina, doctorante co-financée par DIGIT-BIO, était en finale du concours 2023 ‘Ma Thèse en 180 Secondes’ à l’Université Paris-Saclay : voir la vidéo