Thèse labellisée
Thèse de Meije Mathé (2023 - )

Création et exploitation d’un graphe de connaissances pour l’élucidation des liens entre les polluants organiques persistants et l’endpmétriose

Thèse de Meije Mathé (2023 - Toxalim). Le projet proposé porte sur la caractérisation du lien entre polluants organiques persistants (POP) et l'endométriose.

  • Thèse labellisée
  • Date de démarrage : 02/10/2023
  • Unité d'accueil : ToxAlim
  • Centre INRAE : Occitanie Toulouse
  • École doctorale :  SEVAB
  • Université :
  • Disciplines / Spécialités : Bioinformatique
  • Directeurs de thèse : FRAINAY Clément, JOURDAN Fabien
  • Encadrant(es) :
  • Axe du métaprogramme : Axe 1 & Axe 3

Il s'appuie sur des avancées récentes dans le domaine : d'une part sur la disponibilité de données de métabolomique issues d'une étude observationnelle sur le sujet (projet EndoXomics financée par la Fédération pour la Recherche Médicale incluant l’équipe d’accueil) la mise en activité par le laboratoire d’accueil d'un graphe de connaissance recensant des millions de liens métabolites - concepts biomédicaux basés sur la littérature scientifique (FORUM), et enfin la standardisation des mécanismes d'ac-tion conduisant aux effets adverses des contaminants (AOP, Adverse Outcome Pathway).

L'objectif de ce projet porte donc sur les développements méthodologiques nécessaires à la mise en relation de ces sources de données pour la création et l'exploitation d'un graphe de connaissance spécifi-quement conçu pour l'investigation des perturbations du métabolisme dans l'étiologie de l'endométriose en lien avec l’exposition aux POPS.

Les différents livrables et valorisations associées comportent le calcul et la mise à disposition d’une annotation sémantique des AOP compa-tible avec le graphe de connaissance existant (permettant ainsi leur fédération), la réalisation d’un pipeline open source d’extraction et de processing pour la création de graphes de connaissance étude-spécifique, et enfin l’application d’algorithmes sur un tel graphe dédié à l’endométriose, pour la priorisation d’information (incluant la re-commandation d’articles). À plus long terme, ce système pourrait per-mettre la création de systèmes de questions-réponses pour l’interrogation du graphe de connaissances.

Le pipeline, basé sur une définition du domaine d’étude (concepts MeSH) construira un sous-réseau combinant FORUM, les AOP et potentiellement d’autres bases de données. Ce pipeline sera appliqué aux données du projet EndoXomics, et des approches d’extraction de con-naissances seront utilisées pour suggérer des Key Events pouvant être impliqués dans le lien entre les POP et la pathophysiologie de l’endométriose.

Contact