Fond Starline - Freepik
M. Delmas : Construire, exploiter et étendre un graphe de connaissances pour l’étude...

M. Delmas : Construire, exploiter et étendre un graphe de connaissances pour l’étude des liens entre métabolisme et santé

Maxime Delmas soutiendra le 24 octobre sa thèse co-financée par DIGIT-BIO sur le sujet Construire, exploiter et étendre un graphe de connaissances pour l’étude des liens entre métabolisme et santé.

Soutenance le 24 octobre à 15h00 sur le site de l'UMR Toxalim, salle du Pont neuf (INRAE Toulouse). 

JURY

  • M. Olivier Dameron, Rapporteur
  • M. Marco Pagni, Rapporteur
  • Mme Gwennaele Fichant, Examinatrice
  • M. Adrien Coulet, Examinateur
  • M. Clément Frainay, Directeur de thèse
  • M. Fabien Jourdan, Directeur de thèse

Pour suivre la soutenance de thèse sur zoom : 

https://inrae-fr.zoom.us/j/91416229009?pwd=MUZYbHZwY1VHNVJpeVo4YTJmUkNzZz09

Résumé

La métabolomique permet de déterminer des profils métaboliques, représentatifs de l’impact sur le métabolisme d’une condition expérimentale ou d’un phénotype particulier. En santé humaine, l’étude et la comparaison de ces profils permettent entre autres de caractériser des mécanismes pathologiques, des effets toxiques, ou d’identifier de nouvelles cibles pour le diagnostic.

L’interprétation de ces profils requiert de recontextualiser les observations, à la fois dans leur contexte biochimique, mais aussi plus largement sur le plan biologique, en intégrant des connaissances externes issues de la littérature scientifique. Des bases de données chimiques à la littérature, toutes ces connaissances sont accessibles, mais leur volume et leur croissance limitent néanmoins leur exploration. Face à cette surcharge d’informations, de nouvelles stratégies doivent être mises en place pour aider le chercheur à exploiter ces connaissances.

En s’appuyant sur les technologies du Web sémantique, les travaux présentés dans cette thèse proposent d’extraire et d’agréger un ensemble de relations entre composés chimiques et concepts biomédicaux, pour construire un graphe de connaissances ouvert : FORUM. Les liens associatifs entre concepts ont été inférés depuis leur fréquence de co-mention dans la littérature, et augmentés par la représentation sémantique des entités, apportée par les vocabulaires chimiques et biomédicaux. Au-delà du support pour l’interprétation des profils métaboliques, le potentiel de FORUM pour la suggestion de nouvelles hypothèses et l’exploration des chemins de relations à travers le Web de données a également été discuté.

Malgré sa croissance, la couverture de la littérature sur le métabolome reste partielle. Lors de l’interprétation de profils métaboliques, la quantité d’informations disponibles pour chaque composé observé peut ainsi être inégale. Afin d’étendre le graphe de connaissances aux métabolites négligés dans la littérature, une deuxième approche combinant analyses de réseaux et statistiques bayésiennes a été développée. Les nouvelles relations suggérées avec
des maladies, sont dérivées de la littérature du voisinage métabolique du composé et fournissent un nouveau niveau de relation dans le graphe de connaissances.

Publications :

Maxime Delmas, Olivier Filangi, Nils Paulhe, Florence Vinson, Christophe Duperier, William Garrier, P.-E. Saunier, Yoann Pitarch, Fabien Jourdan, Franck Giacomoni and Clément Frainay (2021). FORUM: Building a Knowledge Graph from public databases and scientific literature to extract associations between chemicals and diseasesBionformatics. Consulter sur HAL / Consulter sur BioRXiv

M. Delmas, O. Filangi, C. Duperier, N. Paulhe, F. Vinson, P. Rodriguez-Mier, F. Giacomoni, F. Jourdan, C. Frainay (2022). Suggesting disease associations for overlooked metabolites using literature from metabolic neighbours.bioRxiv 2022.09.13.507596; doi: https://doi.org/10.1101/2022.09.13.507596