Thèses co-financées et labellisées : les sujets de la campagne 2022

Thèses co-financées et labellisées : les sujets de la campagne 2022

Le Metaprogrammes DIGIT-BIO co-finance 2 bourses de thèses et labellise 6 autres sujets pour la campagne 2022.

Liste des sujets co-financés ou labellisés par le Métaprogramme

Type de soutien

Département / Unité

Sujet

Encadrant

Sujet co-financé

PHASE / PRC

Modélisation mathématique de l'ovogenèse chez les poissons

Romain YVINEC

Sujet co-financé

ALIM-H / UNH

Intégration de données multi-études pour l'identification de phénotypes communs du syndrome métabolique

Estelle PUJOS-GUILLOT

Sujet labellisé

GA / MAIAGE - GABI

Modèles à copules pour l'inférence de réseaux de régulation multi-omiqueS

Gildas MAZO, Florence JAFFREZIC

Sujet labellisé

SPE / LIPME

Approches de « Deep Learning » pour la détection précoce, la quantification et le suivi dans le temps des symptômes foliaires de pathogènes de plantes.

Nemo PEETERS

Sujet labellisé

BAP / LEPSE

Bypassing and reconsidering photoperiod sensitivity for maize adaptation to climate change

Randall WISSER

Sujet labellisé

GA / GENPHYSE

Méthodes d'évaluation génomique permettant d'inclure des omiques intermédiaires.

Andres LEGARRA

Sujet labellisé

BAP / SVQV

Optimisation de la sélection de variétés de vigne résistantes aux maladies par prédictions génomiques et phénomiques

Komlan AVIA

Sujet labellisé

PHASE / PRC

Apprentissage profond sur graphes pour décrire, analyser et comparer le développement neurocomportemental du jeune agneau soumis à différentes expériences précoces.

Elodie CHAILLOU

Modélisation mathématique de l'ovogenèse chez les poissons

Sujet co-financé

Démarrage prévu : rentrée 2022

Unité d'accueil : UMR PRC

Centre INRAE : Val de Loire

Université : Tours

École doctorale : Santé, Sciences Biologiques et Chimie du Vivant

Directeur de thèse : Romain Yvinec

Financement : Métaprogramme DIGIT-BIO / Région Centre Val de Loire

Contact mail : romain-yvinec@inrae.fr

Résumé

Cette thèse est consacrée à la compréhension et à la quantification de la dynamique ovarienne chez les poissons modèles à ovogenèse asynchrone (e.g medaka, zebrafish). De par sa nature cyclique, l'ovaire connaît un remodelage cellulaire intense dont la régulation est essentielle pour la maturation des gamètes et le succès reproducteur.

Une difficulté récurrente pour la compréhension e la dynamique cellulaire dans l'ovaire est le manque d'observables en temps réel au niveau de la distribution des populations de cellules (dénombrement, types cellulaires, etc...). L'objectif de la thèse est de construire et de calibrer un modèle mathématique intégrant toute la dynamique de maturation des gamètes et ses régulations au cours de la vie du poisson, en exploitant notamment les nouvelles données fournies par les récents progrès de l'imagerie tridimensionnelle. Nous nous attacherons à montrer en quoi ce modèle permet d'améliorer les prédictions de l'impact des perturbations , environnementales de la fonction de reproduction du l'échelle de vie des individus.

Cette thèse aboutira à des résultats de recherche novateurs dans le domaine de la reproduction du poisson et permettra de développer des approches génériques pour la modélisation de populations structurées avec des interactions non linéaires.

Intégration de données multi-études pour l’identification de phénotypes communs du syndrome métabolique

Sujet co-financé

Démarrage prévu : rentrée 2022

Unité d’accueil : Unité de Nutrition Humaine

Centre INRAE : Clermont-Ferrand/Theix

Université : Université Clermont Auvergne

École doctorale : Ecole Doctorale des Sciences Fondamentales

Directeur de thèse : Estelle PUJOS-GUILLOT

Encadrant(es) : Julien BOCCARD

Financement : Métaprogramme DIGIT-BIO / Université de Genève

Contact mail : estelle.pujos-guillot@inrae.fr

Résumé

Le syndrome métabolique (SMet) associant obésité viscérale, dyslipidémie, hyperglycémie et hypertension est maintenant un enjeu important de santé publique du fait de sa prévalence croissante, en particulier dans la population âgée souffrant de maladies chroniques. Grâce aux approches en population, intégrées et multifactorielles que ce projet propose, l’identification de nouveaux (bio)marqueurs/signatures permettra à terme un meilleur ciblage des populations à risque et une meilleure compréhension de l’étiologie du SMet. La métabolomique constitue une approche de phénotypage moléculaire très puissante et aujourd’hui mature, appliquée à la fois pour mieux comprendre/caractériser les processus biologiques complexes, mais également en identifier des biomarqueurs associés. Les progrès réalisés dans les domaines analytique, bioinformatique et de modélisation, permettent maintenant d'envisager des approches globales intégratives pour la génération et l'exploitation de données massives afin de mieux comprendre ces maladies chroniques et d'en identifier des ensembles de biomarqueurs ou signatures. Le projet de thèse vise à étudier les trajectoires d’installation du SMet de façon transversale, au sein de 3 cohortes observationnelles pour lesquelles des données métabolomiques ont été collectées et disposant de données épidémiologiques/ phénotypiques acquises de façon longitudinale. Il répond à la question essentielle de l’interopérabilité des données métabolomiques et de la plus-value d’une intégration inter-études. Ce sujet s’inscrit à ce niveau dans le domaine très actif des sciences des données, l’intégration des données, visant ici à investiguer la validité des liens entre jeux de données issus de personnes analysées dans différents états de santé. Cette thèse s’appuiera sur un partenariat multidisciplinaire établi entre physiologistes, chimistes, chimiométriciens et statisticiens.

Modèles à copules pour l'inférence de réseaux de régulation multi-omiques

Sujet co-financé

Démarrage prévu : rentrée 2022

Unité d’accueil : MAIAGE/ GABI

Centre INRAE : Jouy en Josas

Université : Université Paris Saclay

École doctorale : EMDH ou ABIES

Encadrants : Florence JAFFREZIC, Gildas MAZO, Andrea RAU

Contact mail : florence.jaffrezic@inrae.fr

Résumé

La biologie des systèmes est basée sur l’analyse de données complexes, de grande dimension et de natures très diverses. Un enjeu majeur est de comprendre les liens d’interactions et de régulation entre les différents types de données omiques mesurées. Aujourd’hui, peu de méthodes permettent de faire une modélisation conjointe de ces différents types. Un problème majeur vient de l’hétérogénéité des données. Certaines peuvent aisément être modélisées avec des lois gaussiennes (données transcriptomiques par puces à ADN), d’autres sont continues mais non-gaussiennes (données épigénomiques par puces de profilage de méthylation), et d’autres encore sont discrètes (données transcriptomiques et épigénomiques par séquençage, génotypage). Or, les modèles mathématiques et statistiques dépendent fortement de la nature des données ; c’est la raison pour laquelle les modélisations proposées jusqu’à présent ont été réalisées principalement pour chaque type de données indépendamment. Dans cette thèse, nous proposerons une modélisation conjointe de données multi-omiques en nous appuyant sur la théorie des copules. Ces dernières permettent de modéliser les interactions entre variables aléatoires de différentes natures et sont donc bien adaptées à notre objectif. Plusieurs enjeux méthodologiques seront étudiés afin d’étendre cette méthode à l’inférence de réseaux de régulation multi-omiques. La modélisation proposée sera appliquée à des problématiques biologiques étudiées à l’INRAE, en particulier dans le cadre de projets du Département de Génétique Animale.

Approches de « Deep Learning » pour la détection précoce, la quantification et le suivi dans le temps des symptômes foliaires de pathogènes de plantes

Sujet labellisé

Démarrage prévu : rentrée 2022

Unité d'accueil : LIPME

Centre INRAE : Occitanie-Toulouse

Université : Université de Toulouse

École doctorale : SEVAB

Directeur de thèse : David Rousseau

Encadrant(es) : Nemo Peeters

Contact mail : nemo.peeters@inrae.fr

Résumé

L’étude fine, assistée par imagerie, des symptômes foliaires des plantes lors d’une interaction compatible ou incompatible avec des microorganismes pathogènes permet la description et la mesure de la dynamique de ces interactions dans l’espace et dans le temps. Cette étape est nécessaire pour l’identification et la compréhension des mécanismes de résistance ou de tolérance chez les plantes et est donc représente un enjeu fort en amélioration des plantes.

Ce projet de thèse vise à développer des outils logiciels pour exploiter les plateformes de phénotypage à haut-débit TPMP à Toulouse et VEGOIA à Colmar pour mieux comprendre la dynamique d’apparition et la quantification des symptômes foliaires causés par trois pathogènes sur Arabidopsis (Pseudomonas, Xanthomonas, Sclerotinia) et également trois pathogènes sur la vigne (Milidou, oïdium et « black rot »). L’objectif est de développer et déployer des outils de deep-learning ad-hoc pouvant répondre de la façon la plus générique possible aux challenge d’analyse posés par les différents pathosystèmes et les différentes échelles d’observation. Le matériel d’étude sera des parties d’organes (disques foliaires de vigne, VEGOIA), des plantes entières isolées (Arabidopsis, TPMP) et plus tard des plantes isolées plus grandes (Vigne, TPMP) avec comme perspective d’adapter les outils d’analyse aux plantes en conditions naturelles (Vigne, Colmar).

Le projet de recherche est ici de développer des algorithmes de deep-learning exploitant au mieux les images générées sur les plateformes dédiées. L’encadrement de cette thèse sera double avec un directeur de thèse biologiste (Nemo Peeters) et un directeur de thèse spécialiste du deep-learning (David Rousseau).

Bypassing and reconsidering photoperiod sensitivity for maize adaptation to climate change

Sujet labellisé

Démarrage prévu : rentrée 2022

Unité d'accueil : LEPSE

Centre INRAE : Occitanie-Montpellier

Université : Institut Agro-Montpellier Supagro

École doctorale : GAIA

Directeur de thèse : Boris PARENT

Encadrant(es) : Rendall Wisser

Contact mail : randall.wisser@inrae.fr

Résumé

Time to flowering determines local adaptation in crops and the adoption of cultivars by farmers. Variation in flowering time (FT) is determined by environmental cues, including temperature and photoperiod (i.e., length of the day), with genotype-specific sensitivities. For maize in the temperate zone, with a genetic base of historical populations that were geographically adapted for FT, the pedigree of modern cultivars constitutes less than 1% of the tropical gene pool (Goodman 1998). Infusion of a vast array of tropical alleles into temperate germplasm is obstructed by photoperiod sensitivity, which requires a decade of breeding for early FT before favorable alleles for other traits can be screened (excessively late FT due to photoperiod sensitivity confounds phenotypic evaluation in temperate environments; Teixeira et al. 2015). This dissertation is built around a proposed strategy where phenomics and modeling are used to bypass this barrier, in order to identify genotypes and alleles with unique adaptations to climate change. Focused on drought tolerance, this research will characterize variation in photoperiod sensitivity for tropical maize and test whether coupling exists between photoperiod sensitivity and mechanisms of drought tolerance at physiological and genetic scales. As an extension, using a crop growth model parameterized by genotype-specific sensitivities, the impact on yield resulting from a reintroduction of photoperiodic control on FT in temperate maize will be examined for current and future climates. Because photoperiod is a stable cue for FT at a given latitude, it is hypothesized that some degree of photoperiod sensitivity will stabilize FT, and in turn, reduce yield loss under climate change. This dissertation is expected to guide new directions for plant breeding.

Méthodes d'évaluation génomique permettant d'inclure des omiques intermédiaires.

Sujet labellisé

Démarrage prévu : rentrée 2022

Unité d'accueil : UMR GENPHYSE

Centre INRAE : Toulouse Occitanie

Université : INPT

École doctorale : SEVAB

Encadrant(es) : Andrés Legarra

Contact mail : andres.legarra@inrae.fr

Résumé

Les capteurs low-cost d’imagerie et de sons pour le phénotypage animal non invasif, les données de type spectral à partir d’échantillons biologiques ou de lait, et les données transcriptomiques ou autre « omiques » (ex. microbiote), permettent l’étude de phénotypes complexes d’intérêt pour répondre aux enjeux de l’agroécologie.
Nous avons proposé récemment une méthode d’intégration directe de ces données « omiques » massives, hétérogènes et incomplètes dans des méthodes de prédiction génomique avec des logiques « Single Step » sans passer par des étapes intermédiaires (Christensen et al. Genetics, iyab130, https://doi.org/10.1093/genetics/iyab130). Cette thèse vise à explorer de nombreux aspects de cette nouvelle méthodologie par simulation et derivation théoriques, en particulier :
Développement de modèles d’estimation de type BLUP ou plus complexes en fonction des situations,
Test des modèles avec des données réelles publiques de génétique humaine,
Evaluation a priori de la précision de la prédiction.

Optimisation de la sélection de variétés de vigne résistantes aux maladies par prédictions génomiques et phénomiques

Sujet labellisé

Démarrage prévu : rentrée 2022

Unité d'accueil : Santé de la Vigne et Qualité du Vin (SVQV)

Centre INRAE : Grand-Est Colmar

Université : Université de Strasbourg

École doctorale : Vie et Santé

Directeur de thèse : Didier MERDINOGLU

Encadrant(es) : Avia Komlan

Contact mail : komlan.avia@inrae.fr

Résumé

La viticulture française doit aujourd’hui s’adapter aux effets du changement climatique avec une contrainte croissante portant sur la diminution de l’utilisation des produits phytosanitaires. Une des solutions pour y parvenir est la création de nouvelles variétés résistantes aux maladies, un concept dont la faisabilité a été démontrée à travers les premières variétés à résistance polygénique du programme d’innovation variétale INRA-ResDur inscrites au catalogue. Cependant, le cycle de sélection de ces nouvelles variétés, qui dure une quinzaine d’années, constitue un frein à un développement rapide des variétés résistantes. Par ailleurs, outre la résistance aux maladies, de nouveaux idéotypes de vigne avec des aptitudes culturales et œnologiques spécifiques à différents contextes de production, notamment régionaux, doivent être définis. Les caractères intervenant dans la définition de ces idéotypes ont souvent une architecture génétique complexe que la sélection assistée par marqueur est incapable de prendre en compte. L’essor actuel de l’utilisation de modèles de prédiction en agriculture offre une opportunité pour définir et optimiser de nouveaux modèles faisant évoluer les schémas de sélection actuels. L’objectif de ce projet de thèse est de mettre à profit le grand nombre de populations de sélection constituées et implantées sur plusieurs sites dans le cadre du programme ResDur pour mettre au point des modèles de prédiction (génomique et phénomique) intégrant des informations acquises sur le déterminisme génétique des caractères et confronter leur efficacité au travail de sélection phénotypique déjà effectué de façon conventionnelle.

Apprentissage profond sur graphes pour décrire, analyser et comparer le développement neurocomportemental du jeune agneau soumis à différentes expériences précoces.

Sujet labellisé

Démarrage prévu : rentrée 2022

Unité d'accueil : UMR PRC

Centre INRAE : Val de Loire

Université : Université de Strasbourg

École doctorale : MIPTIS ou SSBV

Directeur de thèse : Elodie Chaillou, Jean Yves Ramel (Univ. Tours)

Encadrant(es) : Romain Yvinec

Contact mail : elodie.chaillou@inrae.fr

Résumé

L'apport de l'imagerie par résonance magnétique est sans précédent pour décrire le développement cérébral du jeune individu. Cependant, les images obtenues chez les nouveau-nés présentent un contraste tissulaire très réduit, d'importantes variations d'intensité au sein des différents tissus et des dynamiques hétérogènes région-dépendantes. Ces caractéristiques limitent grandement l'utilisation automatique des outils informatiques de calcul et de post-traitement développés pour les images d'un encéphale adulte. li est donc indispensable de disposer de méthodes de calcul et de modélisation adaptées au jeune individu. Parmi les stratégies développées pour étudier le développement cérébral de l'enfant, les approches hybrides semblent les plus pertinentes en particulier la modélisation des données sous forme de graphes associée aux approches d1apprentissage profond pour les analyser et les comparer. C'est cette approche que nous avons utilisée pour créer une plateforme logicielle de segmentation interactive, SILA-30, et que nous vou Ions encore investir pour décrire, ana lyser et comparer le développement cérébral du jeune animal. Les défis scientifiques associés à cet objectif sont de développer de nouvelles méthodes d1apprentissage profond sur graphes pour

  • La détection et la classification de sous-structures particulières dans un encéphale (classification semi-supervisée de nœuds);
  • La comparaison, la discrimination, et la classification (classification supervisée ou non supervisée de graphes) de dynamique;
  • Proposer une approche innovante pour phénotyper le développement cérébral et identifier les phases sensibles à l'expérience précoce.

Date de modification : 29 août 2023 | Date de création : 20 avril 2022 | Rédaction : Com