Le Metaprogrammes DIGIT-BIO co-finance 2 bourses de thèses et labellise 6 autres sujets pour la campagne 2022.
Liste des sujets co-financés ou labellisés par le Métaprogramme
Modélisation mathématique de l'ovogenèse chez les poissons
Sujet co-financé
Démarrage prévu : rentrée 2022
Unité d'accueil : UMR PRC
Centre INRAE : Val de Loire
Université : Tours
École doctorale : Santé, Sciences Biologiques et Chimie du Vivant
Directeur de thèse : Romain Yvinec
Financement : Métaprogramme DIGIT-BIO / Région Centre Val de Loire
Contact mail : romain-yvinec@inrae.fr
Résumé
Cette thèse est consacrée à la compréhension et à la quantification de la dynamique ovarienne chez les poissons modèles à ovogenèse asynchrone (e.g medaka, zebrafish). De par sa nature cyclique, l'ovaire connaît un remodelage cellulaire intense dont la régulation est essentielle pour la maturation des gamètes et le succès reproducteur.
Une difficulté récurrente pour la compréhension e la dynamique cellulaire dans l'ovaire est le manque d'observables en temps réel au niveau de la distribution des populations de cellules (dénombrement, types cellulaires, etc...). L'objectif de la thèse est de construire et de calibrer un modèle mathématique intégrant toute la dynamique de maturation des gamètes et ses régulations au cours de la vie du poisson, en exploitant notamment les nouvelles données fournies par les récents progrès de l'imagerie tridimensionnelle. Nous nous attacherons à montrer en quoi ce modèle permet d'améliorer les prédictions de l'impact des perturbations , environnementales de la fonction de reproduction du l'échelle de vie des individus.
Cette thèse aboutira à des résultats de recherche novateurs dans le domaine de la reproduction du poisson et permettra de développer des approches génériques pour la modélisation de populations structurées avec des interactions non linéaires.
Intégration de données multi-études pour l’identification de phénotypes communs du syndrome métabolique
Sujet co-financé
Démarrage prévu : rentrée 2022
Unité d’accueil : Unité de Nutrition Humaine
Centre INRAE : Clermont-Ferrand/Theix
Université : Université Clermont Auvergne
École doctorale : Ecole Doctorale des Sciences Fondamentales
Directeur de thèse : Estelle PUJOS-GUILLOT
Encadrant(es) : Julien BOCCARD
Financement : Métaprogramme DIGIT-BIO / Université de Genève
Contact mail : estelle.pujos-guillot@inrae.fr
Résumé
Le syndrome métabolique (SMet) associant obésité viscérale, dyslipidémie, hyperglycémie et hypertension est maintenant un enjeu important de santé publique du fait de sa prévalence croissante, en particulier dans la population âgée souffrant de maladies chroniques. Grâce aux approches en population, intégrées et multifactorielles que ce projet propose, l’identification de nouveaux (bio)marqueurs/signatures permettra à terme un meilleur ciblage des populations à risque et une meilleure compréhension de l’étiologie du SMet. La métabolomique constitue une approche de phénotypage moléculaire très puissante et aujourd’hui mature, appliquée à la fois pour mieux comprendre/caractériser les processus biologiques complexes, mais également en identifier des biomarqueurs associés. Les progrès réalisés dans les domaines analytique, bioinformatique et de modélisation, permettent maintenant d'envisager des approches globales intégratives pour la génération et l'exploitation de données massives afin de mieux comprendre ces maladies chroniques et d'en identifier des ensembles de biomarqueurs ou signatures. Le projet de thèse vise à étudier les trajectoires d’installation du SMet de façon transversale, au sein de 3 cohortes observationnelles pour lesquelles des données métabolomiques ont été collectées et disposant de données épidémiologiques/ phénotypiques acquises de façon longitudinale. Il répond à la question essentielle de l’interopérabilité des données métabolomiques et de la plus-value d’une intégration inter-études. Ce sujet s’inscrit à ce niveau dans le domaine très actif des sciences des données, l’intégration des données, visant ici à investiguer la validité des liens entre jeux de données issus de personnes analysées dans différents états de santé. Cette thèse s’appuiera sur un partenariat multidisciplinaire établi entre physiologistes, chimistes, chimiométriciens et statisticiens.
Modèles à copules pour l'inférence de réseaux de régulation multi-omiques
Sujet co-financé
Démarrage prévu : rentrée 2022
Unité d’accueil : MAIAGE/ GABI
Centre INRAE : Jouy en Josas
Université : Université Paris Saclay
École doctorale : EMDH ou ABIES
Encadrants : Florence JAFFREZIC, Gildas MAZO, Andrea RAU
Contact mail : florence.jaffrezic@inrae.fr
Résumé
La biologie des systèmes est basée sur l’analyse de données complexes, de grande dimension et de natures très diverses. Un enjeu majeur est de comprendre les liens d’interactions et de régulation entre les différents types de données omiques mesurées. Aujourd’hui, peu de méthodes permettent de faire une modélisation conjointe de ces différents types. Un problème majeur vient de l’hétérogénéité des données. Certaines peuvent aisément être modélisées avec des lois gaussiennes (données transcriptomiques par puces à ADN), d’autres sont continues mais non-gaussiennes (données épigénomiques par puces de profilage de méthylation), et d’autres encore sont discrètes (données transcriptomiques et épigénomiques par séquençage, génotypage). Or, les modèles mathématiques et statistiques dépendent fortement de la nature des données ; c’est la raison pour laquelle les modélisations proposées jusqu’à présent ont été réalisées principalement pour chaque type de données indépendamment. Dans cette thèse, nous proposerons une modélisation conjointe de données multi-omiques en nous appuyant sur la théorie des copules. Ces dernières permettent de modéliser les interactions entre variables aléatoires de différentes natures et sont donc bien adaptées à notre objectif. Plusieurs enjeux méthodologiques seront étudiés afin d’étendre cette méthode à l’inférence de réseaux de régulation multi-omiques. La modélisation proposée sera appliquée à des problématiques biologiques étudiées à l’INRAE, en particulier dans le cadre de projets du Département de Génétique Animale.
Approches de « Deep Learning » pour la détection précoce, la quantification et le suivi dans le temps des symptômes foliaires de pathogènes de plantes
Sujet labellisé
Démarrage prévu : rentrée 2022
Unité d'accueil : LIPME
Centre INRAE : Occitanie-Toulouse
Université : Université de Toulouse
École doctorale : SEVAB
Directeur de thèse : David Rousseau
Encadrant(es) : Nemo Peeters
Contact mail : nemo.peeters@inrae.fr
Résumé
L’étude fine, assistée par imagerie, des symptômes foliaires des plantes lors d’une interaction compatible ou incompatible avec des microorganismes pathogènes permet la description et la mesure de la dynamique de ces interactions dans l’espace et dans le temps. Cette étape est nécessaire pour l’identification et la compréhension des mécanismes de résistance ou de tolérance chez les plantes et est donc représente un enjeu fort en amélioration des plantes.
Ce projet de thèse vise à développer des outils logiciels pour exploiter les plateformes de phénotypage à haut-débit TPMP à Toulouse et VEGOIA à Colmar pour mieux comprendre la dynamique d’apparition et la quantification des symptômes foliaires causés par trois pathogènes sur Arabidopsis (Pseudomonas, Xanthomonas, Sclerotinia) et également trois pathogènes sur la vigne (Milidou, oïdium et « black rot »). L’objectif est de développer et déployer des outils de deep-learning ad-hoc pouvant répondre de la façon la plus générique possible aux challenge d’analyse posés par les différents pathosystèmes et les différentes échelles d’observation. Le matériel d’étude sera des parties d’organes (disques foliaires de vigne, VEGOIA), des plantes entières isolées (Arabidopsis, TPMP) et plus tard des plantes isolées plus grandes (Vigne, TPMP) avec comme perspective d’adapter les outils d’analyse aux plantes en conditions naturelles (Vigne, Colmar).
Le projet de recherche est ici de développer des algorithmes de deep-learning exploitant au mieux les images générées sur les plateformes dédiées. L’encadrement de cette thèse sera double avec un directeur de thèse biologiste (Nemo Peeters) et un directeur de thèse spécialiste du deep-learning (David Rousseau).
Bypassing and reconsidering photoperiod sensitivity for maize adaptation to climate change
Sujet labellisé
Démarrage prévu : rentrée 2022
Unité d'accueil : LEPSE
Centre INRAE : Occitanie-Montpellier
Université : Institut Agro-Montpellier Supagro
École doctorale : GAIA
Directeur de thèse : Boris PARENT
Encadrant(es) : Rendall Wisser
Contact mail : randall.wisser@inrae.fr
Résumé
Time to flowering determines local adaptation in crops and the adoption of cultivars by farmers. Variation in flowering time (FT) is determined by environmental cues, including temperature and photoperiod (i.e., length of the day), with genotype-specific sensitivities. For maize in the temperate zone, with a genetic base of historical populations that were geographically adapted for FT, the pedigree of modern cultivars constitutes less than 1% of the tropical gene pool (Goodman 1998). Infusion of a vast array of tropical alleles into temperate germplasm is obstructed by photoperiod sensitivity, which requires a decade of breeding for early FT before favorable alleles for other traits can be screened (excessively late FT due to photoperiod sensitivity confounds phenotypic evaluation in temperate environments; Teixeira et al. 2015). This dissertation is built around a proposed strategy where phenomics and modeling are used to bypass this barrier, in order to identify genotypes and alleles with unique adaptations to climate change. Focused on drought tolerance, this research will characterize variation in photoperiod sensitivity for tropical maize and test whether coupling exists between photoperiod sensitivity and mechanisms of drought tolerance at physiological and genetic scales. As an extension, using a crop growth model parameterized by genotype-specific sensitivities, the impact on yield resulting from a reintroduction of photoperiodic control on FT in temperate maize will be examined for current and future climates. Because photoperiod is a stable cue for FT at a given latitude, it is hypothesized that some degree of photoperiod sensitivity will stabilize FT, and in turn, reduce yield loss under climate change. This dissertation is expected to guide new directions for plant breeding.
Méthodes d'évaluation génomique permettant d'inclure des omiques intermédiaires.
Sujet labellisé
Démarrage prévu : rentrée 2022
Unité d'accueil : UMR GENPHYSE
Centre INRAE : Toulouse Occitanie
Université : INPT
École doctorale : SEVAB
Encadrant(es) : Andrés Legarra
Contact mail : andres.legarra@inrae.fr
Résumé
Les capteurs low-cost d’imagerie et de sons pour le phénotypage animal non invasif, les données de type spectral à partir d’échantillons biologiques ou de lait, et les données transcriptomiques ou autre « omiques » (ex. microbiote), permettent l’étude de phénotypes complexes d’intérêt pour répondre aux enjeux de l’agroécologie.
Nous avons proposé récemment une méthode d’intégration directe de ces données « omiques » massives, hétérogènes et incomplètes dans des méthodes de prédiction génomique avec des logiques « Single Step » sans passer par des étapes intermédiaires (Christensen et al. Genetics, iyab130, https://doi.org/10.1093/genetics/iyab130). Cette thèse vise à explorer de nombreux aspects de cette nouvelle méthodologie par simulation et derivation théoriques, en particulier :
Développement de modèles d’estimation de type BLUP ou plus complexes en fonction des situations,
Test des modèles avec des données réelles publiques de génétique humaine,
Evaluation a priori de la précision de la prédiction.
Optimisation de la sélection de variétés de vigne résistantes aux maladies par prédictions génomiques et phénomiques
Sujet labellisé
Démarrage prévu : rentrée 2022
Unité d'accueil : Santé de la Vigne et Qualité du Vin (SVQV)
Centre INRAE : Grand-Est Colmar
Université : Université de Strasbourg
École doctorale : Vie et Santé
Directeur de thèse : Didier MERDINOGLU
Encadrant(es) : Avia Komlan
Contact mail : komlan.avia@inrae.fr
Résumé
La viticulture française doit aujourd’hui s’adapter aux effets du changement climatique avec une contrainte croissante portant sur la diminution de l’utilisation des produits phytosanitaires. Une des solutions pour y parvenir est la création de nouvelles variétés résistantes aux maladies, un concept dont la faisabilité a été démontrée à travers les premières variétés à résistance polygénique du programme d’innovation variétale INRA-ResDur inscrites au catalogue. Cependant, le cycle de sélection de ces nouvelles variétés, qui dure une quinzaine d’années, constitue un frein à un développement rapide des variétés résistantes. Par ailleurs, outre la résistance aux maladies, de nouveaux idéotypes de vigne avec des aptitudes culturales et œnologiques spécifiques à différents contextes de production, notamment régionaux, doivent être définis. Les caractères intervenant dans la définition de ces idéotypes ont souvent une architecture génétique complexe que la sélection assistée par marqueur est incapable de prendre en compte. L’essor actuel de l’utilisation de modèles de prédiction en agriculture offre une opportunité pour définir et optimiser de nouveaux modèles faisant évoluer les schémas de sélection actuels. L’objectif de ce projet de thèse est de mettre à profit le grand nombre de populations de sélection constituées et implantées sur plusieurs sites dans le cadre du programme ResDur pour mettre au point des modèles de prédiction (génomique et phénomique) intégrant des informations acquises sur le déterminisme génétique des caractères et confronter leur efficacité au travail de sélection phénotypique déjà effectué de façon conventionnelle.
Apprentissage profond sur graphes pour décrire, analyser et comparer le développement neurocomportemental du jeune agneau soumis à différentes expériences précoces.
Sujet labellisé
Démarrage prévu : rentrée 2022
Unité d'accueil : UMR PRC
Centre INRAE : Val de Loire
Université : Université de Strasbourg
École doctorale : MIPTIS ou SSBV
Directeur de thèse : Elodie Chaillou, Jean Yves Ramel (Univ. Tours)
Encadrant(es) : Romain Yvinec
Contact mail : elodie.chaillou@inrae.fr
Résumé
L'apport de l'imagerie par résonance magnétique est sans précédent pour décrire le développement cérébral du jeune individu. Cependant, les images obtenues chez les nouveau-nés présentent un contraste tissulaire très réduit, d'importantes variations d'intensité au sein des différents tissus et des dynamiques hétérogènes région-dépendantes. Ces caractéristiques limitent grandement l'utilisation automatique des outils informatiques de calcul et de post-traitement développés pour les images d'un encéphale adulte. li est donc indispensable de disposer de méthodes de calcul et de modélisation adaptées au jeune individu. Parmi les stratégies développées pour étudier le développement cérébral de l'enfant, les approches hybrides semblent les plus pertinentes en particulier la modélisation des données sous forme de graphes associée aux approches d1apprentissage profond pour les analyser et les comparer. C'est cette approche que nous avons utilisée pour créer une plateforme logicielle de segmentation interactive, SILA-30, et que nous vou Ions encore investir pour décrire, ana lyser et comparer le développement cérébral du jeune animal. Les défis scientifiques associés à cet objectif sont de développer de nouvelles méthodes d1apprentissage profond sur graphes pour
- La détection et la classification de sous-structures particulières dans un encéphale (classification semi-supervisée de nœuds);
- La comparaison, la discrimination, et la classification (classification supervisée ou non supervisée de graphes) de dynamique;
- Proposer une approche innovante pour phénotyper le développement cérébral et identifier les phases sensibles à l'expérience précoce.