Fermentwin © Freepik
Consortium PRECURSOR (2024 - 2026)

Mieux comprendre les régions proximales des gènes pour améliorer les modèles de sélection

La transcription des gènes est un processus essentiel dans la réponse adaptative des plantes aux contraintes environnementales. Le consortium scientifique interdisciplinaire PRECURSOR a pour objectif d’explorer et de mieux comprendre ce processus dans les régions proximales des gènes pour, à terme, améliorer le pouvoir prédictif des modèles de sélection.

Contexte et enjeux

La transcription, première étape de l’expression des gènes et de la synthèse des protéines, est finement régulée par de nombreux acteurs moléculaires. Ainsi, les éléments cis-régulateurs, courtes séquences d’ADN, régulent l’expression des gènes via des facteurs trans qui se fixent sur ces éléments cis.

Modifier l’expression de gènes au travers de leurs régulateurs

Les séquences cis-régulatrices sont présentes en forte densité dans les régions proximales des gènes, mais leur caractérisation, préalable indispensable à leur exploitation, demeure lacunaire. Des projets récents ont permis d’établir une carte des séquences d’ADN préférentiellement localisées (PLM) dans ces régions (chez Arabidopsis thaliana et le maïs), dont près de 80% ne sont pas encore répertoriées dans les bases de données. Par ailleurs, de nombreuses études montrent que les éléments transposables (ET) peuvent inclure  des séquences cis-régulatrices. Lorsqu'ils sont insérés à proximité d'un gène, les ET peuvent alors affecter la transcription des gènes adjacents en recrutant des facteurs trans supplémentaires.

Ces deux sources de données (PLM et ET) sont prometteuses, car elles permettent une caractérisation à large échelle d’éléments cis-régulateurs potentiels. Néanmoins, pour atteindre une véritable compréhension des régions proximales, il est nécessaire de coupler ces informations structurales aux données d’expression.  Pour cela, des approches originales utilisant l’intelligence artificielle pourraient être utilisées pour intégrer ces données biologiques dans l’objectif de prédire des gènes clés et leurs réseaux de régulation.

Cependant, ces collectifs scientifiques aux compétences différentes et complémentaires, se rencontrent peu. Le consortium PRECURSOR propose donc de relever ce challenge en rassemblant des compétences interdisciplinaires autour de cette question.

Objectifs

PRECURSOR a pour objectif de fédérer des équipes scientifiques à l’interface entre biologie (molécularistes, généticiens, physiologistes) et sciences formelles (statistiques, informatique, bioinformatique), travaillant sur différentes espèces (mais, blé, sorgho), pour acquérir une vision consolidée des bases génétiques des caractères d’intérêt agronomique, des données structurales aux données d’expression.

L’ambition est de travailler ensemble afin de progresser sur la cartographie et le pouvoir prédictif des éléments cis-régulateurs dans les régions proximales des gènes, en considérant la question dans toute sa complexité et prenant en compte les complémentarités / différences entre les espèces envisagées.
PRECURSOR permettra in fine de construire un consortium scientifique interdisciplinaire sur l’intégration inédite de données hétérogènes pour mieux comprendre les régions proximales des gènes et, à terme, valoriser de nouveaux allèles d’intérêt agronomique et améliorer le pouvoir prédictif des modèles de sélection.

Contact-coordination

Acteurs du projet

Unités INRAE impliquées

DépartementUnitésExpertise
BAPIPS2Bioinformatique des éléments cis-régulateurs, statistiques des données omiques
BAPIJPBBiologie des éléments cis-régulateurs ; maïs ; contraintes environnementales ; digestibilité ; génomique fonctionnelle
BAPURGIInformatique ; bases de connaissances ; éléments transposables
MathNumMIA Paris SaclayMéthodes d’intelligence artificielle

Partenaires extérieurs

InstitutExpertise
CIRAD (AGAP)Génétique quantitative ; sorgho ; génomique fonctionnelle
IRD (DIADE)Biologie ; céréales tropicales ; systèmes racinaires
Université Clermont Auvergne (GDEC)Physiologie moléculaire de la réponse aux stress biotiques et abiotiques ; blé ; pathogènes fongiques ; stress hydrique