Une université d’excellence
Université de recherche intensive, leader mondial en écologie, l’Université de Montpellier est un établissement public expérimental qui figure dans le top 200 du classement de Shanghai. Elle couvre plusieurs champs disciplinaires sciences et techniques, droit, économie, environnement, administration, gestion, médecine, pharmacie, activités physiques et sportives, biologie, informatique, sciences de l’éducation, science politique. Elle a obtenu en 2022 la labellisation I-SITE (Initiative Science Innovation Territoires Economie) qui associe 15 partenaires de recherche et d’innovation du territoire. Ce Programme d'Excellence (PEI) porté par l’Université de Montpellier s’articule autour des enjeux "Nourrir, Soigner, Protéger" et s’appuie sur tous les domaines scientifiques de l'Université et de ses partenaires. Elle coordonne le Pôle Universitaire d’Innovation (PUI).
Une université engagée
Vigilante envers toutes formes de discriminations, l’Université de Montpellier est engagée pour la promotion de la diversité, l’égalité entre femmes et hommes et pour l’inclusion des personnes en situation de handicap. Elle est attachée aux fondements du service public, à la laïcité, à l’égalité des chances et à l’accès de tous aux savoirs. Elle promeut les valeurs académiques telles que l’éthique, l’intégrité scientifique et la liberté universitaire. L’UM place enfin le développement durable au cœur de sa politique et de son savoir-vivre. Une démarche saluée par le palmarès du Times Higher Education qui la place en tête des universités françaises les plus performantes en terme de développement durable.
Dans le cadre de ses engagements, l’université promeut le CV sans photographie.
Structure de rattachement : Institut des Sciences de l'Evolution de Montpellier (ISEM)
Environnement de travail : Le projet ANR PanQueSt vise à produire des outils de détection de variants structuraux (SV) efficaces dans le contexte de l’arrivée massive de données de pangénomiques. Les SV sont des altérations génomiques telles que les insertions, les délétions, les duplications, les inversions et les translocations (généralement définies dans la littérature comme des variants de plus de 50 paires de bases) qui jouent un rôle important dans la formation de la diversité génétique, des traits phénotypiques et de la susceptibilité aux maladies. Malgré leur importance, les SV ont été sous-estimés, car leur détection et leur caractérisation sont plus difficiles que dans le cas des SNP. L'augmentation de la production d'assemblages génomiques « télomère à télomère » de haute qualité a fait passer l'analyse génomique d'un génome de référence unique (linéaire) à des modèles pangénomiques plus complets, qui permettent de saisir tout le spectre des variations génomiques au sein d'une espèce en intégrant plusieurs génomes dans une représentation graphique unique, les graphes de pangénomes (PG). L’analyse des PG permet de saisir directement une image plus complète de la diversité génomique, cependant ce sont des structures de données complexes et à grande échelle, et les approches basées sur les PG en sont encore à leurs débuts, en particulier chez les eucaryotes, qu'il s'agisse de construire des PG ou de détecter des variations basées sur le pangénome. Il n'existe actuellement aucune méthode standard pour construire des PG. Même si plusieurs méthodes ont vu le jour, telles que Minigraph, Minigraph-Cactus ou PGGB, nous manquons de recul quant à l'impact de leurs heuristiques respectives sur les graphes obtenus et en particulier sur la détection des SV. Malgré l'essor récent des publications sur les pangénomes et la première ébauche du pangénome humain en mai 2023, aucune de ces études n'a fourni d'analyse complète des SV en termes de fréquence, de type et de taille. Il est donc essentiel de mener une analyse approfondie et de proposer de nouveaux outils informatiques pour tirer pleinement parti de ce nouveau paradigme, en particulier dans le contexte de la caractérisation des SV.
Mission principale : Fournir des données et des protocoles standardisés et contrôlés pour évaluer les outils de détection de variants structuraux (SV) existantes et celles produites par le projet PanQueSt via la mise au point d’un benchmark et en faire une référence FAIR pour la communauté.
La mission consiste à générer un ensemble complet de pangénomes qui ne se limite pas à une seule espèce ou à un seul type de variants structuraux, mais qui représente de manière équilibrée différents cas réels. Il faudra fournir des indicateurs clairs de caractérisation de ces ensembles de données, y compris les caractéristiques de séquences, SV et PG. La personne recrutée développera des mesures de performance basées sur ces indicateurs afin de permettre des comparaisons équitables et efficaces entre les outils de détection SV et conduira les analyses. Il faudra établir des protocoles reproductibles pour la génération de données et l'évaluation des outils de détection des SV.
Le travail se fera en collaboration avec les autres membres du projet et les résultats du benchmark fourniront à la fois des recommandations et un soutien pour d'autres développements du projet. Enfin, le benchmark sera mis à disposition en ligne, en lien avec le site web du projet PanQueSt, afin qu'il puisse être utilisé par la communauté.
Définition des tâches à accomplir :
1) Création de données de référence. La première étape consistera à créer les données de référence, qui comprendront des données simulées et des données réelles provenant du règne eucaryote. La personne recrutée collectera des données génomiques réelles à partir d'ensembles de données publics standards ainsi qu'à partir d'ensembles de données partenaires qui incluent des organismes non modèles. Pour chaque ensemble de données, il faudra attribuer ou calculer des indicateurs (degré de divergence, nombre et taille des séquences, types de SV, etc.) qui permettront de les organiser et de les comparer aux données simulées. Le benchmark sera construit selon les principes FAIR dans le but de devenir une référence pour l'évaluation des outils de recherche de SV. Les données du benchmark ainsi que les pipelines et la documentation pour la génération des ensembles de données seront mis à la disposition de la communauté via un site web public.
2) Mise en œuvre d'un pipeline d'évaluation et d'outils d'évaluation spécifiques. Afin de comparer les outils de détection des SV, la personne recrutée développera un protocole de benchmarking des outils et des indicateurs de performance, tels que la précision et le rappel, qui seront appliqués à toutes les évaluations des outils de détection des SV sur nos ensembles de données, les rendant ainsi comparables. L'ensemble du processus d'évaluation sera mis en œuvre à l'aide d'un système de gestion de workflow, tel que Snakemake, conçu pour une analyse des données reproductible et évolutive. Nous adopterons une approche modulaire permettant l'automatisation des procédures de test et l'intégration transparente de nouveaux outils à comparer ou de critères d'évaluation.
3) Exécution des tests, analyse des résultats et retour d'information sur les méthodes proposées et le benchmark lui-même. Une fois les premiers ensembles de données prêts et l'outil d'évaluation fonctionnel, il faudra comparer les performances des outils de détection des SV existants dans de nombreux scénarios génomiques divers. Les tests seront organisés en fonction de divers facteurs susceptibles d'influencer la puissance de détection des outils : type et taille des SV, complexité du génome, complexité du graphe en termes de divergence, etc. Le benchmark évaluera également l'influence des constructeurs de pangénomes sur les performances des outils de détection des SV.
Description précise de l'évènement ou du résultat objectif déterminant la fin de la relation contractuelle ainsi que les modalités d'évaluation et de contrôle de ce résultat : La mission se termine lorsque la plateforme de benchmarking est complètement déployée et fonctionnelle, et qu’un rapport présentant la documentation, les choix faits et l’analyse des premiers résultats est ecrit, dans un délai maximum de 24 mois. Le contrôle de la validité de la plateforme et du rapport sera effectué par la coordinatrice du projet PanQueSt à l’ISEM
Qualifications / Domaine de formation demandé :
Niveau master avec des compétences en Bioinformatique et Informatique
Maîtrise de plusieurs langages de programmation, avec des bonnes pratiques de programmation (gestion de version, reproductibilité, documentation, etc.) ; de gestionnaires de workflow ; des systèmes Linux ; des bases de données et des principes FAIR
Maîtrise de l’algorithmique et des graphes
Maîtrise de l’analyse de données en Bioinformatique
Bonnes connaissances des bases de données génomiques, des techniques de séquençage et des réseaux bioinformatiques
Capacité à faire preuve d’une grande rigueur, à effectuer une veille bibliographique, à synthétiser et rédiger des rapports sur le travail effectué
Capacité à travailler en équipe, à communiquer à l’écrit et à l’oral en français et en anglais, à communiquer efficacement avec des interlocuteurs de différents domaines (biologistes expérimentaux, informaticien·nes, statisticien·nes, bioinformaticien·nes, etc.) ;
Une expérience en graphe de pangénomes et en rédaction de communication scientifique est souhaitée
Expérience dans des environnements interdisciplinaires (biologie + calcul) valorisée.
Rejoindre l'université de Montpellier, c'est bénéficier de nombreux avantages dans une région qui offre un cadre de vie qualitatif.
Nos avantages :
> Dispositifs de développement des compétences : accès à une grande offre de formation, préparation aux concours internes
> Jusqu’à 46 jours de congés / an (pour un temps plein à 38h30)
> Temps de travail aménageable
> Jusqu'à 2 jours de télétravail / semaine (selon les modalités de la charte de TT applicable à l'UM)
> Restauration collective
> Aide et prestations sociales
> Prise en charge partielle des abonnements au transport de la ville
> Accès aux activités sportives, culturelles et de loisirs de l'université
> Soutien à la parentalité : club de loisirs pour enfant, partenariat de crèches, jours enfant-malade
Avantages dépendant de la nature et la durée du contrat, des nécessités de services et des conditions d'éligibilité
Informations complémentaires :
Rémunération : de 2160€ à 2325€ bruts mensuels, dont 200€ d'indemnité mensuelle des agents contractuels (prime)
Prise de poste : Janvier
Type de contrat : CDD de catégorie A
Durée du contrat : 2 ans
Clôture des candidatures : 07/12/2025