Skip to main content

Les données issues de la recherche se doivent d’être Faciles à trouver, Accessibles, Interopérables, Réutilisables (FAIR). L’écosystème Recherche Data Gouv aide à s’assurer que les données produites en France par la recherche répondent à ces principes. Cet écosystème s’inscrit dans le Plan national pour la science ouverte, en mettant à disposition :

  • Un entrepôt pluridisciplinaire pour héberger des jeux de données de recherche.
  • Un catalogue (à venir) et un portail web pour rechercher, découvrir, signaler des jeux de données.
  • Une fédération de centres de compétences, qui accompagnent les chercheurs/institutions sur les questions liées à la gestion des données, métadonnées, licences, etc.

Dans le cadre de cet écosysteme, l’IFB a été choisi comme Centre de référence thématique (CRT) pour couvrir le domaine de la Biologie-Santé.

Thématiques concernées : Tous les domaines thématiques de la biologie fondamentale et de ses domaines d’application (notamment microbiologie, santé, agriculture et alimentation, biodiversité, environnement)
Données concernées : Tous types de données de biologie, et les données qui y sont associées, notamment dans les domaines thématiques ci-dessus.
Typologie de données traitées : Différents types de données, avec une prédominance de données massives issues de technologies à haut débit, notamment séquençage, protéomique, métabolomique, imagerie. Codes associés aux développements logiciels et workflow d’analyse.

Recherche Data Gouv est un écosystème national, destiné à accompagner la communauté scientifique dans une gestion vertueuse de leurs données de la recherche. L’ouverture des données de la recherche y est fortement incitée, dans le cadre du plan national pour la science ouverte (PNSO). À ce titre, l’IFB participe à l’ensemble des actions et des initiatives de l’écosystème, en particulier en interaction avec les ateliers de la donnée en région.

Nos missions au sein de Recherche Data Gouv

En tant que CRT, l’IFB contribue à la définition et à l’adoption des normes de description et de diffusion des données dans le domaine Biologie-Santé.

Les actions de l’IFB/ELIXIR-FR en tant que Centre de Référence Thématique des données de Biologie-Santé se déclinent en 5 axes  :

1. Normes & standards

Objectif : garantir la qualité, la cohérence et l’interopérabilité des données de recherche en biologie-santé.
Actions associées :

  • Définir les standards de métadonnées, vocabulaires contrôlés, ontologies et formats recommandés
  • Diffuser les bonnes pratiques de description des données.
  • Contribuer à l’harmonisation internationale (alignement sur les standards internationaux).

L’IFB contribue à élaborer des référentiels de métadonnées pour les différents types de données et domaines thématiques de la biologie. Afin de prendre en compte la diversité des domaines de la biologie, l’IFB collabore avec les autres Infrastructures Nationales en Biologie Santé (INBS) françaises et avec les autres nœuds du réseau européen ELIXIR.

L’IFB soutient le développement et l’adoption d’ontologies définissant les termes d’une communauté ou d’un domaine de la biologie-santé. En particulier, l’IFB/ELIXIR-FR contribue à l’ontologie EDAM, qui définit les types et formats de données biologiques.

2. Production et diffusion de bonnes pratiques

Objectif : accompagner les chercheurs et les plateformes génératrices de données tout au long du cycle de vie des données.
Actions :

  • Définir et documenter les bonnes pratiques de gestion, depuis la collecte jusqu’à la conservation à long terme.
  • Rédiger et diffuser des guides, protocoles et modèles de plans de gestion des données (PGD) adaptés à la discipline.
  • Former et sensibiliser les communautés scientifiques aux pratiques FAIR.

L’IFB/ELIXIR-FR contribue à définir et diffuser les bonnes pratiques de gestion des données et du code logiciel produits dans le cadre de projets en biologie-santé, en s’appuyant notamment sur RDMkit, le portail de connaissances et de ressources pour la gestion de données développé par ELIXIR.

L’IFB déploie et maintient Data Stewardship Wizard (DSW@IFB), service proposant d’élaborer des PGD à partir de modèles, et développe des modèles, en lien avec les autres INBS françaises.

L’IFB développe d’autres outils logiciels et propose des formations pour accompagner les chercheurs aux pratiques FAIR.

3. Entrepôts & infrastructures

Objectif : orienter les chercheurs vers des dépôts fiables en fonction de leurs types de données dans le domaine biologie-santé.
Actions :

  • Identifier les entrepôts nationaux et internationaux pertinents.
  • Recommander ou labelliser certains entrepôts disciplinaires comme dépôts de confiance.
  • Assurer le moissonnage des métadonnées de ces entrepôts pour enrichir le catalogue de Recherche Data Gouv.

L’IFB définit la liste des entrepôts de données de référence dans les différents domaines thématiques de la biologie-santé. Ceci se fait en collaboration avec les réseaux nationaux (notamment les INBS spécialistes des différents types de données) et internationaux (notamment l’infrastructure européenne ELIXIR).

4. Structuration nationale

Objectif : intégrer le domaine biologie-santé dans Recherche Data Gouv
Actions :

  • Contribuer à l’arborescence thématique des données de biologie santé de l’entrepôt Recherche Data Gouv.
  • Faire le lien entre les dispositifs thématiques spécialisés en biologie-santé et la plateforme nationale Recherche Data Gouv.
  • Représenter la communauté scientifique auprès du MESR et du comité de pilotage Recherche Data Gouv.

L’IFB soutient l’articulation entre les dispositifs thématiques spécialisés et Recherche Data Gouv, en participant aux événements nationaux et aux groupes de travaux transversaux. L’IFB participe au conseil des membres de Recherche Data Gouv, une des instances de gouvernance.

5. Structuration internationale

Objectif : positionner la recherche française dans les réseaux européens et mondiaux de données ouvertes.
Actions :

  • Participer à la co-construction de standards internationaux.
  • Favoriser l’interopérabilité transfrontalière des jeux de données.
  • Représenter la France dans les instances de gouvernance des infrastructures internationales.

En tant que nœud français de l’ESFRI ELIXIR, l’IFB/ELIXIR-FR contribue à la mutualisation des ressources qui participent à toutes les étapes de la gestion des données biologiques. Il est notamment partie prenante de projets liés à la gestion de données (ELIXIR-CONVERGE) et à l’élaboration d’infrastructures fédérées (GDI). ELIXIR-FR promeut les bases de connaissances spécialisées dans différents domaines de la biologie (dont Global Data Alliance), et participe à leur labellisation au niveau international (ELIXIR core data resources). ELIXIR-FR est aussi impliqué dans la rédaction d’un Position Paper d’ELIXIR relatif à la sécurisation des ressources ouvertes pour les données biologiques.

Contexte de notre rôle de CRT

Lors du renouvellement de la feuille de route nationale en 2021 des infrastructures de recherche, les pratiques, outils et compétences pour la prise en charge de tout le cycle de vie de la donnée dans les infrastructures candidates ont été appréciés. Certains domaines scientifiques ont spécialisé une ou plusieurs de leurs infrastructures dans la gestion et la diffusion de données pour leur communauté scientifique. Ces infrastructures sont inscrites dans un écosystème international et contribuent à la définition et à l’adoption des normes de description et de diffusion des données de leur domaine. À ce titre, ces infrastructures constituent les premiers Centres de Référence Thématiques (CRT) pour couvrir une partie de leurs domaines scientifiques dont l’IFB/ELIXIR-FR pour les données de biologie-santé.

L’IFB, en tant que centre de référence thématique, doit animer les communautés en science de la vie et santé pour définir les référentiels de bonnes pratiques en gestion des données. Cela nécessite l’implication d’acteurs variés, représentatifs de la grande hétérogénéité des données du domaine. Dans ce contexte, un groupe données de la recherche a été créé et travaille au sein du club des infrastructures nationales en biologie et santé (INBS).

Les différentes initiatives de développement d’outils et service à l’IFB, en science ouverte, viendront, à termes, consolider les recommandations proposées par le centre de référence.

Privacy Preference Center