Skip to main content

Inclure la phrase suivante dans la section « Funding » ou « Acknowledgement » des publications :

Ce travail a bénéficié d’une aide de l’Etat gérée par l’Agence Nationale de la Recherche au titre de France 2030 portant la référence « ANR-24-PESA-0003.
| > Accès à la page Remerciements & affiliations

Descriptif du projet

L’analyse de l’impact du microbiome humain sur la santé représente un enjeu scientifique et médical, et pose des défis aussi bien sur le plan technologique (données massives, dispersées, hétérogènes) qu’éthique (données identifiantes et à valeur prédictive pour la santé et le mode de vie). Le PEPR Systèmes Alimentaires, Microbiome et Santé finance un ambitieux programme visant à stimuler l’analyse du microbiome en France via des appels à projets ciblés ou ouverts, dont les résultats ont vocation à être Faciles à trouver, Accessibles, Interopérables et Réutilisables (principes FAIR).

Le projet ciblé Cloud4SAMS vise à déployer une infrastructure numérique distribuée permettant aux chercheurs d’exploiter les données de microbiome et de santé dans un environnement informatique sécurisé. Il s’appuie sur la fédération de ressources informatiques opérées par différentes institutions et réparties sur différents sites : jeux de données produits par des projets de microbiome (notamment ceux qui seront financés par le PEPR SAMS), outils logiciels et workflows pour le traitement de ces données, plateformes de calcul et stockage appropriées au traitement des données de microbiome et à leur appariement avec des données de santé. Ces ressources seront indexées dans le catalogue Cloud4SAMS (WP2), et serviront de briques de base pour définir des recettes de déploiement décrivant l’ensemble des procédures pour instancier une machine virtuelle dans un cloud sécurisé (WP3), pour y installer tout l’environnement logiciel et pour y accueillir les jeux de données nécessaires au projet. L’accès à ces données (WP4) est facilité par une interface qui gère les demandes auprès des comités d’accès de chaque projet, la validation des autorisations, l’extraction ad hoc des données et leur transfert vers les espaces sécurisés.

Le projet comporte un volet important consacré à la dissémination et à la formation (WP5) : appui aux producteurs de données pour l’évaluation de la qualité des données, l’amélioration des métadonnées, et la soumission aux entrepôts de référence ; formation des usagers aux ressources informatiques (catalogue, portail d’accès, environnements sécurisés) mais aussi aux questions éthiques et juridiques en matière de données personnelles. Ces enjeux cruciaux feront l’objet du WP6, qui consistera à mener les études de risque et d’impact afin de définir le cadre juridique pour le partage des données et le niveau de cybersécurité appropriés pour le traitement des données du microbiome humain, et pour leur appariement avec des données de santé.

L’architecture et l’implémentation s’appuieront sur l’expertise et les standards développés par l’IFB (catalogue des ressources bioinformatiques, outils de FAIRisation et de data brokering) et par le réseau ELIXIR (catalogue bio.tools, workflow hub, ontologie EDAM, Federated European Genome Archive).

En tenant compte des ressources financières et des délais, le présent projet se limitera à implémenter une preuve de concept (Proof Of Concept, POC) visant à déployer toutes les briques de base et à mettre le système à l’épreuve de quelques cas d’études sélectionnés (WP7) sur base de données produites par les équipes partenaires ou disponibles en accès public.

Privacy Preference Center