Logo Sciencesconf

Reproductibilité, portabilités et industrialisation de pipelines bio-informatiques

Quentin Duvert, Philippe Hupé, Frédéric Jarlier  1, 2, 3@  , Julien Romejon  2, 3, 4@  

1 : Institut Curie, PSL Research University, F-75005 Paris, France
Institut Curie, PSL Research University

2 : INSERM, U900, F-75005 Paris, France
Inserm

3 : MINES ParisTech, PSL Research University, CBIO-Centre for Computational Biology, F-75006 Paris, France
MINES ParisTech, PSL Research University

4 : Institut Curie, PSL Research University, Mines Paris Tech, Bioinformatics and Computational Systems Biology of Cancer, INSERM U900, F-75005, Paris, France
Institut Curie, PSL Research University, Mines Paris Tech, Bioinformatics and Computational Systems Biology of Cancer, INSERM U900, F-75005, Paris, France

La plateforme de bioinformatique de l'Institut Curie a développé un ensemble de bonnes pratiques visant à améliorer la reproductibilité, la standardisation et la maintenabilité des pipelines de bioinformatique d'analyse. Ces pratiques s'inscrivent dans les principes FAIR (Findable Accessible Interoperability Reproducibility) qui restent un défi majeur compte tenu de la diversité et de la complexité des outils. Nous structurons nos développements autour du gestionnaire de workflow Nextflow et notre framework GENIAC, qui impose des standards stricts pour la configuration, l'installation et la portabilité des pipelines. L'usage systématique des conteneurs (Docker Apptainer/Singularity) renforce cet objectif en garantissant des environnements reproductibles sur infrastructures HPC et cloud, notamment des infrastructures nationales tel que le supercalculateur Jean Zay du CNRS IDRIS ou de l'Institut Français de bio-informatique. Pour encadrer le versioning et les évolutions du code, nous appliquons nos procédures biogitflow qui formalisent le développement en mode nominal ou hotfix via Git et GitLab. Ce cadre s'intègre naturellement à GitLab‑CI, permettant d'automatiser les tests, le packaging et le déploiement des pipelines dans un contexte d'utilisation en production.

Type : : Poster

Thématiques : Cycle de vie du logiciel, génie logiciel, usines logicielles

Chargement... Chargement...