1 : Institut Curie, PSL Research University, F-75005 Paris, France Institut Curie, PSL Research University
2 : INSERM, U900, F-75005 Paris, France Inserm
3 : MINES ParisTech, PSL Research University, CBIO-Centre for Computational Biology, F-75006 Paris, France MINES ParisTech, PSL Research University
4 : Institut Curie, PSL Research University, Mines Paris Tech, Bioinformatics and Computational Systems Biology of Cancer, INSERM U900, F-75005, Paris, France Institut Curie, PSL Research University, Mines Paris Tech, Bioinformatics and Computational Systems Biology of Cancer, INSERM U900, F-75005, Paris, France
La plateforme de bioinformatique de l'Institut Curie a développé un ensemble de bonnes pratiques visant à améliorer la reproductibilité, la standardisation et la maintenabilité des pipelines de bioinformatique d'analyse. Ces pratiques s'inscrivent dans les principes FAIR (Findable Accessible Interoperability Reproducibility) qui restent un défi majeur compte tenu de la diversité et de la complexité des outils. Nous structurons nos développements autour du gestionnaire de workflow Nextflow et notre framework GENIAC, qui impose des standards stricts pour la configuration, l'installation et la portabilité des pipelines. L'usage systématique des conteneurs (Docker Apptainer/Singularity) renforce cet objectif en garantissant des environnements reproductibles sur infrastructures HPC et cloud, notamment des infrastructures nationales tel que le supercalculateur Jean Zay du CNRS IDRIS ou de l'Institut Français de bio-informatique. Pour encadrer le versioning et les évolutions du code, nous appliquons nos procédures biogitflow qui formalisent le développement en mode nominal ou hotfix via Git et GitLab. Ce cadre s'intègre naturellement à GitLab‑CI, permettant d'automatiser les tests, le packaging et le déploiement des pipelines dans un contexte d'utilisation en production.
Type :
:
Poster
Thématiques
:
Cycle de vie du logiciel, génie logiciel, usines logicielles