Logo Sciencesconf

Holograph: a generic RDF schema to handle data from agroecological holobionts

Edmond Berne  1, 2, 3@  , Marie Lahaye  4  , Alice Mataigne  5  , Matéo Boudet  5, 4  , Olivier Dameron  5  , Valentin Loux  1, 2, 3  , Anne-Françoise Adam-Blondon  6, 3  , Olivier Rué  1, 2  , Fabrice Legeai  4, 5@  

1 : Mathématiques et Informatique Appliquées du Génome à l'Environnement [Jouy-En-Josas]
Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement, Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement : UPR1404

2 : IR BioInfOmics
Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement

3 : Institut Français de Bioinformatique
Commissariat à l'énergie atomique et aux énergies alternatives, Institut National de la Santé et de la Recherche Médicale, Centre National de la Recherche Scientifique, Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement

4 : Institut de Génétique, Environnement et Protection des Plantes
Université de Rennes, Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement, Institut Agro Rennes ANgers

5 : Institut de Recherche en Informatique et Systèmes Aléatoires
Université de Rennes, Institut National des Sciences Appliquées - Rennes, Université de Bretagne Sud, École normale supérieure - Rennes, Institut National de Recherche en Informatique et en Automatique, CentraleSupélec, Centre National de la Recherche Scientifique, IMT Atlantique

6 : Ressources génomique-info
Université Paris-Saclay, Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement

Understanding host-microbiota interactions in agroecological studies requires linking complexheterogeneous datasets, from microbial diversity to host phenotypes and environmental variables.Managing this complexity and integrating metagenomics data is the key challenge in host-microbiotastudies, also called holobiont studies. To address this, we developed Holograph, a RDF schemadedicated to the representation of holobiont data, to provide a structure and interoperable frameworkto store these diverse data types. Indeed, the Resource Description Framework (RDF) is a standardmodel to describe data as oriented graph. It is divided in three elementary entities: the subjectand the object linked by a predicate, all identified by a Uniform Resource Identifier (URI). Thisensures high interoperability through URIs and controlled vocabularies. Our architecture integratesthe Sensor, Observation, Sample, and Actuator ontology (SOSA) and the InteroperAble Descrip-tions of Observable Property Terminology (I-ADOPT) one to standardize measurements, whileGeoSPARQL handles nested geospatial data. This semantic stack ensures a clear and unambiguousdata description. Our schema was successfully tested and implemented on datasets describingplant and livestock animal holobionts allowing data exploration using the RDF query language,SPARQL. However, querying the database using SPARQL can be harsh for non-experts. To remedythis, we are developping HoloUI, a web application which abstracts the graph complexity. Builtwith Next.Js for the frontend and FastAPI for the backend, HoloUI is based on a form collection tocapture user requirements. Thus, they only select parameters and the server dynamically generatesthe SPARQL query by computing one of the shortest path in the RDF graph using the Kurskal'sMinimum Spacing Tree algorithm. This strategy allows researchers to explore complex holobiontdata without mastering semantic query languages.

Type : : Poster

Thématiques : Science Ouverte, recherche reproductible et éco-systèmes numériques

Mots-Clés : Gestion des données

Chargement... Chargement...