Un projet sémantique INRAE récompensé par le Prix Science Ouverte 2023 !
L’écosystème d’outils PO2 développé au sein du CATI DIISCICO et le projet ANR DataSusFood ont reçu le Prix National de la Science Ouverte dans la catégorie « Créer les conditions de la réutilisation » le 29 novembre 2023 lors de la cérémonie qui s’est déroulée au ministère de l’enseignement supérieur et de la recherche.
Ces travaux s’inscrivent dans la politique du Plan National pour la Science Ouverte, déclinée au niveau institutionnel INRAE dans les domaines de l’agriculture, de l’alimentation et de l’environnement.
La démarche s’appuie sur la mise en œuvre “by-design” des principes FAIR pour la mise en visibilité des données et leur intelligibilité. L’intelligibilité s’entend ici au sens de compréhension du contexte d’obtention des données grâce à l’utilisation d’une ontologie de domaine permettant de structurer les données et de définir les concepts et le vocabulaire spécifique utilisés par les scientifiques pour décrire les données. La FAIRification repose sur les technologies du web sémantique et sur l’ontologie Process and Observation Ontology (PO2) dont le modèle simplifié est représenté ci-dessous. Ce modèle générique a été spécialisé pour répondre au périmètre des recherches du département TRANSFORM INRAE. Le résultats est l’ontologie de domaine TransformON consultable sur AgroPortal.
Le projet ANR DataSusFood « Structurer et ouvrir les Données pour améliorer la Durabilité des Systèmes Alimentaires » a permis de consolider la démarche initiée depuis une dizaine d’années pour promouvoir l’ouverture et le partage des données. Plus précisément, les recherches portent sur les procédés de transformation de la biomasse et la caractérisation des aliments et des bioproduits qui en sont issus, en lien avec le recyclage des résidus ou biodéchets pour répondre aux enjeux de la bioéconomie.
Un écosystème d’outils permettant de gérer le vocabulaire, d’annoter les jeux de données et de les interroger pour les réassembler puis de les déposer directement dans l’entrepôt Recherche Data Gouv a été développé au sein d’une équipe pluridisciplinaire. Celle-ci est composée de 27 personnes issus de plusieurs unités de recherche des départements TRANSFORM et MathNum INRAE, dont 10 informaticiens, regroupés au sein du CATI DIISCICO, spécialisés dans les systèmes d’information, le web sémantique et la science des données, des scientifiques (directeur.trice de recherche, chercheur.e ou enseignant-chercheur.e) dans le domaine des sciences alimentaires, du génie des procédés, des sciences de l’environnement et de la modélisation mathématique et une dizaine de stagiaires, doctorant.e.s ou post-doctorant.e.s qui ont contribué au développement de la base de connaissances. Ce travail a aussi été soutenu par la DipSO et notamment le pôle Num4Sci pour l’appui méthodologique en ingénierie des connaissances.