A propos du Thésaurus INRAE
Le Thésaurus INRAE est le référentiel thématique couvrant les domaines de recherche d’INRAE. Il contient plus de 16 000 concepts en français et en anglais et de nombreuses définitions. Il peut être consulté, utilisé par des applications via des API et téléchargé. Il est maintenu par un comité éditorial et mis à jour régulièrement.
Sommaire
À quoi sert le thésaurus INRAE ?
Trouver des informations terminologiques
- des termes en anglais et en français pour les concepts des domaines et objets d’intérêt d’INRAE.
- des synonymes : un concept peut regrouper des termes de sens équivalent
- des définitions : au fil du temps, le thésaurus s’enrichira de définitions qui pourront être réutilisées dans les travaux de recherche, activités de communication, systèmes d’information… Les sources d’origine scientifique sont privilégiées.
Indexer des objets scientifiques numériques
Aujourd’hui, le thésaurus est utilisé dans HAL-INRAE pour indexer les documents de manière riche avec des synonymes ainsi que des traductions en anglais. Cette indexation permet de retrouver plus efficacement les documents et peut être exploitée pour réaliser des analyses thématiques après export des notices.
Son utilisation est également recommandée dans Recherche Data Gouv (INRAE) pour les champs « Keyword » et « Topic Classification ».
D’autres systèmes d’informations et outils pour les métadonnées l’utilisent, parmi lesquels Maggot, ODAM, Actifs Numériques Scientifiques, etc.
Les concepts du thésaurus peuvent donc être utilisés directement pour décrire ou annoter des documents, des jeux de données, des pages web, des descriptions d’activités, etc.
Pourquoi un thésaurus INRAE ?
La création du thésaurus INRAE s’inscrit dans la démarche Science Ouverte de l’institut et la mise en oeuvre des principes FAIR : il doit permettre de rendre les productions de l’institut plus faciles à trouver et améliorer leur interopérabilité sémantique.
INRAE a développé son propre thésaurus avec des objectifs de :
- Qualité : une base terminologique en français et en anglais conçue pour et alimentée par la recherche scientifique ;
- Interopérabilité : un référentiel commun, utilisé dans divers systèmes d’information INRAE pour annoter les objets scientifiques numériques de manière cohérente (interopérabilité sémantique) plutôt qu’une multitude de vocabulaires indépendants ;
- Gouvernance : un référentiel propre à l’institut qui s’adapte aux besoins internes et s’appuie sur des moyens humains et informatiques maîtrisés ;
- Complémentarité : une ressource générique, porte d’entrée vers des vocabulaires plus spécifiques, notamment ceux conçus par les équipes scientifiques INRAE.
- Pertinence : une représentation des thématiques de recherche qui évolue avec l’institut, ce qui ne serait pas le cas en utilisant des vocabulaires externes :
Comment le thésaurus est-il structuré ?
Le thésaurus couvre l’ensemble des domaines qui recouvre le périmètre de recherches INRAE.
Il est organisé de manière thématique, de façon à représenter les objets de recherche et les méthodes employées à INRAE. Il est composé de plus de 16 000 concepts, répartis dans 12 domaines contenant chacun des microthésaurus.
Un concept (C) correspond à une notion et une seule. Un concept peut être représenté par plusieurs termes et dans plusieurs langues (fr, en) : un libellé préférentiel qui s’affichera par défaut et des libellés alternatifs correspondant aux synonymes et acronymes. Chaque concept est identifié de manière unique à l’aide d’une URI (Unique Resource Identifier) et est placé dans au-moins un microthésaurus.
Un microthésaurus (MT) est un sous-ensemble de concepts portant sur un sujet particulier. C’est un module utilisable de manière autonome vis-à-vis de l’ensemble du thésaurus. Au sein d’un microthésaurus, il est possible d’organiser les concepts de manière hiérarchique. La plupart des relations hiérarchiques du thésaurus signifie « est un type de ». Il est aussi possible d’avoir des relations hiérarchiques signifiant « fait partie de », comme dans le MT BIO anatomie et fluides biologiques.
La description des microthésaurus est consultable en cliquant sur le lien ci-contre (« Voir la description des microthésaurus »).
Une collection (anciennement groupe) est une autre manière de regrouper des concepts ayant un point commun. Une collection peut être construite de manière ad hoc sans modifier la structure de base du thésaurus qui reste commune à tous les usages. Une collection est une simple liste de concepts, il n’est pas possible d’y définir de liens hiérarchiques. Il est possible de regrouper des concepts par sujet (par exemple, la forêt) ou par nature (par exemple, les disciplines scientifiques).
Le thésaurus est représenté à l’aide du standard SKOS (Simple Knowledge Organisation System) et de son extension SKOS-XL (standards W3C).
SKOS reprend certains éléments de la norme ISO 25964-1 de 2011 «Information et documentation — Thésaurus et interopérabilité avec d’autres vocabulaires ».
Explorer et utiliser le thésaurus : Agroportal, API, télécharger
Le thésaurus INRAE est disponible sur plusieurs plateformes afin de répondre aux différents usages et communautés.
Basé sur la technologie Skosmos, le portail de consultation offre un accès pratique au contenu du thésaurus pour tous.
Basé sur la technologie OntoPortal, AgroPortal est un entrepôt de référence pour les ontologies et les thésaurus en agriculture et domaines associés. Il permet de découvrir les liens (mappings) du Thésaurus INRAE avec d’autres vocabulaires, d’annoter des petits textes et offre des widgets à intégrer à vos sites.
Une API, pour Application programming interface, est un programme permettant à deux applications distinctes de communiquer entre elles et d’échanger des données. Ce mécanisme permet à un système d’information ou un logiciel d’interroger la dernière version du Thésaurus INRAE. Trois solutions sont disponibles :
- La Plateforme d’intégration (PADRE) administrée par la DSI. Comme d’autres référentiels institutionnels, le Thésaurus INRAE y est exposé. Cette API n’est accessible qu’aux applications INRAE.
- Le portail de consultation Skosmos propose une API publique swagger.
- Le portail AgroPortal permet d’interroger le Thésaurus INRAE seul ou combiné à d’autres thésaurus ou ontologies du domaine.
Un lien unique permet d’accéder en permanence à la dernière version publiée du Thésaurus INRAE.
Les fichiers des anciennes versions en RDF-SKOS ainsi qu’en RDF-SKOS-XL sont accessibles sur la forge INRAE.
Comment est-il maintenu ?
Le thésaurus INRAE est une ressource en constante évolution. Un comité éditorial veille à sa maintenance. Pour répondre au mieux aux besoins, les utilisateurs peuvent eux-mêmes contribuer :
- Proposer de nouveaux concepts
- Proposer des définitions
- Suggérer des améliorations
Pour toute question, n’hésitez pas à explorer la FAQ thésaurus ou nous contacter.
- Thésaurus INRAE : un vocabulaire contrôlé des objets et méthodes de recherche à INRAE. Atelier INRAE Work4Graph Integration. 9 décembre 2021 Résumé – Vidéo – Support de présentation
- Thésaurus INRAE, un outil central pour l’interopérabilité sémantique des systèmes d’information INRAE
- AG du CATI PROSODIe – 25 novembre 2021. Support de présentation
- Séminaire INRAE Semantic Linked Data – 11 octobre 2021. Résumé – Support de présentation
- Thésaurus INRAE. Quoi de neuf en 2021 ? Séminaire IST. 30 novembre 2021
- Présentation du thésaurus INRAE
- Réunion avec l’équipe de traducteurs coordonnés par Christine Young de la Direction Communication INRAE. 21 septembre 2021. Support de présentation
- Journées plénières du projet ANR D2KAB. Support de présentation
- Jeudi DipSO. 10 juin 2021. Support de présentation
Sophie Aubin, Emilie Bernard, Sylvie Blin, Sonia Bravo, Bérengère Casal, Véronique Decognet, Olivier Dupré, Pascale Hénaut, Kareen Louembé, Sacha Muszlak, Valérie Pagneux, Marie-Pierre Raymond, Christine Riou, Roselyne Tâche, Mohamad Taha, Magalie Weber
Agnès Girard, Alexandra Coppolino, Amélie Fiocca, Anne-Sophie Martel, Bérengère Casal, Catherine Boutin, Catherine Tailleux, Charles Perrin, Chloé Duvivier, Christian Duquennoi, Christian Mougin, Christine Le Bas, Christine Molé, Christine Riou, Colette Cadiou, Delphine Mézière, Dominique Blancard, Dominique Fournier, Emilie Bernard, Eric Cahuzac, Floriane Giovannini, Hugues Leiser, Isabelle Cousin, Isabelle Hue, Jean-Bernard Marsat, Jérome Le-Coz, Jonathan Gaudin, Jorge Sierra, Kareen Louembé, Laure Hossard, Magalie Weber, Marie Houdart, Marie-Francoise Zébus, Marie-Laure Abinne, Marie-Noëlle Leclercq-Perlat, Marie-Pascale Baligand, Marie-Pierre Raymond, Marielle Jappiot, Marine Froissard, Mikael Loaëc, Mohamad Taha, Nicolas Eckert, Olivier Dupré, Pascale Hénaut, Pascale Karmasyn-Veyrines, Philippe Namour, Pierre-Yves Le-Bail, Roselyne Tâche, Sabine Arbeille, Sabine Rossi, Sébastien Proust, Soizic Morin, Sonia Bravo, Sophie Aubin, Sylvie Blin, Sophie Burgel, Sylvie Cocaud, Valérie Orozco, Valérie Pagneux, Vazken Andreassian, Véronique Batifol, Véronique Decognet, Violaine Colson, Virginie Piguet, Yves Souchon.

