Pourquoi un thésaurus INRAE ?
La création du thésaurus INRAE s’inscrit dans la démarche Science Ouverte de l’institut et la mise en oeuvre des principes FAIR : il doit permettre de rendre les productions de l’institut plus faciles à trouver et améliorer leur interopérabilité sémantique.
INRAE a développé son propre thésaurus avec des objectifs de :
- Qualité : une base terminologique en français et en anglais conçue pour et alimentée par la recherche scientifique ;
- Interopérabilité : un référentiel commun, utilisé dans divers systèmes d’information INRAE pour annoter les objets scientifiques numériques de manière cohérente (interopérabilité sémantique) plutôt qu’une multitude de vocabulaires indépendants ;
- Gouvernance : un référentiel propre à l’institut qui s’adapte aux besoins internes et s’appuie sur des moyens humains et informatiques maîtrisés ;
- Complémentarité : une ressource générique, porte d’entrée vers des vocabulaires plus spécifiques, notamment ceux conçus par les équipes scientifiques INRAE.
- Pertinence : une représentation des thématiques de recherche qui évolue avec l’institut, ce qui ne serait pas le cas en utilisant des vocabulaires externes ;

À quoi sert le thésaurus INRAE ?
Trouver des informations terminologiques
- des termes en anglais et en français pour les concepts des domaines et objets d’intérêt d’INRAE.
- des synonymes : un concept peut regrouper des termes de sens équivalent
- des définitions : au fil du temps, le thésaurus s’enrichira de définitions qui pourront être réutilisées dans les travaux de recherche, activités de communication, systèmes d’information… Les sources d’origine scientifique sont privilégiées.
Indexer des objets scientifiques numériques
Aujourd’hui, le thésaurus est utilisé dans HAL-INRAE pour indexer les documents de manière riche avec des synonymes ainsi que des traductions en anglais. Cette indexation permet de retrouver plus efficacement les documents et peut être exploitée pour réaliser des analyses thématiques après export des notices.
Son utilisation est également recommandée dans Recherche Data Gouv (INRAE) pour les champs « Keyword » et « Topic Classification ».
Les concepts du thésaurus peuvent donc être utilisés directement pour décrire ou annoter des documents, des jeux de données, des pages web, des descriptions d’activités, etc.
Comment le thésaurus est-il structuré ?
Le thésaurus couvre l’ensemble des domaines qui recouvre le périmètre de recherches INRAE.
Il est organisé de manière thématique, de façon à représenter les objets de recherche et les méthodes employées à INRAE. Il est composé de 15 971 concepts, répartis dans 12 domaines et 63 microthésaurus.

Le thésaurus est représenté à l’aide du standard SKOS (Simple Knowledge Organisation System) et de son extension SKOS-XL (standards W3C).
SKOS reprend certains éléments de la norme ISO 25964-1 de 2011 «Information et documentation — Thésaurus et interopérabilité avec d’autres vocabulaires ».
Un concept (C) correspond à une notion et une seule. Un concept peut être représenté par plusieurs termes et dans plusieurs langues (fr, en) : un libellé préférentiel qui s’affichera par défaut et des libellés alternatifs correspondant aux synonymes et acronymes. Chaque concept est identifié de manière unique à l’aide d’une URI (Unique Resource Identifier) et est placé dans au moins un microthésaurus.
Un microthésaurus (MT) est un sous-ensemble de concepts portant sur un sujet particulier. C’est un module utilisable de manière autonome vis-à-vis de l’ensemble du thésaurus. Au sein d’un microthésaurus, il est possible d’organiser les concepts de manière hiérarchique. La plupart des relations hiérarchiques du thésaurus signifie « est un type de ». Il est aussi possible d’avoir des relations hiérarchiques signifiant « fait partie de », comme dans le MT BIO anatomie et fluides biologiques.
La description des microthésaurus est consultable sur ce site (voir la section « liens utiles » ci-dessous).
Un groupe est une autre manière de regrouper des concepts ayant un point commun. Un groupe peut être construit de manière ad hoc sans modifier la structure de base du thésaurus, commune à tous les usages. Un groupe est une liste de concepts, il n’est pas possible d’y définir de liens hiérarchiques. Il est possible de regrouper des concepts par sujet (par exemple, la forêt) ou par nature (par exemple, les disciplines scientifiques).
Vous avez des questions ?
Consultez notre page Questions/Réponses ou n’hésitez pas à nous contacter !
- Thésaurus INRAE : un vocabulaire contrôlé des objets et méthodes de recherche à INRAE. Atelier INRAE Work4Graph Integration. 9 décembre 2021 Résumé – Vidéo – Support de présentation
- Thésaurus INRAE, un outil central pour l’interopérabilité sémantique des systèmes d’information INRAE
- AG du CATI PROSODIe – 25 novembre 2021. Support de présentation
- Séminaire INRAE Semantic Linked Data – 11 octobre 2021. Résumé – Support de présentation
- Thésaurus INRAE. Quoi de neuf en 2021 ? Séminaire IST. 30 novembre 2021
- Présentation du thésaurus INRAE
- Réunion avec l’équipe de traducteurs coordonnés par Christine Young de la Direction Communication INRAE. 21 septembre 2021. Support de présentation
- Journées plénières du projet ANR D2KAB. Support de présentation
- Jeudi DipSO. 10 juin 2021. Support de présentation
Sabine Arbeille, Sophie Aubin, Emilie Bernard, Sylvie Blin, Sonia Bravo, Colette Cadiou, Eric Cahuzac, Véronique Decognet, Olivier Dupré, Agnès Girard, Pascale Hénaut, Kareen Louembé, Anne-Sophie Martel, Christine Molé, Valérie Pagneux, Marie-Pierre Raymond, Mohamad Taha, Magalie Weber.
Agnès Girard, Alexandra Coppolino, Anne-Sophie Martel, Catherine Boutin, Catherine Tailleux, Charles Perrin, Chloé Duvivier, Christian Duquennoi, Christian Mougin, Christine Molé, Colette Cadiou, Delphine Mézière, Dominique Blancard, Dominique Fournier, Emilie Bernard, Eric Cahuzac, Floriane Giovannini, Hugues Leiser, Isabelle Cousin, Isabelle Hue, Jean-Bernard Marsat, christine Le Bas, Jérome Le-Coz, Jonathan Gaudin, Jorge Sierra, Kareen Louembé, Laure Hossard, Magalie Weber, Marie Houdart, Marie-Francoise Zébus, Marie-Laure Abinne, Marie-Noëlle Leclercq-Perlat, Marie-Pascale Baligand, Marie-Pierre Raymond, Marielle Jappiot, Marine Froissard, Mikael Loaëc, Mohamad Taha, Nicolas Eckert, Olivier Dupré, Pascale Hénaut, Pascale Karmasyn-Veyrines, Philippe Namour, Pierre-Yves Le-Bail, Roselyne Tâche, Sabine Arbeille, Sabine Rossi, Sébastien Proust, Soizic Morin, Sonia Bravo, Sophie Aubin, Sylvie Blin, Sophie Burgel, Sylvie Cocaud, Valérie Orozco, Valérie Pagneux, Vazken Andreassian, Véronique Batifol, Véronique Decognet, Violaine Colson,
Virginie Piguet, Yves Souchon.