A propos du thésaurus INRAE

Le thésaurus INRAE est un thésaurus ouvert et partagé couvrant les domaines de recherche d’INRAE avec plus de 15 000 concepts en français et en anglais (2/3 des concepts sont déjà traduits).

Pourquoi un thésaurus INRAE ?

INRAE a développé son propre thésaurus avec des objectifs de :

  • Pertinence : une représentation des thématiques de recherche qui évolue avec l’institut, ce qui ne serait pas le cas en utilisant des vocabulaires externes ;
  • Qualité : une base terminologique en français et en anglais conçue pour et alimentée par la recherche scientifique ;
  • Interopérabilité : un référentiel commun, utilisé dans divers systèmes d’information INRAE pour annoter les objets scientifiques numériques de manière cohérente (interopérabilité sémantique) plutôt qu’une multitude de vocabulaires indépendants ;
  • Gouvernance : un référentiel propre à l’institut qui s’adapte aux besoins internes et s’appuie sur des moyens humains et informatiques maîtrisés ;
  • Complémentarité : une ressource générique, porte d’entrée vers des vocabulaires plus spécifiques, notamment ceux conçus par les équipes scientifiques INRAE.

La création du thésaurus INRAE s’inscrit dans la démarche Science Ouverte de l’institut et la mise en oeuvre des principes FAIR : il doit permettre de rendre les productions de l’institut plus faciles à trouver et améliorer leur interopérabilité sémantique.

Qu’est-ce qu’un thésaurus ?

Un thésaurus est une liste structurée et contrôlée de concepts, représentés linguistiquement par plusieurs termes (descripteurs et non descripteurs). Les concepts, chacun porteur d’un sens unique, sont reliés par des relations sémantiques et peuvent également être alignés à des concepts d’autres vocabulaires.

En tant que langage documentaire, un thésaurus propose un système d’indexation précis et structuré pour tout objet numérique. Partagé par plusieurs systèmes d’informations, il permet d’interconnecter les ressources qui y sont hébergées.

A quoi sert le thésaurus INRAE ?

Le thésaurus INRAE fournit un ensemble de concepts pour :

1. Indexer des objets scientifiques numériques

Aujourd’hui, le thésaurus est utilisé dans HAL-INRAE pour indexer les document de manière riche avec des synonymes ainsi que des traductions en anglais. Cette indexation permet de retrouver plus efficacement les documents et peut être exploitée pour réaliser des analyses thématiques après export des notices.
Son utilisation est également recommandée dans Data INRAE pour les champs « Keyword » et « Topic Classification ».

Les concepts du thésaurus peuvent donc être utilisés directement pour décrire ou annoter des documents, des jeux de données, des pages web, des descriptions d’activités, etc. Pour savoir comment l’intégrer à un nouveau système d’information, contactez-nous.

2. Trouver des informations terminologiques :

  • des termes en anglais pour les concepts des domaines et objets d’intérêt d’INRAE.
  • des synonymes : un concept peut regrouper des termes de sens équivalent
  • des définitions : au fil du temps, le thésaurus s’enrichira de définitions qui pourront être réutilisées dans les travaux de recherche, activités de communication, systèmes d’information, etc. Les sources d’origine scientifique sont privilégiées.

La DipSO souhaite faire du thésaurus INRAE un outil d’interopérabilité des systèmes d’information de l’institut. Nous l’avons conçu de manière à ce qu’il offre, avec le plus de généricité possible, un ensemble de concepts identifiés de manière unique et pérenne au moyen d’URIs (Uniform Resource Identifier). A terme, nous souhaitons faire du thésaurus une ressource pivot offrant des alignements depuis et vers d’autres thésaurus et ontologies développés ou utilisés par les SI INRAE. Le thésaurus INRAE sera bientôt accessible via des web services opérés par la DSI.

Quelles sont les conditions d’utilisation du thésaurus INRAE ?

Le thésaurus est distribué sous Licence Ouverte Etalab (équivalente CC-BY) et peut donc être utilisé par toute personne ou organisation à condition de citer ses auteurs.

Comment citer le thésaurus ?

DipSO, 2021, « Thésaurus INRAE », https://doi.org/10.15454/J8GANU, Portail Data INRAE, V1

Comment le thésaurus INRAE est-il structuré ?

Le thésaurus INRAE est organisé de manière thématique, de façon à représenter les sujets étudiés et les méthodes employées à INRAE. Il est composé de 15 289 concepts, répartis dans 12 domaines et 64 microthésaurus. Pour visualiser la structure du thésaurus, ouvrir l’onglet Hiérarchie sur le portail de consultation.

Le thésaurus est représenté à l’aide du standard SKOS (Simple Knowledge Organisation System) et de son extension SKOS-XL (standards W3C). SKOS reprend certains éléments de la norme ISO 25964-1 « Information et documentation — Thésaurus et interopérabilité avec d’autres vocabulaires » de 2011.

Un concept correspond à une notion et une seule. Un concept peut être représenté par plusieurs termes et dans plusieurs langues (fr, en) : un libellé préférentiel qui s’affichera par défaut et des libellés alternatifs correspondant aux synonymes et acronymes. Chaque concept est identifié de manière unique à l’aide d’une URI (Unique Resource Identifier).

Un microthésaurus est un sous-ensemble de concepts portant sur un sujet particulier. C’est un module utilisable de manière autonome vis-à-vis de l’ensemble du thésaurus. Au sein d’un microthésaurus, il est possible d’organiser les concepts de manière hiérarchique. La description des microthésaurus est consultable sur ce site (voir la section « liens utiles » ci-dessous).

Un groupe est une autre manière de regrouper des concepts ayant un point commun. Un groupe peut être construit de manière ad hoc sans modifier la structure de base du thésaurus, commune à tous les usages. Un groupe est une liste de concepts, il n’est pas possible d’y définir de liens hiérarchiques. Il est possible de regrouper des concepts par sujet (par exemple, la forêt) ou par nature (par exemple, les disciplines scientifiques).

Comment évolue le thésaurus INRAE ?

Un comité éditorial dédié s’assure de la maintenance et de l’évolution du thésaurus

  • il reçoit et traite les demandes des utilisateurs et initie des chantiers d’enrichissement ;
  • il est garant du respect des règles de rédaction et de l’adaptation du thésaurus aux besoins des utilisateurs ;
  • il accompagne l’intégration du thésaurus dans des systèmes d’information et forme les utilisateurs à son utilisation. 

Le comité éditorial s’appuie sur les experts des domaines représentés en les sollicitant ponctuellement pour relecture et avis.

Les utilisateurs peuvent faire des demandes d’évolution ou de correction.  Les évolutions possibles concernent :

  • ajout d’un ou plusieurs concepts à un micro-thésaurus
  • déplacement d’un ou plusieurs concepts au sein d’un micro-thésaurus ou vers un autre micro-thésaurus
  • ajout de synonymes en français ou en anglais
  • ajout de définitions en français ou en anglais
  • ajout de liens vers des concepts dans d’autres vocabulaires
  • création de groupes (ou collections) de concepts

Une formulaire est mis à disposition des utilisateurs sur le site de consultation du thésaurus (onglet « Nous contacter »).
L’onglet « Nouveautés » du site de consultation présente une liste des concepts ajoutés dernièrement.

Le membres du comité éditorial

Agnès Girard, Anne-Sophie Martel, Christine Molé, Colette Cadiou, Emilie Bernard, Eric Cahuzac, Kareen Louembé, Magalie Weber, Marie-Pierre Raymond, Mohamad Taha, Olivier Dupré, Pascale Hénaut, Roselyne Tâche, Sabine Arbeille, Sonia Bravo, Sophie Aubin, Sylvie Blin, Valérie Pagneux, Véronique Decognet.

Tous les contributeurs

Agnès Girard, Alexandra Coppolino, Anne-Sophie Martel, Catherine Boutin, Catherine Tailleux, Charles Perrin, Chloé Duvivier, Christian Duquennoi, Christian Mougin, Christine Molé, Colette Cadiou, Delphine Mézière, Dominique Blancard, Dominique Fournier, Emilie Bernard, Eric Cahuzac, Floriane Giovannini, Hugues Leiser, Isabelle Cousin, Isabelle Hue, Jean-Bernard Marsat, Jérome Le-Coz, Jonathan Gaudin, Jorge Sierra, Kareen Louembé, Laure Hossard, Magalie Weber, Marie Houdart, Marie-Francoise Zébus, Marie-Laure Abinne, Marie-Noëlle Leclercq-Perlat, Marie-Pascale Baligand, Marie-Pierre Raymond, Marielle Jappiot, Marine Froissard, Mikael Loaëc, Mohamad Taha, Nicolas Eckert, Olivier Dupré, Pascale Hénaut, Pascale Karmasyn-Veyrines, Philippe Namour, Pierre-Yves Le-Bail, Roselyne Tâche, Sabine Arbeille, Sabine Rossi, Sébastien Proust, Soizic Morin, Sonia Bravo, Sophie Aubin, Sylvie Blin, Sophie Burgel, Sylvie Cocaud, Valérie Orozco, Valérie Pagneux, Vazken Andreassian, Véronique Batifol, Véronique Decognet, Violaine Colson, Virginie Piguet, Yves Souchon.

Contacter le comité éditorial

Vous avez une question ? Vous souhaitez participer au comité éditorial ? Vous êtes expert d’un sujet et souhaitez contribuer ponctuellement ? Contactez-nous : thesaurusINRAE@inrae.fr

Communications autour du thésaurus

Liens utiles