Le thésaurus INRAE est le référentiel thématique couvrant les domaines de recherche d’INRAE avec plus de 15 000 concepts en français et en anglais.

Pourquoi un thésaurus INRAE ?

La création du thésaurus INRAE s’inscrit dans la démarche Science Ouverte de l’institut et la mise en oeuvre des principes FAIR : il doit permettre de rendre les productions de l’institut plus faciles à trouver et améliorer leur interopérabilité sémantique.

INRAE a développé son propre thésaurus avec des objectifs de :

  • Qualité : une base terminologique en français et en anglais conçue pour et alimentée par la recherche scientifique ;
  • Interopérabilité : un référentiel commun, utilisé dans divers systèmes d’information INRAE pour annoter les objets scientifiques numériques de manière cohérente (interopérabilité sémantique) plutôt qu’une multitude de vocabulaires indépendants ;
  • Gouvernance : un référentiel propre à l’institut qui s’adapte aux besoins internes et s’appuie sur des moyens humains et informatiques maîtrisés ;
  • Complémentarité : une ressource générique, porte d’entrée vers des vocabulaires plus spécifiques, notamment ceux conçus par les équipes scientifiques INRAE.
  • Pertinence : une représentation des thématiques de recherche qui évolue avec l’institut, ce qui ne serait pas le cas en utilisant des vocabulaires externes :

À quoi sert le thésaurus INRAE ?

Trouver des informations terminologiques

 Le thésaurus INRAE propose :
  • des termes en anglais et en français pour les concepts des domaines et objets d’intérêt d’INRAE.
  • des synonymes : un concept peut regrouper des termes de sens équivalent
  • des définitions : au fil du temps, le thésaurus s’enrichira de définitions qui pourront être réutilisées dans les travaux de recherche, activités de communication, systèmes d’information… Les sources d’origine scientifique sont privilégiées.

Indexer des objets scientifiques numériques

Aujourd’hui, le thésaurus est utilisé dans HAL-INRAE pour indexer les documents de manière riche avec des synonymes ainsi que des traductions en anglais. Cette indexation permet de retrouver plus efficacement les documents et peut être exploitée pour réaliser des analyses thématiques après export des notices.
Son utilisation est également recommandée dans Recherche Data Gouv (INRAE) pour les champs « Keyword » et « Topic Classification ».

Les concepts du thésaurus peuvent donc être utilisés directement pour décrire ou annoter des documents, des jeux de données, des pages web, des descriptions d’activités, etc.

A terme, nous souhaitons faire du thésaurus une ressource pivot offrant des alignements depuis et vers d’autres thésaurus et ontologies développés ou utilisés par les Systèmes d’Information INRAE.

Comment le thésaurus est-il structuré ?

Le thésaurus couvre l’ensemble des domaines qui recouvre le périmètre de recherches INRAE.

Il est organisé de manière thématique, de façon à représenter les objets de recherche et les méthodes employées à INRAE. Il est composé de plus de 16 000 concepts, répartis dans 12 domaines contenant chacun des microthésaurus.

 

Le thésaurus est représenté à l’aide du standard SKOS (Simple Knowledge Organisation System) et de son extension SKOS-XL (standards W3C).

SKOS reprend certains éléments de la norme ISO 25964-1 de 2011 «Information et documentation — Thésaurus et interopérabilité avec d’autres vocabulaires ».

Un concept (C) correspond à une notion et une seule. Un concept peut être représenté par plusieurs termes et dans plusieurs langues (fr, en) : un libellé préférentiel qui s’affichera par défaut et des libellés alternatifs correspondant aux synonymes et acronymes. Chaque concept est identifié de manière unique à l’aide d’une URI (Unique Resource Identifier) et est placé dans au-moins un microthésaurus. 

Un microthésaurus (MT) est un sous-ensemble de concepts portant sur un sujet particulier. C’est un module utilisable de manière autonome vis-à-vis de l’ensemble du thésaurus. Au sein d’un microthésaurus, il est possible d’organiser les concepts de manière hiérarchique. La plupart des relations hiérarchiques du thésaurus signifie « est un type de ». Il est aussi possible d’avoir des relations hiérarchiques signifiant « fait partie de », comme dans le MT BIO anatomie et fluides biologiques.
La description des microthésaurus est consultable en cliquant sur le lien ci-contre (« Voir la description des microthésaurus »).

Un groupe est une autre manière de regrouper des concepts ayant un point commun. Un groupe peut être construit de manière ad hoc sans modifier la structure de base du thésaurus, commune à tous les usages. Un groupe est une liste de concepts, il n’est pas possible d’y définir de liens hiérarchiques. Il est possible de regrouper des concepts par sujet (par exemple, la forêt) ou par nature (par exemple, les disciplines scientifiques).

Vous avez des questions ?

Consultez notre page Questions/Réponses ou n’hésitez pas à nous contacter !

Retour en haut