Questions/Réponses autour du Thésaurus INRAE

Généralités

Qu’est-ce qu’un thésaurus ?

Un thésaurus est une liste structurée et contrôlée de concepts, représentés linguistiquement par plusieurs termes (descripteurs et non descripteurs). Les concepts, chacun porteur d’un sens unique, sont reliés par des relations sémantiques et peuvent également être alignés à des concepts d’autres vocabulaires.

En tant que langage documentaire, un thésaurus propose un système d’indexation précis et structuré pour tout objet numérique. Partagé par plusieurs systèmes d’informations, il permet d’interconnecter les ressources qui y sont hébergées.

Utiliser le thésaurus INRAE

Quelles sont les conditions d’utilisation du thésaurus INRAE ?

Le thésaurus est distribué sous Licence Ouverte Etalab (équivalente CC-BY) et peut donc être utilisé par toute personne ou organisation à condition de citer ses auteurs.

Comment citer le thésaurus ?

DipSO, 2021, « Thésaurus INRAE », https://doi.org/10.15454/J8GANU, Portail Data INRAE, V1

Dans quels formats le thésaurus INRAE est-il disponible ?

La version publique du thésaurus est représentée en SKOS. Le fichier est téléchargeable sur le portail de consultation au format RDF/XML.

Une version SKOS-XL ainsi que d’autres formats (JSON-LD, Turtle, TSV…) sont disponibles à la demande. Contactez le comité éditorial.

Le thésaurus INRAE est-il aligné avec d’autres thésaurus et des ontologies ?

Le thésaurus INRAE contient actuellement des alignements (ou correspondances) vers Agrovoc et GEMET. Tous les alignements sont évalués et validés par le comité éditorial. D’autres alignements seront réalisés avec plus de ressources sémantiques, en particulier les ontologies et thésaurus publiés via le service Vocabulaires Ouverts @INRAE.

Faire évoluer le thésaurus INRAE

Selon quels critères les concepts sont-ils choisis ?
  1. Le concept à ajouter doit être en rapport avec un objet d’étude ou une méthode de recherche d’intérêt pour l’Institut.
  2. Le concept doit être utilisé au sein d’une ou plusieurs communautés (scientifique, de pratique…)  – on peut par exemple vérifier le nombre d’apparitions dans une archive ouverte comme HAL, dans un moteur de recherche, etc.
  3. Les termes proposés doivent désigner précisément le concept.
  4. Le concept doit être nouveau dans le thésaurus. Si un concept désigné par un terme synonyme est déjà présent, on complètera ce concept.
  5. Idéalement, une définition pourra aider à évaluer la pertinence du concept

Note : le comité éditorial se réserve le droit de refuser l’ajout de concepts en dehors du périmètre thématique ou trop spécifiques. En effet, le thésaurus n’a pas vocation à se substituer aux référentiels plus spécialisés et développés pour des applications précises

Au moment de sa création, le comité éditorial s’est basé sur deux ressources existantes : le thésaurus Irstea (5 825 concepts pour environ 10 000 termes) et le référentiel mots-clés INRA (22 057 concepts pour 39 000 termes). Une analyse des usages dans les  archives Irstea-Doc et ProdInra, dans le référentiel Inra des activités ainsi que d’autres ressources publiques ont permis d’écarter les termes peu ou pas usités.