Questions/Réponses autour du Thésaurus INRAE

Généralités

Qu’est-ce qu’un thésaurus ?

Un thésaurus est une liste structurée et contrôlée de concepts, représentés linguistiquement par plusieurs termes (descripteurs et non descripteurs). Les concepts, chacun porteur d’un sens unique, sont reliés par des relations sémantiques et peuvent également être alignés à des concepts d’autres vocabulaires.

En tant que langage documentaire, un thésaurus propose un système d’indexation précis et structuré pour tout objet numérique. Partagé par plusieurs systèmes d’informations, il permet d’interconnecter les ressources qui y sont hébergées.

Utiliser le thésaurus INRAE

Quelles sont les conditions d’utilisation du thésaurus INRAE ?

Le thésaurus est distribué sous Licence Ouverte Etalab (équivalente CC-BY) et peut donc être utilisé par toute personne ou organisation à condition de citer ses auteurs.

Comment citer le thésaurus ?

INRAE, 2021, « Thésaurus INRAE », https://doi.org/10.15454/J8GANU, Portail Data INRAE, V1

Dans quels formats le thésaurus INRAE est-il disponible ?

La version publique du thésaurus est représentée en SKOS. Le fichier est téléchargeable sur le portail de consultation au format RDF/XML.

Une version SKOS-XL ainsi que d’autres formats (JSON-LD, Turtle, TSV…) sont disponibles à la demande. Contactez le comité éditorial.

En savoir plus sur SKOS et SKOS-XL.

Le thésaurus INRAE est-il aligné avec d’autres thésaurus et des ontologies ?

Le thésaurus INRAE contient actuellement plus de 1900 alignements (ou correspondances) vers Agrovoc, GEMET et le thésaurus French Crop Usage. Tous les alignements sont évalués et validés par le comité éditorial. D’autres alignements seront réalisés avec plus de ressources sémantiques, en particulier les ontologies et thésaurus publiés via le service Vocabulaires Ouverts @INRAE.

Nous mettons en correspondance des concepts dont le sens est le même. Ainsi, nous n’utilisons que la propriété skos:exactMatch (équivalence exacte).

D’où viennent les définitions des concepts ?

Les définitions des concepts du Thésaurus INRAE sont pour certaines directement issues de sources scientifiques (ouvrages, glossaires, sites de projets de recherche…) ou de référentiels existants, e.g. French Crop Usage ou Agrovoc. D’autres définitions sont originales ou résultent de la combinaison de sources multiples.

Pour initier la collecte de définitions, le comité a choisi comme stratégie d’identifier et d’exploiter quelques sources fiables et riches sur certaines thématiques d’intérêt de l’institut. Les sources qui fournissent actuellement le plus de définitions au Thésaurus INRAE sont :

  • ROUSSEY, Catherine, 2021, « French Crop Usage », https://doi.org/10.15454/QHFTMX, Portail Data INRAE, V1
  • Denis Baize. 2016. Petit lexique de pédologie. Editions Quae [ISBN 978-2759224456]
  • Bernard Fischesser, Marie France Dupuis Tate. 2017. Le guide illustré de l’écologie, Coédition Cemagref Editions – Delachaux et Niestlé [ISBN : 978-2603025277]
  • Sciences, Eaux et Territoires 
  • Y. Dattée, G. Pelletier, Pourrons-nous vivre sans OGM? 60 clés pour comprendre les biotechnologies végétales, Ed. Quae, 2014, p.132-139 [ISBN : 9782759220588]
  • William Martin-Rosset, coord., 2012. Nutrition et alimentation des chevaux, éditions Quae [ISBN 978-2759216680]
  • Jean Boiffin, François Laurent, Guy Richard. Réussir l’implantation des cultures : Enjeux agroécologiques, itinéraires techniques. Editions Quae; Arvalis – Institut du végétal, pp.440, 2020, Savoir faire, 9782759229550. ⟨hal-02946526⟩
  • Le dicoAE de A à Z : Dictionnaire d’agroécologie (dicoagroecologie.fr)
  • INRAE, 2020, « Agriculture et systèmes d’élevage », https://doi.org/10.15454/ZBD3IV, Portail Data INRAE, V1

Spécialiste d’un sujet, vous pouvez proposer des sources de définitions pour alimenter le Thésaurus INRAE ou des définitions que vous auriez produites dans vos propres ressources. Contactez nous par email à l’adresse thesaurusINRAE[at]inrae.fr
ou via le formulaire du site https://vocabulaires-ouverts.inrae.fr/contact/.

Confiez vos définitions au Thésaurus INRAE. Ainsi, elles seront toujours disponibles en lignes pour y faire référence ou pour les intégrer dans des applications, sites web, etc.

Comment sont traités les noms d’organismes vivants ?

Le thésaurus INRAE inclue des concepts correspondant aux principaux organismes vivants étudiés ou impliqués dans les recherches de l’institut.

Ces concepts peuvent correspondre à un taxon précis (ex: Actinobacteria), plusieurs taxons (ex : truite) ou à un ensemble d’organismes partageant des caractéristiques (ex: aquatique) ou une fonction (ex: allaitante). Selon les cas, les concepts sont placés dans différents microthésaurus (MT) en fonction des règles suivantes, de la plus générique à la plus spécifique :

  • dans le MT ORG taxonomie d’organismes vivants : les noms qui correspondent aux taxons, quel que soit leur niveau dans la taxonomie (ex : Actinobacteria). L’organisation s’appuie sur la classification phylogénétique. Tous les niveaux de la classification ne sont pas représentés. En général, le niveau famille est représenté et les niveaux sous-familles ne sont représentés que s’ils correspondent à des besoins pour classer les objets d’étude. Ex : Bovidae n’est pas présent mais Bovinae et Caprinae le sont.
  • dans le MT ORG notions liées aux organismes : les noms vernaculaires qui renvoient à plusieurs taxons : soit qui sont ambigus (ex : truite) soit qui désignent un genre (ex : brebis), un stade (ex : agneau), un comportement (ex : oiseau migrateur), un collectif (ex : ovin), un groupe relatif à un type d’habitat (ex : champignon du sol, flore digestive).
  • dans le MT AGR produits agricoles : les noms qui désignent un produit issu d’une culture (ex : melon (fruit)), un objectif de production ou un usage (ex : brebis laitière), etc.
  • dans le MT SAN causes et vecteurs de maladie lorsque le concept mentionne explicitement une implication dans une maladie ou une affection (ex : nématode parasite)
répartition des concepts dénotant des organismes vivants dans le thésaurus INRAE

Répartition des concepts dénotant des organismes vivants dans le thésaurus INRAE

Dans la mesure du possible, des relations associatives sont déclarées entre les noms vernaculaires ambigus et les taxons auxquels ils renvoient, entre le produit agricole (fruit) et le taxon (plante), etc.

Avertissement : le microthésaurus ORG taxonomie d’organismes vivants ne constitue en aucun cas une taxonomie complète. Des alignements vers les taxonomies de référence (GBIF, NCBI Taxonomy, TaxRef, Catalogue of Life, etc.) seront progressivement ajoutés au thésaurus.

Faire évoluer le thésaurus INRAE

Comment évolue le thésaurus INRAE ?

Un comité éditorial dédié s’assure de la maintenance et de l’évolution du thésaurus

  • il reçoit et traite les demandes des utilisateurs et initie des chantiers d’enrichissement ;
  • il est garant du respect des règles de rédaction et de l’adaptation du thésaurus aux besoins des utilisateurs ;
  • il accompagne l’intégration du thésaurus dans des systèmes d’information et forme les utilisateurs à son utilisation.

Le comité éditorial s’appuie sur les experts des domaines représentés en les sollicitant ponctuellement pour relecture et avis. Contacter le comité : thesaurusINRAE@inrae.fr

Qui peut proposer une évolution ?

Tous les utilisateurs du thésaurus peuvent proposer une évolution (ajout de concept, de synonyme, de définition, d’alignement, de collection ou de microthésaurus). Les demandes venant d’utilisateurs INRAE ou liées au fonctionnement d’applications INRAE sont traitées en priorité. Les autres demandes sont recevables à condition qu’elles rencontrent les besoins des utilisateurs INRAE.

Les demandes d’évolution peuvent être ponctuelles (un ou quelques concepts) via le formulaire ou s’inscrire dans un chantier collaboratif concernant un ensemble de concepts par exemple (contacter le comité éditorial).

Selon quels critères les concepts sont-ils choisis ?
  1. Le concept à ajouter doit être en rapport avec un objet d’étude ou une méthode de recherche d’intérêt pour l’Institut.
  2. Le concept doit être utilisé au sein d’une ou plusieurs communautés (scientifique, de pratique…)  – on peut par exemple vérifier le nombre d’apparitions dans une archive ouverte comme HAL, dans un moteur de recherche, etc.
  3. Les termes proposés doivent désigner précisément le concept.
  4. Le concept doit être nouveau dans le thésaurus. Si un concept désigné par un terme synonyme est déjà présent, on complètera ce concept.
  5. Idéalement, une définition pourra aider à évaluer la pertinence du concept

Note : le comité éditorial se réserve le droit de refuser l’ajout de concepts en dehors du périmètre thématique ou trop spécifiques. En effet, le thésaurus n’a pas vocation à se substituer aux référentiels plus spécialisés et développés pour des applications précises

Au moment de sa création, le comité éditorial s’est basé sur deux ressources existantes : le thésaurus Irstea (5 825 concepts pour environ 10 000 termes) et le référentiel mots-clés INRA (22 057 concepts pour 39 000 termes). Une analyse des usages dans les  archives Irstea-Doc et ProdInra, dans le référentiel Inra des activités ainsi que d’autres ressources publiques ont permis d’écarter les termes peu ou pas usités.

Comment devenir membre du comité éditorial ?

Vous aimez les mots ? Vous cherchez une activité qui change du quotidien ? Vous avez un intérêt particulier pour un domaine ou une discipline et vous souhaitez partager votre expertise ? Rejoignez le comité thésaurus.

Les membres du comité participent en fonction de leur goût et de leurs compétences à :

  • l’amélioration continue du thésaurus : proposition d’ajout et de modification de concepts, d’enrichissement avec des synonymes et des traductions ainsi que des alignements vers des vocabulaires tiers
  • la stratégie d’évolution du thésaurus : structuration et choix éditoriaux
  • la promotion du thésaurus et l’identification de nouveaux usages
  • la rédaction de la documentation et l’accompagnement des utilisateurs
  • des chantiers avec des experts mobilisés ponctuellement ou qui se proposent pour avancer sur un sujet

Certains membres du comité prennent en charge une responsabilité particulière :

Le comité éditorial fonctionne sur un mode très collaboratif en s’appuyant sur des documents partagés sous Nextcloud,  un éditeur de thésaurus en ligne et collaboratif (VocBench), des listes d’échange par mail et des rencontres régulières en visioconférence :

  • une réunion mensuelle du comité dans son ensemble
  • une réunion mensuelle du groupe Définitions
  • un rendez-vous libre d’une heure par semaine sur un créneau fixe
  • des réunions de travail initiées par les membres selon les besoins

Participer au comité éditorial du thésaurus INRAE, c’est contribuer au partage des connaissances  tout en bénéficiant d’un espace d’échange convivial autour des sujets qu’on affectionne.

Pour participer au comité, envoyez-nous un message à thesaurusINRAE@inrae.fr