Présentation du thésaurus INRAE à la journée du GDR TAL

Le thésaurus INRAE a été présenté sous la forme d’un poster à la journée du Groupement de Recherche sur le Traitement Automatique de la Langue (GDR TAL) le 19 octobre dernier à Rennes.

Cette journée, dédiée au thème de l’accès à l’information, a regroupé environ 80 personnes. Plus de 35 posters y ont été présentés et 4 conférenciers invités sont intervenus :

  • Géraldine Damnati (Orange Labs) : Extraction d’information et gestion de la connaissance au sein d’une organisation. Comment mener des travaux de Recherche ouverte sur des données « fermées » ?
  • Patrick Paroubek (CNRS, LISN): Du traitement automatique du langage naturel et de l’accès aux données expérimentales
  • Anastasia Bezerianos (Université Paris Saclay, LISN) : Visual text analytics in data journalism
  • Cyril Labbé (Université Grenoble, LIG) : Flagging suspect scientific publications for post-publication reassessments

Des échanges intéressants sur des outils liant ressource terminologique et extraction automatique ont eu lieu entre des membres du comité Thésaurus INRAE et des participants à la journée.

Notamment, un contact plus approfondi est envisagé pour tester un outil d’extraction automatique de mots-clés sur un corpus de publications représentant les différents domaines du Thésaurus INRAE et qui possède déjà une indexation manuelle. Cette expérience permettrait d’évaluer la pertinence des extractions et la faisabilité d’une (semi-)automatisation de l’indexation des publications avec le Thésaurus INRAE. À suivre.

Chargeur En cours de chargement…
Logo EAD Cela prend trop de temps ?

Recharger Recharger le document
| Ouvert Ouvrir dans un nouvel onglet

Sophie Aubin, Emilie Bernard, Sonia Bravo, Colette Cadiou, Eric Cahuzac, et al.. Le thésaurus INRAE : une ressource terminologique pour l’interopérabilité sémantique. Journée du GdR Traitement automatique des langues (GDR TAL), Oct 2022, Rennes, France. ⟨hal-03824794⟩

Temps fort pour le comité Thésaurus INRAE

Le comité thésaurus INRAE s’est retrouvé le temps d’un « atelier » à Paris les 10 et 11 octobre 2022.

Pour préparer la prochaine livraison qui aura lieu en janvier 2023, le groupe a planché sur différents points pour améliorer le fonctionnement global et la cohérence du thésaurus :

  • La polyhiérarchie, initiée dans la V1.3 avec un nombre limité de cas a été rediscutée et les conditions nécessaires pour justifier son utilisationont été affinées.
  • Les citations des sources pour les définitions ont été harmonisées.
  • La procédure de traitement de demandes externes d’ajout ou de modification de contenu (via le formulaire ou par mail) a été ré-examinée.
  • Les périmètres du domaine « Approche scientifique » et des MT Physique et état de la matière, MT Science des matériaux,  MT Sociologie, MT Neurosciences et MT Ethologie ont été revus.

Cet atelier a aussi été l’occasion de créer un poster : Le thésaurus INRAE : une ressource terminologique pour l’intéopérabilité sémantique. Il sera présenté lors d’une journée scientifique sur le thème de « l’accès à l’information » le 19 octobre à Rennes dans le cadre du GdR Traitement automatique des langues .

Merci aux 13 membres du comité ayant participé à ces deux jours de travail :
Sophie Aubin, Émilie Bernard, Sonia Bravo, Colette Cadiou, Eric Cahuzac, Véronique Decognet, Olivier Dupré, Agnès Girard, Pascale Hénaut, Marie-Pierre Maleyran-Raymond, Valérie Pagneux, Mohamad Taha, et Magalie Weber

 

 

La version 1.4 du Thésaurus INRAE est disponible

Lien vers le journal de modifications
Lien vers le portail de consultation
Lien vers le téléchargement
Utiliser l’API.

Cette nouvelle version inclut :

  • 155 nouvelles définitions principalement dans les domaines de la santé et les sciences du sol. Les sources utilisées sont l’Organisation Mondiale de la Santé, Ephytia,  Plateforme d’Épidémiosurveillance en Santé Végétale, European Food Safety Authority, Association pour l’Étude de l’Épidémiologie des Maladies Animales pour le domaine santé et le Petit lexique de pédologie.
    L’ensemble des concepts définis sont visibles depuis l’onglet « Groupes » sous « GR. CONCEPTS DEFINIS ».
  • des améliorations de l’organisation des concepts notamment avec un travail de reclassement des concepts autour de l’élevage et des systèmes d’élevages qui a été réalisé en collaboration avec Stéphane Ingrand du département Phase.
  • l’ajout de nouveaux 31 concepts

Nouveauté ! Intégrez le thésaurus dans votre système d’information avec l’API Thésaurus INRAE

Le thésaurus INRAE est un thésaurus ouvert et partagé couvrant les domaines de recherche d’INRAE avec plus de 15 000 concepts en français et en anglais (2/3 des concepts sont déjà traduits). Cette ressource institutionnelle est administrée par un comité éditorial piloté par la DipSO. Elle est mise à disposition des équipes scientifiques et d’appui INRAE pour référencer de manière unique les sujets d’intérêt : objets d’étude, méthodes et environnements de recherche.

Des questions sur la manière d’utiliser le thésaurus dans le cadre de vos activités ?  Vous souhaitez proposer des ajouts, des corrections ? Contactez le comité : thesaurusINRAE[AT]inrae.fr

En savoir plus sur le thésaurus : https://vocabulaires-ouverts.inrae.fr/a-propos-du-thesaurus-inrae/

L’API Thésaurus INRAE fait son entrée au catalogue

Le catalogue des APIs mises à disposition des système d’information INRAE s’est enrichi avec les données du Thésaurus INRAE.

 

Accessible en intranet, l’API permet d’utiliser le Thésaurus INRAE comme référentiel thématique au sein d’un SI ou d’une application informatique. Vous disposez ainsi d’une base mutualisée de concepts couvrant les domaines d’étude d’INRAE. Chaque concept a un identifiant unique et au moins un terme en français, parfois des synonymes. Pour une grande partie, les concepts sont proposés dans leur version anglaise. Des définitions et des équivalents dans d’autres vocabulaires sont aussi disponibles.

Nous vous présentons les données et services disponibles, quelques cas d’utilisation et indique comment accéder au service. Lire la suite

La version 1.3 du Thésaurus INRAE est disponible

Une nouvelle livraison du thésaurus INRAE (V1.3) est disponible depuis le 31 mai 2022. Le thésaurus est consultable en ligne ici.

Cette version propose près de 15 700 concepts et plus de 3 000 alignements réalisés vers d’autres ressources : GEMET, Agrovoc, MeSH (nouveau) et French Crop Usage.

Dans l’onglet « Nouveautés »  vous retrouvez les derniers concepts créés.

Dans l’onglet « Groupes »  sont présentées les collections qui permettent d’afficher des listes de concepts pour des besoins spécifiques. A ce jour trois collections sont proposées :  Bois et Forêt, Science Ouverte, Disciplines, et deux collections permettent de retrouver les concepts alignés avec d’autres vocabulaires et les concepts pour lesquels une définition est disponible, reflétant le travail d’enrichissement en cours.

Continuer la lecture

Bonne année 2022 avec le Thésaurus INRAE

logo thesaurus INRAELa version 1.2 du Thésaurus INRAE est disponible ! Cette nouvelle version inclue :

  • 90 concepts ajoutés à retrouver dans l’onglet Nouveautés du portail
  • 32 concepts doublons rendus invalides (ou dépréciés)
  • 294 définitions issues de sources scientifiques à retrouver dans le nouveau groupe GR. CONCEPTS DEFINIS
  • des alignements vers GEMET, Agrovoc et désormais le Thésaurus FrenchCropUsage qui propose une classification des cultures et plantes cultivées en fonction de leur usage. En savoir plus sur FrencCropUsage publié par l’unité TSCF INRAE.

Consulter le journal de modifications.  Consulter le Thésaurus INRAE.  Télécharger le Thésaurus INRAE. Utiliser l’API.

Un grand merci à Alexandra Coppolino pour la confection du nouveau logo.

En 2022, le comité éditorial continuera à améliorer et enrichir le thésaurus pour qu’il réponde encore mieux à vos besoins. Avec l’appui de la DSI, nous mettrons à disposition une nouvelle API pour faciliter l’utilisation du thésaurus par les applications INRAE. En collaboration avec les projets ANR FooSIN et D2KAB, nous travaillerons à le rendre encore plus facile à trouver, plus accessible, plus interopérable et plus facilement réutilisable pour qu’il devienne un outil incontournable de l’interopérabilité de nos systèmes d’information et de nos produits de recherche.

Des questions sur la manière d’utiliser le thésaurus dans le cadre de vos activités ? En savoir plus sur le thésaurus. Vous souhaitez proposer des ajouts, des corrections ? Contactez le comité

Nouvelle version du Thésaurus INRAE

Une nouvelle version du Thésaurus INRAE est disponible (V1.1). 
Consulter le journal de modifications
.  Consulter le Thésaurus INRAE.  Télécharger le Thésaurus INRAE. Utiliser l’API.

Le thésaurus INRAE est un thésaurus ouvert et partagé couvrant les domaines de recherche d’INRAE avec plus de 15 000 concepts en français et en anglais (2/3 des concepts sont déjà traduits). Cette ressource institutionnelle est administrée par un comité éditorial piloté par la DipSO.

Le thésaurus INRAE est mis à disposition des équipes scientifiques et d’appui INRAE pour référencer de manière unique les sujets d’intérêt : objets d’étude, méthodes et environnements de recherche. Il a déjà servi à indexer 1284 dépôts dans HAL INRAE depuis son intégration en mars 2021.

Des questions sur la manière d’utiliser le thésaurus dans le cadre de vos activités ? En savoir plus sur le thésaurus. Vous souhaitez proposer des ajouts, des corrections ? Contactez le comité