Stage Master – Construction d’une ontologie dédiée à la métabolomique

Ingénierie des connaissances

Titre du stage :

Construction d’une ontologie dédiée à la métabolomique

Contexte :

INRAE est un institut de recherche public œuvrant pour un développement cohérent et durable de l’agriculture, l’alimentation et l’environnement.

Pour répondre à des questions scientifiques de plus en plus complexes, il est souvent nécessaire de combiner des données provenant de banques de données publiques. La manière de représenter ces données peut varier en fonction des communautés scientifiques ou des outils utilisés pour les produire par exemple. Dans ce cas, il est nécessaire de formaliser la manière de représenter et de nommer les objets du domaine d’étude ainsi que leurs propriétés. Cette étape se concrétise généralement par la constitution de ressources sémantiques telles que les thésaurus et les ontologies.

L’infrastructure nationale de métabolomique MetaboHUB a pour objectif de fournir des outils technologiques de pointe et des services en métabolomique et fluxomique aux équipes de recherche académiques et à des partenaires industriels dans les domaines de la santé, de la nutrition, de l’agriculture, de l’environnement et des biotechnologies. Dans le cadre de sa nouvelle feuille de route, un des objectifs principaux est de favoriser une meilleure intégration des données et des services MetaboHUB au sein du consortium et au-delà. Les études actuelles sur le métabolisme nécessitent l’utilisation d’un nombre croissant de ressources de données, complexes, produites ou stockées et au sein des plateformes de métabolomique et sur le Web.

C’est dans ce contexte que le projet du stage s’inscrit. Ainsi, le projet MetaSaurus réunit des experts en ingénierie des connaissances et en science des données du domaine de la métabolomique avec pour objectif de bâtir un modèle de connaissance adapté aux études métabolomiques en s’appuyant sur les ontologies, thésaurus et vocabulaires contrôlés publiés (Thesaurus INRAE, Ontologies OBO Foundry / BioPortal).

Objectifs du stage

Produire une ontologie adaptée au domaine de la métabolomique et les supports méthodologiques d’accompagnement de la démarche.

Déroulement du stage

A partir des spécifications du projet MetaSaurus et de la description des étapes d’intégration de données en métabolomique, le projet consistera à élaborer la première version d’une ontologie dédiée à la métabolomique. Vous étudierez les modalités de réutilisation des ressources sémantiques existantes en lien avec la maintenance de cette ontologie (mis en œuvre des principes OBO) et intégrerez l’environnement de gestion de l’ontologie dans une forge logicielle. L’implémentation de l’ontologie sera réaliser au format OWL.

Cette démarche fera l’objet d’une proposition de méthodologie générique qui pourra être transposée à d’autres cas d’études.

Compétences requises

Étudiant de niveau master 2 avec :

  • Connaissances générales des standards du web sémantique (OWL/RDF) et des outils : Protégé, Github.
  • Aptitude à la rédaction de documentation technique
  • Maîtrise de l’anglais technique (lu)

Modalités d’accueil

Lieu du stage : Site INRAE – Le Rheu (35)
Durée : 6 mois
Gratification : selon le barème en vigueur au 1er janvier 2023 (environ 600 euros)
En rejoignant INRAE, vous bénéficierez (selon le type de contrat et sa durée) :

Environnement scientifique :

Vous serez intégré dans l’équipe RCA (Rendement sous Contraintes Abiotiques) de l’unité IGEPP (Institut de Génétique, Environnement et Protection des Plantes) et vous travaillerez au sein de l’équipe informatique de la plateforme P2M2 (plateau de profilage métabolique et de métabolomique) dédiée aux analyses de produits du métabolisme végétal. P2M2 dispose d’une infrastructure informatique associée à plusieurs équipements dédiés (systèmes de spectrométrie de masse couplés à des systèmes de chromatographie gazeuse et de chromatographie liquide) pour l’analyse, la caractérisation et la quantification de composés biochimiques complexes dans des matrices végétales.

Le stage se déroulera en interaction étroite avec les ingénieurs de la plateforme « Exploration du Métabolisme » PFEM et la DipSO, Direction pour la Science Ouverte en charge de l’accompagnement à l’ingénierie des ressources sémantiques à INRAE (sites d’Angers et de Nantes).

Réunion régulières avec les partenaires du projet en visio-conférence et en présentiel.

Responsables scientifiques du stage / contact :

Co-encadrants : Sophie Aubin, Olivier Filangi, Magalie Weber

Contact : Olivier Filangi olivier.filangi/ AT / inrae.fr

L’API Thésaurus INRAE fait son entrée au catalogue

Le catalogue des APIs mises à disposition des système d’information INRAE s’est enrichi avec les données du Thésaurus INRAE.

 

Accessible en intranet, l’API permet d’utiliser le Thésaurus INRAE comme référentiel thématique au sein d’un SI ou d’une application informatique. Vous disposez ainsi d’une base mutualisée de concepts couvrant les domaines d’étude d’INRAE. Chaque concept a un identifiant unique et au moins un terme en français, parfois des synonymes. Pour une grande partie, les concepts sont proposés dans leur version anglaise. Des définitions et des équivalents dans d’autres vocabulaires sont aussi disponibles.

Nous vous présentons les données et services disponibles, quelques cas d’utilisation et indique comment accéder au service. Lire la suite

SKOS, un allié pour les principes FAIR

Découvrez le premier volet de notre série autour autour de SKOS, un modèle RDF standard pour représenter et échanger des vocabulaires simples.

En effet, les vocabulaires et autres référentiels terminologiques jouent un rôle important dans le cycle de vie de la donnée et contribuent à la mise en œuvre des principes FAIR.

Ils permettent de documenter les objets étudiés, les variables enregistrées dans les bases de données, les méthodes utilisées dans le cadre des expérimentations… Ils facilitent la recherche et la réutilisation des jeux de données et des publications par exemple. Les vocabulaires participent également à réaliser l’interopérabilité sémantique des objets numériques et des systèmes d’information qui les stockent et les exposent. Ils permettent de savoir si deux systèmes font référence ou non à une même notion. Pour qu’ils puissent remplir pleinement ces différents rôles, les vocabulaires doivent être représentés selon un modèle standard. Ils doivent aussi être partagés avec la communauté dans des portails dédiés qui facilite leur réutilisation et leur interconnexion.

En collaboration avec le projet ANR FooSIN, nous avons choisi de nous intéresser à SKOS car :

  • c’est un modèle créé par le W3C plutôt simple à comprendre,
  • suffisamment expressif pour gérer des listes et des hiérarchies de concepts,
  • il permet le multilinguisme,
  • il est assez facile à intégrer aux systèmes d’information et
  • bien adapté pour travailler avec des API,
  • il a gagné une certaine popularité au sein des communautés scientifiques.

SKOS : un standard pour une ressource sémantique simple et FAIR

Dans ce premier volet de la série, découvrez en quoi SKOS peut contribuer à votre démarche de mise en œuvre des principes FAIR. Cette ressource vous propose également une introduction à SKOS.

Lire l’article SKOS : un standard pour une ressource sémantique simple et FAIR

Nouvelle URL pour l’espace Vocabulaires Ouverts dans Data INRAE

L’espace dédié à la publication de vocabulaires (ontologies, thésaurus, glossaires…) sur Data INRAE change d’adresse et de visuel.

Vocabulaires Ouverts @INRAE

https://data.inrae.fr/dataverse/vo-inrae

Suite à la fusion Inra-Irstea, l’ancien service « Lovinra » avait changé de nom pour « Vocabulaires Ouverts@INRAE ». A l’époque, il ne nous avait pas été possible de modifier l’identifiant https://data.inrae.fr/dataverse/lovinra dans Data INRAE. Dans un souci d’harmonisation et puisque cela est désormais possible, nous réalisons ce changement aujourd’hui.

La nouvelle URL de l’espace est https://data.inrae.fr/dataverse/vo-inrae

Merci de penser à modifier ce lien dans les pages web ou les documents y faisant référence ainsi que dans vos procédures automatiques de dépôt si vous en utilisez. Pour les sites web, vous pouvez utiliser l’outil W3C Link Checker qui permet de détecter des liens morts.

Nouveaux contenus

Découvrez les pages ajoutées récemment sur notre site Vocabulaires Ouverts.

Concernant le thésaurus INRAE, 3 nouvelles pages :

Découvrez d’Autres référentiels terminologiques à connaître couvrant un ou plusieurs domaines d’intérêt pour INRAE. A retrouver depuis le menu « Ressources » du site.

Vous ne trouvez pas de réponse à votre question, vous souhaitez en savoir plus sur le service Vocabulaires Ouverts ou sur le thésaurus INRAE ? Contactez-nous.

Pourquoi attribuer un DOI à mon vocabulaire ?

Attribuer un DOI (Digital Object Identifier) à un vocabulaire permet de :

  • le référencer de manière unique et pérenne ;
  • le citer de façon fiable et d’attribuer le crédit à ses auteurs ;
  • créer des relations entre lui et d’autres ressources (base de données, application, etc.)
  • faciliter sa découverte, son accès et sa réutilisation.

Tout savoir sur les DOI.

Demander un DOI.