Constitution d’un corpus d’articles scientifiques avec représentation sémantique

Jean-Claude Moissinac 1, 2
1 MM - Multimédia
LTCI - Laboratoire Traitement et Communication de l'Information
Résumé :

Dans le cadre du projet SemBib, nous avons entrepris une représentation sémantique de la production scientifique de Télécom Paristech. Au delà des objectifs internes, ce corpus enrichi est une source d’expérimentation et une ressource pédagogique. ce travail repose sur l’utilisation de méthodes de fouilles de texte pour construire des graphes de connaissances, puis sur la production d’analyses à partir de ces graphes. La proposition principale exposée est la méthodologie de production de graphes disjoints, aux rôles bien identifiés, afin de permettre des utilisations différenciées, et en particulier la comparaison entre méthodes de production et d’exploitation des graphes. Cet article est avant tout une proposition méthodologique pour l’organisation de représentation sémantique de publications, en s’appuyant sur des méthodes de fouille de texte. La méthode proposée facilite des approches d’enrichissement progressifs des représentations avec possibilités d’évaluation à chaque étape

Mots-clés : bibliométrie sémantique
Complete list of metadatas

https://hal.telecom-paristech.fr/hal-02412392
Contributor : Telecomparis Hal <>
Submitted on : Sunday, December 15, 2019 - 1:01:40 PM
Last modification on : Thursday, December 19, 2019 - 1:06:03 AM

Identifiers

  • HAL Id : hal-02412392, version 1

Citation

Jean-Claude Moissinac. Constitution d’un corpus d’articles scientifiques avec représentation sémantique. TextMine, Jan 2018, Paris, France. ⟨hal-02412392⟩

Share

Metrics

Record views

11