La Représentation Conceptuelle pour la Catégorisation des Textes Multilingue
Loading...
Date
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Ce mémoire s’inscrive dans la problématique générale liée à la représentation
conceptuelle pour la catégorisation de textes multilingues. Le but est de représenter des
documents et des catégories à l’aide d’un même formalisme, qui se repose sur une
représentation vectorielle des documents qui à son tour, n’a plus axée sur des mots mais
sur une représentation plus sémantique de ceux-ci. L’objectif est d’associer
automatiquement une étiquette à tout nouveau texte rédigé dans la langue espagnole en
se basant sur un ensemble de textes préalablement étiquetés dans la langue anglaise.
Cette représentation conceptuelle s’appuie sur des concepts issus de la base de données
lexicographique WordNet et l’expérimentation est effectuée sur un corpus extrait du
corpus d’ILO.