La Représentation Conceptuelle pour la Catégorisation des Textes Multilingue

Loading...
Thumbnail Image

Journal Title

Journal ISSN

Volume Title

Publisher

Abstract

Ce mémoire s’inscrive dans la problématique générale liée à la représentation conceptuelle pour la catégorisation de textes multilingues. Le but est de représenter des documents et des catégories à l’aide d’un même formalisme, qui se repose sur une représentation vectorielle des documents qui à son tour, n’a plus axée sur des mots mais sur une représentation plus sémantique de ceux-ci. L’objectif est d’associer automatiquement une étiquette à tout nouveau texte rédigé dans la langue espagnole en se basant sur un ensemble de textes préalablement étiquetés dans la langue anglaise. Cette représentation conceptuelle s’appuie sur des concepts issus de la base de données lexicographique WordNet et l’expérimentation est effectuée sur un corpus extrait du corpus d’ILO.

Description

Citation

Collections