La Représentation Conceptuelle pour la Catégorisation des Textes Multilingue.
Loading...
Date
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Ce mémoire s’inscrive dans la problématique générale liée à la représentation
conceptuelle pour la catégorisation de textes multilingues. Le but est de représenter des
documents et des catégories à l’aide d’un même formalisme, qui se repose sur une
représentation vectorielle des documents qui à son tour, n’a plus axée sur des mots mais
sur une représentation plus sémantique de ceux-ci. L’objectif est d’associer
automatiquement une étiquette à tout nouveau texte rédigé dans la langue espagnole en
se basant sur un ensemble de textes préalablement étiquetés dans la langue anglaise.
Cette représentation conceptuelle s’appuie sur des concepts issus de la base de données
lexicographique WordNet et l’expérimentation est effectuée sur un corpus extrait du
corpus d’ILO.Abstract
This memory falls under the general problems related to the conceptual
representation for the multilingual text categorization. The purpose is to represent
documents and categories using the same formalism, which rests on a vectorial
representation of the documents which in its turn, did not center any more on words but
on a more semantic representation of those. The objective is automatically to associate
a label all new text written in the Spanish language while being based on a whole of
texts labelled beforehand in the English language. This conceptual representation is
based on concepts resulting from the lexicographical data base WordNet and the
experimentation is carried out on a corpus extracted the corpus of ILO.