Veuillez utiliser cette adresse pour citer ce document : http://dspace1.univ-tlemcen.dz/handle/112/4572
Titre: La Représentation Conceptuelle pour la Catégorisation des Textes Multilingue.
Auteur(s): TERKIA DERDRA, Amel
BENSFIA, Fatima Zahra
Mots-clés: représentation conceptuelle, représentation en sac de mots, catégorisation de textes, multilingue, WordNet, mapping.
representation conceptual, representation out of bag of words, categorization of texts, multilingual, WordNet, mapping.
Date de publication: 20-mar-2014
Résumé: Ce mémoire s’inscrive dans la problématique générale liée à la représentation conceptuelle pour la catégorisation de textes multilingues. Le but est de représenter des documents et des catégories à l’aide d’un même formalisme, qui se repose sur une représentation vectorielle des documents qui à son tour, n’a plus axée sur des mots mais sur une représentation plus sémantique de ceux-ci. L’objectif est d’associer automatiquement une étiquette à tout nouveau texte rédigé dans la langue espagnole en se basant sur un ensemble de textes préalablement étiquetés dans la langue anglaise. Cette représentation conceptuelle s’appuie sur des concepts issus de la base de données lexicographique WordNet et l’expérimentation est effectuée sur un corpus extrait du corpus d’ILO.Abstract This memory falls under the general problems related to the conceptual representation for the multilingual text categorization. The purpose is to represent documents and categories using the same formalism, which rests on a vectorial representation of the documents which in its turn, did not center any more on words but on a more semantic representation of those. The objective is automatically to associate a label all new text written in the Spanish language while being based on a whole of texts labelled beforehand in the English language. This conceptual representation is based on concepts resulting from the lexicographical data base WordNet and the experimentation is carried out on a corpus extracted the corpus of ILO.
URI/URL: http://dspace.univ-tlemcen.dz/handle/112/4572
Collection(s) :Master SIC

Fichier(s) constituant ce document :
Fichier Description TailleFormat 
TERKIA-DERDRA-Amel.pdf451,99 kBAdobe PDFVoir/Ouvrir


Tous les documents dans DSpace sont protégés par copyright, avec tous droits réservés.