Catégorisation automatique des textes avec des mesures de similarité sémantiques
Loading...
Date
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
University of Tlemcen
Abstract
Dans notre projet de master, nous avons traité une problématique liée au domaine de catégorisation du texte qui consiste à associer chaque document non classé à sa catégorie en utilisant un ensemble des documents préalablement classés. Notre but est d’évaluer l’utilisation des mesures de similarités sémantiques et leurs impacts sur la classification automatique de textes à l'aide de la base de donnée lexical Wordnet.
L’implémentation de notre projet est faite à l’aide de langage java en utilisent la
bibliothèque Weka In this project, we dealt with a problem related to the text categorization domain, which involves associating each non-classified document with its category using a Set of previously classified documents.
Our goal is to evaluate the use of semantic similarity measures and their impact on automatic classification of texts using the Wordnet lexical database.
The implementation of our project is done using java language and Weka library.
Description
wordnet, java, Weka, text classification, semantic similarity measures
Citation
salle des thèses