Catégorisation automatique des textes avec des mesures de similarité sémantiques

Loading...
Thumbnail Image

Journal Title

Journal ISSN

Volume Title

Publisher

University of Tlemcen

Abstract

Dans notre projet de master, nous avons traité une problématique liée au domaine de catégorisation du texte qui consiste à associer chaque document non classé à sa catégorie en utilisant un ensemble des documents préalablement classés. Notre but est d’évaluer l’utilisation des mesures de similarités sémantiques et leurs impacts sur la classification automatique de textes à l'aide de la base de donnée lexical Wordnet. L’implémentation de notre projet est faite à l’aide de langage java en utilisent la bibliothèque Weka In this project, we dealt with a problem related to the text categorization domain, which involves associating each non-classified document with its category using a Set of previously classified documents. Our goal is to evaluate the use of semantic similarity measures and their impact on automatic classification of texts using the Wordnet lexical database. The implementation of our project is done using java language and Weka library.

Description

wordnet, java, Weka, text classification, semantic similarity measures

Citation

salle des thèses

Collections