Évaluation de l'utilisation des relations léxico-sémantiques dans la catégorisation de textes.
Loading...
Date
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
University of Tlemcen
Abstract
La catégorisation automatique de textes (CT) est une tâche clé en traitement automatique du
langage naturel (TALN) qui consiste à assigner un document à une ou plusieurs catégories prédéfinies.
Les relations lexico-sémantiques, qui représentent les liens de sens entre les mots, jouent
un rôle crucial dans ce processus en permettant de mieux saisir la signification globale d’un
texte. Notre travail se concentre sur l’évaluation de l’impact de l’intégration des relations lexicosémantiques
dans la catégorisation de textes. Pour ce faire, nous avons développé des modèles
de classification qui exploitent ces relations et les avons évalués à l’aide de métriques standard
telles que la précision, le rappel et la F-mesure, afin de mesurer leur efficacité. L’implémentation
de ces modèles a été réalisée en JAVA, en utilisant la base de données lexicale WordNet
pour l’enrichissement sémantique, et la plate-forme Weka pour l’évaluation des performances.
Les résultats obtenus montrent amélioration notable ce qui prouve l’utilité de notre travail.