Évaluation de l'utilisation des relations léxico-sémantiques dans la catégorisation de textes.

Tahir, Fatima Zohra; Belarbi, Hidayat

Évaluation de l'utilisation des relations léxico-sémantiques dans la catégorisation de textes.

Files

Evaluation_de_l_utilisation_des_relations_lexico_semantiques_dans_la_categorisation_de_textes.pdf (1.05 MB)

Date

2024-09-29

Authors

Tahir, Fatima Zohra

Belarbi, Hidayat

Publisher

University of Tlemcen

Abstract

La catégorisation automatique de textes (CT) est une tâche clé en traitement automatique du langage naturel (TALN) qui consiste à assigner un document à une ou plusieurs catégories prédéfinies. Les relations lexico-sémantiques, qui représentent les liens de sens entre les mots, jouent un rôle crucial dans ce processus en permettant de mieux saisir la signification globale d’un texte. Notre travail se concentre sur l’évaluation de l’impact de l’intégration des relations lexicosémantiques dans la catégorisation de textes. Pour ce faire, nous avons développé des modèles de classification qui exploitent ces relations et les avons évalués à l’aide de métriques standard telles que la précision, le rappel et la F-mesure, afin de mesurer leur efficacité. L’implémentation de ces modèles a été réalisée en JAVA, en utilisant la base de données lexicale WordNet pour l’enrichissement sémantique, et la plate-forme Weka pour l’évaluation des performances. Les résultats obtenus montrent amélioration notable ce qui prouve l’utilité de notre travail.