Détection automatique de plagiat dans les textes arabes

Lakehal, Ibrahim El-Khalil; Berrabah, Nasreddine

Détection automatique de plagiat dans les textes arabes

Files

Detection_automatique_de_plagiat_dans_les_textes_arabes.pdf (1.93 MB)

Date

2024-09-29

Authors

Lakehal, Ibrahim El-Khalil

Berrabah, Nasreddine

Publisher

University of Tlemcen

Abstract

Le développement technologique et la prolifération des données ont exacerbé le problème du plagiat, notamment avec l'augmentation de l'utilisation de la langue arabe sur Internet. Dans ce contexte, nous avons développé un système de détection du plagiat pour les textes arabes, basé sur l'architecture des réseaux de neurones convolutionnels (CNN). Ce système analyse les motifs linguistiques tout en intégrant des représentations issues de l'Arabic WordNet (AWN). Nous avons évalué notre modèle en utilisant le corpus ExAra, et les résultats préliminaires montrent son efficacité, avec un potentiel d'amélioration grâce à des données supplémentaires et un ajustement du modèle.