Détection automatique de plagiat dans les textes arabes
Loading...
Date
Journal Title
Journal ISSN
Volume Title
Publisher
University of Tlemcen
Abstract
Le développement technologique et la prolifération des données ont exacerbé le problème du plagiat, notamment avec l'augmentation de l'utilisation de la langue arabe sur Internet. Dans ce contexte, nous avons développé un système de détection du plagiat pour les textes arabes, basé sur l'architecture des réseaux de neurones convolutionnels (CNN). Ce système analyse les motifs linguistiques tout en intégrant des représentations issues de l'Arabic WordNet (AWN). Nous avons évalué notre modèle en utilisant le corpus ExAra, et les résultats préliminaires montrent son efficacité, avec un potentiel d'amélioration grâce à des données supplémentaires et un ajustement du modèle.