La détection automatique de l’ironie dans les tweets algériens
Loading...
Date
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
University of Tlemcen
Abstract
L’analyse des données sur les réseaux sociaux est un domaine de recherche en plein
ébullition. L’importance de ces données est considérable pour les institutions étatiques et les
entreprises commerciales qui souhaitent obtenir respectivement un avis des citoyens sur un
événement politique particulier ou un retour client sur des produits bien spécifiques. Dans le
cadre de ce mémoire de master, nous nous focalisons sur l’identification de l’ironie dans un
type particulier de données à savoir les tweets. Dans ce cadre, nous nous sommes intéressés à
la construction d’un corpus formé de 8178 tweets algériens dont 70% sont ironiques et le
reste sont non ironiques. Pour ce faire, nous avons suivi une démarche en trois phases. Dans
un premier temps, nous nous sommes intéressés à la collecte des tweets algériens et leurs
annotations. Dans une deuxième étape, nous avons mené une opération de prétraitement de
données comme la tokenisation, la limmetasation et l’élimination des mots vides. Enfin, dans
la troisième étape, nous avons implémenté des classifieurs à base d’apprentissage artificiel
pour la détection automatique de l’ironie pour les tweets algériens. Les résultats obtenus pour
cette tâche sont très prometteurs et ouvrent des pistes de recherche lors de l’analyse future de
sentiments