Construction semi-automatique des ontologies  à partir des documents textuels arabes.

BENABDALLAH, Ali

Veuillez utiliser cette adresse pour citer ce document : http://dspace1.univ-tlemcen.dz/handle/112/11354

Affichage complet

Élément Dublin Core	Valeur	Langue
dc.contributor.author	BENABDALLAH, Ali	-
dc.date.accessioned	2017-11-13T09:24:56Z	-
dc.date.available	2017-11-13T09:24:56Z	-
dc.date.issued	2017-06-28	-
dc.identifier.citation	salle des thèses	en_US
dc.identifier.other	DOC-003-13-01	-
dc.identifier.uri	http://dspace.univ-tlemcen.dz/handle/112/11354	-
dc.description.abstract	La tâche de construction d’une ontologie à partir d'un corpus textuel commence par la phase de conceptualisation, qui consiste à extrait les concepts de l'ontologie. Ces concepts sont reliés par des relations sémantiques. Dans le cadre de cette thèse, nous présentons une contribution pour la construction semi-automatique d'une ontologie à partir d'un corpus textuel arabe, en commençant d'abord par la collecte des documents et le prétraitement du corpus à travers la normalisation, puis la suppression des mots vides et la lemmatisation; Ensuite, pour extraire les termes de notre ontologie, une méthode statistique pour extraire des termes simples et complexes appelée « méthode des segments répétés » est appliquée. Pour sélectionner les segments avec un poids suffisant, nous appliquons deux filtres : un filtre de pondération TF-IDF (Term Frequency-Inverse Document Frequency) et un filtre coupant. Pour relier ces termes par des relations sémantiques, nous appliquons une méthode d'apprentissage automatique des marqueurs linguistiques à partir du texte. Cette méthode nécessite un ensemble de paires de relations, qui sont extraites à partir de deux ressources externes: un dictionnaire arabe de synonymes et d'antonymes et une base de données lexicale Arabe. A la fin de cette thèse, nous présentons les résultats de notre expérimentation en utilisant notre corpus textuel. L'évaluation de notre approche montre des résultats encourageants en termes de rappel et de précision.	en_US
dc.language.iso	fr	en_US
dc.publisher	13-11-2017	en_US
dc.subject	Traitement Automatique du Langage Naturel (TALN), Prétraitement du texte, construction des ontologies, extraction des termes, méthode des segments répétés, relations sémantiques, marqueurs linguistiques.	en_US
dc.title	Construction semi-automatique des ontologies à partir des documents textuels arabes.	en_US
dc.type	Thesis	en_US
Collection(s) :	Doctorat LMD RSD

Fichier(s) constituant ce document :

Fichier	Description	Taille	Format
Construction-semi-automatique-des-ontologies-a-partir-des-documents-textuels-arabes.pdf	CD	3,85 MB	Adobe PDF	Voir/Ouvrir

Affichage abbrégé