Extraction des connaissances dans un environnement distribué : synthèse.
Loading...
Date
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Ce travail s’inscrit dans le domaine du Data Mining qui est une étape importante du
processus d’Extraction des Connaissances à partir de Données (ECD) [ Knowledge
Discovery in Databases (KDD) ].
Dans l’ensemble des travaux existants, l’extraction des connaissances est décomposée
en deux sous problèmes : la recherche des itemsets fréquents et la génération des règles
d’associations. Nous nous sommes intéressées par le premier sous problème, dont la
complexité est exponentielle, et constitue la phase la plus couteuse en termes de temps
d’exécution et d’espace mémoire. Toutefois, la plupart des algorithmes séquentiels
d’extraction des itemsets fréquents voient leurs performances se dégrader lorsque la
taille des données augmente. Pour maintenir les performances de ces algorithmes,
l’utilisation de méthodes et outils parallèles et distribués apparait comme une solution
naturelle.
Le but de ce projet est d’étudier le problème d’extraction des connaissances, en se
basant essentiellement sur l’étape d’extraction des itemsets fréquents dans un
environnement distribué. Après une synthèse et une classification des algorithmes les
plus cités dans la littérature, nous nous somme intéressés à l’un des algorithmes
distribué : ECLAT.