Conception et implémentation d’un algorithme de Clustering à la base de DBSCAN

Loading...
Thumbnail Image

Authors

Journal Title

Journal ISSN

Volume Title

Publisher

Abstract

DBSCAN (Densité-Based Spatial Clustering of Applications with Noise) est l'un des algorithmes de classification basé sur la densité le plus populaire de sa catégorie. Il permet de découvrir les clusters de formes arbitraires et de séparer les bruits. Des limitations importantes de cet algorithme sont connues : il utilise des paramètres globaux de densité de sorte que le résultat de classification de base de données multi-densité est souvent inexact. En plus, son résultat est très sensible aux valeurs de ces paramètres qui sont fixés par l’utilisateur, ajoutant son appartenance au type dur hard Clustering c’est-à-dire que la probabilité d’un point (individu) appartient à un autre cluster autre que le sien, est nul contrairement à l’approche de l’algorithme EM (Expectation Maximisation) qui est une méthode du type soft Clustering, c’est-à-dire que la probabilité pour qu’un point appartient à d’autres clusters différents du sien existe avec un pourcentage raisonnable est logique calculé pour l’appartenance de chacun à ses derniers, si on aura à améliorer DBSCAN on lui combinant les points forts de EM notamment celui qui vient d’être cité dernièrement alors DBSCAN bénéficiera d’une amélioration performante. Néanmoins les résultats expérimentaux montrent que notre algorithme reste toujours efficient et le plus performant dans la détection des groupes de différentes densités

Description

Citation

Collections