Étude comparative de quelques outils de classification sur des données médicales
Loading...
Date
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
L’analyse de données dans le domaine de la médecine est de plus en plus fréquente afin de
préciser les diagnostics, affiner les méthodes de recherche et prévoir des approvisionnements
appropriés en équipement en fonction de l’importance des pathologies qui apparaissent. Pour
analyser les données présentes afin de prédire des résultats optimaux, l’intelligence artificielle
propose des solutions logicielles parmi elles figurent différents outils tel que : R, SAS,
Rapidminer, Weka, Tanagra, Matlab, Keel etc... Ils possèdent plusieurs algorithmes de
traitement de données de filtrage de classification, d’apprentissage et de visualisation.
Ce projet s’intéresse particulièrement à la classification des données. Qui peut être considérée
comme un domaine permettant de définir des algorithmes et des techniques susceptibles de
classer des objets dont l’aspect est variable par rapport à un objet type. On distingue
habituellement deux types de classification, la classification en mode supervisé et la
classification en mode non supervisé.
Dans notre projet de fin d’étude de Master IBM nous avons présenté quelques outils de
classification qui utilisent différents principes d’algorithmes dans le domaine de la
classification. L’essentiel de notre travail a été d’élaborer une simple étude comparative entre
trois outils Weka, Matlab et Tanagra en appliquant différents algorithmes de classification
supervisé à savoir Knn, SVM et RN. Cette comparaison a été effectuée sur trois bases de
données médicales connues: Pima (Diabètes), Heart (maladies de coeur), AP (Appendicite).
D’après les résultats que nous avons obtenus on peut dire qu’il est difficile de conclure qu’un
outil est meilleur par rapport à l’autre avec les critères que nous avons choisis dans notre
travail de PFE. A travers cette modeste étude nous avons découvert qu’il y a d’autres critères
importants pour évaluer les outils de classification qui sont: le temps de traitement,
l’occupation mémoire, la richesse de la bibliothèque des méthodes, l’ergonomie,
l’accessibilité…etc.