Apprentissage des données en distribution déséquilibrée par les méthodes d’ensembles.
Loading...
Date
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Une base de données déséquilibrée est une base dont l’effectif d’une classe est
largement plus petit en comparaison avec les autres classes présentes.
Dans ce projet de fin d’études de Master, nous proposons le traitement des
données déséquilibré par les méthodes d’ensemble. De ce fait, notre contribution
va être dans les trois points suivant : en premier lieu, nous appliquons 2
types de méthodes d’ensemble (Bagging, Adaboost) et leur hybridation avec
les méthodes d’échantillonnage (SMOTEBagging, SMOTEBoost, RUSBoost,
UnderBagging) sur différentes bases de données médicales. En second lieu, nous
étudions l’influence de l’approche SMOTE avec différents degrés de déséquilibres
sur le classifieur adaboost. En dernier lieu, nous évaluons la combinaison
deux types d’échantillonnage (SMOTE, RUS) avec adaboost.
Les résultats empiriques montrent que l’hybridation de SMOTE avec la méthode
d’ensemble Adaboost est plus performante que les autres méthodes testées.