Apprentissage des données en distribution déséquilibrée par les méthodes d’ensembles.

Loading...
Thumbnail Image

Journal Title

Journal ISSN

Volume Title

Publisher

Abstract

Une base de données déséquilibrée est une base dont l’effectif d’une classe est largement plus petit en comparaison avec les autres classes présentes. Dans ce projet de fin d’études de Master, nous proposons le traitement des données déséquilibré par les méthodes d’ensemble. De ce fait, notre contribution va être dans les trois points suivant : en premier lieu, nous appliquons 2 types de méthodes d’ensemble (Bagging, Adaboost) et leur hybridation avec les méthodes d’échantillonnage (SMOTEBagging, SMOTEBoost, RUSBoost, UnderBagging) sur différentes bases de données médicales. En second lieu, nous étudions l’influence de l’approche SMOTE avec différents degrés de déséquilibres sur le classifieur adaboost. En dernier lieu, nous évaluons la combinaison deux types d’échantillonnage (SMOTE, RUS) avec adaboost. Les résultats empiriques montrent que l’hybridation de SMOTE avec la méthode d’ensemble Adaboost est plus performante que les autres méthodes testées.

Description

Citation