Veuillez utiliser cette adresse pour citer ce document : http://dspace1.univ-tlemcen.dz/handle/112/11478
Titre: Traitement et classification des données médicales non équilibrées.
Auteur(s): BELAROUCI, Sara
Mots-clés: Données déséquilibrées, Réseaux de Neurones, Séparateurs à Vastes Marges, K- plus proche voisin.
Méthodes d’échantillonnage, Algorithme LMS.
Date de publication: 30-jui-2016
Résumé: Dans cette thèse nous traitons un problème majeur rencontré par les méthodes d’apprentissage supervisé dans beaucoup d’application du monde réelle telles que la détection de fraudes ou d’intrusions, le diagnostic médical, la classification de textes, etc. Ce problème concerne le déséquilibre des classes, lorsqu’au moins une classe est sous représentée par rapport aux autres. C’est particulièrement le cas du domaine de diagnostic médical, en effet nous rencontrons souvent des classes de pathologies minoritaires qui sont mal représentées lors de la phase d’apprentissage. Ce problème perturbe les algorithmes d’apprentissage, qui ils présentent une grande précision sur les classes majoritaires et une faible précision sur les classes minoritaires. Afin de remédier à ce problème, nous proposons dans le cadre de cette thèse de doctorat une méthode de pondération basée sur l’algorithme des moindres carrés moyens (LMS), qui pénalise les erreurs des différents échantillons par des poids différents. Cette méthode affecte des poids forts aux différents échantillons de la classe minoritaire et des poids faibles aux différents échantillons des classes majoritaires. Après cette phase d’équilibrage, nous testons plusieurs approches de classification (RNMC, SVM et K-PPV) sur les nouveaux ensembles de données équilibrés. Dans ce travail plusieurs contributions ont été réalisées dans le but d’améliorer les performances de la classification des données déséquilibrées et de focaliser la classification sur les classes minoritaires qui sont d’un grand intérêt lors du traitement des ensembles de données médicales déséquilibrées. Les travaux réalisés durant cette thèse ont confirmé clairement que l’utilisation de la méthode de pondération LMS est effectivement très pertinente pour équilibrer les ensembles de données médicales, ainsi que les résultats obtenus sont très prometteurs et ils sont comparables aux travaux existants dans la littérature.
URI/URL: http://dspace.univ-tlemcen.dz/handle/112/11478
Collection(s) :Doctorat en GBM

Fichier(s) constituant ce document :
Fichier Description TailleFormat 
DOCT.EBM.Belarouci.pdf2,47 MBAdobe PDFVoir/Ouvrir


Tous les documents dans DSpace sont protégés par copyright, avec tous droits réservés.