A Variable Importance Measure for a Cost Sensitive Random forest Predition on a Budget.
Loading...
Date
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
De nos jours, avoir de bons soins de santé en utilisant moins d’argent devient
un défi, car les technologies sont devenues de plus en plus coûteuses et les budgets
sont limités. D’autre part, dans le diagnostic médical, une fausse prédiction
négative ( une personne malade déclarée comme étant saine ) peut avoir des
conséquences plus graves qu’une fausse prédiction positive et leur attribuer des
coûts égaux est inapproprié.
Ce projet de fin d’études contribue à la fois aux apprentissages budgétisés et aux
apprentissages sensibles au coût en développant un modèle capable de faire un
compromis entre les coûts de classification erronée et les coûts de test. Le modèle
proposé est basé sur l’idée d’utiliser les mesures d’importance de variables de la
forêt aléatoire en tant que coûts de test et en choisissant l’arbre optimal de la forêt
développée en tant que stratégie de test. Notre modèle a été testé sur dix base de
données: neuf base de données de UCI Machine Learning et une base de données
du monde réel: le myélome multiple; collectée au Centre de Lutte Contre le Cancer
(CLCC) de Tlemcen.