Indexation contrôlée des textes biomédicaux orientée par l’extraction de connaissances.

dc.contributor.authorSouidi, Abdelhakimen_US
dc.date.accessioned2017-10-25T08:39:26Zen_US
dc.date.available2017-10-25T08:39:26Zen_US
dc.date.issued2016-05-26en_US
dc.description.abstractMEDLINE est la base bibliographique de référence dans le domaine biomédical. Cette dernière connait une croissance explosive dans les dernières années. L’indexation de cette ample base avec le thésaurus MeSH devient de plus en plus une tâche difficile pour un staff qualifié de la US-NLM. La catégorisation de texte (CT) à base des algorithmes d’apprentissage, étudiée dans le contexte d’indexation des références de MEDLINE, est une façon efficace afin d’aider ce groupe d’expert. Les algorithmes d’apprentissage supervisé, comme les SVM et la classification Naïve Bayes appliqués sur la représentation standard (sac de mots, ou en anglais : bag-of-words) affinée par des techniques de prétraitement montre des performances compétitives : une F-Mesure de 59.6% pour le classifieur NB, et F-Mesure de 58% pour les SVM avec des paramètres standards. Cependant, la représentation d’un texte peut engendrer un espace de dimension impressionnant entravant les classifieurs. La sélection de descripteurs est une tâche populaire qui consiste à retrouver les mots représentatifs et éliminent ceux qui ne le sont pas. Nous avons appliqué la méthode de sélection chi-2 (chi-squared) avec les techniques SVM et NB. Cette méthode accomplis des bonnes performances, une F-Mesure de : 62.7% pour les SVM et 65.9% pour le classifieur NB.en_US
dc.identifier.urihttps://dspace.univ-tlemcen.dz/handle/112/10817en_US
dc.language.isofren_US
dc.subjectMEDLINE, chi-squared, SVM, Naïve Bayes, MeSH thesaurus, catégorisation de texte, Algorithmes d’apprentissage supervisé.en_US
dc.subjectprétraitement, sélection de descripteurs, sac de mots, Indexation.en_US
dc.titleIndexation contrôlée des textes biomédicaux orientée par l’extraction de connaissances.en_US
dc.typeThesisen_US

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Ms.EBM.Souidi.pdf
Size:
1.98 MB
Format:
Adobe Portable Document Format
Description:

License bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: