Repondération des concepts en utilisant les distances sémantiques dans le cadre de la catégorisation des textes.

Abstract

Ce mémoire s’inscrit dans le cadre des problèmes liés à la repondération des textes, enfaite il existe plusieurs méthodes dont chacune d’elles possède des avantages et des inconvénients et on a montré qu’il est judicieux d’utiliser la méthode conceptuelle qui permet de considérer les sens des mots à l’intérieur des phrases parce qu’un mot est plus précis dans une phrase que si il était isolé. Ainsi la tokenization qui produit des phrases est plus efficace que celle qui produit des sacs de mots ou des n-grams.

Description

Citation

salle des théses.

Collections