BdD des Sciences d’Information

Accueil du site > Science de l’Information et Bibliothéconomie (Généralités) > Indexation automatique de documents par combinaison d’analyses (...)

Indexation automatique de documents par combinaison d’analyses statistiques et terminologiques structurées

Lyne Da Sylva

vendredi 4 mai 2007, par anass


Résumé

Ce travail vise à développer un certain type d’outil de navigation de documents numériques pour faciliter la recherche d’information, sous la forme d’un index comme ceux que l’on retrouve à la fin des livres. L’implémentation veut mettre à profit les techniques d’analyse documentaire humaine : repérage des passages du document, détermination de leurs thématiques respectives, puis établissement de liens entre toutes les entrées proposées. Une liste de candidats-termes pondérés est préparée, sur la base de ces critères mais aussi sur la base d’une analyse de fréquence (on considère alors à la fois les occurrences de termes isolés et les cooccurrences de paires de termes). L’index final est constitué des candidats-termes au poids le plus élevé. Le résultat est une liste d’entrées structurées en vedettes principales et sous-vedettes, entretenant divers liens statistiques ou sémantiques. L’article fait un survol d’approches reliées, présente la méthodologie utilisée ainsi que certains résultats expérimentaux, et conclut sur quelques pistes de recherche à poursuivre.

Source :RIAO.2004. Auteur :Lyne Da Sylva


Suivre la vie du site RSS 2.0 | Plan du site | Espace privé | SPIP | squelette