BdD des Sciences d’Information

Accueil du site > Science de l’Information et Bibliothéconomie (Généralités) > Modèle d’indexation de données peu symboliques dans des documents (...)

Modèle d’indexation de données peu symboliques dans des documents structurés : L’exemple du graphique dans un corpus de documents techniques

Leïla Kefi, Catherine Berrut, Eric Gaussier

jeudi 7 juin 2007, par anass


RÉSUMÉ.

Cet article s’intéresse à l’indexation des données ayant une sémantique pauvre dans des documents structurés. Le but est d’exploiter le contenu des données symboliques avoisinantes afin d’en extraire les fragments adéquats pour compléter l’indexation de la donnée non symbolique. Cette approche a été abordée dans le cadre concret d’une application dans un contexte professionnel : indexer les graphiques des documents techniques en exploitant le texte qui les accompagne. Cette indexation est articulée autour d’un modèle de représentation des graphiques tenant compte de la finalité de leur utilisation et du professionnalisme de leurs usagers, et d’un modèle d’extraction des termes d’indexation à partir du texte du document technique.

Source : Inforsid.Auteurs :Leïla Kefi, Catherine Berrut, Eric Gaussier


Suivre la vie du site RSS 2.0 | Plan du site | Espace privé | SPIP | squelette