BdD des Sciences d’Information

Accueil du site > Science de l’Information et Bibliothéconomie (Généralités) > Conception d’un modèle d’indexation de documents structurés (...)

Conception d’un modèle d’indexation de documents structurés multimédias :cas des relations textes - images fixes

BADJO Bernadette MONNET, BERTIER Marc

mardi 12 juin 2007, par anass


Résumé

La pratique de l’indexation effectuée par les bibliothécaires et documentalistes obéit à un certain nombre de règles : utilisation de substantifs pour les mots-clés ; renvois d’orientation de termes synonymes ou équivalents ; renvois simples, à partir de classifications de concepts dans des thésaurus ou de simples listes d’autorité, etc. Cet ensemble de directives n’empêche pas une certaine forme de subjectivité dans l’analyse d’un document. Un même ouvrage indexé par plusieurs documentalistes est souvent représenté différemment même si ces différentes représentations sont correctes. L’informatisation de la gestion documentaire, la mise en ligne de documents intégraux sur des réseaux et le développement rapide des documents électroniques, remettent en cause la pratique traditionnelle de l’indexation. Outre la question de la rapidité de traitement imposée par l’augmentation des volumes, le fait même de pouvoir consulter un document intégral et non plus sa signalisation, ouvre des perspectives nouvelles quant aux possibilités du traitement à lui appliquer pour le rendre visible. Au lieu de ‘’méta-informations’’ sur le document, il s’agit d’informations propres à ce document rendues exploitables. Nous appelons méta-information, une expression représentant un contenu de document provenant d’une classification. Même si cette expression peut exister dans le document, souvent ce n’est pas le cas.

L’automatisation de la recherche d’information (RI) soulève un autre problème, et non des moindres, celui de la surcharge cognitive dans le cadre de l’indexation classique. Par surcharge cognitive, on entend le travail de sélection qu’il reste à effectuer sur les documents restitués pour satisfaire le besoin d’information : retenir/rejeter chaque document, voire ne garder qu’une partie d’un document.

Dans cette optique, nous proposons un outil d’indexation automatique des documents. Cet outil tâche de trancher la question du traitement rapide de l’information, dans les bibliothèques et centres de documentation ; de lever la question de la multiplicité des termes représentant un même document ; de palier la question de la surcharge cognitive en matière de RI. Cet outil fondé sur la structure logique et sur l’analyse linguistique du document, intègre en outre les éléments non textuels, et les considère comme unités de recherche d’information au même titre que le texte.

Source : Codesria.Auteur :BADJO Bernadette MONNET, BERTIER Marc


Suivre la vie du site RSS 2.0 | Plan du site | Espace privé | SPIP | squelette