BdD des Sciences d’Information

Accueil du site > Science de l’Information et Bibliothéconomie (Généralités) > Cartographie automatique du contenu d’un corpus de documents (...)

Cartographie automatique du contenu d’un corpus de documents textuels

A. Mokrane, R. Arezki, G. Dray, P. Poncelet

vendredi 10 novembre 2006, par anass


Résumé :

La quantité d’informations et de documents disponibles de nos jours, entraîne une « surinformation » de l’utilisateur final (entreprise, organisme, individu, etc.) qui n’est donc plus capable d’analyser ou d’appréhender ces informations dans leur globalité. Avec le Web, les documents textuels non structurés sont devenus prédominants. L’information utile étant enfouie dans le texte, il devient indispensable de proposer de nouveaux systèmes permettant l’analyse, l’organisation et la représentation des différents contenus textuels. Dans cet article nous proposons un nouveau système, appelé IC (Information Cartography), pour la cartographie automatique du contenu d’un corpus de documents textuels. Le système IC est basé sur une approche originale pour le choix des termes représentatifs du contenu d’un corpus documentaire d’une thématique. Il permet d’aider une communauté d’utilisateurs travaillant sur une thématique donnée dans ses consultations documentaires en lui proposant une carte d’information sur le contenu global du corpus et/ou de chaque document. Nous illustrons IC sur un corpus d’articles de presse.

Source :CAVI. Auteurs :A. Mokrane, R. Arezki, G. Dray, P. Poncelet


Suivre la vie du site RSS 2.0 | Plan du site | Espace privé | SPIP | squelette