BdD des Sciences d’Information

Accueil du site > Science de l’Information et Bibliothéconomie (Généralités) > Un résumeur automatique de textes multilingues intégré dans une plate-forme (...)

Un résumeur automatique de textes multilingues intégré dans une plate-forme de veille ; application à la langue arabe

Abderrafih Lehmam , Philippe Bouvet

lundi 7 mai 2007, par anass


Résumé

Dans cet article nous présentons une solution de résumé automatique de texte multilingue. Cette solution se fonde uniquement sur des techniques linguistiques codées de facon sophistiquée en XML et en Java. Des fonctionnalités avancées augmentent la pertinence des résultats par des moyens pragmatico-linguistiques. En particulier, le moteur de résumé s’appuie a la fois sur une base de connaissances linguistiques et sur des thésaurus de divers domaines. L’association des deux bases permet d’intégrer des fonctionnalités intelligentes d’extraction de connaissances. Tous les termes descripteurs d’un domaine donné sont présentés sous forme d’une liste a partir de laquelle il est possible d’extraire les synonymes se trouvant dans le texte source ou son résumé automatique. Ces fonctionnalités nouvelles de fouille de texte permettent d’explorer des documents en naviguant a travers les termes spécifiques d’un domaine et leurs synonymes et produire automatiquement ou interactivement un résumé. Ces résultats sont exploités sur une plate-forme de veille qui analyse des sites Internet en plusieurs langues pour en extraire des informations liées a l’actualité.

Source :LPL. Auteurs :Abderrafih Lehmam , Philippe Bouvet


Suivre la vie du site RSS 2.0 | Plan du site | Espace privé | SPIP | squelette