BdD des Sciences d’Information

Accueil du site > Science de l’Information et Bibliothéconomie (Généralités) > Extraction et impact des connaissances sur les performances des systèmes de (...)

Extraction et impact des connaissances sur les performances des systèmes de recherche d’information

Mohamed Hatem Haddad

mardi 20 juin 2006, par anass


Dans un contexte riche d’information, un système de recherche d’information doit être capable de trouver les meilleurs résultats possibles dans un océan d’information. Notre étude s’intéresse aux connaissances qui peuvent être extraites du contenu textuel des documents en associant la finesse d’analyse d’une approche linguistique (extraction et structuration) à la capacité d’une approche statistique de traiter de gros corpus. L’approche statistique se base sur la fouille de données textuelles et principalement la technique de règles d’association. L’approche linguistique se base sur les syntagmes nominaux que nous considérons comme des entités textuelles plus susceptibles de représenter l’information contenue dans le texte que les termes simples. Elle explicite les contraintes linguistiques nécessaires à l’extraction des syntagmes nominaux et défini les rapports syntagmatiques entre les composantes d’un syntagme nominal. Ces relations syntagmatiques sont exploitées pour la structuration des syntagmes nominaux. Une mesure, appelée ``quantité d’information’’, est proposée pour évaluer le pouvoir évocateur de chaque syntagme nominal, filtrer et comparer les syntagmes nominaux. Le modèle proposé démontre que la combinaison d’une approche statistique et d’une approche linguistique affine les connaissances extraites et améliore les performances d’un système de recherche d’information.

Source : TEL.2002.Doctorat. Spécialité :informatique.Auteur : Mohamed Hatem Haddad


Suivre la vie du site RSS 2.0 | Plan du site | Espace privé | SPIP | squelette