BdD des Sciences d’Information

Accueil du site > Science de l’Information et Bibliothéconomie (Généralités) > Utilisation d’ ontologies pour décrire les données semi-structurées (...)

Utilisation d’ ontologies pour décrire les données semi-structurées issues du web

Marie-Sophie Segret, Pierre Pompidor, Danièle Hérin, Michel Sala

mardi 8 mai 2007, par anass


Résumé :

Actuellement de nombreux serveurs offrent essentiellement des pages de textes, mais le grand enjeu économique est lié à la mise à disposition de grandes bases de données afin d’offrir un service à un utilisateur. Or les sites web qui offrent des accès à des bases de données contiennent des informations textuelles complémentaires aux données structurées.

Nous nous intéressons aux services offerts par ce type de sites. L’objectif premier est d’identifier les sites qui traitent d’un même service. Les problèmes à résoudre sont liés, d’une part à l’extraction des informations à partir des sites web en combinant les deux types de données (structurées et texte) afin d’obtenir un ensemble d’informations cohérent et décrit à l’aide d’un même formalisme ; d’autre part, à l’intégration et à l’exploitation des informations extraites de différents sites et répondant à un même service, sachant que les problèmes d’hétérogénéité doivent être transparents pour l’utilisateur.

Nous avons retenu une solution basée sur les ontologies et les agents informationnels, et une approche incrémentale consistant à développer un prototype « minimal » qui permette d’extraire et d’intégrer les informations issues de sites web et de montrer la faisabilité de l’approche retenue.

Source : Inforsid.Auteurs :Marie-Sophie Segret, Pierre Pompidor, Danièle Hérin, Michel Sala


Suivre la vie du site RSS 2.0 | Plan du site | Espace privé | SPIP | squelette