BdD des Sciences d’Information

Accueil du site > Science de l’Information et Bibliothéconomie (Généralités) > Un modèle de données pour la textométrie : contribution à une (...)

Un modèle de données pour la textométrie : contribution à une interopérabilité entre outils

Serge Heiden

vendredi 19 janvier 2007, par anass


Résumé

La communauté des chercheurs en analyse de données textuelles s’organise afin d’unir les efforts de développement et de diffusion des outils de textométrie ainsi que l’échange des données textuelles qu’ils traitent. L’effort nécessaire pour rendre les calculs et les données interopérables est important pour clarifier les architectures de traitement textométrique complexes intégrant les outils de TAL et pour la capitalisation du travail de préparation des données. Afin de pouvoir comparer globalement les fonctionnalités des outils, nous proposons 4 axes de synthèse fonctionnels : Synthèses statistiques, Édition de texte, Moteur de recherche et Annotation de texte. Il existe différentes initiatives internationales de standardisation de la description (métadonnées) et du codage du contenu des données textuelles. Vue la grande diversité dans l’usage de ces standards et leur évolution permanente, nous proposons de situer l’effort d’interopérabilité avec les données à un niveau synthétique composé de 11 rubriques générales. Elles ont été construites à partir d’une synthèse des différents formats de données des outils de textométrie. Nous proposons de situer le travail d’interopérabilité des données à ce niveau de description.

Source :Cavi.2006. Auteur :Serge Heiden


Suivre la vie du site RSS 2.0 | Plan du site | Espace privé | SPIP | squelette