BdD des Sciences d’Information

Accueil du site > Traitement de l’Information > Pré-analyse de corpus

Pré-analyse de corpus

Thierry Poibeau

mardi 12 juin 2007, par anass


Résumé

Les applications de Traitement Automatique des Langues nécessitent le plus souvent des corpus homogènes pour fournir des résultats pertinents. De tels corpus sont rarement disponibles dans des contextes applicatifs ou industriels. Cet article propose une approche originale pour préparer les corpus et obtenir des masses de textes utilisables. Les techniques présentées vont des statistiques à l’analyse linguistique de surface. Les techniques sont présentées puis appliquées au domaine de l’extraction d’information. Nous montrons l’intérêt de ces techniques et nous en donnons une évaluation fondée sur leur pertinence pour la tâche visée.

Source : CAVI.2004.Auteur :Thierry Poibeau

Documents joints


Suivre la vie du site RSS 2.0 | Plan du site | Espace privé | SPIP | squelette