BdD des Sciences d’Information

Accueil du site > Veille > Initiation aux outils et méthodes de veille sur internet

Initiation aux outils et méthodes de veille sur internet

BOUDRY Christophe

mercredi 8 février 2006, par anass


Dans certains cas, les recherches d’information doivent être complétées par une démarche de veille, qui seule permettra d’assurer facilement et de manière réactive la mise à jour des connaissances sur le sujet étudié. Des outils facilitent cette démarche.

Les principes et différents types de veille sur internet

Ce qui distingue les activités de veille de la recherche d’information classique, c’est qu’elles s’inscrivent dans la durée et intègrent donc une dimension temporelle forte. En effet, si l’action de se documenter sur un sujet se pratique généralement à un instant donné, l’activités de veille consiste, au contraire, au maintien de la recherche documentaire dans le temps, en employant certaines méthodes et outils.

Alors que les activités de veille classiques "hors réseaux" sont des méthodes bien connues et très largement employées à l’heure actuelle, force est de constater que les méthodes et outils disponibles pour pratiquer la veille sur internet sont récents et encore assez peu usités, et ce malgré la place croissante que la veille prend dans les processus de collecte et de diffusion d’informations. D’un point de vue pratique, les activités de veille peuvent par exemple permettre de suivre les évolutions d’une technologie particulière et/ou de suivre les nouveautés technologiques apparaissant dans un domaine d’activité donné, de surveiller un concurrent, de créer une revue de presse ou bien encore de mettre à jour régulièrement un site web...

Pour rapatrier des informations, l’utilisateur peut pratiquer le "pull" ou le "push". Le "pull" (qui signifie tirer) consiste à aller chercher, à extraire des informations suite à une action de l’utilisateur (la recherche sur un moteur de recherche classique constitue donc du "pull") Le "push" (qui signifie pousser), consiste à recevoir de l’information de manière systématique, la collecte étant initiée en amont une fois pour toute. Le "pull" et le "push" définissent donc plus la méthode de collecte des données que le type de veille effectuée par un utilisateur. Ainsi, la surveillance des modifications de pages web par le biais d’un logiciel donné constitue un type de veille qui peut impliquer le "pull" ou le "push", selon la manière dont sont rapatriées les données : si c’est à l’initiative de l’utilisateur, il s’agit de "pull", si c’est automatiquement dès l’apparition de modifications, par exemple , il s’agit de "push".

Actions de veille sur internet

Les actions de veille sur internet sont principalement de trois types :

Répétition d’une même recherche sur un outil de recherche d’information

Une action de veille peut s’exécuter par la répétition d’une même recherche sur un ou plusieurs outils de recherche. Ce type d’action de veille ne nécessite pas forcément d’outils spécifiques. Il peut s’agir tout simplement, pour un utilisateur, de répéter une recherche donnée à intervalle régulier, le principal inconvénient étant le caractère non systématique de cette action. Pour remédier à cela, il existe des outils qui proposent à l’utilisateur de choisir ceux qu’il souhaite interroger, ainsi que la périodicité à laquelle doit s’effectuer la recherche (par exemple, Copernic dans sa version " Agent Professional " ).

Suivi de pages web

Le suivi des modifications et nouveautés apparues sur certains sites Web choisis constitue une méthode performante pour pratiquer des activités de veille sur internet. Les principaux outils dédiés à cette tache sont les aspirateurs de sites (comme MemoWeb) et les agents de veille (comme WebSiteWatcher).

Les aspirateurs de sites sont des outils de type logiciel qui permettent de rapatrier tout ou partie d’un site Web sur l’ordinateur, à intervalle régulier, afin d’en analyser les modifications. Ce type d’outil présente en outre l’avantage de pouvoir analyser les résultats "off line" (c’est à dire sans forcément être connecté sur internet) et de proposer parfois d’intéressants outils d’analyse des sites capturés.

Les agents de veille sont des logiciels qui permettent de "pointer" sur des pages Web ; ils nécessitent pour la plupart d’être en configuration "on line" (c’est à dire connecté sur internet). Ils présentent la particularité de mettre en évidence les changements intervenus ou de rechercher l’apparition de mots clés spécifiques sur les pages surveillées (exemple : Webspector). Suivant les outils, la surveillance peut s’effectuer selon des intervalles de temps définis par l’utilisateur ou non. Les résultats peuvent être consultés à l’initiative de l’utilisateur ou bien, par exemple, signalés automatiquement par courrier électronique lorsqu’une modification apparaît sur une page Web.

Les canaux d’information

Le "webcasting" est une autre manière de pratiquer une activité de veille sur internet. Il s’agit de s’abonner à des canaux d’information sur une ou plusieurs thématique donnée (à ce titre, ce type de veille peut faire penser au mode de diffusion des informations utilisé par la télévision ou la radio), de recevoir automatiquement et de visualiser les dernières informations apparues sur le ou les canaux en question. Les domaines couverts par ces canaux d’informations sont cependant assez limités et généralistes, et concernent surtout des domaines comme le sport, la bourse. Les outils déployés sont de type logiciel ou non. Dans ce dernier cas, l’information réside dans une page Web, dont le contenu est rafraîchi à intervalle régulier ou à l’initiative de l’utilisateur.

Le principal inconvénient de ces outils est de nécessiter d’être en configuration "on line", et de générer un trafic de données conséquent. Après une période d’euphorie, ils se sont faits plus discrets.

Depuis peu, le développement des blogs a permis la diffusion du "RSS", qui fonctionne selon un procédé similaire et permet la diffusion d’actualités. Le RSS - Rich Site Summary" (Sommaire de site enrichi) ou "Really Simple Syndication" (Syndication vraiment simple), selon les traductions - correspond à la diffusion d’un fichier de texte balisé, généré à chaque mise à jour du site. L’usager peut lire ce fichier, ou "fil RSS", qui correspond donc aux nouveautés du site, et même s’y abonner. Les flux RSS sont lus via un navigateur web ou un logiciel de messagerie (avec thunderbird, par exemple).

Source :Repère.Le 30/05/2005. Auteur : BOUDRY Christophe


Suivre la vie du site RSS 2.0 | Plan du site | Espace privé | SPIP | squelette