Fermer×
6 décembre 2005

Au delà de Google, il y a le Web invisible

Ce texte a initialement été publié par Profweb sous licence CC BY-NC-ND 4.0 International, avant la création d’Éductive.

Saviez-vous que Google, AltaVista et les autres moteurs de recherche ne couvrent que la pointe de l’iceberg du contenu du Web? Le reste, c’est ce qu’on appelle le « Web invisible » ou le « Web profond ». Selon l’article « Web invisible, Web caché, Web profond », le Web invisible serait 260 fois plus vaste que le Web visible. Alors, comment prendre connaissance de ces richesses cachées?

Est-ce que la réponse se trouve dans les banques de données, véritable valeur ajoutée à l’information? De par sa structure même, Internet met en lien différents types de serveurs offrant leur contenu par le biais de divers protocoles de communication. Le plus connu est le Web qui affiche principalement des pages HTML, mais il permet aussi d’accéder à différents formats de documents (PDF, Word, Excel, PowerPoint, etc.).

Internet comporte aussi les protocoles liés au courriel et aux forums de discussion et également le transfert de fichiers (FTP). Ce sont les moteurs de recherche (Google, Alta Vista et les autres) qui permettent de retrouver les documents dans cette partie visible publique d’Internet. Ces moteurs sont de véritables araignées qui sillonnent les quelque « 11,5 milliards de pages sur le Web » (Référence : http://actu2.abondance.com/2005-26/web-size.php) pour créer leur index. Il n’est donc pas surprenant d’obtenir environ 31 600 000 de références pour la requête « Web invisible » dans Google (30 novembre 2005)!

Par ailleurs, parmi ces millions de résultats, êtes-vous surpris de rencontrer si peu d’articles scientifiques? De contenu révisé par les pairs? C’est en effet là que l’on observe les trous noirs… Le Web invisible!

Le Web invisible est la zone non indexée d’Internet. On y retrouve, entres autres, les bases de données protégées ou non par un mot de passe, les catalogues de bibliothèques, la majorité des livres électroniques et les images animées (Flash et autres).

Illustration de la distribution des sites du « Web Profond ». Schéma établit sur la base de la figure
« Distribution des sites du Deep Web par types de contenu » de l’étude Bright Planet.

Alors, comment accéder à ces richesses cachées?

La première étape est de bien préparer sa recherche, comme le mentionnent Philippe Flamand et Véronica Gill dans leur dossier Recherche d’information efficace dans Internet dans Profweb. Une fois les concepts identifiés et les mots-clés retenus, la recherche proprement dite peut s’enclencher.

Peu importe la discipline, un bon point de départ consiste à consulter le site Web de la bibliothèque de votre collège. Certaines bases de données payantes y sont accessibles. Ainsi, la banque Repère (Pour accéder à ce lien, votre collège doit être abonné et vous devez être dans les murs de celui-ci.) vous permet de chercher des articles de revues francophones; Biblio Branchée (Pour accéder à ce lien, votre collège doit être abonné et vous devez être dans les murs de celui-ci.) donne accès au plein texte des articles de journaux francophones et à la retranscription d’émissions de Radio-Canada;Ebsco Host (Pour accéder à ce lien, votre collège doit être abonné et vous devez être dans les murs de celui-ci.) permet de repérer et lire des articles de journaux et magasines en anglais.

Plusieurs autres bases de données, encyclopédies, ouvrages de référence spécialisés et ressources Web sont disponibles via la section de « référence virtuelle » du site Web de votre bibliothèque. N’hésitez surtout pas à en discuter avec vos spécialistes de la recherche d’information dans votre collège : les techniciens en documentation et la bibliothécaire. C’est effectivement là que l’on profite d’une valeur ajoutée à l’information!

Pour les chercheurs en éducation et les praticiens avides de perfectionner leur enseignement ou de mieux comprendre le processus de l’apprentissage, le Centre de documentation collégiale (CDC) offre lui aussi toute une gamme de ressources. Le catalogue en ligne du CDC donne accès à des articles, des livres et des rapports, dont ceux de PAREA(Programme d’aide à la recherche sur l’enseignement et l’apprentissage du ministère de l’Éducation, du Loisir et du Sport.), spécialisés en éducation et plus spécifiquement à l’enseignement collégial. La banque ProQuest indexe plus de 2 000 titres de revues en éducation et offre près de 1 000 titres en texte intégral dont ERIC Plus text (Pour obtenir un accès à ProQuest, contactez le CDC). Une foule de ressources spécialisées, spécialement identifiées par la bibliothécaire, sont également disponibles sur le site Web du CDC.

Conclusion, le meilleur moyen d’accéder aux ressources du Web invisible, c’est de consulter les références sélectionnées par des humains! Par exemple, les sites Web des bibliothèques du réseau collégial, les listes d’« incontournables » comme celle proposée dans le dossier Recherche d’information efficace dans Internet de Profweb.

À propos de l'auteur

Isabelle Laplante

Isabelle LAPLANTE est la bibliothécaire responsable du Centre de documentation collégiale (CDC) dont le mandat est de desservir tous les cégeps et collèges privés, francophones et anglophones du Québec. Elle s’intéresse notamment à la diffusion du patrimoine documentaire du réseau collégial.

S’abonner
Notification pour
guest

1 Commentaire
Le plus ancien
Le plus récent Le plus populaire
Commentaires en ligne
Afficher tous les commentaires