Fermer×
9 mai 2012

De l’imprimé aux données ouvertes

Ce texte a initialement été publié par la Vitrine technologie-éducation sous licence CC BY-NC-SA 3.0, avant la création d’Éductive.

Avec ma formation en lettres, je suis venu à l’univers des données par l’établissement d’un index des noms propres pour les œuvres de l’écrivain Jacques Ferron : 12 000 noms dans 1 200 textes. J’ai aussi entré les 42 000 occurrences, une à la fois, sur mon premier ordi à écran monochrome (sans souris!) et le logiciel DBASE III+. Jusque-là, je croyais avoir fait un index ordinaire, un peu plus volumineux.

Quand j’ai mis les noms dans 20 catégories et que je les ai liées aux données bibliographiques (date, éditeur, collection), j’ai réalisé que je venais de construire une base de données. Au fil des ans, avec des amis, j’ai ajouté des données sur la correspondance, la critique, les manuscrits, la bibliothèque de Ferron, des liens Internet, etc. J’ai dû numériser des livres, transférer une bibliographie dans une base de données (je vous passe les détails!), créer des relations entre les différents sous-ensembles de données. Voilà deux, trois ans, j’ai appris que je faisais depuis 15 ans de l’extraction d’entités nommées! Ça donne le module de « Recherche globale » de l’HyperFerron que vous pouvez consulter ici (l’interface de recherche est bien vieillie).

Le passage des informations imprimées à la base de données numériques m’a permis de consulter autrement l’œuvre de Ferron, de me poser de nouvelles questions, de découvrir de nombreux aspects dont je ne pouvais même pas soupçonner l’existence. Pour moi, les données ouvertes, c’est d’abord ça : la séparation des données de leur support fixe sur papier. Tout devient malléable, ouvert aux échanges, aux tris multiples, à des modes de diffusion et de visualisations variés. Je suis donc venu aux données ouvertes par la pratique.

Peu à peu, j’ai essayé d’utiliser des outils et des plateformes en ligne pour mieux exploiter mes données.

Voici deux expériences et la démarche que j’ai suivie :

1er projet : 1 600 noms de lieux mentionnés par Ferron

1. enregistrer le fichier de données en csv

2. géocoder (ajouter longitude et latitude)

3. importer dans Google Docs

4. utiliser le plugiciel (plug-in) conçu pour les géolocaliser sur une carte. Avec 1 600 noms, le résultat est un peu long à s’afficher, mais ça marche (Aide Google sur l’utilisation des feuilles de données)

2e projet : Places de spectacles du boulevard Saint-Laurent

1. numérisation du répertoire de A.-G. Bourasse et J.-M. Larrue

2. ocr, Word, base de données, ajout de catégorie

3. fichier csv, géocodage, importation dans Google Fusion Tables

4. plugiciel pour créer des fichiers kzm pour l’afficher dans Google Earth

La transformation des informations imprimées en données numériques modifie complètement la vision et la compréhension que l’on pouvait avoir de ce répertoire. On apprécie encore mieux le travail minutieux des deux historiens.

Pour continuer ce projet? Ajouter aux lieux de spectacles des informations sur les artistes, des photos, des extraits sonores, visuels, des extraits de la presse, de la radio, de la littérature, les commentaires des historiens, et laisser les gens ajouter leur propres souvenirs et documents qu’ils ont sur la Main de Montréal.

S’abonner
Notification pour
guest

0 Commentaires
Commentaires en ligne
Afficher tous les commentaires