Bibliométrie en vrac

Le New York Times nous apprend que Google, en collaboration avec des chercheurs de Harvard, offre un outil de visualisation unique occurrence de mots dans les livres numérisés. L’outil, nommé Ngram, permet de voir combien de fois un mot apparaît dans les monographies numérisées par le géant d’Internet. Plus de 500 milliards de mots seraient disponibles !

Tel un enfant le matin de Noël, je me suis empressé de lancer une petite requête pour le mot « copyright » qui se trouvent dans les livres en anglais. Voici le résultat :

De CultureLibre.ca

Mystérieusement, il n’y avait pas de résultats pour « droit d’auteur » sur le corpus en français, juste pour « copyright »:

De CultureLibre.ca

Fait intéressant, Google permet de télécharger les micro-données qui permettent à cet outil de fonctionner. Vivement l’appropriation libre du domaine public !

Ce contenu a été mis à jour le 2010-12-20 à 11 h 49 min.