Organisations

Données géospatiales Droit d'auteur Exceptions au droit d'auteur Universités Voix, données

Le droit d’auteur et les données de recherche

Notes de ma présentation lors de l’École d’été sur les humanités numériques de 2022. Vous pouvez visionner ou consulter mes présentations antérieures sur mon carnet.

Parfois, il faut savoir protéger ses droits !

Dans son Petit cours d’autodéfense intellectuelle, Normand Baillargeon offre un vibrant hommage à la pensée critique et à la capacité de raisonnement. Par contre, il n’y offre aucun conseil pour se battre. Car en droit d’auteur, il faut savoir comment ester en justice, en plus de savoir créer !

Le droit d’auteur saisit les créations artistiques, culturelles, créatives ou leur communication, pour échafauder un régime de propriété assorti de toutes sortes de modalités. Pour y faire face, les agents socio-économiques doivent analyser leur communautés, contextes et ressources pour effectuer des choix stratégiques, symboliques et structurants. En ce qui concerne le domaine des données de recherche, me vous propose cette savoureuse lecture de Pablo Jensen: Pourquoi la société ne se laisse pas mettre en équations ainsi que de l’essentiel Vademecum pour la réutilisabilité des données du Consortium Cahier.

Or, il de bon aloi de blâmer le droit d’auteur pour une complexité délétère à l’innovation. Cette prémisse est malheureusement injuste: La complexité autour des enjeux juridiques de tout contexte découle de l’imbrication de divers ordres juridiques, tant publics que privés, de plusieurs facteurs technologiques ou médiatiques liés à l’environnement socio-économique des acteurs impliqués ainsi que le contexte mondialisé de l’ordre économique néolibéral. Pour les données de recherche en humanités numériques, nous nous situons en amont et en aval du processus de la recherche universitaire. Examinons les aspects légaux comme point focal en gardant en tête le système social de notre étude, l’université contemporaine.

1. Le droit d’auteur

Débuts britanniques du copyright au 18e siècle: Statute of Ann (livre, 1710) et l’Acte d’Hogarth (gravure, 1734). Le droit d’auteur Français et la piraterie américaine au 19e siècle. La codification internationale des nouvelles formes médiales depuis… Internet n’est qu’un écho d’une histoire bien connue du droit d’auteur !

1.1 Droit économique et artistique

Propriété

art 3, https://canlii.ca/t/ckj9#art3: protection de l’oeuvre. Produire, reproduire, publier, exécuter en public l’entièreté ou une partie substantielle de la forme exprimée. En 2012, le législateur édicte la «mise à disposition par Internet» comme une méthode d’exécution en public.

art. 6, https://canlii.ca/t/ckj9#art6durée du droit d’auteur. 50 ans après la mort de la créatrice (bientôt 70 ans). Après, l’utilisation n’est plus restreinte par le droit d’auteur et l’oeuvre est dans le domaine public.

Contrats, licences, cessions et toutes les concessions

art 13, https://canlii.ca/t/ckj9#art13possession, cessions et licences. Certaines dispositions sont édictées comme point de départ, mais le droit d’auteur est agnostique quant à la teneur des contrats.

Droit moral et artistique

art 14.1(2) https://canlii.ca/t/ckj9#art14.1: Les droits moraux sont incessibles; ils sont toutefois susceptibles de renonciation, en tout ou en partie. Encore les contrats!

1.2 Autour du droit d’auteur

Limitations

Les limitations édictent une utilisation sans autorisation mais rémunérée. Les Société de gestion collectives (SGC) sont les organisations appelées à gérer les droits sur un corpus homogène d’oeuvres pour une communauté donnée. Copibec gère la réprographie au Québec. Dans l’industrie, on parle des «petits droits» pour ceux gérées par les SGC.

Exceptions

Les exceptions édictent une utilisation sans autorisation et sans rémunération. L’utilisation équitable aux art. 29, 29.1 et 29.2. Le contenu non-commercial généré par les utilisateurs à l’art 29.21. Les Bibliothèques, archives et musées (BAM) aux art. 30.1 et 30.2.

Idées et faits (originalité de l’oeuvre)

Le droit d’auteur protège les oeuvres originales et fixées. Les faits (données) ne sont pas originales à moins que la sélection et l’arrangement de ceux-ci découle du talent, jugement et de l’effort. Une recette n’est pas protégée, à moins de se qualifier comme originale dans la forme qu’elle est exprimée. Les idées ne sont pas protégées par droit d’auteur.

Formes insaisissables (fixation de l’oeuvre)

Certaines formes d’expression artistiques glissent hors de la structure édictée par le droit d’auteur. La danse peut difficilement être fixée (filmer une chorégraphie protège la vidéo produite, pas la danse elle-même). Pour les artistes-interprètes musicaux, une forme de «droit voisin» est édicté. La mode est généralement exclue du droit d’auteur au Canada.

Les savoirs traditionnels et les formes d’expressions autochtones sont des formes glissent également (fort malheureusement) de la structure du droit d’auteur, tout comme le patrimoine vivant

Synthèse

2. Les données saisies par le droit d’auteur

2.1 Sources

Quelles sont les contraintes juridiques sur les sources envisagées ? Le domaine public? Les documents publics? Renseignements personnels? Cadre éthique de la recherche ? Données ouvertes liées ou secret de polichinelles ?

Utilisation équitable dans CCH: (1) le but de l’utilisation; (2) la nature de l’utilisation; (3) l’ampleur de l’utilisation; (4) les solutions de rechange à l’utilisation; (5) la nature de l’œuvre; (6) l’effet de l’utilisation sur l’œuvre. * CCH Canadienne Ltée c. Barreau du Haut-Canada, 2004 CSC 13 (CanLII), [2004] 1 RCS 339, au para 53, <https://canlii.ca/t/1glnw#par53>, consulté le 2022-06-06

2.2 Méthodes

Les faits (données) ne sont pas originales à moins que la sélection et l’arrangement de ceux-ci découle du talent, jugement et du travail.

Voir « idées et faits » sous 1.2

Est-ce que les données sont protégées par droit d’auteur?

Essentiellement, la compilation, pour être originale, doit être une œuvre que son auteur a créée de façon indépendante et qui, par les choix dont elle résulte et par son arrangement, dénote un degré minimal de talent, de jugement et de travail. Ce n’est pas une haute exigence, mais c’en est une. S’il en était autrement, n’importe quel type de choix ou d’arrangement suffirait, puisque ces opérations supposent un certain effort intellectuel. Toutefois, la Loi est claire: seules les œuvres originales sont protégées. Il se peut donc que certaines compilations ne satisfassent pas à ce critère.

Télé-Direct (Publications) Inc. c. American Business Information, Inc., [1998] 2 CF 22, 1997
CanLII 6378 (CAF), <http://canlii.ca/t/4mzd>

En plus du jugement Télé-Direct cité précédemment, voici une petite liste de jugements canadiens sur les questions de propriété des données, en ordre chronologique inversé:

La méthode scientifique est-elle un engin de création d’oeuvres protégées ?

Les types de documents canoniques produits en humanités numériques: thèses, articles et rapports, monographies… mais entre ces documents, il y a des billets, courriels et messages…

Les trois éléments du modèle documentaire en humanités numérique: la notice documentaire; la compilation de notices; et le corpus décrit par les notices.

2.3 Résultats

Quelle version de vos données rendre disponible? À quelle clientèle ?

Plusieurs licences pour le même objet de droit

Les trois soeurs, le plan: de mobilisation des connaissances; de gestion des données de recherche; de libre accès.

3. Perspectives futures

Chantier sur la gouvernance documentaire en humanités numériques:

  • Le plan de moissonnage de sources
  • Le dictionnaire de données, ou comment encode-t-on nos sources en données de recherches
  • La méthode, ou comment on transforme nos données en résultats
  • Le plan de mobilisation et de libre accès

Tous ces éléments doivent figurer dans la Charte d’un projet en HN. Il faut discuter des intentions quant au décorum du projet, notamment pour sa réutilisation.

Note importante: le dictionnaire des données doit spécifier dans quels champs nous inscrivons le statut juridique des oeuvres dans nos corpus. Il s’agit des métadonnées juridiques.

Le cas des jeux vidéo créés dans le cadre de la recherche.

Universités Voix, données

Comment réutiliser les données de recherche

Je tiens à remercier mes collègues du groupe de travail (Ré)utilisatibilité du consortium Cahier pour leur fabuleux guide: Vademecum pour la réutilisabilité des données. À la page 6, les auteurs indiquent :

L’un des principaux verrous pour la réutilisation des données concerne les aspects juridiques. En France, le cadre légal prône l’ouverture des données au maximum (cf. loi sur la république numérique14 et loi Valter15). En même temps, d’autres principes s’appliquent : les droits d’auteur et les droits voisins, la question de la propriété intellectuelle ou des données personnelles (droits à l’image, respect de la vie privée, etc.). C’est surtout flagrant pour les corpus récents (XXe -XXIe siècle). Il en découle des restrictions pour la réutilisabilité des données et leur citabilité16. Il existe une zone de flou, qui peut déstabiliser les porteurs de projets et les utilisateurs : par exemple, du point de vue des droits, certaines données sont inaccessibles, alors que leurs métadonnées sont, elles, accessibles.

Dans quelle mesure les métadonnées sont-elles concernées par le droit d’auteur ? Sans doute faudrait-il distinguer les métadonnées purement descriptives de celles qui sont le fruit d’un travail d’interprétation17. Mais si ce travail d’interprétation n’est pas signé, il est difficile concrètement de le protéger. Une des premières actions d’un projet doit être de chercher les indications de signatures et de protection juridiques (licence, source, propriété, etc.) des données. Si ces indications ne permettent pas la réutilisation des données, il est toujours possible de contacter les propriétaires des droits.

14 Voir https://www.economie.gouv.fr/republique-numerique

15 Voir https://www.legifrance.gouv.fr/jorf/id/JORFTEXT000031701525

16 Marie-Luce Demonet, « La Confiscation des données issues de l’humanisme numérique » in Véronique Ginouvès ; Isabelle Gras, La Diffusion numérique des données en SHS – Guide de bonnes pratiques éthiques et juridiques, Presses universitaires de Provence, 2018, Digitales, 9791032001790 〈hal-02068085〉.

17 Le droit d’auteur s’applique à tout travail témoignant de l’originalité d’une pensée. Voir le tutoriel de Mate-SHS avec une intervention de Lionel Maurel, « À qui appartiennent les données ? » : https://mate-shs.cnrs.fr/actions/tutomate/tuto25-propriete-donnees-lionel-maurel

Source: Vademecum pour la réutilisabilité des données. p. 6

À la page 11:

Faire un état des lieux juridique
Un tel état des lieux doit concerner autant les données réutilisées que les données produites
et comprendre au moins les aspects suivants :
– identification du statut juridique des données réutilisées ;
– prise en compte des différents types de contenus produits par le projet : images et transcriptions, images sans transcriptions, transcriptions sans images, etc. ;
– intégration de la question de la réutilisabilité des données à la convention entre les différents partenaires, qu’il s’agisse d’institutions, d’individus ou d’ayants droit ;
– résolution des problématiques induites par le RGPD (Règlement général sur la protection des données). En cas de doute, il faut contacter le DPO (Data Protection Officer), aussi appelé DPD (Délégué à la Protection des Données) de votre établissement, qui vous conseillera sur les démarches éventuelles à entreprendre auprès de la CNIL (Commission Informatique et Liberté) et sur les précautions à prendre avant
de traiter et de publier vos données ;
– résolution des contraintes liées au respect des droits d’auteurs ;
– état des lieux des possibles embargos pour ne pas se retrouver bloqué au moment de la mise en ligne des données

Source: Vademecum pour la réutilisation des données, janvier 2022, p.11

De plus, les auteurs précisent à la page 18:

Il faut pouvoir concevoir, dès la phase initiale du projet, une charte anticipant et précisant toutes les conditions de réutilisation possibles en concertation avec l’ensemble des acteurs concernés (institutions, ayants droit, etc.). Quand un projet implique plusieurs partenaires,
ou des partenaires internationaux, qui peuvent être soumis à des cadres légaux différents, il apparaît nécessaire de prévoir dans un document-cadre les difficultés potentielles à cette gestion des données, idéalement dès le tout début du projet.

Source: Vademecum pour la réutilisabilité des données. p. 18

Je me demande si la nouvelle norme ISO 24143:2022 – Information et documentation — Gouvernance de l’information — Concept et principes pourrait être utile pour documenter les pratiques des chercheurs en lien avec leur traitement des données… La recherche universitaire constitue une certaine forme de gouvernance des données.

Créateur Revendication

Le droit d’auteur sur les planches

Le Conseil québécois du théâtre (CQT) a lancé hier un dossier intitulé intitulé
Le droit d’auteur à l’ère du numérique. Celui-ci propose deux entrevues et une «chronique» de leur comité numérique. Une lecture très pertinente pour comprendre les transformations en cours sur le monde des arts vivants.

Par exemple, la chronique du CQT soulève les modifications des législations sur le statut de l’artiste, surtout en ce qui concerne les cadres de rémunérations édictés en lien avec la webdiffusion. J’ai noté, par ailleurs, que le Comité indique que la plateforme Smartsplit peut s’appliquer au théâtre. Pour l’anecdote, Smartsplit est une initiative du domaine musical afin d’inscrire les métadonnées juridiques d’une oeuvre dans une chaîne de blocs, pour en faciliter la répartition des revenus. J’ai d’ailleurs co-écrit un article sur les chaînes de blocs et du droit d’auteur avec l’un des instigateurs de ce projet, Guillaume Déziel, avec l’incontournable Me Érika Bergeron-Drolet.

Le Comité pose cette épineuse question, qui semble toucher un nerf sensible partout où il est question du numérique :

L’une des questions-clé qui se posent encore, même en phase de relance, est la suivante: de quelle façon peut-on calculer la valeur du droit d’exploitation lorsqu’on passe de la scène à la diffusion web ?

Source: Chronique du comité numérique, Conseil québécois du théâtre, 23 novembre 2021

Sans toutefois y répondre, le Comité évoque soit un modèle de paiement d’un montant forfaitaire en amont, soit un partage des flux monétaires selon une «licence pour un certain montant, pendant une période déterminée, dans un territoire, sur un support et pour un type d’utilisation spécifique.» (p.3)

D’ailleurs, il y est également question du rôle des revenus venant des subventions dans la répartition équitable des droits ainsi que de la notion de responsabilité sociale.

Droit d'auteur Internet

Livrels en accès libre, modèles économiques

Le libre accès est une méthode de diffusion pour une oeuvre numérique qui implique une mise en ligne à titre gratuite, contraintes tant juridiques que technologiques. Exit les limitations des licences propriétaires ou les verrous numériques. Mais cette approche question se pose : quel sont les modèles possibles de financer une telle approche ? Quel est l’impact escompté ?

Il y a plusieurs dimensions à ces questions. En premier lieu, le libre accès est un thème récurent dans l’édition scientifique, tant pour les revues édités par les pairs que les monographies. D’ailleurs, plusieurs groupes du milieu des bibliothèques proposent des ressources à leurs membres ou à la communauté à cet effet. Au Canada, notons l’excellent partenariat Coalition Publi.ca.

En fait, qui s’intéresse à la question de l’accès libre est rapidement submergé dans une vague déferlante d’information traitant du milieu académique, scientifique ou savant. Qu’en est-il du domaine (ou industrie) de l’édition littéraire et du libre accès ?

Pour un aperçu de l’univers littéraire numérique au Québec, certaines adresses sont incontournables. Débutons avec le très pertinent Édition Mammouth Numérique, qui livre sous format blogue une veille sectorielle. Ensuite, le plus récent mais non moins ambitieux le Carnet de la Fabrique Numérique est une initiative du laboratoire ExSitu de l’Université Laval (auquel je participe accessoirement par le projet Littérature Québécoise Mobile). D’ailleurs, il est essentiel de souligner l’important répertoire Opuscules lorsqu’il et question de littérature numérique au Québec !

J’oublie certainement quelques sites et initiatives, n’hésitez pas à me les souligner dans les commentaires…

En ce qui concerne la création littéraire de livres électroniques (livrels) en libre accès au Québec, je ne peux passer sous silence les efforts de la Fondation littéraire Fleur de Lys et leur service Manuscrit Dépôt qui, dans une certaine mesure, offre du libre accès. Plus récemment, le Labo Ex-Situ à Québec a récemment lancé la bibliothèque mobile québécoise, qui réédite des oeuvres littéraires classiques de la belle province en libre accès.

Y aurait-il d’autres corpus ou initiatives d’oeuvres littéraires récentes en libre accès? Comment étudier l’impact du libre accès sur celles-ci ?

Canada Enseignant

Profs et enseignants : qui possède votre droit d’auteur ?

Possession du droit d’auteur et oeuvres exécutées dans le cadre d’un emploi, voir respectivement l’alinéa 1 et 3 de l’article 13 de la Loi sur le droit d’auteur. Source: Loi sur le droit d’auteur, LRC 1985, c C-42, art 13, https://canlii.ca/t/ckj9#art13, consulté le 2021-11-10

Ressources éducatives libres (REL), voir l’exemple de la FabriqueREL.org.

Foire aux questions sur le droit d’auteur en milieu scolaire du Québec, Édition 2014 (pdf, 20 pages). Ce document propose en annexe, une politique type pour les commissions scolaires.

Google

Le moment où nous avons basculé dans l’ère post-moderne

Je me souviens encore de cette paisible journée de février. Une neige cotonneuse saupoudrait mollement Montréal tandis que je lisais mes fils RSS. C’est à ce moment que j’ai appris que Google avait ajusté, le 18 janvier 2009, certains éléments de son algorithme de tri des résultats de recherche de sites web. C’est aussi à ce moment que, selon moi, la société occidentale a basculé à l’ère post-moderne.

À l’époque, l’ingénieur Matt Cutts de Google nuançait la situation comme un ajustement mineur, nommé en l’honneur du membre de son équipe qui a mené l’initiative – le «Vince change» (le changement de Vince). Voir cette vidéo à ce effet :

Il faut dire qu’à l’époque, l’ajustement eut un impact significatif sur les efforts de lissage du référencement (ou, pour nos cousins de France: «search engine optimisation») et fit disparaître beaucoup de petits commerçants des premiers résultats, au profit des sites des grandes marques de commerce. C’est d’ailleurs ce qui demeure aujourd’hui de cette petite modification dans les sources que j’ai consulté… j’ai tenté en vain d’obtenir plus de détails sur le «Vince Change» de 2009 et c’est tout ce que j’ai trouvé. (Oui, j’ai même exploré des articles scientifiques et de la presse professionnelle de l’époque via une banque de donnée spécialisée de ma bibliothèque universitaire)

J’ai le vif souvenir d’avoir appris que depuis le 18 janvier 2009, l’algorithme de tri du moteur de recherche de Google répond aux requêtes avec des résultats optimisés pour l’individu lançant la recherche. Dans la vidéo, l’ingénieur Cutts mentionne que l’algorithme retiens toujours la confiance, l’autorité et la réputation («trust, authority, reputation») comme critères de base pour le tri des résultats. Mais qu’en est-il de cette idée que Google offre des résultats distincts en vertu de la personne effectuant la requête? Il s’agit, selon certains, de la source des chambres d’écho du Web. J’ai également inclus cette perspective dans mon enseignement des habitudes de recherche à mes étudiants.

Donc, j’ai souvenir que le 18 janvier 2009 fut le moment où Google a cessé de retourner les mêmes résultats pour tout le monde avec la même requête. Nous quittons le monde positiviste / naturaliste où une structure (ou ontologie) globale gouvernait le système. Nous entrons un cadre relativiste, pluraliste, personnel. Si le fait et le savoir gouvernent un système soit naturaliste ou positiviste, l’opinion et la croyance s’imbrique dans le relationnel. Ce qui est «vrai» découle donc de son approche épistémique (c’est-à-dire, notre façon de penser dicte notre de comprendre le monde). Cet argument mérite d’être déconstruit, voire amélioré – j’y reviendrai… dans l’intérim, je vous propose cette courte vidéo de mon collègue (et très chic type) Vivek Venkatesh, qui utilise judicieusement la distinction entre la pensée positiviste/naturaliste et relationnelle pour expliquer le racisme systémique sur le site du quotidien Montréalais Le Devoir.

Pourquoi est-ce que je vous parle de tout ceci? Simplement à cause du nouveau livre de Eric Schmidt (ancien grand patron de Google et Alphabet) avec Henry A Kissinger (!) et Daniel Huttenlocher dont le titre est assez évocateur : The age of AI and our human future (l’âge de l’intelligence artificielle et notre futur humain).

Il me semble que la recherche web via Google est un exemple probant de l’impact d’un algorithme apprenant (je déteste intelligence artificielle) sur la société. Il s’agit d’un outil essentiel qui est probablement mal utilisé par la vaste majorité… Simplement car chaque recherche effectuée fait partie d’une longue conversation avec une entité apprenante plutôt qu’un acte distinct. Il faut traiter Google comme la machine qu’elle est, celle qui décide ce que nous pouvons découvrir sur le web en vertu de ce qu’elle sait de nous.

Je vous laisse avec ma vidéo où j’explique, justement, comment entretenir cette conversation à long terme avec votre Google (en anglais, la langue de mon milieu de travail)

Conférence Voix, données

Corpus et droit d’auteur

Cette présentation s’inscrit dans les activités de l’École d’été 2021 PLU6113 intitulé Humanités numériques : approche interdisciplinaire, sous l’égide du Centre d’études et de recherches internationales (CÉRIUM) et en association avec le Centre de Recherche Interuniversitaire sur les Humanités Numériques (CRIHN) et le projet Littérature québécoise mobile (LQM).

Source: Plan de cours de l’École d’été PLU6113
Lien direct vers YouTube: https://youtu.be/aJx_noq7lMA

Éléments préliminaires

Je tiens à remercier l’équipe du CRIHN et tout particulièrement Michael Sinatra pour leur efforts dans l’organisation de cet activité importante.

Je me suis inspiré de plusieurs sources pertinentes mais je tiens à souligner ce texte d’Edin Tabak (2017) concernant le modèle hybride pour la gestion des projets en humanités numériques. Cette contribution a su guider mes réflexions lors de l’organisation de cette présentation.

La vidéo ici-bas que j’ai préparé pour l’École d’été 2021 PLU6113 Humanités numériques synthétise plusieurs éléments présentés lors de deux midi-conférences du projet de recherche Littérature québécoise mobile (LQM) en mars avec Marjolaine Poirier, et en avril avec Anne-Sophie Hulin, sur le thème du Droit d’auteur et des métadonnées culturelles. La première vidéo présente les questions juridiques générales ayant trait aux métadonnées tandis que la seconde présente un arrangement institutionnel particulier très novateur et pertinent, les fiducies de données. J’ai regroupé ces deux présentations dans une liste de lecture sur YouTube, dont voici le lien :

Droit et données en culture en 2 parties : silences du droit et fiducies (2 vidéos, 104 minutes 57 secondes). Voici les synthèses de ces deux vidéos :

Les milieux artistiques, culturels et créatifs sont confrontées à l’émergence du numérique. Marchés, outils technologiques et méthodes de mobilisation semblent échapper à l’ordre régalien. Ces mutations imposent une réflexion quant aux arrangements institutionnels novateurs, à l’intersection de contextes et paratextes inédits.

[Conférence du 24 mars 2021, avec Marjolaine Poirier] Nous présenterons les résultats d’une étude approfondie concernant les questions juridiques applicables aux données culturelles et leur diffusion. Spécifiquement, nous explorons les difficultés de concevoir les données culturelles par le cadre juridique édicté par le droit d’auteur tout en positionnant le libre accès comme une hypothèse de travail pour enrichir la réflexion des intervenants du milieu.

[Conférence du 21 avril 2021, avec Dre Anne-Sophie Hulin] Afin de pallier les écueils présentés lors de la conférence midi du 24 mars, les intervenants présenterons la fiducie de données comme un modèle pertinent à mobiliser pour faire converger les intérêts de divers intervenants.

Source: Site du projet Littérature québécoise mobile (LQM)

Cette séance donne suite à celle organisée l‘an dernier, qui est également disponible dans mon carnet de recherche, sur le thème «Droit et libre accès» (il y a une logique dans ces séances : je m’intéresse au droit et je décortique un nouvel éléments pertinent des humanités numériques à chaque année).

Plan de la présentation

  • Droit d’auteur
  • Corpus
    • Sources protégées par droit d’auteur
    • Données (talent, jugement, effort dans la sélection et l’arrangement)
  • Corpus et droit d’auteur : éléments de corpus ; cycle de vie de la communication savante

La vidéo sera imbriquée dans ce billet dès que possible