Commerce et Compagnies Droit d'auteur Grande Bretagne Rapport et étude Vie privée et anonymat

Étude sur les contrats d’utilisation des IA génératives

Le centre Create de l’Université de Glascow propose une nouvelle étude (white paper) qui pose un regard sur les contrats d’utilisation des outils de l’intelligence artificielle générative, déposée le 24 mai dernier dans l’archive Zenodo sous le titre Private Ordering and Generative AI: What Can We Learn From Model Terms and Conditions? Voici le résumé d’origine:

Large or “foundation” models, sometimes also described as General Purpose Artificial Intelligence (GPAI), are now being widely used to generate not just text and images but also video, games, music and code from prompts or other inputs. Although this “generative AI” revolution is clearly driving new opportunities for innovation and creativity,  it is also enabling easy and rapid dissemination of harmful speech such as deepfakes, hate speech and disinformation, as well as potentially infringing existing laws such as copyright and privacy. Much attention has been paid recently to how we can draft bespoke legislation to control these risks and harms, notably in the EU, US and China, as well as considering how existing laws can be tweaked or supplemented. However private ordering by generative AI providers, via user contracts, licenses, privacy policies and more fuzzy materials such as acceptable use guidelines or “principles”, has so far attracted less attention.  Yet across the globe, and pending the coming into force of new rules in a number of countries, T&C may be the most pertinent form of governance out there.

Drawing on the extensive history of study of the terms and conditions (T&C) and privacy policies of social media companies, this  paper reports the results of pilot empirical work conducted in January-March 2023, in which  T&C were mapped across a representative sample of generative AI providers as well as some downstream deployers. Our study looked at providers of multiple modes of output (text, image, etc), small and large sizes, and varying countries of origin. Although the study looked at terms relating to a wide range of issues including content restrictions and moderation, dispute resolution and consumer liability, the focus here is on copyright and data protection. Our early  findings indicate the emergence of a “platformisation paradigm”, in which providers of generative AI attempt to position themselves as neutral intermediaries similarly to search and social media platforms, but without the governance increasingly imposed on these actors, and in contradistinction to their function as content generators rather than mere hosts for third party content. This study  concludes that in light of these findings, new laws being drafted to rein in the power of “big tech” must be reconsidered carefully, if the imbalance of power between users and platforms in the social media era, only now being combatted, is not to be repeated via the private ordering of the providers of generative AI.

Source: Create (UK)

Le document d’une trentaine de pages propose deux tableau synthèse pour les questions de droit d’auteur et de vie privée / renseignements personnels des contrats d’utilisation de treize systèmes d’IA générative. Voici les champs de ces tableaux:

Analysis of copyright clauses

  • Who owns the copyright over the outputs and (if any indication is found) over the inputs?
  • If a copyright infringement is committed, who is responsible?
  • Is there any procedure in force to avoid or at least minimise the risk of copyright infringement?

Analysis of privacy policies

  • Mention CCPA rights (California), EU or UK GDPR?
  • Mention rights other than erasure explicitly, and do they give a form to claim your rights?
  • Offer an email address to claim DP rights?

J’apprécie beaucoup des efforts de ce centre de recherche en droit britannique.

Lettres Résumé Standards

Fabuleux manuel libre sur LaTeX, merci Éric Guichard

Un jour, avant mon trépas je l’espère, j’aurai le loisir de produire et diffuser un texte savoureux, fabuleux, où l’on sent le dévouement et la passion de l’auteur. Un texte qui vient du coeur mais qui existe (persiste!) pour la lectrice. Un don de soi… merci Éric Guichard de me donner cet exemple d’ouvrage qui enrichit notre expérience collective !

Je vous invite chaleureusement à télécharger l’incontournable LaTeX pour littéraires, éditeurs et designers: version 2024 (FR, 25 Mo, 114 pages, CC-NC-SA).

Je n’ai jamais autant voulu encoder un document (en passant, je crie vivement le TEI!) puis le mettre en bonne et due forme.

Malvoyant Revendication

Néologisme: la verbalisation des données

Je reçois beaucoup de courriels pour des colloques, congrès, communications savantes. Parfois, celles-ci proposent des images pour atirer l’attention du scientifique distrait: portrait des personnes intervenantes, des logos de labos ou d’universités, voire du texte… qui n’est pas réellement du texte, mais des pixels que mon cerveau peut interpréter comme du texte. Les pires sont les images haute résolution de plus d’un méga-octet, comme si nous avons tous un ordinateur avec écran haute résolution connecté à Internet par débit de données haute vitesse… et surtout au moins un oeil qui puisse capter et interpréter ces images, décoder les éléments, y entrevoir du texte. Il s’agit bien de la majorité d’entre nous, mais pas tous.

Il y a deux groupes qui n’ont pas ces loisirs: les malvoyants et les machines.

Selon le Petit Robert, « verbaliser » désigne soit « dresser un procès verbal » (pour un policier, donner une contravention), soit « exprimer, extérioriser au moyen du langage » une émotion. Si l’on se fie aux blogue Data Nudge, il y aurait maintenant un 3e sens possible, celui d’exprimer en mots une image.

Car, beaucoup d’efforts sont portés pour transformer les données en images. Dans ce cas, il est question de la visualisation de données, soit de mettre une idée ou un sujet en images. La verbalisation serait son corrolaire: une fois la représantation des données en image faite, il faut ensuite la verbaliser pour les malvoyants et les liseuses numériques.

L’enjeu est l’accessibilité du web pour les malvoyants et autres truchements automatiques tels que les lecteurs audio de contenu numérique. Concrètement, il s’agit de renseigner la balise « alt text » d’une Image en HTML pour la rendre lisible… aux machines qui lisent pour les humains.

Il s’agit d’une idée importante pour l’accessibilité du web, celle de verbaliser ses images, surtout si celles-ci représentent des éléments picturaux qui ne sont pas lisibles par la machine. Je suis coupable de ne pas toujours prendre la peine de verbaliser les images que j’utilise dans ce carnet numérique. Pour savoir désigner un problème, toujours faut-il le nommer convenablement.

Une image vaut bien mille mots, après tout. Et, vice versa. Verbalisons nos images, pour le bien de tous.

Olivier Charbonneau

Culture libre.ca est le fruit des efforts de recherche d'Olivier Charbonneau, bibliothécaire titulaire et chercheur à l'Université Concordia. Cliquez ici pour accéder directement à une brève note biographique.

Twitter