Europe

Commerce et Compagnies Droit d'auteur Grande Bretagne Rapport et étude Vie privée et anonymat

Étude sur les contrats d’utilisation des IA génératives

Le centre Create de l’Université de Glascow propose une nouvelle étude (white paper) qui pose un regard sur les contrats d’utilisation des outils de l’intelligence artificielle générative, déposée le 24 mai dernier dans l’archive Zenodo sous le titre Private Ordering and Generative AI: What Can We Learn From Model Terms and Conditions? Voici le résumé d’origine:

Large or “foundation” models, sometimes also described as General Purpose Artificial Intelligence (GPAI), are now being widely used to generate not just text and images but also video, games, music and code from prompts or other inputs. Although this “generative AI” revolution is clearly driving new opportunities for innovation and creativity,  it is also enabling easy and rapid dissemination of harmful speech such as deepfakes, hate speech and disinformation, as well as potentially infringing existing laws such as copyright and privacy. Much attention has been paid recently to how we can draft bespoke legislation to control these risks and harms, notably in the EU, US and China, as well as considering how existing laws can be tweaked or supplemented. However private ordering by generative AI providers, via user contracts, licenses, privacy policies and more fuzzy materials such as acceptable use guidelines or “principles”, has so far attracted less attention.  Yet across the globe, and pending the coming into force of new rules in a number of countries, T&C may be the most pertinent form of governance out there.

Drawing on the extensive history of study of the terms and conditions (T&C) and privacy policies of social media companies, this  paper reports the results of pilot empirical work conducted in January-March 2023, in which  T&C were mapped across a representative sample of generative AI providers as well as some downstream deployers. Our study looked at providers of multiple modes of output (text, image, etc), small and large sizes, and varying countries of origin. Although the study looked at terms relating to a wide range of issues including content restrictions and moderation, dispute resolution and consumer liability, the focus here is on copyright and data protection. Our early  findings indicate the emergence of a “platformisation paradigm”, in which providers of generative AI attempt to position themselves as neutral intermediaries similarly to search and social media platforms, but without the governance increasingly imposed on these actors, and in contradistinction to their function as content generators rather than mere hosts for third party content. This study  concludes that in light of these findings, new laws being drafted to rein in the power of “big tech” must be reconsidered carefully, if the imbalance of power between users and platforms in the social media era, only now being combatted, is not to be repeated via the private ordering of the providers of generative AI.

Source: Create (UK)

Le document d’une trentaine de pages propose deux tableau synthèse pour les questions de droit d’auteur et de vie privée / renseignements personnels des contrats d’utilisation de treize systèmes d’IA générative. Voici les champs de ces tableaux:

Analysis of copyright clauses

  • Who owns the copyright over the outputs and (if any indication is found) over the inputs?
  • If a copyright infringement is committed, who is responsible?
  • Is there any procedure in force to avoid or at least minimise the risk of copyright infringement?

Analysis of privacy policies

  • Mention CCPA rights (California), EU or UK GDPR?
  • Mention rights other than erasure explicitly, and do they give a form to claim your rights?
  • Offer an email address to claim DP rights?

J’apprécie beaucoup des efforts de ce centre de recherche en droit britannique.

Conférence Diversité culturelle France Québec

Questions juridiques de l’IA pour la découvrabilité des contenus artistiques et culturels

Ce texte est un brouillon :: veuillez excuser les imprécisions ou les fautes éventuelles…

Selon l’Office québécois de la langue française, la découvrabilité est un néologisme qui désigne:

Potentiel pour un contenu, disponible en ligne, d’être aisément découvert par des internautes dans le cyberespace, notamment par ceux qui ne cherchaient pas précisément le contenu en question.

La question est d’une importance capitale pour assurer une visibilité minimale aux créatrices et créateurs d’ici, surtout dans un contexte de domination des grandes plateformes internationales qui carburent à la popularité propulsée par des algorithmes. Voici quelques éléments juridiques pour en saisir les contours, à l’attention des personnes inscrites au MOOC sur la décourabilité des contenus francopghones (disponible sur la plateforme FunMOOC).

Pour dire les chose d’amblée: je privilégie une approche théorique pluraliste, plutôt que naturaliste ou positiviste, pour saisir l’impact du numérique sur le droit d’auteur. Il s’agit de ces idées que j’ai mobilisé pour le projet Savoir commun du cinéma de la Cinémathèque Québécoise, notamment sa politique d’ouverture de données.

0. De quoi se nourrit un algorithme?

L’intelligence artificielle, qu’elle soit générative ou prédictive, mobilise des algorithmes. Selon Alain Turing (Longo 2018), ceux-ci se construisent à partir de quatre éléments essentiels: (1) un corpus source constitué de données, documents et corpus ; (2) des fonctions statistiques ou informatiques; (3) des paramêtres pour ces fonctions; et (4) un format de sortie. Donc, sans les corpus au sein de nos organisations artistiques ou culturelles, l’IA ne peut pas faire son travail convenablement.

1. La mise à disposition dans Internet sous le prisme du droit d’auteur

Le Canada a ratifié les « traités Internet » de l’OMPI datant de la fin du 20e siècle en 2012. Nommée droit de mise à disposition par Internet constitue un nouveau droit de propriété conféré aux titulaires du droit d’auteur, il fut édicté en tant qu’exécution en public. Il est primordial de comprendre l’impact de ce choix: maintenant, l’art et les livres numériques se comportent comme un signal radio. Les marchés économiques sont donc bouleversés, jadis des artefacts minutieusement publiés ou reproduits, les oeuvres sont mobilisés par des effets réseaux sur des plateformes étrangères. Cette nuance juridique induit un changement de la nature même de l’oeuvre protégée.

1.1. De nouveaux objets sous l’égide du droit d’auteur

L’oeuvre (un livre, une peinture, les paroles d’une chançon, etc.) est l’objet principal du droit d’auteur. Outre le changement de sa nature (voir point précédent), le droit d’auteur canadien doit maintenant gouverner deux classes nouvelles: les métadonnées et les corpus. Les métadonnées sont les information descriptives, administratives et techniques sur une oeuvre. Un corpus est un concept plus vaste et désigne l’ensemble d’un fonds, d’une collection ou d’un inventaire. En droit d’auteur, le concept pertinent est la compilation. Les corpus et les métadonnées sont des objets ésotériques en droit d’auteur mais constituent la pierre angulaire de l’univers numérique. Les concepts d’originalité et de droit moral, si importantes dans la doxa du droit d’auteur, se perdent dans les détails. C’est la juxtaposition des oeuvrtes qui compte.

1.2 Dépouillement du contrat sur le numérique

Les grandes plateformes numériques jonglent avec des modulations de la licence en droit d’auteur: la licence non-exclusive. Je peux verser la même photo d’un chaton sur plusieurs réseaux sociaux, chacun m’impose une license non-exclusive, mondiale, gratuite, perpétuelle et transférable. Ce genre de pratique commerciale était impenseable jadis. Aujourd’hui, nous l’acceptons sans réfléchir. Par ailleurs, la valeur des renseignements personnels des personnes qui intéragissent avec l’oeuvre ont maintenant plus de valeur que les droits sur l’oeuvre numérique: c’est la juxtaposition de l’oeuvre avec sa lectrice qui compte.

2. Cadre de gouvernance juridique du numérique

Pour saisir les opportunités du numérique, une approche nouvelle est nécessaire.

2.1 Un chantier juridique pour la transformation numérique

Le chantier juridique constitue une étape de validation pour articuler les approches souhaitées aux situations complexes en droit. Il s’agit d’un exercice qui peut s’étaler sur plusieurs années autour des oeuvres, métadonnées et corpus visés, en lien avec les communautés actives dans un projet. L’idée de base est d’anticiper le cycle de vie complet de l’interaction entre les objets de droits (oeuvres, métadonnées, corpus) et les sujets de droits (personnes, plateformes, organisations).

Les phases pertinentes sont:

  • Un inventaire des « classes documentaires (œuvres) » (collections / corpus / etc.) en fonction de leur statut juridique;
  • Un inventaire des « contextes d’utilisation » (services documentaires) des collections;
  • Une synthèse des considérations juridiques des conditions d’acquisition des documents; puis
  • La production d’une matrice œuvres-utilisation;
  • L’élaboration d’une politique et de quelques procédures sur le droit d’auteur, qui doivent «cheminer» aux bonnes instances .

Exemple: le projet des Savoirs communs du cinéma de la Cinémathèque Québécoise.

2.2 Des politiques, procédures et contrats

Suite aux analyses et recensements du chantier juridique, il convient de revisiter toutes les politiques, procédures et contrats types employés par l’organisation pour mettre en place le nouveau cadre de gouvernance souhaité.

Schéma synthèse des choix juridiques à valider lors du chantier:

Grande Bretagne Livre et édition Pétition Revendication

Campagne britannique pour investiguer les pratiques commerciales du secteur de l’édition académique

Une des réalités de l’édition numérique concerne l’émergence de nouvelles pratiques commerciales en lien avec le droit d’auteur. Le législateur canadien a enchâssé, avec la réforme de 2012, le droit de mise à disposition par internet dans le régime général de la communication par télécommunication plutôt que celui de la publication. Cette subtilité, que seuls les observateurs aguerris du droit d’auteur semblent avoir décelé, introduit des nouveaux moyens de vendre des livrels.

Spécifiquement, publier un livre n’est plus l’équivalent de lancer un livrel. La publication, qui est reconnue comme un mécanisme précis en droit d’auteur, implique le dépôt légal et ouvre la voie aux mécanismes de financement au profit d’auteurs et d’éditeurs par diverses agences de l’état. Celui de la diffusion par internet du même objet de droit, le livre, mobilise des réalités juridiques bien différentes.

Par exemple, et ceci surprend toujours les membres des communautés pour lesquelles je prodigue mon service professionnel, il est difficile pour une éditrice (ou un diffuseur, ou une libraire) d’exclure une bibliothèque de se procurer une copie d’un livre. Ceux-ci sont en vente libre selon les marchés ouverts. Tel n’est pas le cas des livrels numériques, même s’ils sont des versions homéostatiques.

Oui, dans la chaîne du livre, tous les intervenants peuvent bloquer une bibliothèque d’acquérir un livrel.

En ce qui concerne ma pratique professionnelle, je dois expliquer aux étudiant.e.s, profeseur.e.s, doyen.ne.s et autres membres de la communauté universitaire que les éditeurs académiques m’interdisent l’accès aux versions numériques des manuels scolaires (textbooks) choisis par les profs.Ces manuels sont maintenant des services informatiques, protégés par mot de passe, et n’ont de « livre » que le nom. Si l’expérience de lecture est bonifiée pour l’étudiant par des paratextes qui facilite l’enseignement, ce monde numérique n’est pas ouvert aux acquisitions par les institutions. C’est pourquoi je dois expliquer, encore et encore, dans ces temps de confinement, que je suis incapable de procurer des copies numériques de manuels scolaires pour les étudiant.e.s de l’école de gestion… parce que les éditeurs ne les offrent pas en vente libre.

On pourrait se désolé de cette situation. Personnellement, ce n’est pas mon approche. Il s’agit d’une excellente opportunité de souligner que les choix des professeurs quant à l’élaboration des activités complémentaires de leurs cours (comme la lecture d’un manuel numérique ou etextbook) introduit des conséquences monétaires desquelles ils et elles sont redevables.

C’est pourquoi votre humble bibliothéconomiste appui la demande des collègues britanniques de procéder à une réflexion critique des mesures et moyens de diffusion de la littérature académique: https://academicebookinvestigation.org/

Après les articles savants, les manuels pédagogiques? Le libre accès se positionne comme une hypothèse de travail pour mettre en lumière les lacunes et prioriser les zones d’ombres des marchés numériques. Dans un contexte de transformation numérique, que certains appellent la redocumentation (Salaün), l’analyse téléologique des modalités d’affaires contemporaines impose de réfléchir aux lectrices autant qu’aux autrisses.

Parce que vendre des livres n’est pas la même chose que de bâtir de riches expériences de lecture. L’enjeux est tout aussi subtil que crucial. Il concerne tous les intervenants, sans quoi, comment pouvons-nous prétendre à avoir une culture viable, durable et évolutive? Comment harmoniser et mettre à profit les levies étatiques, organisationnels et communautaires en vue d’une appropriation des moyens numériques nouveaux? Comment le droit d’auteur s’insère-t-il dans l’équation culturelle?

Il s’agit de questions qui m’animent depuis longtemps. À ce sujet, je vise à faire converser la théorie néolibérale de Hayek avec les communs de Hess et Ostrom; à moduler une téléologie numérique avec les thèses d’Alan Turing et des travaux sur le cybernétisme féministe de Donna Haraway, protocoles autochtones de Jason Lewis et de son équipe, sans oublier les approches vidéoludiques.

Avocat CultureLibre.ca Droits des citoyens France

Lecture de « petite poucette » de Michel Serres 2012 (mais lecture de la réédition de 2017)

En passant par ma bibliothèque municipale, je suis tombé sur la réédition de 2017 chez Éditions de Noyelle / France Loisir du livre Petite Poucette [initialement chez Le Pommier en 2012] du philosophe et professeur à Standford University, Michel Serres. Une lecture rapide mais exigeante explorant les mutations qu’ont pu vivres les jeunes à travers les yeux perçants de quelqu’un au long parcours.

L’auteur divise son oeuvre en trois: la première partie présente ce que peut vivre Petite Poucette et comment cela façonne sa perception de la réalité. Ensuite, l’auteur expose comment cette perception s’applique à l’école, surtout lorsque l’on peut retrouver toute information à la pointe des doigts – dans ce cas-ci, on peut réellement parler d’information digitale. La dernière partie traite de la société au sens large et c’est là que j’ai déniché des perles…

Un des thèmes proposé par Serres concerne le renversement de la présomption d’incompétence, intertitre d’une section de sa troisième partie sur la société:

Utilisant la vieille présomption d’incompétence, de grandes machines publiques ou privées, bureaucratie, médias, publicité, technocratie, entreprises, politique, universités, administrations, science même quelquefois…, imposent leur puissance géante en s’adressant à des imbéciles supposés, nommés grand public, méprisés par les chaînes à spectacle. En compagnie de semblables qu’ils supposent compétents, et, de plus, pas si sûr d’eux-mêmes, les Petits Poucets, anonymes, annoncent, leur voix diffuse, que ces dinosaures, qui prennent d’autant plus de volume qu’ils sont en voie d’extinction, ignorent l’émergence de nouvelles compétences. Que voici (p. 66)

Soulignant maintenant l’émergence de voix, de brouhaha collectifs par le biais de médias sociaux, Serres recentre le rôle du Petit Poucet par rapport à l’expert, être voué à disparaître:

Le collectif, dont le caractère virtuel se cachait, peureux, sous la mort monumentale, laisse la place au connectif, virtuel vraiment. (p. 67)

Relatant son parcours personnel, jadis épistémologue (qui « étudie les méthodes et les résultats de science), Serres précise:

Alors que je ne prétends plus à cette discipline, tout le monde aujourd’hui devient épistémologue. Il y a présomption de compétence. Ne riez pas, dit Petite Poucette: quand ladite démocratie donna le droit de vote à tous, elle dut le faire contre ceux qui criaient au scandale qu’on le donnât, de manière équivalente, aux sages et aux fous, aux ignorants et aux instruits. Le même argument revient. (p. 67-8)

Que sont devenues les institutions de jadis?

Pour la première fois sans doute de l’histoire, le public, les individus, les personnes, le passant appelé naguère vulgaire, bref Petite Poucette, pourront et peuvent détenir au moins autant de sagesse, de science, d’information, de capacité de décision que les dinosaures en question, dont nous servons encore, esclaves soumis, la voracité en énergie et l’avarice en production. […] Voilà pourquoi ce livre titre: Petite Poucette. Il touche aussi les cultures, puisque la Toile favorise la multiplicité des expressions et, bientôt, la traduction automatique, alors que nous sortons à peine d’une ère où la domination géante d’une seule langue avait unifié dires et pensées dans la médiocrité, en stérilisant l’innovation. (p. 68-9)

Serres note une complexification croissante de la société.

Or, je le répète, l’histoire des sciences connaît le décrochement qui s’ensuit de ce type de croissance. Lorsque l’ancien modèle de Ptolémée eut accumulé des dizaines d’épicycles qui rendaient illisible et compliqué le mouvement des astres, il fallut changer la figure : on déplaça vers le soleil le centre du système et tout redevint limpide. Sans doute, le code écrit d’Hammourabi mit fin à des difficultés sociojuridiques tenant au droit aural. Nos complexités viennent d’une crise de l’écrit. Les lois se multiplient, enfle le Journal officiel. La page se trouve à bout de course. Il faut changer. L’informatique permet se relais. (p. 72)

Faisant l’éloge de la « vitesse électronique » (p. 72), Serres poursuit:

Que la complexité ne disparaisse pas ! Elle croît et croîtra parce que chacun profite du comfort et de la liberté qu’elle procure ; elle caractérise la démocratie. Pour réduire le coût, il suffit de le vouloir. Quelques ingénieurs peuvent résoudre ce problème en passant au paradigme informatique, dont la capacité conserve et même laisse croître le simplexe, mais le parcourt vite, supprime donc, je le répète, files ou bouchons et gomme les chocs. (p. 72-3)

Par files et bouchons, Serres fait référence aux files des guichets de services et les bouchons de circulation. Il introduit à ce stade-ci un concept central de la thèse du livre, celui de l’importance des données:

Petite Poucette – individu, client, citoyen – laissera-t-elle indéfiniment l’État, les banques, les grands magasins… s’approprier ses données propres, d’autant qu’elles deviennent aujourd’hui source de richesse ? Voilà un problème politique, moral et juridique dont les solutions transforment notre horizon historique et culturel. Il peut en résulter un regroupement des partages socio-politiques par l’avènement d’un cinquième pouvoir, celui des données, indépendant des quatre autres, législatif, exécutif, judiciaire et médiatique. (p 73)

Ce dernier passage est particulièrement inspirant. D’ailleurs, les pages qui suivent sont d’une richesse inouïe, qui versent dans la théorie cybernétique sans la nommer. Serres revisite la distinction, classique en France et ailleurs, entre les disciplines intellectuelles, racines d’innombrables structures socioéconomiques. Ainsi, il explore la distinction entre celles-ci: « lettres, sciences, droit et médecine-pharmacie » (p. 74) où la première « chantaient l’égo, le je personnel, l’humain de Montaigne, ainsi que le nous des historiens, linguistes et sociologues » tandis que les secondes « énonçaient des lois générales, voire universelles » – mais le droit et la médecine sont d’un autre ordre:

Mis tous deux en tiers, la médecine et le droit accédaient ensemble, peut-être sans le comprendre, à une manière de connaître qu’ignoraient les sciences et les lettres. Unissant le général et le particulier, naquit, dans ces facultés juridiques et médicales, un tiers sujet… l’un des ancêtres de Petite Poucette. (p. 74)

La capacité de Petite Poucette à manipuler ses bidules et « maîtriser des pouces boutons, jeux et moteurs de recherche » (p. 75-6),

[Petite Poucette] déploie sans hésitation un champ cognitif qu’une part de la culture antérieure, celle des sciences et des lettres, a longtemps laissé en jachère, que l’on peut nommer «procédural». […] En passe de concurrencer l’abstrait de la géométrie aussi bien que le descriptif des sciences sans mathématiques, ces procédures pénètrent aujourd’hui le savoir et les techniques. Elles forment la pensée algorithmique. (p. 76)

De plus,

L’objectif, le collectif, le technologique, l’organisationnel… se soumettent plus, aujourd’hui, à ce cognitif algorithmique ou procédural qu’aux abstractions déclaratives que, nourries aux sciences et aux lettres, la philosophie consacre depuis plus de deux millénaires. (p. 77)

En effet, cette émergence de de l’algorithme ou de la procédure n’a rien de nouveau. Serres invoque les travaux de Pascal et Leibniz pour souligner son origine :

Formidable mais alors discrète, cette révolution passa inaperçue des philosophes, nourris aux sciences et aux lettres. Entre formalité géométrique – les sciences – et la réalité personnelle – les lettres – advenait, dès cette époque, une nouvelle cognition des hommes et des choses, déjà prévue dans l’exercice de la médecine t du droit, tous deux soucieux de réunir juridiction et jurisprudence, malade et maladie, universel et particulier. Émergeait là notre nouveauté. (p. 77-8)

Et c’est là que la thèse de Serres déploie tout sons sens pour mes recherches: « La nouvelle victoire de ces vieilles procédures vient de ce que l’algorithmique et le procédural s’appuient sur des codes » (p. 78). Justement, le code persiste dans les vieilles disciplines (droit, médecine, pharmacie) et les nouvelles (biochimie, théorie de l’information, nouvelles technologies) car elles « s’en emparent, et, de là, le généralisent au savoir et à l’action en général. » (p. 78)

Jadis et naguère, le vulgaire n’entendait goutte aux codes juridiques, ni à ceux des médicaments ; ouvert ou fermé, leur écriture pourtant affichée ne restait lisible qu’aux doctes. Un code ressemblait à une pièce à deux côtés, poli ou face, contradictoires : accessible et secret. Nous vivons depuis peu dansla civilisation de l’accès. Le correspondant linguistique et cognitif de cette culture y devient le code, qui le permet ou l’interdit. Or justement le code institut un ensemble de correspondances entre deux systèmes à traduire l’un dans l’autre, il possède les deux faces dont nous avons besoin dans la circulation libre des flux dont je viens de décrire la nouveauté. Il suffit de codes pour préserver l’anonymat en laissant libre l’accès. (p. 79)

Serre propose, par exemple, l’ADN comme exemple de ce code qui est à la fois ouvert et fermé.

Médecine et droit nourrissaient depuis longtemps cette idée de l’homme comme code. Le savoir et les pratiques la confirment aujourd’hui, dont les méthodes utilisent procédures et algorithmes ; le code fait naître un nouvel ego. Personnel, intime, secret ? Oui. Générique, public publiable ? Mieux, les deux: double, je l’ai déjà dit du pseudonyme. (p.80)

Je ne peux m’empêcher que je m’insère directement dans cette veine : ce carnet de recherche, ce billet, ma démarche témoigne  de ma démarche intellectuelle, un fragment public de mes intérêts secrets.

Entre données et algorithme (ou procédure) naît Petite Poucette et ce paradigme nouveau pour redéfinir ce simplex de la société que l’on ne sait pas encore observer. Serres a su mettre en mots et faire l’éloquente dissection, dans Petite Poucette, de ce qui anime mon programme intellectuel depuis le début de ma carrière. Qui sera ce Ptolémée contemporain qui ajustera la doctrine pour enfin apercevoir le chemin tracé vers l’avenir ?

Critique France Internet Livre et édition

Mon ami Sartre

Il me restait quelques moments avant de terminer ma journée, quelques minutes tout au plus, juste assez pour repasser les missives reçues par courriel pour m’assurer que je n’ai pas complètement négligé ma correspondance. Et je suis tombé sur ce message, sans mots autre qu’un hyperlien, de ma propre plume, à moi même.

Il s’agit du message parfait pour meubler ces instants où le soleil d’automne vacille vers le crépuscule. Le voici:

http://figura-concordia.nt2.ca/appel-raconter-linternet

Ah oui, il s’agit d’un appel de communication de mes collègues en littérature – un domaine que je considère comme prioritaire pour partager mes résultats de recherche en droit d’auteur numérique… dans l’appel, une phrase en particulier m’accroche, une référence directe à Jean-Paul Sartre:

Cette journée d’étude vise à réfléchir à la présence du numérique dans le roman et à ses implications sur l’imaginaire contemporain. Les interventions, que nous souhaitons fondées sur des études de cas, chercheront à émettre quelques hypothèses sur ce que « peut » la littérature, pour reprendre la célèbre formule de Sartre, lorsque confrontée aux effets sémiotiques ou rhétoriques des innombrables dispositifs, applications, réseaux et logiciels qui balisent désormais le quotidien.

Tiens, une célèbre formule de Sartre ? Quid… Mon le duo Google-Wikipedia me lancent sur la trace de l’essai Qu’est-ce que la littérature ? que je retrouve sous mes pieds (oui, oui, je travaille au 5e de ma bibliothèque universitaire et le livre est classé au 4e).

Il faut dire que le moment s’est envolé et j’ai réellement manqué mon train… assis sur ma chaise, je savoure cette édition ancienne, éphémère, où chaque page semble sur le point de se sublimer en nuage de poussière !

Je trouve beaucoup de perles, fragments de pensées attrapées par butinage paresseux. Je saute à la section « Pour qui écrit-on ? » de l’essai en question et je découvre ces mots, à la page 128-9:

L’écrivain consomme et ne produit pas, même s’il a décidé de servir par la plume les intérêts de la communauté. Ses oeuvres restent gratuites, donc inestimables ; leur valeur marchande est arbitrairement fixée. […] Au fond on ne paie pas l’écrivain : on le nourrit, bien ou mal selon les époques. Il ne peut en aller différemment, car son activité est inutile : il n’est pas du tout utile, il est parfois nuisible que la société prenne conscience d’elle-même. Car précisément l’utile se définit dans les cadres d’une société constituée et par rapport à des institutions, des valeurs et des fins déjà fixées.

Je viens de trouver ma lecture de chevet pour les prochaines semaines…

Communautés Conférence France Histoire et sciences sociales Lettres Montréal

Pistes pour se lancer dans le réseau

Je profite de l’École thématique CNRS sur l’Analyse de réseaux et complexité, pour partager quelques pistes intéressantes pour se « lancer dans le réseau » ou, les moyens pour s’engager dans ce domaine intellectuel:

N’hésites pas à ajouter des pistes supplémentaires dans les commentaires de ce billet ou contactez-moi pour que je puisse renseigner cette liste.

Un grand merci à Guillaume Favre du LISST à Toulouse pour le partage.
Conférence France

Analyse réseaux complexes — Jour 5

J’ai l’énorme privilège de participer à l’École thématique CNRS sur l’Analyse de réseaux et complexité.

L’émergence des collectifs à partir des réseaux – Michel Grossetti

Objectifs: formalisation et application

Travaille sur un vocabulaire/ontologie

Entité

  • Personne : tout humain vivant; les autres entités (animaux…) sont des ressources
  • Ressources de coordination: sont impliquées dans les interactions entre les personnes
  • Processus d’émergence (découplage) ou de dissolution (encastrement) des entités relativement à ce qui les constitue ou ce qu’elles contribuent à constituer
    • Artistes encastrées dans un collectif (Beatles ensemble)
    • Découplage – they split up
  • Processus:
    • Activité
    • Action
    • Interaction – créé son propre contexte
    • Processus est une construction analytique regroupant des activités considérées comme liées entre elles
  • Collectifs et réseaux: composés de personnes et de ressources
    • Collectif: ensemble de personnes partageant des ressources (contraintes/enjeux). Construction analytique (collectif analytique)
    • Lorsque certaines des ressources produisent des coordinations spécifiques à l’ensemble concerné, un processus de découplage (d’émergence) s’enclenche. Au delà d’un certain niveau de découplage, un  collectif devient un collectif explicite
    • Analogue à « groupeÉ ; « classe sociale » ; « organisation
  • Sphères d’activité et institutions
    • sphère d’activité: implique un ensemble donné de ressources
    • Comme les collectifs, certaines sphères d’activités sont explicites, institutionnalisés. Elles regroupent de nombreuses ressources spécialisés. D’autres sont seulement analytiques
    • Les ressources de coordination spécifiques à une sphère ……

Processus d’émergence et de collectifs

3 scénarios

  1. Polarisation externe
    1. (Classes sociales de Marx)
    2. Théorie des marchés de Harrison White: phase 2: équivalence structurelle  où chaque firme contracte avec chaque client d’un marché; le marché comme ensemble d’entreprises s’ajustant collectivement aux clients, comme des bancs de poisson – équivalence structurelle – revues spécialisées;
  2. Densification
    1. Mullins, Howard Benker, etc.
    2. Étape 1: réseau relativement ouvert, peu dense; Étape 2: groupement par densification des liens par des associations professionnelles ou industrielles, revues, etc. ; Étape 3: émergence de collectif par fragmentation de collectifs existants, sous-disciplines, spécialisation, voir polarisation interne: Mulkay et Edge, Andrew Abbott.
  3. Fragmentation
    1. Andrew Abbott. Ce dernier propose 3 types de fragmentation dans Chaos of disciplines, 2001: fragmentation simple, fractale, fractale avec reformulation

Entrepreneur de collectif: personnes ayant projets relativement au collectif

Émergence: permet d’aller au delà du binaire (existe/n’existe pas) pour un continuum de situations intermédiaires, ce qui est nécessaire pour étudier la constitution de collectifs; permet de mieux cerner les dynamiques; demanderait à être mieux précisée et équipée de critères empiriques

Modèles multi-agents et simulation – Paola Tubaro

Comment la structure des réseaux sociaux affecte-t-elle le travail d’équipe sur mars? ; Manzo et al. (2018) – la diffusion inégale d’innovation techniques – appartenance religieuse ; Casilli et al 2014 anorexie en-ligne ; … beaucoup d’autres exemples

Principes de fond

  • On regarde les interactions sociales ; on s’intéresse aux propriétés émergentes ( c-a-d résultant des interactions) et, éventuellement, usage de simulation informatiques en l’absence de solutions analytiques (Axelrod & Tesfatsion 2006)
  • « Générer des histoires » (Tesfatsion 2006), commerncer par des postulats concernant les agents et leurs interactions; puis, simuler les comportements d’un système où ces postulats s’appliquent; observer les conséquences dynamiques de ces postulats; produire des « expériences » …

Manzo, 2014b: usages des modèles multi-agents ; voir aussi Epstein 2006

Logiciels:

  • Netlogo
  • RNetlogo (Thiele et al, 2014)
  • GAMA = dponnées spatiales
  • OpenMole pour explorer les modèles

Visualisations de réseaux par matrices d’adjacence et représentations hybrides – Jean-Daniel Fekete

Logiciel de visualisation généalogique: http://aviz.fr/~fekete

Viz: Card & Mackinlay & Shneiderman: Readings in information 1999

Où se place la viz dans la chaîne scientifique? À quel endroit la positionner dans la structure épistémo-herméneutique / cadre théorique et conceptuel… ?

  • 1. Théorie/loi en haut => 2. modèle => 3. statistiques descriptives => 4. faits ou mesures
  • Entre modèle et statistiques descriptives: accommodement pour contradictions; « fits » ; Induces
  • La visualisation se situe au niveau des données statistiques

Prof. Fekete positionne la visualisation de données au niveau des statistiques descriptives

Visual Patterns, logiciel NodeTrix : https://github.com/IRT-SystemX/nodetrix

Réseaux dynamiques: Boyandin et al. 2012

Beaucoup d’exemples de visualisation dynamiques: Animation visuelle: Maray & Eades 2001 ; TempoViz ……………….

Visualizing Dynamic Networks with Matrix Cubes [CHI] aviz.fr/cubix

Interactive Visualizations for Dynamic and Multivariate Networks: vistorian.net

Analyse multiniveaux et réseaux – Emmanuel Lazega & Julien Brailly

Voir: Multilevel network analysis for the social sciences : theory, methods and applications / Emmanuel Lazega, Tom A.B. Snijders, editors.

Exemples:

  • système socio-sémantique (« éléments de connaissance » connectés à des « inventeurs »)
  • système socio-écologiques Bodin et al. 2016 Theorizing benefiits…
  • Système d’action multi-niveau Lazega 2007 Revue Française de sociologie aussi, Breiger 1974

Brailly 2016: dynamic networks of trade fairs, journal of economic geography

Europe des juges Dehousse, Forum de venise 2009

Multi-niveau et gestion des communs: gestion de l’eau en commun au Sénégal: Faye & Brailly

 

Table ronde : Analyse complexe et réseaux : quels enjeux interdisciplinaires ?

Conférence France

Analyse réseaux complexes — Jour 4

J’ai l’énorme privilège de participer à l’École thématique CNRS sur l’Analyse de réseaux et complexité.

Analyses longitudinales et réseaux – Claire Bidart

Ce matin, jeudi, j’ai pris 15 minutes de retard (juré!) car j’ai bouquiné au tabac du très sympathique village de Cargèse, il y avait une chouette sélection de bandes dessinées corses, alors j’ai manqué le début de la première session. En guise d’intermède, je vous balance la moitié de la 2e partie de ma thèse, où je traite du concept des réseaux du point de vue de la sociologie du droit. Pour lire l’ensemble de celle-ci, vous pouvez la télécharger depuis l’archive institutionnelle de l’Université de Montréal: Émergence de normes dans les systèmes économiques et sociaux d’oeuvres numériques protégées par droit d’auteur par Olivier Charbonneau 

Très intéressante interprétation de visualisations basées sur une variable temporelle, où l’on peut voir différents graphes selon les moments de la vie d’un.e jeune diplômé.e.

Modèle comparables : trajectoires France, Québec, Argentine // les liens perdus sont rapidement oubliés.

Compléter le longitudinal avec des entretiens, études qualitatives

Graphes attribués dynamiques – Yoann Pitarch

Approche méthodologique, à nous d’utiliser ces outils pour notre discipline.

Graphe attribué: en plus de la structure, dirigé ou non, les noeuds du graphe sont équipés d’attributs. Ces attributs sont numériques, ordinaux ou catégoriels.

Dynamiques: séquence de graphes. Les noeuds changent de valeur d’attribut et les liens évoluent entre les lieux.

Graphe attribué dynamique (GAD), comme: médias sociaux; Loisirs; bibliométrie; biologie….

Dans l’ensemble de l’analyse de réseaux, on fait de la fouille de graphes. Il y a deux sous-ensembles, qui se recoupent légèrement par certains aspects:

  • dynamiques, temporels, longitudinal: visualisation; détecter des communautés évolutives; évolution des indicateurs topologiques
  • ainsi que attribués et multivariés: extraction de motifs; détection de communautés homogènes
  • La présentation se situe à l’intersection de ces deux sous-ensembles.

Plan: Stocker et générer; Analyser: extraire des motifs caractéristiques, extraire communautés; visualiser

Gephi permet de visualiser et manipuler des GAD à travers le fichier .gexf

Stockage:

  • Mouvance NoSQL
  • Noe4j + langage d’interrogation Cypher (proche du SQL et SPARQL)
  • Possibilité d’attribuer les sommets et les relations
  • Mécanismes d’interrogation assez puissants mais sophistiqués
  • Bases de données orientées graphes
  • Problème de la modélisation du temps: les attributs deviennent des sommets; problème informatique difficilement résoluble

Générer les données

  • DANCer [Benyahia et al. 2016]

Extraire des données

  • Extraire des motifs dans les GAD: règles d’attribution [Agrawal et Srikant 1994], motifs séquentiels [A & S 1995], sous-graphes fréquents [Yan et Han 2002]

Analyser les motifs

  • Cohesive co-evolution patterns: Desmier et al. 2012
  • Motifs de déclenchement: Kayttoue et al. 2015 [what effects topological changes in dynamic graphs]
  • Vers la co-construction de nouveaux types de motifs et de nouvelles contraintes entre les SHS et les informaticiens
  • Détection des communautés: Bello et al. 2016 [community detection…]

Saisir le temps : les usages archéologiques de l’analyse de graphes – Clara Filet & Sébastien Plutniak

Sémantique de graphes archéologiques: Feugnet et al. 2017 [co-presence analysis and economic patterns…]

Mesures de (Dis)similarité: Mills et al. 2013 [transformation of social networks…]

Analyse des interactions temporelles avec les flots de liens (Matthieu Latapy)

http://complexnetworks.fr/
Pas réseau: interaction (événement à un moment donné) plutôt que relation entre des entités d’un réseau

Conférence France

Analyse réseaux complexes — Jour 3

J’ai l’énorme privilège de participer à l’École thématique CNRS sur l’Analyse de réseaux et complexité. Voici quelques notes.

Détecter des communautés scientifiques, à grande et petite échelle – Yves Gingras & Béatrice Milard

Yves Gingras & la grande échelle

Prof. Gingras propose un survol de ses résultats qui sont disponibles sur la plateforme DigitalHistoryOfScience.org pour le domaine économique. Il utilise des données bibliographiques pour représenter l’agglomération de diverses entités autour de disciplines. Ces entités peuvent être les auteurs ou certaines de leurs propriétés tels leur institution d’attachement, leur ville… Les liens sont surtout les co-auteurs d’articles, les citations.

Béatrice Milard & la petite échelle

À partir d’entretiens et d’un corpus de leurs publications internationales, prof. Milard vise à découvrir les entourages sociocognitifs et la structure des mondes scientifiques. Entre autres éléments, elle désire explorer les liens affectifs entre les auteurs des articles cités (connaissez-ils – car c’est surtout des hommes – ceux que vous citez).

Détecter les communautés disciplinaires et les ponts inter-disciplinaires – Pablo Jensen

Titre réel: Limites des communautés scientifiques

Quelle unité pour les systèmes complexes? « faire des patates » – de beaux réseaux avec des sommets en tailles variées. Qu’est-ce qui fait lien entre ses communautés? voir: Grauwin et al, JASIST (2012)

Atelier 1 – statistiques des réseaux

Hypothèse globale des statistiques: indépendance des observation

Hypo de la stat des réseaux: traquer la dépendance => on inverse l’hypo de base. Pauvreté des données (une seule vague de données), grandeur (nombre de dyades)

Avant les outils, 3 questions: que veut-on expliquer?; Quelles sont les variables explicatives  Variables indépendantes) c-a-d lien, attributs, les deux?; 3. réseauxdynamiques ou statiques

Outils statistiques

  • Analyse descriptives
    • mesures de centralité sur l’acteur => source de centralité
    • étude sur la structure globale => modèles de blocs ou blockmodels (voir première partie de la présentation)
  • Analyse explicatifs (stochastique) – c.f. QUANTITATIVE MODELING
    • étude de la variable performance selon les attributs des acteurs et leurs relations (modèles ALAAM)
    • Étude des effets d’attributs non structuraux sur l’existence d’un lien entre acteurs (modèles LRQAP) => voir 2e partie de la présentation (logistical regression)
    • Étude de la structure globale par un positionnement à l’échelle du voisinage relationnel (modèle ERGM)
  • Demain, autre atelier: modèle SCIENA: dynamique, mélange, le réseau est la variable

Avantage des modèles longitudinaux: on capte beaucoup de données et on décide ensuite les variables dépendantes ou indépendantes.

Blockmodeling et équivalence structurale

Mesure descriptive (de moins en moins présente) mais que le présentateur veut défendre

Simplifier et dégager les caractéristiques fondamentales des réseaux (un peu comme l’analyse factorielle)… enlever le bruit et de garder la structure essentielle

Sources du blockmodel

  • Lorrain & White : structural equivalence
  • White, Boorman, Breiger
  • R. Burt : positions in networks
  • Interprétation: Borgatti & Everett (1992) / Faust Wasseman (1992)

Logiciels

  • Pajek.imfm.sl/doku.php
  • Packages R
    • blockmodeling (un peu ancien
    • blockmodels (JB Leger)
    • Celui de pierre barbillon à Paris…
  • Blocks (Snijders)

L’équivalence structurale:

  • des noeuds ont la même position dans le réseau;
  • identifier des rôles sociaux, des groupes. Regrouper les acteurs en blocks (ou positions).
  • De Lorrain & White, 71
  • Exemple: deux individus ont les mêmes relations, mêmes amis et ennemies = ces noeuds sont équivalents
  • Simplification des noeuds par classe de participants homogènes; structurellement équivalents; mêmes flux de relations; fonctionne bien sur les réseaux dirigés mais peut s’appliquer au non-dirigé

2 notions (faust et wasserman) ppour sortir du paradigme de la dynamique du centre et de la périphérie

  • position
  • rôle

Exemple: Doreian et al. 2005 pour un salon de chaîne de télévision en Afrique

  • Ceux qui ont des relations « entre eux » permettent de distinguer les groupes entre eux
  • On représente ces relations « entre eux » par une boucle récursive entre les entités du réseau blockmodelisé
  • Un peu comme de « Analyse factorielle sur le clustering « 

Super pour faire émerger des domaines sémantiques dans un corpus de documents se citant en appliquant le « blockmodeling général » plutôt que la branche stochastique

Blockmodeling vs détection de communautés == pas utile pour détecter communautés

The Louvain algorithm

Deux types d’équivalence: voir Beaugritte 2011

Étapes: 1. Matrice d’adjacente; 2. permutation algorithmique; 3. matrice image

Batagelj 2002 == types de blocs

Interprétation du blockmodel, 3 possibilités (Faust & Wasserman 1992), aussi utilisé par Lazega en 2001 pour parler de niches sociales, positions denses

  1. Description des attributs des acteurs dans chaque block
  2. Description des positions (comment chacune des positions est reliée aux autres?), c-a-d est-ce que les block reçoivent ou envoient des liens
  3. Description de l’ensemble du blockmodel, description de sa structure

L’autre présentation de Julien

Trois trucs

  1. Tests statistiques simples: est-ce que mes données collent à un modèle? Par exemple, le tirage d’un dé est-il aléatoire? Hypothèse est oui. Est-ce que les observations sont significativement différentes d’un modèle => suivent la loi normale (ou non). On connaît déjà la loi/distribution que l’on veut utiliser (chi-2, student, poisson…)
  2. LRQAP test: on ne connaît pas la loi de probabilité – il faut « deviner » la loi de dépendance car on ne la connaît pas exactement
    1.  voir Krackardt 1987
      1. Modèle de régression logistique
      2. variable dyadique
      3. permutation des variables pour obtenir des coefficients de beta pour voir si on a un effet significatif
    2. on tente de créer de l’aléatoire pour dessiner la dépendance
Conférence France

Analyse réseaux complexes — Jour 2

J’ai l’énorme privilège de participer à l’École thématique CNRS sur l’Analyse de réseaux et complexité. Voici quelques notes.

Collecte de données – Marie-Pierre Bès; Guillaume Favre; Claire Lemercier

Guillaume Favre

Types de collecte: questionnaires sur les relations; questionnaires sociométriques; expérimentation; entretiens: narrations qualifiées; traces de pratique ou sources écries; observations: plus rare?

Exemples:

  • Héran (1988) sociologue français sur les égoréseaux
  • ISSP 1986, 2001, 2017 dans « social networks »
  • Panel ELLIPSS – capital social des individus
  • Grossetti (2005, 2007) dans social networks – avec générateurs de noms (champs pré-populés avec options de type à choix multiples)
  • American Global Social Survey de McPherson et al en 2006
    • Résultats controversés (Fisher 2009, Wang…….

Marie Pierre Bès

Classes d’informations ou de questionnaires ou d’approches théoriques

Claire Lemercier

Utilisation des « traces » comme source. Les traces peuvent être des documents (d’archive, images, vidéos, etc.), des médias sociaux, …

Idée: extraire les juris de thèse à partir de la page de couverture <- travail à faire ->

Le potentiel est infini quand on explore les sources: à condition d’être spécifique sur les relations ou types de liens que nous allons explorer (parfois, être exhaustif étourdit et distrait)

Coda: quelle population étudier: toujours se demander à propos de quoi on veut et on a les moyens d’être systématique

Analyser un système urbain à partir de son réseau viaire et de son réseau parcellaire – Claire Lagesse & Cécile Rivals

Claire: Morphologies des villes – extraire le réseau de rues – sommets aux intersections – rues les arcs

Cécile: parcelles de terres (arpenteurs) – relations mitoyennes sont les arcs et les parcelles sont les noeuds

Claire: univers de la théorie des graphes: regarder les relations des réseaux des voies et des parcelles

Cécile: exemple des sources historiques : plan et registre fiscal du 18e et 19e siècle – avant, on perd les plans mais on a les Compoix et les Terriers – registres fonciers où l’on peut obtenir les réseaux parcellaires.

Représentation des sources historiques dans une base de données – reconstitution de cartes à la main (travail de moine)

Registres fiscaux: base de données Tercomp : matrice d’adjacence des parcelles: graphe d’adjascence des parcelles: comparer pour ….. [trop rapide]

Analyse de corpus de décisions juridiques : quel apport de la science des réseaux ? – Fabien Tarissan

Voir les publications de Fabien Tarissan.

Création du Cour pénale internationale (CPI) en 2002 et premier jugement en 2012. Masse importante de documents; procédures longues et complexes; chaînes de décisions techniques; pas de recueil de jurisprudence.

Réseau dirigé; acyclique; statique; biparti (articles de loi et jugements)

Toutes les décisions: http://www.legal-tools.org

Questions de la science du réseau: quelle place pour les réseaux juridiques; interprétation des métriques habituelles; nouveau schémas relations/modèles; structure biparties et unimodal

Juridiques, entre autre: modèles droit civil et common law

Analyse statique

Distribution des degrés

Pour l’interprétation des impacts juridiques, voir: 

« réutiliser des métriques classiques, connues »

Évolution de l’importance au cours du temps (CJUE)

Comment tenir compte du temps?

Graphe orienté acyclique (CAG)

Temps versus degré: les décisions récentes ont moins d’occasion d’être citées; les décisions importantes continuent d’être citées au cours du temps

Deux variations proposées:

  • Au lieu du degré entrant on regarde le degré relatif: relie le nombre de citations au nombre de citations possibles; valeur entre 1 et 0
  • Longévité: distance temporelle moyenne séparant deux décisions

Quand on regarde le degré relatif: on constate des décisions que les juristes n’ont pas nécessairement relevé mais pertinente pour le cas

Longévité moyenne: les décision procédurale importante qui n’est pas commentée par les juristes

AUTRE ÉTUDE
Est-ce que la citation reflète l’importance réelle; est-ce que les métriques réseaux……… [trop vite]

Exploiter les structures uni- et biparties

Inférer le contenu d’une décision: comment identifier les décisions dont la citation d’un article de loi ne concerne pas la cause principale?

Regarder le sous-graphe de l’égoréseau dirigé autour de la décision cible pour identifier les articles cités par les décision subséquentes. Définir le profil d’un jugement

Mesurer la polyvalence: cristalliser un raisonnement juridique particulier plutôt que son « sujet » en droit ou son domaine juridique == regarder aussi les PARAGRAPHES importants, polyvalents en plus des jugements

Formes des réseaux personnels sur Facebook – Raphaël Charbier

Application AlgoPol

Les 30 graphlets de taille 5 ou moins sans îlots – la couleur représente la centralité des petits réseaux – analyse de l’émergence de ces structures dans l’égoportrait d’un réseau d’ami d’un participant à une étude de ses données d’amis sur Facebook, associé à la CNIL.

Table ronde : Sources et réseaux : quels enjeux interdisciplinaires ?

Discussion sur les perspectives épistémologiques et herméneutiques des participants de la matinée.

Atelier de l’après-midi: Gephi, Cytoscape, R

Gephy – Fabien Tarissan

Importer les données; aller dans Layout et choisir l’algorithme de visualisation « ForceAtlas2 » – jouer avec les paramètres

Demander la distribution des degrés sous Statistics > Network overview ; aussi Betweenness, Eccentricity Distribution

À chaque fois que l’on demande des données à Gephy via ce menu, le logiciel ajoute des colonnes de données à la Data Table (table de données sur les noeuds et sur les liens)

Ensuite, export table en CSV

Comment importer les données? File > Open. Mais, il faut préparer le fichier avant. Le plus simple, c’est une liste de liens (deux sommets liés). Ceci dit, le graph résultant n’aura pas beaucoup de détail.

Cytoscape

Introduction rapide

RStudio

Pour aller plus loin : http://kateto.net/network-visualization
Traduit en français ici : https://arshs.hypotheses.org/403