International

Conférence France

Analyse réseaux complexes — Jour 2

Collecte de données – Marie-Pierre Bès; Guillaume Favre; Claire Lemercier

Guillaume Favre

Types de collecte: questionnaires sur les relations; questionnaires sociométriques; expérimentation; entretiens: narrations qualifiées; traces de pratique ou sources écries; observations: plus rare?

Exemples:

  • Héran (1988) sociologue français sur les égoréseaux
  • ISSP 1986, 2001, 2017 dans “social networks”
  • Panel ELLIPSS – capital social des individus
  • Grossetti (2005, 2007) dans social networks – avec générateurs de noms (champs pré-populés avec options de type à choix multiples)
  • American Global Social Survey de McPherson et al en 2006
    • Résultats controversés (Fisher 2009, Wang…….

Marie Pierre Bès

Classes d’informations ou de questionnaires ou d’approches théoriques

Claire Lemercier

Utilisation des “traces” comme source. Les traces peuvent être des documents (d’archive, images, vidéos, etc.), des médias sociaux, …

Idée: extraire les juris de thèse à partir de la page de couverture <- travail à faire ->

Le potentiel est infini quand on explore les sources: à condition d’être spécifique sur les relations ou types de liens que nous allons explorer (parfois, être exhaustif étourdit et distrait)

Coda: quelle population étudier: toujours se demander à propos de quoi on veut et on a les moyens d’être systématique

Analyser un système urbain à partir de son réseau viaire et de son réseau parcellaire – Claire Lagesse & Cécile Rivals

Claire: Morphologies des villes – extraire le réseau de rues – sommets aux intersections – rues les arcs

Cécile: parcelles de terres (arpenteurs) – relations mitoyennes sont les arcs et les parcelles sont les noeuds

Claire: univers de la théorie des graphes: regarder les relations des réseaux des voies et des parcelles

Cécile: exemple des sources historiques : plan et registre fiscal du 18e et 19e siècle – avant, on perd les plans mais on a les Compoix et les Terriers – registres fonciers où l’on peut obtenir les réseaux parcellaires.

Représentation des sources historiques dans une base de données – reconstitution de cartes à la main (travail de moine)

Registres fiscaux: base de données Tercomp : matrice d’adjacence des parcelles: graphe d’adjascence des parcelles: comparer pour ….. [trop rapide]

Analyse de corpus de décisions juridiques : quel apport de la science des réseaux ? – Fabien Tarissan

Voir les publications de Fabien Tarissan.

Création du Cour pénale internationale (CPI) en 2002 et premier jugement en 2012. Masse importante de documents; procédures longues et complexes; chaînes de décisions techniques; pas de recueil de jurisprudence.

Réseau dirigé; acyclique; statique; biparti (articles de loi et jugements)

Toutes les décisions: http://www.legal-tools.org

Questions de la science du réseau: quelle place pour les réseaux juridiques; interprétation des métriques habituelles; nouveau schémas relations/modèles; structure biparties et unimodal

Juridiques, entre autre: modèles droit civil et common law

Analyse statique

Distribution des degrés

Pour l’interprétation des impacts juridiques, voir: 

“réutiliser des métriques classiques, connues”

Évolution de l’importance au cours du temps (CJUE)

Comment tenir compte du temps?

Graphe orienté acyclique (CAG)

Temps versus degré: les décisions récentes ont moins d’occasion d’être citées; les décisions importantes continuent d’être citées au cours du temps

Deux variations proposées:

  • Au lieu du degré entrant on regarde le degré relatif: relie le nombre de citations au nombre de citations possibles; valeur entre 1 et 0
  • Longévité: distance temporelle moyenne séparant deux décisions

Quand on regarde le degré relatif: on constate des décisions que les juristes n’ont pas nécessairement relevé mais pertinente pour le cas

Longévité moyenne: les décision procédurale importante qui n’est pas commentée par les juristes

AUTRE ÉTUDE
Est-ce que la citation reflète l’importance réelle; est-ce que les métriques réseaux……… [trop vite]

Exploiter les structures uni- et biparties

Inférer le contenu d’une décision: comment identifier les décisions dont la citation d’un article de loi ne concerne pas la cause principale?

Regarder le sous-graphe de l’égoréseau dirigé autour de la décision cible pour identifier les articles cités par les décision subséquentes. Définir le profil d’un jugement

Mesurer la polyvalence: cristalliser un raisonnement juridique particulier plutôt que son “sujet” en droit ou son domaine juridique == regarder aussi les PARAGRAPHES importants, polyvalents en plus des jugements

Formes des réseaux personnels sur Facebook – Raphaël Charbier

Application AlgoPol

Les 30 graphlets de taille 5 ou moins sans îlots – la couleur représente la centralité des petits réseaux – analyse de l’émergence de ces structures dans l’égoportrait d’un réseau d’ami d’un participant à une étude de ses données d’amis sur Facebook, associé à la CNIL.

Table ronde : Sources et réseaux : quels enjeux interdisciplinaires ?

Discussion sur les perspectives épistémologiques et herméneutiques des participants de la matinée.

Atelier de l’après-midi: Gephi, Cytoscape, R

Gephy – Fabien Tarissan

Importer les données; aller dans Layout et choisir l’algorithme de visualisation “ForceAtlas2” – jouer avec les paramètres

Demander la distribution des degrés sous Statistics > Network overview ; aussi Betweenness, Eccentricity Distribution

À chaque fois que l’on demande des données à Gephy via ce menu, le logiciel ajoute des colonnes de données à la Data Table (table de données sur les noeuds et sur les liens)

Ensuite, export table en CSV

Comment importer les données? File > Open. Mais, il faut préparer le fichier avant. Le plus simple, c’est une liste de liens (deux sommets liés). Ceci dit, le graph résultant n’aura pas beaucoup de détail.

Cytoscape

Introduction rapide

RStudio

Pour aller plus loin : http://kateto.net/network-visualization
Traduit en français ici : https://arshs.hypotheses.org/403

Conférence France

Analyse réseaux complexes — Jour 1

J’ai l’énorme privilège de participer à l’École thématique CNRS sur l’Analyse de réseaux et complexité. Voici quelques notes.

Pierre Mercklé – Introduction à l’analyse en réseaux

Surtout, la perspective sociologique des réseaux sociaux [personnels], son histoire et son émergence:

Pierre Bourdieux, La Distinction 1979 p.140-141; Raisons pratiques

Blogue: mondegeonumérique.wordpress.com Thierry Joliveau

John Scott, 2012, Social Network Analysis: A Handbook, Sage, p.12

Freeman, Development of Social Network Analysis: a Study in the Sociology of Science, Empirical Press, 2004, p.131

Moreno, Who Shall Survive, 1934

John Barnes, Classes sociales et réseaux dans une Île de Norvège, Réseaux, 2013 [1954], p.217 : pour une distinction terminologique entre web et réseau, “tisser” et réseau social, réseau informel, points reliés par des lignes

S. Milgram, 1967, “the small world problem” Psychology Today, 1, pp. 62-67

Merklé, Sociologie des réseaux sociaux, Paris, La Découverte

Bertrand Jouve – Introduction à l’analyse des réseaux complexes

“Ce que j’ai envie de faire”  “comme matheu” : s’attacher à comprendre la structure et sa dynamique, en mesurant, en construisant des modèles qui les reproduisent: variables pertinentes, dépendances…

1. Introduction

Mathématicien et physicien: apportent des outils différents

Math sont moyens pour simplifier un problème avec des outils génériques: approche formelle suppose des hypothèses même bien cachées derrière des équations

Un système complexe est constitué de nombreuses entités dont les interactions conduisent à l’apparition d’un comportement global dit “émergeant” qui peut être expliqué en considérant uniquement les propriétés individuelles de ses constituants. Nécessité d’identifier: des interactions multi-échelles, des boucles de rétroaction, des bifurcations, des phénomènes en cascade.

Par ailleurs,

Réseau complexe: système complexe dont les interactions interindividuelles sont dyadiques

Et

Réseau social (complexe) : réseau complexe dont les interactions sont régies par des liens sociaux

(Green & Sadedin, 2014)

(Alan Kirman)

Les SHS [sciences humaines et sociales], SDV [science de la vie], SPI [sciences pour ingénieurs] abordent différemment le traitement de la complexité ;  l’objectif doit maintenant être de construire la continuité des concepts, méthodes et outils sur des objets partagés.

L’objet est de comprendre les logiques qui sous-tendent la dynamique du réseau et d’en construire un modèle simplifié

Que doit-on disposer pour étudier un réseau cokmplexe

  1. Identifier et décrire l’hétérogénéité des noeuds (sommets, vertex)
  2. Identifier et décrire la diversité des interactions entre les noeuds
  3. Analyser la structure du réseau et identifier les échelles perfinentes
  4. Caractériser la dynamique et les logiques qui la sous-tend

(3) et (4) sont fortement liés: la structure des interactions entre les individus est une contrainte importante sur la dynamique et donc l’existence de comportement émergents du système. (épidémies)

2. Réseaux complexes

  • Ce qui nous intéresse c’est quand la structure globale d’un réseau observé s’écarte d’une structure “classique” , appelé modèle nul
  • Un modèle nul est un ensemble de graphes qui ont le même nombre de sommets que le graphe étudié et qui conservent un certain nombre de caractéristiques locales (degré, clustering, …)
  • Il faut donc être capable de produire des graphes avec ces propriétés voulues
  • et de les comparer au graphe initial (en général, on vérifie seulement si la propriété globale est conservée)

Donc, on se trouve à générer une multitude de graphes ayant les mêmes propriétés pour les sommets afin de voir si notre graphe est “surprenant” ou non. Il s’agit de

  • “modèles de référence” ou graphes élémentaires:
  • réseau réguliers; graph Erdos-Rényi (nombre de sommets fixés, les arêtes sont tirées indépendamment suivant une loi uniforme de paramètre p) dans ce cas, on obtient une distribution des probabilités des degrés.
  • The configuraiton model: nombre de sommets fixés, distribution de degrés fixés [Fosdick, 2018, SIAM]

3. Des modèles statistiques des réseaux sociaux

En fixant de plu en plus de contraintes sur les modèles nuls, on va in fine basculer dans une autre logique qui est de chercher un modèle statistique générique qui explique assez bien l’observation qu’on a. On s’intéresse au codage, dans le modèle, de configuration récurrentes (ie. dépendances dans des données relationnelles)

[il saute le reste de la partie 3 et blitz la partie 4]

4. Quid des modèles génériques?

Small world, scale free, …

Watts-Strogatz model

Barabasi model

5. Big data

bertrand stigler sur canal-u.tv

On fouille pour trouver ce qu’on cherche – La data Science doit servir la science (des concepts).

Atelier 1 – Claire Lemercier

Format du fichier “classique” en réseau: entité 1 + entité 2 + lien + source

Deux inspirations:

  • réfléchir aux classes distinctes d’entités au-delà du classique personne, place, temps, objet. Pour mes recherches, je crois que les liens sémantiques en droit sont très pertinents
  • explorer et chercher le moment “woah hoo” donc, viser l’itération d’hypothèses ou de versions de réseaux sans trop s’embêter avec la conceptualisation théorique de l’approche. Peut-être une approche inductive en amont.

Suggestions de lecture personnelles par Claire pour l’idée de l’analyse en réseau du droit :

Atelier 2 – Guillaume Cabanac et Gilles Hubert

Récupération de données bibliographiques du web.

  1. Données par tabulation: base bibliographique Web of Science tout est payant, sauf si votre institution est abonné; limite de 500 notices à la fois; téléchargement et utilisation de la fonction de “text to columns” de votre tableur préféré; utiliser l’outil Voyant Tools pour traiter rapidement le corpus rapidement.
  2.  Données structurées JSON, outil http://www.altmetric.com : permet de générer certaines de mesures de popularité pour un article scientifique selon une certaine quantité de sources de données; permet d’interroger le système via l’API selon le DOI d’un article; utilisation de “./jq” pour interroger l’arbre JSON pour les données que l’on désire dans le schéma
  3. “Web scraping” (sic) ou moissonnage ou aspirateur de site web. Structure des pages: Document Object Model; idée: demander à archive.org d’indexer une page web pour avoir un permalien afin de publier celui-ci comme source dans une bibliographie d’un article; visualisation des chercheurs dans un labo de recherche oeuvrant dans divers thèmes et axes avec Gephi

Question de la salle:

 

Exceptions au droit d'auteur Jugement Livre et édition Québec Universités

Entente à l’amiable entre l’Université Laval et Copibec

Selon un communiqué émis par l’Université Laval via le site CNW, Copibec et l’Université Laval concluent une entente hors cour en matière de droits d’auteurs. Bien sûr, il faudra attendre encore un peu pour obtenir les détails de cette entente – il faut être prudent et patient avant d’analyser la situation.

 

Voici le texte complet du communiqué de presse, une utilisation équitable de ce contenu protégé par le droit d’auteur pour communication de nouvelle:

 

QUÉBEC, le 19 juin 2018 /CNW Telbec/ – Copibec et l’Université Laval annoncent qu’elles entendent mettre un terme définitif au litige qui les oppose concernant la gestion des droits des auteurs dans le cadre des activités d’enseignement et de recherche de l’Université Laval.

Au terme de leurs échanges, les parties ont conclu une entente à l’amiable, laquelle demeure cependant sujette à l’approbation de la Cour. Les modalités exactes de cette entente seront donc rendues publiques ultérieurement, après que la Cour ait eu l’opportunité de les examiner.

Cette entente de règlement hors cour a été conclue sans admission quelconque, dans le but d’éviter des frais et déboursés additionnels importants pour toutes les parties, lesquelles préfèrent consacrer leurs énergies et leurs ressources à la défense des droits des auteurs dans la perspective de leur mission respective.

Copibec et l’Université Laval sont heureuses d’avoir trouvé une solution à l’amiable à leur différend qui, à leur avis, respecte à la fois les besoins du milieu universitaire et les droits des titulaires de droits d’auteur. Elles reconnaissent toutes deux que la gestion collective offre des avantages et favorise la liberté académique.

Veuillez prendre note que Copibec et l’Université Laval n’émettront pas de commentaires additionnels avant l’approbation de l’entente par la Cour.

Canada Droit d'auteur Réforme

Début de la période d’examen de la Loi sur le droit d’auteur

Le le Comité permanent de l’industrie, des sciences et de la technologie annonce la diffusion d’un “plan de travail” pour examiner la Loi sur le droit d’auteur :

Le Comité va mener cet examen en trois phases. Plus spécifiquement, le Comité entendra des témoignages provenant :

  • De témoins représentant des secteurs d’activités spécifiques, incluant l’édition, les arts visuels, les logiciels et les télécommunications (Phase I);
  • De témoins représentant un éventail de parties prenantes impliquées dans de multiples secteurs d’activité, incluant les communautés autochtones et divers groupes d’intérêts (Phase II); et
  • D’experts légaux, incluant des avocats et des universitaires, de même que des associations professionnelles (Phase III).

Le Comité voyagera aussi à travers le Canada en mai pour offrir plus d’opportunités aux Canadiens d’exprimer leur position sur le droit d’auteur.

Le Comité prévoit compléter ces trois phases d’ici le début de 2019.

Afin de soutenir l’examen de la Loi, le Comité a invité le Comité permanent du patrimoine canadien à effectuer une étude des modèles de rémunération pour les artistes et les créateurs.

Le Comité invite les Canadiens à soumettre des mémoires écrits n’excédant pas 2 000 mots. Les mémoires peuvent être envoyés à : indu@parl.gc.ca.

Accès libre Bibliothécaire Conférence Europe Histoire et sciences sociales Lettres

Notes de la conférence d’ouverture de prof. Alan Liu #DHN2018

J’ai l’énorme plaisir de participer à la Digital Humanities in Nordic Countries Conference à Helsinki cette semaine. J’y présente demain (jeudi après-midi) ma thèse doctorale, financée en partie par la Foundation Knight. Les thèmes de cette troisième version de cet événement sont: “cultural heritage; history; games; future; open science.”

Suivez la conférence sur Twitter grâce au mot-clic #DHN2018.

La conférence a été précédée par un séminaire sur l’utilisation d’outils de traduction simultanée dans le processus créatif. J’y reviendrai peut-être…

Je désire offrir mes notes de la communication d’ouverture du professeur Alan Liu, portant les protocoles de travail ouverts et reproductibles en humanités numériques. Il divise sa présentation en trois parties: la vue au rez-de-chaussée ; la vue à la cime des montagnes et la vue stratosphérique. Trois points de vue du même phénomène pour mieux saisir les défis à saisir.

Avant tout, Liu définit les humanités en citant la loi habilitante du National Endowment for the Humanities aux USA (National Foundation for the Arts and the Humanities Act, 1965). En réalité, il articule “humanities” en cinq vecteurs théoriques: les humanities au sens classique platonique de la rhétorique, de la logique et de la grammaire; des social sciences; des science (au sens de STEM; et des creative & performing arts. Ces cinq vecteurs définissent les forces à l’oeuvre pour les humanités numériques. Il indique que les humanités sont essentielles dans le concert des disciplines intellectuelles, il collabore à l’initiative 4humanities.org pour en faire la promotion.

I. Vue du rez-de-chaussée

Prof. Liu présente son projet qui emploie l’outil DFR Browser pour son projet WhatEveryone1Says. Afin de proposer une méthode qui est ouverte et reproductible, Liu propose deux étapes, suivant cette structure:

A. Un système de gestion du cycle de vie virtuel (virtual workflow manager)

Utilisant un “Jupyter” notebook comme outil, l’équipe de Liu peut moissonner (scrape), gérer la provenance et le cycle de travail (workflow), les processus analytiques (analytical processes of topic modelling and word embedding), et l’interprétation. Sans le dévoilement de ces éléments, les humanités numériques ne peuvent espérer devenir une science ouverte et reproductibles.

B. Provenance

L’équipe de prof. Liu utilise des bibliothèques JSON pour l’identification du corpus et la confection de notes d’accès, les points de données (data nodes along the wy: raw data, processed data, scripts). Le tout est consigné dans une base de donnée MongoDB.

II. Vue à la cime des montagnes

Dans ce cas, il est essentiel pour un cycle de travail ouvert de se formaliser. Liu utilise “Wings” qui est une ontologie OWL. Il mentionne aussi le protocole W3C PROV (PROV-O; PROV-datamodel; PROV-OWL).

III. Vue stratosphérique

Liu cite la page 6 du rapport suivant: Our cultural commonwealth: Report on the American Council of Learned Societies on Cyberinfrastructure (2006). Liu cite aussi son rôle au sein de la nouvelle revue Journal of Cultural Analytics, basée à l’Université McGill à Montréal. Il cite aussi un article intitulé “Towards an automated data narrative” par Gil et al. dans Communications of the ACM.

Questions

J’ai posé la dernière quesiton à prof. Liu, à propos du rôle des bibliothèques et des bibliothécaire dans son “nouveau modèle” des humanités. Il précise que nous devons déconstruire le cycle de vie d’un projet pour identifier tous les microdocuments générés. Il faut aussi analyser les environnements numériques de travail: ceux de développement, de production, d’infonuagique. Il faut aussi bâtir des dépôts institutionnels et des dépôts de code informatique.

Bibliothécaire Bibliothèques Critique Québec Revue et journaux

Lancement du no. 73 de la revue À Bâbord – mardi 27 février 18h30

Je désire vous inviter au lancement du numéro 73 de la revue À Bâbord, contenant un dossier spécial intitulé « Bibliothèques. Enjeux et mutations. » Je suis membre du comité de pilotage de ce dossier et j’y livre un article intitulé « Copibec ou la vie sauvage » sur l’action collective contre l’U. Laval.

Les détails sont ici :

https://www.ababord.org/Bibliotheques-Enjeux-et-mutations

et sur Facebook:

https://www.facebook.com/events/185901792009670/

Selon le site du lancement :

Le numéro 73 d’À Bâbord ! sera lancé le mardi 27 février, 18h30, à la bibliothèque Mont-Royal (465 Mont-Royal est, Montréal). Plusieurs collaboratrices et collaborateurs seront de la partie et des lectures publiques sont prévues. L’événement Facebook est ici. Bienvenue à toutes et à tous !

Au plaisir de vous y voir!

Bibliothèques Chine Loi ou règlement

La Chine se dote d’une loi pour des bibliothèques publiques gratuites

Selon le site officiel du gouvernement chinois, le premier janvier marque l’entrée en vigueur d’une nouvelle loi créant l’obligation pour les gouvernements de proximité de proposer des bibliothèques publiques gratuites. Sommairement, la priorité devrait être donné aux ainés et aux jeunes, dans des espaces ouverts au public sans frais, une collection et des services d’aide au lecteur.

J’ai converti les pages annoncant ces information en PDF afin de les archiver, voici mes sources:

Supreme People’s Court of the People’s Republic of China, “First law on public libraries enacted” Site visité le 2018-01-09; Archivé ici: 2018-01-09_LoiBiblioChineGraph

Supreme People’s Court of the People’s Republic of China, “Highlights of public library law” Site visité le 2018-01-09; Archivé ici: 2018-01-09_LoiBiblioChineComm

Outre ces deux sources, il est difficile de trouver des informations sur cette loi en anglais ou en français dans Internet.

Au Québec, la situation est bien différente. Dans un élan de réforme visant la simplification de la loi constituant les cités et villes, que j’ai sévèrement critiqué, le législateur offre le choix aux municipalités d’offrir des services culturels et sportifs, ou non. Il s’agit d’un vent de réforme en vafeur du droit souple, où les normes techniques et la co-régulation remplacent les obligations légales.

 

Canada Droit d'auteur Réforme

Révision de la Loi sur le droit d’auteur en 2018

Hier, le parlement canandien a voté la motion suivante à l’unanimité:

« Que le Comité permanent de l’industrie, des sciences et de la technologie soit le comité désigné aux fins de l’article 92 de la Loi sur le droit d’auteur. »

“That the Standing Committee on Industry, Science and Technology be the committee designated for the purposes of section 92 of the Copyright Act.”

Ainsi débute officiellement le processus de révision de la Loi sur le droit d’auteur au Canada… Aucune réunion de ce comité est encore prévu selon le site Internet du Parlement. Par ailleurs, la Chambre des communes ne se réunira pas avant la fin du mois de janvier 2018.