Information et savoirs | Page 3

Commerce et Compagnies Document numérique Voix, données

Lecture de Weapons of Math Destruction (Cathy O’Neil, Crown Publishers, 2016)

Et si les algorithmes étaient en train de détruire notre société ? Cette surprenante prémisse est le point de départ de Cathy O’Neil dans son récent livre sur ce qu’elle nomme les weapons of math destruction ou WMD : les armes de destruction mathématiques. J’ai entendu parlé de l’ouvrage de O’Neil via la baladodiffision Sparc de Nora Young, diffusée à la mi-octobre, une émission web de la Canadian Broadcasting Corporation (CBC) sur les technologies.

Dans ce livre, l’auteure relate une série d’anecdotes soit personnelles, soit plus générales, groupées par thématiques. Ayant travaillé dans le domaine de la haute finance et de l’analyse des données massives en marketing numérique, O’Neil possède une expérience de terrain sur le recours au modèles statistiques et probabilistes appliqués à divers domaines économiques ou sociaux: les admissions à l’enseignement supérieur, le marketing web, la justice, la dotation et la gestion d’horaire en entreprise, l’attribution de cotes de crédit et le profilage pour le vote. Tous ces exemples illustrent comment les données massives, combinées à des processus algorithmiques, mènent à la codification de préjudices où les iniquités systémiques pénètrent dans la chambre de résonance du numérique (p. 3-4).

La première étape pour concevoir un algorithme consiste à bâtir un modèle : une représentation abstraite du monde réel, de laquelle nous pouvons obtenir or extraire des données. Il devient ainsi possible de prévoir ou prédire notre fiabilité, notre potentiel ou notre valeur relative par rapport à ces mesures (p. 4) afin d’optimiser ledit système social ou économique. Beaucoup des problèmes selon O’Neil découlent d’une césure entre le monde et son modèle, il manque un élément de rétroaction (feedback, p. 6) afin de raffiner les calculs et indices numériques issus du modèle. Les exceptions génèrent des cas erratiques et troublent l’harmonie du système:  « [WMD] define their own reality and use it to justify their results. This model is self-perpetuating, highly destructive – and very common. […] Instead of searching for the truth, the score comes to embody it » (p. 7).

Un des problème majeur selon O’Neil découle du secret qui entoure les modèles, les données et les algorithmes qui y sont appliqués. En plus d’être camouflée par les mathématiques souvent complexes et inaccessibles (p. 7), les assises sur lesquelles elles reposent ne sont ni testées, ni questionnées. Les pauvres y sont des proies faciles : puisqu’un algorithme se déploie rapidement et à faible coût, il est plus simple de traiter des masses de dossiers, tandis que les personnes plus fortunées reçoivent un traitement plus personnalisé. Par ailleurs, les algorithmes sont des secrets corporatifs jalousement gardés, ce qui complexifie d’avantage une critique sociale constructive (p.8).

Par ailleurs, une fois que l’algorithme est établi et que son score fait autorité, les humains tombant dans ses griffes sont tenus à un fardeau de preuve beaucoup plus élevé pour faire modifier leur score. Si l’algorithme est secret et obscur, son score est accepté et il est difficile de le renverser (p. 10). Il s’agit de dommages collatéraux (p, 13).

Ayant mis la table dans son chapitre introductif (que la mathématicienne n’a pas numéroté et serait le chapitre « 0 »), O’Neil présente les éléments constituant les « bombes » mathématiques, spécifiquement ce q’est un modèle. Elle emploie l’exemple des statistiques sportives, notamment pour le Baseball, puisqu’un livre récent a traité des analyses mathématiques desdites statistiques et fut porté à l’écran mettant en vedette Brad Pitt. Voici en vrac les morceaux présentés par O’Neil:

  • Un modèle est un univers parallèle qui puise dans les probabilités, recensant tous les liens mesurables possibles entre les divers éléments d’un modèle (p. 16)
  • « Baseball has statistical rigor. Its gurus have an immense data set at hand, almost all of it directly related to the performance of players in the game. Moreover, their data is highly relevant to the outcomes they are trying to predict. This may sound obvious, but as we’ll see throughout this book, the folks using WMDs routinely lack data for the behaviors they’re most interested in. So they substitute stand-in data, or proxies. They draw statistical correlations between a person’s zip code or language pattern and her potential to pay back a loan or handle a job. These correlations are discriminatory, and some of them are illigal. » (p. 17-18)

  • En ce qui concerne le baseball, « data is constantly pouring in. […] Statisticians can compare the results of these games to the predictions of their models, and they can see where they were wrong […] and tweak their model and […] whatever they learn, they can feed back into the model, refining it. That’s how trustworthy models operate » (p. 18)
  • « A model, after all, is nothing more than an abstract representation of some process, be it a baseball game, an oil company’s supply chain, a foreign government’s actions, or a movie theater’s attendance. Whether it’s running in a computer program or in our head, the model takes what we know and uses it to predict responses in various situations. » (p. 18)

  • Mais, rien n’est parfait dans un monde de statistiques: « There would always be mistakes, however, because models are by their very nature, simplifications. » (p. 20) Ils ont des points morts (blind spots), certains éléments de la réalité qui ne modélisent pas ou des données qui ne sont pas incorporées dans le modèle. « After all, a key component of every model, whether formal or informal, is its definition of success. » (p. 21)
  • « The question, however, is whether we’ve eliminated human bias or simply camouflaged it with technology. The new recidivism models are complicated and mathematical. But embedded within these models are a host of assumptions, some of them prejudicial. And while [a convicted felon’s] words were transcribed for the record, which could later be read and challenged in court, the workings of the recidivism model are tucked away in algorithms, intelligible only to a tiny elite. (p. 25)

  • Exemple du LSI-R: level of service inventory – revised, un long formulaire à être rempli par un prisonnier. (p. 25-26)
  • Afin de cerner le concept d’armes de destruction mathématiques, O’Neil propose trois facteurs, présentés sous forme de questions, afin d’identifiers quels algorithmes se qualifient. La première question s’articule ainsi: « Even if the participant is aware of being modelled, or what the model is used for, is the model opaque, or even invisible? […] Opaque and invisible models are the rule, and clear ones very much the exception.  » (p. 28) O’Neil cite la propriété intellectuelle, et son corollaire malsain, le secret industriel, à défaut d’une obligation de divulgation (comme les brevets – cette observation est mienne) comme étant la cause de cette opacité et de cette invisibilité. Ce qui introduit la seconde question: « Does the model work against the subject’s interest? In short, is it unfair? Does it damage or destroy lives? » (p. 29) Cette iniquité découle d’un système de rétroaction déficient (feedback loop). Finalement, la troisième question est « whether a model has the capacity to grow exponentially. As a statistician would put it, can it scale? […] the developing WMDs in human resources, health, and banking just to name a few, are quickly establishing broad norms that exert upon us something very close to the power of law. » (p. 29-30)
  • « So to sum it up, these are the three elements of a WMD: Opacity, Scale, and Damage. […] And here’s one more thing about algorithms: they can leap from one field to the next, and they often do. » (p.31)

Pas besoin d’avoir un doctorat en droit pour comprendre que les choses aux États-Unis sont bien différentes qu’ailleurs : leurs droits à la vie privée ne sont pas enchâssés dans des constitutions ou édictés par des lois. Le recours aux méthodes statistiques (Monte Carlo) appliquées à des modèles ou à des jeux de données incomplètes perpétuent des préjugés et les érigent en systèmes étanches, inhumains, injustes.

Dans le reste de son livre, O’Neil nous peint un portrait glauque mais lucide de la dystopie algorithmique qui s’installe tranquillement aux USA. Les pauvres, les marginalisés ou les illettrés sont proie aux analyses des machines tandis que les fortunés sont analysés par des humains.

De tous les chapitres, celui sur la justice m’interpelle le plus.

Dans un premier temps, O’Neil présente l’algorithme prédictif employés par les services de polices afin de déterminer où se produiront les crimes, tels l’outil PredPol ou le projet CompStat de la ville de New York. O’Neil relate comment d’autres approches des forces de l’ordre, dont la méthode stop-and-frisk (qui consiste à interpeller quiconque semble le moindrement suspect), ne fait que renforcer le modèle d’oppression envers certaines communautés qui se concentrent dans des quartiers précis…

D’un point de vue plus large, les réflexions de O’Neil concernant les WMDs me fait penser aux théories de Shannon sur la communication  ainsi que de Wiener sur la cybernétique, (liens vers des billets synthétiques sur ces théories). En particulier, le cadre d’analyse de O’Neil (ses trois questions ci-haut, pour déterminer si un algorithme est un WMD) évoquent les trois éléments de Shannon et Wiener pour l’information: communication, rétroaction, entropie.

J’ai aussi découvert un autre livre potentiellement intéressant: Unfair : the new science of criminal injustice par Adam Benforado chez Crown Publishers en 2016. Je me suis empressé de l’emprunter pour creuser cette fâcheuse intersection entre le droit et les mathématiques…

Je viens de jeter un coup d’oeil au livre de Benforado. Quoi que bien écrit et à première vue une critique constructive du système judiciaire, je ne vais pas effectuer une lecture plus approfondie. En fait, il traite spécifiquement des développements en psychologie cognitive, comportementale et en neuropsychologie (comment nous percevons le monde, comment nous nous expliquons nos biais personnels, comment notre cerveau réagit à des stimulus perçus consciemment ou non). De plus, il traite uniquement du système criminel et pénal américain, ce qui me semble bien loin de mes algorithmes et de mes mathématiques et le droit. Une bonne lecture donc, pour une autre fois.

Accès libre Conférence Santé et médecine

Jeux libres dans le domaine de la santé

Avis aux amoureux des logiciels libres, de l’innovation ouverte et sociale ainsi que des pratiques novatrices du co-design et des fab labs : le 22 novembre prochain aura lieu un colloque sur le thème de: «Applications mobiles en santé : des usages aux enjeux éthiques, déontologiques et juridiques»

Seront de la partie professeur Vincent Gautrais du CRDP et Catherine Régis, Professeure, Faculté de droit de l’Université de Montréal, titulaire de la Chaire de recherche du Canada sur la culture collaborative en droit et politiques de santé, en plus de plusieurs autres conférenciers.

Je tiens à remercier Fabio Balli, Candidat au doctorat, Université Concordia, pour le tuyau et je lui souhaite la bienvenue à Montréal! Il est très actif dans le développement d’un projet d’innovation ouverte menant vers une application mobile sur l’asthme, voir: http://breathinggames.net/fr

Logiciel à code source libre Montréal Programmeurs

Atelier avancé Arduino le 29 sept. par Massimo Banzi

À ne pas manquer le 29 septembre prochain, Massimo Banzi, co-fondateur du projet Arduino, sera à l’Institut Milieux (Hexagram redux) l’Université Concordia et offrira un atelier avancé de 13h à 16h ! Le nombre de places sont limitées, il faut s’inscrire sur le site du Centre de recherche sur les jeux de l’U. Concordia, TAG.

Et oui, j’ai ajouté l’événement à l’agenda du libre 😉 Dommage que l’on manque la semaine québécoise de l’informatique libre qui se déroule du 17 au 25 septembre…

Logiciel à code source libre Montréal Numérisation Programmeurs Réforme

Nous cherchons : bidouilleurs et amoureux des nouvelles technologies

Je suis heureux d’annoncer que mon employeur, l’Université Concordia, est à la recherche de deux candidats exceptionnels pour réfléchir à comment la technologie peut servir la mission des bibliothèques:

Il faut comprendre « technologue » plutôt que technicien, quoi que je dois vous faire part de ma surprise de voir qu’ils demandent un bacc en génie ou informatique pour ce genre d’emploi… en fait, rien n’aurait d’égal un excellent et passionné technicien(ne) en documentation qui bidouille les technologies émergentes !

Voici un test très simple à effectuer si vous désirez savoir si cet emploi est pour vous. Considérer la liste de terme suivants:

living labs ; maker space ; bibliothèque ; coworking

Si vous ne voyez pas d’intrus dans la liste d’expressions, vous devez appliquer, surtout si vous avez déjà joué avec des raspberry pi, des matrices arduino, etc. Constatez la belle place donnée aux technologies émergentes, citoyennes et à code source libre !

D’ailleurs, je suis absolument ravi d’apprendre que la Ville de Montréal, le gouvernement du Québec et la BAnQ – Grande Bibliothèque ont renouvelé leur entente cadre qui vise à transformer la délicieuse bibliothèque St-Sulpice en institution vouée aux adolescents et à l’innovation. Laissée à l’abandon depuis des années, ces intervenants ont annoncé en février que le resplendissant édifice aura une nouvelle vie.

Ainsi, nos deux offres d’emploi sont en lien avec de désir de s’approprier les nouvelles technologies et cette offre est une opportunité de façonner notre avenir numérique.

PS. je ne suis pas membre du comité de sélection, alors je n’ai que des informations extérieures au processus de dotation.

Canada Document numérique Éducation Non classé Rapport et étude

Livrel libre sur l’apprentissage numérique

Dr Tony Bates, chercheur et administrateur universitaire canadien, annonce la diffusion libre d’une traduction en français de son plus récent ouvrage intitulé L’enseignement à l’ère du numérique (lien direct vers le PDF). J’ai suivi ses travaux d’écriture sur son blogue et j’ai même consulté cet ouvrage quelquefois dans sa version anglophone. Maintenant qu’il y a une version en français, je suis très heureux de pouvoir vous en parler ici.

Cet ouvrage recense et commente diverses stratégies pédagogiques liées au numérique. Il s’avère une inspiration pour quiconque désirant s’approprier les nouveaux moyens numériques, au profit des apprenants.

Accès libre Creative Commons Logiciel à code source libre Montréal Non classé Québec

Agenda du libre

Connaissez-vous le site AgendaDuLibre.qc.ca ? Il s’agit du meilleur endroit pour être au fait des événements ayant trait aux logiciels libres mais aussi de tout aspect du libre numérique… N’oubliez pas d’y inscrire vos événements à venir pour créer un avenir libre et ouvert. En plus, ils diffusent les événements grâce aux fils RSS par région du Québec.

Neutralité

Le CRTC lance une consultation sur la neutralité du net

Le Conseil de la radiodiffusion et des télécommunications canadiennes (CRTC) lance aujourd’hui une consultation publique sur la « neutralité des forfaits de données Internet » – c’est à dire la neutralité du net.
Cette consultation est d’une importance capitale pour maintenir un accès impartial et ouvert au réseau. Par exemple, il se peut que votre fournisseur d’accès Internet vous impose un frais additionnel pour utiliser votre plate-forme vidéo sur demande favorite aux heures de grande écoute.
Voici le commentaire que je viens de verser dans le formulaire du CRTC:

Il est essentiel de maintenir une tarification des forfaits de données Internet qui ne fluctue pas avec le temps ou avec le site/service consulté. 

Internet est un bien public, au sens économique du terme. Moduler les tarifs selon les sites ou la période du jour créé une situation inéquitable et limite le potentiel économique et social d’internet. Il s’agit du même genre de situation que la tarification unique du système postal canadien. Une tarification inmodulable génère des externalités positives du point de vue de l’utilisation d’internet et permet aux Canadiennes et Canadiens d’accéder à Internet librement et ouvertement.

Il faudrait plutôt imposer aux sociétés de télécommunication un investissement dans leurs infrastructures afin de répondre à la demande aux heures de pointe. 

Bibliothèques Financement Jeux vidéos Logiciel à code source libre

Inclure les jeux numériques en bibliothèque

Suivez l’évolution de ce projet: http://www.culturelibre.ca/tag/knight/
Follow the evolution of this project here: http://outfind.ca/tag/knight/

En novembre dernier, j’ai eu le plaisir de présenter au Congrès des milieux documentaires notre projet pour rendre accessible des jeux numériques pour les bibliothèques, financé par la bienveillante Fondation Knight aux USA. Je vous écris maintenant pour vous faire part de la suite de ce projet et pour solliciter votre aide dans le cadre du concours de financement.

Je vous fais suivre un texte qui vous offre les détails (désolé de l’anglais, mais la Fondation Knight est aux USA) ainsi que le mécanisme pour appuyer notre demande sur leur plateforme web.

Le lien direct vers notre projet est :
https://www.newschallenge.org/challenge/how-might-libraries-serve-21st-century-information-needs/submissions/play-at-your-leisure

Merci de votre aide!

I am really excited to share with you Concordia’s own Technoculture Art and Games’ (TAG) submission for the Knight Foundation’s News Challenge, here is the link:
https://www.newschallenge.org/challenge/how-might-libraries-serve-21st-century-information-needs/submissions/play-at-your-leisure
The goal is to get digital games from small (aka indie) studios into libraries. The benevolent Knight Foundation’s News Challenge is an open call for projects to fund innovative ideas and this current iteration focusses on Libraries.

The Knight Foundation has already granted us “prototype” funding last year to create our alpha prototype, codenamed Alice (family pictures on the proposal page). Now, we want to develop and test our library videogame system with partner libraries (Brooklyn NY, San José CA, Civilla in Detroit and with the Indigenous Futures communities in the North) over the next few years. The Knight Foundation focusses on the USA and rest assured that we will be seeking support to deploy our system in Canada and elsewhere!

Because the News Challenge uses an “open” community based evaluation process (in addition to a formal review), you can help in some very simple ways:

1. Please click on the link to get the page view count up.
2. Register an account on the system to either “heart” the proposal or leave a comment. Some useful comments could be “I would love for my local public library to have indie/digital games” or, if you are a game maker, “I would love for libraries to add my game to their collection” (or some variation thereof). Of course, please feel free to add your own comment!
3. Forward this email to anyone who believes that libraries should have Game Clubs and Indie Games.

The Comment phase of the granting cycle closes in about 2 week.

On a more personal note, my ambition is to strengthen libraries everywhere by devising an open social computing platform so that everyone can play and make games. This will also help libraries acquire and preserve digital content through open markets (fixing some pesky collective action & copyright & technological issues). I am blessed with a myriad of colleagues at Concordia who also share this vision and are willing to embark on this quest!

Thanking you in advance for your support of our project,
Olivier

Commerce et Compagnies Montréal Non classé Radio, télévision Réforme

Au revoir, téléphone public

 

Je travaille à la bibliothèque du centre-ville de l’Université Concordia et la marche matinale qui m’amène au bureau passe par la même porte… Mais ce matin j’ai constaté une mutation de mon environnement physique à cause du numérique: la banque de téléphones publics sous l’escalier qui mène à la bibliothèque n’est plus encombré par des téléphones publics. Il y en avait jadis près d’une vingtaine mais ils sont de plus en plus vacants et ce matin… Il n’en resque de deux.

Encore une technologie à la potence de la modernité ! (Tiens: avez-vous un meilleur calembour avec les deux sens de potence – comme support et comme outil de torture?) 

Gouvernance Logiciel à code source libre Québec

Préparer la Semaine québécoise de l’informatique libre (SQIL)

Marquez vos agendas : la Semaine québécoise de l’informatique libre (SQIL) aura lieu du 17 au 25
septembre 2016 ! Nos amiEs de FACIL préparent déjà le terrain, en ouvrant les candidatures pour le comité de coordination en contactant Mathieu Gauthier-Pilote. Ce dernier indique justement :

Comme l’an dernier, nous allons inviter la communauté du libre à organiser des activités (rencontres, ateliers, hackathons, colloques, séminaires, conférences, tables rondes, manifestations, etc.) partout sur le territoire québécois.

Le but est de pourvoir au comité de coordination dans les prochaines semaines et de lancer l’appel de projets et d’événements en avril.