Objectifs
Découvrir la captologie, champ de recherche à la base du fonctionnement des plateformes
Comprendre comment les plateformes utilisent la captologie pour récolter des données
Comprendre les infrastructures techniques permettant aux plateformes de récolter des données en dehors de leurs services
Comprendre la différence entre données et information
Découvrir les mécanismes et l'efficacité des prédictions d'information à partir de données
Introduction
La quantité et la qualité des données personnelles détenues par les grandes plateformes sont directement proportionnelles à leurs profits. Cette accumulation se fait selon trois grandes étapes, où l'on file une métaphore végétale.
Modifier les comportement des utilisateur·ices pour extraire des données (culture)
Capter le maximum de données ainsi extraites (récolte)
Combiner algorithmiquement ces données pour prédire de l'information (transformation)
L'information ainsi monnayée est ré-injectée dans cette boucle, que l'on peut d'emblée nommer surveillance.
Captologie : l'art de changer les comportements
Un champ de recherche relativement ignoré
Définition : Captologie
Computers As Persuasive TechnOLOGY
Étude de l'informatique et des technologies numériques comme outils de persuasion et de changement des comportements (Fogg, 1998).
Fogg est loin d'être un méchant de film.
[La design comportemental (ndlr : une discipline soeur de la captologie) pourrait être utilisée] par les hôpitaux pour soigner les diabétiques, les organismes financiers pour aider les gens à épargner, et les ONG pour lutter contre le dérèglement climatique (Fogg, 2019).
Remarque : Ressemblances
Porosité avec la théorie du nudges (ou paternalisme libéral), lit. « coup de pouce ».
Exemples :
Mettre l'imprimante en recto-verso par défaut
La SNCF qui met des messages « motivants » sur les escaliers pour fluidifier le traffic
Mettre des fausses mouches au fond des urinoirs pour inciter les utilisateurs à bien viser
Supposer le consentement par défaut du don d'organe
Exemple :
Chaque case est associée avec un manuel donnant les grandes étapes pour promouvoir le comportement souhaité.
Complément : Fogg croit dans un équilibre de la Force
Si je n'étais pas optimiste quant à la nature humaine, je serais inquiet pour l'avenir. Mais je suis optimiste. Je crois que nous, les humains, sommes fondamentalement bons. Maintenant que la technologie de persuasion est mise entre les mains de millions de personnes (par exemple, ma mère peut créer un groupe sur Facebook et influencer des centaines, des milliers, voire des millions de personnes), les outils permettant de créer ces systèmes ne sont plus réservés aux personnes hautement qualifiées ou aux grandes entreprises. De plus en plus de gens ordinaires peuvent créer des sites web, des applications, des contacts, et c'est une bonne chose, je crois, parce que les humains sont fondamentalement bons, parce qu'ils veulent faire de bonnes choses dans le monde.
En donnant à des millions de personnes les moyens de créer des expériences persuasives grâce à la technologie, nous aurons des milliers, voire des millions, de forces qui œuvreront pour un monde meilleur. Et je pense que cela compense l'aspect négatif : le pouvoir que les personnes malveillantes et les organisations corrompues gagneront grâce à la technologie de persuasion.
De la recherche à l'industrie
Nir Eyal est un ancien élève de Fogg à Standford. Cet ouvrage promet d'apprendre à créer des produits de type « habit-forming », c'est-à-dire qui construisent des habitudes. C'est un best-seller lu par tous les entrepreneurs de la tech.
Attention : Habitude ou addiction ?
Habit-forming products often start as a nice-to-haves (vitamins) but once the habit is formed, they become must-haves (painkillers).
Définition : Habitude
Behaviours done with little or no conscious thoughts (Eyal, 2014).
Méthode : Créer une habitude
Signal externe : qu'est-ce-qui amène l'utilisateur·ice à utiliser le produit ?
Action : quelle est l'action la plus simple à réaliser dans l'espoir d'une récompense ?
Récompense variable : comment équilibrer satisfaction et frustration imprévisibles ?
Engagement : comment donner envie à l'utilisateur·ice de s'engager au-delà de la récompense ? (c'est la phase où il est le plus réceptif)
La répétition est importante : plus les utilisateur·ices passent par ces étapes, plus iels ont des chances de s'engager spontanément (self-trigger).
Remarque : Boîte de Skinner
Les recherches sur le caractère addictif ne sont pas nouvelles : les expériences animales sur le conditionnement opérant montrent qu'une récompense variable en réponse à un comportement appris augmente la fréquence du comportement (Skinner, 1930).
Exemple : Application aux plateformes
Signal externe : notifications, mails, icône visible, rappel d'une todo-list...
Action : ouvrir une application, acheter en un clic, partager un contenu, swipe...
Récompense variable : (non-)réactions, (non-)match, trouver le contenu recherché, (non-) badges ou achievements...
Engagement : produire du contenu, ajuster les préférences, gérer ses abonnements, apprendre de nouvelles fonctionnalités, obtenir des rapports de performances... et chargement du prochain trigger.
Renforcer l'addiction
Exemple : Créer l'inertie
Scroll infini
Recommandations
Lecture automatique
Exemple : Créer de l'urgence
Peur de la perte d'assets virtuels (e.g. 🔥)
Suggestions FOMO (Fear of Missing Out)
Exemple : Exploiter les affects
Les contenus polarisants (positifs ou négatifs) renforcent l'engagement actif (réaction, partage, commentaire, etc) (Berget et Milkman, 2009).
Conclusion
On peut penser les processus amenant la multiplication des données disponibles en deux étapes :
Germination : tout ce qui donnera des informations sur les motivations intrinsèques (voire les failles psychologiques) de l'utilisateur·ice, ce qui fonctionne pour l'hameçonner : les triggers s'affinent et gagnent en efficacité.
Croissance : tout ce qui va permettre d'en apprendre plus sur les caractéristiques (morales, politiques, religieuses...) de l'utilisateur : ce sont les stratégies permettant d'augmenter les interactions à l'intérieur du produit.
Pisteurs : capter et centraliser les données
À l'intérieur des plateformes
Fondamental : Donnée disponible et donnée captée
Les mécanismes captologiques augmentent les interactions donc la quantité de données disponibles sur les utilisateur·ices.
La captologie est essentiellement un outil de génération de données pour les GAFAM.
Les grandes plateformes, dont l'économie repose sur les données personnelles, doivent fournir un effort supplémentaire pour récolter ces données « dans la nature ».
Attention : Signaux faibles
Les données en question peuvent être extrêmement précises : temps passé devant une publication sans cliquer, vitesse de défilement, vitesse de frappe au clavier...
À l'extérieur des plateformes
Définition : Cookie
Inventé en 1994, le cookie est un fichier texte brut constitué de paires clé-valeur échangé par le protocole de communication HTTP. Créé par un serveur HTTP, le cookie est envoyé au client HTTP pour être enregistré un temps spécifié durant lequel il est renvoyé tel quel au serveur à chaque requête. La durée d'enregistrement peut s'étendre de quelques minutes à quelques années. (Wikipédia).
Définition : Cookie tiers
Il s'agit d'un cookie concernant un domaine tiers (dont une ressource est chargée par la page principale). L'intérêt du cookie tiers réside dans la possibilité de tracer la navigation d'un·e internaute.
Définition : Analyse d'audience
Les principaux GAFAM développent des outils d'analyse d'audience à destinations des administrateurs de sites web (marchands ou non) et d'applications mobiles (via les SDK).
La promesse est de donner une idée très précise du type de public, des actions effectuées, etc.
Exemple : Google Analytics
Méthode : Intégrer un suivi d'audience sur son site web
Il suffit usuellement de rajouter un morceau de code JavaScript. En 2025, le site Suicide Écoute, premier résultat de recherche d'aide sur Google, intègre par exemple le code suivant.
function gtag() { dataLayer.push(arguments); }
gtag("set", "linker", { "domains": ["www.suicide-ecoute.fr"] });
gtag("js", new Date());
gtag("set", "developer_id.dZTNiMT", true);
gtag("config", "G-06DS76NYVV");
// Plus loin dans le code...
<a href="tel:0145394000" onclick="ga('send','event','Phone','Click To Call','Phone')";
Centralisation des données
Fondamental : Pistage inter-outils
Les pisteurs sur chaque site web ou application mobile ne sont pas indépendants. Les utilisateur·ices sont suivi·es :
Par l'identifiant unique enregistré dans le cookie (web) ;
Par l'identifiant publicitaire unique géré par l'OS mobile (iOS ou Android).
Attention : Oligopole analytique
Remarque : Smartphones : un rêve éveillé
Les smartphones centralisent d'emblée des données sensibles difficiles à obtenir par ailleurs : réseau relationnel, conversations, localisation, habitudes de consommation, données cardiaques, humeur, sommeil, cycle menstruel, opinions politiques, orientation sexuelle, situation économique, situation romantique, handicaps…
Noter qu'Apple a un monopole total en matière de publicité sur iOS, sans amélioration de la privacy par rapport à Android (contrairement à son image publique).
Attention : Smartphones et données de santé
For most of the 20 000 medical and health and fitness apps analysed, we found that most can collect and potentially share data with third parties (Ikram et al., 2021).
Des données brutes à la prédiction
Données et information
Définition : Information
Ici, on entend une information comme une prédiction réalisée à partir d'un grand nombre de points de données bruts.
Remarque : Émergence
On peut considérer une information comme une propriété émergente, c'est-à-dire une entité qui est plus que la somme de ses parties. C'est l'utilisation de modèles statistiques entraînés sur d'immenses quantités de données (machine learning) qui permet de faire émerger quelque chose de nouveau.
Prédictions de traits psychologiques
Exemple : Remplacer les évaluations psychologique ?
En 2019, un papier compile des études sur la prédictions des caractéristiques suivantes : émotions, bien-être, QI, qualité d'écriture, aisance verbale, valeurs morales, orientation sexuelle, orientation politique, appréciations des marques, traits OCEAN (Nettle, 2009), curiosité, autisme, dépression, dyslexie, psychopathie et stress.
Les technologies actuelles peuvent déjà déduire des informations probabilistes sur nos états mentaux et nos traits psychologiques et nous classer d'une manière qui dépasse les formes traditionnelles d'évaluation psychologique. […] À mesure que les types et la quantité d'interactions entre nous et nos appareils en ligne augmentent et que de nouveaux types de capteurs pour mesurer les signaux comportementaux sont développés, on s'attend à ce qu'en combinant ces sources d'information, un algorithme de Machine Learning (ML) puisse former une image très précise de nous. (Burr et Cristianini, 2019).
Exemple : Des signaux faibles à l'information
Toutes les prédictions ne se valent pas
Attention : Exactitude
La presse a tendance à surévaluer l'exactitude des prédictions algorithmiques. En 2012, le New York Times publiait un article influent, encore cité aujourd'hui. Il entendait notamment montrer comment un supermarché avait prédit la grossesse d'une jeune fille avant qu'elle ne le sache elle-même (Duhigg, 2012).
Pour autant, il omettait les notions d'exactitude, faux-positifs, faux-négatifs, précision, mémoire des données d'entraînement (Fraser, 2020).
Remarque :
La capacité de prédiction des algorithmes à base de machine learning est sujet à une hype massive, tant dans la littérature que dans l'opinion publique.
Pour autant, nombre de ces algorithmes performent extrêmement mal dans certaines situations.
Fondamental : Les prédictions sociales sont profondément dysfonctionnelles
Dans une étude co-écrites par 112 chercheur·ses, plus de 400 équipes spécialisées en machine learning ont tenté de prédire le devenir social de familles fragiles à partir de données collectées par les chercheur·ses pendant 15 ans (Salganik et al., 2020).
À partir de 13.000 variables (à 9 ans), l'idée était de prédire 6 variables (à 15 ans).
Les modèles en jeu sont issus de dizaines d'années de recherche et vendus par des entreprises avec des promesses particulièrement hautes.
Remarque : Les prédictions comportementales manquent d'évaluations
Certains alertent sur la possible sur-confiance donnée dans les prédictions comportementales des publicitaires.
Et si la publicité personnalisée promue par les géants du web n'était qu'un mirage ? Tim Hwang déconstruit le mythe promis aux annonceurs d'un accès sur mesure à chaque utilisateur ou utilisatrice de l'internet. Il dévoile, ce faisant, les pratiques spéculatives et les manipulations des grandes places de marché publicitaires, intimement liées aux monopoles du web.
Attention : Politiques publiques et prédictions algorithmiques
En général, les tribunaux utilisent ces systèmes pour évaluer la probabilité de récidive ou de fuite des personnes en attente de jugement ou des délinquants dans le cadre des procédures de libération sous caution et de libération conditionnelle. Par exemple, l'algorithme bien connu de la Fondation Arnold, qui est en cours de déploiement dans 21 juridictions aux États-Unis (Dewan, 2015), utilise 1,5 million d'affaires pénales pour prédire le comportement des défendeurs dans la phase précédant le procès. De même, la Floride utilise des algorithmes d'apprentissage automatique pour fixer le montant des cautions (Eckhouse, 2017). Ces systèmes sont également utilisés pour déterminer les besoins criminogènes des délinquants, qui pourraient être modifiés par un traitement, et pour surveiller les interventions dans les procédures de condamnation (Kehl et Kessler, 2017).
L'étude des biais algorithmiques sort du cadre de ce cours. Les lectaires intéressé·es pourront se référer à Schuilenburg et Peeters, 2021.
Conclusion
La surveillance n'est ni l'observation seule ni le contrôle : elle consiste à comprendre et influencer les choix [...] Les pratiques de surveillance obéissent aux impératifs de rentabilité : elles transforment l'information en capital et non en pouvoir. Contrôler, c'est réguler. Surveiller, c'est observer et produire de l'information [...] L'économie de la surveillance est une conception du monde où les individus et leurs choix peuvent être compris comme des procédures marchandes que l'on peut influencer, analyser, mesure à travers le recueil d'informations, c'est-à-dire l'accumulation de données et de sens. À ce titre, production et consommation sont les interactions sociales qui génèrent de l'information et, donc, de la surveillance (Masutti, 2020).
Consommation et production sont à comprendre au sens large : c'est le cadre marchand dans lequel toutes les actions des personnes sont catégorisées. En d'autres termes, l'économie de la surveillance rationalise tout selon des règles économiques.
Synthèse
Questions
Montrer en quoi un réseau social de votre choix (Instagram, Tiktok, Facebook...) applique la méthode décrite par Nir Eyal.
Comment et pourquoi les GAFAM parviennent-ils à obtenir des données de personnes qui n'utilisent pas leurs produits ?
Quels sont les types de prédictions les plus exactes produites par les algorithmes de machine learning actuels ? Proposer une vision critique de la pertinence de l'exactitude dans le cadre de l'économie de la donnée.
Concepts
Captologie
Récompense variable
Cookie
Prédiction
Surveillance