Objectifs
Découvrir la captologie, champ de recherche devenu une référence de design pour les plateformes
Comprendre comment les plateformes utilisent la captologie pour récolter des données
Comprendre les infrastructures techniques permettant aux plateformes de récolter des données en dehors de leurs services
Comprendre la différence entre données et information
Connaître les mécanismes et l'efficacité des prédictions d'information à partir de données
Captologie : l'art de changer les comportements
Un champ de recherche relativement ignoré
Définition : Captologie
Computers As Persuasive TechnOLOGY
Étude de l'informatique et des technologies numériques comme outils de persuasion et de changement des comportements (Fogg, 1998).
Fogg est loin d'être un méchant de film.
[La design comportemental (ndlr : une discipline soeur de la captologie) pourrait être utilisée] par les hôpitaux pour soigner les diabétiques, les organismes financiers pour aider les gens à épargner, et les ONG pour lutter contre le dérèglement climatique (Fogg, 2019).
Remarque : Ressemblances
Porosité avec la théorie du nudges (ou paternalisme libéral), lit. « coup de pouce ».
Exemples :
Mettre l'imprimante en recto-verso par défaut ;
La SNCF qui met des messages « motivants » sur les escaliers pour fluidifier le trafic ;
Mettre des fausses mouches au fond des urinoirs pour inciter les utilisateur·ices à bien viser ;
Supposer le consentement par défaut du don d'organe.
Exemple :
Complément : Fogg croit dans un équilibre de la Force
Si je n'étais pas optimiste quant à la nature humaine, je serais inquiet pour l'avenir. Mais je suis optimiste. Je crois que nous, les humains, sommes fondamentalement bons. Maintenant que la technologie de persuasion est mise entre les mains de millions de personnes (par exemple, ma mère peut créer un groupe sur Facebook et influencer des centaines, des milliers, voire des millions de personnes), les outils permettant de créer ces systèmes ne sont plus réservés aux personnes hautement qualifiées ou aux grandes entreprises. [...] Et je pense que cela compense l'aspect négatif : le pouvoir que les personnes malveillantes et les organisations corrompues gagneront grâce à la technologie de persuasion.
Fogg, 2012 (je souligne)
De la recherche à l'industrie
Définition : Habitude
Behaviours done with little or no conscious thoughts (Eyal, 2014).
Méthode : Créer une habitude
Signal externe : qu'est-ce-qui amène l'utilisateur·ice à utiliser le produit ?
Action : quelle est l'action la plus simple à réaliser dans l'espoir d'une récompense ?
Récompense variable : comment équilibrer satisfaction et frustration imprévisibles ?
Engagement : comment donner envie à l'utilisateur·ice de s'engager au-delà de la récompense ? (c'est la phase où il est le plus réceptif)
La répétition est importante : plus les utilisateur·ices passent par ces étapes, plus iels ont des chances de s'engager spontanément (self-trigger).
Remarque : Boîte de Skinner
Les recherches sur le caractère addictif ne sont pas nouvelles : les expériences animales sur le conditionnement opérant montrent qu'une récompense variable en réponse à un comportement appris augmente la fréquence du comportement (Skinner, 1930).
Attention : Habitude ou addiction ?
Hooked, he stresses, was about building positive habits; it urged companies to improve people’s lives. [...] Further, he says, we need to stop using the word « addicted » when it comes to technology – because most of us aren’t addicted at all; we’re just guilty of overuse. “Addiction, in people’s minds, means mind control,” he says. « When you tell yourself, this is addicting me, this is hijacking my brain… you slough off responsibility. It’s called learned helplessness. »
Eyal, cité par Mahdawi, 2019
Renforcer l’habitude
Exemple : Inertie
Scroll infini
Recommandations
Lecture automatique
Exemple : Urgence
Peur de la perte d'assets virtuels (e.g. 🔥)
Suggestions FOMO (Fear of Missing Out)
Exemple : Affects
Les contenus polarisants (positifs ou négatifs) renforcent l'engagement actif (réaction, partage, commentaire, etc) (Berget et Milkman, 2009).
Pisteurs : capter et centraliser les données
À l'intérieur des plateformes
Fondamental : Donnée disponible et donnée captée
Les mécanismes captologiques augmentent les interactions donc la quantité de données disponibles sur les utilisateur·ices.
La captologie est essentiellement un outil de génération de données pour les Big Tech.
Elles doivent fournir un effort supplémentaire pour récolter ces données, que l’on ne détaille pas ici, mais qui consiste à écrire du code spécifique pour détecter et capter les événements, exploiter le maximum de permissions possibles sur les smartphones, etc.
Attention : Signaux faibles
Les données en question peuvent être extrêmement précises : temps passé devant une publication sans cliquer, vitesse de défilement, vitesse de frappe au clavier...
À l'extérieur des plateformes
Définition : Cookie
Inventé en 1994, le cookie est un fichier texte brut constitué de paires clé-valeur échangé par le protocole de communication HTTP. Créé par un serveur HTTP, le cookie est envoyé au client HTTP pour être enregistré un temps spécifié durant lequel il est renvoyé tel quel au serveur à chaque requête. La durée d'enregistrement peut s'étendre de quelques minutes à quelques années. (Wikipédia).
Définition : Cookie tiers
Exemple : Google Analytics
Méthode : Intégrer un suivi d'audience sur son site web
Il suffit usuellement de rajouter un morceau de code JavaScript. En 2025, le site Suicide Écoute, premier résultat de recherche d'aide sur Google, intègre par exemple le code suivant.
function gtag() { dataLayer.push(arguments); }
gtag("set", "linker", { "domains": ["www.suicide-ecoute.fr"] });
gtag("js", new Date());
gtag("set", "developer_id.dZTNiMT", true);
gtag("config", "G-06DS76NYVV");
// Plus loin dans le code...<a href="tel:0145394000" onclick="ga('send','event','Phone','Click To Call','Phone')";
Centralisation des données
Fondamental : Pistage inter-outils
Les pisteurs sur chaque site web ou application mobile ne sont pas indépendants. Les utilisateur·ices sont suivi·es :
Par l'identifiant unique enregistré dans le cookie (web) ;
Par l'identifiant publicitaire unique géré par l'OS mobile (iOS ou Android).
Attention : Oligopole analytique
Attention : Smartphones et données de santé
For most of the 20 000 medical and health and fitness apps analysed, we found that most can collect and potentially share data with third parties (Ikram et al., 2021).
Des données brutes à la prédiction
Données et information
Définition : Information
Ici, on entend une information comme une prédiction réalisée à partir d'un grand nombre de points de données bruts.
Remarque : Émergence
On peut considérer une information comme une propriété émergente, c'est-à-dire une entité qui est plus que la somme de ses parties. C'est l'utilisation de modèles statistiques entraînés sur de grandes quantités de données (machine learning) qui permet de faire émerger quelque chose de nouveau.
Prédictions de traits psychologiques
Exemple : Remplacer les évaluations psychologique ?
En 2019, un papier compile des études sur la prédictions des caractéristiques suivantes : émotions, bien-être, QI, qualité d'écriture, aisance verbale, valeurs morales, orientation sexuelle, orientation politique, appréciations des marques, traits OCEAN (Nettle, 2009), curiosité, TSA, dépression, dyslexie, psychopathie et stress.
Les technologies actuelles peuvent déjà déduire des informations probabilistes sur nos états mentaux et nos traits psychologiques et nous classer d'une manière qui dépasse les formes traditionnelles d'évaluation psychologique. […] À mesure que les types et la quantité d'interactions entre nous et nos appareils en ligne augmentent et que de nouveaux types de capteurs pour mesurer les signaux comportementaux sont développés, on s'attend à ce qu'en combinant ces sources d'information, un algorithme de Machine Learning (ML) puisse former une image très précise de nous.
Exemple : Des signaux faibles à l'information
Le statut singulier des LLM/LRM
Une collecte (pour l’heure) non-marchande
A significant portion of online content involves information about people, so our training data may incidentally include personal information. However, we do not intentionally collect personal information for the purpose of training our models.
OpenAI, 2025 (consulté le 11/11/2025)
When you use our services for individuals such as ChatGPT, Codex, and Sora, we may use your content to train our models.
OpenAI, 2025 (consulté le 11/11/2025)
Attention : Des rustines éphémères
To build that safety system, OpenAI took a leaf out of the playbook of social media companies like Facebook, who had already shown it was possible to build AIs that could detect toxic language like hate speech to help remove it from their platforms. The premise was simple: feed an AI with labeled examples of violence, hate speech, and sexual abuse, and that tool could learn to detect those forms of toxicity in the wild. That detector would be built into ChatGPT to check whether it was echoing the toxicity of its training data, and filter it out before it ever reached the user. It could also help scrub toxic text from the training datasets of future AI models.
To get those labels, OpenAI sent tens of thousands of snippets of text to an outsourcing firm in Kenya, beginning in November 2021. Much of that text appeared to have been pulled from the darkest recesses of the internet. Some of it described situations in graphic detail like child sexual abuse, bestiality, murder, suicide, torture, self harm, and incest.
Exemple : o3-deep-reasearch : quel sens donner au mot « public » ?
Quentin’s online presence is closely tied to his work with Picasoft and the free-software community, often under his handle “<XXX>.” [...] Under the pseudonym <XXX>, Quentin engages with a broader tech audience. For instance, he developed <YYY> [...]. As “<XXX>” he has contributed to community forums: on <ZZZ> (a French open-source news site), [...] On the CHATONS forum, Quentin posted as <XXX> in <YEAR> to introduce a backup-sharing initiative, explicitly stating, « <EXTRAIT> » . In that post he described his dual role as a Picasoft volunteer and a part-time engineer on a research project at UTC [...]. Overall, the alias “<XXX>” is consistently linked to Quentin [...].
o3-deep-research, 2025
Toutes les prédictions ne se valent pas
Attention : Exactitude
La presse a tendance à surévaluer l'exactitude des prédictions algorithmiques. En 2012, le New York Times publiait un article influent, encore cité aujourd'hui. Il entendait notamment montrer comment un supermarché avait prédit la grossesse d'une jeune fille avant qu'elle ne le sache elle-même (Duhigg, 2012).
Pour autant, il omettait les notions d'exactitude, faux-positifs, faux-négatifs, précision, mémoire des données d'entraînement (Fraser, 2020).
Remarque :
La capacité de prédiction des algorithmes à base de machine learning est sujet à une hype massive, tant dans la littérature que dans l'opinion publique.
Pour autant, nombre de ces algorithmes performent extrêmement mal dans certaines situations.
Fondamental : Les prédictions sociales sont profondément dysfonctionnelles
Dans une étude co-écrites par 112 chercheur·ses, plus de 400 équipes spécialisées en machine learning ont tenté de prédire le devenir social de familles fragiles à partir de données collectées par les chercheur·ses pendant 15 ans (Salganik et al., 2020).
À partir de 13.000 variables (à 9 ans), l'idée était de prédire 6 variables (à 15 ans).
Remarque : Les prédictions comportementales manquent d'évaluations
Attention : Politiques publiques et prédictions algorithmiques
[L]'algorithme bien connu de la Fondation Arnold, qui est en cours de déploiement dans 21 juridictions aux États-Unis, utilise 1,5 million d'affaires pénales pour prédire le comportement des défendeurs dans la phase précédant le procès. De même, la Floride utilise des algorithmes d'apprentissage automatique pour fixer le montant des cautions. Ces systèmes sont également utilisés pour déterminer les besoins criminogènes des délinquants, qui pourraient être modifiés par un traitement, et pour surveiller les interventions dans les procédures de condamnation.
Conclusion
La surveillance n'est ni l'observation seule ni le contrôle : elle consiste à comprendre et influencer les choix [...] Les pratiques de surveillance obéissent aux impératifs de rentabilité : elles transforment l'information en capital et non en pouvoir. Contrôler, c'est réguler. Surveiller, c'est observer et produire de l'information [...] L'économie de la surveillance est une conception du monde où les individus et leurs choix peuvent être compris comme des procédures marchandes que l'on peut influencer, analyser, mesure à travers le recueil d'informations, c'est-à-dire l'accumulation de données et de sens. À ce titre, production et consommation sont les interactions sociales qui génèrent de l'information et, donc, de la surveillance.
Consommation et production sont à comprendre au sens large : c'est le cadre marchand dans lequel toutes les actions des personnes sont catégorisées. En d'autres termes, l'économie de la surveillance rationalise tout selon des règles économiques.
Synthèse
Questions
Montrer en quoi un réseau social de votre choix (Instagram, Tiktok, Facebook...) applique la méthode décrite par Nir Eyal.
Comment et pourquoi les Big Tech parviennent-elles à obtenir des données de personnes qui n'utilisent pas leurs produits ?
Quels sont les types de prédictions les plus exactes produites par les algorithmes de machine learning actuels ? Proposer une vision critique de la pertinence de l'exactitude dans le cadre de l'économie de la donnée.
Concepts
Captologie
Récompense variable
Cookie
Prédiction comportementale
Surveillance
Donnée publique
Apprentissage par renforcement à partir de rétroaction humaine (RLHF)












