Le marché de la publicité numérique
On va chercher à étudier les mécanismes internes de la publicité en ligne dans le but de mieux comprendre la stratégie des acteurs de la donnée.
Fonctionnement général
Fondamental : Personnalisation
La publicité en ligne est systématiquement personnalisée, c'est-à-dire basée sur le ciblage de données personnelles.
C'est un écosystème complexe, opaque et peu connu. Les sommes en jeu sont colossales, de l'ordre de 500 milliards de dollars ( Grand View Research[1]).
Méthode : Passer une annonce
Les client·es des régies publicitaires définissent un message à faire passer, un public à cibler et un budget moyen, souvent par jour.
Les régies estiment les « performances » réalisables avec ce budget (nombre d'impressions, nombre de clics, etc.).
Méthode : De l'annonce à l'impression
Les différents annonceurs sont en compétition pour l'affichage de leurs annonces.
Chaque emplacement disponible est vendu aux enchères, auxquelles participent tous les annonceurs intéressés.
Un emplacement est associé à des métadonnées (URL, langue, thème...) et à des données sur l'utilisateur·ice (dont la qualité dépend du ciblage antérieur).
Le placement des publicités doit se faire en un temps très faible (quelques millisecondes). Des algorithmes sont en compétition pour faire la meilleure offre.
De la personnalisation à la prédiction
Les annonceurs combinent généralement les données personnelles dont ils disposent avec des informations contextuelles (période de l'année, goûts du cercle social, tendance à cliquer sur des publicités...) pour prédire si un·e utilisateur·ice cliquera sur une publicité.
Les algorithmes utilisés sont de type machine learning.
Exemple : Facebook Ads

Noter comme les paramètres de ciblage ne sont pas nécessairement connus par Facebook : ils sont alors prédits.

Conceptuellement, choisir la bonne annonce pour le bon utilisateur est assez simple. Nous extrayons les annonces d'une base de données, nous les classons en fonction de la probabilité que l'utilisateur clique dessus, nous lançons un processus d'enchères pour choisir la meilleure et nous la présentons enfin à l'utilisateur.
(Damien Benveniste, ex-«Machine Learning Tech Lead » à Meta.)
Nous devons réfléchir aux différents acteurs du processus : les utilisateurs, les publicités et le contexte. Meta dispose d'environ 10 000 caractéristiques qui décrivent le comportement de ces acteurs.
Méthode : Publicité programmatique
Pour chaque emplacement disponible, c'est le plus haut prix proposé qui remporte l'enchère, celui-ci étant supposé optimiser le prix dépensé par le client pour le retour sur investissement final.
Attention : Course à l'armement
Cette compétition pour optimiser le coût d'un produit hautement spéculatif rappelle l'algorithmisation de la finance.
Exemple : Google Ads
Google Ads revendique une diffusion sur 35 millions de sites web, auxquels il faut ajouter Gmail et YouTube.
Google propose des enchères automatisées basées sur plusieurs algorithmes de machine learning.
Complément : Après l'impression
Les rapports sur les stratégies d'enchères Google Ads offrent un aperçu des performances de vos stratégies d'enchères automatiques. Ils incluent des métriques personnalisées pour vous présenter les éléments les plus pertinents concernant chaque type de stratégie, ainsi que d'autres données importantes comme l'état de votre stratégie, les principaux signaux, les simulateurs de cibles et de budgets, le CPA cible moyen, le ROAS cible moyen et le délai de conversion.
Le délai de conversion désigne le temps entre le clic et le comportement souhaité. Les clients Google Ads ont accès à de nombreux outils pour injecter ces données, même pour des achats en boutique. Les clients finaux sont in fine suivis au long court.