La data selon Weborama

  • 507 views
Uploaded on

 

More in: Career
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
    Be the first to like this
No Downloads

Views

Total Views
507
On Slideshare
0
From Embeds
0
Number of Embeds
0

Actions

Shares
Downloads
15
Comments
0
Likes
0

Embeds 0

No embeds

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. la dataselon weborama
  • 2. dataApplicationde la segmentationd’audienceau pilotage du médiapar la
  • 3. L’universdataLa montée en puissance du digitalet les nouvelles possibilités qu’il offreen matière de publicité ont chamboulél’écosystème publicitaire qui, depuisl’âge d’or de Madison Avenue, étaitprincipalement fondé sur la création.Pour autant, il ne faut pas perdre de vueque la data (désormais à portée de maingrâce au plus jeune des médias)« n’est pas en train de tuer la créativité,mais simplement de changer notremanière de raconter des histoires. »(Alex Williams, journaliste Tech Crunch)*big* “(Data) is not killing creativity, it’s just changing how we tell stories”.
  • 4. ès l’apparition des métiers publi­citaires, les profes-sionnels du marke­ting ont rêvé de ne s’adresserqu’à des audiences utiles, c’est-à-dire poten-tiellement intéressées par leur offre. Le mondede la communication a connu de très bonneheure la définition de « cibles marketing » : laménagère de moins de 50 ans, les CSP+, lesearly adopters ou les seniors. Le développementdu marketing direct et des bases de données CRM– ou PRM – ont permis d’affiner et de préciser le ci-blage, et de s’adresser véritablement au consommateur.Le média Internet et les nouvelles technologies ont boule-versé le con­cept même de la cible. Le rêve devient désor-mais réalité puisque la navigation des internautes est tra-çable. Les annonceurs peuvent toucher leurs clients etprospects en se basant non seulement sur les actions déjàaccomplies par l’internaute (achat, demande de conseil,essai d’un produit, etc.), mais également sur ses besoinsfuturs, prédictibles grâce au suivi et à l’analyse mathéma-tique de leur comportement en ligne.Le phénomène Big Data prend de l’ampleur, les marquespeuvent désormais centraliser et exploiter toutes les sour-ces de données disponibles, qu’elles soient offline ou on-line, média ou CRM. Avec comme finalité, d’une part, d’en-richir la connaissance de leurs clients avec les données denavigation sur Internet pour mieux les fidéliser, et d’autrepart de créer des bases d’internautes potentiellementacheteurs de leurs produits et services.« J’ai en tête cette fameuse illustration de Pierre Steinerparue dans le New Yorker en 1993 : “Sur Internet, person-ne ne sait que vous êtes un chien.” De nos jours, ce seraitdavantage : “Sur Internet, tout le monde sait quelle mar-que de nourriture pour chien vous achetez.”*.Le Big Data ne concerne pas seulement le marketing,même si ce secteur en tire évidemment les bénéfices.Il y a également la finance, la santé, le sport, la météorolo-gie… Selon le journaliste John Edwards, « Comme la mortet les impôts, la météo est une certitude. Et, grâce au BigData, elle est désormais une certitude plus prévisible. »**Dans tous ses domaines, le Big Data confère plusieursavantages déterminants : la fiabilité, la fraîcheur et la perti-nence des données. Pourtant, à l’état brut, les données nepossèdent pas de valeur. Les technologies adaptées etl’intelligence humaine sont nécessaires pour leur donnerdu sens.Les difficultés liées au Big Data concernent surtout le vo-lume et l’hétérogénéité des données qui doivent être trai-tées à très grande vitesse. Stephen Gold (IBM) estime en2012 que « 90 % de l’ensemble des données du monde ontété créées ces deux dernières années ». Mais le grand en-jeu pour tout data scientist n’est pas seulement de dispo-ser d’un espace de stockage illimité ou de mettre au pointdes algorithmes rapides et puissants : il s’agit de rendre ladata pertinente et vivante, de la faire parler, ce qui consti-tue une tâche plus complexe.Comme exemple : un algorithme se donne pour but dedéceler les lieux de vie d’une personne, ingérant les don-nées de géolocalisation liées à son mobile. Les premiersrésultats aboutissent à trois lieux : le domicile de la per-sonne, son bureau et... un feu rouge sur une grande ar-tère. Sans intelligence humaine, les traitements du BigData ne peuvent aboutir à un résultat pertinent.Pour relever ces défis, le Big Data puise non seulementdans les technologies les plus modernes, mais aussidans les acquis scientifiques du passé. La mise au point detests statistiques d’hypothèse, des premiers arbres de dé-cision, très utilisés dans le domaine de la SegmentationMarketing, date de 1900. Ces modèles continuent d’êtreaméliorés aujourd’hui. À l’inverse, « Map Reduce » est unalgorithme de traitement de la donnée moderne, fondésur un mode de calcul des données distribué en parallèle,très en vue dans le monde du Big Data, apparu en 2004.Les nouveaux modèles de stockage (par exemple le cloud)et de bases de données rendent en partie obsolète lesbases relationnelles comme SQL. L’univers du Big Data esten mouvement perpétuel.En ce qui concerne les experts data, ils possèdent descompétences variées. Mais ce qu’ils ont tous en commun,c’est l’ouverture aux nouvelles technologies et la capacitéà les accorder aux acquis (théorèmes, algorithmes) parfoisanciens. Une connaissance historique des mathématiqueset des statistiques est un atout de tout expert data.“I think of thatfamous 1993 NewYorker cartoonby Peter Steiner:‘On the Internet,nobody knowsyou’re a dog.’Now it’s morelike, ‘On theInternet,everybody knowswhat brandof dog foodyou buy”*.Geoff Nunbergenseigne lalinguistique àl’université deCalifornie, àBerkeley. Il estl’auteur de TheWay We TalkNow, GoingNucular, TalkingRight and TheYears of TalkingDangerously. Sondernier ouvrageparu est Ascentof the A-Word. Ilintervient commeconsultantlinguistique dansl’émissionde NPR Fresh Air,animée par TerryGross.D’aprèsDouglasMerrill,fondateuret CEO deZestFinance.com, « With toolittle data, youwon’t be ableto make anyconclusions thatyou trust. Withloads of datayou will findrelationshipsthat aren’t real…Big data isn’tabout bits, it’sabout talent  ».(Avec trop peude données,vous ne serez pascapables de tirerdes conclusionsdans lesquellesvous puissiezavoir confiance.En collectant destas de données,vous allez établirdes relationsqui ne sontpas réelles…Le Big Data n’estpas une affairede bits,mais de talent).“Likedeath and taxes,weather isa certainty. And,thanks to BigData, it’s now amore predictablecertainty”.***
  • 5. la visiondatasciencede weborama‘‘ ‘‘La data au cœur de l’activitéde WeboramaDepuis sa création il y a 15 ans, Weborama est enga-gée dans la science de la data au service du marke-ting en ligne.Pionnier de l’innovation technologique sur son marché,Weborama investit constamment dans son service R&D,dont l’effectif constitue 52 % des effectifs totaux de la so-ciété. La data est au cœur de son expertise, grâce aux datastrategists, aux consultants data, aux linguistes-informati-ciens, aux statisticiens, aux mathématiciens et aux déve-loppeurs.Le Big Data est aujourd’hui le moteur des développementsde Weborama et il continuera de l’être dans le futur. Avectoujours le même souci de collecter des données anony-mes, l’individu bénéficie des recherches et des étudesconstruites et calibrées sur la masse.Le respect de la vie privéeDepuis sa fondation en 1998, Weborama porte une at-tention particulière au respect de la vie privée des in-ternautes. La société participe activement aux nombreuxchantiers e-privacy de l’industrie digitale française.Précurseur dans le domaine, Weborama milite depuisplusieurs années pour la transparence des acteurs de sonmarché envers les consommateurs. Parmi les nombreusesinitiatives entreprises par la société, la co-rédaction du li-vre blanc « Ciblage publicitaire et respect de l’internaute »de l’IAB, signature de la charte paneuropéenne de la publi-cité comportementale ou bien de la charte de l’Union fran-çaise du marketing direct et digital (UFMD).En accord avec les législations en vigueur, les internautespeuvent se désinscrire à tout moment du programme decollecte de Weborama, soit à partir d’opt-out sur le sitedu groupe, soit via l’icône Ad Choices, présente sur toutepublicité ciblée et renvoyant vers le site YourOnlineChoi-ces de l’IAB Europe.
  • 6. Les questions de la vie privée des internautes ont fait l’ob-jet de l’ouvrage d’Alain Levy, président de Weborama,« Sur les traces de Big Brother, la vie privée à l’ère numéri-que »*. Prônant l’importance de l’éducation du grand publicau digital, il conclut : « […] Pour que les internautes accep-tent cette quête incessante de données, il est fon­damentalque les sociétés de ce domaine soient mieux connues dugrand public, en communiquant davantage sur leurs prin-cipes éthiques, et en consolidant un socle de bonnes prati-ques. […] Elles doivent engager le dialogue avec leursclients, leurs salariés, leurs actionnaires, leur environnementpolitique, les associations, les consommateurs. […] Nous ne“fliquons” personne. Nous essayons de mieux comprendreles goûts et les habitudes des internautes afin de ne lesexposer qu’à des messages qui collent à leur profil et ré-pondent à leurs attentes. C’est l’application du principe dedéveloppement durable à la publicité. »Une vision sémantiqued’InternetL’approche « Data science » de Weborama consiste àcollecter et à traiter les données, afin de les analyseret de les segmenter de façon à ce qu’elles puissent êtredéployées au sein des campagnes publicitaires. Webo-rama considère le web comme un espace lexical infini oùles mots entretiennent des relations de proximité ou dedistance en fonction du contexte dans lequel ils apparais-sent, tel que ce contexte est révélé par les requêtes desinternautes (le « search ») et par le contenu lexical des sitesqu’ils visitent (le « surf »). Provenant de 300 000 sites sour-ces, les données sont collectées de façon anonyme, via lescookies, et instantanément traitées. Cette classification del’audience constitue un processus stratégique au sein dechaque base de données.Grâce à cette méthodologie, Weborama dispose d’unebase de données de 110 millions de profils comportemen-taux, sociodémographiques et intentionnistes en Europe,dont 70 millions en France.33 M d’urls actives300 000 sites analysés chaque jour110 M de profils actifs par mois3,5 M d’internautes qualifiés par jour25 mots par jour et par internauteWeborama identifie ce jour près de 200 clusters (centresd’intérêt) basés sur le comportement des internautes etrépartis dans 23 segments (un segment étant une « fa-mille » de clusters).La base sociodémographique de Weborama est cons­truite à partir d’un panel. Celui-ci est constitué de300 000 in­ternautes actifs en France ayant répondu à unquestionnaire de leur plein gré et ayant renseigné leur âge,sexe et catégorie socioprofessionnelle. Grâce au croise-ment des clusters comportementaux et du panel sociodé-mographique de Weborama, les données du panel sontextrapolées à l’ensemble de la base.La technologie au servicede la « data science »L’ensemble des solutions de Weborama est alimentépar les technologies brevetées, basées sur les algo-rithmes propriétaires et le traitement automatique du lan-gage (TAL). La robustesse des outils de collecte et destockage, ainsi que la solidité de l’infrastructure, permet-tent le traitement instantané de très importants volumesde données.Grâce à la navigation intuitive, la dimension technologi-que s’efface au profit d’une expérience utilisateur cen-trée sur la data.*Alain Levy, « Sur les traces de Big Brother, la vie privée à l’ère numérique »,l’Éditeur, 2010, Paris.
  • 7. - Weborama Audience Insight (outil d’analyse compor-tementale d’audience des sites Internet) ;Technology :- Weborama Campaign Manager (outil d’adservingpermettant la gestion et l’optimisation des campagnespublicitaires).Grâce à ces outils, Weborama réussit le passage de lamicro donnée au Big Data, c’est-à-dire d’une suite d’évé-nements insignifiants produits par l’internaute lors de sanavigation, à la construction de son profil marketingcomplet.annonceurs- Data CRM- Data du site Internet- Data médiaéditeurs- Data relativeà l’audience du sitetrackingad exchangesdata“3rdparty”Le déploiement du savoir-fairede Weborama au seindu marché publicitaireLa base de données 3rdparty* de Weborama, une véri-table source d’enrichissement des données 1stparty**,constitue le pilier de l’ensemble des outils mis à dispositiondes clients. L’efficacité de sa data est éprouvée par We-borama, son premier utilisateur depuis 15 ans, aussi bienau sein des campagnes publicitaires branding et perfor-mance (bundle data & media, proposé par Weborama ausein de sa plateforme publicitaire, Weborama AudienceExchange, et testé par rapport aux campagnes non-ci-blées), que pour les études marketing.Weborama propose trois solutions technologiques com-plémentaires et communicantes :Data science- Weborama Audience Manager (data managementplatform) ;*Données d’un acteur tiers, n’appartenant pas à un annonceur ou un éditeur,mais mises à sa disposition pour le déploiement au sein de ses actions marketingen ligne.** Données propriétaires d’un annonceur ou d’un éditeur.
  • 8. applications possibles de la&usage de ladatasciencedata3rdparty
  • 9. la segmentationpOUr les annonceursLa démarcheLes informations récoltées sur Internet constituent unevraie mine de savoir. Pour en tirer profit, il est néces-saire de traiter et d’analyser un volume de données dispo-nibles très important, après avoir déterminé celles qui sontsusceptibles d’améliorer le ROI digital d’un annonceur.Il existe de nombreuses techniques de ciblage des inter-nautes. Souvent basées sur les cibles marketing histori-ques de l’annonceur, ces techniques ne se montrent pastoujours aussi efficaces qu’on le voudrait. Pour déterminerles ciblages plus précis, il convient donc de regarder lesperformances des campagnes média, en prenant encomp­te le profil des internautes exposés ou « cliqueurs » etles données relatives aux « transformations » (souscrip-tions aux produits proposés par la campagne).La segmentation de l’audience d’un site Internet ou d’unecampagne publicitaire permet de déterminer les ciblesutiles en fonction de l’offre de l’annonceur. Ces ciblespourront être déployées au sein des campagnes média àvenir. Dans l’optique de l’extension d’audience, il est désor-mais possible de cibler les « look alike », c’est à dire les in-ternautes ayant le profil similaire à celui des internautesqui « transforment ». Cela permet de leur proposer une pu-blicité personnalisée en fonction de leur profil.Première application pratiquepar un annonceurLa première application de la segmentation d’audiencedes campagnes média a été réalisée en 2012. Ce dé-ploiement de la segmentation a eu lieu pour un annonceurdont le catalogue d’offres était très fourni, ce qui rendaitplus complexe la définition de ses cibles marketing. Bienque disposant d’une base CRM très fournie, cet acteursouhaitait mieux connaître les cibles potentiellement inté-ressées par chacune des offres et chacun des produits surle digital, dans une optique de recrutement de nouveauxclients, mais également de ventes croisées.L’objectif poursuivi était ainsi d’optimiser les campagnesdigitales pour augmenter le taux de transformations et li-miter la déperdition des investissements média. Pour at-teindre cet objectif, l’annonceur a fait appel à Weboramaafin de construire un dispositif correspondant à son cata-logue commercial.Méthodologie WeboramaLa segmentation d’audience pour les annonceurs com-prend plusieurs étapes. Après la phase de modélisa-tion, suit une phase de validation des modèles, puis unephase de tests au sein de campagnes média. La démarches’inscrit dans l’ensemble des processus data proposés parWeborama : collecte de la data brute, traitement, analyse,segmentation et enfin déploiement média.Dans le cadre de la segmentation au service du pilotagedu média par la data, les étapes de la démarche se tradui-sent de la façon suivante :- la constitution d’une base de datamining, provenantd’une ou de plusieurs campagnes média de l’annonceur ;- l’entraînement du modèle, au cours duquel sont émisesdes hypothèses sur les cibles utiles des offres ou produitsconcernés ;- le calcul des arbres de segmentation ;- la mise au point du modèle de ciblage publicitaire ;- la simulation d’une campagne média ayant pour but deconfirmer les hypothèses émises lors de l’entraînement dumodèle ;- la diffusion d’une campagne ciblée et A/B testing (compa-raison des résultats de la population ciblée et non ciblée).
  • 10. Constitution d’une base de dataminingAvant de segmenter l’audience de l’annonceur, Webora-ma a construit une base d’internautes exposés aux cam-pagnes de celui-ci, ou ayant visité son site. Cette base estenrichie par des critères sociodémographiques et com-portementaux pour les internautes dont Weborama con­nait le profil, grâce à sa base de données de 70 millions deprofils qualifiés en France. Ces données sont croisées aveccelles de Weborama Campaign Manager. L’ensemblede ces informations anonymes est accessible via l’identi-fiant de l’internaute (qui est une suite de caractères propreà chaque individu contenue dans les cookies déposésdans le navigateur Internet). Cet identifiant unique permetà Weborama de retrouver dans sa base de données, entemps réel, le profil complet de l’internaute.Weborama a appliqué dans cette démarche les donnéesprovenant du search (requêtes dans les moteurs de re-cherche) et du surf (navigation à travers la toile) des inter-nautes, afin de leur attribuer le profil correspondant à leursexe, âge et catégorie socioprofessionnelle, ainsi qu’à leurscentres d’intérêt et leur comportement en ligne.Pendant plusieurs semaines, Weborama a récolté les in-formations sur les transformations post view (à la suited’une publicité servie par Weborama, sans qu’il y ait unclic direct lors du visionnage).La base de Datamining ainsi constituée pour l’annonceurcomporte quelque 60 millions de profils qualifiés sur envi-ron 300 colonnes, parmi lesquelles : les publicités auxquel-les l’internaute a été exposé, sa réactivité face à la publicité(visite, clic), son comportement sur le site (catégories deproduits recherchées, produits mis en panier, conversion,etc.), son profil sociodémographique et son profil com-portemental.Entraînement du modèle (calcul des arbresde décision et mise au point du ciblage publicitaire)Après la constitution de la base exploitée pour la segmen-tation, Weborama a construit une représentation graphi-que des critères de ciblage permanents. La solution rete-nue, à savoir les arbres de segmentation, permet d’extraireles critères les plus pertinents pour chaque offre. Ces cri-tères sont basés sur les transformations des internautesexposés à une campagne publicitaire et sur les impres-sions générées lors de celle-ci. Le logiciel choisi a permisde tester chaque critère, afin de déduire les critères à rete-nir, présents dans les cookies des internautes exposés.Avant la constitution des arbres de segmentation, l’algo-rithme de segmentation de Weborama a permis, en par-tant de la racine, d’associer à chaque nœud de l’arbre lecritère et le seuil d’affinité le plus pertinent. Ensuite, We-borama a calculé le gain de taux de transformations pourchaque nœud des arbres. Seuls les nœuds présentant lesgains de taux de transformations les plus avantageux se-ront sélectionnés pour les campagnes média ciblées. We-borama a également calculé un intervalle de confiancepour tous les gains de taux de transformations. Contenuentre une valeur minimum et une valeur maximum, cet in-tervalle permettra, d’une part, de confirmer chaque mo-dèle lors de la phase de simulation d’une campagne mé-dia, d’autre part, de surveiller les résultats de futurescampagnes ciblées de l’annonceur (cf infra).L’offre de l’annonceur est complexe et inclut les différen-tes variantes (5 produits au total). La segmentation del’audience se fera donc en fonction de ces caractéristi-ques, avec un arbre de segmentation correspondant à unproduit.
  • 11. CLUSTER3 >= 32,03p=1362,3%L’arbre de segmentation se lit de bas en haut, en remon-tant de la racine vers les branches supérieures. À la racine,l’ensemble de la population exposée à la campagne, avecle gain de taux de transformations égal à 1 et servant decomparaison avec les différents niveaux de branches, lenombre d’exemples positifs (les internautes ayant trans-formé) et le pourcentage d’impressions publicitaires diffu-sées auprès de la population (ici égal à 100 %).Les branches de l’arbre comportent 4 informations clés :- le cluster comportemental ou critère sociodémographi-que discriminant, avec le quantile correspondant ;- le gain de taux de transformations par rapport à la popu-lation globale exposée. Celui-ci est pertinent pour le ci-Exemple d’arbre de segmentationet de son analyse en vuedes futures campagnes médiablage au sein d’une campagne média s’il est strictementsupérieur à 1. Dans le cas inverse, il peut être utilisé pourexclure du dispositif de communication en ligne les inter-nautes qui ne transforment pas ;- le nombre d’exemples positifs au sein de la populationappartenant à un critère ou cluster ;- le pourcentage d’impressions publicitaires diffuséesauprès de cette population. Nous pouvons considérer qu’ils’agit d’un pourcentage approximatif de la population ex-posée à la campagne.L’analyse d’un arbre de segmentation repose sur une ca-pacité à trouver un équilibre entre la performance, doncles cibles utiles (le gain de taux de transformations supé-rieur à 1) et le pourcentage d’impressions suffisant pour lapuissance de la campagne.*Le critère« USAGE »correspondaux internautesdont lanavigationsur Internetest soutenue.CLUSTER4 >= 14,92p=4082,8%1p=2845100%CLUSTER 2 < 10,4p=54948,8%CLUSTER 2 >= 11,05p=78526,3%USAGE < 130,67p=25513,5%sd 3 < 61,3p=45212,2%sd 1 < 22,89p=122614,6%sd 2 < 100,52p=503,4%sd 1 >= 21,05p=30710,3%sd 2 >= 101,31p=2576,9%sd 3 >= 64,23p=780,6%USAGE >= 131,45p=53012,8%CLUSTER 1 < 10,62p=131475,1%CLUSTER 1 >= 12,13p=153324,9%CLUSTER4 < 12,4p=81811,8%CLUSTER3 < 30,94p=1214,6%*
  • 12. Les deux branches du même niveau sont à chaque foiscomplémentaires, les internautes ne peuvent pas fairepartie des deux côtés à la fois. Il est donc possible d’addi-tionner plusieurs groupes d’internautes (cf. les critèresrouges dans l’exemple ci-dessus), pour une diffusion pluslarge.Exemple de lecture : concentrons-nous sur les deux po-pulations marquées en rouge sur l’arbre de décision.Nous avons d’un côté les internautes qui ont, dans leurcookie, le CLUSTER 1 avec le quantile supérieur ou égal à1. Nous savons qu’ils ont été exposés à la campagne etont transformé 2,13 fois plus que la population au global.Nous savons également qu’ils constituent près de 25 %de la population exposée.Sur la branche opposée, nous sommes intéressés par lesinternautes qui ont À LA FOIS le CLUSTER 1 avec lequantile inférieur à 1 (donc égal à 0) ET le cluster 2 dontle quantile est supérieur ou égal à 1 ET qui sont des sur-feurs importants (ce critère doit atteindre le quantile mi-nimum de 13). Ces internautes constituent près de 13 %de la population exposée et transforment 1,45 fois plusque l’ensemble des internautes ayant potentiellement vula campagne.Simulation d’une campagne média(confirmation des hypothèses)La définition d’un modèle d’audience pour chaque offre etproduit n’est qu’une phase de modélisation. Celle-ci né-cessite d’être confirmée par une simulation de campagnemédia. Aucun ciblage n’est mis en place. Les résultats decette campagne sont croisés avec le fichier de datamining,afin de voir les corrélations avec le modèle défini aupara-vant, lors de l’entraînement du modèle.Dans le cas de la simulation pour l’annonceur évoquéplus haut, Weborama a observé de parfaites corréla-tions entre la base de datamining et la simulation d’unecampagne. Ces résultats de l’application des arbres desegmentation ont permis de confirmer la justesse des ci-blages proposés pour chaque offre et produit. Les profilsqui transforment sont bien ceux que Weborama a misen avant dans les arbres de décision. Les futures actionsde communication pourront désormais bénéficier d’unciblage bien précis afin d’augmenter le ROI digital dechaque campagne.Diffusion d’une campagne ciblée et AB testingAprès la définition des modèles de ciblage dédiés à cha-que offre et à la suite de la confirmation des arbres dedécision lors d’une simulation de campagne, la data jouerason rôle final. Elle sera désormais valorisée au sein descampagnes média afin d’augmenter leur efficacité et dediminuer la déperdition.Simultanément et dans exactement les mêmes condi-tions, Weborama a diffusé deux campagnes média :l’une ciblée et l’autre auprès d’une population non ciblée.Le rapprochement des résultats des deux types de cam-pagnes a confirmé une fois de plus la justesse des ciblesdéfinies auparavant au sein des arbres de décision.L’augmentation du nombre de transformations attenduea bien été réalisée.Des variations du gain de taux de transformations ont éténotées par rapport à ceux exposés dans l’arbre de déci-sion. Toutefois, les résultats n’ont pas dépassé l’intervallede confiance.Les variations des résultats versus les prévisions peuventavoir lieu pour plusieurs raisons : elles peuvent être liéesaux créations publicitaires ou bien aux facteurs externes àla campagne, comme un événement calendaire ou unepériode de vacances, durant lesquels les internautes chan-gent leurs habitudes de navigation. L’intérêt de définir enamont les intervalles de confiance réside dans la prise encompte de l’ensemble de ces facteurs.Déploiement et futur de la segmentation d’audienceLa segmentation d’audience, et plus particulièrement lesarbres de segmentation, peuvent être utilisés à des finsdifférentes. Dans le cadre du pilotage du média par ladata, au-delà de l’amélioration du ROI digital d’une cam-pagne média par le ciblage des internautes potentielle-ment intéressés par les produits, il est possible d’appliquerles arbres dans l’optique de ventes croisées ou de calculde valeur potentielle d’un internaute.
  • 13. CLUSTER4 >= 14,92p=4082,8%1p=2845100%CLUSTER 2 < 10,4p=54948,8%CLUSTER 2 >= 11,05p=78526,3%USAGE < 130,67p=25513,5%Sd 3 < 61,3p=45212,2%Sd 1 < 22,89p=122614,6%Sd 2 < 100,52p=503,4%Sd 1 >= 21,05p=30710,3%Sd 2 >= 101,31p=2576,9%Sd 3 >= 64,23p=780,6%USAGE >= 131,45p=53012,8%CLUSTER 1 < 10,62p=131475,1%CLUSTER 1 >= 12,13p=153324,9%CLUSTER4 < 12,4p=81811,8%CLUSTER3 < 30,94p=1214,6%*CLUSTER4 >= 14,92p=4082,8%1p=2845100%CLUSTER 2 < 10,4p=54948,8%CLUSTER 2 >= 11,05p=78526,3%USAGE < 130,67p=25513,5%Sd 3 < 61,3p=45212,2%Sd 1 < 22,89p=122614,6%Sd 2 < 100,52p=503,4%Sd 1 >= 21,05p=30710,3%Sd 2 >= 101,31p=2576,9%Sd 3 >= 64,23p=780,6%USAGE >= 131,45p=53012,8%CLUSTER 1 < 10,62p=131475,1%CLUSTER 1 >= 12,13p=153324,9%CLUSTER4 < 12,4p=81811,8%CLUSTER3 < 30,94p=1214,6%*% de la population654321taux detransformations+24,9 %  37,7 %2,131,89CLUSTER 1 > = 12,13p=153324,9 %0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100USAGE >= 131,45p=53012,8 %Weborama développe l’intégration de ce dispositif ausein d’un de ses outils marketing pilotés par la data : lesC-Clones. Les C-Clones, ou les « look alike », sont une ex-tension d’audience basée sur les transformations des in-ternautes. Comme dans la démarche décrite ci-dessus, ils’agit d’allier la performance et la puissance d’une cam-pagne média efficace, en choisissant une population quiest susceptible de souscrire aux produits de la campagneet qui est suffisamment large pour la diffusion. L’interfaceC-Clones sera intégrée dans la data management plate-form Weborama Audience Manager. L’intégration desarbres de segmentation permettra, en un coup d’œil, dedéterminer le profil utile de la campagne.CLUSTER 1 > = 12,13p=153324,9 %
  • 14. la segmentationpOUr les éditeursLa démarcheLa connaissance de leur audience est devenue un enjeumajeur pour les éditeurs, qui souhaitent valoriser aumieux leur inventaire publicitaire afin d’optimiser sa moné-tisation. La segmentation de l’audience du site offre à l’édi-teur de nombreuses opportunités.Opportunités d’exploitationAvant tout, les éditeurs souhaitent organiser leur offredans le but de proposer aux annonceurs et auxagences, en complément du volet contextuel, des packsd’au­dien­ce ciblés, enrichis par la data 3rdparty. Le secondenjeu est de construire des packs d’audience spécifiquesgrâce aux cibles ad hoc, basées sur l’alliage de ciblagessociodémographique et comportemental (prenant encompte les centres d’intérêt des internautes). L’exploita-tion de la data permettra donc de piloter la commerciali-sation de l’inventaire du site et de diffuser les publicitésauprès des contacts utiles, tout en « désengorgeant » lesrubriques surchargées. Le coût par mille (CPM) de ventedes emplacements publicitaires sera ainsi revalorisé parla vente d’audience utile.Quant aux formats publicitaires dits événementiels, ils sontprincipalement commercialisés de façon forfaitaire, surune base journalière. Grâce à la data, ils pourront égale-ment être ciblés et mis à la disposition des acheteurs auCPM. À titre d’exemple, un « habillage comportemental »ne sera plus visible pendant seulement une journée et uni-quement sur la home page, mais plutôt sur une période de15 jours, sur l’ensemble des pages du site et affiché enfonction du profil de l’internaute, correspondant à la cibleen affinité avec la campagne.La segmentation d’audience d’un site permet d’apercevoirdes profils de visiteurs qui vont au-delà de sa thématique.Il est fort probable qu’un site d’actualité ait, au sein de sonaudience, des amateurs d’autres domaines (finance, beau-té, mode, cuisine, voyage…). Cela donnera à l’éditeur lapossibilité de valoriser non seulement son contenu dequalité, mais également son audience, ceci en élargissantla typologie des clients.engagementWeborama s’engage auprès des éditeurs à collecter lesdonnées brutes et anonymes de navigation. L’analysede l’audience, suivie d’une proposition de cibles marketingpertinentes, sera effectuée dans un délai de trois semainesà compter de la pose des tags Weborama sur le site del’éditeur. Les données servant au ciblage seront transfé-rées sous un mois et les cibles seront ensuite optimiséesquotidiennement, afin de répondre au mieux aux attentesde l’éditeur.Par là même, Weborama ne commercialise pas la data del’éditeur seule et ne redéfinit pas les packs d’audience dusite. Les informations liées à l’audience de ce dernier étantstrictement confidentielles, Weborama s’interdit de lescommuniquer aux autres acteurs.
  • 15. Méthodologie WeboramaWeborama propose aux éditeurs deux méthodesde l’en­­richissement de leur data par les données3rd party.La première méthode consiste à synchroniser et projeterles critères sociodémographiques et clusters comporte-mentaux de Weborama sur l’audience du site de l’éditeur.Cela est possible grâce à l’identification des profils recon-nus au sein de l’audience du site, qui font déjà partie de labase de données de Weborama.Synchronisation et projection des clusterset du sociodémographiqueDans ce cas précis, l’adserver de l’éditeur appelle la basede données Weborama pour chaque internaute. Si labase de données de Weborama reconnaît le profil socio-démographique ou comportemental du visiteur du site, cedernier est transféré à l’adserver éditeur.L’adserver éditeur dispose alors des profils sociodémogra­phi­ques et comportementaux de la majorité de ses inter-nautes.INTERNAUTES du sitede l’ÉDITEURAD SERVERÉDITEURINTERROGATIONDE LA BaseDe DonnéesWEBORAMARECONNAISSANCEDU PROFILIDENTIFICATIONDES CENTRESD’INTÉRÊT& DU PROFILSOCIODÉMOgraphiqueWEBORAMATRANSFÈRELA LISTEDE VALEURDU PROFILANALYSÉ
  • 16. La seconde méthode identifie et d’analyse le profil des in-ternautes du site afin de créer des cibles ad hoc corres-pondant aux secteurs d’activité des annonceurs.Identification, analyse et création de cibles ad hocCet enrichissement est axé sur l’analyse des profils desinternautes du site éditeur afin de créer des cibles ad hocqui lui sont propres et qui pourront être exploitées par larégie.Cette approche se traduit en trois étapes : tout d’abordl’identification et l’analyse des cibles, ensuite l’enrichisse-ment du ciblage et la création de cibles customs pour larégie, et enfin le processus de transfert de profils.- Identification & analyse des ciblesDans cette étape, Weborama met en place l’outil d’ana-lyse comportementale et sociodémographique du site,Weborama Audience Insight (WAI). WAI permetd’iden­tifier et de classer les segments et clusters compor-identification& analysesiteet/ourubriqueautomobileet/ourégionÎLE-DE-FRANCEROTATIONGéNéRALERÉGIEenrichissementvia la base dedonnées weboramacréationdes cibles AD HOCdiffusion3rdpartyCIBLE 1CIBLE 2CIBLE 3transferttransferttransferttementaux par puissance et/ou affinité, en croisant l’au­dience du site avec la base de données de Weborama.Les profils les plus discriminants sont déduits en compa-rant l’audience du site de l’éditeur avec la moyenne relevéeau sein de la base de données de Weborama.- Enrichissement du ciblage et création de cibles ad hocL’étude WAI permet la création de cibles ad hoc, alliantles critères sociodémographiques aux clusters comporte-mentaux. Trouver un équilibre entre les indicateurs depuissance et d’affinité est ici déterminant afin de définirune volumétrie de profils pertinente.- Transfert des cibles ad hocLe transfert des cibles ad hoc précédemment définies estpos­sible grâce à une liste de différents pixels adserver. Cetransfert se fait par l’intermédiaire d’un appel des pixelsgé­né­rés par l’adserver éditeur. Les volumes souhaités depro­fils par cible sont alors disponibles directement dansl’adserver.
  • 17. DIGITALPILOTÉ PAR laMARKETINGdataa data ne conditionnera pas que les ac-tions liées à la communication digitale. De plus en plusprésente, elle prendra une place importante dans tous lesaspects de notre vie, aussi bien dans la sphère personnelleque dans la sphère professionnelle. Afin de profiter desopportunités offertes par « l’or de demain », les entreprisesdevront revoir leur organisation interne, souvent structu-rée en silos : media digital, site marchand, CRM, etc.En ce qui concerne le marché publicitaire, la data devientune composante à part entière au marketing. Aujourd’hui,son déploiement au sein de tous les leviers du marketingdigital est une nécessité pour les marques. Celles-ci re-cherchent toujours à toucher les clients et prospects defaçon plus pertinente afin de rendre plus efficaces les ac-tions de communication en ligne. En parallèle, la dichoto-mie offline et online tend à disparaître.Depuis 15 ans, Weborama offre des solutions data inno-vantes et complètes. La segmentation d’audience et lesarbres de décision ne constituent qu’une partie de la datascience de Weborama. Soucieux de rendre facilementaccessible aux utilisateurs cette science basée sur les al-gorithmes complexes et les technologies de stockage etde traitement robustes, Weborama entend poursuivreses efforts de recherche et développement. La passiondes données fait partie intégrante de l’ADN de la société,renommée sur le marché publicitaire européen pour sonapproche lexicale du digital. Le claim « From data to va-lue » illustre bien son savoir-faire et la volonté de rendre lesdonnées utiles en leur donnant une dimension humaine.
  • 18. Weborama est le leader européen de la data et disposed’une base de données de 110 M de profils.Depuis 15 ans, Weborama développe des solutions d’ad-serving, DMP, analyse d’audience, segmentation des don-nées et ciblages.Plus de 300 clients utilisent ses solutions innovantes pourpiloter et optimiser leurs investissements online en France,en Espagne, en Italie, au Portugal, aux Pays-Bas, au UK eten Russie :Weborama Audience Manager : data managementplatform pour la segmentation des différentes sources dedonnées 1stparty (CRM, média et site) et enrichissementpar les données 3rdparty, via l’accès à la data propriétairede WeboramaWeborama Audience Insight : outil d’analyse compor-tementale et sociodémographique d’audience des sitesInternetWeborama Campaign Manager : outil d’adserving etd’ad analytics pour la gestion et l’optimisation des campa-gnes publicitairesWeborama Advanced Rich Media : outil de gestion descampagnes Rich Media/vidéoWeborama Audience Exchange : plateforme d’audien-ce premium et multi device, via deux canaux (WAX foragency, WAX for trading desk). Formats classiques, RichMedia et in stream.Weboramaest cotée surAlternextdepuis juin 2006(ALWEB).Son chiffred’affaires aatteint 24,3 M d’€en 2012.© 2013, WeboramaTous droits réservés pour tous pays.Toute reproduction même partielle est strictement interdite.Imprimé en France.Conception graphique et réalisation © LES 5 SUR 5 .COM*WEBORAMA,FROM DATA TO VALUE
  • 19. www.weborama.com