AB Testing chez M6Web

AB testing chez M6Web
« Tester c’est douter, mais le doute c’est le début de la sagesse »
Nastasia Saby
@saby_nastasia
Fabien de Saint pern
@fabdspM6Web & Zenika
Octobre 2017
6play
Existe depuis 2008
18 Millions de comptes utilisateurs
+90k videos publiés - 4 millions vidéos vues par jour
Disponible sur plus de 10 plateformes (Web, Apps, IPTV)
Offre gratuite (revenus publicitaires) - Offre payante récente
AB testing kezako ?
Une expérience
L’AB testing
Procédure utilisée en marketing et
qui permet de mesurer l’impact d’un
changement de version d’une
variable sur l’atteinte d’un objectif
(clic, validation, remplissage
formulaire, …)
● AB test = 2 versions
● ABC test = 3 versions
● AAB test = 3 versions (2 ident.)
Exemple d’AB testing avec la page d’inscription
25%
de conversion
17%
de conversion
X
X
L’AB testing pour être
«data driven»
Dorénavant, il ne suffit pas d’avoir
une bonne idée, mais faut-il encore
vérifier si elle est vraiment bonne.
Exemple de l’Infinite scrolling
chez Etsy (2013)
Choix de la population
inconnue ou connue ?
Stratégies d’
échantillonnage
● Aléatoire simple
● Stratifié
● En grappes
Toujours une notion d’aléatoire
Utilisation de l’AB testing
Exemples de tests
Utilisation de l’AB testing
pour personnaliser
● Test de différents algorithmes
de personnalisation
Exemples :
● Recommandation de
programmes par rubrique
Recommandation de programmes
● Objectifs : programmes recommandés personnalisés par utilisateur
Recommandation de programmes en détail
Résultats : C le meilleur mais...
● Tests de différents algorithmes :
○ A : Contribution manuelle quotidienne (version legacy)
○ B : Selon les dernières consommations de la personne
○ C & D : Selon les consommations de tous les utilisateurs (2
méthodes)
● Test AABCD
○ AA : deux variantes identiques.
○ Permet d’analyser la divergence des populations.
○ Calcul du biais d'échantillonnage.
Tests avec 5 variantes de 20 % (sur 80% total)
Activation
du test
Utilisation de l’AB testing
pour sa communication
● Campagne d'emailing
● Notifications via les apps
Résultats inattendus
AB testing sur des
populations déterminées
● Fan d’une émission, éléments
socio-démographiques...
● Test complet sur une
population ou filtrage
Ex : Pression pub selon les
segments
Résultats ?
Utilisation de l’AB testing
Exemples de tests techniques
Utilisation de l’AB testing
pour faire du Canary
testing
● Nouveau player
● Lancement progressif d’un
nouvel adserver
Utilisation de l’AB testing
pour la performance
● Tests de performance entre
deux versions
● Taux d’abandon au
chargement
● Scalabilité d’une architecture
● Vidéos : rapport débit / qualité /
erreurs / temps de chargement
Prouver que votre idée est la
meilleure par les chiffres
Utilisation de l’AB testing
pour de la « prod cachée »
● Fonctionnalités disponibles
pour les équipes produits
uniquement
● Lancement d’un service pour un
groupe d’utilisateurs restreint
Architecture 6play
Avant l’AB Testing
Front-end ● Web (ReactJs)
● Application
natives/ReactNative iOs,
Android
● Boxes FAI français : Free,
Orange, Bytel, Sfr /
Numéricable, CanalSat
● API vidéos
○ Métadonnées vidéos
○ Cache Varnish
Back-end
● API utilisateurs
○ Données utilisateurs
○ Pas de cache Varnish
L’Applaunch
● Microservice de
configuration
● Toutes plateformes
● Front-end
● Back-end
L’Applaunch pour les paramétrer tous
Fronts 6play
(Apps Mobiles, IPTV, Web …)
CacheAPCu
Fichiers Json
statiques de
configuration
des apps /
services
Back-office de
configuration
“Applaunch”
Ecritures
Lectures
Micro-Services / API
Middleware
Images
Users
Workers
Advertising
...
Applaunch : configuration par version
App version 1.0.0 App version 2.0.0
Applaunch : utilisation
Utilisations :
● Feature flipping
● Paramètres de fonctionnalités (Temps de rafraîchissement, timeout…)
● Base URL de services
● Valeurs diverses, messages aux utilisateurs...
Architecture 6play
Avec l’AB Testing
Les variantes de
l’Applaunch et les tests
L’AB Testing :
Une configuration
personnalisée par utilisateur
Applaunch et le système des variantes
Fichier json principal Fichier des variantes
{
Test_Theme_Variante_Sea:
color : blue,
deco : fishes
Test_Theme_Variante_Earth:
color : brown,
deco : trees
}
Test_Theme_Variante_Sea
Test_Theme_Variante_Earth
Pas de variante
Création des tests et des variantes
Métadonnées sur l’AB test
Nom du test : Thème
Description : Description
Type de test : Realtime
Pourcentage de la population: 10%
Variante Pourcentage Clef
Variante Earth 50% color: blue
deco: fishes
Variante Sea 50% color: brown
deco : tree
Le Customizer
Customizer : applaunch personnalisé
Fichiers Json
principal
Services
Fichiers Json des
variantes
Users
Middleware
Fronts 6play
(Apps, IPTV, Web…)
Advertising
Customizer
2. Par utilisateur
1. Par application
...
API
AB Tests
Customizer en détail
Request
Applaunch
personnalisé ?
● User
● App
● Version
Api
des tests
Applaunch
fichiers Json des
variantes
API :
● Tests actifs (APCu)
● Variantes par utilisateur (Cassandra)
● Config applaunch des variantes de
l’application (Redis)
Génération du cache APCU :
● Toutes les 5 min ou sur cache vide
● Précalcul tests & variantes actifs
5 ms de temps
de réponse
Typologie des tests
Typologie des tests chez M6Web
Deux types de répartition des utilisateurs :
● Realtime
○ Répartition aléatoire : utilisation d’un crc32(id_users/ id test)
○ Répartition homogène et déterministe
○ Recalculable à l’analyse des résultats
● Batch
○ Échantillonnage par segmentation
○ Socio-démo / consommation - Ex : H/F, 15-25, Fan de Capital ...
○ Importés dans Cassandra (performance)
Analyse des AB tests
Une plateforme big data à la rescousse
HiveQL
Hive :
requêtage
CLI
Dataviz
HDFS :
stockage
Hadoop
Jupyter
La construction d’un
data lake
● Collecte et agrégation de
données M6
● Batch spark
HDFS :
stockage
Logs des
AdServer
Collecte et analyse de données avec des KPIS
KPIS
● Nombre de vidéos vues
par utilisateur par jour
● Nombre de secondes de
vidéos vues par utilisateur
par jour
● Nombre de pubs
consommés par utilisateur
par jour
● Nombre de visites
KPIS par AB test
Pas de formule magique
Les pièges
● Effets de saisonnalité
● Nouvelle
fonctionnalité peut
avoir un fort impact
● Résultats parfois
difficiles à voir à l’oeil
nu
Trouver la vérité au
milieu du bruit
Fluctuation due au hasard des
échantillons ou à la variation ?
Hypothèse d’homogénéité
A/A - Avant/Après
● Valeur P = Si plus de 5%, on
ne peut imputer les fluctuations
à l’introduction d’une variante
● Intervalle de confiance =
Appui de la p-value
=> Avons-nous des résultats
significatifs ?
Comment connaître sa population ?
Agrégation des données de différentes plateformes M6Web
Croisement des segments
de population avec
d’autres sources M6
Quels types de données ?
Données déclaratives
● Age - Sexe
● Centres d’intérêts
Données déduites
Consommation vidéo :
● Quoi ?
● Combien de fois ?
● Combien de temps ?
● Quand ? Où ?
Consommation sur les sites
M6 :
● Pages vues ?
● Combien de fois ?
● Quand ? Où ?
Définition de segments
Segments :
● Fan des Marseillais, séries américaines, …
● Segments comportementaux : nocturnes, uniques, ...
Le comportement prime
La supériorité des données
comportementales par
rapport aux données
déclaratives
Merci
« Tester c’est douter, mais le doute c’est le début de la sagesse »
1 of 47

Recommended

Climbing the Abstract Syntax Tree (Forum PHP 2017) by
Climbing the Abstract Syntax Tree (Forum PHP 2017)Climbing the Abstract Syntax Tree (Forum PHP 2017)
Climbing the Abstract Syntax Tree (Forum PHP 2017)James Titcumb
4.3K views123 slides
Recettes de tests by
Recettes de testsRecettes de tests
Recettes de testsCharles Desneuf
1.8K views144 slides
Language objet : passé, présent et futur by
Language objet : passé, présent et futurLanguage objet : passé, présent et futur
Language objet : passé, présent et futurSophie Beaupuis
770 views28 slides
ABTest : un outil indispensable pour être « data-driven » ? par Laurent VION by
ABTest : un outil indispensable pour être « data-driven » ? par Laurent VIONABTest : un outil indispensable pour être « data-driven » ? par Laurent VION
ABTest : un outil indispensable pour être « data-driven » ? par Laurent VIONLa Cuisine du Web
140 views65 slides
Optimiser la performance business de votre site avec l'A/B Testing by
Optimiser la performance business de votre site avec l'A/B TestingOptimiser la performance business de votre site avec l'A/B Testing
Optimiser la performance business de votre site avec l'A/B TestingGillesLaborderie
1.4K views36 slides
Comparatif analytics by
Comparatif analyticsComparatif analytics
Comparatif analyticsQuentin Apruzzese
1.2K views26 slides

More Related Content

Similar to AB Testing chez M6Web

Comparatif solutions A/B Testing - VWO vs Optimizely vs Kameleoon vs AB Tasty by
Comparatif solutions A/B Testing - VWO vs Optimizely vs Kameleoon vs AB TastyComparatif solutions A/B Testing - VWO vs Optimizely vs Kameleoon vs AB Tasty
Comparatif solutions A/B Testing - VWO vs Optimizely vs Kameleoon vs AB TastyCartelis
845 views37 slides
Optimiser son site grâce au testing A/B ou multivarié et au ciblage by
Optimiser son site grâce au testing A/B ou multivarié et au ciblageOptimiser son site grâce au testing A/B ou multivarié et au ciblage
Optimiser son site grâce au testing A/B ou multivarié et au ciblageRaphaël Fétique
4.2K views26 slides
La boite a_outils_de_l_excellence_operationnelle_presentation minitab by
La boite a_outils_de_l_excellence_operationnelle_presentation minitabLa boite a_outils_de_l_excellence_operationnelle_presentation minitab
La boite a_outils_de_l_excellence_operationnelle_presentation minitabMinitab, LLC
10.3K views29 slides
Apprentissage automatique avec RapidMiner by
Apprentissage automatique avec RapidMinerApprentissage automatique avec RapidMiner
Apprentissage automatique avec RapidMinerMajdi Hannachi
1.7K views32 slides
Ab testing seo 22 dec 2020 by
Ab testing seo   22 dec 2020Ab testing seo   22 dec 2020
Ab testing seo 22 dec 2020Philippe YONNET
173 views49 slides
Soirée du Test Logiciel - Intelligence Artificielle dans le test - J. VAN QUA... by
Soirée du Test Logiciel - Intelligence Artificielle dans le test - J. VAN QUA...Soirée du Test Logiciel - Intelligence Artificielle dans le test - J. VAN QUA...
Soirée du Test Logiciel - Intelligence Artificielle dans le test - J. VAN QUA...TelecomValley
2.3K views36 slides

Similar to AB Testing chez M6Web(20)

Comparatif solutions A/B Testing - VWO vs Optimizely vs Kameleoon vs AB Tasty by Cartelis
Comparatif solutions A/B Testing - VWO vs Optimizely vs Kameleoon vs AB TastyComparatif solutions A/B Testing - VWO vs Optimizely vs Kameleoon vs AB Tasty
Comparatif solutions A/B Testing - VWO vs Optimizely vs Kameleoon vs AB Tasty
Cartelis845 views
Optimiser son site grâce au testing A/B ou multivarié et au ciblage by Raphaël Fétique
Optimiser son site grâce au testing A/B ou multivarié et au ciblageOptimiser son site grâce au testing A/B ou multivarié et au ciblage
Optimiser son site grâce au testing A/B ou multivarié et au ciblage
Raphaël Fétique4.2K views
La boite a_outils_de_l_excellence_operationnelle_presentation minitab by Minitab, LLC
La boite a_outils_de_l_excellence_operationnelle_presentation minitabLa boite a_outils_de_l_excellence_operationnelle_presentation minitab
La boite a_outils_de_l_excellence_operationnelle_presentation minitab
Minitab, LLC10.3K views
Apprentissage automatique avec RapidMiner by Majdi Hannachi
Apprentissage automatique avec RapidMinerApprentissage automatique avec RapidMiner
Apprentissage automatique avec RapidMiner
Majdi Hannachi1.7K views
Soirée du Test Logiciel - Intelligence Artificielle dans le test - J. VAN QUA... by TelecomValley
Soirée du Test Logiciel - Intelligence Artificielle dans le test - J. VAN QUA...Soirée du Test Logiciel - Intelligence Artificielle dans le test - J. VAN QUA...
Soirée du Test Logiciel - Intelligence Artificielle dans le test - J. VAN QUA...
TelecomValley2.3K views
Resolution de probleme conduite de projet et analyse de donnees webinaire-min... by Minitab, LLC
Resolution de probleme conduite de projet et analyse de donnees webinaire-min...Resolution de probleme conduite de projet et analyse de donnees webinaire-min...
Resolution de probleme conduite de projet et analyse de donnees webinaire-min...
Minitab, LLC353 views
PerfUG Comment tester et optimiser la performance d'un SI ? by Marc Bojoly
PerfUG Comment tester et optimiser la performance d'un SI ?PerfUG Comment tester et optimiser la performance d'un SI ?
PerfUG Comment tester et optimiser la performance d'un SI ?
Marc Bojoly859 views
Tracer la voie vers le big data avec Talend et AWS by Jean-Michel Franco
Tracer la voie vers le big data avec Talend et AWSTracer la voie vers le big data avec Talend et AWS
Tracer la voie vers le big data avec Talend et AWS
CdP QA - QA hackathon - Intelligence artificielle - Meetup du 9 mars by Agile Montréal
CdP QA - QA hackathon - Intelligence artificielle - Meetup du 9 marsCdP QA - QA hackathon - Intelligence artificielle - Meetup du 9 mars
CdP QA - QA hackathon - Intelligence artificielle - Meetup du 9 mars
Agile Montréal184 views
Carnet de l'innovation 2012_ Raphaël_Thème3_BOB Pro by raphkonan
Carnet de l'innovation 2012_ Raphaël_Thème3_BOB ProCarnet de l'innovation 2012_ Raphaël_Thème3_BOB Pro
Carnet de l'innovation 2012_ Raphaël_Thème3_BOB Pro
raphkonan143 views
R I S O M Pour Bib Op 6 Avril 2009 by Renaud AIOUTZ
R I S O M Pour  Bib  Op 6 Avril 2009R I S O M Pour  Bib  Op 6 Avril 2009
R I S O M Pour Bib Op 6 Avril 2009
Renaud AIOUTZ522 views
Metrixware Rencontre Utilisateurs Projet Cobos by metrixware
Metrixware Rencontre Utilisateurs Projet CobosMetrixware Rencontre Utilisateurs Projet Cobos
Metrixware Rencontre Utilisateurs Projet Cobos
metrixware533 views
Statistiques 101 - Gilles Barbier, Partner chez TheFamily by TheFamily
Statistiques 101 - Gilles Barbier, Partner chez TheFamilyStatistiques 101 - Gilles Barbier, Partner chez TheFamily
Statistiques 101 - Gilles Barbier, Partner chez TheFamily
TheFamily1.7K views
Crash Test Your Idea Meetup Valtech 13/09/2016 by André De Sousa
Crash Test Your Idea Meetup Valtech 13/09/2016Crash Test Your Idea Meetup Valtech 13/09/2016
Crash Test Your Idea Meetup Valtech 13/09/2016
André De Sousa828 views
Actualité des moteurs de recherche et du référencement (SEO & SEA) - petit dé... by Peak Ace
Actualité des moteurs de recherche et du référencement (SEO & SEA) - petit dé...Actualité des moteurs de recherche et du référencement (SEO & SEA) - petit dé...
Actualité des moteurs de recherche et du référencement (SEO & SEA) - petit dé...
Peak Ace501 views
Optimisez votre site en alliant Web Analytics & A/B Testing by Optimizely
Optimisez votre site en alliant Web Analytics & A/B TestingOptimisez votre site en alliant Web Analytics & A/B Testing
Optimisez votre site en alliant Web Analytics & A/B Testing
Optimizely1.2K views
Extrait du Benchmark Cloud IaaS par Gekko by GekkoSAS
Extrait du Benchmark Cloud IaaS par Gekko Extrait du Benchmark Cloud IaaS par Gekko
Extrait du Benchmark Cloud IaaS par Gekko
GekkoSAS455 views
Optimisez le parcours client de votre application mobile by Adjust
Optimisez le parcours client de votre application mobileOptimisez le parcours client de votre application mobile
Optimisez le parcours client de votre application mobile
Adjust1.1K views

Recently uploaded

BeBop : l’apport des vidéos pour analyser le comportement des taurillons by
BeBop : l’apport des vidéos pour analyser le comportement des taurillonsBeBop : l’apport des vidéos pour analyser le comportement des taurillons
BeBop : l’apport des vidéos pour analyser le comportement des taurillonsInstitut de l'Elevage - Idele
14 views24 slides
Cours Unix Emsi 2023 2024.pdf by
Cours Unix Emsi 2023 2024.pdfCours Unix Emsi 2023 2024.pdf
Cours Unix Emsi 2023 2024.pdfADNANEELBOUAAMRI
19 views41 slides
Caprinov2023 Ruminal by
Caprinov2023 RuminalCaprinov2023 Ruminal
Caprinov2023 RuminalInstitut de l'Elevage - Idele
33 views22 slides
GAV2023 - Quel cheptel et quels leviers de décarbonation la filière met en pl... by
GAV2023 - Quel cheptel et quels leviers de décarbonation la filière met en pl...GAV2023 - Quel cheptel et quels leviers de décarbonation la filière met en pl...
GAV2023 - Quel cheptel et quels leviers de décarbonation la filière met en pl...Institut de l'Elevage - Idele
157 views17 slides
Caprinov2023 Réussite à l’IA des chèvres : effet de la diversité des trajecto... by
Caprinov2023 Réussite à l’IA des chèvres : effet de la diversité des trajecto...Caprinov2023 Réussite à l’IA des chèvres : effet de la diversité des trajecto...
Caprinov2023 Réussite à l’IA des chèvres : effet de la diversité des trajecto...Institut de l'Elevage - Idele
63 views11 slides
GAV2023 - Entre inflation et décapitalisation, une conjoncture mouvementée by
GAV2023 - Entre inflation et décapitalisation, une conjoncture mouvementéeGAV2023 - Entre inflation et décapitalisation, une conjoncture mouvementée
GAV2023 - Entre inflation et décapitalisation, une conjoncture mouvementéeInstitut de l'Elevage - Idele
325 views20 slides

Recently uploaded(20)

AB Testing chez M6Web

  • 1. AB testing chez M6Web « Tester c’est douter, mais le doute c’est le début de la sagesse » Nastasia Saby @saby_nastasia Fabien de Saint pern @fabdspM6Web & Zenika Octobre 2017
  • 3. Existe depuis 2008 18 Millions de comptes utilisateurs +90k videos publiés - 4 millions vidéos vues par jour Disponible sur plus de 10 plateformes (Web, Apps, IPTV) Offre gratuite (revenus publicitaires) - Offre payante récente
  • 5. Une expérience L’AB testing Procédure utilisée en marketing et qui permet de mesurer l’impact d’un changement de version d’une variable sur l’atteinte d’un objectif (clic, validation, remplissage formulaire, …) ● AB test = 2 versions ● ABC test = 3 versions ● AAB test = 3 versions (2 ident.)
  • 6. Exemple d’AB testing avec la page d’inscription 25% de conversion 17% de conversion X X
  • 7. L’AB testing pour être «data driven» Dorénavant, il ne suffit pas d’avoir une bonne idée, mais faut-il encore vérifier si elle est vraiment bonne. Exemple de l’Infinite scrolling chez Etsy (2013)
  • 8. Choix de la population inconnue ou connue ? Stratégies d’ échantillonnage ● Aléatoire simple ● Stratifié ● En grappes Toujours une notion d’aléatoire
  • 9. Utilisation de l’AB testing Exemples de tests
  • 10. Utilisation de l’AB testing pour personnaliser ● Test de différents algorithmes de personnalisation Exemples : ● Recommandation de programmes par rubrique
  • 12. ● Objectifs : programmes recommandés personnalisés par utilisateur Recommandation de programmes en détail Résultats : C le meilleur mais... ● Tests de différents algorithmes : ○ A : Contribution manuelle quotidienne (version legacy) ○ B : Selon les dernières consommations de la personne ○ C & D : Selon les consommations de tous les utilisateurs (2 méthodes) ● Test AABCD ○ AA : deux variantes identiques. ○ Permet d’analyser la divergence des populations. ○ Calcul du biais d'échantillonnage.
  • 13. Tests avec 5 variantes de 20 % (sur 80% total) Activation du test
  • 14. Utilisation de l’AB testing pour sa communication ● Campagne d'emailing ● Notifications via les apps Résultats inattendus
  • 15. AB testing sur des populations déterminées ● Fan d’une émission, éléments socio-démographiques... ● Test complet sur une population ou filtrage Ex : Pression pub selon les segments Résultats ?
  • 16. Utilisation de l’AB testing Exemples de tests techniques
  • 17. Utilisation de l’AB testing pour faire du Canary testing ● Nouveau player ● Lancement progressif d’un nouvel adserver
  • 18. Utilisation de l’AB testing pour la performance ● Tests de performance entre deux versions ● Taux d’abandon au chargement ● Scalabilité d’une architecture ● Vidéos : rapport débit / qualité / erreurs / temps de chargement Prouver que votre idée est la meilleure par les chiffres
  • 19. Utilisation de l’AB testing pour de la « prod cachée » ● Fonctionnalités disponibles pour les équipes produits uniquement ● Lancement d’un service pour un groupe d’utilisateurs restreint
  • 21. Front-end ● Web (ReactJs) ● Application natives/ReactNative iOs, Android ● Boxes FAI français : Free, Orange, Bytel, Sfr / Numéricable, CanalSat
  • 22. ● API vidéos ○ Métadonnées vidéos ○ Cache Varnish Back-end ● API utilisateurs ○ Données utilisateurs ○ Pas de cache Varnish
  • 23. L’Applaunch ● Microservice de configuration ● Toutes plateformes ● Front-end ● Back-end
  • 24. L’Applaunch pour les paramétrer tous Fronts 6play (Apps Mobiles, IPTV, Web …) CacheAPCu Fichiers Json statiques de configuration des apps / services Back-office de configuration “Applaunch” Ecritures Lectures Micro-Services / API Middleware Images Users Workers Advertising ...
  • 25. Applaunch : configuration par version App version 1.0.0 App version 2.0.0
  • 26. Applaunch : utilisation Utilisations : ● Feature flipping ● Paramètres de fonctionnalités (Temps de rafraîchissement, timeout…) ● Base URL de services ● Valeurs diverses, messages aux utilisateurs...
  • 28. Les variantes de l’Applaunch et les tests L’AB Testing : Une configuration personnalisée par utilisateur
  • 29. Applaunch et le système des variantes Fichier json principal Fichier des variantes { Test_Theme_Variante_Sea: color : blue, deco : fishes Test_Theme_Variante_Earth: color : brown, deco : trees } Test_Theme_Variante_Sea Test_Theme_Variante_Earth Pas de variante
  • 30. Création des tests et des variantes Métadonnées sur l’AB test Nom du test : Thème Description : Description Type de test : Realtime Pourcentage de la population: 10% Variante Pourcentage Clef Variante Earth 50% color: blue deco: fishes Variante Sea 50% color: brown deco : tree
  • 32. Customizer : applaunch personnalisé Fichiers Json principal Services Fichiers Json des variantes Users Middleware Fronts 6play (Apps, IPTV, Web…) Advertising Customizer 2. Par utilisateur 1. Par application ... API AB Tests
  • 33. Customizer en détail Request Applaunch personnalisé ? ● User ● App ● Version Api des tests Applaunch fichiers Json des variantes API : ● Tests actifs (APCu) ● Variantes par utilisateur (Cassandra) ● Config applaunch des variantes de l’application (Redis) Génération du cache APCU : ● Toutes les 5 min ou sur cache vide ● Précalcul tests & variantes actifs 5 ms de temps de réponse
  • 35. Typologie des tests chez M6Web Deux types de répartition des utilisateurs : ● Realtime ○ Répartition aléatoire : utilisation d’un crc32(id_users/ id test) ○ Répartition homogène et déterministe ○ Recalculable à l’analyse des résultats ● Batch ○ Échantillonnage par segmentation ○ Socio-démo / consommation - Ex : H/F, 15-25, Fan de Capital ... ○ Importés dans Cassandra (performance)
  • 36. Analyse des AB tests
  • 37. Une plateforme big data à la rescousse HiveQL Hive : requêtage CLI Dataviz HDFS : stockage Hadoop Jupyter
  • 38. La construction d’un data lake ● Collecte et agrégation de données M6 ● Batch spark HDFS : stockage Logs des AdServer
  • 39. Collecte et analyse de données avec des KPIS KPIS ● Nombre de vidéos vues par utilisateur par jour ● Nombre de secondes de vidéos vues par utilisateur par jour ● Nombre de pubs consommés par utilisateur par jour ● Nombre de visites KPIS par AB test Pas de formule magique
  • 40. Les pièges ● Effets de saisonnalité ● Nouvelle fonctionnalité peut avoir un fort impact ● Résultats parfois difficiles à voir à l’oeil nu
  • 41. Trouver la vérité au milieu du bruit Fluctuation due au hasard des échantillons ou à la variation ? Hypothèse d’homogénéité A/A - Avant/Après ● Valeur P = Si plus de 5%, on ne peut imputer les fluctuations à l’introduction d’une variante ● Intervalle de confiance = Appui de la p-value => Avons-nous des résultats significatifs ?
  • 42. Comment connaître sa population ?
  • 43. Agrégation des données de différentes plateformes M6Web Croisement des segments de population avec d’autres sources M6
  • 44. Quels types de données ? Données déclaratives ● Age - Sexe ● Centres d’intérêts Données déduites Consommation vidéo : ● Quoi ? ● Combien de fois ? ● Combien de temps ? ● Quand ? Où ? Consommation sur les sites M6 : ● Pages vues ? ● Combien de fois ? ● Quand ? Où ?
  • 45. Définition de segments Segments : ● Fan des Marseillais, séries américaines, … ● Segments comportementaux : nocturnes, uniques, ...
  • 46. Le comportement prime La supériorité des données comportementales par rapport aux données déclaratives
  • 47. Merci « Tester c’est douter, mais le doute c’est le début de la sagesse »