SlideShare a Scribd company logo
1 of 42
Experimentation
Anti-Patterns
Comparação temporal
Comparação temporal
Nova
funcionalidade
Comparação temporal
http://www.tylervigen.com/spurious-correlations
Comparação temporal
Comparação temporal da alavancagem
Comparação temporal da alavancagem
50%⬆
60%⬆
Comparação temporal da alavancagem
Comparação temporal da alavancagem
Comparação temporal da alavancagem
60%⬆
40%⬇
Longo ciclo de desenvolvimento
Longo ciclo de desenvolvimento
$ A/B
Sucesso!
Ufa
:(
Longo ciclo de desenvolvimento
https://ai.stanford.edu/~ronnyk/ExPThinkWeek2009Public.pdf
1/3
Longo ciclo de desenvolvimento
75%
O experimento que vira funcionalidade
O experimento que vira funcionalidade
Mínimo
necessário
para validar
hipótese
Experimento
foi um
sucesso
Produção
O experimento que vira funcionalidade
O experimento que vira funcionalidade
Mínimo
necessário
para validar
hipótese
Experimento
foi um
sucesso
Produção
Implementar
corretamente
Métrica incorreta
Métrica incorreta
$
Métrica incorreta
ℹ
Métrica não acionável
Métrica não acionável
Churn
Lifetime
Value
Ads
Revenue
- Muito tempo para
comparar
- Muitas influências
externas
- Dificilmente separável
em A/B
Métrica não acionável
Churn
Lifetime
Value
Ads
Revenue
Média de
tempo
Frequência
Assertiveness
Alvo populacional errado
Alvo populacional errado
Acidental
Moderado
Heavy
Desconsiderar mudança populacional
Desconsiderar mudança populacional
Acidental Heavy
Inicio do
teste A/B
Fim do
teste A/B
Desconsiderar mudança populacional
Resultado do AB para heavys: Número de heavys:
A segmentação infinita
A segmentação infinita
Amostra de usuários do
experimento
A segmentação infinita
Moderados
A segmentação infinita
Nas quarta-feiras
A segmentação infinita
Em uma faixa de
horário
A segmentação temporal
A segmentação temporal
Observações não independentes
Observações não independentes
Por
impressão
Por
usuárioX
Observações não independentes
http://ewulczyn.github.io/ab_testing_and_independence/
https://medium.com/convoy-tech/cracking-correlated-
observations-in-a-b-tests-with-mixed-effect-models-
80a63027444e
Experimentation Anti-Patterns
- Comparação temporal
- Comparação temporal da alavancagem
- Longo ciclo de desenvolvimento
- O experimento que vira funcionalidade
- Métrica incorreta
- Métrica não acionável
- Alvo populacional errado
- Segmentação infinita
- Segmentação temporal
- Observações não independentes
Desculpa
@timotta

More Related Content

More from Tiago Albineli Motta

More from Tiago Albineli Motta (10)

Rastros digitais
Rastros digitaisRastros digitais
Rastros digitais
 
Big data
Big dataBig data
Big data
 
Recomendação de ponta a ponta na Globo.com
Recomendação de ponta a ponta na Globo.comRecomendação de ponta a ponta na Globo.com
Recomendação de ponta a ponta na Globo.com
 
Recomendação na Globo.com
Recomendação na Globo.comRecomendação na Globo.com
Recomendação na Globo.com
 
Otimizando seu projeto Rails
Otimizando seu projeto RailsOtimizando seu projeto Rails
Otimizando seu projeto Rails
 
Meta-programacao em python
Meta-programacao em pythonMeta-programacao em python
Meta-programacao em python
 
Testes unitários e de integração: Quando e Porque
Testes unitários e de integração: Quando e PorqueTestes unitários e de integração: Quando e Porque
Testes unitários e de integração: Quando e Porque
 
Redis na Prática
Redis na PráticaRedis na Prática
Redis na Prática
 
Dinamizando Sites Estáticos
Dinamizando Sites EstáticosDinamizando Sites Estáticos
Dinamizando Sites Estáticos
 
Escalando Sites com Nginx
Escalando Sites com NginxEscalando Sites com Nginx
Escalando Sites com Nginx
 

Experimentation anti patterns

Editor's Notes

  1. Explicar aqui que comparar o crescimento ou decréscimo dos diversos KPIs é importante, mas não necessariamente indica se uma determinada feature causou essa melhora ou não e o mais importante é a forma como você comunica isso