Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Data Science

673 views

Published on

Slides de mi charla en los Data Konferences 2018 (Madrid) sobre como calcular el CLV y la retención de los clientes usando modelos predictivos aplicados en situaciones no contractuales.

Slides (In Spanish) about how to apply predictive modeling to estimate CLV and customer retention in a non-contractual business.

Published in: Data & Analytics
  • Be the first to comment

Data Science

  1. 1. José Ramón Cajide DATA SCIENTIST en El Arte de Medir Modelos predictivos para retail
  2. 2. Analítica Digital
  3. 3. Valor de vida del cliente: Modelos predictivos en situaciones no contractuales Segmentación Scoring CLV Marketing Science Recencia (R) Frecuencia (F) Valor monetario (M)
  4. 4. Fuente de datos
  5. 5. Variables RFM
  6. 6. Modelo RFM básico
  7. 7. INACTIVE COLD ACTIVE High value € >= 100 >3años 2-3 años 1-2 años < 1 año NEW active ACTIVE Low value € < 100 WARM High value € >= 100 NEW warm WARM Low value € < 100 Modelo RFM heurísticoSegmentación RFM heurística
  8. 8. INACTIVE COLD ACTIVE High value € >= 100 >3años 2-3 años 1-2 años < 1 año NEW active ACTIVE Low value € < 100 WARM High value € >= 100 NEW warm WARM Low value € < 100 Modelo RFM heurístico ¿Cuánto dinero generará cada uno de nuestros clientes? ¿Cuál es la probabilidad de que cada cliente siga “vivo”?
  9. 9. Modelo RFM heurístico Modelamos los datos a partir del histórico ¿Cuál es la probabilidad de que cada cliente siga “vivo”? INACTIVE COLD ACTIVE High value € >= 100 >3años 2-3 años 1-2 años < 1 año NEW active ACTIVE Low value € < 100 WARM High value € >= 100 NEW warm WARM Low value € < 100
  10. 10. INACTIVE COLD ACTIVE High value € >= 100 >3años 2-3 años 1-2 años < 1 año NEW active ACTIVE Low value € < 100 WARM High value € >= 100 NEW warm WARM Low value € < 100 Modelo RFM heurístico Modelamos los datos a partir del histórico ¿Cuánto dinero generará cada uno de nuestros clientes?
  11. 11. INACTIVE COLD ACTIVE High value € >= 100 >3años 2-3 años 1-2 años < 1 año NEW active ACTIVE Low value € < 100 WARM High value € >= 100 NEW warm WARM Low value € < 100 Modelo RFM heurístico Aplicamos ambos modelos predictivos
  12. 12. INACTIVE COLD ACTIVE High value € >= 100 >3años 2-3 años 1-2 años < 1 año NEW active ACTIVE Low value € < 100 WARM High value € >= 100 NEW warm WARM Low value € < 100 Modelo RFM heurístico ¿Cómo cambian los clientes de segmento?
  13. 13. INACTIVE COLD ACTIVE High value € >= 100 >3años 2-3 años 1-2 años < 1 año NEW active ACTIVE Low value € < 100 WARM High value € >= 100 NEW warm WARM Low value € < 100 Modelo RFM heurístico La matriz de transición como método para estimar el CLV ? REVENUE
  14. 14. Segmentación jerárquica
  15. 15. Segmentación k-means
  16. 16. Segmentación k-means
  17. 17. Modelo RFM heurísticoModelos probabilísticos https://goo.gl/S9fFPm • Válido para situaciones no contractuales • Válido bajo las siguiente hipótesis: 1. Los clientes realizan pedidos mientras están activos 2. Los clientes pueden abandonar tras un periodo de tiempo ?
  18. 18. Suposiciones del modelo Los clientes realizan sus compras de acuerdo a una distribución de probabilidad discreta de Poisson con una frecuencia de compra Tras cada compra, un cliente tiene un probabilidad p de convertirse en inactivo, la cual sigue una distribución geométrica EL importe de cada compra que realiza un cliente sigue una distribución Gamma λ Propensión a la compra Probabilidad de abandono CLV [1] [2] [3]
  19. 19. Fuente de datos 5.549.938 transacciones 1.727.844 clientes 38 meses 42 países
  20. 20. El hábito de compra del cliente
  21. 21. Resultados del modeloT Antigüedad T Antigüedad
  22. 22. Validación del modelo
  23. 23. Resultado del modelo
  24. 24. reportValor de la vida del cliente 26,73€ Vida del cliente Ratio abandono clientes Repetición de compra media 74semanas MIN 25% 18semanas 35 € TARGET 18 16 14 17 21 24 22 19 21 22 20 18 Ene Feb Mar Abr May Jun Jul Ago Sep Oct Nov Dic 4% YoY 2% YoY 2% YoY 2% YoY Analizar ROI de campañas Planificación de medios Automatización Mkt Análisis de cohortes Optimizar presupuestos Segmentación
  25. 25. Data Source 010011000 1001100 010011010 0100101001100 01001100 0100110001001100 010011000100101001100 01001100 BQ BQ Modelado de clientes Gestión de alertas Modelado Acciones Dashboard [5.1] [5.2] [2] [3] [1] [4] [5] Anomalías Arquitectura
  26. 26. Código fuente https://github.com/joseramoncajide/data_konferences
  27. 27. @jrcajide es.linkedin.com/in/jrcajide GRACIAS

×