Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em serviços de telefonia

746 views

Published on

Nesta palestra, vamos trabalhar uma abordagem passo a passo de como construir um modelo de classificação, para identificar os padrões de clientes de uma empresa de telefonia que cancelaram o serviço, de modo que a operadora possa prever o risco de cancelamento e iniciar um trabalho para evitar que isso aconteça.

Published in: Technology
  • I liked it!.... STARTUPS...Send your pitchdeck to over 5700 of VC's and Angel's with just 1 click. Visit: Angelvisioninvestors.com
       Reply 
    Are you sure you want to  Yes  No
    Your message goes here

Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em serviços de telefonia

  1. 1. Mineração de dados com Classificação de Dados Um estudo de caso sobre o Churn Rate em serviços de telefonia PROF. JOÃO GABRIEL LIMA @JGABRIEL_LIMA LINKEDIN.COM/IN/JOAOGABRIELLIMA Mineração de dados com RapidMiner - Prof. João Gabriel Lima
  2. 2. Prof. João Gabriel Lima • Pesquisador em Mineração de dados e Inteligência Computacional; • Engenheiro da Computação, especialista em Software e Hardware; • Doutorando em Computação Aplicada; Mineração de dados com RapidMiner - Prof. João Gabriel Lima
  3. 3. Processo de Extração do conhecimento Mineração de dados com RapidMiner - Prof. João Gabriel Lima
  4. 4. Conhecendo nossa base de dados ENTENDER O DOMÍNIO E O CONHECIMENTO QUE PODEMOS EXTRAIR Mineração de dados com RapidMiner - Prof. João Gabriel Lima
  5. 5. Serviço de telefonia Nesta base de dados, temos os dados dos clientes de uma empresa de telefonia. Vamos focar no Churn Rate O que é o Churn Rate? ◦ Trata-se de uma métrica que avalia a quantidade de clientes que abandonam/cancelam um determinado serviço. ◦ Para uma empresa expandir é imprescindível que o seu Growth Rate (índice de crescimento) supere o seu Churn Rate. ◦ Objetivo é criar estratégias para lidar com os clientes de modo a compreender e diminuir o Churn Rate. Mineração de dados com RapidMiner - Prof. João Gabriel Lima
  6. 6. Serviço de telefonia Nesta base temos as seguintes informações: - TECNOLOGIA: 4G, Telefone Móvel, Telefone Fixo, Fibra - IDADE - DATA DE ADESÃO - LIGACOES_SUPORTE_ULTIMO_ANO: quantidade total de ligações feitas para ao suporte - MEDIA_FATURA_MENSAL - TAXA_DE_CHURN: probabilidade de cancelamento Mineração de dados com RapidMiner - Prof. João Gabriel Lima
  7. 7. Qual o objetivo chave? EM MINERAÇÃO DE DADOS, TRAÇAR O OBJETIVO É O PRIMEIRO PASSO. É FUNDAMENTAL! Mineração de dados com RapidMiner - Prof. João Gabriel Lima
  8. 8. Classificar e prever o Churn Rate de acordo com o perfil e comportamento dos clientes. Mineração de dados com RapidMiner - Prof. João Gabriel Lima
  9. 9. Ótimo! Vamos aos negócios!
  10. 10. Conhecendo nossa ferramenta!
  11. 11. AWESOME DATA MINE TOOL
  12. 12. Passo 1 – Abrindo nossos dados na ferramenta Abra o arquivo telefonia_churn_rate.csv com o componente Load Data.
  13. 13. Passo 2 – ETL e preparação de dados Precisamos marcar a coluna que será o alvo das análises ( TAXA_DE_CANCELAMENTO) e convetê-la de numérica para binária. Componentes: - Set Rule - Numerical to Binomial
  14. 14. Passo 3 – Preparando a validação do modelo Validar seu modelo é a chave do sucesso. O cross-validation separa o conjunto de dados em consjunto de treinamento e de teste. Componente: * X-Validation
  15. 15. Passo 3.1– Preparando o grupo de treinamento A maioria dos clientes querem ficar com um serviço ao invés de abandoná-lo (rsrsr) Para isso precisamos equilibrar nosso conjunto de treinamento para focar sobre o caso que estamos interessados. Como se estivéssemos colocando uma lupa sobre a taxa de cancelamento. Componentes: - Sample
  16. 16. Passo 3.1– Preparando o grupo de treinamento
  17. 17. Passo 3.2– Preparando o grupo de treinamento Em vez de apenas fazer a configuração manual, vamos otimizá-lo. Utilizando o modelo Wisdom of the Crowd para uma árvore de decisão nós vamos otimizar a profundidade máxima no intervalo [20-29] Componente: - Optimize Parameters (Grid)
  18. 18. Passo 4– Preparando nosso classificador Abrindo o ”Otimizador de Parâmetros”, o modelo será treinado e avaliado. Leitura recomendada: Wisdom of the Crowd Componentes: - Decision Tree; Apply Model; Performance
  19. 19. Passo 3.3 – Configurando o otimizador
  20. 20. Passo 3.2– Preparando o grupo de teste O modelo treinado será testado com esses dados para verificar e validar a eficiência dos resultados Componentes: - Apply Model - Performance (Binominal Classification)
  21. 21. Passo 3.3– Preparando o grupo de teste O modelo treinado será testado com esses dados para verificar e validar a eficiência dos resultados Componentes: - Apply Model - Performance (Binominal Classification)
  22. 22. Passo 3.3– Preparando o grupo de teste O modelo treinado será testado com esses dados para verificar e validar a eficiência dos resultados Componentes: - Apply Model - Performance (Binominal Classification)
  23. 23. Interpretando os resultados ENTENDENDO O PODER DE NOSSA MODELAGEM
  24. 24. Interpretando as saídas - Um modelo de árvore (treinado com os dados), que analisa o comportamento do churn e pode ser aplicada a qualquer cliente individual para estimar a probabilidade de churn. - Os dados de entrada original - A estimativa (isto é cross-validado) do desempenho do modelo.
  25. 25. Utilizando o modelo Queremos prever o comportamento de novos clientes. Para isso vamos utilizar o dataset: telefonia_churn_rate_final.csv Componentes: - Read CSV - Nominal to Date - Set Role Apply Model
  26. 26. Analisando os Resultados
  27. 27. Analisando os Resultados
  28. 28. Mano… que louco isso!
  29. 29. Agora é minha vez!
  30. 30. Atividade A partir de uma base de dados de sua escolha, com, no mínimo 100.000 registros, aplique a classificação de dados de modo que seja possível prever o comportamento do seu objeto de estudo, destacando a interpretação dos resultados. Devem apresentar de acordo com o exporto em sala de aula.
  31. 31. Mineração de dados com Classificação de Dados Um estudo de caso sobre o Churn Rate em serviços de telefonia PROF. JOÃO GABRIEL LIMA @JGABRIEL_LIMA LINKEDIN.COM/IN/JOAOGABRIELLIMA Mineração de dados com RapidMiner - Prof. João Gabriel Lima

×