• Save

Loading…

Flash Player 9 (or above) is needed to view presentations.
We have detected that you do not have it on your computer. To install it, go here.

Like this document? Why not share!

Modelo de segmentação de Clientes

on

  • 4,104 views

Desenvolvimento de um modelo de segmentação na indústria elétrica

Desenvolvimento de um modelo de segmentação na indústria elétrica

Statistics

Views

Total Views
4,104
Views on SlideShare
4,104
Embed Views
0

Actions

Likes
1
Downloads
0
Comments
0

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

Modelo de segmentação de Clientes Modelo de segmentação de Clientes Document Transcript

  • Data Mining 2011/2012Modelo de segmentação na Indústria Elétrica Lisboa, 9 de Dezembro de 2011 Hugo Rodrigues hugo.rodrigues@gmail.comÍndice
  • Data Mining – 2011/2012 Modelo de segmentação na Indústria Eléctrica1. Introdução .............................................................................................................. 42. Criação de Projeto e Diagrama...................................................................................... 43. Importação da ABT ................................................................................................... 54. Exploração das variáveis ............................................................................................. 65. Filtros .................................................................................................................... 76. Valores omissos ........................................................................................................ 77. Criar/Transformar variáveis .......................................................................................... 98. Desenvolvimento dos Clusters .................................................................................... 109. Análise de Perfil dos Segmentos .................................................................................. 1310. Comparação de Perfis .............................................................................................. 1511. Estratégias de Marketing ........................................................................................... 1612. Scorização............................................................................................................. 1713. Anexos ................................................................................................................. 20Hugo Rodrigues 2
  • Data Mining – 2011/2012 Modelo de segmentação na Indústria EléctricaTabela de ImagensFig 1 – Criação de um diagrama ............................................................................. 4Fig 2 – Criação do projeto inicial, criando uma libname ............................................. 5Fig 3 – Propriedades da ABT disponibilizada ............................................................. 5Fig 4 – Resultado da importação: variáveis existentes e respectivo papel .................... 5Fig 5 – Variáveis rejeitadas .................................................................................... 6Fig 6 – Resultado da ABT após o tratamento de variáveis .......................................... 6Fig 7 – Node do tipo SAS Code para tratamento da variável data_nasc ...................... 6Fig 8 – Resultado da nova variável Idade com anos ................................................. 7Fig 9 – Filter Node ............................................................................................... 7Fig 10 – Correção de Outliers ................................................................................ 7Fig 11 – Stat Explore Node ................................................................................... 7Fig 12 – Missing Values identificados nas variáveis .................................................. 8Fig 13 –Missing Values Node ................................................................................. 8Fig 14 – Metadata Node........................................................................................ 9Fig 15 – Variáveis Tratadas ................................................................................... 9Fig 16 – Transform Variables Node ........................................................................ 9Fig 17 – Métodos de transformação de variáveis ...................................................... 9Fig 18 – Variáveis alvo de transformação ...............................................................10Fig 19 – Variáveis transformadas ..........................................................................10Fig 20 – Cluster Node ..........................................................................................10Fig 21 – Variáveis não utilizadas para os clusters ....................................................10Fig 22 – Cluster Plot (não hierárquico) ..................................................................11Fig 23 – Dimensão dos Clusters ............................................................................11Fig 24 – Valor das Variáveis .................................................................................11Fig 25 – Análise dos Segmentos ...........................................................................12Fig 26 – Análise do Consumo por Segmento...........................................................12Fig 27 – Análise da Potência Contratada por Segmento ...........................................12Fig 28 – Análise da Faturação por Segmento ..........................................................13Fig 29 – Análise da Classe de Conta por Segmento .................................................13Fig 30 –Segment Profile Node ..............................................................................13Fig 31 – Segment Size ........................................................................................14Fig 32 – Variable Worth .......................................................................................14Fig 33 – Segment Profile .....................................................................................15Fig 34 –Score Node.............................................................................................17Fig 35 –SAS Code ...............................................................................................17Fig 36 –Scorização de 2011 .................................................................................18Fig 37 –Aplicação do modelo Scoring ....................................................................18Fig 38 –Resultado do Scoring ...............................................................................19Hugo Rodrigues 3
  • Data Mining – 2011/2012 Modelo de segmentação na Indústria Eléctrica1. IntroduçãoNo âmbito da cadeira de Data Mining foi proposto a elaboração de um trabalho que é odesenvolvimento de um modelo de segmentação na indústria eléctrica.Para uma leitura simples decidimos modelar o trabalho segmentado, ou seja segmentaros vários perfis a serem utilizados. Este tipo de operação são de um enorme relevoporque isto permite aos gestores analisar a sua organização,bem como analisar a nível segmentar dos vários produtos eserviços, face a isso também compreender melhor os váriosserviços que os seus concorrentes diretos fornecem e atémesmo possíveis concorrentes num futuro próximo.Pelo conhecimento aplicado nas aulas, podemos alinhar o modelo de segmentação declientes em 5 fases:  Análise dos vários perfis utilizados  Planeamento do modelo analítico  Implementação do modelo proposto  Tabela ABT o Caso de exclusão  Oportunidades identificadas nos vários grupos2. Criação de Projeto e DiagramaRecorrendo a aplicação SAS Enterprise Miner Workstation 7.1 efetuámos a criação deum novo projeto: Fig 1 – Criação de um diagramaHugo Rodrigues 4
  • Data Mining – 2011/2012 Modelo de segmentação na Indústria Eléctrica3. Importação da ABTFoi necessário adicionar uma opção para ignorar a validação das variáveis parapodermos carregar a ABT disponibilizada: Fig 2 – Criação do projeto inicial, criando uma libnameEfetuámos o seguinte procedimento para importação da ABT RAW para o projeto: Fig 3 – Propriedades da ABT disponibilizadaConseguimos observar que os dados que vão ser utilizados têm como base uma tabelacom 17 variáveis e 288890 observações.Esta ABT vai ser utilizada para efetuarmos a exploração de dados para o projeto. Fig 4 – Resultado da importação: variáveis existentes e respectivo papelHugo Rodrigues 5
  • Data Mining – 2011/2012 Modelo de segmentação na Indústria Eléctrica 4. Exploração das variáveisExplorando os dados da ABT disponibilizada, concluímos que existem variáveis que nãosão relevantes para a nossa análise.As variáveis Ntelefone, Tel_alternativo e n_contrib não acrescentam valor quediferencie a segmentação por ou todos terem, ou por não fazer sentido (ter ou não tertelefone alternativo quando já têm Telefone). Fig 5 – Variáveis rejeitadasTambém observamos que existem variáveis mal classificadas quanto ao seu papel elevel. Dessa forma efetuámos a seguinte correção: Fig 6 – Resultado da ABT após o tratamento de variáveisA variável data_nasci não é trabalhável da forma como consta na tabela, sendonecessário efetuar uma transformação para o formato numérico, em anos. Fig 7 – Node do tipo SAS Code para tratamento da variável data_nascCódigo:data &EM_EXPORT_TRAIN;set &EM_IMPORT_DATA;Idade = Floor((date()-data_nasci)/365); /* Determina o número de dias até à data, converte para anos earredonda */run;Hugo Rodrigues 6
  • Data Mining – 2011/2012 Modelo de segmentação na Indústria EléctricaComo resultado, passámos a ter o número de anos para cada observação: Fig 8 – Resultado da nova variável Idade com anos5. FiltrosApós a exploração das variáveis percebemos que nas variáveis intervalares existemoutliers. Para o tratamento desta situação utilizou-se um node do tipo Filter. Fig 9 – Filter NodePara tal efetuamos a aplicação de filtros sobre as observações efetuadas. Fig 10 – Correção de Outliers6. Valores omissosAnalisando os resultados, com um nó do tipo Stat Explore observamos que existemmissing values em ambos os tipos de variáveis. Fig 11 – Stat Explore NodeHugo Rodrigues 7
  • Data Mining – 2011/2012 Modelo de segmentação na Indústria EléctricaOs resultados obtidos foram os seguintes: Fig 12 – Missing Values identificados nas variáveisPara efetuar o tratamento dos valores omissos, utilizamos um nó do tipo Impute. Fig 13 –Missing Values NodePara o tratamento, adotámos uma estratégia baseada nos seguintes parâmetros: Propriedade ValorMissing Cutoff 50 %Default Input Method (para as variáveis de classe e intervalares) TreeDefault Character Value DescDefault Number Value 0Ao utilizarmos este método as variáveis género e distribuidora serão afetadas pois apercentagem de missing values é superior ao valor de cuttoff que definimos. Paraultrapassar esta questão definimos que devem ser consideradas e como métodoutilizado a constant.A variável género é por isso eliminada uma vez que não faz sentido a imputação deomissos a Masc ou Fem.De seguida efetuamos um filtro de variáveis para ficarmos com um novo conjunto detrabalho.Hugo Rodrigues 8
  • Data Mining – 2011/2012 Modelo de segmentação na Indústria Eléctrica Fig 14 – Metadata NodeO nosso modelo passa a considerar as seguintes variáveis: Fig 15 – Variáveis Tratadas7. Criar/Transformar variáveisVerificamos que no conjunto obtido existem assimetrias que podem prejudicar osresultados. Para tratamento destes casos foi necessário efetuarmos transformação. Fig 16 – Transform Variables NodePara selecionarmos o melhor método de transformação foi necessário efetuar váriastentativas. Como parâmetros base definimos o seguinte: Propriedade Valor Method First N Cutoff Value 1.04E-4Após várias tentativas selecionámos para as variáveis os seguintes métodos detransformação: Fig 17 – Métodos de transformação de variáveisHugo Rodrigues 9
  • Data Mining – 2011/2012 Modelo de segmentação na Indústria EléctricaAs variáveis tinham a seguinte distribuição: Fig 18 – Variáveis alvo de transformaçãoCom a transformação passámos a ter os seguintes resultados: Fig 19 – Variáveis transformadas8. Desenvolvimento dos ClustersPara o desenvolvimento de clusters tivemos uma primeira abordagem baseada emcluster node: Fig 20 – Cluster NodeIniciámos a análise com um cluster hierárquico. Neste caso a definição dos métodos equantidade é automática. Após uma afinação concluímos que deveríamos reduzir ovalor máximo do critério de seleção. O resultado automático resultou em 9 clusters. Osresultados não foram interessantes pois observamos demasiados clusters, e todos elesmuito próximos (distância curta).Realizámos por isso um cluster do tipo Não Hierárquico. Neste caso demos um valorinicial de 5 clusters. Verificámos que existem frequências muito díspares entre osclusters considerados. Efetuamos uma revisão nas variáveis a considerar para a análise.Por serem muito semelhantes, descartamos as seguintes: Fig 21 – Variáveis não utilizadas para os clustersHugo Rodrigues 10
  • Data Mining – 2011/2012 Modelo de segmentação na Indústria EléctricaReduzimos para 4 uma vez que 2 deles estavam muito próximos. O resultado final foi oseguinte: Fig 22 – Cluster Plot (não hierárquico)Dimensão dos Clusters Fig 23 – Dimensão dos ClustersValor de importância das Variáveis Fig 24 – Valor das VariáveisHugo Rodrigues 11
  • Data Mining – 2011/2012 Modelo de segmentação na Indústria EléctricaAnálise dos Segmentos Fig 25 – Análise dos SegmentosO segmento 3 é o que possui maior valor médio de consumo mensal, seguindo-se dossegmentos 2, 4 e 1: Fig 26 – Análise do Consumo por SegmentoO segmento 2 é o que possui maior nível de potência contratada associada ao contrato,seguindo-se dos segmentos 1, 4 e 3: Fig 27 – Análise da Potência Contratada por SegmentoHugo Rodrigues 12
  • Data Mining – 2011/2012 Modelo de segmentação na Indústria EléctricaO segmento 2 é o que possui maior volume de faturação, seguindo-se dos segmentos3, 4 e 1: Fig 28 – Análise da Faturação por SegmentoO segmento 4 é o que possui maior volume de clientes residenciais, seguindo-se dossegmentos 3, 2 e 1: Fig 29 – Análise da Classe de Conta por Segmento9. Análise de Perfil dos SegmentosAtravés do nó Segment Profile podemos verificar os dados segmentados e analisadospelo cluster, e identificar os factores de diferenciação em relação à população.Através dos relatórios fornecidos por este nó (comparação dos segmentos com apopulação) podemos analisar e delinear posteriormente estratégias de marketing deacordo com objectivos da empresa. Fig 30 –Segment Profile NodeHugo Rodrigues 13
  • Data Mining – 2011/2012 Modelo de segmentação na Indústria EléctricaOs 4 segmentos resultantes do modelo têm o seguinte peso e distribuição: Fig 31 – Segment SizeVerifica-se que o segmento 3 é o mais observado com 40% do valor total da populaçãoanalisada.Segue-se o segmento 4 com 31,96%, o segmento 2 com 18,65% e por ultimo osegmento 1 com 9,31%.As variáveis possuem o seguinte peso por segmento: Fig 32 – Variable WorthHugo Rodrigues 14
  • Data Mining – 2011/2012 Modelo de segmentação na Indústria EléctricaObservamos os seguintes perfis de segmento: Fig 33 – Segment Profile10. Comparação de PerfisPara avaliarmos se os segmentos obtidos fazem sentido, poderemos verificar pelaanálise da figura Fig 33 – Segment Profile, que os gráficos representantes da população(a vermelho para as variáveis intervalares) não coincidem com os gráficos do segmento(a azul para as variáveis intervalares).Comparando o resultado dos clusters com os perfis dos segmentos, podemos concluirque é possível adotarmos a segmentação para a segmentação dos clientes com base nosegmento. PotênciaSegmento/Variáveis Faturação Consumo Residencial Contratada Segmento 1 * * *** * Segmento 2 **** *** **** ** Segmento 3 *** **** * *** Segmento 4 ** ** ** ****Analisando os resultados anteriores poderemos concluir o seguinte:  O segmento 1 poderá ser composto por Empresas, uma vez que se identifica ter um baixo volume residencial e uma potência contratada elevada (Industria, comércio,etc.);  O segmento 2 retrata clientes que poderão ser empresas ou residenciais, cuja faturação é elevada, resultante de uma atividade intensa dado o consumo elevado;Hugo Rodrigues 15
  • Data Mining – 2011/2012 Modelo de segmentação na Indústria Eléctrica  O segmento 3 identifica clientes residenciais, com um nível de potencia contratada baixo, mas que consomem muito, resultando no segundo segmento mais importante ao nível da faturação;  O segmento 4 inclui os clientes residenciais que têm um consumo e potência contratada baixos e como tal um nível de faturação baixo.11. Estratégias de MarketingPara uma abordagem comercial, tendo como objetivo criar um conjunto deoportunidades sobre os segmentos encontrados.Ao nível estratégico, as ações recomendadas visam reter os clientes mais valiosos paraa empresa, ou seja, os que representam maior faturação. Promover a comunicação daempresa para com os clientes empresariais e aumentar o nível de envolvimento dospequenos clientes.Num nível mais tático, propomos a seguinte estrutura comercial para cada camada:  Platina (Segmento 2): Segmento de topo que representa clientes sobre os quais deverão ser promovidas ações comerciais de comunicação (contato permanente e pró-ativo), de forma a garantir a exclusividade na utilização da rede elétrica atual e consequentemente garantir a manutenção dos clientes.  Ouro (Segmento 3): Este segmento representa os clientes que consomem muita energia. Recomendamos que sejam efetuadas ações de marketing que demonstrem o valor obtido pela utilização da rede de energia atual, e como a eficácia do serviço é elemento diferenciador para a qualidade de vida. Recomendamos também a criação de cartões de cliente que proporcionem vantagens pessoais em serviços diversos.  Prata (Segmento 4): Este segmento representa os pequenos consumidores residenciais. Recomendamos que sejam efetuadas campanhas de marketing através de uma abordagem ao nível das redes sociais, por ser mais direta, tendo uma implicação na cultura do público-alvo mais abrangente dentro deste segmento.  Bronze (Segmento 1): Este segmento representa clientes empresariais que consomem muita energia. Recomendamos que sejam efetuadas campanhas de marketing personalizadas, dado representar um subconjunto reduzido da população, que demonstrem a qualidade do serviço atual e os benefícios obtidos pela utilização da rede atual. Propomos também que seja demonstrada flexibilidade na prestação de serviços complementares por forma a alargar o portefólio de serviços contratados.Hugo Rodrigues 16
  • Data Mining – 2011/2012 Modelo de segmentação na Indústria EléctricaAcreditamos que com estas recomendações será possível inverter ou minimizar a perdade fidelização dos clientes atuais face à possível liberalização do mercado elétrico.12. ScorizaçãoPara automatizar o processo de análise de clientes, com base no modelo validado, quenormalmente ocorre com regularidade, realiza-se a ação de scorização. No modeloanalítico utiliza-se o nó de score: Fig 34 –Score NodeO Score permite ter acesso a todo o código subjacente à criação do modelo, que poderáser aplicado sobre uma nova ABT com dados atualizados à data.Foram produzidos dois modelos de código. Um representa o código total – SAS Code. Ooutro modelo representa uma versão reduzida e otimizada. Fig 35 –SAS CodeHugo Rodrigues 17
  • Data Mining – 2011/2012 Modelo de segmentação na Indústria EléctricaNeste trabalho, para simular a scorização do mês de janeiro de 2011, associamos aonode de scoring uma nova instância da ABT ABT_FACTUR_ENERGIA com o Role de“Score”. Fig 36 –Scorização de 2011Na aplicação do modelo foram consideradas as seguinte variáveis: Fig 37 –Aplicação do modelo ScoringHugo Rodrigues 18
  • Data Mining – 2011/2012 Modelo de segmentação na Indústria EléctricaO resultado desta scorização foi: Fig 38 –Resultado do ScoringHugo Rodrigues 19
  • 13. Anexos