SlideShare a Scribd company logo
1 of 12
www.ipvc.pt AnalysisServices ■Realizado por: Joel Latino                              joellatino@ipvc.pt ■ Orientadores do IPVC: Prof. Jorge Ribeiro Ano lectivo 2009/2010
Agenda ■ 1. Introdução■ 2. Apresentação da Empresa■ 3. Trabalho desenvolvido■ 4. Conclusões - 2 - @2010, Adventure Works Cycles- IPVC, Analysis Services - Joel Latino
1. Introdução ,[object Object]
 Por isso, esta empresa pretende saber mais sobre os seus clientes através do seu histórico de compras.  E usar esses dados para desenvolver previsões que possam ser usadas em marketing. A empresa nunca tinha usado Data Mining antes, por isso, pretendeu-se desenvolver uma nova base de dados especificamente para realizar Data Mining, permitindo desenvolver vários modelos.
 Os modelos desenvolvidos são as árvores de decisão, Clustering da Microsoft e NaiveBayes da Microsoft.- 3 - @2010, Adventure Works Cycles- IPVC, Analysis Services - Joel Latino
2. Apresentação da Empresa ■ A Adventure Works Cycles é uma empresa fictícia criada pela Microsoft para simular cenários de negócio com o objectivo de fornecer tutoriais de desenvolvimento aos utilizadores do seu software. ■ Trata-se de uma empresa em que o seu negócio consiste na venda de bicicletas aos seus clientes.  - 4 - @2010, Adventure Works Cycles- IPVC, Analysis Services - Joel Latino
3. Trabalho desenvolvido ■ Criar um Projecto Business Inteligence  do tipo Analise Service. ■ Definir a conexão á base de dados (Data Source). ■ Definir os dados, do Datawarehouse, a utilizar para a técnicas de Data Mining (Data SouceView). ■ Criar uma estrutura de Data Mining, onde temos de definir os seguintes aspectos: ■ Técnica de Data Mining, neste caso foram as Arvores de Decisão, Clustering da Microsoft e NaiveBayes da Microsoft. ■ Tabelas a utilizar no processo de Data Mining. ■ Especificação do conjunto de teste. ■ Especificar o conjunto de dados de teste, com base na percentagem de dados a utilizar. - 5 - @2010, Adventure Works Cycles- IPVC, Analysis Services - Joel Latino
3. Trabalho desenvolvido ■ Conluiada criação da Estrutura de Data Minig, com todas as técnicas, mencionadas, implementadas, obtivemos os seguintes resultados, demonstrados nos slides seguintes. Fig. 1: Arvore de Decisão - 6 - @2010, Adventure Works Cycles- IPVC, Analysis Services - Joel Latino
3. Trabalho desenvolvido ■ A imagem que se segue ilustra a rede de depenicas criada com a associação da arvore de decisão mencionada anteriormente. Fig. 2: Rede de dependências com base na árvore de decisão. - 7 - @2010, Adventure Works Cycles- IPVC, Analysis Services - Joel Latino
3. Trabalho desenvolvido ■ Modelo de Clusters, usado a técnica Clustering da Microsoft. A figura 3 demonstra praticamente todas as ligações de proximidade enquanto que na figura 4 ilustra apenas as ligações mais fortes. A cor escura das linhas representa a força de aproximação entre cada Cluster. Fig. 3: Diagrama de Cluster com as ligações Fig. 4: Diagrama de Cluster com as ligações mais fortes - 8 - @2010, Adventure Works Cycles- IPVC, Analysis Services - Joel Latino
3. Trabalho desenvolvido ■ A imagem que se segue ilustra o modelo de dependências obtido com base na técnica NaiveBayes da Microsoft. Por isso a ordem das ligações mais fracas para as ligações mais fortes são: EnglishOccupation, Marital Status, Region, NumberChildrenAtHome, EnglishEducation, Total Children, CommuteDistance e NumberCarOwned. Fig. 5: Rede de dependências - 9 - @2010, Adventure Works Cycles- IPVC, Analysis Services - Joel Latino
3. Trabalho desenvolvido ■ No Lift Chart podemos visualizar os dados relativos a cada modelo implementado, a percentagem de população classificada e a previsão feita. Fig. 6: Lift Chart – representação gráfica da previsão dos modelos criados.  - 10 - @2010, Adventure Works Cycles- IPVC, Analysis Services - Joel Latino

More Related Content

Similar to Análise de dados de clientes para previsões de marketing usando técnicas de Data Mining

Mineração de dados com RapidMiner + WEKA - Clusterização
Mineração de dados com RapidMiner + WEKA - ClusterizaçãoMineração de dados com RapidMiner + WEKA - Clusterização
Mineração de dados com RapidMiner + WEKA - ClusterizaçãoJoão Gabriel Lima
 
Trabalhos Big Data e Algoritmos - Mercado Financeiro
Trabalhos Big Data e Algoritmos - Mercado FinanceiroTrabalhos Big Data e Algoritmos - Mercado Financeiro
Trabalhos Big Data e Algoritmos - Mercado FinanceiroMarco Garcia
 
Lessons learned 6
Lessons learned 6Lessons learned 6
Lessons learned 6Joel Pinto
 
Visão Geral De Desenvolvimento Web Sre 2012
Visão Geral De Desenvolvimento Web   Sre 2012Visão Geral De Desenvolvimento Web   Sre 2012
Visão Geral De Desenvolvimento Web Sre 2012Carlos Casalicchio
 
[DTC21] Raphael Castilho - Começando com Inteligência Artificial e Machine Le...
[DTC21] Raphael Castilho - Começando com Inteligência Artificial e Machine Le...[DTC21] Raphael Castilho - Começando com Inteligência Artificial e Machine Le...
[DTC21] Raphael Castilho - Começando com Inteligência Artificial e Machine Le...Deep Tech Brasil
 
Apostila comunicação visual
Apostila comunicação visualApostila comunicação visual
Apostila comunicação visualAdriano Borges
 
Apostila comunicação visual para web
Apostila comunicação visual para webApostila comunicação visual para web
Apostila comunicação visual para webMarcos Nori
 
Machine Learning com Vowpal Wabbit
Machine Learning com Vowpal WabbitMachine Learning com Vowpal Wabbit
Machine Learning com Vowpal WabbitLabs Alfacon
 
TDC2016SP - SparkMLlib Machine Learning na Prática
TDC2016SP -  SparkMLlib Machine Learning na PráticaTDC2016SP -  SparkMLlib Machine Learning na Prática
TDC2016SP - SparkMLlib Machine Learning na Práticatdc-globalcode
 
Inteligência Artificial Aplicada - Software, Hardware e Resultados
Inteligência Artificial Aplicada - Software, Hardware e ResultadosInteligência Artificial Aplicada - Software, Hardware e Resultados
Inteligência Artificial Aplicada - Software, Hardware e ResultadosDionisio Chiuratto Agourakis
 
Fast start tv b#1 p9_tela_modelo_negocio
Fast start tv b#1 p9_tela_modelo_negocioFast start tv b#1 p9_tela_modelo_negocio
Fast start tv b#1 p9_tela_modelo_negociofabricastartups
 
Web analytics-uma-visao-brasileira-2
Web analytics-uma-visao-brasileira-2Web analytics-uma-visao-brasileira-2
Web analytics-uma-visao-brasileira-2Pedro Quintanilha
 
e-Book Web Analytics - Uma Visão Brasileira II
e-Book Web Analytics - Uma Visão Brasileira IIe-Book Web Analytics - Uma Visão Brasileira II
e-Book Web Analytics - Uma Visão Brasileira IIGerson Ribeiro
 
Web Analytics - Uma Visão Brasileira II
Web Analytics - Uma Visão Brasileira IIWeb Analytics - Uma Visão Brasileira II
Web Analytics - Uma Visão Brasileira IIPoliana Lopes
 
PowerBI na Pártica com Indicadores Elicitados com MindMap e Canvas consumidos...
PowerBI na Pártica com Indicadores Elicitados com MindMap e Canvas consumidos...PowerBI na Pártica com Indicadores Elicitados com MindMap e Canvas consumidos...
PowerBI na Pártica com Indicadores Elicitados com MindMap e Canvas consumidos...Aislan Honorato
 
Web Analytics - Uma visão Brasileira - Volume 2
Web Analytics - Uma visão Brasileira - Volume 2Web Analytics - Uma visão Brasileira - Volume 2
Web Analytics - Uma visão Brasileira - Volume 2Guga Alves
 

Similar to Análise de dados de clientes para previsões de marketing usando técnicas de Data Mining (17)

Mineração de dados com RapidMiner + WEKA - Clusterização
Mineração de dados com RapidMiner + WEKA - ClusterizaçãoMineração de dados com RapidMiner + WEKA - Clusterização
Mineração de dados com RapidMiner + WEKA - Clusterização
 
Tsg web mining
Tsg web miningTsg web mining
Tsg web mining
 
Trabalhos Big Data e Algoritmos - Mercado Financeiro
Trabalhos Big Data e Algoritmos - Mercado FinanceiroTrabalhos Big Data e Algoritmos - Mercado Financeiro
Trabalhos Big Data e Algoritmos - Mercado Financeiro
 
Lessons learned 6
Lessons learned 6Lessons learned 6
Lessons learned 6
 
Visão Geral De Desenvolvimento Web Sre 2012
Visão Geral De Desenvolvimento Web   Sre 2012Visão Geral De Desenvolvimento Web   Sre 2012
Visão Geral De Desenvolvimento Web Sre 2012
 
[DTC21] Raphael Castilho - Começando com Inteligência Artificial e Machine Le...
[DTC21] Raphael Castilho - Começando com Inteligência Artificial e Machine Le...[DTC21] Raphael Castilho - Começando com Inteligência Artificial e Machine Le...
[DTC21] Raphael Castilho - Começando com Inteligência Artificial e Machine Le...
 
Apostila comunicação visual
Apostila comunicação visualApostila comunicação visual
Apostila comunicação visual
 
Apostila comunicação visual para web
Apostila comunicação visual para webApostila comunicação visual para web
Apostila comunicação visual para web
 
Machine Learning com Vowpal Wabbit
Machine Learning com Vowpal WabbitMachine Learning com Vowpal Wabbit
Machine Learning com Vowpal Wabbit
 
TDC2016SP - SparkMLlib Machine Learning na Prática
TDC2016SP -  SparkMLlib Machine Learning na PráticaTDC2016SP -  SparkMLlib Machine Learning na Prática
TDC2016SP - SparkMLlib Machine Learning na Prática
 
Inteligência Artificial Aplicada - Software, Hardware e Resultados
Inteligência Artificial Aplicada - Software, Hardware e ResultadosInteligência Artificial Aplicada - Software, Hardware e Resultados
Inteligência Artificial Aplicada - Software, Hardware e Resultados
 
Fast start tv b#1 p9_tela_modelo_negocio
Fast start tv b#1 p9_tela_modelo_negocioFast start tv b#1 p9_tela_modelo_negocio
Fast start tv b#1 p9_tela_modelo_negocio
 
Web analytics-uma-visao-brasileira-2
Web analytics-uma-visao-brasileira-2Web analytics-uma-visao-brasileira-2
Web analytics-uma-visao-brasileira-2
 
e-Book Web Analytics - Uma Visão Brasileira II
e-Book Web Analytics - Uma Visão Brasileira IIe-Book Web Analytics - Uma Visão Brasileira II
e-Book Web Analytics - Uma Visão Brasileira II
 
Web Analytics - Uma Visão Brasileira II
Web Analytics - Uma Visão Brasileira IIWeb Analytics - Uma Visão Brasileira II
Web Analytics - Uma Visão Brasileira II
 
PowerBI na Pártica com Indicadores Elicitados com MindMap e Canvas consumidos...
PowerBI na Pártica com Indicadores Elicitados com MindMap e Canvas consumidos...PowerBI na Pártica com Indicadores Elicitados com MindMap e Canvas consumidos...
PowerBI na Pártica com Indicadores Elicitados com MindMap e Canvas consumidos...
 
Web Analytics - Uma visão Brasileira - Volume 2
Web Analytics - Uma visão Brasileira - Volume 2Web Analytics - Uma visão Brasileira - Volume 2
Web Analytics - Uma visão Brasileira - Volume 2
 

Análise de dados de clientes para previsões de marketing usando técnicas de Data Mining

  • 1. www.ipvc.pt AnalysisServices ■Realizado por: Joel Latino joellatino@ipvc.pt ■ Orientadores do IPVC: Prof. Jorge Ribeiro Ano lectivo 2009/2010
  • 2. Agenda ■ 1. Introdução■ 2. Apresentação da Empresa■ 3. Trabalho desenvolvido■ 4. Conclusões - 2 - @2010, Adventure Works Cycles- IPVC, Analysis Services - Joel Latino
  • 3.
  • 4. Por isso, esta empresa pretende saber mais sobre os seus clientes através do seu histórico de compras. E usar esses dados para desenvolver previsões que possam ser usadas em marketing. A empresa nunca tinha usado Data Mining antes, por isso, pretendeu-se desenvolver uma nova base de dados especificamente para realizar Data Mining, permitindo desenvolver vários modelos.
  • 5. Os modelos desenvolvidos são as árvores de decisão, Clustering da Microsoft e NaiveBayes da Microsoft.- 3 - @2010, Adventure Works Cycles- IPVC, Analysis Services - Joel Latino
  • 6. 2. Apresentação da Empresa ■ A Adventure Works Cycles é uma empresa fictícia criada pela Microsoft para simular cenários de negócio com o objectivo de fornecer tutoriais de desenvolvimento aos utilizadores do seu software. ■ Trata-se de uma empresa em que o seu negócio consiste na venda de bicicletas aos seus clientes. - 4 - @2010, Adventure Works Cycles- IPVC, Analysis Services - Joel Latino
  • 7. 3. Trabalho desenvolvido ■ Criar um Projecto Business Inteligence do tipo Analise Service. ■ Definir a conexão á base de dados (Data Source). ■ Definir os dados, do Datawarehouse, a utilizar para a técnicas de Data Mining (Data SouceView). ■ Criar uma estrutura de Data Mining, onde temos de definir os seguintes aspectos: ■ Técnica de Data Mining, neste caso foram as Arvores de Decisão, Clustering da Microsoft e NaiveBayes da Microsoft. ■ Tabelas a utilizar no processo de Data Mining. ■ Especificação do conjunto de teste. ■ Especificar o conjunto de dados de teste, com base na percentagem de dados a utilizar. - 5 - @2010, Adventure Works Cycles- IPVC, Analysis Services - Joel Latino
  • 8. 3. Trabalho desenvolvido ■ Conluiada criação da Estrutura de Data Minig, com todas as técnicas, mencionadas, implementadas, obtivemos os seguintes resultados, demonstrados nos slides seguintes. Fig. 1: Arvore de Decisão - 6 - @2010, Adventure Works Cycles- IPVC, Analysis Services - Joel Latino
  • 9. 3. Trabalho desenvolvido ■ A imagem que se segue ilustra a rede de depenicas criada com a associação da arvore de decisão mencionada anteriormente. Fig. 2: Rede de dependências com base na árvore de decisão. - 7 - @2010, Adventure Works Cycles- IPVC, Analysis Services - Joel Latino
  • 10. 3. Trabalho desenvolvido ■ Modelo de Clusters, usado a técnica Clustering da Microsoft. A figura 3 demonstra praticamente todas as ligações de proximidade enquanto que na figura 4 ilustra apenas as ligações mais fortes. A cor escura das linhas representa a força de aproximação entre cada Cluster. Fig. 3: Diagrama de Cluster com as ligações Fig. 4: Diagrama de Cluster com as ligações mais fortes - 8 - @2010, Adventure Works Cycles- IPVC, Analysis Services - Joel Latino
  • 11. 3. Trabalho desenvolvido ■ A imagem que se segue ilustra o modelo de dependências obtido com base na técnica NaiveBayes da Microsoft. Por isso a ordem das ligações mais fracas para as ligações mais fortes são: EnglishOccupation, Marital Status, Region, NumberChildrenAtHome, EnglishEducation, Total Children, CommuteDistance e NumberCarOwned. Fig. 5: Rede de dependências - 9 - @2010, Adventure Works Cycles- IPVC, Analysis Services - Joel Latino
  • 12. 3. Trabalho desenvolvido ■ No Lift Chart podemos visualizar os dados relativos a cada modelo implementado, a percentagem de população classificada e a previsão feita. Fig. 6: Lift Chart – representação gráfica da previsão dos modelos criados. - 10 - @2010, Adventure Works Cycles- IPVC, Analysis Services - Joel Latino
  • 13. 3. Trabalho desenvolvido ■ A matriz de classificação, mais propriamente a matriz de confusão, permite indicar o numero de classificações correctas versus as previsões efectuadas para os respectivos modelos implementados. Fig. 7: Matriz de classificação dos modelos implementados. - 11 - @2010, Adventure Works Cycles- IPVC, Analysis Services - Joel Latino
  • 14. 4. Conclusão No LiftChart o modelo ideal será aquele que se aproxima de uma linha recta, como podemos ver no segundo slide anterior, por isso será o modelo das Arvores de decisão. As árvores de decisão têm uma probabilidade de previsão de 72,84%, segue-se NaiveBayes com 71,45% e por fim o modelo Clustering com 59,65%. Analisando a matriz de classificação obtida pelo modelo de árvores de decisão podemos dizer o seguinte: - Que o número de verdadeiros positivos para obter o valor 0 é de 346, ou seja, previu correctamente 346 casos que as pessoas não compraram bicicleta.- Que o número de falsos positivos é de 161 para o valor 0, isto é, o número de casos em que o modelo previu mal que alguém compraria uma bicicleta.- Que o numero de falsos positivos é de 132 para o valor 1, ou seja, o modelo previu que 132 casos alguém compraria uma bicicleta, mas isso não aconteceu. - Por fim, que o numero de verdadeiros positivos para obter o valor 1 é de 361, isto é, que o modelo previu correctamente que 361 casos alguém compraria uma bicicleta. - 12 - @2010, Adventure Works Cycles- IPVC, Analysis Services - Joel Latino