SlideShare a Scribd company logo
1 of 15
Mineração de Dados com SQL Server – Datamining
Apresentação
Rodrigo Dornel é fundador e principal consultor da RDornel Data Platform Experts e
professor universitário na Universidade de Joinville. Possui mais de 15 anos de
experiência na área de TI, sendo os últimos 10 trabalhando com SQL Server. Possui
certificações MCSA, MCT, MCTS e MCITP. Também é atuante na comunidade como
MTAC e Chapter Leader do PASS em Santa Catarina.
Email: rodrigo@rdornel.com
Skype: rdornel@Hotmail.com
Linkedin profile: http://br.linkedin.com/pub/rodrigo-ramos-dornel/4/421/154
Blog: http://rdornel.wordpress.com
Twitter: @rdornel
Agenda
 Introdução
 Tarefas de Mineração de Dados
 Principais Algoritmos
 Análise dos Resultados
 Mineração com Analysis Services
 Mineração de Dados com Excel
Mineração de Dados com SQL Server - Introdução
Com os novos termos sendo introduzidos no mundo dos dados, Data Science, Analytics, Machine Learning,
muito gente se esqueceu que faz muito tempo que o SQL Server já tem seu kit de ferramentas para
descoberta do conhecimento.
Ferramentas muito poderosas e que passam despercebidas dentro do Analysis Services. Nessa apresentação
vamos analisar as principais ferramentas, algoritmos e técnicas que permitem você minerar dados de forma
robusta com o Analysis Services ou de forma mais simples com o plugin de mineração para o Excel.
Mineração de Dados com SQL Server – Introdução
 O que é Mineração de Dados?
 Quais passo eu preciso seguir?
 Que dados eu preciso?
 Quais ferramentas eu posso usar?
Mineração de Dados com SQL Server – Introdução
 Mineração de Dados
 Machine Learning
 Business Analytics
 Business Intelligence
 Big Data
 Cientista de Dados
Mineração de Dados com SQL Server – Introdução
 KDD – Knowledge Discovery in Database
 Imagen: http://i.imgur.com/713YCN9.png
Mineração de Dados com SQL Server – Tarefas
 Previsão
 Tendências com base em histórico
 Descrição
 Engenharia Reversa
Mineração de Dados com SQL Server – Tarefas
 Aprendizado
 Supervisionado
 Não supervisionado
Mineração de Dados com SQL Server – Algoritmos
 KNN
 K-means
 C4.5
 Apriori
Mineração de Dados com SQL Server – Exemplo
 KNN
 Simular no Excel
Mineração de Dados com SQL Server – Análise dos Resultados
 Acurácia
 Verdadeiro X Previsto
 Suporte
 Frequência que isso ocorre na base conhecida
 Confidencia
 Frequência que ele acerta nos novos casos
Mineração de Dados com SQL Server – Demonstração
 Analysis Services
 Arvore de Decisão
 Agrupamento
Mineração de Dados com SQL Server – Conclusão
 A mineração de dados é focada em gerar modelos e tendências
 Os resultados precisarão ser avaliados por um especialista da área
 Podemos usar tarefas e sub tarefas
 Dividir para conquistar
Referências
 MSDN: https://msdn.microsoft.com/en-us/library/ms167167.aspx
 Site: http://www.sqlserverdatamining.com/ssdm
 Blog: http://mcitpsc.com.br/?p=12

More Related Content

Viewers also liked

AIAのまちづくり
AIAのまちづくりAIAのまちづくり
AIAのまちづくりrika_hrtj
 
Criando indicadores de time com VSTS e POWER BI
Criando indicadores de time com VSTS e POWER BICriando indicadores de time com VSTS e POWER BI
Criando indicadores de time com VSTS e POWER BIAdriano Bertucci
 
SharePoint 2010 Workflows
SharePoint 2010 WorkflowsSharePoint 2010 Workflows
SharePoint 2010 WorkflowsPhil Wicklund
 
What is datavisualization?
What is datavisualization?What is datavisualization?
What is datavisualization?Stephane Nardin
 
[Vssummit] DevOps - Release Management VSTS
[Vssummit]   DevOps - Release Management VSTS[Vssummit]   DevOps - Release Management VSTS
[Vssummit] DevOps - Release Management VSTSLeandro Prado
 
Overcoming the challenges of Office 365 user management in hybrid environments​
Overcoming the challenges of Office 365 user management in hybrid environments​Overcoming the challenges of Office 365 user management in hybrid environments​
Overcoming the challenges of Office 365 user management in hybrid environments​Zoho Corporation
 
O365 Groups- Best Practices and Solutions
O365 Groups- Best Practices and SolutionsO365 Groups- Best Practices and Solutions
O365 Groups- Best Practices and SolutionsJohnConnected
 
Understanding Office 365 Groups: Ask The Experts
Understanding Office 365 Groups: Ask The ExpertsUnderstanding Office 365 Groups: Ask The Experts
Understanding Office 365 Groups: Ask The ExpertsDux Raymond Sy
 
10 Things Many IT Professionals Don’t Know About Office 365
10 Things Many IT Professionals Don’t Know About Office 36510 Things Many IT Professionals Don’t Know About Office 365
10 Things Many IT Professionals Don’t Know About Office 365Richard Harbridge
 
DevOps in the Cloud with Microsoft Azure
DevOps in the Cloud with Microsoft AzureDevOps in the Cloud with Microsoft Azure
DevOps in the Cloud with Microsoft Azuregjuljo
 
Office 365 presentation
Office 365 presentationOffice 365 presentation
Office 365 presentationSaed Shela
 

Viewers also liked (13)

AIAのまちづくり
AIAのまちづくりAIAのまちづくり
AIAのまちづくり
 
Criando indicadores de time com VSTS e POWER BI
Criando indicadores de time com VSTS e POWER BICriando indicadores de time com VSTS e POWER BI
Criando indicadores de time com VSTS e POWER BI
 
SharePoint 2010 Workflows
SharePoint 2010 WorkflowsSharePoint 2010 Workflows
SharePoint 2010 Workflows
 
What is datavisualization?
What is datavisualization?What is datavisualization?
What is datavisualization?
 
[Vssummit] DevOps - Release Management VSTS
[Vssummit]   DevOps - Release Management VSTS[Vssummit]   DevOps - Release Management VSTS
[Vssummit] DevOps - Release Management VSTS
 
Overcoming the challenges of Office 365 user management in hybrid environments​
Overcoming the challenges of Office 365 user management in hybrid environments​Overcoming the challenges of Office 365 user management in hybrid environments​
Overcoming the challenges of Office 365 user management in hybrid environments​
 
O365 Groups- Best Practices and Solutions
O365 Groups- Best Practices and SolutionsO365 Groups- Best Practices and Solutions
O365 Groups- Best Practices and Solutions
 
Understanding Office 365 Groups: Ask The Experts
Understanding Office 365 Groups: Ask The ExpertsUnderstanding Office 365 Groups: Ask The Experts
Understanding Office 365 Groups: Ask The Experts
 
10 Things Many IT Professionals Don’t Know About Office 365
10 Things Many IT Professionals Don’t Know About Office 36510 Things Many IT Professionals Don’t Know About Office 365
10 Things Many IT Professionals Don’t Know About Office 365
 
DevOps in the Cloud with Microsoft Azure
DevOps in the Cloud with Microsoft AzureDevOps in the Cloud with Microsoft Azure
DevOps in the Cloud with Microsoft Azure
 
Office 365 presentation
Office 365 presentationOffice 365 presentation
Office 365 presentation
 
DevOps with Microsoft Azure
DevOps with Microsoft AzureDevOps with Microsoft Azure
DevOps with Microsoft Azure
 
Office 365 ProPlus: Click-to-run deployment and management
Office 365 ProPlus: Click-to-run deployment and managementOffice 365 ProPlus: Click-to-run deployment and management
Office 365 ProPlus: Click-to-run deployment and management
 

Similar to Biweek Mineração de Dados com SQL Server

Mineração de dados com SQL Server - Datamining
Mineração de dados com SQL Server - DataminingMineração de dados com SQL Server - Datamining
Mineração de dados com SQL Server - DataminingRodrigo Dornel
 
Reunião01 Pass Chapter - MCITPSC
Reunião01 Pass Chapter - MCITPSCReunião01 Pass Chapter - MCITPSC
Reunião01 Pass Chapter - MCITPSCRodrigo Dornel
 
Reunião #1 – 2015 – Overview
Reunião #1 – 2015 – OverviewReunião #1 – 2015 – Overview
Reunião #1 – 2015 – OverviewRodrigo Dornel
 
O problema não é no banco de dados
O problema não é no banco de dadosO problema não é no banco de dados
O problema não é no banco de dadosMarcos Freccia
 
Detecção preventiva de fracionamento de compras
Detecção preventiva de fracionamento de comprasDetecção preventiva de fracionamento de compras
Detecção preventiva de fracionamento de comprasRommel Carvalho
 
Virtualização de dados para Advanced Analytics e Machine Learning
Virtualização de dados para Advanced Analytics e Machine LearningVirtualização de dados para Advanced Analytics e Machine Learning
Virtualização de dados para Advanced Analytics e Machine LearningDenodo
 
Palestra Cobisa-2019 - Desenvolvendo Cultura Analítica e Machine Learning
Palestra Cobisa-2019 - Desenvolvendo Cultura Analítica e Machine LearningPalestra Cobisa-2019 - Desenvolvendo Cultura Analítica e Machine Learning
Palestra Cobisa-2019 - Desenvolvendo Cultura Analítica e Machine LearningJosias Oliveira
 
realizando_limpeza_de_dados_com_data_quality_services
realizando_limpeza_de_dados_com_data_quality_servicesrealizando_limpeza_de_dados_com_data_quality_services
realizando_limpeza_de_dados_com_data_quality_servicesarthurjosemberg
 
PowerBI na Pártica com Indicadores Elicitados com MindMap e Canvas consumidos...
PowerBI na Pártica com Indicadores Elicitados com MindMap e Canvas consumidos...PowerBI na Pártica com Indicadores Elicitados com MindMap e Canvas consumidos...
PowerBI na Pártica com Indicadores Elicitados com MindMap e Canvas consumidos...Aislan Honorato
 
SQL Saturday 469 Brasília - Oportunidades com a plataforma de dados da Microsoft
SQL Saturday 469 Brasília - Oportunidades com a plataforma de dados da MicrosoftSQL Saturday 469 Brasília - Oportunidades com a plataforma de dados da Microsoft
SQL Saturday 469 Brasília - Oportunidades com a plataforma de dados da MicrosoftRodrigo Crespi
 
Business Intelligence & Data Mining - Knowledge Discovery in Databases
Business Intelligence & Data Mining - Knowledge Discovery in DatabasesBusiness Intelligence & Data Mining - Knowledge Discovery in Databases
Business Intelligence & Data Mining - Knowledge Discovery in DatabasesLeandro Guerra
 
[SIN-NA7] Gestão de Projetos e Empreendedorismo - Atividade: Status Report
[SIN-NA7] Gestão de Projetos e Empreendedorismo - Atividade: Status Report[SIN-NA7] Gestão de Projetos e Empreendedorismo - Atividade: Status Report
[SIN-NA7] Gestão de Projetos e Empreendedorismo - Atividade: Status ReportAlessandro Almeida
 
CURSOS_LISTA2022-v2.pdf
CURSOS_LISTA2022-v2.pdfCURSOS_LISTA2022-v2.pdf
CURSOS_LISTA2022-v2.pdflarcioFelix
 
Profissional de sistemas de informação
Profissional de sistemas de informaçãoProfissional de sistemas de informação
Profissional de sistemas de informaçãoIFBA
 
Escalando a Qualidade de Dados com Great Expectations e Spark no Modern Data ...
Escalando a Qualidade de Dados com Great Expectations e Spark no Modern Data ...Escalando a Qualidade de Dados com Great Expectations e Spark no Modern Data ...
Escalando a Qualidade de Dados com Great Expectations e Spark no Modern Data ...Cicero Joasyo Mateus de Moura
 
Apresentacao Vertical De Alocacao Consultor Adriana
Apresentacao Vertical De Alocacao   Consultor AdrianaApresentacao Vertical De Alocacao   Consultor Adriana
Apresentacao Vertical De Alocacao Consultor Adrianacleveranjos
 

Similar to Biweek Mineração de Dados com SQL Server (20)

Mineração de dados com SQL Server - Datamining
Mineração de dados com SQL Server - DataminingMineração de dados com SQL Server - Datamining
Mineração de dados com SQL Server - Datamining
 
Ementa curso de dados
Ementa curso de dadosEmenta curso de dados
Ementa curso de dados
 
Reunião01 Pass Chapter - MCITPSC
Reunião01 Pass Chapter - MCITPSCReunião01 Pass Chapter - MCITPSC
Reunião01 Pass Chapter - MCITPSC
 
Reunião #1 – 2015 – Overview
Reunião #1 – 2015 – OverviewReunião #1 – 2015 – Overview
Reunião #1 – 2015 – Overview
 
O problema não é no banco de dados
O problema não é no banco de dadosO problema não é no banco de dados
O problema não é no banco de dados
 
Detecção preventiva de fracionamento de compras
Detecção preventiva de fracionamento de comprasDetecção preventiva de fracionamento de compras
Detecção preventiva de fracionamento de compras
 
Painel 03 01 - Rommel Carvalho - detecção preventiva de fracionamento de co...
Painel 03   01 - Rommel Carvalho - detecção preventiva de fracionamento de co...Painel 03   01 - Rommel Carvalho - detecção preventiva de fracionamento de co...
Painel 03 01 - Rommel Carvalho - detecção preventiva de fracionamento de co...
 
Virtualização de dados para Advanced Analytics e Machine Learning
Virtualização de dados para Advanced Analytics e Machine LearningVirtualização de dados para Advanced Analytics e Machine Learning
Virtualização de dados para Advanced Analytics e Machine Learning
 
Palestra Cobisa-2019 - Desenvolvendo Cultura Analítica e Machine Learning
Palestra Cobisa-2019 - Desenvolvendo Cultura Analítica e Machine LearningPalestra Cobisa-2019 - Desenvolvendo Cultura Analítica e Machine Learning
Palestra Cobisa-2019 - Desenvolvendo Cultura Analítica e Machine Learning
 
realizando_limpeza_de_dados_com_data_quality_services
realizando_limpeza_de_dados_com_data_quality_servicesrealizando_limpeza_de_dados_com_data_quality_services
realizando_limpeza_de_dados_com_data_quality_services
 
PowerBI na Pártica com Indicadores Elicitados com MindMap e Canvas consumidos...
PowerBI na Pártica com Indicadores Elicitados com MindMap e Canvas consumidos...PowerBI na Pártica com Indicadores Elicitados com MindMap e Canvas consumidos...
PowerBI na Pártica com Indicadores Elicitados com MindMap e Canvas consumidos...
 
SQL Saturday 469 Brasília - Oportunidades com a plataforma de dados da Microsoft
SQL Saturday 469 Brasília - Oportunidades com a plataforma de dados da MicrosoftSQL Saturday 469 Brasília - Oportunidades com a plataforma de dados da Microsoft
SQL Saturday 469 Brasília - Oportunidades com a plataforma de dados da Microsoft
 
CVitae- Sergio Della Nina
CVitae- Sergio Della Nina CVitae- Sergio Della Nina
CVitae- Sergio Della Nina
 
Business Intelligence & Data Mining - Knowledge Discovery in Databases
Business Intelligence & Data Mining - Knowledge Discovery in DatabasesBusiness Intelligence & Data Mining - Knowledge Discovery in Databases
Business Intelligence & Data Mining - Knowledge Discovery in Databases
 
[SIN-NA7] Gestão de Projetos e Empreendedorismo - Atividade: Status Report
[SIN-NA7] Gestão de Projetos e Empreendedorismo - Atividade: Status Report[SIN-NA7] Gestão de Projetos e Empreendedorismo - Atividade: Status Report
[SIN-NA7] Gestão de Projetos e Empreendedorismo - Atividade: Status Report
 
CURSOS_LISTA2022-v2.pdf
CURSOS_LISTA2022-v2.pdfCURSOS_LISTA2022-v2.pdf
CURSOS_LISTA2022-v2.pdf
 
Profissional de sistemas de informação
Profissional de sistemas de informaçãoProfissional de sistemas de informação
Profissional de sistemas de informação
 
Escalando a Qualidade de Dados com Great Expectations e Spark no Modern Data ...
Escalando a Qualidade de Dados com Great Expectations e Spark no Modern Data ...Escalando a Qualidade de Dados com Great Expectations e Spark no Modern Data ...
Escalando a Qualidade de Dados com Great Expectations e Spark no Modern Data ...
 
Apresentacao Vertical De Alocacao Consultor Adriana
Apresentacao Vertical De Alocacao   Consultor AdrianaApresentacao Vertical De Alocacao   Consultor Adriana
Apresentacao Vertical De Alocacao Consultor Adriana
 
FGV - Data Science Day - Gabriela Queiroz
FGV - Data Science Day - Gabriela QueirozFGV - Data Science Day - Gabriela Queiroz
FGV - Data Science Day - Gabriela Queiroz
 

More from Rodrigo Dornel

SQL Saturday 570 - São Paulo - 2016
SQL Saturday 570 - São Paulo - 2016SQL Saturday 570 - São Paulo - 2016
SQL Saturday 570 - São Paulo - 2016Rodrigo Dornel
 
Mentoring para prova MTA - Fundamento de Banco de Dados
Mentoring para prova MTA - Fundamento de Banco de DadosMentoring para prova MTA - Fundamento de Banco de Dados
Mentoring para prova MTA - Fundamento de Banco de DadosRodrigo Dornel
 
Power bi na prática 2016
Power bi na prática 2016Power bi na prática 2016
Power bi na prática 2016Rodrigo Dornel
 
SQL Server Heterogêneo: SQL Server + BigData
SQL Server Heterogêneo: SQL Server + BigDataSQL Server Heterogêneo: SQL Server + BigData
SQL Server Heterogêneo: SQL Server + BigDataRodrigo Dornel
 
Palestra sql saturday 361
Palestra sql saturday 361Palestra sql saturday 361
Palestra sql saturday 361Rodrigo Dornel
 
Reunião02 pass chapter - desenvolvimento
Reunião02 pass chapter - desenvolvimentoReunião02 pass chapter - desenvolvimento
Reunião02 pass chapter - desenvolvimentoRodrigo Dornel
 
Reunião 02 PASS Chapter MCITPSC
Reunião 02 PASS Chapter MCITPSCReunião 02 PASS Chapter MCITPSC
Reunião 02 PASS Chapter MCITPSCRodrigo Dornel
 
Mineração com sql server 2008 r2
Mineração com sql server 2008 r2Mineração com sql server 2008 r2
Mineração com sql server 2008 r2Rodrigo Dornel
 

More from Rodrigo Dornel (10)

SQL Saturday 570 - São Paulo - 2016
SQL Saturday 570 - São Paulo - 2016SQL Saturday 570 - São Paulo - 2016
SQL Saturday 570 - São Paulo - 2016
 
Mentoring para prova MTA - Fundamento de Banco de Dados
Mentoring para prova MTA - Fundamento de Banco de DadosMentoring para prova MTA - Fundamento de Banco de Dados
Mentoring para prova MTA - Fundamento de Banco de Dados
 
Power bi na prática 2016
Power bi na prática 2016Power bi na prática 2016
Power bi na prática 2016
 
SQL Server Heterogêneo: SQL Server + BigData
SQL Server Heterogêneo: SQL Server + BigDataSQL Server Heterogêneo: SQL Server + BigData
SQL Server Heterogêneo: SQL Server + BigData
 
Palestra sql saturday 361
Palestra sql saturday 361Palestra sql saturday 361
Palestra sql saturday 361
 
Reunião02 pass chapter - desenvolvimento
Reunião02 pass chapter - desenvolvimentoReunião02 pass chapter - desenvolvimento
Reunião02 pass chapter - desenvolvimento
 
Reunião 02 PASS Chapter MCITPSC
Reunião 02 PASS Chapter MCITPSCReunião 02 PASS Chapter MCITPSC
Reunião 02 PASS Chapter MCITPSC
 
Data mining (Part II)
Data mining (Part II)Data mining (Part II)
Data mining (Part II)
 
Data mining (Part I)
Data mining (Part I)Data mining (Part I)
Data mining (Part I)
 
Mineração com sql server 2008 r2
Mineração com sql server 2008 r2Mineração com sql server 2008 r2
Mineração com sql server 2008 r2
 

Biweek Mineração de Dados com SQL Server

  • 1. Mineração de Dados com SQL Server – Datamining
  • 2. Apresentação Rodrigo Dornel é fundador e principal consultor da RDornel Data Platform Experts e professor universitário na Universidade de Joinville. Possui mais de 15 anos de experiência na área de TI, sendo os últimos 10 trabalhando com SQL Server. Possui certificações MCSA, MCT, MCTS e MCITP. Também é atuante na comunidade como MTAC e Chapter Leader do PASS em Santa Catarina. Email: rodrigo@rdornel.com Skype: rdornel@Hotmail.com Linkedin profile: http://br.linkedin.com/pub/rodrigo-ramos-dornel/4/421/154 Blog: http://rdornel.wordpress.com Twitter: @rdornel
  • 3. Agenda  Introdução  Tarefas de Mineração de Dados  Principais Algoritmos  Análise dos Resultados  Mineração com Analysis Services  Mineração de Dados com Excel
  • 4. Mineração de Dados com SQL Server - Introdução Com os novos termos sendo introduzidos no mundo dos dados, Data Science, Analytics, Machine Learning, muito gente se esqueceu que faz muito tempo que o SQL Server já tem seu kit de ferramentas para descoberta do conhecimento. Ferramentas muito poderosas e que passam despercebidas dentro do Analysis Services. Nessa apresentação vamos analisar as principais ferramentas, algoritmos e técnicas que permitem você minerar dados de forma robusta com o Analysis Services ou de forma mais simples com o plugin de mineração para o Excel.
  • 5. Mineração de Dados com SQL Server – Introdução  O que é Mineração de Dados?  Quais passo eu preciso seguir?  Que dados eu preciso?  Quais ferramentas eu posso usar?
  • 6. Mineração de Dados com SQL Server – Introdução  Mineração de Dados  Machine Learning  Business Analytics  Business Intelligence  Big Data  Cientista de Dados
  • 7. Mineração de Dados com SQL Server – Introdução  KDD – Knowledge Discovery in Database  Imagen: http://i.imgur.com/713YCN9.png
  • 8. Mineração de Dados com SQL Server – Tarefas  Previsão  Tendências com base em histórico  Descrição  Engenharia Reversa
  • 9. Mineração de Dados com SQL Server – Tarefas  Aprendizado  Supervisionado  Não supervisionado
  • 10. Mineração de Dados com SQL Server – Algoritmos  KNN  K-means  C4.5  Apriori
  • 11. Mineração de Dados com SQL Server – Exemplo  KNN  Simular no Excel
  • 12. Mineração de Dados com SQL Server – Análise dos Resultados  Acurácia  Verdadeiro X Previsto  Suporte  Frequência que isso ocorre na base conhecida  Confidencia  Frequência que ele acerta nos novos casos
  • 13. Mineração de Dados com SQL Server – Demonstração  Analysis Services  Arvore de Decisão  Agrupamento
  • 14. Mineração de Dados com SQL Server – Conclusão  A mineração de dados é focada em gerar modelos e tendências  Os resultados precisarão ser avaliados por um especialista da área  Podemos usar tarefas e sub tarefas  Dividir para conquistar
  • 15. Referências  MSDN: https://msdn.microsoft.com/en-us/library/ms167167.aspx  Site: http://www.sqlserverdatamining.com/ssdm  Blog: http://mcitpsc.com.br/?p=12