Successfully reported this slideshow.

Introdução ao BI

2,234 views

Published on

Esta é a minha apresentação utilizada na palestra "Introdução ao BI" que foi realizada em 26/10/2010 na Faculdade Impacta de Tecnologia

Published in: Technology
  • Be the first to comment

Introdução ao BI

  1. 1. Introdução ao BI Msc. Mauro C. Pichiliani (@pichiliani) 1
  2. 2. Roteiro • Apresentação • Conceitos e teoria de BI • OLTP e OLAP • Histórico • Modelagem Dimensional • Cubo de Dados • Conclusões 2
  3. 3. Apresentação (1) 3  Mauro Pichiliani (pichiliani@uol.com.br)  Colunista do iMasters (www.imasters.com.br)  Fundador do podcast Databasecast (@databasecast)  Escritor da revista SQL Magazine ( www.devmedia.com.br)  Pesquisador de banco de dados e sistemas distribuídos.  Doutorando do ITA (Instituo de Tecnologia da Aeronáutica)  Experiência com o BI desde 2001
  4. 4. Apresentação (2) 4  E vocês?  Experiência com:  Programação Java? .NET?  Banco de dados?  Modelagem?  BI, DW, ERP, OLAP?  Linux? Inglês?
  5. 5. Conceitos e teoria de BI (1) 5  BI = Bussiness Intelligence  Definição: Utilizar informação já disponível para auxiliar os tomadores de decisão a tomar decisões melhores e mais rápidas  Substitui sistemas EIS (Executive Information Systems) e DSS (Decision Support Systems)
  6. 6. Conceitos e teoria de BI (2) 6  O foco é na geração de relatórios dinâmicos para analistas e tomadores de decisão  Usuários especializados (analistas)  Não há a necessidade de conhecimentos técnicos profundos sobre as ferramentas  BI envolve diversas tecnologias e processos.  Geralmente é implementado como ferramenta para visualização de dados
  7. 7. Conceitos e teoria de BI (3) 7
  8. 8. Conceitos e teoria de BI (4) 8
  9. 9. Conceitos e teoria de BI (5) 9  Relatórios:  Tipo Dashboard  Relatórios de produção  Relatórios Analíticos  Exemplos: clientes, pedidos fechados, status de faturamento, contas a pagar, satisfação de clientes, etc
  10. 10. Conceitos e teoria de BI (7) 10  Data Warehouse: Repositório para armazenar e analisar informações quantitativas e qualitativas que são estáveis e confiáveis.  Comparação com DW e Bancos Relacionais: a) Suportar atividades x Planejamento b) Detalhes x Agregação de alto nível c) Aplicação específica x Agrega Dados d) Imediato x Atividade através do tempo e) Volátil x Estável f) Rápido para detalhes x Rápidos para agregações 
  11. 11. Conceitos e teoria de BI (8) 11  Data Mart: Subconjunto do DW, geralmente voltado para um propósito específico ou contexto. Pode ser distribuído para suportar a necessidade do negócio  Artigo: Data Mart does not Equal Data Warehouse, em:  http://www.information-management.com/infodirect/19991120/1675- 1.html
  12. 12. OLTP e OLAP (1) 12  OLTP = OnLine Transaction Processing  Utilizado para gerenciar transações e operações diárias  E. F. Codd propôs 12 critérios para OLTP em 1985  OLAP = Online Analytical processing  Descreve ferramentas especializadas para tornar os dados do DW facilmente acessíveis  E. F. Codd propôs 15 critérios para OLAP em 1985
  13. 13. OLTP e OLAP (2) 13
  14. 14. Histórico 14
  15. 15. Modelagem Dimensional (1) 15  Modelo multidimensional (ou dimensional): um design para Data Warehouse  Conceito de múltiplas dimensões foi pego da física  Baseado nas idéias de dimensões e medidas  Medida (ou indicadores): Valor numérico totalizado utilizado para monitorar o negócio  Dimensões: Lista independete de valores que filtrados afetam o cálculo da medida  Modelagem tradicional não atende os requisitos de ferramentas OLAP e dinâmica das visualizações  Geralmente aplica normalização até 2FN  Algum nível de desnormalização
  16. 16. Modelagem Dimensional (2) 16  Dimensões representam as possíveis formas de visualizar os dados.Dimensões representam as possíveis formas de visualizar os dados. São as entradas para as consultas. A base para entendimento deSão as entradas para as consultas. A base para entendimento de qualquer negócio é responder às quatro perguntas fundamentais:qualquer negócio é responder às quatro perguntas fundamentais:  QUANDO? (Período de tempo a que se refere à análise)QUANDO? (Período de tempo a que se refere à análise)  O QUE? (O principal objeto de análise)O QUE? (O principal objeto de análise)  ONDE? (Localização física ou geográfica para análise)ONDE? (Localização física ou geográfica para análise)  QUEM? (Um objeto específico e detalhado para análise: opcional)QUEM? (Um objeto específico e detalhado para análise: opcional)  Exemplo: relatório de vendas
  17. 17. Modelagem Dimensional (3) 17  Figura 1: Relatório de unidades vendidas  Figura 2: Análise mensal  Figura 3: Por produto e por mês  Duas dimensões: produto e mês  Uma medida: unidades vendidas  Elementos da dimensão são chamados de membros
  18. 18. Modelagem Dimensional (4) 18  Figura 4: Por produto e mês de forma diferente  Duas dimensões: produto e mês  Uma medida: unidades vendidas
  19. 19. Modelagem Dimensional (5) 19  Figura 5: Por produto, estado e mês  Três dimensões: estado, produto e mês  Uma medida: unidades vendidas
  20. 20. Modelagem Dimensional (6) 20  Figura 6: Por produto, estado e mês + lucro  Três dimensões: estado, produto e mês  Duas medidas: unidades vendidas e lucro
  21. 21. Modelagem Dimensional (7) 21  Dados de dimensão são armazenados em tabelas de dimensão  Dados das medidas são armazendos em tabelas fato. Exemplo:  Cada linha da tabela fato contém valores detalhados (fatos)  Uma coluna para cada medida e ligações com as tabelas de dimensão  Sempre contém o membro mais detalhado da dimensão
  22. 22. Modelagem Dimensional (8) 22  Exemplo de tabela fato com relacionamentos:  Um DW pode conter várias tabelas fato  As tabelas fato contém chaves estrangeiras para as tabelas de dimensão  Cada tabela de dimensão contém um identificador e atributos dos membros da dimensão  Tomar cuidado com a nomeclatura!
  23. 23. Modelagem Dimensional (9) 23  Exemplo de tabela de dimensão simples:  Coluna PROD_ID é chave primária  Tabelas de dimensão podem conter vários atributos representados pelas suas colunas. Exemplo de outros atributos:
  24. 24. Modelagem Dimensional (10) 24  Alguns atributos podem agrupar membros da dimensão: cor  Não faz sentido agrupar por certos atributos: preço  Exemplo:  Agrupamento de membros por atributos da dimensão dá origem a hierarquias  Abaixo da hierarquia podemos ter níveis de membros  Navegação nos níveis: Drill-down and Drill-up.
  25. 25. Modelagem Dimensional (10a) 25  Dimensões, hierarquias, níveis, membros:
  26. 26. Modelagem Dimensional (11) 26  Exemplos de modelos: Tabela de Fatos Dimensão Aluno Dimensão Tempo Dimensão Curso Dimensões Hierarquias Níveis Membros
  27. 27. Modelagem Dimensional (12) 27  Exemplos de modelos:
  28. 28. Modelagem Dimensional (13) 28  Exemplos de modelos:
  29. 29. Modelagem Dimensional (14) 29  Dimensões star (estrela):  Apenas uma tabela de dimensão  Dimensões snowflake (floco-de-neve):  Mais de uma tabela de dimensão relacionada  Maioria dos modelos é híbrida  Modelagem dimensional é fundamental para entender OLAP  Geralmente a modelagem está envolvida como processo de ETL  Recomenda-se gastar uma boa parte do tempo na modelagem
  30. 30. Cubo de dados (1) 30  O conceito de cubo vem da matemática:  3 dimensões apenas  Em OLAP, um cubo requer ao menos uma dimensão e uma medida:  Pode possuir muitas medidas  Pode possuir muitos membros  Um cubo é uma estrutura multidimensional criada a partir do modelo multidimensional  A princípio contém apenas metadados  Pode conter agregações
  31. 31. Cubo de dados (2) 31  Exemplo: 3 dimensões e uma medida:
  32. 32. Cubo de dados (3) 32  Exemplo: 3 dimensões e uma medida:
  33. 33. Cubo de dados (4) 33  Exemplo: 3 dimensões e uma medida:
  34. 34. Cubo de dados (5) 34  Visualização do cubo
  35. 35. Cubo de dados (6) 35  Operações: Slice e Dice
  36. 36. Cubo de dados (7) 36  Em resumo, ferramentas OLAP permitem:  1) Resposta rápida e consistente  Modelo de planilha  Modelo multidimensional em RBDMS  2) Consultas baseadas em metadados  Cubos contém muitos metadados  MDX (Multidimensional Expressions) x SQL  Usuários não precisam conhecer SQL e nem MDX  3) Fórmula no cubo, como em uma planilha  Valores separados em células  Manipulação de células  Modelo de medatados para célula. E: [avg] x c4  Acesso a diferentes cubos
  37. 37. Conclusões 37  Foco de BI é trazer inteligência ao negócio  Sempre procurar auxiliar o tomador de decisões  Várias fases compõem o processo de BI  A modelagem é imprescindível  Relatórios são cruciais  A tecnologia pode variar ao longo do tempo, mas conceitos permanecem

×