Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Modelagem multidimensional conceitos básicos

965 views

Published on

Conceitos básicos sobre modelagem multidimensional

Published in: Data & Analytics

Modelagem multidimensional conceitos básicos

  1. 1. Modelagem Multidimensional Conceitos Básicos
  2. 2. Tomada de Decisão Gerencial • É a escolha racional, dentre alternativas disponíveis, de um curso de ação, que se faz presente em todos os níveis da organização (estratégico, gerencial e operacional). • Identificar e selecionar um curso de ação para lidar com um problema específico ou extrair vantagens em uma oportunidade.
  3. 3. Sistemas de apoio à Decisão Gerencial  Transformar dados em informações de suporte à decisão;  Auxiliar na tomada de decisões estratégicas e táticas;
  4. 4. DATA WAREHOUSE – Armazém de Dados Bill Inmon : “É um banco de dados, orientado por assunto, integrado, não volátil e histórico, criado para suportar o processo de tomada de decisão.” Ralph Kimball : “Um armazém é uma cópia dos dados da transação especificamente estruturado para consulta e análise.”
  5. 5. DATA MART – Repositório de Dados Bill Inmon : “Data Mart é cada uma das partes físicas ou lógicas de um Data Warehouse corporativo. Um Data Mart corresponde às necessidades de informação de uma determinada comunidade de usuários.”
  6. 6. DATA MART – Repositório de Dados Arquitetura Top-Down Bill Inmon Arquitetura Botton-Up Ralph Kimball
  7. 7. Granularidade
  8. 8. Granularidade
  9. 9. ETL – Extract Transform Load Extração Transformação e Limpeza Transform Staging Area Load Data Mart Usuário Final
  10. 10. Extração 1. Fonte: Considerar dados oriundos dos sistemas transacionais 2. Meio de acesso ao sistema fonte: através de views 3. Horário da extração: fora do horário comercial. Deve constar no FLD – Formulário de Levantamento de Dados 4. Montar esquema de tabelas de staging 5. Periodicidade da extração: horária, diária, semanal, mensal. Deve constar no documento de requisitos
  11. 11. Transformação 1. Conversões de formatos: EBCDIC, ASCII, códigos geográficos (estados, países), conversões de medidas, caixa alta, etc. 2. Criação de dados derivados (Ex.: UEN Prestadora: obtida pelo tipo da unidade e a UF) 3. Separação e concatenação de dados, como quebra de datas, endereços, etc. 4. Limpezas de erros de entrada de dados (typing), inconsistência entre atributos com valores associados; campos ausentes; duplicação de informações com inconsistência entre fontes; aplicação de regras de negócio
  12. 12. Carga 1. Identificar os dados a serem carregados, mapeando o esquema de staging com o esquema dos modelos dimensionais 2. Tratar o mapeamento de chaves naturais para chaves surrogates 3. Carregar as dimensões 4. Carregar tabelas fato 5. Considerar aspectos de performance, como uso de paralelismo, presença ou ausência de índices e constraints 6. Considerar armazenar dados rejeitados, erros em tabelas de violação
  13. 13. Modelagem Multidimensional T Técnica de modelagem onde as informações se relacionam de maneira que podem ser representadas metaforicamente como um cubo.
  14. 14. Questões de Negócio Como nasce o modelo multidimensional ?
  15. 15. Questão de negócio: • Qual a quantidade de objetos do serviço Remessa Expressa extraviados/roubados e devolvidos ao remente, por DR de destino, por período (data de apuração), e por agrupamento de eventos finalizadores?
  16. 16. Objetos Extraviados/Roubados e Devolvidos ao Remetente
  17. 17. Fato de Negócio: Remessa Expressa
  18. 18. Questão de Negócio • Qual a quantidade exportada por Tipo de Malote, por DR Origem, por DR de Destino e por período?
  19. 19. Quantidade Malotes Exportados
  20. 20. Fato de Negócio: Malotes Exportados
  21. 21. O que é Modelagem Multidimensional ? “Cruzamento de dimensões de análise para achar uma métrica.” Carlos Caldo
  22. 22. Elementos de um Modelo Multidimensional  FATO  DIMENSÃO  MÉTRICA ECT_TD_TEMPO TEM_NU_ID_TEMPO TEM_DT_TEMPO TEM_DT_JULIANA TEM_IC_FERIADO_NACIONAL TEM_SG_DIA_SMNA TEM_NO_DIA_SMNA TEM_MM TEM_DD_MES TEM_NO_DIA TEM_NU_DIA_SMNA TEM_DD_ANO TEM_NU_SMNA_MES TEM_NU_SMNA_ANO TEM_NO_COMPLETO_MES TEM_NO_ABREVIADO_MES TEM_NU_MES_ANO REMESSA_EXPRESSA_FAT TEM_NU_ID_TEMPO(FK) ORG_NU_ID_ORGAO(FK) cli_nu_identificador(FK) rem_qt_objeto ECT_DIM_ORGAO ORG_NU_ID_ORGAO ORG_NU_ORGAO ORG_NU_ORGAO_NIVEL_1_TEC ORG_NO_ORGAO_NIVEL_1_TEC ORG_NU_ORGAO_NIVEL_2_TEC ORG_NO_ORGAO_NIVEL_2_TEC ORG_NU_ORGAO_NIVEL_3_TEC ORG_NO_ORGAO_NIVEL_3_TEC ORG_NU_ORGAO_NIVEL_4_TEC ORG_NO_ORGAO_NIVEL_4_TEC ORG_NU_ORGAO_NIVEL_5_TEC ORG_NO_ORGAO_NIVEL_5_TEC ORG_NU_ORGAO_NIVEL_6_TEC ORG_NO_ORGAO_NIVEL_6_TEC ORG_NU_ORGAO_NIVEL_7_TEC ORG_NO_ORGAO_NIVEL_7_TEC ORG_NU_ORGAO_NIVEL_8_TEC ORG_NO_ORGAO_NIVEL_8_TEC ORG_NU_ORGAO_NIVEL_9_TEC ORG_NO_ORGAO_NIVEL_9_TEC ORG_NU_ORGAO_NIVEL_10_TEC ORG_NO_ORGAO_NIVEL_10_TEC ORG_NU_ORGAO_NIVEL_1_ADMCLIENTE_DIM cli_nu_identificador cli_co_origem cli_no cli_dt_carga cli_in_registro_corrente
  23. 23. Tipos de métricas
  24. 24. Tipos de Modelos Multidimensionais  Modelo Star Schema
  25. 25. Modelo Star Schema
  26. 26. Tipos de Modelos Multidimensionais  Modelo Snow Flake
  27. 27. Roteiro para uma Modelagem Eficaz
  28. 28. FIM

×