Oficina Pentaho
Upcoming SlideShare
Loading in...5
×
 

Oficina Pentaho

on

  • 5,767 views

Oficina de Pentaho realizada na Primeira Semana de Software Livre da USP.

Oficina de Pentaho realizada na Primeira Semana de Software Livre da USP.

Statistics

Views

Total Views
5,767
Views on SlideShare
3,593
Embed Views
2,174

Actions

Likes
1
Downloads
87
Comments
0

7 Embeds 2,174

http://www.hackagenda.com.br 2168
http://www.slashdocs.com 1
http://www.docshut.com 1
http://feedly.com 1
http://www.google.com 1
http://www.google.com.br 1
http://www.inoreader.com 1
More...

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

Oficina Pentaho Oficina Pentaho Presentation Transcript

  • Oficina de Pentaho Wesley Seidel Carvalho wesley.seidel@gmail.com www.ime.usp.br/~wesleys
  • O que é BI?● São muitos os conceitos.● Vamos falar da idéia:● A idéia é que um sistema de BI possua, dentre outras as seguintes características [Caiçara Júnior]: ● Fornecer informações relevantes para auxiliar na tomada de decisão; ● Disponíveis a qualquer momento; ● Fácil utilização.
  • BI possui muitos nomes:● Para empresários: ● busca de mercado; ● Inteligência competitiva;● Para outros: ● relatório; ● análises; ● análise do negócio; ● suporte a decisão.
  • OLTP● On-Line Transactional Processing
  • Ué? Mas eu não consigo gerar esses dados e análises direto de um sistema transacional?
  • Sim, só que...● As organizações geralmente possuem: ● Mais de um sistema; ● Sistemas armazenam em fontes distintas; – MySql, SQL Server, Texto, XML ... ● Existencia de planilhas; ● Diferença entre representações de um mesma informação; – M/F, 0/1, H/M ... ● Etc...
  • E agora? Quem poderá me Salvar?
  • Opssss... Bem... Que tal:● Sistemas de apoio à decisão (SAD) ou● Sistemas OLAP (On-Line Analytical Processing);
  • O que é OLAP ?● Sistema de informação utilizado para viabilizar a análise da empresa e auxiliar na tomada de decisão. [Segundo Machado (2004)]
  • OLTP vs OLAP OLTP OLAPOrigem dos Dados operacionais Dados consolidadosdados Vários Sistemas OLTPsPropósito dos Controlar e executar tarefas Auxiliar o planejamento, resoluçãodados fundamentais do negócio de problemas e suporte a decisãoOrganização Entidade Relacionamento; Modelagem Multi-dimensional;dos dados Normalizado De-normalizadoIdade dos Presente Histórico, Atual e ProjetadodadosVelocidade de Geralmente muito rápido; Depende da quantidade de dados;processamento cargas podem levar horasConsultas Relativamente simples; Mais complexas; Retorna “poucos” registros; Envolvem agregações; ...
  • Mais sobre OLAP:● Sistemas OLAP oferecem: ● Diferentes perspectivas, n-dimensões; – visão multidimensional das informações ● De forma rápida; ● Consistente; ● Normalmente na forma de CUBOS OLAPs.
  • CUBOS OLAPs ?
  • CUBOS OLAPs ?● Cubos é uma forma de representação dos dados em um formato Multi-dimensional.
  • CUBOS OLAPs ? http://msdn.microsoft.com/pt-br/library/ms175449.aspx
  • CUBOS OLAPs ● Cada face representa um aspecto do assunto que se deseja analisar ● ( Dimensão ); ● Cada célula é representada por uma medida; ● (Campo da tabela de Fatos ); ● É possível observar várias visões do dado que está sendo apresentado.
  • Composição de um CUBO oucomposição modelo multidimensional:
  • Composição de um CUBO● Fatos ou Tabela Fato: ● Eventos que nos interessam avaliar;● Dimensões: ● São os elementos que compõe um fato; – Ex: ● Produtos, períodos ( dia, mês, trimestre, ano ... ), segmento de clientes, fornecedores, ...; ● Hierarquias da dimensão: – Período: Ano → Mês → Dia – Localização: País → Estados → Cidades → Bairros
  • Composição de um CUBO● Métricas: ● São os valores que estamos interessados em medir. – Ex: ● Qnt de produtos vendidos; ● Lucro obtido (R$); ● Quantidade de votos;
  • Representação lógica de um CUBO:● Baseada no modelo relacional;● Esquemas: ● Estrela (star schema) – A Tabela Fato no centro e as Dimensões ao seu redor; ● Floco de Neve (snowflake) – Parecido o esquema estrela, porém normaliza as hierarquias das dimensões;
  • Esquema Estrela
  • Esquema Estrela
  • Snowflake
  • Snowflake
  • Operações Básica de um sistema OLAP:● Dril-Down: ● Nível mais detalhados;● Dril-Up ou Roll-up: ● Nível mais agregados;● Slice: ● Redução de escopo e mantendo a mesma perspectiva;● Dice: ● Mudança de perspectiva;● Pivoting: ● Alterar eixos de visualização.
  • E o Datawarehouse? O que é ?● Um conjunto de dados para apoio a decisão e possui as características [Inmon]: ● -Orientado a assuntos – Ao invés de aplicações; ● -Integrado – Adaptação e padronização dos dados vindos de diferentes sistemas; ● -Não volátil: – Sem atualizações, e sim carga inicial ou incremental e modo de acesso apenas leitura ; ● -Variável em relação ao tempo.
  • ETL● É a etapa do processo de construção de um DW que consiste em:● Extract: ● Dados dos OLTPs● Transformation: ● Limpeza e Transformação ( padronização )● Load: ● “Alimentar” o DW.
  • Como tudo isso funciona junto ?
  • DataE Warehouse SistemaT BIL DM1 DM2 DM3
  • A Pentaho BI Suite. O que é?
  • A Pentaho BI Suite.● Pentaho BI Suite é uma plataforma Open Source para desenvolvimento de Soluções em Business Intelligence.● Mantida pela Empresa Pentaho ela é suportada por comunidades de usuários e desenvolvedores ao redor do mundo
  • A Pentaho BI Suite.● Composta por diversas ferramentas: ● Para analistas e Gestores: ● Para a equipe de desenvolvimento do projeto de BI
  • Arquitetura
  • Servidor BIResponsável pelo gerenciamento dos indicadores,compartilhamento entre os usuários, controle deacesso, origem dos dados, entre outras coisas.
  • Servidor BI
  • PAC( Pentaho Administrator Console)
  • PRD (Pentaho Report Designer)
  • PDI (Pentaho Data Integration)
  • PSW (Pentaho Schema Workbench)
  • PME (Pentaho Metadata Editor)
  • Weka
  • ??????? PDI PSW ??????? PRD Data E Warehouse PME Sistema (Ad-Hoc) T BI L DM1 DM2 DM3 Weka
  • Nossa Oficina!
  • Efetuar um pequeno ETL● Origem: ● extras/dados/candidatos_2008.csvcan_id; nomecand;ano; nomeurna;turno; data_nasc;codmun; codnasc; sexo;codibge6; estciv;codcargo; inst;codcand; ocup;codpart; cpf;siglapart; leg;nomepart; sit_pos;
  • PDI (Pentaho Data Integration)
  • Esquema Estrela. DIM_Cargos DIM_Partidos FATO_CandidatosDIM_Municipios DIM_Pessoas
  • PSW (Pentaho Schema Workbench)
  • Mãos à Obra.
  • Referências● INMON. W. H., Como construir um Data warehouse (tradução da segunda edição), editora campus, 1997.● KIMBALL, R.; ROSS, M. The Data Warehouse Toolkit: O guia completo para modelagem dimensional.● LIMA, Thalles da Silva, CARVALHO, Wesley Seidel, Montando um cubo Olap com o MS Analisys Services, 2007.● SOUZA, Caio Moreno, Integração de ferramentas de código aberto (java, pentaho e android) e mapas, aplicada a projetos de inteligência de negócios, 2010 (Monografia).● BOBSIN, Juliana Bitello, Uma solução bi utilizando ferramentas open source, 2010 (Monografia).● CARNIEL, Anderson, BJIN OLAP: Uma ferramenta OLAP baseada no índice bitmap de junção, 2012 (TCC).● Suíte Pentaho. <http://www.pentaho.com>.
  • Obrigado !