1. Sistemas de Informação
Professora Clara Gusmão
Técnico de Informática de Gestão
Rui Pedro Alves Gomes
11ºE
2. Arquitectura da Data Warehouse
Extracção de dados
Ferramentas
Exemplo
3. O armazenamento dá-se num depósito único, convém que este
seja prático para que possa ser acedido de uma forma
rápida. Este armazenamento irá conter dados históricos de
bancos de dados que servem como backup de sistemas
empresariais.
Quanto mais dados do histórico das operações da empresa,
melhor será para que a análise destas informações ajudem a
revelar o desempenho actual da empresa .
4. Os sistemas de base de dados tradicionais utilizam a
simplicidade no formato de dados para garantir a
consistência destes e também para a maior organização de
espaço de armazenamento necessário e diminuição de
redundâncias, que devem ser verificadas antes da conclusão
do modelo de dados.
Uma data warehouse utiliza dados em formato de-
normalizados. Isto aumenta o desempenho das consultas ou
seja o processo torna-se mais intuitivo para os utilizadores
comuns. Essa maneira de reordenar os dados chama -
se Modelagem Dimensional, e o resultado da modelagem é o
Modelo Dimensional, ou MD.
5. O conceito Metadado é considerado como sendo os "dados
sobre dados", isto é, os dados sobre os sistemas que operam
com estes dados. Um repositório de metadados é uma
ferramenta essencial para o gerenciamento de uma data
warehouse. Entre outras coisas, um repositório de metadados
bem construído deve conter informações sobre a origem dos
dados, regras de transformação, nomes e alias, formatos de
dados, etc. Ou seja, esse "dicionário" deve conter muito mais
do que as descrições de colunas e tabelas: deve conter
informações que adicionem valor aos dados.
6. O data warehouse é normalmente acedido através de data
marts, que são pontos específicos de acesso a subconjuntos
do data warehouse. Os data marts são construídos para
responder prováveis perguntas de um tipo específico de
utilizador. Um data mart pode ser composto por um ou mais
cubos de dados.
Hoje em dia, os conceitos de data warehouse e data mart
fazem parte de um conceito muito maior chamado
de Corporate Performance Management.
7. Os dados introduzidos num data warehouse geralmente
passam por uma área conhecida como área de stage. O stage
de dados ocorre quando existem processos periódicos de
leitura de dados de fontes como sistemas OLTP. Os dados
podem passar então por um processo de qualidade, de
normalização e gravação dos dados no data warehouse. Esse
processo geralmente é realizado por ferramentas ETL e outras
ferramentas.
8. Sistemas OLTP são sistemas que têm a tarefa de monitorar e processar as
funções básicas de uma organização, tais como processamento da folha de
pagamento, factura, stock, etc.
Os dados OLTP são usados pelos utilizadores em geral no dia-a-dia nas suas
actividades.
O principal objectivo da modelagem relacional em um sistema OLTP é
eliminar ao máximo a redundância, para que promova mudanças no estado
do banco de dados o mais pontualmente possível. Com isso, nas
metodologias de projeto usuais, os dados são fragmentados por diversas
tabelas, o que traz uma considerável complexidade à formulação de uma
consulta por um utilizador final. Por isso, esta abordagem não parece ser a
mais adequada para o projeto de um data warehouse, onde estruturas mais
simples, com menor grau de normalização devem ser investigadas.
9. As ferramentas OLAP são geralmente desenvolvidas para trabalhar
com banco de dados de-normalizados, embora existam ferramentas que
trabalham com esquemas especiais de armazenamento, com dados
normalizados.
Essas ferramentas são capazes de navegar pelos dados de um Data
Warehouse possuindo uma estrutura adequada tanto para a realização de
pesquisas como para a apresentação de informações.
Nas ferramentas de navegação OLAP, é possível navegar entre diferentes
níveis de um cubo de dados. Através de um processo chamado Drill o
usuário pode aumentar (Drill down[) ou diminuir (Drill up) o nível de
detalhamento dos dados. Por exemplo, se um relatório estiver consolidado
por países, fazendo um Drill down[, os dados passarão a ser apresentados
por estados, cidades, bairros e assim sucessivamente até o maior nível de
detalhamento possível. O processo contrário, o Drill up, faz com que os
dados sejam consolidados em níveis superiores de informação.
10. Outra possibilidade apresentada pela maioria das ferramentas de
navegação OLAP é o recurso chamado Slice and dice. Esse recurso é usado
para criar visões dos dados por meio de sua reorganização, de forma que
eles possam ser examinados sob diferentes perspectivas.
O uso de recursos para manipular, formatar e apresentar os dados de modo
rápido e flexível é um dos pontos fortes de um Data Warehouse. Essa
característica faz com que a apresentação de relatórios no ecrã seja mais
comum do que imprimi-los. Além disso, o utilizador tem a liberdade para
examinar as informações que quiser de diversas maneiras e, no final, pode
imprimir e até mesmo salvar as visões mais importantes para uma futura
consulta.
11. Data mining, ou mineração de dados, é o processo de descoberta de padrões
existentes em grandes massas de dados. Apesar de existirem ferramentas
que ajudam na execução do processo, o Data Mining precisa ser conduzido
por uma pessoa, preferencialmente com formação em Estatística ou áreas
afins.