CERTIFICACIÓN EN SISTESMAS Y TECNOLOGIAS DE LA INFORMACIÓN

S.C.

DATA WAREHOUSE


Es un ambiente estructurado para análisis de
datos no volatiles



Es una colección de datos orientada a sujetos,
inte...


Facilita la integración, para la toma de
decisiones, de datos de aplicaciones
operacionales no integrados.



Organiza...
Bases de Datos Operacional

Data Warehouse

Datos Operacionales

Datos del negocio para Información

Orientado a la aplica...
ALTAMENTE
RESUMIDO
LIGERAMENTE
RESUMIDO
SISTEMA
OPERACIONAL

refrescamiento

META DATA
DETALLE
ACTUAL
DE DATOS

DETALLE
HI...


Detalle de datos actuales: Datos que constan en los sistemas operacionales



Detalle de datos antiguos: La datos anti...


Datos completamente resumidos: Estos datos son compactos y fácilmente
accesibles, resultan de resumir los datos ligeram...
Ninguno
(libre)

Bajo Nivel

refrescamiento

SISTEMA
OPERACIONAL

META DATA
Alto Nivel
INDEXACIÓN
No permite
fácilmente

refrescamiento

SISTEMA
OPERACIONAL

META DATA
Relativamente
fácil
RESTRUTURACiÓN
Ponga en un buscador de internet “imágenes Data Warehouse” y encontrará:
Ponga en un buscador de internet “imágenes Data Warehouse” y encontrará:
Ponga en un buscador de internet “imágenes Data Warehouse” y encontrará:
Datos de sistemas
Operacionales

compras

Datos de DW

No son modificables
Datos guardados por
Períodos más largos
Bajos c...
Herramientas OLAP (componente clave del DW)
 On Line Analitical Process (procesamiento
analítico en línea)
 Tecnología o...
Análisis de datos
LOS MODELOS DE ALMACENAMIENTO DE DATOS QUE FACILITAN EL ANÁLISIS DIFIEREN
DEPENDIENDO SI ESTÁN ACTUANDO ...


Creados basados en las técnicas OLAP, para
organizar los datos (ya se pueden considerar
información) (cubos)
Variable t...
Una sola área o grupos, costoso y mayor esfuerzo

Compras
DMT

Ventas
DMT

Rrhh
DMT

Produccion
DMT

EMPRESA
Riesgos:
Prol...
Una sola área o grupos, costoso y mayor esfuerzo

Ventas
DMT

Compras
DMT

DataWarehouse

Rrhh
DMT

Produccion
DMT

EMPRES...
Sybase IQ (DW+ business
intelligence)

Sybase, Inc. (NYSE:
SAP)

IBM Netezza DW appliance

Netezza Inc (IBM)

HP Enterpris...
DATA MINING (minería de datos)
DATA MINING (minería de datos)


ES LA EXTRACCIÓN DE INFORMACIÓN
OCULTA DE GRANDES BASES DE DATOS



Herramienta que ayu...
Predicción automatizada de tendencias y
comportamientos
 Descubrimientos automatizados de modelos
previamente desconocido...
Fundamentos
Soportado por tecnologías


1.
2.
3.

Recolección masiva de datos
Computadores potentes con multiprocesador
A...
DW
Sistema x

Sistema y

Data mining
Aplicación n
Aplicación 2
Aplicación 1

inform
ación
DATA WAREHOUSE
Upcoming SlideShare
Loading in...5
×

DATA WAREHOUSE

349
-1

Published on

ES UN AMBIENTE ESTRUCTURADO PARA ANALISIS DE DATOS NO VOLATILES

ES UNA COLECCIÓN DE DATOS ORIENTADA A SUJETOS, INTEGRADA, VARIABLE EN EL TIEMPO Y NO VOLATIL, PARA SOPORTE DE PROCESOS DE TOMA DE DECISION DE LOS EJECUTIVOS.

Published in: Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
349
On Slideshare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
13
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

DATA WAREHOUSE

  1. 1. CERTIFICACIÓN EN SISTESMAS Y TECNOLOGIAS DE LA INFORMACIÓN S.C. DATA WAREHOUSE
  2. 2.  Es un ambiente estructurado para análisis de datos no volatiles  Es una colección de datos orientada a sujetos, integrada, variable en el tiempo y no volatil, para soporte de procesos de toma de decisión de los ejecutivos.
  3. 3.  Facilita la integración, para la toma de decisiones, de datos de aplicaciones operacionales no integrados.  Organiza y almacena los datos que se necesitan para el procesamiento analítico, informático sobre una amplia perspectiva de tiempo.
  4. 4. Bases de Datos Operacional Data Warehouse Datos Operacionales Datos del negocio para Información Orientado a la aplicación Orientado al sujeto Actual Actual + histórico Datos detallados Resumidos + más resumidos Datos cambian continuamente Estable El uso de DW se ha extendido debido a Hardware y software mas robustos y se esperaOrientación a la web.
  5. 5. ALTAMENTE RESUMIDO LIGERAMENTE RESUMIDO SISTEMA OPERACIONAL refrescamiento META DATA DETALLE ACTUAL DE DATOS DETALLE HISTORICO DE DATOS
  6. 6.  Detalle de datos actuales: Datos que constan en los sistemas operacionales  Detalle de datos antiguos: La datos antigüos que se almacenan sobre alguna forma de almacenamiento masivo. No son frecuentemente accesada y se almacena a un nivel de ligeramente resumidos, consistente con los datos detallados actuales del momento en que se obtuvieron.  Datos ligeramente resumidos: La data ligeramente resumida es aquella que proviene desde un bajo nivel de detalle encontrado al nivel de detalle actual.
  7. 7.  Datos completamente resumidos: Estos datos son compactos y fácilmente accesibles, resultan de resumir los datos ligeramente resumidos.  Meta data(datos de datos): juega un rol especial y muy importante contiene referencias y apuntadores tales como: ◦ Un directorio para ayudar al analista a ubicar los contenidos del data warehouse. ◦ Una guía para el mapping de datos, de cómo se transforma desde el ambiente operacional hacia el ambiente de data warehouse. ◦ Una guía de los algoritmos usados para la esquematización entre el detalle de datos actual, con los datos ligeramente resumidos y éstos, con los datos completamente resumidos, etc.
  8. 8. Ninguno (libre) Bajo Nivel refrescamiento SISTEMA OPERACIONAL META DATA Alto Nivel INDEXACIÓN
  9. 9. No permite fácilmente refrescamiento SISTEMA OPERACIONAL META DATA Relativamente fácil RESTRUTURACiÓN
  10. 10. Ponga en un buscador de internet “imágenes Data Warehouse” y encontrará:
  11. 11. Ponga en un buscador de internet “imágenes Data Warehouse” y encontrará:
  12. 12. Ponga en un buscador de internet “imágenes Data Warehouse” y encontrará:
  13. 13. Datos de sistemas Operacionales compras Datos de DW No son modificables Datos guardados por Períodos más largos Bajos costos de almacenamiento ventas rrhh produccion Separados de los operacionales para evitar degradación del tiempo
  14. 14. Herramientas OLAP (componente clave del DW)  On Line Analitical Process (procesamiento analítico en línea)  Tecnología orientada al análisis de datos  Permite el análisis de las diferentes medidas correspondientes a las dimensiones relacionadas entre sí DW DIMENSIONES (categoría descriptiva) MEDIDAS ( valores cuantitativos)
  15. 15. Análisis de datos LOS MODELOS DE ALMACENAMIENTO DE DATOS QUE FACILITAN EL ANÁLISIS DIFIEREN DEPENDIENDO SI ESTÁN ACTUANDO EN UN AMBIENTE TRANSACCIONAL O EN UN DW Modelos de datos en ambientes Transaccionales (Operacionales): •OLTP: Procesamiento de Transacciones En Línea (OnLine Transaction Processing) OLTP Modelos de datos en ambientes de DW : OLAP procesamiento analítico en línea (On-Line Analytical Processing). •ROLAP : Procesamiento analítico en línea sobre base de datos relacional •MOLAP : Procesamiento analítico en línea sobre base de datos multidimensional (OnLine Transaction Processing) •HOLAP: Procesamiento analítico en línea híbrido MOLAP+ROLAP (MOLAP)=OLAP multidimensional ROLAP HOLAP
  16. 16.  Creados basados en las técnicas OLAP, para organizar los datos (ya se pueden considerar información) (cubos) Variable tiempo Variable producto Variable Ubicación geográfica DW
  17. 17. Una sola área o grupos, costoso y mayor esfuerzo Compras DMT Ventas DMT Rrhh DMT Produccion DMT EMPRESA Riesgos: Proliferación no planificada, Inconsistencia en los datos Pérdida de rendimiento por incremento del tamaño DMT1 + DMT2 + DMT3 + …. DMTn = Reunión de información Separados para evitar degradación en el tiempo
  18. 18. Una sola área o grupos, costoso y mayor esfuerzo Ventas DMT Compras DMT DataWarehouse Rrhh DMT Produccion DMT EMPRESA DMT1 + DMT2 + DMT3 + …. DMTn = DW
  19. 19. Sybase IQ (DW+ business intelligence) Sybase, Inc. (NYSE: SAP) IBM Netezza DW appliance Netezza Inc (IBM) HP Enterprise DW Solutions para Hewlett-Packard Co. MsSql Server SAP Business Objects data Service Software Business Objects, SAP (comprado 2007) Oracle ( a partir de la versión 11g) ORACLE
  20. 20. DATA MINING (minería de datos)
  21. 21. DATA MINING (minería de datos)  ES LA EXTRACCIÓN DE INFORMACIÓN OCULTA DE GRANDES BASES DE DATOS  Herramienta que ayuda a predecir futuras tendencias y comportamientos
  22. 22. Predicción automatizada de tendencias y comportamientos  Descubrimientos automatizados de modelos previamente desconocidos   Aplica técnicas tales como: redes neuronales artificiales, árboles de decisión, algoritmos genéticos, método vecino más cercano, regla de inducción.
  23. 23. Fundamentos Soportado por tecnologías  1. 2. 3. Recolección masiva de datos Computadores potentes con multiprocesador Algoritmos Data Mining
  24. 24. DW Sistema x Sistema y Data mining Aplicación n Aplicación 2 Aplicación 1 inform ación
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×