DATA WAREHOUSE
Upcoming SlideShare
Loading in...5
×
 

DATA WAREHOUSE

on

  • 273 views

ES UN AMBIENTE ESTRUCTURADO PARA ANALISIS DE DATOS NO VOLATILES ...

ES UN AMBIENTE ESTRUCTURADO PARA ANALISIS DE DATOS NO VOLATILES

ES UNA COLECCIÓN DE DATOS ORIENTADA A SUJETOS, INTEGRADA, VARIABLE EN EL TIEMPO Y NO VOLATIL, PARA SOPORTE DE PROCESOS DE TOMA DE DECISION DE LOS EJECUTIVOS.

Statistics

Views

Total Views
273
Views on SlideShare
271
Embed Views
2

Actions

Likes
0
Downloads
6
Comments
0

1 Embed 2

http://www.linkedin.com 2

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    DATA WAREHOUSE DATA WAREHOUSE Presentation Transcript

    • CERTIFICACIÓN EN SISTESMAS Y TECNOLOGIAS DE LA INFORMACIÓN S.C. DATA WAREHOUSE
    •  Es un ambiente estructurado para análisis de datos no volatiles  Es una colección de datos orientada a sujetos, integrada, variable en el tiempo y no volatil, para soporte de procesos de toma de decisión de los ejecutivos.
    •  Facilita la integración, para la toma de decisiones, de datos de aplicaciones operacionales no integrados.  Organiza y almacena los datos que se necesitan para el procesamiento analítico, informático sobre una amplia perspectiva de tiempo.
    • Bases de Datos Operacional Data Warehouse Datos Operacionales Datos del negocio para Información Orientado a la aplicación Orientado al sujeto Actual Actual + histórico Datos detallados Resumidos + más resumidos Datos cambian continuamente Estable El uso de DW se ha extendido debido a Hardware y software mas robustos y se esperaOrientación a la web.
    • ALTAMENTE RESUMIDO LIGERAMENTE RESUMIDO SISTEMA OPERACIONAL refrescamiento META DATA DETALLE ACTUAL DE DATOS DETALLE HISTORICO DE DATOS
    •  Detalle de datos actuales: Datos que constan en los sistemas operacionales  Detalle de datos antiguos: La datos antigüos que se almacenan sobre alguna forma de almacenamiento masivo. No son frecuentemente accesada y se almacena a un nivel de ligeramente resumidos, consistente con los datos detallados actuales del momento en que se obtuvieron.  Datos ligeramente resumidos: La data ligeramente resumida es aquella que proviene desde un bajo nivel de detalle encontrado al nivel de detalle actual.
    •  Datos completamente resumidos: Estos datos son compactos y fácilmente accesibles, resultan de resumir los datos ligeramente resumidos.  Meta data(datos de datos): juega un rol especial y muy importante contiene referencias y apuntadores tales como: ◦ Un directorio para ayudar al analista a ubicar los contenidos del data warehouse. ◦ Una guía para el mapping de datos, de cómo se transforma desde el ambiente operacional hacia el ambiente de data warehouse. ◦ Una guía de los algoritmos usados para la esquematización entre el detalle de datos actual, con los datos ligeramente resumidos y éstos, con los datos completamente resumidos, etc.
    • Ninguno (libre) Bajo Nivel refrescamiento SISTEMA OPERACIONAL META DATA Alto Nivel INDEXACIÓN
    • No permite fácilmente refrescamiento SISTEMA OPERACIONAL META DATA Relativamente fácil RESTRUTURACiÓN
    • Ponga en un buscador de internet “imágenes Data Warehouse” y encontrará:
    • Ponga en un buscador de internet “imágenes Data Warehouse” y encontrará:
    • Ponga en un buscador de internet “imágenes Data Warehouse” y encontrará:
    • Datos de sistemas Operacionales compras Datos de DW No son modificables Datos guardados por Períodos más largos Bajos costos de almacenamiento ventas rrhh produccion Separados de los operacionales para evitar degradación del tiempo
    • Herramientas OLAP (componente clave del DW)  On Line Analitical Process (procesamiento analítico en línea)  Tecnología orientada al análisis de datos  Permite el análisis de las diferentes medidas correspondientes a las dimensiones relacionadas entre sí DW DIMENSIONES (categoría descriptiva) MEDIDAS ( valores cuantitativos)
    • Análisis de datos LOS MODELOS DE ALMACENAMIENTO DE DATOS QUE FACILITAN EL ANÁLISIS DIFIEREN DEPENDIENDO SI ESTÁN ACTUANDO EN UN AMBIENTE TRANSACCIONAL O EN UN DW Modelos de datos en ambientes Transaccionales (Operacionales): •OLTP: Procesamiento de Transacciones En Línea (OnLine Transaction Processing) OLTP Modelos de datos en ambientes de DW : OLAP procesamiento analítico en línea (On-Line Analytical Processing). •ROLAP : Procesamiento analítico en línea sobre base de datos relacional •MOLAP : Procesamiento analítico en línea sobre base de datos multidimensional (OnLine Transaction Processing) •HOLAP: Procesamiento analítico en línea híbrido MOLAP+ROLAP (MOLAP)=OLAP multidimensional ROLAP HOLAP
    •  Creados basados en las técnicas OLAP, para organizar los datos (ya se pueden considerar información) (cubos) Variable tiempo Variable producto Variable Ubicación geográfica DW
    • Una sola área o grupos, costoso y mayor esfuerzo Compras DMT Ventas DMT Rrhh DMT Produccion DMT EMPRESA Riesgos: Proliferación no planificada, Inconsistencia en los datos Pérdida de rendimiento por incremento del tamaño DMT1 + DMT2 + DMT3 + …. DMTn = Reunión de información Separados para evitar degradación en el tiempo
    • Una sola área o grupos, costoso y mayor esfuerzo Ventas DMT Compras DMT DataWarehouse Rrhh DMT Produccion DMT EMPRESA DMT1 + DMT2 + DMT3 + …. DMTn = DW
    • Sybase IQ (DW+ business intelligence) Sybase, Inc. (NYSE: SAP) IBM Netezza DW appliance Netezza Inc (IBM) HP Enterprise DW Solutions para Hewlett-Packard Co. MsSql Server SAP Business Objects data Service Software Business Objects, SAP (comprado 2007) Oracle ( a partir de la versión 11g) ORACLE
    • DATA MINING (minería de datos)
    • DATA MINING (minería de datos)  ES LA EXTRACCIÓN DE INFORMACIÓN OCULTA DE GRANDES BASES DE DATOS  Herramienta que ayuda a predecir futuras tendencias y comportamientos
    • Predicción automatizada de tendencias y comportamientos  Descubrimientos automatizados de modelos previamente desconocidos   Aplica técnicas tales como: redes neuronales artificiales, árboles de decisión, algoritmos genéticos, método vecino más cercano, regla de inducción.
    • Fundamentos Soportado por tecnologías  1. 2. 3. Recolección masiva de datos Computadores potentes con multiprocesador Algoritmos Data Mining
    • DW Sistema x Sistema y Data mining Aplicación n Aplicación 2 Aplicación 1 inform ación