Your SlideShare is downloading. ×
Que Es Un Data Warehouse
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×

Saving this for later?

Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime - even offline.

Text the download link to your phone

Standard text messaging rates apply

Que Es Un Data Warehouse

8,337
views

Published on

Published in: Education

1 Comment
3 Likes
Statistics
Notes
No Downloads
Views
Total Views
8,337
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
352
Comments
1
Likes
3
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. DATA WAREHOUSE
    BASE DE DATOS
    UNIVERSIDAD ESTATAL DE MILAGRO
    ENERO DE 2010
    MAURICIO QUINTUÑA
  • 2. La definición de empresa:
    Es una unidad de producción de bienes y servicios para satisfacer las necesidades de un mercado.
  • 3.
    • El objetivo de una empresa es ganar dinero¡¡¡¡
  • PRODUCTOS Y SERVICIOS
    proveedor
    inventario
    producción
    inventario
    clientes
    FLUJO DE INFORMACION
    ¿Cómo se mueve actualmente la cadena de suministro?
    Por un lado fluye productos y al mismo tiempo fluye una gran cantidad de información en cada eslabón de la cadena.
  • 4. Entorno de la empresa actual.
    Globalización de los mercados.
    Es necesario contar con ventaja competitiva o comparativa respecto a otras empresas.
    Incertidumbre y turbulencia del entorno.
    Oferta en un entorno de alto nivel de competencia.
    Demanda más exigente y selectiva.
    Aumento de la innovación y oferta de productos.
    Acortamiento del ciclo de vida de los productos.
    Utilización del costo, calidad, tiempo, innovación y orientación al cliente como estrategias de negocios.
  • 5.
    • Por lo tanto ante la imperante necesidad de obtener información confiable casi en tiempo real la utilización de un sistema de Data Warehouse se considera hoy día como una herramienta primaria no solo en las empresas globales sino inclusive en las PYMES.
  • ¿Qué es un “Data Warehouse”?
    Es un almacén de datos de muy fácil acceso, alimentado de numerosas fuentes, transformadas en grupos de información sobre temas específicos del negocio, para permitir nuevas consultas, análisis, reportes ejecutivos y finalmente lo más importante, tomar decisiones.
  • 6.
    • Un sistema de Data Warehouse permite transformar datos o información bruta en información con sentido y extremadamente útil.
    • 7. Uno de los valores más importantes de una organización es la información. Estos valores normalmente son guardados por la empresa de dos formas:
    • 8. Los sistemas operacionales de registros (de donde el Data Warehouse obtiene los datos) y nuestro almacén de datos.
  • ¿Cuáles son los objetivos fundamentales de un Almacén de Datos?
    Hacer que la información de la organización sea accesible.
    Hacer que la información de la organización sea consistente.
    Que la información sea adaptable y flexible.
    Seguridad en el resguardo de la información.
    Ser la base principal de información para la toma de decisiones.
  • 9. Las razones básicas de porque una organización implementa Data Warehouse:
    a) Para realizar tareas en los servidores y discos, asociados a queries y reportes en servidores y discos que no son utilizados por sistemas de proceso de transacciones.
    b) Para utilizar modelos de datos o tecnologías de servidores que agilizan los queries y reportes, y que no son apropiados para los procesos de transacciones.
    c) Para proveer un ambiente donde relativamente una muy poca cantidad de conocimiento de los aspectos técnicos de tecnología de bases de datos es requerida para escribir y mantener queries y reportes.
    d) Para proveer un almacén del sistema de proceso de transacciones limpio que puede ser reportado y que no necesariamente requiere que se arregle el sistema de proceso de transacciones.
    e) Para hacer los queries y reportes de datos básicamente más fácil de los múltiples procesos de transacciones y de las fuentes externas y de los datos que deben ser almacenados solamente para el propósito de hacer queries y reportes.
  • 10. Los procesos básicos del Data WareHouse (ETL):
    Extracción: este es el primer paso de obtener la información hacia el ambiente del Data Warehouse.
    b) Transformación: una vez que la información es extraída hacia el área de trafico de datos, hay posibles paso de transformación como; limpieza de la información, tirar la basura que no nos sirve, seleccionar únicamente los campos necesarios para el Data Warehouse, combinar fuentes de datos, haciéndolas coincidir por los valores de las llaves, creando nuevas llaves para cada registro de una dimensión.
    c) Carga: al final del proceso de transformación, los datos están en forma para ser cargados.
  • 11. Los elementos básicos de un Data WareHouse:
    Sistema fuente: sistemas operacionales de registros donde sus funciones son capturar las transacciones del negocio. A los sistemas fuentes también se le conoce como LegacySystem.
    b) Área de trafico de datos: es un área de almacenamiento y grupo de procesos, que limpian transforman, combinan, remover los duplicados, guardan, archivan y preparan los datos fuente para ser usados en el Data Warehouse.
    c) Servidor de presentación: la maquina física en donde los datos del Data Warehouse son organizados y almacenados para Queriesdirectos por los usuarios finales, reportes y otras aplicaciones.
    d) Modelo dimensional: una disciplina especifica para el modelado de datos que es una alternativa para los modelos de entidad – relación.
    e) Data Warehousesystem.
    f) OLAP: actividad general de búsquedas para presentación de texto y números del Data WareHouse, también un estilo dimensional especifico de búsquedas y presentación de información.
  • 12. g) ROLAP: un grupo de interfases de usuarios y aplicaciones que le dan a la base de datos relacional un estilo dimensional.
    h) MOLAP: un grupo de interfases de usuarios, aplicaciones y propietarios de tecnología de bases de datos que tienen un fuerte estilo dimensional.
    i) Aplicaciones para usuarios finales: una colección de herramientas que hacen los queries, analizan y presentan la información objetivo para el soporte de las necesidades del negocio.
  • 13.
  • 14. El Data Mining y su relación con el Data Warehouse.
    Un sistema Data Mining es una tecnología de soporte para usuario final cuyo objetivo es extraer conocimiento útil y utilizable a partir de la información contenida en las bases de datos de las empresas.
    Las herramientas de Data Mining sirven para predecir tendencias y comportamientos, de esta manera permiten a las organizaciones tomar decisiones proactivas para adaptarse rápidamente a los cambios del mercado obteniendo así ventajas heterogéneas Bases de Datos relacionales, ficheros planos y registros de transacciones en línea.
    El Data Warehouse dota a las organizaciones de memoria, y el Data Mining de inteligencia.
    .
  • 15. Ventajas de Data Warehouse:a) Proporciona información clave para la toma de decisiones empresariales.Mejora la calidad de las decisiones tomadas.b) Especialmente útil para el medio y largo plazo.c) Son sistemas relativamente sencillos de instalar si las fuentes de datos y los objetivos están claros.d) Muy útiles para el almacenamiento de análisis y consultas de históricos.
    Desventajas:a) No es muy útil para la toma de decisiones en tiempo real debido al largo tiempo de procesamiento que puede requerir. En cualquier caso la tendencia de los productos actuales (junto con los avances del hardware) es la de solventar este problema convirtiendo la desventaja en una ventaja.b) Requiere de continua limpieza, transformación e integración de datos.c) En un proceso de implantación puede encontrarse dificultades ante los diferentes objetivos que pretende una organización.d) Una vez implantado puede ser complicado añadir nuevas fuentes de datos.
  • 16. Evolución desde los datos operacionales hasta la información para la toma de decisiones
    Usuario final
    Toma de
    decisiones
    Analista negocios
    Presentación de datos
    Técnicas de visualización
    Data Mining
    Exploración de datos y descubrimiento de información
    Analista datos
    Data Warehouses / Data Marts
    OLAP
    Admon.DB
    Fuentes de Datos
    Papel, ficheros, fuentes externas, SGBDS, OLTP
  • 17. Cuatro características clave del Data Warehouse
    • Las evoluciones tecnológicas
    • 18. La vinculación implícita con la estrategia de la empresa
    • 19. Una lógica de mejora continua
    • 20. Un nivel de madurez diferente según las empresas
  • FASES DE IMPLANTACIÓN
    Implementación:
    Extracción de los datos del sistema operacional y transformación de los mismos.
    Carga de los datos validados en el Data Warehouse. Esta carga deberá ser planificada con una periodicidad que se adaptará a las necesidades de refresco detectadas durante las fases de diseño del nuevo sistema.
    Explotación del Data Warehouse mediante diversas técnicas dependiendo del tipo de aplicación que se de a los datos:
    Revisión:
    La construcción del Data Warehouse no finaliza con la implantación del mismo, sino que es una tarea iterativa en la que se trata de incrementar su alcance aprendiendo de las experiencias anteriores.
    Después de implantarse, debería realizarse una revisión del Data Warehouse planteando preguntas que permitan, después de los seis o nueve meses posteriores a su puesta en marcha, definir cuáles serían los aspectos a mejorar o potenciar en función de la utilización que se haga del nuevo sistema
  • 21. Arquitectura Data Warehouse
    • Base de datos operacional / Nivel de base de datos externo
    • 22. Nivel de acceso a la información
    • 23. Nivel de acceso a los datos
    • 24. Nivel de directorio de datos (Metadata)
    • 25. Nivel de gestión de proceso
    • 26. Nivel de mensaje de la aplicación
    • 27. Nivel de data warehouse
    • 28. Nivel de organización de datos
  • ESTRUCTURA DEL DATA WAREHOUSE
    Datos antiguos: La data antigua es aquella que se almacena sobre alguna forma de almacenamiento masivo. No es frecuentemente accesada y se almacena a un nivel de detalle, consistente con los datos detallados actuales.
    Datos Actuales:
    Refleja las ocurrencias más recientes, las cuales son de gran interés
    Datos ligeramente resumidos
    La data ligeramente resumida es aquella que proviene desde un bajo nivel de detalle encontrado al nivel de detalle actual. Este nivel del data warehouse casi siempre se almacena en disco. Los puntos en los que se basa el diseñador para construirlo son:
    Datos completamente resumidos:
    El siguiente nivel de datos encontrado en el data warehouse es el de los datos completamente resumidos. Estos datos son compactos y fácilmente accesibles.
  • 29.
  • 30. JDE
    DB2
    AS400
    Lay out
    FTP
    protocolo
    Data
    Warehouse
    COGNOS
    Windows server 2003
    Ventas
    catálogos
    Ledger
    movements
    OS400
    Formato
    TXT
    Reportes
    compras
    Inventarios
    ventas
    Location
    Clientes
    inventarios
    reportes
    manufactura
    contabilidad
    costos
  • 31.
  • 32.
  • 33.
  • 34. Conclusiones
    ¿Qué es un Datawarehouse?
    Es una base de datos que contiene datos de la empresa, además de integrar una serie de datos históricos. Tiene una orientación a uno o varios temas, con datos consolidados y consistentes, estructurados para su distribución y consulta.
     
    ¿Tengovarias Bases de Datos, puedoalmacenar la información en un mismo Data Warehouse?
    Desdeluegoquesi, al concentrar la información en una Data Warehouse, el acceso a la informaciónesmásrápido, además de queesposiblehacer cruces entre la información de diferentes Bases de Datos.
     
  • 35. Finalización!!!