Your SlideShare is downloading. ×
Que Es Un Datawarehouse
Que Es Un Datawarehouse
Que Es Un Datawarehouse
Que Es Un Datawarehouse
Que Es Un Datawarehouse
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

Que Es Un Datawarehouse

9,638

Published on

Published in: Education
0 Comments
3 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
9,638
On Slideshare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
415
Comments
0
Likes
3
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. Mauricio Quintuña 6to C Ingeniería de Sistemas Temario 1. Definición. 2. Objetivo 3. Qué es un Data WareHouse? 4. Importancia 5. Procesos de un Data Warehouse 1
  • 2. Mauricio Quintuña 6to C Ingeniería de Sistemas 6. Desarrollo gradual 7. Beneficios de un Data WareHouse 8. Cómo justificar la inversión en un DataWarehouse? 9. Ventajas y desventajas del DataWarehouse? 10. Tipos de usuarios de un DataWarehouse 11. Las razones básicas de porque una organización implementa Data Warehouse: 12. Los procesos básicos del Data WareHouse (ETL) 13. Los elementos básicos de un Data WareHouse: 14. El Data Mining y su relación con el Data Warehouse. 15. Características clave del Data Warehouse 16. Arquitectura del Data Warehouse 17. ESTRUCTURA DEL DATA WAREHOUSE DataWareHouse Definición “El Data Warehouse es una colección de datos orientados al tema, integrados, no volátiles e historiados, organizados para el apoyo de un proceso de ayuda a la decisión. Objetivo El objetivo del DW se expresa en términos puramente de negocio como “mantener la fidelidad de la clientela” ¿Que es un Data Warehouse? Un Data Warehouse es un almacenamiento separado y homogéneo donde son cargados datos transformados provenientes de diferentes bases de datos. Importancia  Un sistema de Data Warehouse permite transformar datos o información bruta en información con sentido y extremadamente útil.  Uno de los valores más importantes de una organización es la información. Estos valores normalmente son guardados por la empresa de dos formas:  Los sistemas operacionales de registros (de donde el Data Warehouse obtiene los datos) y nuestro almacén de datos. Procesos de un Data Warehouse a) Extracción: obtención de información de las distintas fuentes tanto internas como externas. b) Elaboración: filtrado, limpieza, depuración, homogeneización y agrupación de la información. c) Carga: organización y actualización de los datos y los metadatos en la base de datos. d) Explotación: extracción y análisis de la información en los distintos niveles de agrupación. Desde el punto de vista del usuario, el único proceso visible es la explotación del almacén de datos, aunque el éxito del Data Warehouse radica en los tres procesos iniciales que alimentan la información del mismo y suponen el mayor porcentaje de esfuerzo (en torno a un 80%) a la hora de desarrollar el almacén. Desarrollo gradual 1) Una de las claves del éxito en la construcción de un Data Warehouse es el desarrollo de forma gradual, seleccionando a un departamento usuario como piloto y expandiendo progresivamente el almacén de datos a los demás usuarios. 2
  • 3. Mauricio Quintuña 6to C Ingeniería de Sistemas 2) Por ello es importante elegir este usuario inicial o piloto, siendo importante que sea un departamento con pocos usuarios, en el que la necesidad de este tipo de sistemas es muy alta y se puedan obtener y medir resultados a corto plazo. Beneficios de un Data WareHouse a) Proporciona una herramienta para la toma de decisiones en cualquier área funcional, basándose en información integrada y global del negocio. b) Facilita la aplicación de técnicas estadísticas de análisis y modelización para encontrar relaciones ocultas entre los datos del almacén; obteniendo un valor añadido para el negocio de dicha información. c) Proporciona la capacidad de aprender de los datos del pasado y de predecir situaciones futuras en diversos escenarios. d) Simplifica dentro de la empresa la implantación de sistemas de gestión integral de la relación con el cliente. e) Supone una optimización tecnológica y económica en entornos de Centro de Información, estadística o de generación de informes con retornos de la inversión espectaculares ¿Cómo justificar la inversión en un data warehouse? - ¿Están las ventas de artículos deportivos sujetas a tendencias por temporada? ¿Qué artículos se ven afectados y cuándo? - ¿Cuántos autos se vendieron el mes pasado? ¿Cómo se compara esta cantidad con el mismo mes en los últimos cinco años? - ¿Quiénes son los diez primeros vendedores o clientes en Latinoamérica? ¿Qué porcentaje del ingreso generan? - ¿Cuáles son los diez artículos de menor rentabilidad en el catálogo de ventas? Ventajas - Data Warehouse a) Datos de toda la compañía, organizados para facilitar las consultas más analíticas que transaccionales. b) Los procesos de transformación han sido aplicados a los datos para permitir un tiempo de respuesta mínimo a las consultas. c) Modelo de datos multidimensional para hacer más fácil la navegación y explotación de datos. d) La administración de la seguridad está centralizada para garantizar la necesidad de información dependiendo del perfil de los usuarios. Desventajas: a) No es muy útil para la toma de decisiones en tiempo real debido al largo tiempo de procesamiento que puede requerir. b) Requiere de continua limpieza, transformación e integración de datos. c) En un proceso de implantación puede encontrarse dificultades ante los diferentes objetivos que pretende una organización. d) Una vez implantado puede ser complicado añadir nuevas fuentes de datos. Tipos de usuarios de un DW: 1) Turistas 3
  • 4. Mauricio Quintuña 6to C Ingeniería de Sistemas 2) Exploradores 3) Labradores. Las razones básicas de porque una organización implementa Data Warehouse: a) Para realizar tareas en los servidores y discos, asociados a queries y reportes en servidores y discos que no son utilizados por sistemas de proceso de transacciones. b) Para utilizar modelos de datos o tecnologías de servidores que agilizan los queries y reportes, y que no son apropiados para los procesos de transacciones. c) Para proveer un ambiente donde relativamente una muy poca cantidad de conocimiento de los aspectos técnicos de tecnología de bases de datos es requerida para escribir y mantener queries y reportes. d) Para proveer un almacén del sistema de proceso de transacciones limpio que puede ser reportado y que no necesariamente requiere que se arregle el sistema de proceso de transacciones. e) Para hacer los queries y reportes de datos básicamente más fácil de los múltiples procesos de transacciones y de las fuentes externas y de los datos que deben ser almacenados solamente para el propósito de hacer queries y reportes. Los procesos básicos del Data WareHouse (ETL): a) Extracción: este es el primer paso de obtener la información hacia el ambiente del Data Warehouse. b) Transformación: una vez que la información es extraída hacia el área de trafico de datos, hay posibles paso de transformación como; limpieza de la información, tirar la basura que no nos sirve, seleccionar únicamente los campos necesarios para el Data Warehouse, combinar fuentes de datos, haciéndolas coincidir por los valores de las llaves, creando nuevas llaves para cada registro de una dimensión. c) Carga: al final del proceso de transformación, los datos están en forma para ser cargados. Los elementos básicos de un Data WareHouse: a) Sistema fuente: sistemas operacionales de registros donde sus funciones son capturar las transacciones del negocio. A los sistemas fuentes también se le conoce como Legacy System. b) Área de tráfico de datos: es un área de almacenamiento y grupo de procesos, que limpian transforman, combinan, remover los duplicados, guardan, archivan y preparan los datos fuente para ser usados en el Data Warehouse. c) Servidor de presentación: la maquina física en donde los datos del Data Warehouse son organizados y almacenados para Queries directos por los usuarios finales, reportes y otras aplicaciones. d) Modelo dimensional: una disciplina especifica para el modelado de datos que es una alternativa para los modelos de entidad – relación. e) Data Warehouse system. f) OLAP: actividad general de búsquedas para presentación de texto y números del Data WareHouse, también un estilo dimensional especifico de búsquedas y presentación de información. g) ROLAP: un grupo de interfaces de usuarios y aplicaciones que le dan a la base de datos relacional un estilo dimensional. h) MOLAP: un grupo de interfaces de usuarios, aplicaciones y propietarios de tecnología de bases de datos que tienen un fuerte estilo dimensional. i) Aplicaciones para usuarios finales: una colección de herramientas que hacen los queries, analizan y presentan la información objetivo para el soporte de las necesidades del negocio. 4
  • 5. Mauricio Quintuña 6to C Ingeniería de Sistemas El Data Mining y su relación con el Data Warehouse. Un sistema Data Mining es una tecnología de soporte para usuario final cuyo objetivo es extraer conocimiento útil y utilizable a partir de la información contenida en las bases de datos de las empresas. Las herramientas de Data Mining sirven para predecir tendencias y comportamientos, de esta manera permiten a las organizaciones tomar decisiones proactivas para adaptarse rápidamente a los cambios del mercado obteniendo así ventajas heterogéneas Bases de Datos relacionales, ficheros planos y registros de transacciones en línea. El Data Warehouse dota a las organizaciones de memoria, y el Data Mining de inteligencia. Cuatro características clave del Data Warehouse 1) Las evoluciones tecnológicas 2) La vinculación implícita con la estrategia de la empresa 3) Una lógica de mejora continua 4) Un nivel de madurez diferente según las empresas Arquitectura Data Warehouse  Base de datos operacional / Nivel de base de datos externo  Nivel de acceso a la información  Nivel de acceso a los datos  Nivel de directorio de datos (Metadata)  Nivel de gestión de proceso  Nivel de mensaje de la aplicación  Nivel de data warehouse  Nivel de organización de datos Estructura del data warehouse a) Datos antiguos: La data antigua es aquella que se almacena sobre alguna forma de almacenamiento masivo. No es frecuentemente accesada y se almacena a un nivel de detalle, consistente con los datos detallados actuales. b) Datos Actuales: Refleja las ocurrencias más recientes, las cuales son de gran interés c) Datos ligeramente resumidos: La data ligeramente resumida es aquella que proviene desde un bajo nivel de detalle encontrado al nivel de detalle actual. Este nivel de la data warehouse casi siempre se almacena en disco. Los puntos en los que se basa el diseñador para construirlo son: d) Datos completamente resumidos: El siguiente nivel de datos encontrado en el data warehouse es el de los datos completamente resumidos. Estos datos son compactos y fácilmente accesibles. 5

×