Your SlideShare is downloading. ×
0
Msc(C) Alfonso Borré Sarmiento
Msc(C) Alfonso Borré Sarmiento
Msc(C) Alfonso Borré Sarmiento
Msc(C) Alfonso Borré Sarmiento
Msc(C) Alfonso Borré Sarmiento
Msc(C) Alfonso Borré Sarmiento
Msc(C) Alfonso Borré Sarmiento
Msc(C) Alfonso Borré Sarmiento
Msc(C) Alfonso Borré Sarmiento
Msc(C) Alfonso Borré Sarmiento
Msc(C) Alfonso Borré Sarmiento
Msc(C) Alfonso Borré Sarmiento
Msc(C) Alfonso Borré Sarmiento
Msc(C) Alfonso Borré Sarmiento
Msc(C) Alfonso Borré Sarmiento
Msc(C) Alfonso Borré Sarmiento
Msc(C) Alfonso Borré Sarmiento
Msc(C) Alfonso Borré Sarmiento
Msc(C) Alfonso Borré Sarmiento
Msc(C) Alfonso Borré Sarmiento
Msc(C) Alfonso Borré Sarmiento
Msc(C) Alfonso Borré Sarmiento
Msc(C) Alfonso Borré Sarmiento
Msc(C) Alfonso Borré Sarmiento
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

Msc(C) Alfonso Borré Sarmiento

1,167

Published on

Published in: Technology, Business
0 Comments
2 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
1,167
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
18
Comments
0
Likes
2
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. www.EvencoCCC.com
  • 2. Creación de un sistema de soporte a la toma de decisiones Msc(c) Alfonso Borré Sarmiento alfonsoborre@yahoo.es
  • 3. Agenda Antecedentes Modelamiento dimensional Ejemplo de construcción de una bodega de datos
  • 4. Antecedentes La información es la clave para obtener una ventaja competitiva en el mundo de los negocios Los gerentes y tomadores de decisiones requieren de un acceso rápido y fácil a información útil y valiosa de la empresa Tenemos montañas de datos en esta ● compañía y no podemos accesarlos
  • 5. Sistemas transaccionales (OLTP) Son aquellas aplicaciones que ● resuelven las necesidades de funcionamiento de la empresa En este tipo de aplicaciones los ● conceptos más importantes son la actualización y el tiempo de respuesta (insert, update, delete)
  • 6. Problemas de los sistemas transaccionales Es difícil separar el procesamiento de ● la consulta. No fueron diseñados para soportar ● consultas masivas con datos agregados (sumatorias, conteos, promedios) Proliferación de islas de información ● Mantienen historia de pocos años ●
  • 7. Tipos de usuario Alta Cuadro de mando dirección Olap, query ad hoc Dirección intermedia Informes preformateados Nivel operativo
  • 8. Data warehouse (Bodega de datos) Es una colección de datos orientados ● al tema, integrados, no volátiles e historiados, organizados para el apoyo de un proceso de ayuda a la decisión”. Bill Inmon -Using de Data Warehouse.
  • 9. Datamart Es un almacén de datos históricos ● relativos a un departamento de una organización, así que puede ser simplemente una copia de parte de un DataWarehouse para uso departamental.
  • 10. Carácterísticas de una bodega de datos Integración Historia Datos no volátiles
  • 11. Sistema transaccional y datawarehouse ● BODEGA DE SISTEMA TRANSACCIONAL DATOS Predomina la actualización ● Predomina la consulta ● La actividad más importante es ● La actividad más importante es ● de tipo operativo, día a día el análisis y la decisión estratégica Datos en general ● Datos en distintos niveles de ● desagregados detalle y agregación Importancia del dato actual ● Importancia del dato histórico ● Usuarios de perfiles táctico y ● Usuarios de perfiles estratégicos ● operativo y tácticos No fueron diseñados para ● Diseñados para realizar ● realizar consultas masivas de consultas masivas de datos datos agregados agregados
  • 12. Sistema transaccional y datawarehouse SISTEMA ● BODEGA DE DATOS TRANSACCIONAL Integra diferentes fuentes de ● Está diseñado para soportar datos ● una aplicación específica Muestra el patrón histórico de las ● Muestra cuales sillas están sillas vacías por vuelo para ajustar ● disponibles en una aerolínea agendas en un futuro para que un agente de viajes realice reservaciones
  • 13. Sistemas para la toma de decisiones Tableros de control (dashboards) : Reportes analíticos: ● Reportes producción: ●
  • 14. Agenda Antecedentes Modelamiento multidimensional Ejemplo de construcción de una bodega de datos
  • 15. Modelamiento multidimensional Se basa en modelar los requerimientos ● de análisis de los usuarios vistos como eventos relevantes. Cada evento es cuantificado usando ● un conjunto de medidas y criterios de agrupación o visualización
  • 16. Modelamiento multidimensional El modelamiento se basa en dos componentes : tablas ● de hechos (fact tables) y dimensiones. Un hecho es el foco de interés en el proceso de toma ● de decisiones, típicamente modela un conjunto de eventos del mundo real. Una medida es una propiedad de un hecho y describe ● aspectos cuantitativos de interés para el análisis. Las medidas son usadas para llevar a cabo cálculos. Una dimensión es una propiedad de un hecho con ● un dominio finito y describe una de sus coordenadas de análisis. El conjunto de dimensiones de un hecho determina la granularidad o nivel de detalle.
  • 17. Metodología de diseño 1. Elija los hechos de interés 2. Por cada hecho construya un árbol de atributos que capture las dependencias funcionales expresada en el esquema 3. Escoja dimensiones y medidas 4. Cree el esquema multidimensional
  • 18. Tipos de esquema multidimensionales Estrella (Star) : Estuctura ● desnormalizada en la cual todas las dimensiones están directamente relacionadas a la fact table. Copo de nieve (Snowflake) : En ● esta estructura por lo menos una dimensión debe usar una tabla intermedia para conectarse con la fact table.
  • 19. Modelo relacional
  • 20. Agenda Antecedentes Modelamiento multidimensional Ejemplo de construcción de una bodega de datos
  • 21. Requerimientos Número de inscripciones por colegios ● Total de inscripciones por facultad y ● programa Total de inscritos por departamento y ● municipio Total de inscritos por jornada por periodo ● académico Inscripciones distribuidas por género y edad ● Total de inscritos por programa por año ●
  • 22. Identificación de dimensiones y medidas Dimensiones : Medidas : 1. Inscritos 1. Total de inscritos 2. Tiempo 3. Programa 4. Periodo académico 5. Edad 6. Jornada
  • 23. Modelo dimensional
  • 24. ETL (Extracción, transformación y carga) Es el trabajo de recolectar, transformar ● y cargar los datos desde diferentes y múltiples fuentes a una base de atos estructurada para el ánalisis. Puede ocupar hasta el 70% del tiempo ● proyecto.

×