www.EvencoCCC.com
Creación de un
sistema de soporte
    a la toma de
     decisiones
            Msc(c) Alfonso Borré Sarmiento
            ...
Agenda
Antecedentes
Modelamiento dimensional
Ejemplo de construcción de una
bodega de datos
Antecedentes
    La información es la clave para obtener
    una ventaja competitiva en el mundo de los
    negocios

    ...
Sistemas transaccionales
            (OLTP)
    Son aquellas aplicaciones que
●
    resuelven las necesidades de
    funci...
Problemas de los sistemas
         transaccionales
     Es difícil separar el procesamiento de
●
     la consulta.
     No...
Tipos de usuario

     Alta         Cuadro de mando
  dirección



                    Olap, query ad hoc
   Dirección
  i...
Data warehouse
        (Bodega de datos)
    Es una colección de datos orientados
●
    al tema, integrados, no volátiles ...
Datamart
    Es un almacén de datos históricos
●
    relativos a un departamento de una
    organización, así que puede se...
Carácterísticas de una
       bodega de datos
Integración   Historia   Datos no
                         volátiles
Sistema transaccional y
                datawarehouse
●                                            BODEGA DE
     SISTEMA ...
Sistema transaccional y
                datawarehouse
     SISTEMA
●                                           BODEGA DE D...
Sistemas para la toma de
          decisiones
    Tableros de control (dashboards) :   Reportes analíticos:
●




    Repo...
Agenda
Antecedentes
Modelamiento multidimensional
Ejemplo de construcción de una
bodega de datos
Modelamiento multidimensional

    Se basa en modelar los requerimientos
●
    de análisis de los usuarios vistos
    como...
Modelamiento multidimensional
    El modelamiento se basa en dos componentes : tablas
●
    de hechos (fact tables) y dime...
Metodología de diseño
1. Elija los hechos de interés
2. Por cada hecho construya un árbol de
   atributos que capture las ...
Tipos de esquema
         multidimensionales
    Estrella (Star) : Estuctura
●
    desnormalizada en la cual todas las
   ...
Modelo relacional
Agenda
Antecedentes
Modelamiento multidimensional
Ejemplo de construcción de una
bodega de datos
Requerimientos
    Número de inscripciones por colegios
●
    Total de inscripciones por facultad y
●
    programa
    Tot...
Identificación de
   dimensiones y medidas
Dimensiones :            Medidas :
  1. Inscritos           1. Total de inscrit...
Modelo dimensional
ETL (Extracción,
    transformación y carga)
    Es el trabajo de recolectar, transformar
●
    y cargar los datos desde d...
Upcoming SlideShare
Loading in …5
×

Msc(C) Alfonso Borré Sarmiento

1,535 views

Published on

Published in: Technology, Business
0 Comments
2 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
1,535
On SlideShare
0
From Embeds
0
Number of Embeds
12
Actions
Shares
0
Downloads
19
Comments
0
Likes
2
Embeds 0
No embeds

No notes for slide

Msc(C) Alfonso Borré Sarmiento

  1. 1. www.EvencoCCC.com
  2. 2. Creación de un sistema de soporte a la toma de decisiones Msc(c) Alfonso Borré Sarmiento alfonsoborre@yahoo.es
  3. 3. Agenda Antecedentes Modelamiento dimensional Ejemplo de construcción de una bodega de datos
  4. 4. Antecedentes La información es la clave para obtener una ventaja competitiva en el mundo de los negocios Los gerentes y tomadores de decisiones requieren de un acceso rápido y fácil a información útil y valiosa de la empresa Tenemos montañas de datos en esta ● compañía y no podemos accesarlos
  5. 5. Sistemas transaccionales (OLTP) Son aquellas aplicaciones que ● resuelven las necesidades de funcionamiento de la empresa En este tipo de aplicaciones los ● conceptos más importantes son la actualización y el tiempo de respuesta (insert, update, delete)
  6. 6. Problemas de los sistemas transaccionales Es difícil separar el procesamiento de ● la consulta. No fueron diseñados para soportar ● consultas masivas con datos agregados (sumatorias, conteos, promedios) Proliferación de islas de información ● Mantienen historia de pocos años ●
  7. 7. Tipos de usuario Alta Cuadro de mando dirección Olap, query ad hoc Dirección intermedia Informes preformateados Nivel operativo
  8. 8. Data warehouse (Bodega de datos) Es una colección de datos orientados ● al tema, integrados, no volátiles e historiados, organizados para el apoyo de un proceso de ayuda a la decisión”. Bill Inmon -Using de Data Warehouse.
  9. 9. Datamart Es un almacén de datos históricos ● relativos a un departamento de una organización, así que puede ser simplemente una copia de parte de un DataWarehouse para uso departamental.
  10. 10. Carácterísticas de una bodega de datos Integración Historia Datos no volátiles
  11. 11. Sistema transaccional y datawarehouse ● BODEGA DE SISTEMA TRANSACCIONAL DATOS Predomina la actualización ● Predomina la consulta ● La actividad más importante es ● La actividad más importante es ● de tipo operativo, día a día el análisis y la decisión estratégica Datos en general ● Datos en distintos niveles de ● desagregados detalle y agregación Importancia del dato actual ● Importancia del dato histórico ● Usuarios de perfiles táctico y ● Usuarios de perfiles estratégicos ● operativo y tácticos No fueron diseñados para ● Diseñados para realizar ● realizar consultas masivas de consultas masivas de datos datos agregados agregados
  12. 12. Sistema transaccional y datawarehouse SISTEMA ● BODEGA DE DATOS TRANSACCIONAL Integra diferentes fuentes de ● Está diseñado para soportar datos ● una aplicación específica Muestra el patrón histórico de las ● Muestra cuales sillas están sillas vacías por vuelo para ajustar ● disponibles en una aerolínea agendas en un futuro para que un agente de viajes realice reservaciones
  13. 13. Sistemas para la toma de decisiones Tableros de control (dashboards) : Reportes analíticos: ● Reportes producción: ●
  14. 14. Agenda Antecedentes Modelamiento multidimensional Ejemplo de construcción de una bodega de datos
  15. 15. Modelamiento multidimensional Se basa en modelar los requerimientos ● de análisis de los usuarios vistos como eventos relevantes. Cada evento es cuantificado usando ● un conjunto de medidas y criterios de agrupación o visualización
  16. 16. Modelamiento multidimensional El modelamiento se basa en dos componentes : tablas ● de hechos (fact tables) y dimensiones. Un hecho es el foco de interés en el proceso de toma ● de decisiones, típicamente modela un conjunto de eventos del mundo real. Una medida es una propiedad de un hecho y describe ● aspectos cuantitativos de interés para el análisis. Las medidas son usadas para llevar a cabo cálculos. Una dimensión es una propiedad de un hecho con ● un dominio finito y describe una de sus coordenadas de análisis. El conjunto de dimensiones de un hecho determina la granularidad o nivel de detalle.
  17. 17. Metodología de diseño 1. Elija los hechos de interés 2. Por cada hecho construya un árbol de atributos que capture las dependencias funcionales expresada en el esquema 3. Escoja dimensiones y medidas 4. Cree el esquema multidimensional
  18. 18. Tipos de esquema multidimensionales Estrella (Star) : Estuctura ● desnormalizada en la cual todas las dimensiones están directamente relacionadas a la fact table. Copo de nieve (Snowflake) : En ● esta estructura por lo menos una dimensión debe usar una tabla intermedia para conectarse con la fact table.
  19. 19. Modelo relacional
  20. 20. Agenda Antecedentes Modelamiento multidimensional Ejemplo de construcción de una bodega de datos
  21. 21. Requerimientos Número de inscripciones por colegios ● Total de inscripciones por facultad y ● programa Total de inscritos por departamento y ● municipio Total de inscritos por jornada por periodo ● académico Inscripciones distribuidas por género y edad ● Total de inscritos por programa por año ●
  22. 22. Identificación de dimensiones y medidas Dimensiones : Medidas : 1. Inscritos 1. Total de inscritos 2. Tiempo 3. Programa 4. Periodo académico 5. Edad 6. Jornada
  23. 23. Modelo dimensional
  24. 24. ETL (Extracción, transformación y carga) Es el trabajo de recolectar, transformar ● y cargar los datos desde diferentes y múltiples fuentes a una base de atos estructurada para el ánalisis. Puede ocupar hasta el 70% del tiempo ● proyecto.

×