Your SlideShare is downloading. ×
0
UNIVERSIDAD CENTRAL DE VENEZUELA           FACULTAD DE CIENCIAS         ESCUELA DE COMPUTACION´       Sistemas de Informac...
Agenda Introducción Origen y Definición Soluciones Analíticas ¿Qué es OLAP? Características de las Soluciones analíticas M...
Objetivos de Aprendizaje   Al finalizar este capitulo, usted estará en capacidad de:   • Los conceptos básicos de OLAP   •...
Introducción                                     Origen y definición                                     ¿Qué es OLAP?    ...
Modelaje Dimensional Mejores practicas para el diseño de base de datos para OLAP       Kimball, Ralph; et al. (1998). The ...
Tercera Forma Normal En la mayoría de los cursos de BDD:       Base de datos relacionales       3NF = IDEAL       Claves, ...
Esquema Estrella – (MODELO)                                                                     Tabla Fact (Hechos)       ...
Esquema estrella – QUÉ y POR (REPORTE)                                                                     8© 2010, Univer...
Esquema Estrella – QUÉ y POR (LENGUAJE) Usa un “lenguaje” durante el análisis para encontrar medidas y dimensiones QUE = H...
3NF vs Esquema Estrella¿ Como es el query para obtener las ventas por año, mes y departamento?¿ Cuantos Joins son necesari...
Hechos y Dimensiones Consideremos un ejemplo de una operación de ventas, en la cual el tiempo, producto, región, tienda y ...
Tabla Dimensión Jerarquías y niveles       Las jerarquías pueden existir en una dimensión en la cual sirven como       nav...
Jerarquías y niveles – Notación lógica                                                     TABLA “tiempo_dim”Dimensión Tie...
Dimensiones Conformadas (Compartidas)•   Son aquellas que son compartidas entre esquemas estrella•   Permite el diseño esc...
Dimensiones Degeneradas y Combinadas  Una dimensión degenerada es representada con un solo  atributo.  Al menos que el tip...
Dimensiones Combinadas También llamadas dimensiones basura Antes de tener muchas columnas de 0 y 1 en la tabla de hechos  ...
Dimensiones que cambian lentamente (SCD) Dimensión “Tipo 1”:       Nueva información sobrescribe la información vieja.    ...
Hechos aditivos vs. semi-aditivos Los hechos aditivos se agregan a través de todas las dimensiones       E.j. Ingreso por ...
Modelo SnowFlake• Modelo estrella es el más puro  acercamiento al modelado  dimensional   – Mejores practicas   – Es el má...
Esquema Estrella vs. Copa de Nieve                                                                    Snowflake    Star•  ...
Ejemplo de Esquema Copa de Nieve  Mfr                         Mfrid    Marca ProdidNombre         Mfrid                   ...
Conclusiones                                             Conclusiones•   Hemos realizado un estudio de …..•   Hemos hecho ...
Upcoming SlideShare
Loading in...5
×

Inteligencia de negocio- Modelos Dimensionales y Esquemas Estrellas

5,002

Published on

0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
5,002
On Slideshare
0
From Embeds
0
Number of Embeds
2
Actions
Shares
0
Downloads
182
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide

Transcript of "Inteligencia de negocio- Modelos Dimensionales y Esquemas Estrellas"

  1. 1. UNIVERSIDAD CENTRAL DE VENEZUELA FACULTAD DE CIENCIAS ESCUELA DE COMPUTACION´ Sistemas de Información Tema 6: Inteligencia de Negocio. Modelado Multidimensional 1 Prof. Wilfredo Rangel
  2. 2. Agenda Introducción Origen y Definición Soluciones Analíticas ¿Qué es OLAP? Características de las Soluciones analíticas Modelaje Multidimensional ETL Metodología de desarrollo de soluciones analíticas 2© 2010, Universidad Central de Venezuela. Sistemas de Información.
  3. 3. Objetivos de Aprendizaje Al finalizar este capitulo, usted estará en capacidad de: • Los conceptos básicos de OLAP • Entender los aspectos relacionados al desarrollo de soluciones analíticas basadas en OLAP (Online Analitycal Processing) • La arquitectura y módulos de las soluciones analíticas • emplear metodologías de desarrollo de estándares de la industria de BI 3© 2010, Universidad Central de Venezuela. Sistemas de Información.
  4. 4. Introducción Origen y definición ¿Qué es OLAP? Características de las Soluciones Analíticas Modelaje Multidimensional – Esquema Estrella 4© 2010, Universidad Central de Venezuela. Sistemas de Información.
  5. 5. Modelaje Dimensional Mejores practicas para el diseño de base de datos para OLAP Kimball, Ralph; et al. (1998). The Data Warehouse Lifecycle Toolkit. Técnica de modelaje NO implementación de base de datos Tablas de base de datos estándares Optimizada para agregaciones masivas y dinámicas Importante en MOLAP; Realmente Importante en ROLAP 5© 2010, Universidad Central de Venezuela. Sistemas de Información.
  6. 6. Tercera Forma Normal En la mayoría de los cursos de BDD: Base de datos relacionales 3NF = IDEAL Claves, Uniones, Roles, Flexibilidad OLTP (OnLine Transaction Processing) BDdatos para soporte de aplicaciónes MODELO IDEAL PARA: Muchos usuarios, pequeños pedazos de data Ej: Debito # 1002 $40.00 retirada en el cajero (ATM) # 33354 MODELO MALO PARA: Pocos Usuarios y grandes pedazos de data Sumas, agregación y cálculos© 2010, Universidad Central de Venezuela. Sistemas de Información.
  7. 7. Esquema Estrella – (MODELO) Tabla Fact (Hechos) Una tabla fact contiene elementos que se quieren medir. Las Transacciones: Ingreso (Bs. $) Cantidad Vendida (unidades) Precio Promedio Las Medidas son los valores que se FACT tratan de reportar: El “Qué” Tabla Dimensión Las Dimensiones son las formas como se quieren ver las medidas. Por ejemplo: Por cliente Por fecha Por producto Las dimensiones dan contexto, significado a la información en los reportes (agrupaciones, etiquetas, filtros, etc.). El “Por” 7© 2010, Universidad Central de Venezuela. Sistemas de Información.
  8. 8. Esquema estrella – QUÉ y POR (REPORTE) 8© 2010, Universidad Central de Venezuela. Sistemas de Información.
  9. 9. Esquema Estrella – QUÉ y POR (LENGUAJE) Usa un “lenguaje” durante el análisis para encontrar medidas y dimensiones QUE = HECHO (medidas) QUIEN = DIMENSIONES Ejemplos: Quisiera saber cuales son las proporciones de Ventas por mis tipos de producto y tipos de cliente. Cual es la proporción de ganancia que proviene de clientes actuales vs clientes nuevos. Cual es el perfil de los clientes (perfil = Localidad, Ingreso, y Genero) que hace el 80% de mi ganancia actual opuesto al 80% de mis ingresos. 9© 2010, Universidad Central de Venezuela. Sistemas de Información.
  10. 10. 3NF vs Esquema Estrella¿ Como es el query para obtener las ventas por año, mes y departamento?¿ Cuantos Joins son necesarios para obtener la data que quiero?¿ Estos querys sobrecargan el sistema transaccional? ¿Qué tal OLAP? 10© 2010, Universidad Central de Venezuela. Sistemas de Información.
  11. 11. Hechos y Dimensiones Consideremos un ejemplo de una operación de ventas, en la cual el tiempo, producto, región, tienda y cliente son las dimensiones de la base de datos, y se busca medir la transacción de venta en la tabla fact. 11© 2010, Universidad Central de Venezuela. Sistemas de Información.
  12. 12. Tabla Dimensión Jerarquías y niveles Las jerarquías pueden existir en una dimensión en la cual sirven como navegaciones predefinidas Una jerarquía esta compuesta de uno o más niveles Una dimensión puede tener una o más jerarquías Propiedades Cada nivel de dimensión tiene un atributo primario que provee un “identificador único de usuario” para ese nivel Atributos y propiedades adicionales pueden existir para cada nivel que provee un valor descriptivo 12© 2010, Universidad Central de Venezuela. Sistemas de Información.
  13. 13. Jerarquías y niveles – Notación lógica TABLA “tiempo_dim”Dimensión Tiempo ( CAL_AÑO / integer CAL_TRIM / integer Jerarquía del calendario CAL_MES / integer Año FIS_AÑO / integer Trimestre FIS_TRIM / integer Mes FIS_MES / integer ) Jerarquía Fiscal Es una Tabla plana Año Fiscal Trimestre Fiscal Las Columnas son estandares Mes Fiscal El significado y metodos de agregación (drill up/down, etc) se implementan en el servidor OLAP 13© 2010, Universidad Central de Venezuela. Sistemas de Información.
  14. 14. Dimensiones Conformadas (Compartidas)• Son aquellas que son compartidas entre esquemas estrella• Permite el diseño escalable de bases de datos analíticas• Permite el análisis y agregación por área entre distintos sujetos Geografía dim Empleado dim Cliente dim Ventas Fact Producto dim Fecha dim Almacén dim Inventarios Fact 14 © 2010, Universidad Central de Venezuela. Sistemas de Información.
  15. 15. Dimensiones Degeneradas y Combinadas Una dimensión degenerada es representada con un solo atributo. Al menos que el tipo de dato sea grande, estas dimensiones son almacenadas como una columna en la tabla hechoEstrategia: Si hay más de una dimensión degenerada tienen algún grado de relación sus cardinalidades son relativamente pequeñas, de forma tal que un producto cartesiano no produce muchas filas Entonces, se puede crear una dimensión combinada Una columna por atributo/dimensión Una fila por cada combinación 15 © 2010, Universidad Central de Venezuela. Sistemas de Información.
  16. 16. Dimensiones Combinadas También llamadas dimensiones basura Antes de tener muchas columnas de 0 y 1 en la tabla de hechos Crea una dimensión que sea el producto cartesiano de dos dimensiones degeneradas Las búsquedas deben hacerse por los atributosDimensiones Degeneradas Dimensión Combinada Sexo Dimensión ID / Sexo / Tipo de Orden M/F/I 1 /M / Nuevo Todas las 2 /M / Retornado Tipo de Orden combinaciones 3 /F / Nuevo Nuevo / Retornado 4 /F / Retornado 5 /I / Nuevo 6 /I / Retornado 16 © 2010, Universidad Central de Venezuela. Sistemas de Información.
  17. 17. Dimensiones que cambian lentamente (SCD) Dimensión “Tipo 1”: Nueva información sobrescribe la información vieja. La información vieja es perdida, no se guarda. Solo se puede usar en aplicaciones en las cuales mantener un histórico de la data no es esencial; solo se usa para actualizaciones. Dimensión “Tipo 2”: La información nueva es adjuntada a la información vieja. La información vieja se guarda y es versionada. Se puede usar en aplicaciones en las cuales mantener un histórico de los datos es requerido de forma tal que cambios en el data warehouse pueden ser rastreados. Dimensión “Tipo 3”: La nueva información se guarda junto con la información vieja. La información vieja es guardada parcialmente. Se crean columnas adicionales para mostrar el momento a partir del cual la nueva información ha tomado efecto. Habilita una vista de hechos tanto en el estado actual como una vista tentativa del escenario utilizando valores dimensionales viejos. 17© 2010, Universidad Central de Venezuela. Sistemas de Información.
  18. 18. Hechos aditivos vs. semi-aditivos Los hechos aditivos se agregan a través de todas las dimensiones E.j. Ingreso por ventas Los hechos semi-aditivos agregan a través de dimensionalidad parcial, generalmente no agregan en la dimensión tiempo E.j. Artículos a mano Pregunta válida: ¿Cuántos ítems habían en el inventario el primero de julio? Pregunta Inválida: ¿Cuántos ítems habían en el inventario en Julio?La segunda pregunta no tiene sentido. ¿El usuario quiere la cantidad promediopor día para julio? ¿La cantidad al comienzo del mes? ¿Al final?Los hechos semi-aditivos generalmente se miden en un punto del tiempo (comouna foto del estado en un momento determinado).Los hechos aditivos generalmente se usan para marcar un evento transaccional. 18© 2010, Universidad Central de Venezuela. Sistemas de Información.
  19. 19. Modelo SnowFlake• Modelo estrella es el más puro acercamiento al modelado dimensional – Mejores practicas – Es el más utilizado Normalization Normalization• El copo de nieve es un modelo más normalizado – Más espacio físico/ Problemas de performance 19 © 2010, Universidad Central de Venezuela. Sistemas de Información.
  20. 20. Esquema Estrella vs. Copa de Nieve Snowflake Star• Todos los niveles dimensionales están Niveles dimensionales son contenidos en una sola tabla normalizados a tablas separadas• Introduce redundancia en los datos Elimina redundancia en los datos• Indexación y consultas simplificadas• Generalmente el método preferido Reutilización simplificada de dimensiones de alto nivel en agregados 20 © 2010, Universidad Central de Venezuela. Sistemas de Información.
  21. 21. Ejemplo de Esquema Copa de Nieve Mfr Mfrid Marca ProdidNombre Mfrid Día Prodid Unid. Bs Pago Clientid Mfr Producto Mfr es un diseño en copa Ventas de nieve Año Trim Mes Día Estado Ciudad Clientid Tiempo Cliente 21 © 2010, Universidad Central de Venezuela. Sistemas de Información.
  22. 22. Conclusiones Conclusiones• Hemos realizado un estudio de …..• Hemos hecho una discusión sobre….• Se han desarrollado demostraciones de 22© 2010, Universidad Central de Venezuela. Sistemas de Información.
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×