Propuesta de un método para el diseño                   y modelado de una bodega de datos                                 ...
house Data technologies and Olap           information requirements from a bu-tools is relatively new. Therefore, the-   s...
INTRODUCCIÓN                                          MÉTODO PROPUESTOEl desarrollo de los Sistemas de In-                ...
• Fase 3: Elaboración del modelo fí-                   «¿Cuál es la información que desea  sico de la bodega de datos.    ...
Método para el diseño y modelado de una bodega de datos           Fase 1: Identificación de las necesidades de infor-     ...
Como resultado de esta fase, se ten-      tión (necesidades de información ge-drá una visión del negocio y de la in-    re...
Figura 2. Vista multidimensional de una de las variables que conforman          un indicador.Figura 3. Diagrama en estrell...
Antes de presentar los pasos propues-            Cuadro 1 se presentan las definicio-tos por el método para la elaboración...
A continuación se presentan los cua-       • El indicador 1 del F.C.E1 puedetro pasos propuestos para la sistema-        s...
Cuadro 2: Información gerencial del área de ventas,                      obtenida al realizar la fase 1.Área del Negocio -...
Paso No. 2:                               En este paso, se espera que el usua-Identificar, para cada tabla de           ri...
tres ejes para elaborar la vista mul-                 chos, por cada dimensión. Estos ni-tidimensional (dimensiones) de la...
Notación tipo E-R:                       junto de trayectorias de entidades yEn esta notación, el diagrama en es-     rela...
A manera de ejemplo se presenta en      anterior. En la Figura 8 se represen-la Figura 7, el diagrama en estrella,   tan l...
Fase 3:                                                soportado. Si esta verificación no esElaboración de la estructura f...
Figura 9. Dimensión con trayectoria cíclica.Las opciones de transformación para     2. Ajuste para los casos de trayecto-e...
En estos casos, el problema ocurre con                 la bodega de datos, debe ser conver-la trayectoria cíclica; por lo ...
Figura 12. Conversión vertical de la trayectoria de una dimensión.Adicionalmente, en este esquema de      quico son precal...
Este esquema de conversión es el más      tos que conforman cada estructura.recomendable, si las agregaciones de      Una ...
Finalmente, se deben establecer los        de hechos. El resultado de esta revi-tipos de cálculos matemáticos como        ...
Cuadro 6: Definición de los atributos de la tabla de hechos sobre ventas. Nombre de la estructura de la bodega            ...
Cuadro 8: Operaciones matemáticas para cada atributo                    de la tabla de hechos sobre ventas.   Tabla de hec...
BIBLIOGRAFÍA                              Modeling Techniques for Data                                          Warehouse....
36        SISTEMAS      TELEMÁTICA
Upcoming SlideShare
Loading in...5
×

Jbahamon diseno modelado-bodega_datos

98

Published on

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
98
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
0
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Jbahamon diseno modelado-bodega_datos

  1. 1. Propuesta de un método para el diseño y modelado de una bodega de datos José Hernando Bahamón L. Universidad Icesi jbahamon@icesi.edu.coFecha de recepción: 15-4-2003 Fecha de aceptación: 25-8-2003RESUMEN ses. La primera fase comprende laEl desarrollo de los Sistemas de In- identificación de las necesidades deformación Gerencial basados en tec- información gerencial, desde la pers-nologías de Data Warehouse y Herra- pectiva del negocio. La segunda fasemientas Olap, es relativamente re- comprende todas las actividades re-ciente y, por lo tanto, no existe una lacionadas con la elaboración de unpropuesta metodológica universal- modelo lógico-conceptual de la estruc-mente válida y aceptada como tal, por tura de la bodega de datos. La terce-la comunidad académica. ra fase incluye los pasos para reali- zar el diseño físico de la estructuraEl presente artículo expone una pro- de la bodega de datos.puesta metodológica para la realiza-ción del diseño de una bodega de da- PALABRAS CLAVEStos, que utiliza como eje articulador Bodegas de datos, método de diseñola identificación de las necesidades de de la estructura de una bodega deinformación por parte de la gerencia, datos.para el soporte de los procesos de con-trol y de toma de decisiones. ABSTRACTEl método propuesto está compuesto The development of Management In-de ocho pasos agrupados en tres fa- formation Systems based on Ware- SISTEMAS & TELEMÁTICA 13
  2. 2. house Data technologies and Olap information requirements from a bu-tools is relatively new. Therefore, the- siness perspective. The second onere is no valid methodological appro- deals with all the activities associa-ach that is generally accepted as such ted with the preparation of a logicalby the academic community. conceptual model for the data ware- house structure, and the third stageThis article presents a methodologi- includes the steps to make the phy-cal approach to the design of a data sical design of the data warehousewarehouse using the identification of structure.management information require-ments as a shaft that supports the KEY WORDScontrol and decision-making proces-ses. The suggested approach consists Data warehouses, approach to theof eight steps grouped in three diffe- design of a data warehouse struc-rent stages. The first stage encompas- ture.ses the identification of management Clasificación: A14 SISTEMAS & TELEMÁTICA
  3. 3. INTRODUCCIÓN MÉTODO PROPUESTOEl desarrollo de los Sistemas de In- El método de diseño propuesto estáformación Gerencial basados en tec- centrado en la identificación de lanologías de Data Warehouse y herra- información clave y relevante para so-mientas Olap, es relativamente re- portar los procesos de dirección y deciente y, por lo tanto, no existe una toma de decisiones dentro de la orga-propuesta metodológica universal- nización. Este método utiliza, comomente válida y aceptada como tal, por punto de partida, la identificación yla comunidad académica. el modelado de: qué es lo que el negocio está tratando de alcan-Entre las propuestas más conocidas zar, para luego elaborar una estruc-están: 1. Ralph Kimball,1 con un es- tura que apoye el proceso de gestiónquema centrado en la identificación hacia el logro de las metas definidas.de los procesos de la empresa, comoelemento clave para la definición de Una vez que la información clave dela estructura de variables y dimen- apoyo a los procesos de gestión y con-siones; 2. W.H. Inmon,2 con un esque- trol de la organización ha sido iden-ma que parte de la construcción del tificada, se inicia la elaboración delmodelo de datos corporativos, elabo- modelo lógico-conceptual de la estruc-rado al más alto nivel de abstracción, tura de la bodega de datos, que so-para luego derivar la estructura del portará las consultas y la exploraciónmodelo de datos, para el diseño de la de los datos, a partir de los cuales sebodega; 3. Golfarelli Matteo, Maio construirán los indicadores de gestiónDario, Rizzi Stefano3 proponen un requeridos por los niveles directivosesquema que parte de los modelos E- de la organización.R descriptivos de los sistemas tran- Para darle un orden a este procesosaccionales de la organización, para sistémico de diseño, los pasos delluego derivar el modelo E-R de la es- método propuesto, tal como se presen-tructura, para la bodega de datos. tan en la Figura 1, se han agrupadoEn este artículo se presenta una pro- en las siguientes fases:puesta de sistematización del proce- • Fase 1: Identificación de las ne-so de diseño de una bodega de datos, cesidades de información geren-que se aparta de los esquemas de di- cial, desde la perspectiva del ne-seño referidos, y que utiliza como eje gocio.articulador, la identificación de la in-formación gerencial, para el soporte • Fase 2: Elaboración del modelo ló-de los procesos de control y de toma gico-conceptual de la estructurade decisiones en los niveles directi- de la bodega de datos.vos de la organización.1. Kimball R. The Data Warehouse Toolkit. John Wiley & Sons, 1996.2. Inmon W.H. Building The Data Warehouse. QED Press / John Wiley & Sons, 1992.3. Golfarelli M., Maio D., Rizzi S. Conceptual Design of Data Warehouse From E/R Schemes. http//www.csr.unib.it/~golfare/db.html, 1998. SISTEMAS & TELEMÁTICA 15
  4. 4. • Fase 3: Elaboración del modelo fí- «¿Cuál es la información que desea sico de la bodega de datos. obtener del sistema de información gerencial?». Este enfoque puede resul- tar muy peligroso, si el directivo noFase 1: realiza un proceso sistemático y orde-Identificación de las necesidades nado, para establecer sus necesidadesde información gerencial, desde de información, en relación con sus ac-la perspectiva del negocio. tividades de gestión y control.La primera fase, a partir de la cual Una forma ordenada y sistemáticase realiza el proceso de diseño de la para realizar esta fase de identifica-estructura para una bodega de datos, ción de las necesidades de informa-comprende la identificación de las ne- ción, que soporte los procesos de ges-cesidades de información gerencial, tión y control gerencial, es la aplica-lo que significa hacer explícitos los ción del enfoque de sistemas, paraobjetivos y los factores claves de éxi- guiar el proceso de revisión o defini-to de la organización, o de un área ción de: 1. Los objetivos estratégicosdel negocio. del negocio o del área; 2. Los factores clave para el logro de los objetivos de-Es bastante común empezar este pro- finidos y 3. Los indicadores de con-ceso de identificación y modelado trol, tanto de los objetivos como de losmediante entrevistas a los directivos, factores clave.4en las cuales la pregunta central es:4. Véase Bahamón José H. Construcción de indicadores de gestión bajo el enfoque de sistemas. S&T Revista de la Facultad de Ingeniería, Universidad Icesi. 2003.16 SISTEMAS & TELEMÁTICA
  5. 5. Método para el diseño y modelado de una bodega de datos Fase 1: Identificación de las necesidades de infor- mación gerencial, desde la perspectiva del negocio. Fase 2: Elaboración del modelo lógico-conceptual de la estructura de la bodega de datos. 2.1. Definir las tablas de hechos o las variables de la estructura. 2.2. Identificar, para cada tabla de hechos, las dimen- siones que la referencian. 2.3. Establecer el nivel de granulación y los niveles de agregación. 2.4. Elaborar el diagrama en estrella que representa la estructura de la bodega. Fase 3: Elaboración del modelo físico de la bodega de datos. 3.1. Verificación y ajuste del modelo lógico. 3.2. Definición del esquema físico del almacenamien- to de las dimensiones y sus jerarquías. 3.3. Definición de los atributos que conforman las tablas de hechos.Figura 1. Método para el diseño y modelado de una bodega. SISTEMAS & TELEMÁTICA 17
  6. 6. Como resultado de esta fase, se ten- tión (necesidades de información ge-drá una visión del negocio y de la in- rencial), identificados en la fase an-formación requerida para la dirección terior, y termina con la construccióny el control gerencial, representada de una representación multidimen-fundamentalmente por: Los objetivos sional de las variables que conformandel negocio; los factores clave de éxi- cada indicador. En esta representa-to y, en especial, un conjunto de indi- ción multidimensional, cada variablecadores clave de la gestión. es modelada mediante un arreglo di- mensional (multidimensional) de cel-Fase 2: das, como se presenta en la Figura 2.Elaboración del modelo lógico- Para facilitar el proceso de elabora-conceptual de la estructura de la ción del modelo lógico, se utiliza unabodega. representación gráfica denominadaEn esta fase se elabora el modelo ló- diagrama tipo estrella, donde el ele-gico de la estructura de la bodega, que mento central del esquema es la Va-soportará las consultas, mediante las riable o Tabla de Hechos («Fact»), lacuales se obtendrá la información re- cual es referenciada por un conjuntoquerida por los niveles directivos de ejes, denominados Dimensiones, acomo apoyo a sus procesos de gestión través de los cuales se seleccionan losy de toma de decisiones. valores contenidos en la tabla de he- chos. En la Figura 3, se esquematizaLa elaboración de este modelo lógico el modelo de un diagrama en estrella.comienza con los indicadores de ges-18 SISTEMAS & TELEMÁTICA
  7. 7. Figura 2. Vista multidimensional de una de las variables que conforman un indicador.Figura 3. Diagrama en estrella de una estructura multidimensional. SISTEMAS & TELEMÁTICA 19
  8. 8. Antes de presentar los pasos propues- Cuadro 1 se presentan las definicio-tos por el método para la elaboración nes adoptadas para los diferentesdel modelo lógico, es pertinente pre- conceptos utilizados en el método pro-cisar algunos de los términos utiliza- puesto.dos en el método propuesto. En el Cuadro 1: Definición de conceptos básicos. Gráfica Una gráfica es una red de nodos interconectados. Una gráfica direccional es aquella en la cual la conexión entre dos nodos tiene una dirección específica. Un modelo E-R puede ser considerado una gráfica direccional. Trayectorias cíclicas En una gráfica, una trayectoria acíclica es aquella que sólo y acíclicas tiene una forma de recorrido (en un solo sentido). Una trayectoria cíclica es aquella que se puede recorrer en dos o más secuencias diferentes. Tabla de hechos Es la tabla central de la estructura de la bodega. Esta tabla contiene los datos de interés para el negocio, es decir, los valo- res para la construcción de los indicadores claves del negocio. Técnicamente, la tabla de hechos es una entidad de intersec- ción cuya llave primaria está compuesta por la unión de los dominios de las diferentes dimensiones que la referencian. Dimensión Las dimensiones corresponden a los ejes con los cuales se cons- truye la vista multidimensional de la información clave del ne- gocio, almacenada en la tabla de hechos. Las atributos almacenados en las dimensiones determinan la granulación adoptada para el modelo. Las dimensiones pueden ser: – Propias: Cuando el conjunto de entidades que conforman la dimensión se encuentran unidas a la tabla de hechos, en una trayectoria acíclica. – Impropias: Cuando el conjunto de entidades que confor- man la dimensión se encuentran unidas a la tabla de he- chos, en una trayectoria cíclica. – De Información: Cuando los atributos contenidos en la dimensión definen qué tipo de datos se encuentran almace- nados en la tabla de hechos. Jerarquías Determinan cómo las instancias de la tabla de hechos pueden ser agregadas. Las jerarquías permiten las operaciones de «drill-down» o «rollup», en los procesos de consulta. Una jerarquía está conformada por el conjunto de entidades que constituyen la dimensión.20 SISTEMAS & TELEMÁTICA
  9. 9. A continuación se presentan los cua- • El indicador 1 del F.C.E1 puedetro pasos propuestos para la sistema- ser construido con dos tablas detización del proceso de elaboración del hechos que son: ventas por ven-modelo lógico: dedor y cuota de ventas de cada vendedor.Paso No. 1: • El indicador 2 del F.C.E1 puedeDefinir las tablas de hechos o las ser construido con dos tablas devariables de la estructura. hechos que son: número de visi-Este paso se realiza a partir del con- tas realizadas por cada vendedor,junto de los indicadores de gestión, y número de visitas presupuesta-definidos en la fase de identificación das por cada vendedor.de las necesidades de información • El indicador 1 del F.C.E2 puedegerencial, desde la perspectiva del ser construido con una tabla denegocio. El paso se inicia con la eva- hechos: número de clientes nue-luación de las variables (divisores y vos en la base de datos. En estedividendos) de cada indicador, para caso, el denominador del indica-determinar cuáles de éstas pueden dor se asume como un único valorser almacenadas en una tabla de he- y, por lo tanto, no tiene sentidochos, y cuáles no. almacenarlo en otra tabla de he-En el Cuadro 2 se presenta, a mane- chos.ra de ejemplo, la información obteni- • Los demás indicadores se anali-da, al aplicar los pasos de la fase 1 al zan de igual manera.área de ventas de una organización.A partir de estos resultados se iden- En suma, al realizar el análisis detifican las variables o tablas de he- todos los indicadores, obtenemos laschos, como lo establece el paso 1 de siguientes tablas de hecho:esta fase. • Ventas.Aplicación del paso 1: Identificación • Ventas por vendedor.de las tablas de hechos • Cuota de ventas de cada vende-• El indicador definido para el mo- dor. nitoreo del objetivo puede ser construido con una sola tabla de • Número de visitas realizadas por hechos: Ventas. Se toma una sola cada vendedor. variable, por cuanto las ventas del • Número de visitas presupuesta- año y las ventas del año anterior, das por cada vendedor. que son las dos variables que con- forman el indicador, se pueden • Número de clientes nuevos en la almacenar en la misma tabla de base de datos. hechos. • Número de vendedores capacita- dos que aprobaron los cursos. SISTEMAS & TELEMÁTICA 21
  10. 10. Cuadro 2: Información gerencial del área de ventas, obtenida al realizar la fase 1.Área del Negocio - Descripción. Se trabaja con el área de ventas de una orga-nización dedicada a la producción de recipientes elaborados en plástico.Objetivo del Área: para propósitos del ejemplo, se toma el siguiente objetivo: Lograr al final del año un incremento del 15% en las ventas totales de la compañía, con respecto a las ventas del año anterior.Factores claves de éxito. Luego de realizado el análisis de las acciones y lascondiciones necesarias para garantizar el logro del objetivo planteado, se identi-ficaron los siguientes F.C.E: • F.C.E.1: Planeación y control de la fuerza de ventas. • F.C.E.2: Búsqueda de nuevos clientes rentables para la organización. • F.C.E.3: Capacitación y entrenamiento de la fuerza de ventas.Indicadores claves de gestión. Para el control y seguimiento de los F.C.E y losobjetivos, se proponen los siguientes indicadores: Ventas del añoI_obj: -1 Ventas del año anterior Ventas del vendedorI1_FCE1: Cuota de ventas Número de visitas de venta realizadasI2_FCE1: Número de visitas presupuestadas Número de clientes nuevos en la base de datosI1_FCE2: Número de clientes nuevos presupuestados Número de vendedores capacitados que aprobaron los cursosI1_FCE3: Número presupuestado de vendedores capacitados22 SISTEMAS & TELEMÁTICA
  11. 11. Paso No. 2: En este paso, se espera que el usua-Identificar, para cada tabla de rio visualice cada variable, como unhechos, las dimensiones que la conjunto de valores almacenados enreferencian. una estructura de varias dimensio- nes, donde los valores almacenadosPara cada variable o tabla de hechos son referenciados por la combinaciónse identifican, con la colaboración del de los valores definidos para cada ejeusuario líder del área de negocio, los (dominio de la dimensión), tal comoejes de visualización multidimensio- se esquematiza en la Figura 4.nal los cuales constituyen las dimen-siones de la variable.Figura 4: Esquema de una vista multidimensional de una tabla de hechos.Paso 3: Hechos sobre Ventas, definida en elEstablecer el nivel de granula- ejemplo anterior.ción y los niveles de agregación Aplicación del paso 2: Identificaciónde cada dimensión. de las dimensiones.Una vez que las dimensiones han sido Supongamos que el gerente de ven-identificadas se debe establecer, para tas expresa su interés por visualizarcada una de ellas, el menor nivel de la información de ventas organizadagranulación, el cual corresponde al de la siguiente manera: primero, porconjunto de atributos que referencian cada producto de la compañía; en se-el mayor nivel de detalle deseado gundo término, por cada lugar enpara la variable o tabla de hechos. donde se venden los productos y, fi-A manera de ejemplo, se aplican los nalmente, por cada semana. Podemosdos pasos anteriores para la Tabla de establecer la necesidad de utilizar SISTEMAS & TELEMÁTICA 23
  12. 12. tres ejes para elaborar la vista mul- chos, por cada dimensión. Estos ni-tidimensional (dimensiones) de la veles de agregación representan laTabla de Hechos - Ventas: jerarquía de cada dimensión.• Dim1: Producto • Jerarquía en la Dim. Produc- to: Las ventas por productos pue-• Dim2: Lugar de venta den ser agregadas por grupos de• Dim3: Tiempo. productos, por líneas de produc- tos y, por el total de la venta. DeAplicación del paso 3: Definición del esta manera, los niveles de agre-nivel de granulación. gación de la dimensión productoDe acuerdo con la solicitud del geren- son:te, se establece para cada dimensión – Por grupos de productos.la siguiente granulación:• Dim. Producto: El menor nivel – Por líneas de productos. de granulación es el Tipo de Pro- – Total. ductos. Podemos establecer otros • Jerarquía en la Dim. Lugar: niveles como: Línea de Productos, Las ventas por lugar pueden ser que tiene un nivel de granulación agregadas por regiones y por el mayor, pero un menor nivel de de- total del país. talle en la variable ventas; o Re- ferencias de Productos, que tiene • Jerarquía en la Dim. Tiempo: un menor nivel de granulación, Las ventas por tiempo pueden ser pero un mayor nivel de detalle. agregadas por mes, por trimestre, por semestre, por año.• Dim. Lugar: El nivel de granu- lación requerido es la Ciudad. Se habrían podido seleccionar otros Paso 4: niveles, como Almacén, que tiene Elaborar el diagrama en estrella un menor nivel, o Región, que tie- que representa la estructura de ne uno mayor. la bodega.• Dim. Tiempo: El menor nivel de Luego de identificar los elementos granulación requerido es la Sema- que conforman la estructura de la na. Se habrían podido seleccionar vista multidimensional, de la infor- otros niveles, como el Día, que tie- mación gerencial requerida por la ne un menor nivel, o el Mes, que organización, se pasa a la elaboración tiene uno mayor. de una representación gráfica, en for-Una vez se han definido los menores ma de estrella; para ello se puede uti-niveles de granulación para cada di- lizar la notación simplificada de losmensión, se identifican los niveles de diagramas E-R, o la notación deno-agregación requeridos para los valo- minada «Dot modeling».5res almacenados en la tabla de he-5. Todman, Chris. Designing a Data Warehouse: Supporting Customer Relationship. Prentice Hall, 2001.24 SISTEMAS & TELEMÁTICA
  13. 13. Notación tipo E-R: junto de trayectorias de entidades yEn esta notación, el diagrama en es- relaciones de uno a muchos, que co-trella está conformado por una enti- rresponde a las dimensiones y a susdad central asociativa, que correspon- jerarquías. En la Figura 5 se presen-de a la tabla de hechos, y por un con- ta un diagrama en estrella con esta notación.Figura 5. Representación de un diagrama en estrella, mediante la notación tipo E-R.Notación «Dot Modeling» trayectorias compuestas por puntosEn esta notación, el diagrama en es- («dots»), que representan las dimen-trella está conformado por una enti- siones y sus jerarquías. En la Figuradad central que corresponde a la Ta- 6 se presenta un diagrama en estre-bla de Hechos, y por un conjunto de lla con esta notación.Figura 6. Representación de un diagrama en estrella, mediante la notación «Dot Modeling». SISTEMAS & TELEMÁTICA 25
  14. 14. A manera de ejemplo se presenta en anterior. En la Figura 8 se represen-la Figura 7, el diagrama en estrella, tan los mismos elementos de la es-con notación «Dot Modeling», para la tructura de la bodega, pero con nota-Tabla de Hechos y para las dimen- ción tipo E-R.siones identificadas en el ejemploFigura 7. Representación, mediante la notación «Dot Modeling», de la estructura para la bodega de datos del ejemplo anterior.Figura 8. Representación, mediante la notación E-R, de la estructura para la bodega de datos del ejemplo anterior.26 SISTEMAS & TELEMÁTICA
  15. 15. Fase 3: soportado. Si esta verificación no esElaboración de la estructura fí- correcta, se debe retornar a la fasesica de la bodega anterior, para incorporar las estruc- turas que soporten los requerimien-Durante esta fase, se realiza la trans- tos faltantes de información.formación del modelo lógico concep-tual en la estructura física, que pos- Terminada la revisión anterior, elteriormente será implementada en proceso continúa con la evaluación dealguna herramienta de «Data Ware- la estructura, para asegurar la vali-house». dez de todas las consultas de infor- mación realizadas sobre dicha estruc-Este proceso de transformación se tura.realiza mediante los siguientes pasos:1. Verificación y refinamiento del Para realizar este proceso de compro-modelo lógico para determinar su con- bación de validez de la estructura,sistencia. 2. Definición del esquema recurrimos a la teoría de grafos, se-físico de almacenamiento de las es- gún la cual una estructura de consul-tructuras jerárquicas de las dimen- ta es válida cuando está conformadasiones. 3. Identificación de los atri- por trayectorias acíclicas. Al aplicarbutos que conforman las tablas de esta teoría, se puede afirmar quehechos y las dimensiones. cualquier diseño para una bodega de datos permitirá siempre consultas co- rrectas, si la estructura propuestaPaso 1: está conformada únicamente por di-Verificación y ajuste mensiones propias, es decir, por tra-del modelo lógico. yectorias acíclicas.Durante este paso, se realiza la veri- Si al realizar la comprobación de laficación del modelo lógico, obtenido en estructura se encuentran trayecto-la fase anterior, para garantizar que rias acíclicas, éstas deben ser trans-el modelo, además de soportar todas formadas, para asegurar la confiabi-las consultas requeridas por los ni- lidad de las consultas. Las posiblesveles ejecutivos, siempre retorne in- transformaciones son:6formación confiable.Para iniciar este proceso de verifica- 1. Ajuste para los casos de trayecto-ción se debe elaborar una matriz de rias cíclicas simplescruce, entre los requerimientos de Este caso ocurre cuando la trayecto-información gerencial, definidos en la ria de una dimensión presenta unafase inicial, y las estructuras (estre- trayectoria alterna que tiene dos en-llas), definidas en la fase anterior. En tidades comunes. En la Figura 9, sela matriz de cruce se confirma si el esquematiza una trayectoria cíclicarequerimiento está completamente simple.6. Mcguff, F. Designing the perfect Data Warehouse. 1998. SISTEMAS & TELEMÁTICA 27
  16. 16. Figura 9. Dimensión con trayectoria cíclica.Las opciones de transformación para 2. Ajuste para los casos de trayecto-esta clase de trayectorias son: rias alternas, mezcladas con trayec- torias cíclicas.• Tratar cada trayectoria como una Se presenta cuando la trayectoria de nueva dimensión, lo cual signifi- una dimensión está conformada por ca redibujar el diagrama, elimi- una trayectoria alterna, más una tra- nando las relaciones N1-A2 y A3- yectoria cíclica, tal como se esquema- N4, para luego crear la relación: tiza en la Figura 10. Tabla de Hechos - A2.• Convertir la trayectoria cíclica en una trayectoria alterna, eliminan- do la relación A3-N4.Figura 10. Dimensión con trayectoria alterna, más trayectoria cíclica.28 SISTEMAS & TELEMÁTICA
  17. 17. En estos casos, el problema ocurre con la bodega de datos, debe ser conver-la trayectoria cíclica; por lo tanto, la tido en una estructura totalmentetransformación se maneja como se ex- desnormalizada, tal como se presen-plicó en el caso anterior. ta en la Figura 11. Este modelo físico está conformado por una tabla dePaso 2: hechos, y por las entidades en las cua-Definición del esquema físico del les se almacenarán los dominios dealmacenamiento de las dimensio- las dimensiones con sus correspon-nes y sus jerarquías. dientes niveles jerárquicos.El modelo en estrella que conformala estructura lógica propuesta paraFigura 11. Modelo lógico en estrella, y modelo físico de la bodega.Para el proceso de conversión de cada todos los dominios de las entidadesuna de las trayectorias que confor- que conforman la trayectoria de laman el modelo en estrella, en entida- dimensión, es decir, si los dominiosdes desnormalizadas, se puede utili- de las entidades que conforman lazar uno de los siguientes esquemas trayectoria son: {enero, febrero, mar-de conversión.7 zo, abril ....}; {1er_trim, 2º_trim, 3er_trim, 4º_trim}; {1er_sem,1. Conversión vertical 2º_sem}, el dominio de la llave prima- o recursiva ria será: {enero, febrero, marzo, abril,En esta conversión, se utiliza una lla- ...., 1er_trim, 2º_trim, 3er_trim,ve primaria única, para cada dimen- 4º_trim; 1er_sem,2º_sem}. En la Fi-sión. El dominio de esta llave prima- gura 12 se presenta, de manera grá-ria se obtiene mediante la unión de fica, este esquema de conversión.7. Mcguff, F. Designing the perfect Data Warehouse. 1998. SISTEMAS & TELEMÁTICA 29
  18. 18. Figura 12. Conversión vertical de la trayectoria de una dimensión.Adicionalmente, en este esquema de quico son precalculadas y almacena-conversión a cada valor del dominio das en la bodega.se le asocia un valor padre, el cual Este esquema de conversión es el mástambién pertenece al dominio; de esta recomendado para implementar lamanera se implementa la jerarquía estructura física de una bodega, cuan-definida en la trayectoria, represen- do las dimensiones están compuestastada en la dimensión, dentro del mo- por jerarquías desbalanceadas.delo en estrella.Este esquema para el manejo de las 2. Conversión horizontaljerarquías (id_dimensión, id_padre) En esta conversión, la llave primariapermite implementar fácilmente la de la dimensión se conforma comooperación de desenrolle («drill- una llave compuesta por las llaves dedown»), cuando se realizan consultas cada una de las entidades que con-a la bodega de datos. Sin embargo, forman la trayectoria de la dimen-esta estructura es eficiente, si las sión. En la Figura 13 se presenta, deagregaciones para cada nivel jerár- manera gráfica, este esquema de con- versión.Figura 13: Conversión horizontal de la trayectoria de una dimensión.30 SISTEMAS & TELEMÁTICA
  19. 19. Este esquema de conversión es el más tos que conforman cada estructura.recomendable, si las agregaciones de Una vez asignados todos los atribu-datos se realizan de manera dinámica. tos, se realiza un análisis cruzado en- tre la tabla de hechos y las dimen-Paso 3: siones, para establecer los tipos deDefinición de los atributos que cálculo matemático que pueden serconforman las tablas de hechos realizados, sobre la tabla de hechos.y las dimensiones del modelo. La especificación de los atributos queEn este paso final, se identifican para conforman la tabla de hechos se debecada tabla de hechos y cada dimen- realizar siguiendo el formato que apa-sión las características de los atribu- rece en el Cuadro 3. Cuadro 3: Formato para la definición de los atributos de una tabla de hechos.Igualmente, para la especificación de los atributos que conforman las dimen-siones se debe utilizar el formato que aparece en el Cuadro 4. Cuadro 4: Formato para la definición de los atributos de una dimensión. SISTEMAS & TELEMÁTICA 31
  20. 20. Finalmente, se deben establecer los de hechos. El resultado de esta revi-tipos de cálculos matemáticos como sión debe quedar consignado en unasuma, conteo, promedio, mínimo, matriz de cruce, como la presentadamáximo, que pueden ser aplicados a en el Cuadro 5.los valores almacenados en las tablas Cuadro 5: Operaciones matemáticas para cada atributo de la tabla de hechos. Tabla de hechos Atributo 1 Dimensiones Suma Conteo Prom. Mín. Máx. 1. Dimensión a 2. Dimensión b 3. Dimensión c ..... Atributo 2 Dimensiones Suma Conteo Prom. Mín. Máx. 1. Dimensión a 2. Dimensión b 3. Dimensión c Atributo 3 Dimensiones Suma Conteo Prom. Mín. Máx. 1. Dimensión a 2. Dimensión b 3. Dimensión c ....A manera de ejemplo, se presenta en los siguientes cuadros la definición deatributos para la tabla de hechos y para las dimensiones definidas en el ejem-plo anterior, y esquematizadas en la Figura 7.32 SISTEMAS & TELEMÁTICA
  21. 21. Cuadro 6: Definición de los atributos de la tabla de hechos sobre ventas. Nombre de la estructura de la bodega Área de ventas Tabla de hechos Ventas Atributos tipo Pk Descripción Id lugar C(35) Sí Identif. de la dimensión lugar Id tiempo C(12) Sí Identif. de la dimensión tiempo id producto C(30) Sí Identif. de la dimensión producto Unidades vendidas N(8,0) Valor 1 de la tabla de hechos Pesos-venta N(10,2) Valor 2 de la tabla de hechos Cuadro 7: Definición de los atributos de las dimensiones, para la estructura de ventas.Nombre de la estructura de la bodega Nombre de la estructura de la bodega Nombre de la estructura de la bodega SISTEMAS & TELEMÁTICA 33
  22. 22. Cuadro 8: Operaciones matemáticas para cada atributo de la tabla de hechos sobre ventas. Tabla de hechos Ventas Atributo 1 Unidades vendidas Dimensiones Suma Conteo Prom Mín Máx Lugar Tiempo Producto Atributo 2 Pesos-venta Dimensiones Suma Conteo Prom Mín Máx Lugar Tiempo Producto CONCLUSIÓN organizaciones se realiza de maneraMediante la aplicación del enfoque de intuitiva y, en otras mediante la uti-Sistemas para la definición de los in- lización de estructuras de bodegasdicadores claves de gestión de la or- que han sido definidas para otras or-ganización, se ha logrado articular ganizaciones. El modelo propuesto,una propuesta para modelar, de ma- que se aparta de muchos de los enfo-nera ordenada y sistémica, las estruc- ques presentados por los investigado-turas de las bodegas de datos que ser- res en este campo, se convierte en unavirán de soporte a la implementación opción válida para el diseño de siste-de sistemas de información gerencial, mas de información gerencial, en par-hechos a la medida de las necesida- ticular para el diseño de bodegas dedes de información de la gerencia. datos departamentalizadas («DataEsta propuesta facilita, ordena y sis- Marts»).tematiza un proceso que en algunas34 SISTEMAS TELEMÁTICA
  23. 23. BIBLIOGRAFÍA Modeling Techniques for Data Warehouse. IBM. 1998.• Mcguff, F. Designing the perfect Data Warehouse. 1998. http:// • Todman, C. Designing a Data members.aol.com/fmcguff/dwmo- Warehouse: Supporting Customer del/index.htm Relationship. Prentice Hall. 2001• Kimball R. The Data Warehouse Toolkit. John Wiley Sons, 1996. CURRÍCULO• Inmon W.H. Building The Data Warehouse. QED Press /Jhon José Hernando Bahamón L. Inge- Wiley, 1992. niero Electrónico de la Universidad del Cauca, especialista en Adminis-• Golfarelli, M; Maio, D; Rizzi, S. tración de la Universidad Icesi y ma- Conceptual Design of Data Ware- gíster en Dirección Universitaria de house From E/R schemes. http// la Universidad de los Andes. Profe- www.csr.unib.it/~golfare/db.html, sor investigador de la Universidad 1998. Icesi. Vinculado a la Universidad Ice-• Bahamón, J. H. Construcción de si desde 1988. Ha sido jefe del Depar- indicadores de gestión bajo el en- tamento Académico de Sistemas foque de sistemas. ST Revista de (1988-1998), Director del programa la Facultad de Ingeniería, Univer- de Ingeniería de Sistemas (1998- sidad Icesi. 2003. 2000), y en la actualidad es el Direc-• Chuck, B; Dick, H; Don, S; Rhon- tor Académico de la Universidad. da; Eunsaeng, K.; Ann, V. Data SISTEMAS TELEMÁTICA 35
  24. 24. 36 SISTEMAS TELEMÁTICA

×