SlideShare una empresa de Scribd logo
1 de 14
BASE DE DATOS AVANZADAS
Unidad 8: Diseño de almacenes de datos


ESCUELA:       Ciencias de la Computación

NOMBRES:       Ing. Juan Carlos Morocho




                                            1
Diseño de almacenes de datos

Emprender en el diseño de un almacén de
datos no es tarea fácil, pero la utilización de
una metodología adecuada será clave.

Considerando que un almacén de datos tiene
un alcance corporativo, a veces resulta mejor
empezar por mercados de datos, pero hay que
tener en cuenta que el fin último es un
almacén de datos que soporte las necesidades
de toda la organización en forma integrada.
Metodología de diseño

1. Selección del proceso

Ejemplo: Cadena de supermercados.
Cadena de supermercados con 300 almacenes
en la que se expenden unos 30.000 productos
distintos.

Actividad: Ventas.
La actividad a modelar son las ventas de
productos en los almacenes de la cadena
Metodología de diseño

2. Selección de la granularidad
Ejemplo: Cadena de supermercados.
Gránulo: “se desea almacenar información
sobre las ventas diarias de cada producto en
cada almacén de la cadena”.
Gránulo:
• Define el significado de las tuplas de la tabla
de hechos.
• Determina las dimensiones básicas del
esquema
Metodología de diseño

3. Identificación y conformación de las
dimensiones

Ejemplo: Cadena de supermercados.


      Definición de   Dimensiones   •Tiempo
        gránulo         básicas     •Producto
                                    •Establecimiento
Metodología de diseño

4. Selección de los hechos
Ejemplo: Cadena de supermercados.
Gránulo: “se desea almacenar información
sobre las ventas diarias de cada producto en
cada establecimiento de la cadena”.

• Importe total de las ventas del producto en el día.
• Número total de unidades vendidas del producto en
el día.
• Número total de clientes distintos que han
comprado el producto en el día.
Metodología de diseño

5.   Almacenamiento        de   los           valores
precalculados en la tabla de hechos.




                         Valor precalculado
Metodología de diseño

6. Terminación de las tablas de dimensión

La idea es añadir descripciones textuales a las
dimensiones hasta ahora definidas, para que
sean entendibles para los usuarios.


                   En lugar de “nro_clientes”, una descripción
                   más inituitiva sería “Total de clientes”.
Metodología de diseño

7. Selección de la duración de la base de
datos.

Definir la cantidad de tiempo con la cual se va
a trabajar o a contrastar los datos de las
tablas de hechos. Generalmente se hacen
comparaciones de dos años atrás, pero por
temas legales en otros casos se trabaja con
datos de hasta cinco años atrás.
Metodología de diseño

8. Control de las dimensiones lentamente
cambiantes

Tipo 1: Sobreescribe un atributo de dimensión
modificado.
Tipo 2: Un atributo de dimensión modificado
hace que se cree un nuevo registro de
dimensión.
Tipo 3: Un atributo de dimensión modificado
hace que se cree un atributo alternativo.
Metodología de diseño

9. Selección de las prioridades de consulta y
de los modos de consulta

Esto es importante ya que hay que considerar
que la consultas siempre manejan gran
cantidad de datos, calculan subtotales,
ordenan resultados, por lo que consume una
cantidad considerable de recursos.
Trabajos citados

 Hernández Orallo, J. (s.f.). Curso: Análisis y
  Extracción de Conocimiento en Sistemas de
  Información. Recuperado el 5 de Marzo de
  2012, de Departamento de Sistemas
  Informáticos y Computación:
  http://users.dsic.upv.es/~jorallo/cursoDWD
  M/dwdm-II.pdf



                                               12
Información de contacto:

E-mail: jcmorocho@utpl.edu.ec

Cuenta en skype: jcmorocho
14

Más contenido relacionado

Destacado (20)

Procesos de construcción del software
Procesos de construcción del softwareProcesos de construcción del software
Procesos de construcción del software
 
Ciclos de vida de un software
Ciclos de vida de un softwareCiclos de vida de un software
Ciclos de vida de un software
 
Calidad del software
Calidad del softwareCalidad del software
Calidad del software
 
Aplicación de un modelo de procesos rup
Aplicación de un modelo de procesos rupAplicación de un modelo de procesos rup
Aplicación de un modelo de procesos rup
 
Diseño conceptual
Diseño conceptualDiseño conceptual
Diseño conceptual
 
Algebra relacional
Algebra relacionalAlgebra relacional
Algebra relacional
 
Normalización
NormalizaciónNormalización
Normalización
 
Lenguaje sql
Lenguaje sqlLenguaje sql
Lenguaje sql
 
Diseño lógico
Diseño lógicoDiseño lógico
Diseño lógico
 
Modelo relacional
Modelo relacionalModelo relacional
Modelo relacional
 
Sector público
Sector públicoSector público
Sector público
 
Presentacion oferta y demanda
Presentacion oferta y demandaPresentacion oferta y demanda
Presentacion oferta y demanda
 
Cuentas nacionales
Cuentas nacionalesCuentas nacionales
Cuentas nacionales
 
Presentacion elasticidad de la oferta y demanda
Presentacion elasticidad de la oferta y demandaPresentacion elasticidad de la oferta y demanda
Presentacion elasticidad de la oferta y demanda
 
Sistemas de producción
Sistemas de producciónSistemas de producción
Sistemas de producción
 
Presentacion conceptos básicos introduccion a la economia
Presentacion conceptos básicos introduccion a la economiaPresentacion conceptos básicos introduccion a la economia
Presentacion conceptos básicos introduccion a la economia
 
Video 2 herencia y polimorfismo
Video 2 herencia y polimorfismoVideo 2 herencia y polimorfismo
Video 2 herencia y polimorfismo
 
Subprocesamiento Mùltiple
Subprocesamiento MùltipleSubprocesamiento Mùltiple
Subprocesamiento Mùltiple
 
Video 1 metodos y arreglos
Video 1 metodos y arreglosVideo 1 metodos y arreglos
Video 1 metodos y arreglos
 
Arreglos en java
Arreglos en javaArreglos en java
Arreglos en java
 

Similar a Diseño de almacenes de datos

Almacenes de datos, olap y minería de datos
Almacenes de datos, olap y minería de datosAlmacenes de datos, olap y minería de datos
Almacenes de datos, olap y minería de datos
Fiorella Urbina Vera
 
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Titiushko Jazz
 
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Titiushko Jazz
 
Seminario Almacenamiento Datos Hoy - 13/12/10
Seminario Almacenamiento Datos Hoy - 13/12/10Seminario Almacenamiento Datos Hoy - 13/12/10
Seminario Almacenamiento Datos Hoy - 13/12/10
CAESCG.org
 
Data Mart de una área de compras
Data Mart de una área de comprasData Mart de una área de compras
Data Mart de una área de compras
roy_vs
 
Arquitectura de datos empresariales actividad 3
Arquitectura de datos empresariales   actividad 3Arquitectura de datos empresariales   actividad 3
Arquitectura de datos empresariales actividad 3
CarlosTenelema1
 
Que Es Un Datawarehouse
Que Es Un DatawarehouseQue Es Un Datawarehouse
Que Es Un Datawarehouse
guest10616d
 

Similar a Diseño de almacenes de datos (20)

3.1 data warehouse_conceptos_generales
3.1 data warehouse_conceptos_generales3.1 data warehouse_conceptos_generales
3.1 data warehouse_conceptos_generales
 
Almacenes de datos, olap y minería de datos
Almacenes de datos, olap y minería de datosAlmacenes de datos, olap y minería de datos
Almacenes de datos, olap y minería de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
IN Unidad 3: Minería de datos
IN Unidad 3: Minería de datosIN Unidad 3: Minería de datos
IN Unidad 3: Minería de datos
 
Mineria y modelado de datos
Mineria y modelado de datosMineria y modelado de datos
Mineria y modelado de datos
 
Session01.pptx
Session01.pptxSession01.pptx
Session01.pptx
 
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
 
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
 
Seminario Almacenamiento Datos Hoy - 13/12/10
Seminario Almacenamiento Datos Hoy - 13/12/10Seminario Almacenamiento Datos Hoy - 13/12/10
Seminario Almacenamiento Datos Hoy - 13/12/10
 
Portafolio Computación Aplicada
Portafolio Computación AplicadaPortafolio Computación Aplicada
Portafolio Computación Aplicada
 
Seminarios de Analítica Predictiva con Rapid Miner
Seminarios de Analítica Predictiva con Rapid MinerSeminarios de Analítica Predictiva con Rapid Miner
Seminarios de Analítica Predictiva con Rapid Miner
 
Normas icontec carlos andres murCia
Normas icontec carlos andres murCiaNormas icontec carlos andres murCia
Normas icontec carlos andres murCia
 
Determinación del Tamaño Óptimo
Determinación del Tamaño ÓptimoDeterminación del Tamaño Óptimo
Determinación del Tamaño Óptimo
 
Recomendador de artículos científicos basado en metadatos de repositorios dig...
Recomendador de artículos científicos basado en metadatos de repositorios dig...Recomendador de artículos científicos basado en metadatos de repositorios dig...
Recomendador de artículos científicos basado en metadatos de repositorios dig...
 
Data Mart de una área de compras
Data Mart de una área de comprasData Mart de una área de compras
Data Mart de una área de compras
 
Revista TicNews Marzo 2015
Revista TicNews Marzo 2015Revista TicNews Marzo 2015
Revista TicNews Marzo 2015
 
Arquitectura de datos empresariales actividad 3
Arquitectura de datos empresariales   actividad 3Arquitectura de datos empresariales   actividad 3
Arquitectura de datos empresariales actividad 3
 
Big-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptxBig-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptx
 
Fases para la creaciòn de una base de datos
Fases para la creaciòn de una base de datos Fases para la creaciòn de una base de datos
Fases para la creaciòn de una base de datos
 
Que Es Un Datawarehouse
Que Es Un DatawarehouseQue Es Un Datawarehouse
Que Es Un Datawarehouse
 

Más de UTPL UTPL

Análisis de obras contemporáneas de la literatura infantil y juvenil
Análisis de obras contemporáneas de la literatura infantil y juvenilAnálisis de obras contemporáneas de la literatura infantil y juvenil
Análisis de obras contemporáneas de la literatura infantil y juvenil
UTPL UTPL
 
Gestión del capital humano
Gestión del capital humanoGestión del capital humano
Gestión del capital humano
UTPL UTPL
 
Cambio cultural y sostenibilidad institucional
Cambio cultural y sostenibilidad institucionalCambio cultural y sostenibilidad institucional
Cambio cultural y sostenibilidad institucional
UTPL UTPL
 
Análisis de clásicos latinoamericanos de la literatura infantil y juvenil
Análisis de clásicos latinoamericanos de la literatura infantil y juvenilAnálisis de clásicos latinoamericanos de la literatura infantil y juvenil
Análisis de clásicos latinoamericanos de la literatura infantil y juvenil
UTPL UTPL
 
Gerencia de proyectos
Gerencia de proyectosGerencia de proyectos
Gerencia de proyectos
UTPL UTPL
 
Relaciones internacionales y globalización
Relaciones internacionales y globalizaciónRelaciones internacionales y globalización
Relaciones internacionales y globalización
UTPL UTPL
 
Desarrollo organzacional
Desarrollo organzacionalDesarrollo organzacional
Desarrollo organzacional
UTPL UTPL
 
Asesoría de tesis (trabajo de fin de titulación)
Asesoría de tesis (trabajo de fin de titulación)Asesoría de tesis (trabajo de fin de titulación)
Asesoría de tesis (trabajo de fin de titulación)
UTPL UTPL
 
Pedagogía y didáctica de la literatura infantil y juvenil
Pedagogía y didáctica de la literatura infantil y juvenilPedagogía y didáctica de la literatura infantil y juvenil
Pedagogía y didáctica de la literatura infantil y juvenil
UTPL UTPL
 
Ingeniería estratégica financiera
Ingeniería estratégica financieraIngeniería estratégica financiera
Ingeniería estratégica financiera
UTPL UTPL
 
Comunicación y empresa
Comunicación y empresaComunicación y empresa
Comunicación y empresa
UTPL UTPL
 
Análisis de obras clásicas de la literatura infantil y juvenil
Análisis de obras clásicas de la literatura infantil y juvenilAnálisis de obras clásicas de la literatura infantil y juvenil
Análisis de obras clásicas de la literatura infantil y juvenil
UTPL UTPL
 
Relaciones humanas y públicas
Relaciones humanas y públicasRelaciones humanas y públicas
Relaciones humanas y públicas
UTPL UTPL
 
Plan de comunicación empresarial
Plan de comunicación empresarialPlan de comunicación empresarial
Plan de comunicación empresarial
UTPL UTPL
 
Obligaciones y contratos
Obligaciones y contratosObligaciones y contratos
Obligaciones y contratos
UTPL UTPL
 
Historia de la literatura infantily juvenil
Historia de la literatura infantily juvenilHistoria de la literatura infantily juvenil
Historia de la literatura infantily juvenil
UTPL UTPL
 
Derecho sucesorio instituciones y acciones
Derecho sucesorio instituciones y accionesDerecho sucesorio instituciones y acciones
Derecho sucesorio instituciones y acciones
UTPL UTPL
 
Historia cultural infancia y juventud
Historia cultural infancia y juventudHistoria cultural infancia y juventud
Historia cultural infancia y juventud
UTPL UTPL
 
La fiscalía y el procedimiento penal acusatorio
La fiscalía y el procedimiento penal acusatorioLa fiscalía y el procedimiento penal acusatorio
La fiscalía y el procedimiento penal acusatorio
UTPL UTPL
 
Derecho de seguros
Derecho de segurosDerecho de seguros
Derecho de seguros
UTPL UTPL
 

Más de UTPL UTPL (20)

Análisis de obras contemporáneas de la literatura infantil y juvenil
Análisis de obras contemporáneas de la literatura infantil y juvenilAnálisis de obras contemporáneas de la literatura infantil y juvenil
Análisis de obras contemporáneas de la literatura infantil y juvenil
 
Gestión del capital humano
Gestión del capital humanoGestión del capital humano
Gestión del capital humano
 
Cambio cultural y sostenibilidad institucional
Cambio cultural y sostenibilidad institucionalCambio cultural y sostenibilidad institucional
Cambio cultural y sostenibilidad institucional
 
Análisis de clásicos latinoamericanos de la literatura infantil y juvenil
Análisis de clásicos latinoamericanos de la literatura infantil y juvenilAnálisis de clásicos latinoamericanos de la literatura infantil y juvenil
Análisis de clásicos latinoamericanos de la literatura infantil y juvenil
 
Gerencia de proyectos
Gerencia de proyectosGerencia de proyectos
Gerencia de proyectos
 
Relaciones internacionales y globalización
Relaciones internacionales y globalizaciónRelaciones internacionales y globalización
Relaciones internacionales y globalización
 
Desarrollo organzacional
Desarrollo organzacionalDesarrollo organzacional
Desarrollo organzacional
 
Asesoría de tesis (trabajo de fin de titulación)
Asesoría de tesis (trabajo de fin de titulación)Asesoría de tesis (trabajo de fin de titulación)
Asesoría de tesis (trabajo de fin de titulación)
 
Pedagogía y didáctica de la literatura infantil y juvenil
Pedagogía y didáctica de la literatura infantil y juvenilPedagogía y didáctica de la literatura infantil y juvenil
Pedagogía y didáctica de la literatura infantil y juvenil
 
Ingeniería estratégica financiera
Ingeniería estratégica financieraIngeniería estratégica financiera
Ingeniería estratégica financiera
 
Comunicación y empresa
Comunicación y empresaComunicación y empresa
Comunicación y empresa
 
Análisis de obras clásicas de la literatura infantil y juvenil
Análisis de obras clásicas de la literatura infantil y juvenilAnálisis de obras clásicas de la literatura infantil y juvenil
Análisis de obras clásicas de la literatura infantil y juvenil
 
Relaciones humanas y públicas
Relaciones humanas y públicasRelaciones humanas y públicas
Relaciones humanas y públicas
 
Plan de comunicación empresarial
Plan de comunicación empresarialPlan de comunicación empresarial
Plan de comunicación empresarial
 
Obligaciones y contratos
Obligaciones y contratosObligaciones y contratos
Obligaciones y contratos
 
Historia de la literatura infantily juvenil
Historia de la literatura infantily juvenilHistoria de la literatura infantily juvenil
Historia de la literatura infantily juvenil
 
Derecho sucesorio instituciones y acciones
Derecho sucesorio instituciones y accionesDerecho sucesorio instituciones y acciones
Derecho sucesorio instituciones y acciones
 
Historia cultural infancia y juventud
Historia cultural infancia y juventudHistoria cultural infancia y juventud
Historia cultural infancia y juventud
 
La fiscalía y el procedimiento penal acusatorio
La fiscalía y el procedimiento penal acusatorioLa fiscalía y el procedimiento penal acusatorio
La fiscalía y el procedimiento penal acusatorio
 
Derecho de seguros
Derecho de segurosDerecho de seguros
Derecho de seguros
 

Diseño de almacenes de datos

  • 1. BASE DE DATOS AVANZADAS Unidad 8: Diseño de almacenes de datos ESCUELA: Ciencias de la Computación NOMBRES: Ing. Juan Carlos Morocho 1
  • 2. Diseño de almacenes de datos Emprender en el diseño de un almacén de datos no es tarea fácil, pero la utilización de una metodología adecuada será clave. Considerando que un almacén de datos tiene un alcance corporativo, a veces resulta mejor empezar por mercados de datos, pero hay que tener en cuenta que el fin último es un almacén de datos que soporte las necesidades de toda la organización en forma integrada.
  • 3. Metodología de diseño 1. Selección del proceso Ejemplo: Cadena de supermercados. Cadena de supermercados con 300 almacenes en la que se expenden unos 30.000 productos distintos. Actividad: Ventas. La actividad a modelar son las ventas de productos en los almacenes de la cadena
  • 4. Metodología de diseño 2. Selección de la granularidad Ejemplo: Cadena de supermercados. Gránulo: “se desea almacenar información sobre las ventas diarias de cada producto en cada almacén de la cadena”. Gránulo: • Define el significado de las tuplas de la tabla de hechos. • Determina las dimensiones básicas del esquema
  • 5. Metodología de diseño 3. Identificación y conformación de las dimensiones Ejemplo: Cadena de supermercados. Definición de Dimensiones •Tiempo gránulo básicas •Producto •Establecimiento
  • 6. Metodología de diseño 4. Selección de los hechos Ejemplo: Cadena de supermercados. Gránulo: “se desea almacenar información sobre las ventas diarias de cada producto en cada establecimiento de la cadena”. • Importe total de las ventas del producto en el día. • Número total de unidades vendidas del producto en el día. • Número total de clientes distintos que han comprado el producto en el día.
  • 7. Metodología de diseño 5. Almacenamiento de los valores precalculados en la tabla de hechos. Valor precalculado
  • 8. Metodología de diseño 6. Terminación de las tablas de dimensión La idea es añadir descripciones textuales a las dimensiones hasta ahora definidas, para que sean entendibles para los usuarios. En lugar de “nro_clientes”, una descripción más inituitiva sería “Total de clientes”.
  • 9. Metodología de diseño 7. Selección de la duración de la base de datos. Definir la cantidad de tiempo con la cual se va a trabajar o a contrastar los datos de las tablas de hechos. Generalmente se hacen comparaciones de dos años atrás, pero por temas legales en otros casos se trabaja con datos de hasta cinco años atrás.
  • 10. Metodología de diseño 8. Control de las dimensiones lentamente cambiantes Tipo 1: Sobreescribe un atributo de dimensión modificado. Tipo 2: Un atributo de dimensión modificado hace que se cree un nuevo registro de dimensión. Tipo 3: Un atributo de dimensión modificado hace que se cree un atributo alternativo.
  • 11. Metodología de diseño 9. Selección de las prioridades de consulta y de los modos de consulta Esto es importante ya que hay que considerar que la consultas siempre manejan gran cantidad de datos, calculan subtotales, ordenan resultados, por lo que consume una cantidad considerable de recursos.
  • 12. Trabajos citados  Hernández Orallo, J. (s.f.). Curso: Análisis y Extracción de Conocimiento en Sistemas de Información. Recuperado el 5 de Marzo de 2012, de Departamento de Sistemas Informáticos y Computación: http://users.dsic.upv.es/~jorallo/cursoDWD M/dwdm-II.pdf 12
  • 13. Información de contacto: E-mail: jcmorocho@utpl.edu.ec Cuenta en skype: jcmorocho
  • 14. 14

Notas del editor

  1. utpl
  2. utpl
  3. utpl
  4. utpl
  5. utpl
  6. utpl
  7. utpl
  8. utpl
  9. utpl
  10. utpl
  11. utpl
  12. utpl
  13. utpl
  14. utpl