SlideShare a Scribd company logo
1 of 30
DATAWAREHOUSE
Almacenes y Minería de Datos 2
Definición
• Datawarehouse (Almacen de datos) se
define como una colección de datos que
verifican las siguientes propiedades:
– Está orientado (a un tema) a objetos
– Datos integrados
– No volátiles
– Variante en el tiempo
que surgieron como una herramienta de
soporte para la toma de decisiones a nivel
gerencial
Almacenes y Minería de Datos 3
Explicación de la definición
• Orientado hacia temas: los datos se
almacenan y agrupan por temas de interés.
Almacenes y Minería de Datos 4
Explicación de la definición
• Datos integrados: el almacén de datos
integra datos que provienen de varias
fuentes. Partimos de una base de datos
(operacional) y mediante un proceso de
carga de datos hacemos el Datawarehouse.
El proceso de carga es lo más complicado
por problemas de codificación, medidas de
los atributos… de las bases de datos.
BD
BD
BD
DW
CARGA
Almacenes y Minería de Datos 5
Explicación de la definición
• No volátiles: son estables, una vez
almacenados los datos no se modifican.
BD DWD
W
SELECT
INSERT
UPDATE
DELETE
REPORT
S
SELECT
CARGA
Almacenes y Minería de Datos 6
Explicación de la definición
• Variante en el tiempo: los datos contienen
información sobre la fecha de los mismos,
porque se hacen cargas de datos
continuamente. Cuando los datos van
cambiando, se actualizan los históricos y se
guardan en ficheros temporales. Siempre va
haber una variable tiempo.
TIEMPO
# id_tiempo
* periodo
Almacenes y Minería de Datos 7
Características
• Podemos resumir las características de
un Datawarehouse:
– Trabaja con datos de negocio
– Orientado a un sujeto
– Almacena datos actuales orientado a un
histórico (actual + histórico)
– Datos más bien resumidos (no información
detallada)
Almacenes y Minería de Datos 8
DIFERENCIAS
BD
OPERACIONAL
- Datos
operacionales
- Orientado a
aplicaciones
- Datos Actuales
- Datos Detallados
- Datos en continuo
cambio
DATAWAREHOUS
E
- Datos de negocio
- Orientado al sujeto
- Actuales +
Histórico
- Datos Resumidos
- Datos Estables
Almacenes y Minería de Datos 9
GESTOR
CARGA
ARQUITECTURA DW
GESTOR
ALMACENAMIENT
O
GESTOR
CONSULTAS
BD
operacional
Partimos de una BD operacional y se basa en 3 módulos
Almacenes y Minería de Datos 10
GESTOR DE CARGA
• Permite hacer la carga. Como dificultades
nos podemos encontrar:
– La integración de los datos
– Elección del momento de la carga
– El tiempo de carga sea el mínimo posible
– Buen diccionario de datos o METADATA (para
evitar cometer errores en la carga)
– Diseño de procedimientos PL/SQL
Almacenes y Minería de Datos 11
GESTOR DE ALMACENAMIENTO
• Se encarga del almacenamiento, de la
estructura,….
Existe una tabla llamada FACT (Hecho) y unas
tablas llamadas dimensiones o tablas
dimensionales.
Entre la tabla FACT y las tablas dimensionales
suele haber relaciones 1:N
Este modelo tiene forma de estrella por eso se
denomina MODELO STAR
Almacenes y Minería de Datos 12
MODELO STAR
FACT
DIM_1
DIM_2
DIM_TIEMPO
DIM_3
# PK4
# PK1
# PK2
# PK3
# PK1
# PK2
# PK3
# PK4
*campoA
*campoB
Almacenes y Minería de Datos 13
GESTOR DE CONSULTAS
• Las consultas se hacen sobre la tabla
FACT. También se encarga de los
perfiles, pues las consultas (reports)
serán diferentes dependiendo del
usuario y sus necesidades.
Almacenes y Minería de Datos 14
Ejemplo 1:
CATEGORIAS_PROF
# c_categoria
* descripción
* salario_min
* salario_max
USUARIOS
# c_usuario
* nombre
* apellido1
* apellido2
* c_categoria
* direccion
USU_OFERTAS
# c_categoria
# c_oferta
* salario_deseado
OFERTAS
# c_oferta
* descripción
* salario_min
* salario_max
* fx_alta
1
n
11
nn
Almacenes y Minería de Datos 15
Ejemplo 1:
# PK1CATEGORIAS_PR
OF
# c_categoria
* descripción
* salario_min
* salario_max
USUARIOS
# c_usuario
* nombre
* apellido1
* apellido2
* c_categoria
* direccion
OFERTAS
# c_oferta
* descripción
* salario_min
* salario_max
* fx_alta
TIEMPO
# c_tiempo
* descripcion
USU_OFERTAS
# c_usuario
# c_categoria
# c_oferta
* salario_deseado
Almacenes y Minería de Datos 16
REPORTS
• ¿Cuántos usuarios se han apuntado a las
ofertas de empleo del mes de enero?
SELECT count(*)
FROM USUARIOS_OFERTAS U, OFERTAS O
WHERE U.c_oferta=o.c_oferta
AND O.fx_alta BETWEEN (’01/01/07’,`31/01/07´)
17
Arquitectura de un Almacén de Datos
EJEMPLO
Organización: Cadena de supermercados.
Actividad objeto de análisis: ventas de productos.
Información registrada sobre una venta: “del producto “Tauritón
33cl” se han vendido en el almacén “Almacén nro.1” el día 17/7/2003, 5
unidades por un importe de 103,19 dolares.”
Para hacer el análisis no interesa la venta individual (ticket)
realizada a un cliente sino las ventas diarias de productos en
los distintos almacenes de la cadena.
18
Arquitectura de un Almacén de Datos
Ventasimporte
unidades
Almacén
Almacén
Ciudad
Región
Tipo
Producto
Departamento
Nro_producto
Categoría
Marca
Tipo
Descripción
Tiempo
Día
Mes
Semana
Año
Trimestre
19
Arquitectura de un Almacén de Datos
Ventasimporte
unidades
Departamento
Nro_producto
Categoría
Marca
Tipo
Día
Mes
Semana
Almacén
Ciudad
Región
Tipo
Año
Descripción
Actividad que es objeto de
análisis con los indicadores
que interesa analizar
Dimensiones (puntos de
vista) desde los que se
puede analizar la actividad.
Producto
TiempoAlmacén
Trimestre
20
Arquitectura de un Almacén de Datos
Modelo multidimensional:
 en un esquema multidimensional se representa una actividad
que es objeto de análisis (hecho) y las dimensiones que
caracterizan la actividad (dimensiones).
la información relevante sobre el hecho (actividad) se
representa por un conjunto de indicadores (medidas o atributos
de hecho).
la información descriptiva de cada dimensión se representa por
un conjunto de atributos (atributos de dimensión).
21
Arquitectura de un Almacén de Datos
Ventas
importe
unidades
Almacén
Almacén
Ciudad
Región
Tipo
Producto
Departamento
Nro_producto
Categoría
Marca
Tipo
Descripción
hecho
medidas
dimensión
atributos
Tiempo
Día
Mes
Semana
Año
Trimestre
22
Arquitectura de un Almacén de Datos
Entre los atributos de una dimensión se definen jerarquías
departamento
almacén
ciudad región
tipo
día mes año
Producto
Almacén
Tiempo
nro. producto categoría
trimestre
semana
23
Arquitectura de un Almacén de Datos
Este esquema multidimensional recibe varios nombres:
• estrella: si la jerarquía de dimensiones es lineal
• estrella jerárquica o copo de nieve: si la jerarquía no es lineal.
PERSONAL
VENTAS
tiempo
tiempo
producto
lugar
proyecto
equipo
24
Herramientas OLAP
una consulta a un almacén de datos consiste generalmente
en la obtención de medidas sobre los hechos parametrizadas
por atributos de las dimensiones y restringidas por
condiciones impuestas sobre las dimensiones
¿ “Importe total de las ventas durante este año de los productos
del departamento Bebidas, por trimestre y por categoría” ?.
Restricciones: productos del departamento Bebidas, ventas durante este año
medida hecho
Parámetros de la consulta: por categoría de producto y por trimestre
25
Herramientas OLAP
“2002”
“Bebidas”
Producto
Tiempo
Almacén
Ventas
importe
unidades
Departamento
Nro_producto
Categoría
Marca
Tipo
Día
Mes
Día de la
semana
Almacén
Ciudad
Región
Tipo
Año
“Importe total de ventas en
este año, del departamento
de “Bebidas”, por categoría y
trimestre”
Trimestre
26
Diseño de un Almacén de Datos
id_dim1
id_dim2
id_dim3
...
id_dim n
....
(hechos)
Dim3
Dim2
Dim1
tabla de
hechos
tabla
Dimensión 3
tabla
Dimensión 1
tabla
Dimensión 2 tabla
Dimensión nDimn
27
Diseño de un Almacén de Datos
producto
día
almacén
ventas
tiempo
almacén
producto
id_producto
id_fecha
id_almacén
.....
.....
......
tabla de
hechos
la clave primaria* está
formada por los
identificadores de las
dimensiones básicas.
datos (medidas) sobre
las ventas diarias de un
producto en un almacén.
* pueden existir excepciones a esta regla general
28
Diseño de un Almacén de Datos
id_establec
nro_establec
nombre
dirección
distrito
ciudad
país
tlfno
fax
superficie
tipo_almacén
...
Establecimiento
id_fecha
día
semana
mes
año
día_semana
día_mes
trimestre
festivo
....
Tiempo
id_producto
nro_producto
descripción
marca
subcategoría
categoría
departamento
peso
unidades_peso
tipo_envase
dietético
...
Producto
29
Diseño de un Almacén de Datos
id_fecha
id_producto
id_establec
...
...
...
Ventas
id_establec
nro_establec
nombre
dirección
distrito
ciudad
país
tlfno
fax
superficie
tipo_almacén
...
id_producto
nro_producto
descripción
marca
subcategoría
categoría
departamento
peso
unidades_peso
tipo_envase
dietético
...
Establecimiento
Producto
id_fecha
día
semana
mes
año
día_semana
día_mes
trimestre
festivo
....
Tiempo
30
Líneas de Investigación Abiertas
 Diseño de Almacenes de Datos: modelos conceptuales,
metodogías de diseño.
 Carga y ETL: recuperación de fallos durante la carga.
Planificación de cargas y refrescos.
 Limpieza y Transformación
 Mantenimiento de Almacenes de Datos: mantenimiento
de vistas materializadas.
 Implementación de Almacenes de Datos.
 Diseño Físico, optimizaciones para ROLAP, estructuras
para MOLAP.
 Repartición de tareas OLAP entre el cliente y el servidor.

More Related Content

What's hot

Data WareHouse. Introduccion
Data WareHouse. IntroduccionData WareHouse. Introduccion
Data WareHouse. IntroduccionRicardo Mendoza
 
05 exposicion data warehouse no. 5
05   exposicion data warehouse              no. 505   exposicion data warehouse              no. 5
05 exposicion data warehouse no. 5Gustavo Cuxum
 
DATA WAREHOUSE
DATA WAREHOUSEDATA WAREHOUSE
DATA WAREHOUSEGrupo Dos
 
Data warehouse
Data warehouseData warehouse
Data warehousemaggybe
 
Datawarehouse
DatawarehouseDatawarehouse
Datawarehouseshady85
 
Data mart-data-warehouse-data-mining
Data mart-data-warehouse-data-miningData mart-data-warehouse-data-mining
Data mart-data-warehouse-data-miningNintendo
 
Fundamentos de DataWareHouse - FISI - UNMSM - DataWareHouse
Fundamentos de DataWareHouse - FISI - UNMSM - DataWareHouseFundamentos de DataWareHouse - FISI - UNMSM - DataWareHouse
Fundamentos de DataWareHouse - FISI - UNMSM - DataWareHouseJulio Pari
 
Fundamentos de DataWarehouse
Fundamentos de DataWarehouseFundamentos de DataWarehouse
Fundamentos de DataWarehouseHermes Romero
 
Que Es Un Datawarehouse
Que Es Un DatawarehouseQue Es Un Datawarehouse
Que Es Un Datawarehouseguest10616d
 
Arquitectura de un dw
Arquitectura de un dwArquitectura de un dw
Arquitectura de un dwMax Santiago
 
Data mart-data-warehouse-data-mining
Data mart-data-warehouse-data-miningData mart-data-warehouse-data-mining
Data mart-data-warehouse-data-miningNintendo
 
Diseño de almacenes de datos
Diseño de almacenes de datosDiseño de almacenes de datos
Diseño de almacenes de datosUTPL UTPL
 

What's hot (20)

Data warehouse
Data warehouseData warehouse
Data warehouse
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Almacen de datos
Almacen de datosAlmacen de datos
Almacen de datos
 
Data WareHouse. Introduccion
Data WareHouse. IntroduccionData WareHouse. Introduccion
Data WareHouse. Introduccion
 
05 exposicion data warehouse no. 5
05   exposicion data warehouse              no. 505   exposicion data warehouse              no. 5
05 exposicion data warehouse no. 5
 
DATA WAREHOUSE
DATA WAREHOUSEDATA WAREHOUSE
DATA WAREHOUSE
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Datawarehouse
DatawarehouseDatawarehouse
Datawarehouse
 
Data mart-data-warehouse-data-mining
Data mart-data-warehouse-data-miningData mart-data-warehouse-data-mining
Data mart-data-warehouse-data-mining
 
Fundamentos de DataWareHouse - FISI - UNMSM - DataWareHouse
Fundamentos de DataWareHouse - FISI - UNMSM - DataWareHouseFundamentos de DataWareHouse - FISI - UNMSM - DataWareHouse
Fundamentos de DataWareHouse - FISI - UNMSM - DataWareHouse
 
Fundamentos de DataWarehouse
Fundamentos de DataWarehouseFundamentos de DataWarehouse
Fundamentos de DataWarehouse
 
Que Es Un Datawarehouse
Que Es Un DatawarehouseQue Es Un Datawarehouse
Que Es Un Datawarehouse
 
Almacén de datos
Almacén de datosAlmacén de datos
Almacén de datos
 
Almacenes de datos
Almacenes de datosAlmacenes de datos
Almacenes de datos
 
Arquitectura de un dw
Arquitectura de un dwArquitectura de un dw
Arquitectura de un dw
 
Data mart
Data martData mart
Data mart
 
Data mart-data-warehouse-data-mining
Data mart-data-warehouse-data-miningData mart-data-warehouse-data-mining
Data mart-data-warehouse-data-mining
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Diseño de un Datamart
Diseño de un DatamartDiseño de un Datamart
Diseño de un Datamart
 
Diseño de almacenes de datos
Diseño de almacenes de datosDiseño de almacenes de datos
Diseño de almacenes de datos
 

Similar to Datawarehouse práctica 6

1 gestión de informacion
1 gestión de informacion1 gestión de informacion
1 gestión de informacionOscar Correa
 
BusinessIntelligence Introduction
BusinessIntelligence IntroductionBusinessIntelligence Introduction
BusinessIntelligence Introductionandres hurtado
 
2.1 fundamentos de data warehousing
2.1 fundamentos de data warehousing2.1 fundamentos de data warehousing
2.1 fundamentos de data warehousingLuis
 
2 Desa Sincrono 2 Caso Modelamiento.doc
2 Desa Sincrono 2 Caso Modelamiento.doc2 Desa Sincrono 2 Caso Modelamiento.doc
2 Desa Sincrono 2 Caso Modelamiento.docaldair441257
 
Fundamentos de Sistemas de Base de Datos (Capítulo 29 y 30)
Fundamentos de Sistemas de Base de Datos (Capítulo 29 y 30)Fundamentos de Sistemas de Base de Datos (Capítulo 29 y 30)
Fundamentos de Sistemas de Base de Datos (Capítulo 29 y 30)Karina Lucio
 
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)Titiushko Jazz
 
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)Titiushko Jazz
 
MINERIA DE DATOS
MINERIA DE DATOSMINERIA DE DATOS
MINERIA DE DATOSLosMorales
 
Data Warehouse en las empresas y negocios.pdf
Data Warehouse en las empresas y negocios.pdfData Warehouse en las empresas y negocios.pdf
Data Warehouse en las empresas y negocios.pdfexpertoleonelmartine
 
Clase 02 - Base de Datos Estratégica [Inteligencia de Negocios en las Organiz...
Clase 02 - Base de Datos Estratégica [Inteligencia de Negocios en las Organiz...Clase 02 - Base de Datos Estratégica [Inteligencia de Negocios en las Organiz...
Clase 02 - Base de Datos Estratégica [Inteligencia de Negocios en las Organiz...Julio Antonio Huaman Chuque
 
Mejores prácticas de Data Warehouse con SQL Server
Mejores prácticas de Data Warehouse con SQL ServerMejores prácticas de Data Warehouse con SQL Server
Mejores prácticas de Data Warehouse con SQL ServerSpanishPASSVC
 
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)Titiushko Jazz
 
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)Titiushko Jazz
 
IN Unidad 2: Infraestructuras y arquitecturas de inteligencia de negocios
IN Unidad 2: Infraestructuras y arquitecturas de inteligencia de negociosIN Unidad 2: Infraestructuras y arquitecturas de inteligencia de negocios
IN Unidad 2: Infraestructuras y arquitecturas de inteligencia de negociosFranklin Parrales Bravo
 

Similar to Datawarehouse práctica 6 (20)

1 gestión de informacion
1 gestión de informacion1 gestión de informacion
1 gestión de informacion
 
Lab 01 modelado
Lab 01   modeladoLab 01   modelado
Lab 01 modelado
 
Kdd fase1
Kdd fase1Kdd fase1
Kdd fase1
 
BusinessIntelligence Introduction
BusinessIntelligence IntroductionBusinessIntelligence Introduction
BusinessIntelligence Introduction
 
2.1 fundamentos de data warehousing
2.1 fundamentos de data warehousing2.1 fundamentos de data warehousing
2.1 fundamentos de data warehousing
 
Datawarehouse
DatawarehouseDatawarehouse
Datawarehouse
 
2 Desa Sincrono 2 Caso Modelamiento.doc
2 Desa Sincrono 2 Caso Modelamiento.doc2 Desa Sincrono 2 Caso Modelamiento.doc
2 Desa Sincrono 2 Caso Modelamiento.doc
 
Fundamentos de Sistemas de Base de Datos (Capítulo 29 y 30)
Fundamentos de Sistemas de Base de Datos (Capítulo 29 y 30)Fundamentos de Sistemas de Base de Datos (Capítulo 29 y 30)
Fundamentos de Sistemas de Base de Datos (Capítulo 29 y 30)
 
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
 
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
 
MINERIA DE DATOS
MINERIA DE DATOSMINERIA DE DATOS
MINERIA DE DATOS
 
Data ware house
Data ware houseData ware house
Data ware house
 
Data Warehouse en las empresas y negocios.pdf
Data Warehouse en las empresas y negocios.pdfData Warehouse en las empresas y negocios.pdf
Data Warehouse en las empresas y negocios.pdf
 
Clase 02 - Base de Datos Estratégica [Inteligencia de Negocios en las Organiz...
Clase 02 - Base de Datos Estratégica [Inteligencia de Negocios en las Organiz...Clase 02 - Base de Datos Estratégica [Inteligencia de Negocios en las Organiz...
Clase 02 - Base de Datos Estratégica [Inteligencia de Negocios en las Organiz...
 
Mejores prácticas de Data Warehouse con SQL Server
Mejores prácticas de Data Warehouse con SQL ServerMejores prácticas de Data Warehouse con SQL Server
Mejores prácticas de Data Warehouse con SQL Server
 
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
 
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
 
1DATA WAREHOUSE.ppt
1DATA WAREHOUSE.ppt1DATA WAREHOUSE.ppt
1DATA WAREHOUSE.ppt
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
IN Unidad 2: Infraestructuras y arquitecturas de inteligencia de negocios
IN Unidad 2: Infraestructuras y arquitecturas de inteligencia de negociosIN Unidad 2: Infraestructuras y arquitecturas de inteligencia de negocios
IN Unidad 2: Infraestructuras y arquitecturas de inteligencia de negocios
 

Recently uploaded

LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptxLAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptxAlexander López
 
Mapa-conceptual-del-Origen-del-Universo-3.pptx
Mapa-conceptual-del-Origen-del-Universo-3.pptxMapa-conceptual-del-Origen-del-Universo-3.pptx
Mapa-conceptual-del-Origen-del-Universo-3.pptxMidwarHenryLOZAFLORE
 
AREA TECNOLOGIA E INFORMATICA TRABAJO EN EQUIPO
AREA TECNOLOGIA E INFORMATICA TRABAJO EN EQUIPOAREA TECNOLOGIA E INFORMATICA TRABAJO EN EQUIPO
AREA TECNOLOGIA E INFORMATICA TRABAJO EN EQUIPOnarvaezisabella21
 
El uso de las tic en la vida ,lo importante que son
El uso de las tic en la vida ,lo importante  que sonEl uso de las tic en la vida ,lo importante  que son
El uso de las tic en la vida ,lo importante que son241514984
 
Actividad integradora 6 CREAR UN RECURSO MULTIMEDIA
Actividad integradora 6    CREAR UN RECURSO MULTIMEDIAActividad integradora 6    CREAR UN RECURSO MULTIMEDIA
Actividad integradora 6 CREAR UN RECURSO MULTIMEDIA241531640
 
La Electricidad Y La Electrónica Trabajo Tecnología.pdf
La Electricidad Y La Electrónica Trabajo Tecnología.pdfLa Electricidad Y La Electrónica Trabajo Tecnología.pdf
La Electricidad Y La Electrónica Trabajo Tecnología.pdfjeondanny1997
 
Segunda ley de la termodinámica TERMODINAMICA.pptx
Segunda ley de la termodinámica TERMODINAMICA.pptxSegunda ley de la termodinámica TERMODINAMICA.pptx
Segunda ley de la termodinámica TERMODINAMICA.pptxMariaBurgos55
 
GonzalezGonzalez_Karina_M1S3AI6... .pptx
GonzalezGonzalez_Karina_M1S3AI6... .pptxGonzalezGonzalez_Karina_M1S3AI6... .pptx
GonzalezGonzalez_Karina_M1S3AI6... .pptx241523733
 
Tecnologias Starlink para el mundo tec.pptx
Tecnologias Starlink para el mundo tec.pptxTecnologias Starlink para el mundo tec.pptx
Tecnologias Starlink para el mundo tec.pptxGESTECPERUSAC
 
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptxMedidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptxaylincamaho
 
Presentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidadPresentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidadMiguelAngelVillanuev48
 
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptx
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptxCrear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptx
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptxNombre Apellidos
 
Excel (1) tecnologia.pdf trabajo Excel taller
Excel  (1) tecnologia.pdf trabajo Excel tallerExcel  (1) tecnologia.pdf trabajo Excel taller
Excel (1) tecnologia.pdf trabajo Excel tallerValentinaTabares11
 
El uso de las TIC's en la vida cotidiana.
El uso de las TIC's en la vida cotidiana.El uso de las TIC's en la vida cotidiana.
El uso de las TIC's en la vida cotidiana.241514949
 
FloresMorales_Montserrath_M1S3AI6 (1).pptx
FloresMorales_Montserrath_M1S3AI6 (1).pptxFloresMorales_Montserrath_M1S3AI6 (1).pptx
FloresMorales_Montserrath_M1S3AI6 (1).pptx241522327
 
Explorando la historia y funcionamiento de la memoria ram
Explorando la historia y funcionamiento de la memoria ramExplorando la historia y funcionamiento de la memoria ram
Explorando la historia y funcionamiento de la memoria ramDIDIERFERNANDOGUERRE
 
LUXOMETRO EN SALUD OCUPACIONAL(FINAL).ppt
LUXOMETRO EN SALUD OCUPACIONAL(FINAL).pptLUXOMETRO EN SALUD OCUPACIONAL(FINAL).ppt
LUXOMETRO EN SALUD OCUPACIONAL(FINAL).pptchaverriemily794
 
dokumen.tips_36274588-sistema-heui-eui.ppt
dokumen.tips_36274588-sistema-heui-eui.pptdokumen.tips_36274588-sistema-heui-eui.ppt
dokumen.tips_36274588-sistema-heui-eui.pptMiguelAtencio10
 
Google-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptx
Google-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptxGoogle-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptx
Google-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptxAlexander López
 
Hernandez_Hernandez_Practica web de la sesion 11.pptx
Hernandez_Hernandez_Practica web de la sesion 11.pptxHernandez_Hernandez_Practica web de la sesion 11.pptx
Hernandez_Hernandez_Practica web de la sesion 11.pptxJOSEMANUELHERNANDEZH11
 

Recently uploaded (20)

LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptxLAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
 
Mapa-conceptual-del-Origen-del-Universo-3.pptx
Mapa-conceptual-del-Origen-del-Universo-3.pptxMapa-conceptual-del-Origen-del-Universo-3.pptx
Mapa-conceptual-del-Origen-del-Universo-3.pptx
 
AREA TECNOLOGIA E INFORMATICA TRABAJO EN EQUIPO
AREA TECNOLOGIA E INFORMATICA TRABAJO EN EQUIPOAREA TECNOLOGIA E INFORMATICA TRABAJO EN EQUIPO
AREA TECNOLOGIA E INFORMATICA TRABAJO EN EQUIPO
 
El uso de las tic en la vida ,lo importante que son
El uso de las tic en la vida ,lo importante  que sonEl uso de las tic en la vida ,lo importante  que son
El uso de las tic en la vida ,lo importante que son
 
Actividad integradora 6 CREAR UN RECURSO MULTIMEDIA
Actividad integradora 6    CREAR UN RECURSO MULTIMEDIAActividad integradora 6    CREAR UN RECURSO MULTIMEDIA
Actividad integradora 6 CREAR UN RECURSO MULTIMEDIA
 
La Electricidad Y La Electrónica Trabajo Tecnología.pdf
La Electricidad Y La Electrónica Trabajo Tecnología.pdfLa Electricidad Y La Electrónica Trabajo Tecnología.pdf
La Electricidad Y La Electrónica Trabajo Tecnología.pdf
 
Segunda ley de la termodinámica TERMODINAMICA.pptx
Segunda ley de la termodinámica TERMODINAMICA.pptxSegunda ley de la termodinámica TERMODINAMICA.pptx
Segunda ley de la termodinámica TERMODINAMICA.pptx
 
GonzalezGonzalez_Karina_M1S3AI6... .pptx
GonzalezGonzalez_Karina_M1S3AI6... .pptxGonzalezGonzalez_Karina_M1S3AI6... .pptx
GonzalezGonzalez_Karina_M1S3AI6... .pptx
 
Tecnologias Starlink para el mundo tec.pptx
Tecnologias Starlink para el mundo tec.pptxTecnologias Starlink para el mundo tec.pptx
Tecnologias Starlink para el mundo tec.pptx
 
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptxMedidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
 
Presentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidadPresentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidad
 
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptx
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptxCrear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptx
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptx
 
Excel (1) tecnologia.pdf trabajo Excel taller
Excel  (1) tecnologia.pdf trabajo Excel tallerExcel  (1) tecnologia.pdf trabajo Excel taller
Excel (1) tecnologia.pdf trabajo Excel taller
 
El uso de las TIC's en la vida cotidiana.
El uso de las TIC's en la vida cotidiana.El uso de las TIC's en la vida cotidiana.
El uso de las TIC's en la vida cotidiana.
 
FloresMorales_Montserrath_M1S3AI6 (1).pptx
FloresMorales_Montserrath_M1S3AI6 (1).pptxFloresMorales_Montserrath_M1S3AI6 (1).pptx
FloresMorales_Montserrath_M1S3AI6 (1).pptx
 
Explorando la historia y funcionamiento de la memoria ram
Explorando la historia y funcionamiento de la memoria ramExplorando la historia y funcionamiento de la memoria ram
Explorando la historia y funcionamiento de la memoria ram
 
LUXOMETRO EN SALUD OCUPACIONAL(FINAL).ppt
LUXOMETRO EN SALUD OCUPACIONAL(FINAL).pptLUXOMETRO EN SALUD OCUPACIONAL(FINAL).ppt
LUXOMETRO EN SALUD OCUPACIONAL(FINAL).ppt
 
dokumen.tips_36274588-sistema-heui-eui.ppt
dokumen.tips_36274588-sistema-heui-eui.pptdokumen.tips_36274588-sistema-heui-eui.ppt
dokumen.tips_36274588-sistema-heui-eui.ppt
 
Google-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptx
Google-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptxGoogle-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptx
Google-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptx
 
Hernandez_Hernandez_Practica web de la sesion 11.pptx
Hernandez_Hernandez_Practica web de la sesion 11.pptxHernandez_Hernandez_Practica web de la sesion 11.pptx
Hernandez_Hernandez_Practica web de la sesion 11.pptx
 

Datawarehouse práctica 6

  • 2. Almacenes y Minería de Datos 2 Definición • Datawarehouse (Almacen de datos) se define como una colección de datos que verifican las siguientes propiedades: – Está orientado (a un tema) a objetos – Datos integrados – No volátiles – Variante en el tiempo que surgieron como una herramienta de soporte para la toma de decisiones a nivel gerencial
  • 3. Almacenes y Minería de Datos 3 Explicación de la definición • Orientado hacia temas: los datos se almacenan y agrupan por temas de interés.
  • 4. Almacenes y Minería de Datos 4 Explicación de la definición • Datos integrados: el almacén de datos integra datos que provienen de varias fuentes. Partimos de una base de datos (operacional) y mediante un proceso de carga de datos hacemos el Datawarehouse. El proceso de carga es lo más complicado por problemas de codificación, medidas de los atributos… de las bases de datos. BD BD BD DW CARGA
  • 5. Almacenes y Minería de Datos 5 Explicación de la definición • No volátiles: son estables, una vez almacenados los datos no se modifican. BD DWD W SELECT INSERT UPDATE DELETE REPORT S SELECT CARGA
  • 6. Almacenes y Minería de Datos 6 Explicación de la definición • Variante en el tiempo: los datos contienen información sobre la fecha de los mismos, porque se hacen cargas de datos continuamente. Cuando los datos van cambiando, se actualizan los históricos y se guardan en ficheros temporales. Siempre va haber una variable tiempo. TIEMPO # id_tiempo * periodo
  • 7. Almacenes y Minería de Datos 7 Características • Podemos resumir las características de un Datawarehouse: – Trabaja con datos de negocio – Orientado a un sujeto – Almacena datos actuales orientado a un histórico (actual + histórico) – Datos más bien resumidos (no información detallada)
  • 8. Almacenes y Minería de Datos 8 DIFERENCIAS BD OPERACIONAL - Datos operacionales - Orientado a aplicaciones - Datos Actuales - Datos Detallados - Datos en continuo cambio DATAWAREHOUS E - Datos de negocio - Orientado al sujeto - Actuales + Histórico - Datos Resumidos - Datos Estables
  • 9. Almacenes y Minería de Datos 9 GESTOR CARGA ARQUITECTURA DW GESTOR ALMACENAMIENT O GESTOR CONSULTAS BD operacional Partimos de una BD operacional y se basa en 3 módulos
  • 10. Almacenes y Minería de Datos 10 GESTOR DE CARGA • Permite hacer la carga. Como dificultades nos podemos encontrar: – La integración de los datos – Elección del momento de la carga – El tiempo de carga sea el mínimo posible – Buen diccionario de datos o METADATA (para evitar cometer errores en la carga) – Diseño de procedimientos PL/SQL
  • 11. Almacenes y Minería de Datos 11 GESTOR DE ALMACENAMIENTO • Se encarga del almacenamiento, de la estructura,…. Existe una tabla llamada FACT (Hecho) y unas tablas llamadas dimensiones o tablas dimensionales. Entre la tabla FACT y las tablas dimensionales suele haber relaciones 1:N Este modelo tiene forma de estrella por eso se denomina MODELO STAR
  • 12. Almacenes y Minería de Datos 12 MODELO STAR FACT DIM_1 DIM_2 DIM_TIEMPO DIM_3 # PK4 # PK1 # PK2 # PK3 # PK1 # PK2 # PK3 # PK4 *campoA *campoB
  • 13. Almacenes y Minería de Datos 13 GESTOR DE CONSULTAS • Las consultas se hacen sobre la tabla FACT. También se encarga de los perfiles, pues las consultas (reports) serán diferentes dependiendo del usuario y sus necesidades.
  • 14. Almacenes y Minería de Datos 14 Ejemplo 1: CATEGORIAS_PROF # c_categoria * descripción * salario_min * salario_max USUARIOS # c_usuario * nombre * apellido1 * apellido2 * c_categoria * direccion USU_OFERTAS # c_categoria # c_oferta * salario_deseado OFERTAS # c_oferta * descripción * salario_min * salario_max * fx_alta 1 n 11 nn
  • 15. Almacenes y Minería de Datos 15 Ejemplo 1: # PK1CATEGORIAS_PR OF # c_categoria * descripción * salario_min * salario_max USUARIOS # c_usuario * nombre * apellido1 * apellido2 * c_categoria * direccion OFERTAS # c_oferta * descripción * salario_min * salario_max * fx_alta TIEMPO # c_tiempo * descripcion USU_OFERTAS # c_usuario # c_categoria # c_oferta * salario_deseado
  • 16. Almacenes y Minería de Datos 16 REPORTS • ¿Cuántos usuarios se han apuntado a las ofertas de empleo del mes de enero? SELECT count(*) FROM USUARIOS_OFERTAS U, OFERTAS O WHERE U.c_oferta=o.c_oferta AND O.fx_alta BETWEEN (’01/01/07’,`31/01/07´)
  • 17. 17 Arquitectura de un Almacén de Datos EJEMPLO Organización: Cadena de supermercados. Actividad objeto de análisis: ventas de productos. Información registrada sobre una venta: “del producto “Tauritón 33cl” se han vendido en el almacén “Almacén nro.1” el día 17/7/2003, 5 unidades por un importe de 103,19 dolares.” Para hacer el análisis no interesa la venta individual (ticket) realizada a un cliente sino las ventas diarias de productos en los distintos almacenes de la cadena.
  • 18. 18 Arquitectura de un Almacén de Datos Ventasimporte unidades Almacén Almacén Ciudad Región Tipo Producto Departamento Nro_producto Categoría Marca Tipo Descripción Tiempo Día Mes Semana Año Trimestre
  • 19. 19 Arquitectura de un Almacén de Datos Ventasimporte unidades Departamento Nro_producto Categoría Marca Tipo Día Mes Semana Almacén Ciudad Región Tipo Año Descripción Actividad que es objeto de análisis con los indicadores que interesa analizar Dimensiones (puntos de vista) desde los que se puede analizar la actividad. Producto TiempoAlmacén Trimestre
  • 20. 20 Arquitectura de un Almacén de Datos Modelo multidimensional:  en un esquema multidimensional se representa una actividad que es objeto de análisis (hecho) y las dimensiones que caracterizan la actividad (dimensiones). la información relevante sobre el hecho (actividad) se representa por un conjunto de indicadores (medidas o atributos de hecho). la información descriptiva de cada dimensión se representa por un conjunto de atributos (atributos de dimensión).
  • 21. 21 Arquitectura de un Almacén de Datos Ventas importe unidades Almacén Almacén Ciudad Región Tipo Producto Departamento Nro_producto Categoría Marca Tipo Descripción hecho medidas dimensión atributos Tiempo Día Mes Semana Año Trimestre
  • 22. 22 Arquitectura de un Almacén de Datos Entre los atributos de una dimensión se definen jerarquías departamento almacén ciudad región tipo día mes año Producto Almacén Tiempo nro. producto categoría trimestre semana
  • 23. 23 Arquitectura de un Almacén de Datos Este esquema multidimensional recibe varios nombres: • estrella: si la jerarquía de dimensiones es lineal • estrella jerárquica o copo de nieve: si la jerarquía no es lineal. PERSONAL VENTAS tiempo tiempo producto lugar proyecto equipo
  • 24. 24 Herramientas OLAP una consulta a un almacén de datos consiste generalmente en la obtención de medidas sobre los hechos parametrizadas por atributos de las dimensiones y restringidas por condiciones impuestas sobre las dimensiones ¿ “Importe total de las ventas durante este año de los productos del departamento Bebidas, por trimestre y por categoría” ?. Restricciones: productos del departamento Bebidas, ventas durante este año medida hecho Parámetros de la consulta: por categoría de producto y por trimestre
  • 25. 25 Herramientas OLAP “2002” “Bebidas” Producto Tiempo Almacén Ventas importe unidades Departamento Nro_producto Categoría Marca Tipo Día Mes Día de la semana Almacén Ciudad Región Tipo Año “Importe total de ventas en este año, del departamento de “Bebidas”, por categoría y trimestre” Trimestre
  • 26. 26 Diseño de un Almacén de Datos id_dim1 id_dim2 id_dim3 ... id_dim n .... (hechos) Dim3 Dim2 Dim1 tabla de hechos tabla Dimensión 3 tabla Dimensión 1 tabla Dimensión 2 tabla Dimensión nDimn
  • 27. 27 Diseño de un Almacén de Datos producto día almacén ventas tiempo almacén producto id_producto id_fecha id_almacén ..... ..... ...... tabla de hechos la clave primaria* está formada por los identificadores de las dimensiones básicas. datos (medidas) sobre las ventas diarias de un producto en un almacén. * pueden existir excepciones a esta regla general
  • 28. 28 Diseño de un Almacén de Datos id_establec nro_establec nombre dirección distrito ciudad país tlfno fax superficie tipo_almacén ... Establecimiento id_fecha día semana mes año día_semana día_mes trimestre festivo .... Tiempo id_producto nro_producto descripción marca subcategoría categoría departamento peso unidades_peso tipo_envase dietético ... Producto
  • 29. 29 Diseño de un Almacén de Datos id_fecha id_producto id_establec ... ... ... Ventas id_establec nro_establec nombre dirección distrito ciudad país tlfno fax superficie tipo_almacén ... id_producto nro_producto descripción marca subcategoría categoría departamento peso unidades_peso tipo_envase dietético ... Establecimiento Producto id_fecha día semana mes año día_semana día_mes trimestre festivo .... Tiempo
  • 30. 30 Líneas de Investigación Abiertas  Diseño de Almacenes de Datos: modelos conceptuales, metodogías de diseño.  Carga y ETL: recuperación de fallos durante la carga. Planificación de cargas y refrescos.  Limpieza y Transformación  Mantenimiento de Almacenes de Datos: mantenimiento de vistas materializadas.  Implementación de Almacenes de Datos.  Diseño Físico, optimizaciones para ROLAP, estructuras para MOLAP.  Repartición de tareas OLAP entre el cliente y el servidor.