SlideShare una empresa de Scribd logo
1 de 137
División de Alta Tecnología
FUNDAMENTOS DE APLICACIONES
BUSINESS INTELLIGENCE
División de Alta Tecnología
Introducción al Business Intelligence
1. ¿Qué es Business Intelligence?
2. Historia y Evolución de los conceptos de BI
3. Conceptos y Terminología BI: OLTP, OLAP, Data
Warehouse, Datamart, Metadata
División de Alta Tecnología
¿Qué es Business Intelligence?
Business Intelligence o Inteligencia de Negocios,
consiste en el proceso de transformación de datos
en información, haciendo uso de técnicas de
Extracción, Transformación y Carga (ETL),
proporcionando información validada para una
adecuada toma de decisiones y de manera oportuna.
División de Alta Tecnología
¿El valor de la Información?
“Transformación Ascendente”
DATOS
INFORMACION
INTELIGENCIA
CONOCIMIENTO
SABIDURIA
División de Alta Tecnología
¿El valor de la Información?
 Asignación de valor: Ley de oferta y demanda?
 Preguntas claves:
 ¿Qué influencia la compra y la demanda?
 ¿Qué productos me generan más ingresos?
 ¿En dónde hay oportunidades de negocio?
 ¿Cómo segmento mis clientes según su comportamiento comercial?
 ¿Qué es lo que mueve la calidad del producto y la demanda de los
clientes?
 “Era de la Información”, la información tiene un valor
monetario.
División de Alta Tecnología
Las Organizaciones y sus Requerimientos de
S.I.
 Las empresas al querer contar con una mayor
automatización en sus procesos, implementan dentro de su
organización una gran infraestructura tecnológica.
 Sistemas de Procesamiento de Datos (SPD)
 Administración de Recursos Empresariales (ERP)
 Sistemas de Información Ejecutiva (EIS)
 Sistemas de Soporte a Decisiones (DSS)
 Manejo de Relación con Clientes (CRM)
División de Alta Tecnología
¿ Qué información se necesita?
 Antiguamente:
 Toma de decisiones = INTUICIÓN , BASADA EN LA EXPERIENCIA
 Actualmente:
 Más personas toman decisiones
 Deben tener información OPORTUNA Y DE CALIDAD
División de Alta Tecnología
Requerimientos Informativos
en la Piramide Organizacional
Analistas
Consumidore
s de
Información
Exploradores
de
Información
5-10% de los usuarios
15-25% de los usuarios
65-80% de los
usuarios
Nivel Estratégico
Nivel Táctico
Nivel Operacional
División de Alta Tecnología
Historia y Evolución de los conceptos de BI
Conceptos de Business Intelligence
 Fenicios, persas, egipcios y otros pueblos usaban informaciones obtenidas
de la naturaleza en beneficio propio
 Mareas
 Sequías
 Lluvias
 Posición de los astros
División de Alta Tecnología
Historia y Evolución de los conceptos de BI
Conceptos de Business Intelligence
 Después de la conquista de América, se crea en España la "Casa del Oro“
 Las nuevas tecnologías tales como, almacenamiento en tarjetas
perforadas, Bases de Datos lineales y Lenguajes de Cuarta Generación
(4GL), permitieron darle al usuario la facilidad de tener el control directo
de los sistemas y de la información.
División de Alta Tecnología
Historia y Evolución de los conceptos de BI
 En los 70’s se da un gran salto al aparecer
los dispositivos de Acceso Directo (DASD)
 En los 90’s las grandes empresas contaban
con Centros de Información.
Conceptos de Business Intelligence
División de Alta Tecnología
Historia y Evolución de los conceptos de BI
Conceptos de Business Intelligence
 El concepto de Data Warehouse nace entre los años 1992 y 1993 como
base del desarrollo de soluciones Business Intelligence.
 En 1996 el concepto de Business Intelligence empezó a difundirse como
una evolución de los Executive Information Systems (EIS).
División de Alta Tecnología
Historia y Evolución de los conceptos de BI
Conceptos de Business Intelligence
 El término Business Intelligence se extendió hacia otras
herramientas como:
 EIS (sistema de información ejecutiva)
 DSS (sistema de soporte a las decisiones)
 Balanced Scorecad (indicadores de gestión)
 Dashboard (cuadros de mandos)
 ER (reporteadores empresariales)
 Data Marts, Data Mining, Herramientas OLAP
División de Alta Tecnología
Historia y Evolución de los conceptos de BI
Conceptos de Business Intelligence
 Los sistemas de Planeamiento de Recursos Empresariales o Enterprise
Resource Planning (ERP), tienen como función principal dar soporte a la
parte operativa de las diferentes áreas de la organización, y se encuentra
muy ligada con la historia del Business Intelligence.
División de Alta Tecnología
ERP
El reto es unir elementos de las áreas y
proporcionarle a los usuarios una manera
universal de utilizar la información
almacenada en diferentes sistemas.
Utiliza la información a través de la
organización de forma más proactiva en
áreas claves.
División de Alta Tecnología
Conceptos y Terminología BI:
 OLTP
 OLAP
 Data Warehouse
 Datamart
 Metadata
División de Alta Tecnología
On Line Transacction Processing (OLTP)
Características
 Diseño orientado a la transacción.
 Volatilidad de los datos.
 Proporciona soporte muy limitado a la toma de decisiones.
División de Alta Tecnología
On Line Analytical Processing (OLAP)
OnLine Analytical Processing (OLAP) es un proceso en el que
se usan herramientas netamente análiticas, que facilitan el
análisis de la información del negocio. Se halla organizada
en entidades y métricas, que permiten al usuario
flexibilidad en la ejecución de consultas complejas.
División de Alta Tecnología
OLAP
Los servicios OLAP proveen de múltiples niveles de análisis
entre los cuales podemos mencionar, además de tener la
capacidad de realizar consultas complejas, el realizar
actividades intensivas de comparación de datos, análisis de
tendencias, reportes, etc.
División de Alta Tecnología
OLAP
Características
Es consolidada. La data se agrupada desde todas las áres de la
organización y almacenada en un repositorio central y único.
Es consistente. Todos los usuarios deben obtener la misma versión
de los datos independientemente de donde provengan o cuando hallan
sido procesadas.
Es orientada al objetivo. Sólo debe contener información
importante que permita la toma de decisiones.
División de Alta Tecnología
OLAP
Características
Es histórica. Toda la información de la empresa es almacenada
como fotografías en el repositorio único de datos.
Es de solo lectura. El sistema OLAP es exclusivamente sólo para
consultas.
No es atómica. La data OLAP principalmente contiene data
sumirazada y resumida.
División de Alta Tecnología
OLAP
División de Alta Tecnología
OLAP. Un ejemplo
Ejemplo:
Una cadena de tiendas de alquiler de videos muestra el siguiente
cuadro mensual, con las cantidades de videos alquilados por cada
una de sus sucursales.
División de Alta Tecnología
OLAP. Un ejemplo
Sin embargo, la tienda de alquiler de videos también
desearía ver como se desarrollan las ventas en el tiempo.
División de Alta Tecnología
OLAP
Las mismas celdas de datos se visualizan mediante un cubo.
División de Alta Tecnología
OLAP
División de Alta Tecnología
Modelos de Almacenamiento
 OLAP Relacional (ROLAP)
 OLAP Multidimensional (MOLAP)
 OLAP Híbrido (HOLAP)
 OLAP de Escritorio (DOLAP)
 OLAP Local (LOLAP)
División de Alta Tecnología
ROLAP
OLAP Relacional (ROLAP) es un sistema en el cual los
datos se encuentran almacenados en una base de datos
relacional.
Típicamente, los datos son detallados, evitando las
agregaciones y las tablas se encuentran normalizadas.
Los esquemas más comunes sobre los que se trabaja son
estrella o copo de nieve, aunque es posible trabajar sobre
cualquier base de datos relacional.
División de Alta Tecnología
ROLAP
La arquitectura ROLAP está compuesta por un
servidor de base de datos Relacional y un motor OLAP
en un servidor dedicado.
Esta arquitectura está diseñada para almacenar
gran volumen de datos, debido a que su
almacenamiento es relacional.
División de Alta Tecnología
MOLAP
En un sistema OLAP multidimensional (MOLAP) los datos
se encuentran almacenados en una estructura
multidimensional.
Para optimizar los tiempos de respuesta, el resumen de la
información es usualmente calculado por adelantado. Estos
valores precalculados o agregaciones son la base de las
ganancias de desempeño de este sistema.
Algunos sistemas utilizan técnicas de compresión de datos
para disminuir el espacio de almacenamiento en disco
debido a los valores precalculados.
División de Alta Tecnología
HOLAP
Un sistema OLAP Híbrido (HOLAP) mantiene los registros
detallados en la base de datos relacional, mientras que los
datos resumidos o agregados se almacenan en una base de
datos multidimensional separada.
Este método de almacenamiento es una combinación de
los dos anteriores e intenta rescatar lo mejor de cada uno.
División de Alta Tecnología
DOLAP y LOLAP
Las Desktop Online Analytical Processing (DOLAP) y
Local Online Analytical Processing (LOLAP) se almacena en
la estación de trabajo del cliente (que puede ser una PC
común).
Este tipo de cubos de información envían al servidor
relacional instruciones SQL desde una estación de trabajo
y reciben los datos almacenándolos como micro cubos los
cuales son analizados de manera local. Entre sus
desventajas es que el cubo offline no puede ser muy
grande y al estar almacenado en la pc del cliente pueden
presentarse problemas de seguridad.
División de Alta Tecnología
ARQUITECTURAS OLAP
División de Alta Tecnología
OLTP vs OLAP
 Difieren en arquitectura y uso.
 Entre los numerosos puntos de diferencias se encuentran:
 Los objetivos principales
 La orientación de los datos
 La integración
 La historicidad
 El acceso de datos y manipulación
 Los patrones de uso
 La granularidad de los datos
 El perfil de los usuarios
 La metodología de desarrollo, etc.
División de Alta Tecnología
OLTP vs OLAP
 Objetivos principales de construcción
 Los OLTP están orientados a dar soporte a las operaciones diarias del
negocio. Las aplicaciones OLAP se orientan a asistir en el análisis del
negocio (consultas).
División de Alta Tecnología
OLTP vs OLAP
 Alineación de datos
 Los OLTP están orientados a aplicaciones o sistemas los cuales poseen
distintos tipos de datos y diferentes y estructurados para registrar las
trascancciones diarias del negocio.
 Los sistemas OLAP están alineados por área o tema y están orientados
a la consulta del analista de negocio.
División de Alta Tecnología
OLTP vs. OLAP
OLTP
OLAP
División de Alta Tecnología
OLTP vs. OLAP
 Integración de datos
 En los OLTP, los datos se encuentran dispersos, son calificados como
datos base o datos operacionales. Estos datos son estructurados en
forma aislada uno de otros, pudiendo tener diferentes estructuras de
llaves y nombres.
 En los ambientes OLAP, los datos deben estar integrados, consolidados
y orientados a un tema o área de análisis.
División de Alta Tecnología
OLTP vs. OLAP
 Acceso y manipulación de los datos
 Los sistemas operacionales realizan operaciones con los datos fila por
fila usando genaralmente sentencias inserts, updates y deletes.
Además requieren de rutinas de validación como son el commit y el
rollback, los bloqueos de registros, etc.
 Los sistemas OLAP tienen una carga y acceso masivo de datos,
haciendo uso principalmente de sentencias select.
División de Alta Tecnología
OLTP vs. OLAP
 Granularidad de los datos
 Los sistemas OLTP se encuentran los datos a nivel atómico
(transacción por transacción).
 Los sistemas OLAP tienen adicionalmente de data detallada, datos
sumarizados y agregados.
División de Alta Tecnología
Sistemas OLTP vs OLAP
División de Alta Tecnología
Sistemas OLTP vs OLAP
Transaccionales: OLTP Análisis: OLAP
Se definen entidades normalizadas Se definen entidades
desnormalizadas
Se normaliza hasta la tercera
forma
Diseños complejos de base de
datos
Define diseños sencillos de base
de datos fáciles de entender por
los usuarios
Almacena información al menor
nivel de detalle transaccional
Almacena datos a nivel
transaccional y totalizados
Incrementa el número de joins Reduce el número de joins
Normalmente es estático Normalmente es dinámico
Comparación de los modelos de base de datos
División de Alta Tecnología
Data Warehouse
 Ralph Kimball: “un data warehouse es una ‘copia’ de los
datos transaccionales específicamente estructurados para
consultas y análisis”.
División de Alta Tecnología
Data Warehousing
“A Warehouse is a place, Warehousing is a process”
[R.Hackathorn]
 Existe una gran cantidad de procesos detrás de una arquitectura de Data
Warehouse de suma importancia para el mismo. Estos comprenden desde
procesos de extracción que estudian y seleccionan los datos fuente adecuados
para el Data Warehouse hasta procesos de consulta y análisis de datos que
despliegan la información de una forma fácil de interpretar y analizar.
 A continuación pasaremos a explicar los procesos básicos de una Data
Warehouse: Extracción, Transformación, Carga e Indices, Chequeo de
Calidad, Liberación/Publicación, Consulta, Feedback, Auditoria, Seguridad,
Respaldo y Recuperación.
División de Alta Tecnología
Datamart
 Un Datamart es un Data Warehouse mas
pequeño.Normalmente la información contenida en un
datamart es un subconjunto de un datawarehouse.
División de Alta Tecnología
Metadata
 Es un componente muy valioso para el Data Warehouse; los
datos provenientes de la metadata se sitúa en una
dimensión diferente al de otros datos del data warehouse,
debido a que su contenido no es tomado directamente
desde el ambiente operacional.
División de Alta Tecnología
Introducción al Data Warehouse
1. ¿Qué es un Data Warehouse?
2. Etapas de un Proceso Data Warehousing
(Metodología Ralph Kimball)
División de Alta Tecnología
¿Qué es un Data Warehouse?
 Un Data Warehouse (DWH) es un repositorio central que
contiene la información más valiosa de la empresa. Los
datos que aquí se almacenan han pasado por un proceso de
calidad que asegura su consistencia. Además, el repositorio
está construido de tal manera que el acceso sea lo más
rápido posible.
Data Warehouse
Acceso a los datos
Usuario
Acceso a datos
Fuentes
de datos
Entrada de datos
Area de
preparación
Data Marts
Data Warehouse
Data Warehouse
Acceso a los datos
Usuario
Acceso a datos
Fuentes
de datos
Acceso a los datos
Acceso a los datos
Usuario
Acceso a datos
Fuentes
de datos
Entrada de datos
Area de
preparación
Entrada de datos
Area de
preparación
Area de
preparación
Data Marts
Data Marts
Data Marts
Componentes de un sistema Datawarehouse
División de Alta Tecnología
Etapas de un Proceso Data Warehousing
(Metodología Ralph Kimball)
 El marco presentado por Ralph Kimball bajo el nombre de Business
Dimensional Lifecycle (BDL) ilustra las diferentes etapas por las que debe
pasar todo proceso de Data Warehousing. Este enfoque de implementación
de Data Warehouses es ilustrado en la siguiente figura:
Business Dimensional Lifecycle propuesto por Ralph Kimball
División de Alta Tecnología
Planificación del Proyecto
 La planificación busca identificar la definición y el alcance
del proyecto de Data Warehouse, incluyendo justificaciones
del negocio y evaluaciones de factibilidad. La planificación
del proyecto se focaliza sobre recursos, perfiles, tareas,
duraciones y secuencialidad. El plan de proyecto resultante
identifica todas las tareas asociadas con el BDL e identifica
las partes involucradas.
División de Alta Tecnología
Definición de los Requerimientos del Negocio
 Un factor determinante en el éxito de un proceso de Data
Warehousing es la interpretación correcta de los diferentes
niveles de requerimientos, expresados por los diferentes
niveles de usuarios. La técnica utilizada para relevar los
requerimientos de los analistas del negocio difiere de los
enfoques tradicionales guiados por los datos. Los
diseñadores de los Data Warehouses deben entender los
factores claves que guían al negocio para determinar
efectivamente los requerimientos y traducirlos en
consideraciones de diseño apropiadas.
División de Alta Tecnología
Modelado Dimensional
 La definición de los requerimientos del negocio determina
los datos necesarios para cumplir los requerimientos
analíticos de los usuarios.
 Diseñar los modelos de datos para soportar estos análisis
requieren un enfoque diferente al usado en los sistemas
operacionales.
 Básicamente se comienza con una matriz donde se
determina la dimensionalidad de cada indicador y luego se
especifican los diferentes grados de detalle (atributos)
dentro de cada concepto del negocio (dimensión), como así
también la granularidad de cada indicador (variable o
métrica) y las diferentes jerarquías que dan forma al
Modelo Dimensional del Negocio (BDM) o Mapa
Dimensional.
División de Alta Tecnología
Diseño Físico
 El diseño físico de las base de datos se focaliza sobre la
selección de las estructuras necesarias para soportar el
diseño lógico.
División de Alta Tecnología
Diseño y Desarrollo de Presentación de Datos
 Esta etapa es una de las más subestimadas de las tareas
en un proyecto de Data Warehouse. Las principales sub
etapas de esta zona del ciclo de vida son: la extracción, la
transformación y la carga (ETL process). Se definen como
procesos de extracción a aquellos requeridos para obtener
los datos que permitirán efectuar la carga del Modelo Físico
acordado. Así mismo, se definen como procesos de
transformación a los procesos para convertir o recodificar
los datos fuente a fin poder efectuar la carga efectiva del
Modelo Físico. Por otra parte, los procesos de carga de
datos son los procesos requeridos para poblar el Data
Warehouse.
División de Alta Tecnología
Diseño y Desarrollo de Presentación de Datos
 Como advierte Kimball (1998), el proceso de Data Staging
es el iceberg de un proyecto de Data Warehousing. Son
muchos los desafíos que deben enfrentarse para lograr
datos de alta calidad de los sistemas fuentes. Es una de las
etapas más subestimadas, que siempre termina tomando
más tiempo del previsto. Ralph Kimball propone un plan de
10 ítems que ayudarán a guiar esta etapa del BDL.
División de Alta Tecnología
Diseño de la Arquitectura Técnica
 Los ambientes de Data Warehousing requieren la
integración de numerosas tecnologías. Se debe tener en
cuenta tres factores: los requerimientos del negocio, los
actuales ambientes técnicos y las directrices técnicas
estratégicas futuras planificadas para de esta forma poder
establecer el diseño de la arquitectura técnica del ambiente
de Data Warehousing.
División de Alta Tecnología
Selección de Productos e Instalación
 Utilizando el diseño de arquitectura técnica como marco, es
necesario evaluar y seleccionar componentes específicos de
la arquitectura como será la plataforma de hardware, el
motor de base de datos, la herramienta de ETL o el
desarrollo pertinente, herramientas de acceso, etc.
División de Alta Tecnología
Especificación de Aplicaciones para Usuarios Finales
 No todos los usuarios del Data Warehouse necesitan el mismo nivel de
análisis. Es por ello que en esta etapa se identifican los diferentes roles o
perfiles de usuarios para determinar los diferentes tipos de aplicaciones
necesarias en base al alcance de los diferentes perfiles (gerencial, analista
del negocio, vendedor, etc.)
 Kimball se concentra sobre el proceso de creación de aplicaciones
“Templates”.
 Comienza definiendo el concepto de la aplicación para usuario final y su rol
en el acceso a la información del negocio.
 Brinda un marco metodológico bastante estándar en lo que a desarrollo de
aplicaciones (como piezas de software) se refiere.
División de Alta Tecnología
Desarrollo de Aplicaciones para Usuarios Finales
 Siguiendo a la especificación de las aplicaciones para
usuarios finales, el desarrollo de las aplicaciones de los
usuarios finales involucra configuraciones del metadata y
construcción de reportes específicos.
 Una vez que se ha cumplido con todos los pasos de la
especificación y se tiene la posibilidad de trabajar con
algunos datos de prueba, comienza el desarrollo de la
aplicación (Kimball, 1998)
División de Alta Tecnología
Implementación
 La implementación representa la analogía de la tecnología,
los datos y las aplicaciones de usuarios finales accesibles
desde el escritorio del usuario del negocio.
 Hay varios factores extras que aseguran el correcto
funcionamiento de todas estas piezas, entre ellos se
encuentran la capacitación, el soporte técnico, la
comunicación, las estrategias de feedback.
 Todas estas tareas deben ser tenidas en cuenta antes de
que cualquier usuario pueda tener acceso al Data
Warehouse.
División de Alta Tecnología
Mantenimiento y crecimiento
 Data Warehousing es un proceso (de etapas bien definidas, con comienzo
y fin, pero de naturaleza espiral) pues acompaña a la evolución de la
organización durante toda su historia.
 Se necesita continuar con los relevamientos de forma constante para
poder seguir la evolución de las metas por conseguir.
 Según afirma Kimball (1998), “si se ha utilizado el BDL el Data Warehouse
está preparado para evolucionar y crecer”.
 Al contrario de los sistemas tradicionales, los cambios en el desarrollo
deben ser vistos como signos de éxito y no de falla.
 Es importante establecer las prioridades para poder manejar los nuevos
requerimientos de los usuarios y de esa forma poder evolucionar y crecer.
División de Alta Tecnología
Mantenimiento y crecimiento
Data Warehousing como proceso de naturaleza espiral
El sentido de las flechas fija claramente el concepto evolutivo y
espiral del Business Dimensional Lifecycle.(BDL)
División de Alta Tecnología
Gerenciamiento del Proyecto
 El gerenciamiento del proyecto asegura que las actividades
del BDL se lleven en forma y sincronizadas.
 Entre sus actividades principales se encuentra el monitoreo
del proyecto y la comunicación entre los requerimientos del
negocio. Asimismo, determina las restricciones de
información para poder manejar correctamente las
expectativas en ambos sentidos.
División de Alta Tecnología
Soluciones Business Intelligence
1. Herramientas de BI: Executive Information System
(EIS), Decision Support Systems (DSS), Reporting
Tools (RT), Data Mining.
2. Componentes de una solución BI.
3. Los 5 estilos de BI: Enterprise Reporting, Análisis
con Cubos, Consultas Ad Hoc, Análisis Estadísticos y
Data Mining, Envio Proactivo de Alertas.
4. Guia para el desarrollo del BI.
5. Ejemplos de lo que se puede obtener con BI.
6. Productos de software de BI.
División de Alta Tecnología
Herramientas de Business Intelligence
 Dentro del mundo de los negocios y, de las organizaciones
en general, la Inteligencia de Negocios, es un concepto
respaldado por una nueva manera de hacer las cosas. Esto
es posible gracias a los avances de los Sistemas de
Información y de las Tecnologías de Información.
División de Alta Tecnología
Executive Information System (EIS)
 El EIS es una herramientas de BI orientada al nivel
estratégico de las empresas.
 Tiene como objetivo primordial proveer de toda la
información necesaria al personal que toma decisiones, de
modo fácil y prácticamente sin necesidad de interactuar con
el mismo sistema.
 En términos formales, "un EIS es un sistema de
información que permite a los ejecutivos acceso rápido y
efectivo a información compartida, crítica para el negocio,
utilizando interfaces gráficas.“
 Las interfaces que son utilizadas en estos sistemas deben
ser más sofisticadas que los sistemas transaccionales y
deben incluir, en el menor número de páginas posible, la
mayor cantidad de información que el usuario necesita para
monitorear su empresa.
División de Alta Tecnología
 La diferencia de los EIS con otros sistemas no solo es la
vistosidad y facilidad de uso.
 Aparte del front-end, los EIS interpretan y manipulan de
forma diferente la información, pues trabajan con formatos
de datos no típicos, tales como Data Warehouse o Data
Mart.
 Prácticamente todos los EIS obtienen sus datos de matrices
multidimensionales denominadas "cubos" y las
herramientas en las que se desarrollan estos sistemas
tienen tecnología que permite realizar consultas amplias y
complejas de diversas fuentes de datos en tiempos
mínimos.
 Las partes importantes de un EIS son: la interfaz de
usuario y la base de datos multidimensional, esto montado
en una arquitectura Cliente/Servidor.
Executive Information System (EIS)
División de Alta Tecnología
Lo que debe contener un EIS
 Elementos:
 Interfaz gráfica fácil de usar y ver
 Alarmas o semáforos
 Tableros de control
 Administración de una sola Página
 Integración de información proveniente de los cubos
Elementos de un EIS
Fuente: BITAM (business Intelligence Tools)
División de Alta Tecnología
Decision Support Systems (DSS)
 "DSS se refiere a cualquier sistema de software que permite análisis de las
diferentes variables del negocio para apoyar una decisión.“
 Puede considerarse como un sistema que se basa en un almacén de datos
y crea una base de datos multidimensional, permitiéndole al usuario
procesar analíticamente la información en línea (OLAP), con la habilidad de
poder girar y taladrar dentro de los datos.
 Como utilidad al usuario final, un DSS se valora cuando se profundiza en
la información para conocer los "porqués a" los indicadores presentados,
pero la infraestructura y metodologías que soporten el "taladreo" de
información son las que completan el esquema de un DSS y le permiten
hacer uso de OLAP, Data Warehouse y otros conceptos asociados.
 En términos prácticos, el DSS lo vemos cuando analizamos la información,
pero realmente involucra todo un proceso previo antes de poner la
información en el escritorio del usuario.
División de Alta Tecnología
Decision Support Systems (DSS)
 Un sistema DSS procesa una transacción por día, pero esa transacción es
producto de miles o millones de registros que han sido procesados en el
día (puede ser por cualquier periodo de tiempo, pero el común es por día).
 En vez de llamarle transacción, se le llama Carga de Información de
Producción.
 En este caso lo importante es el estado de consistencia de la información
antes y después de la carga.
 En cuanto a los usuarios y administradores de un DSS, no son los que
ingresan cada una de las operaciones en sus PCs, sino los que solicitan
una o dos hojas con resúmenes totalizados de miles de operaciones.
 El usuario de OLTP cambia con frecuencia el tipo de información que
solicita, de ahí que sus requerimientos no sean planeados, sino
heurísticos.
 Una pantalla de un sistema DSS deberá contener la información sobre el
por qué de una tabla o gráfica, con algunos números y pantallas, al
momento de pedir información sobre el por qué de determinado dato,
podrá accederse a otra pantalla con la explicación y así, sucesivamente,
hasta llegar al último detalle.
División de Alta Tecnología
Decision Support Systems (DSS)
 La interpretación y manipulación de la información es muy distinta a los
formatos típicos. A pesar de que la capacidad de extracción de datos
puede ser de archivos de texto, tablas, etc., la forma de organizar esa
información es lo que difiere, pues la mayoría de los DSS organizan la
información vía matrices multidimensionales denominadas "cubos". Los
cubos organizan la información de tal modo que puedan, posteriormente,
'montarse' herramientas para desarrollar sistemas complejos, que
permitan realizar una gran cantidad de cálculos, consolidaciones,
consultas y despliegues de información, localizadas en múltiples
repositorios en un tiempo mínimo.
Arquitectura de un DSS
División de Alta Tecnología
Lo que debe contener un DSS
 Elementos:
 Análisis Multidimensional (OLAP)
 Proyecciones de Información
 Tendencias
 What... If
Fuente: BITAM (Business Intelligence Tools)
División de Alta Tecnología
 Las herramientas de consulta y reporteo (Query &
Reporting Tools) son una categoría de
herramientas de BI.
 Con las herramientas de reporteo orientadas al
usuario final se pretende eliminar la dependencia
del área de sistemas al manejar una capa
intermedia entre complejidad técnica y usuario
final.
Herramientas de Consulta y Reporteo
División de Alta Tecnología
 Todo usuario depende de los reportes para
comunicar lo que está ocurriendo en la empresa
vía los almacenes de información.
 Los reportes tienen en las bases de datos su
principal fuente de alimentación y han brindado la
posibilidad de consultar y publicar lo que las bases
de datos poseen.
 Los reportes son requeridos por muchas personas
en una organización.
 El tiempo de respuesta en la obtención de ellos
marca la diferencia entre el éxito o fracaso de un
proyecto.
Herramientas de Reporteo
División de Alta Tecnología
 Intuitivo
 Seguridad
 Publicación y distribución
 Navegación
 Reportes por excepción
 Reportes dinámicos
 Programación automática
Características de una herramienta de reporteo
División de Alta Tecnología
Proceso de Data Mining
Data Mining (DM)
División de Alta Tecnología
Fases de un Proyecto de DM
 Los pasos a seguir para la realización de un proyecto de
minería de datos son siempre los mismos,
independientemente de la técnica específica de extracción
de conocimiento usada.
 Filtrado de datos
 Selección de variables
 Extracción del conocimiento
 Interpretación y evaluación.
División de Alta Tecnología
¿Cómo se desarrollan los sistemas Data Mining?
Árbol de predicción, que extrae y analiza datos de una datamart
Los sistemas Datamining se desarrollan bajo lenguajes de
última generación basados en la inteligencia artificial que
utilizan modelos matemáticos tales como:Redes neuronales
artificiales, Árboles de decisión, Algoritmos genéticos,Regla de
inducción y Método del vecino más cercano.
División de Alta Tecnología
Herramientas del Data Mining
 Las herramientas de Data Mining predicen futuras
tendencias y comportamientos, permitiendo en los negocios
tomar decisiones proactivas y conducidas por un
conocimiento acabado de la información (knowledge-
driven).
 Estas herramientas exploran las bases de datos en busca
de patrones ocultos, encontrando información predecible
que un experto no puede llegar a encontrar porque se
encuentra fuera de su alcance.
 Las herramientas de Data Mining pueden analizar bases de
datos masivas para brindar respuesta a preguntas tales
como:
 "¿Qué clientes tienen más probabilidad de responder al próximo
mailing promocional, y por qué? y presentar los resultados en formas
de tablas, con gráficos, reportes, texto, hipertexto, etc.
División de Alta Tecnología
Herramientas del Data Mining
 Ejemplos de las preguntas que se pueden responder con las
herramientas de Data Mining:
 ¿Qué características tienen mis mejores clientes?
 ¿Qué características tienen los clientes que estoy perdiendo?
 ¿A quiénes debería dirigir mi campaña publicitaria?
 Ejemplos de las preguntas que se pueden responder con las
herramientas de Data Mining:
 ¿Cuáles son los factores que inciden en que algunas máquinas tengan
mayores tasas de fallas que otras?
 ¿A quiénes no debo venderles seguros contra todo riesgo?
 ¿Qué factores inciden en el aumento de la tasa de fallas?
División de Alta Tecnología
 Todas las soluciones de BI tienen funciones parecidas,
pero deben de reunir al menos los siguientes
componentes:
 Multidimensionalidad
 Data Mining
 Agentes
 Data Warehouse
Componentes de una solución BI
División de Alta Tecnología
 Estos cinco estilos representan el espectro
completo de la funcionalidad de BI necesaria para
dar soporte a las necesidades analíticas, de
supervisión y de generación de informes de todos
y cada uno de los usuarios empresariales.
Los 5 estilos del BI
División de Alta Tecnología
Los 5 estilos del BI
División de Alta Tecnología
 Enterprise Reporting
Una herramienta Enterprise Reporting debe permitir al
usuario crear indicadores, reportes, grillas, gráficos,
logos, texto libre y demás objetos sin depender de
asistencia de sistemas. De la misma manera debe
máximizar todo lo que tenga que ver con la
presentación del informe, para incluso, poder
visualizarlo de igual modo tanto en la computadora
como en una impresión.
Los 5 estilos del BI
División de Alta Tecnología
 Análisis con cubos.
Factores determinantes de un buen análisis con cubos:
 Rápida performance para niveles sumarizados de
información
 Cálculos definidos por el usuario
 Análisis Offline
 Acceso a datos no-relacionales y relacionales
 Generación rápida de cubos sin pre-cálculo de datos
 Expiración y refresco automático de datos
 Creación dinámica por el usuario vía Windows® o
Web
Los 5 estilos del BI
División de Alta Tecnología
 Consultas Ad hoc.
En toda organización existe un perfil de analista que
necesita analizar información a nivel transaccional. Esto
no significa, que mire transacción por transacción, sino
que el análisis que demanda necesita que la
información esté almacenada a nivel transaccional para
así lograr obtener análisis de afinidad entre productos,
identificar clientes, identificar nuevas oportunidades de
venta, etc.
Los 5 estilos del BI
División de Alta Tecnología
 Análisis estadísticos y Data Mining.
Comprende la búsqueda de patrones de
comportamiento de forma automática. Los usuarios
brindan una muestra de datos para que el sistema
“aprenda” en base a la búsqueda de patrones de
comportamiento similares. Una vez que el sistema
“aprende” se le da la muestra real desde donde se
quiere inferir cierto comportamiento.
Los 5 estilos del BI
División de Alta Tecnología
Los 5 estilos del BI
 Envío proactivo de Alertas
Aquí el usuario define exactamente qué información
quiere recibir, en qué momento, bajo que formato y por
cual medio.
Los 5 Estilos de BI han evolucionado para apoyar las diferentes necesidades,
del análisis profesional avanzado al consumo de información básico.
División de Alta Tecnología
Guía para el desarrollo de BI
 Introducción:
 La mayoría de los proyectos de ingeniería pasan por 6 fases entre el inicio
y la implementación. Así mismo, la mayoría de estos procesos son
iterativos. Una vez desplegado, un producto se mejora continuamente
basado en la retroalimentación. Cada iteración produce una nueva versión
del producto.
 Las 6 fases de un proyecto de Ingeniería:
 Justificación
 Planificación
 Análisis del Negocio
 Diseño
 Construcción
 Despliegue
División de Alta Tecnología
Fuente: Business Intelligence Roadmap
Autores: Larissa T.Moss / Shaku Atre
Guía para el desarrollo de BI
Fases de Desarrollo y sus dependencias
División de Alta Tecnología
Aplicaciones BI
División de Alta Tecnología
Diseñando las fases y los pasos de desarrollo
Los proyectos de BI están organizados de acuerdo a las mismas 6 fases comunes
de los procesos de ingeniería mencionados anteriormente, ciertos pasos se llevan a
cabo para ver el diseño a través de su realización.
Esta guía describirá 16 pasos dentro de estas 6 fases.
División de Alta Tecnología
Diseñando las fases y los pasos de desarrollo
División de Alta Tecnología
Diseñando las fases y los pasos de desarrollo
División de Alta Tecnología
Diseñando las fases y los pasos de desarrollo
División de Alta Tecnología
Diseñando las fases y los pasos de desarrollo
División de Alta Tecnología
Diseñando las fases y los pasos de desarrollo
División de Alta Tecnología
Ejemplos de lo que se puede obtener con Business
Intelligence
 Mejorar el servicio al cliente
 Generar reportes globales o por secciones
 Crear escenarios con respecto a una decisión
 Hacer pronósticos de ventas y devoluciones
 Compartir información entre departamentos
 Análisis multidimensionales
 Crear una base de datos de clientes (potenciales)
 Cambiar la estructura de toma de decisiones
División de Alta Tecnología
Productos de software de BI
División de Alta Tecnología
Productos Business Intelligence
SAGENT SOLUTION PLATTFORM:
División de Alta Tecnología
MICROSTRATEGY:
Productos Business Intelligence
División de Alta Tecnología
BUSINESS OBJECTS:
Productos Business Intelligence
http://www.latam.businessobjects.com/productos/
División de Alta Tecnología
Productos Business Intelligence
http://www.cognos.com/products/cognos8businessintelligence/index.html
http://www.cognos.com/es/c8demo/index.html?mc=-web_es_hp
COGNOS:
División de Alta Tecnología
BITAM BUSINESS INTELLIGENCE SUITE:
Los productos de BITAM permiten integrar
tecnologías OLAP, diferentes plataformas de
bases de datos y aplicaciones corporativas
de uso diario existentes.
Productos Business Intelligence
Los productos Artus,
Advisor y Papiro
permiten a las compañías
traducir la información en
conocimiento y distribuirlo
eficientemente donde las
decisiones tienen que
tomarse.
División de Alta Tecnología
Productos Business Intelligence
http://www.oracle.com/global/es/consultoria/B_Software.htm
ORACLE:
División de Alta Tecnología
Introducción a la Inteligencia de Negocios
 La información cumple un rol vital en el ciclo de vida de
toda organización.
 Todos los días, las organizaciones producen grandes
volúmenes de información, que es utilizada para tomar
decisiones de todo tipo.
División de Alta Tecnología
Características de una solución de Inteligencia de
Negocios
 Una solución de Inteligencia de Negocios tiene las
siguientes características:
 Ubica, extrae, transforma y centraliza datos desde múltiples ubicaciones y
formatos.
 Consolida y estandariza la información.
 Proporciona repositorios centralizados de almacenamiento de la
información, y herramientas para analizar y explotar dicha información.
 La noción generalizada de que los usuarios de las soluciones de
Inteligencia de Negocios serán los gerentes y altos directivos de la
empresa, es errónea.
División de Alta Tecnología
Enfoque de la Inteligencia de Negocios en la empresa
 El proceso de Inteligencia de Negocios abarca la totalidad de las áreas de
interés en una organización.
 La figura 1.1 muestra una representación de dicho proceso.
Contabilidad
(Fox Pro)
Logística
(SQL Server 6.5)
CRM
(SQL Server 2005)
STAGING AREA
ETL ETL DATA MART –
DATA
WAREHOUSE
(Esquemas Star –
Snowflake)
OLAP –
Data Mining
Reportes Excel
Mobile
Devices
Excel
Figura 1.1: El proceso de la Inteligencia de Negocios
División de Alta Tecnología
Bases de datos OLAP y OLTP
 La siguiente tabla compara las características
principales de las bases de datos OLTP y OLAP:
Bases de datos OLTP Bases de datos OLAP
Frecuencia de
actualización
Tiempo real Periódica
Estructuración Integridad de los datos. Alta
normalización
Fácil consulta. Información no
normalizada.
Optimización Procesos transaccionales
(modificación de datos)
Consultas.
División de Alta Tecnología
Características especiales de las bases de datos OLAP
 Algunas características particulares de una base de datos
OLAP son las siguientes:
 Datos consolidados y consistentes
 Está orientada a temas específicos
 Histórica
 Es de sólo lectura
 Tiene un nivel de granularidad
División de Alta Tecnología
Ejemplo:
 La siguiente tabla que muestra las características
esenciales de la información almacenada en Data Marts
y Data Warehouses:
Característica de los datos Descripción
Consolidados Información centralizada de una unidad organizacional
o de toda la organización. Cada entidad de
negocio está representada de manera única. Por
ejemplo, cada cliente está representado por un
único registro y una clave uniforme.
Consistentes Los resultados son consistentes. Por ejemplo, el total
vendido para Lima es la suma de las ventas
parciales por distrito.
Históricos Copias permanentes de información.
Sólo lectura No pueden ser actualizados.
Totalizados La información se almacena con un apropiado nivel de
detalle, definido en la fase de análisis. Por
ejemplo, puede definirse que se almacenarán las
ventas semanales, y no la información de cada
factura en particular.
División de Alta Tecnología
Ejemplo:
• La ilustración siguiente nos muestra un típico reporte de volúmenes
de ventas en diferentes ciudades en un mes específico:
División de Alta Tecnología
Data Marts & Data Warehouses
 Los términos “Data Mart” y “Data Warehouse” pueden
causar cierta confusión, debido a que se emplean
indistintamente como conceptos equivalentes. A
continuación se explicarán las diferencias en el significado
de ambas palabras.
División de Alta Tecnología
Data Marts & Data Warehouses
La siguiente figura ilustra el proceso de construcción de Data
Marts y Data Warehouses:
División de Alta Tecnología
El proceso de construcción de un Data Warehouses
 Existen dos caminos para la construcción de un Data
Warehouse:
 Top – Down
 Bottom – Up
División de Alta Tecnología
Enfoque Top – Down: Mover datos del Data Warehouse
hacia Data Marts
División de Alta Tecnología
Enfoque Button – Top: Mover Datos de los Data Marts
hacia el Data Warehouse
División de Alta Tecnología
SQL Server 2005 y el proceso de Inteligencia de
Negocios
División de Alta Tecnología
SQL Server 2005 y el proceso de Inteligencia de
Negocios
 Las principales herramientas de apoyo en la
implementación de soluciones de Inteligencia de Negocios
provistas por SQL Server 2005 son:
 Database Services
 SQL Server Integration Services (SSIS
 Analysis Services de SQL Server 2005
 Reporting Services de SQL Server 2005
División de Alta Tecnología
El proceso de la Inteligencia de Negocios
 La siguiente exposición se centrará en el proceso de análisis
y la determinación de indicadores clave de performance del
negocio.
 Los pasos principales del proceso de análisis se muestran
en el siguiente gráfico:
División de Alta Tecnología
El proceso de la Inteligencia de Negocios
División de Alta Tecnología
Alto nivel de análisis de los requerimientos para
analizar la información
División de Alta Tecnología
Roles y Procesos
División de Alta Tecnología
Identificar los principales indicadores de
performance
División de Alta Tecnología
Identificar los principales indicadores de
performance
División de Alta Tecnología
Identificar los principales indicadores de
performance
División de Alta Tecnología
Dimensiones y Eventos
En este punto, ya se cuenta con las bases para formalizar el modelo conceptual.
División de Alta Tecnología
Fuentes y transformaciones
 En esta fase, se identifican las fuentes de datos donde reside la
información relevante para la solución de Inteligencia de Negocios. Se
determinan también los cambios y transformaciones de datos necesarios
para lograr la consistencia de la información. Cada transformación debe
documentarse adecuadamente, para facilitar el trabajo técnico de los
implementadores.
 No es infrecuente descubrir que existe información clave que no se
encuentra almacenada en bases de datos relacionales, sino en orígenes
atípicos: hojas de cálculo Excel, archivos de texto, documentos Word, etc.
Esta información también debe ser transferida al almacén de datos central
del Data Mart a través de procesos ETL.
División de Alta Tecnología
Información de Negocio
División de Alta Tecnología
Principios de diseño de bases de datos OLAP
División de Alta Tecnología
El modelo Estrella (STAR)
División de Alta Tecnología
Componentes de un esquema STAR
 A continuación se listan los componentes de un esquema
STAR:
 Tabla de Hechos
 Tablas de Dimensión
División de Alta Tecnología
Tabla Dimensión
 El diseño de las tablas de dimensión es, generalmente,
sencillo y de fácil comprensión. Sea, por ejemplo, la
dimensión Producto. Los productos de la empresa se
agrupan por familias, las cuales contienen subfamilias de
productos. Cada subfamilia consta de varias marcas de
productos. Finalmente, cada marca contiene múltiples
presentaciones de productos. El diseño de la tabla de
dimensión PRODUCTO_DIM es:
División de Alta Tecnología
Tabla de Hechos
• Un data mart está constituido por tablas de hechos y tablas
de dimensión. Cada tabla de hechos está enlazada con
múltiples tablas de dimensión. El siguiente diseño
corresponde con una tabla de hechos que almacena
información de ventas:
División de Alta Tecnología
Ejemplo: Modelo Estrella (STAR)
División de Alta Tecnología
Ejercicio 1: Diseño de un Data Mart para tarjetas de
crédito.
• El área de tarjetas de crédito de un banco desea
implementar un Data Mart. Se desea visualizar la
información de créditos concedidos y pagos hasta llegar a
cada tarjeta. Las tarjetas pueden ser de dos tipos: “VISA” y
“MASTERCARD”. También se desea visualizar los créditos y
pagos por cada vendedor y cada cliente. Cada cliente
pertenece a un distrito, cada distrito a una provincia y cada
provincia a un departamento. Cada vendedor pertenece a
una agencia, y cada agencia pertenece a un distrito, cada
distrito a una provincia y cada provincia a un
departamento. Las métricas deben visualizarse como
totalizados anuales, semestrales, trimestrales y mensuales.
Diseñe las dimensiones, las medidas y el modelo de datos.
División de Alta Tecnología
El modelo del STAR para este data mart es:

Más contenido relacionado

Similar a PPTS establecida para los manuales del DAT New.ppt

Datawarehouse y Datamining
Datawarehouse y DataminingDatawarehouse y Datamining
Datawarehouse y Dataminingdannoblack
 
Big Data en el entorno Bancario
Big Data en el entorno BancarioBig Data en el entorno Bancario
Big Data en el entorno BancarioMartín Cabrera
 
Que Es Un Data Warehouse
Que Es Un Data WarehouseQue Es Un Data Warehouse
Que Es Un Data Warehouseguest10616d
 
Data Mart de una área de compras
Data Mart de una área de comprasData Mart de una área de compras
Data Mart de una área de comprasroy_vs
 
Analisis multidemensional.pdf
Analisis multidemensional.pdfAnalisis multidemensional.pdf
Analisis multidemensional.pdfmgl27
 
Datawarehouse
DatawarehouseDatawarehouse
Datawarehouseshady85
 
Inteligencia de negocios
Inteligencia de negociosInteligencia de negocios
Inteligencia de negociosjo_unwell
 
Inteligencia de negocios
Inteligencia de negociosInteligencia de negocios
Inteligencia de negociosjo_unwell
 
Inteligencia de negocios
Inteligencia de negociosInteligencia de negocios
Inteligencia de negociosjo_unwell
 
Inteligencia de negocios
Inteligencia de negociosInteligencia de negocios
Inteligencia de negociosjo_unwell
 
Big Data - Desarrollando soluciones efectivas
Big Data - Desarrollando soluciones efectivasBig Data - Desarrollando soluciones efectivas
Big Data - Desarrollando soluciones efectivasJoseph Lopez
 
Topicos de ingeneria_de_sistema_sii_calzada1
Topicos de ingeneria_de_sistema_sii_calzada1Topicos de ingeneria_de_sistema_sii_calzada1
Topicos de ingeneria_de_sistema_sii_calzada1Calzada Meza
 
Presentación Sistemas
Presentación SistemasPresentación Sistemas
Presentación Sistemasvickyderas17
 

Similar a PPTS establecida para los manuales del DAT New.ppt (20)

Datawarehouse y Datamining
Datawarehouse y DataminingDatawarehouse y Datamining
Datawarehouse y Datamining
 
Sistemas de soporte
Sistemas de soporteSistemas de soporte
Sistemas de soporte
 
Sistemas de soporte
Sistemas de soporteSistemas de soporte
Sistemas de soporte
 
Big Data en el entorno Bancario
Big Data en el entorno BancarioBig Data en el entorno Bancario
Big Data en el entorno Bancario
 
ALMACEN DE DATOS.pptx
ALMACEN DE DATOS.pptxALMACEN DE DATOS.pptx
ALMACEN DE DATOS.pptx
 
Que Es Un Data Warehouse
Que Es Un Data WarehouseQue Es Un Data Warehouse
Que Es Un Data Warehouse
 
Data Mart de una área de compras
Data Mart de una área de comprasData Mart de una área de compras
Data Mart de una área de compras
 
Analisis multidemensional.pdf
Analisis multidemensional.pdfAnalisis multidemensional.pdf
Analisis multidemensional.pdf
 
Datawarehouse
DatawarehouseDatawarehouse
Datawarehouse
 
Inteligencia de negocios
Inteligencia de negociosInteligencia de negocios
Inteligencia de negocios
 
Inteligencia de negocios
Inteligencia de negociosInteligencia de negocios
Inteligencia de negocios
 
Inteligencia de negocios
Inteligencia de negociosInteligencia de negocios
Inteligencia de negocios
 
Inteligencia de negocios
Inteligencia de negociosInteligencia de negocios
Inteligencia de negocios
 
Almacenes de datos
Almacenes de datosAlmacenes de datos
Almacenes de datos
 
Big Data - Desarrollando soluciones efectivas
Big Data - Desarrollando soluciones efectivasBig Data - Desarrollando soluciones efectivas
Big Data - Desarrollando soluciones efectivas
 
Topicos de ingeneria_de_sistema_sii_calzada1
Topicos de ingeneria_de_sistema_sii_calzada1Topicos de ingeneria_de_sistema_sii_calzada1
Topicos de ingeneria_de_sistema_sii_calzada1
 
1 caracteristicas y_tipos_de_bases_de_datos
1 caracteristicas y_tipos_de_bases_de_datos1 caracteristicas y_tipos_de_bases_de_datos
1 caracteristicas y_tipos_de_bases_de_datos
 
1 caracteristicas y_tipos_de_bases_de_datos
1 caracteristicas y_tipos_de_bases_de_datos1 caracteristicas y_tipos_de_bases_de_datos
1 caracteristicas y_tipos_de_bases_de_datos
 
Base de datos
Base de datosBase de datos
Base de datos
 
Presentación Sistemas
Presentación SistemasPresentación Sistemas
Presentación Sistemas
 

Último

Gastos que no forman parte del Valor en Aduana de la mercadería importada
Gastos que no forman parte del Valor en Aduana de la mercadería importadaGastos que no forman parte del Valor en Aduana de la mercadería importada
Gastos que no forman parte del Valor en Aduana de la mercadería importadaInstituto de Capacitacion Aduanera
 
La electrónica y electricidad finall.pdf
La electrónica y electricidad finall.pdfLa electrónica y electricidad finall.pdf
La electrónica y electricidad finall.pdfDiegomauricioMedinam
 
PPT Empresas IANSA Sobre Recursos Humanos.pdf
PPT Empresas IANSA Sobre Recursos Humanos.pdfPPT Empresas IANSA Sobre Recursos Humanos.pdf
PPT Empresas IANSA Sobre Recursos Humanos.pdfihmorales
 
u1_s4_gt_la demanda y la oferta global_b27t9rulx9 (1).pptx
u1_s4_gt_la demanda y la oferta global_b27t9rulx9 (1).pptxu1_s4_gt_la demanda y la oferta global_b27t9rulx9 (1).pptx
u1_s4_gt_la demanda y la oferta global_b27t9rulx9 (1).pptxUrabeSj
 
Proyecto TRIBUTACION APLICADA-1.pdf impuestos nacionales
Proyecto TRIBUTACION APLICADA-1.pdf impuestos nacionalesProyecto TRIBUTACION APLICADA-1.pdf impuestos nacionales
Proyecto TRIBUTACION APLICADA-1.pdf impuestos nacionalesjimmyrocha6
 
Habilidades de un ejecutivo y sus caracteristicas.pptx
Habilidades de un ejecutivo y sus caracteristicas.pptxHabilidades de un ejecutivo y sus caracteristicas.pptx
Habilidades de un ejecutivo y sus caracteristicas.pptxLUISALEJANDROPEREZCA1
 
CADENA DE SUMINISTROS DIAPOSITIVASS.pptx
CADENA DE SUMINISTROS DIAPOSITIVASS.pptxCADENA DE SUMINISTROS DIAPOSITIVASS.pptx
CADENA DE SUMINISTROS DIAPOSITIVASS.pptxYesseniaGuzman7
 
20240418-CambraSabadell-SesInf-AdopTecnologica-CasoPractico.pdf
20240418-CambraSabadell-SesInf-AdopTecnologica-CasoPractico.pdf20240418-CambraSabadell-SesInf-AdopTecnologica-CasoPractico.pdf
20240418-CambraSabadell-SesInf-AdopTecnologica-CasoPractico.pdfRamon Costa i Pujol
 
PROCESO PRESUPUESTARIO - .administracion
PROCESO PRESUPUESTARIO - .administracionPROCESO PRESUPUESTARIO - .administracion
PROCESO PRESUPUESTARIO - .administracionDayraCastaedababilon
 
PRESENTACIÓN NOM-004-STPS-2020 SEGURIDAD EN MAQUINARIA
PRESENTACIÓN NOM-004-STPS-2020 SEGURIDAD EN MAQUINARIAPRESENTACIÓN NOM-004-STPS-2020 SEGURIDAD EN MAQUINARIA
PRESENTACIÓN NOM-004-STPS-2020 SEGURIDAD EN MAQUINARIAgisellgarcia92
 
El MCP abre convocatoria de Monitoreo Estratégico y apoyo técnico
El MCP abre convocatoria de Monitoreo Estratégico y apoyo técnicoEl MCP abre convocatoria de Monitoreo Estratégico y apoyo técnico
El MCP abre convocatoria de Monitoreo Estratégico y apoyo técnicoTe Cuidamos
 
¿ESTÁ PREPARADA LA LOGÍSTICA PARA EL DECRECIMIENTO?
¿ESTÁ PREPARADA LA LOGÍSTICA PARA EL DECRECIMIENTO?¿ESTÁ PREPARADA LA LOGÍSTICA PARA EL DECRECIMIENTO?
¿ESTÁ PREPARADA LA LOGÍSTICA PARA EL DECRECIMIENTO?Michael Rada
 
Tema Documentos mercantiles para uso de contabilidad.pdf
Tema Documentos mercantiles para uso de contabilidad.pdfTema Documentos mercantiles para uso de contabilidad.pdf
Tema Documentos mercantiles para uso de contabilidad.pdfmaryisabelpantojavar
 
Coca cola organigrama de proceso empresariales.pptx
Coca cola organigrama de proceso empresariales.pptxCoca cola organigrama de proceso empresariales.pptx
Coca cola organigrama de proceso empresariales.pptxJesDavidZeta
 
Mapa Conceptual relacionado con la Gerencia Industrial, su ámbito de aplicaci...
Mapa Conceptual relacionado con la Gerencia Industrial, su ámbito de aplicaci...Mapa Conceptual relacionado con la Gerencia Industrial, su ámbito de aplicaci...
Mapa Conceptual relacionado con la Gerencia Industrial, su ámbito de aplicaci...antonellamujica
 
Elección supervisor y comité SST 2020.pptx
Elección supervisor y comité SST 2020.pptxElección supervisor y comité SST 2020.pptx
Elección supervisor y comité SST 2020.pptxDiegoQuispeHuaman
 
estadistica funcion distribucion normal.ppt
estadistica funcion distribucion normal.pptestadistica funcion distribucion normal.ppt
estadistica funcion distribucion normal.pptMiguelAngel653470
 
SISTEMA FINANCIERO PERÚ. Institución privada
SISTEMA FINANCIERO PERÚ. Institución privadaSISTEMA FINANCIERO PERÚ. Institución privada
SISTEMA FINANCIERO PERÚ. Institución privadaBetlellyArteagaAvila
 
Derechos de propiedad intelectual lo mejor
Derechos de propiedad intelectual lo mejorDerechos de propiedad intelectual lo mejor
Derechos de propiedad intelectual lo mejorMarcosAlvarezSalinas
 
AFILIACION CAJA NACIONAL DE SALUD WOM 1 .pdf
AFILIACION CAJA NACIONAL DE SALUD WOM 1 .pdfAFILIACION CAJA NACIONAL DE SALUD WOM 1 .pdf
AFILIACION CAJA NACIONAL DE SALUD WOM 1 .pdfOdallizLucanaJalja1
 

Último (20)

Gastos que no forman parte del Valor en Aduana de la mercadería importada
Gastos que no forman parte del Valor en Aduana de la mercadería importadaGastos que no forman parte del Valor en Aduana de la mercadería importada
Gastos que no forman parte del Valor en Aduana de la mercadería importada
 
La electrónica y electricidad finall.pdf
La electrónica y electricidad finall.pdfLa electrónica y electricidad finall.pdf
La electrónica y electricidad finall.pdf
 
PPT Empresas IANSA Sobre Recursos Humanos.pdf
PPT Empresas IANSA Sobre Recursos Humanos.pdfPPT Empresas IANSA Sobre Recursos Humanos.pdf
PPT Empresas IANSA Sobre Recursos Humanos.pdf
 
u1_s4_gt_la demanda y la oferta global_b27t9rulx9 (1).pptx
u1_s4_gt_la demanda y la oferta global_b27t9rulx9 (1).pptxu1_s4_gt_la demanda y la oferta global_b27t9rulx9 (1).pptx
u1_s4_gt_la demanda y la oferta global_b27t9rulx9 (1).pptx
 
Proyecto TRIBUTACION APLICADA-1.pdf impuestos nacionales
Proyecto TRIBUTACION APLICADA-1.pdf impuestos nacionalesProyecto TRIBUTACION APLICADA-1.pdf impuestos nacionales
Proyecto TRIBUTACION APLICADA-1.pdf impuestos nacionales
 
Habilidades de un ejecutivo y sus caracteristicas.pptx
Habilidades de un ejecutivo y sus caracteristicas.pptxHabilidades de un ejecutivo y sus caracteristicas.pptx
Habilidades de un ejecutivo y sus caracteristicas.pptx
 
CADENA DE SUMINISTROS DIAPOSITIVASS.pptx
CADENA DE SUMINISTROS DIAPOSITIVASS.pptxCADENA DE SUMINISTROS DIAPOSITIVASS.pptx
CADENA DE SUMINISTROS DIAPOSITIVASS.pptx
 
20240418-CambraSabadell-SesInf-AdopTecnologica-CasoPractico.pdf
20240418-CambraSabadell-SesInf-AdopTecnologica-CasoPractico.pdf20240418-CambraSabadell-SesInf-AdopTecnologica-CasoPractico.pdf
20240418-CambraSabadell-SesInf-AdopTecnologica-CasoPractico.pdf
 
PROCESO PRESUPUESTARIO - .administracion
PROCESO PRESUPUESTARIO - .administracionPROCESO PRESUPUESTARIO - .administracion
PROCESO PRESUPUESTARIO - .administracion
 
PRESENTACIÓN NOM-004-STPS-2020 SEGURIDAD EN MAQUINARIA
PRESENTACIÓN NOM-004-STPS-2020 SEGURIDAD EN MAQUINARIAPRESENTACIÓN NOM-004-STPS-2020 SEGURIDAD EN MAQUINARIA
PRESENTACIÓN NOM-004-STPS-2020 SEGURIDAD EN MAQUINARIA
 
El MCP abre convocatoria de Monitoreo Estratégico y apoyo técnico
El MCP abre convocatoria de Monitoreo Estratégico y apoyo técnicoEl MCP abre convocatoria de Monitoreo Estratégico y apoyo técnico
El MCP abre convocatoria de Monitoreo Estratégico y apoyo técnico
 
¿ESTÁ PREPARADA LA LOGÍSTICA PARA EL DECRECIMIENTO?
¿ESTÁ PREPARADA LA LOGÍSTICA PARA EL DECRECIMIENTO?¿ESTÁ PREPARADA LA LOGÍSTICA PARA EL DECRECIMIENTO?
¿ESTÁ PREPARADA LA LOGÍSTICA PARA EL DECRECIMIENTO?
 
Tema Documentos mercantiles para uso de contabilidad.pdf
Tema Documentos mercantiles para uso de contabilidad.pdfTema Documentos mercantiles para uso de contabilidad.pdf
Tema Documentos mercantiles para uso de contabilidad.pdf
 
Coca cola organigrama de proceso empresariales.pptx
Coca cola organigrama de proceso empresariales.pptxCoca cola organigrama de proceso empresariales.pptx
Coca cola organigrama de proceso empresariales.pptx
 
Mapa Conceptual relacionado con la Gerencia Industrial, su ámbito de aplicaci...
Mapa Conceptual relacionado con la Gerencia Industrial, su ámbito de aplicaci...Mapa Conceptual relacionado con la Gerencia Industrial, su ámbito de aplicaci...
Mapa Conceptual relacionado con la Gerencia Industrial, su ámbito de aplicaci...
 
Elección supervisor y comité SST 2020.pptx
Elección supervisor y comité SST 2020.pptxElección supervisor y comité SST 2020.pptx
Elección supervisor y comité SST 2020.pptx
 
estadistica funcion distribucion normal.ppt
estadistica funcion distribucion normal.pptestadistica funcion distribucion normal.ppt
estadistica funcion distribucion normal.ppt
 
SISTEMA FINANCIERO PERÚ. Institución privada
SISTEMA FINANCIERO PERÚ. Institución privadaSISTEMA FINANCIERO PERÚ. Institución privada
SISTEMA FINANCIERO PERÚ. Institución privada
 
Derechos de propiedad intelectual lo mejor
Derechos de propiedad intelectual lo mejorDerechos de propiedad intelectual lo mejor
Derechos de propiedad intelectual lo mejor
 
AFILIACION CAJA NACIONAL DE SALUD WOM 1 .pdf
AFILIACION CAJA NACIONAL DE SALUD WOM 1 .pdfAFILIACION CAJA NACIONAL DE SALUD WOM 1 .pdf
AFILIACION CAJA NACIONAL DE SALUD WOM 1 .pdf
 

PPTS establecida para los manuales del DAT New.ppt

  • 1. División de Alta Tecnología FUNDAMENTOS DE APLICACIONES BUSINESS INTELLIGENCE
  • 2. División de Alta Tecnología Introducción al Business Intelligence 1. ¿Qué es Business Intelligence? 2. Historia y Evolución de los conceptos de BI 3. Conceptos y Terminología BI: OLTP, OLAP, Data Warehouse, Datamart, Metadata
  • 3. División de Alta Tecnología ¿Qué es Business Intelligence? Business Intelligence o Inteligencia de Negocios, consiste en el proceso de transformación de datos en información, haciendo uso de técnicas de Extracción, Transformación y Carga (ETL), proporcionando información validada para una adecuada toma de decisiones y de manera oportuna.
  • 4. División de Alta Tecnología ¿El valor de la Información? “Transformación Ascendente” DATOS INFORMACION INTELIGENCIA CONOCIMIENTO SABIDURIA
  • 5. División de Alta Tecnología ¿El valor de la Información?  Asignación de valor: Ley de oferta y demanda?  Preguntas claves:  ¿Qué influencia la compra y la demanda?  ¿Qué productos me generan más ingresos?  ¿En dónde hay oportunidades de negocio?  ¿Cómo segmento mis clientes según su comportamiento comercial?  ¿Qué es lo que mueve la calidad del producto y la demanda de los clientes?  “Era de la Información”, la información tiene un valor monetario.
  • 6. División de Alta Tecnología Las Organizaciones y sus Requerimientos de S.I.  Las empresas al querer contar con una mayor automatización en sus procesos, implementan dentro de su organización una gran infraestructura tecnológica.  Sistemas de Procesamiento de Datos (SPD)  Administración de Recursos Empresariales (ERP)  Sistemas de Información Ejecutiva (EIS)  Sistemas de Soporte a Decisiones (DSS)  Manejo de Relación con Clientes (CRM)
  • 7. División de Alta Tecnología ¿ Qué información se necesita?  Antiguamente:  Toma de decisiones = INTUICIÓN , BASADA EN LA EXPERIENCIA  Actualmente:  Más personas toman decisiones  Deben tener información OPORTUNA Y DE CALIDAD
  • 8. División de Alta Tecnología Requerimientos Informativos en la Piramide Organizacional Analistas Consumidore s de Información Exploradores de Información 5-10% de los usuarios 15-25% de los usuarios 65-80% de los usuarios Nivel Estratégico Nivel Táctico Nivel Operacional
  • 9. División de Alta Tecnología Historia y Evolución de los conceptos de BI Conceptos de Business Intelligence  Fenicios, persas, egipcios y otros pueblos usaban informaciones obtenidas de la naturaleza en beneficio propio  Mareas  Sequías  Lluvias  Posición de los astros
  • 10. División de Alta Tecnología Historia y Evolución de los conceptos de BI Conceptos de Business Intelligence  Después de la conquista de América, se crea en España la "Casa del Oro“  Las nuevas tecnologías tales como, almacenamiento en tarjetas perforadas, Bases de Datos lineales y Lenguajes de Cuarta Generación (4GL), permitieron darle al usuario la facilidad de tener el control directo de los sistemas y de la información.
  • 11. División de Alta Tecnología Historia y Evolución de los conceptos de BI  En los 70’s se da un gran salto al aparecer los dispositivos de Acceso Directo (DASD)  En los 90’s las grandes empresas contaban con Centros de Información. Conceptos de Business Intelligence
  • 12. División de Alta Tecnología Historia y Evolución de los conceptos de BI Conceptos de Business Intelligence  El concepto de Data Warehouse nace entre los años 1992 y 1993 como base del desarrollo de soluciones Business Intelligence.  En 1996 el concepto de Business Intelligence empezó a difundirse como una evolución de los Executive Information Systems (EIS).
  • 13. División de Alta Tecnología Historia y Evolución de los conceptos de BI Conceptos de Business Intelligence  El término Business Intelligence se extendió hacia otras herramientas como:  EIS (sistema de información ejecutiva)  DSS (sistema de soporte a las decisiones)  Balanced Scorecad (indicadores de gestión)  Dashboard (cuadros de mandos)  ER (reporteadores empresariales)  Data Marts, Data Mining, Herramientas OLAP
  • 14. División de Alta Tecnología Historia y Evolución de los conceptos de BI Conceptos de Business Intelligence  Los sistemas de Planeamiento de Recursos Empresariales o Enterprise Resource Planning (ERP), tienen como función principal dar soporte a la parte operativa de las diferentes áreas de la organización, y se encuentra muy ligada con la historia del Business Intelligence.
  • 15. División de Alta Tecnología ERP El reto es unir elementos de las áreas y proporcionarle a los usuarios una manera universal de utilizar la información almacenada en diferentes sistemas. Utiliza la información a través de la organización de forma más proactiva en áreas claves.
  • 16. División de Alta Tecnología Conceptos y Terminología BI:  OLTP  OLAP  Data Warehouse  Datamart  Metadata
  • 17. División de Alta Tecnología On Line Transacction Processing (OLTP) Características  Diseño orientado a la transacción.  Volatilidad de los datos.  Proporciona soporte muy limitado a la toma de decisiones.
  • 18. División de Alta Tecnología On Line Analytical Processing (OLAP) OnLine Analytical Processing (OLAP) es un proceso en el que se usan herramientas netamente análiticas, que facilitan el análisis de la información del negocio. Se halla organizada en entidades y métricas, que permiten al usuario flexibilidad en la ejecución de consultas complejas.
  • 19. División de Alta Tecnología OLAP Los servicios OLAP proveen de múltiples niveles de análisis entre los cuales podemos mencionar, además de tener la capacidad de realizar consultas complejas, el realizar actividades intensivas de comparación de datos, análisis de tendencias, reportes, etc.
  • 20. División de Alta Tecnología OLAP Características Es consolidada. La data se agrupada desde todas las áres de la organización y almacenada en un repositorio central y único. Es consistente. Todos los usuarios deben obtener la misma versión de los datos independientemente de donde provengan o cuando hallan sido procesadas. Es orientada al objetivo. Sólo debe contener información importante que permita la toma de decisiones.
  • 21. División de Alta Tecnología OLAP Características Es histórica. Toda la información de la empresa es almacenada como fotografías en el repositorio único de datos. Es de solo lectura. El sistema OLAP es exclusivamente sólo para consultas. No es atómica. La data OLAP principalmente contiene data sumirazada y resumida.
  • 22. División de Alta Tecnología OLAP
  • 23. División de Alta Tecnología OLAP. Un ejemplo Ejemplo: Una cadena de tiendas de alquiler de videos muestra el siguiente cuadro mensual, con las cantidades de videos alquilados por cada una de sus sucursales.
  • 24. División de Alta Tecnología OLAP. Un ejemplo Sin embargo, la tienda de alquiler de videos también desearía ver como se desarrollan las ventas en el tiempo.
  • 25. División de Alta Tecnología OLAP Las mismas celdas de datos se visualizan mediante un cubo.
  • 26. División de Alta Tecnología OLAP
  • 27. División de Alta Tecnología Modelos de Almacenamiento  OLAP Relacional (ROLAP)  OLAP Multidimensional (MOLAP)  OLAP Híbrido (HOLAP)  OLAP de Escritorio (DOLAP)  OLAP Local (LOLAP)
  • 28. División de Alta Tecnología ROLAP OLAP Relacional (ROLAP) es un sistema en el cual los datos se encuentran almacenados en una base de datos relacional. Típicamente, los datos son detallados, evitando las agregaciones y las tablas se encuentran normalizadas. Los esquemas más comunes sobre los que se trabaja son estrella o copo de nieve, aunque es posible trabajar sobre cualquier base de datos relacional.
  • 29. División de Alta Tecnología ROLAP La arquitectura ROLAP está compuesta por un servidor de base de datos Relacional y un motor OLAP en un servidor dedicado. Esta arquitectura está diseñada para almacenar gran volumen de datos, debido a que su almacenamiento es relacional.
  • 30. División de Alta Tecnología MOLAP En un sistema OLAP multidimensional (MOLAP) los datos se encuentran almacenados en una estructura multidimensional. Para optimizar los tiempos de respuesta, el resumen de la información es usualmente calculado por adelantado. Estos valores precalculados o agregaciones son la base de las ganancias de desempeño de este sistema. Algunos sistemas utilizan técnicas de compresión de datos para disminuir el espacio de almacenamiento en disco debido a los valores precalculados.
  • 31. División de Alta Tecnología HOLAP Un sistema OLAP Híbrido (HOLAP) mantiene los registros detallados en la base de datos relacional, mientras que los datos resumidos o agregados se almacenan en una base de datos multidimensional separada. Este método de almacenamiento es una combinación de los dos anteriores e intenta rescatar lo mejor de cada uno.
  • 32. División de Alta Tecnología DOLAP y LOLAP Las Desktop Online Analytical Processing (DOLAP) y Local Online Analytical Processing (LOLAP) se almacena en la estación de trabajo del cliente (que puede ser una PC común). Este tipo de cubos de información envían al servidor relacional instruciones SQL desde una estación de trabajo y reciben los datos almacenándolos como micro cubos los cuales son analizados de manera local. Entre sus desventajas es que el cubo offline no puede ser muy grande y al estar almacenado en la pc del cliente pueden presentarse problemas de seguridad.
  • 33. División de Alta Tecnología ARQUITECTURAS OLAP
  • 34. División de Alta Tecnología OLTP vs OLAP  Difieren en arquitectura y uso.  Entre los numerosos puntos de diferencias se encuentran:  Los objetivos principales  La orientación de los datos  La integración  La historicidad  El acceso de datos y manipulación  Los patrones de uso  La granularidad de los datos  El perfil de los usuarios  La metodología de desarrollo, etc.
  • 35. División de Alta Tecnología OLTP vs OLAP  Objetivos principales de construcción  Los OLTP están orientados a dar soporte a las operaciones diarias del negocio. Las aplicaciones OLAP se orientan a asistir en el análisis del negocio (consultas).
  • 36. División de Alta Tecnología OLTP vs OLAP  Alineación de datos  Los OLTP están orientados a aplicaciones o sistemas los cuales poseen distintos tipos de datos y diferentes y estructurados para registrar las trascancciones diarias del negocio.  Los sistemas OLAP están alineados por área o tema y están orientados a la consulta del analista de negocio.
  • 37. División de Alta Tecnología OLTP vs. OLAP OLTP OLAP
  • 38. División de Alta Tecnología OLTP vs. OLAP  Integración de datos  En los OLTP, los datos se encuentran dispersos, son calificados como datos base o datos operacionales. Estos datos son estructurados en forma aislada uno de otros, pudiendo tener diferentes estructuras de llaves y nombres.  En los ambientes OLAP, los datos deben estar integrados, consolidados y orientados a un tema o área de análisis.
  • 39. División de Alta Tecnología OLTP vs. OLAP  Acceso y manipulación de los datos  Los sistemas operacionales realizan operaciones con los datos fila por fila usando genaralmente sentencias inserts, updates y deletes. Además requieren de rutinas de validación como son el commit y el rollback, los bloqueos de registros, etc.  Los sistemas OLAP tienen una carga y acceso masivo de datos, haciendo uso principalmente de sentencias select.
  • 40. División de Alta Tecnología OLTP vs. OLAP  Granularidad de los datos  Los sistemas OLTP se encuentran los datos a nivel atómico (transacción por transacción).  Los sistemas OLAP tienen adicionalmente de data detallada, datos sumarizados y agregados.
  • 41. División de Alta Tecnología Sistemas OLTP vs OLAP
  • 42. División de Alta Tecnología Sistemas OLTP vs OLAP Transaccionales: OLTP Análisis: OLAP Se definen entidades normalizadas Se definen entidades desnormalizadas Se normaliza hasta la tercera forma Diseños complejos de base de datos Define diseños sencillos de base de datos fáciles de entender por los usuarios Almacena información al menor nivel de detalle transaccional Almacena datos a nivel transaccional y totalizados Incrementa el número de joins Reduce el número de joins Normalmente es estático Normalmente es dinámico Comparación de los modelos de base de datos
  • 43. División de Alta Tecnología Data Warehouse  Ralph Kimball: “un data warehouse es una ‘copia’ de los datos transaccionales específicamente estructurados para consultas y análisis”.
  • 44. División de Alta Tecnología Data Warehousing “A Warehouse is a place, Warehousing is a process” [R.Hackathorn]  Existe una gran cantidad de procesos detrás de una arquitectura de Data Warehouse de suma importancia para el mismo. Estos comprenden desde procesos de extracción que estudian y seleccionan los datos fuente adecuados para el Data Warehouse hasta procesos de consulta y análisis de datos que despliegan la información de una forma fácil de interpretar y analizar.  A continuación pasaremos a explicar los procesos básicos de una Data Warehouse: Extracción, Transformación, Carga e Indices, Chequeo de Calidad, Liberación/Publicación, Consulta, Feedback, Auditoria, Seguridad, Respaldo y Recuperación.
  • 45. División de Alta Tecnología Datamart  Un Datamart es un Data Warehouse mas pequeño.Normalmente la información contenida en un datamart es un subconjunto de un datawarehouse.
  • 46. División de Alta Tecnología Metadata  Es un componente muy valioso para el Data Warehouse; los datos provenientes de la metadata se sitúa en una dimensión diferente al de otros datos del data warehouse, debido a que su contenido no es tomado directamente desde el ambiente operacional.
  • 47. División de Alta Tecnología Introducción al Data Warehouse 1. ¿Qué es un Data Warehouse? 2. Etapas de un Proceso Data Warehousing (Metodología Ralph Kimball)
  • 48. División de Alta Tecnología ¿Qué es un Data Warehouse?  Un Data Warehouse (DWH) es un repositorio central que contiene la información más valiosa de la empresa. Los datos que aquí se almacenan han pasado por un proceso de calidad que asegura su consistencia. Además, el repositorio está construido de tal manera que el acceso sea lo más rápido posible. Data Warehouse Acceso a los datos Usuario Acceso a datos Fuentes de datos Entrada de datos Area de preparación Data Marts Data Warehouse Data Warehouse Acceso a los datos Usuario Acceso a datos Fuentes de datos Acceso a los datos Acceso a los datos Usuario Acceso a datos Fuentes de datos Entrada de datos Area de preparación Entrada de datos Area de preparación Area de preparación Data Marts Data Marts Data Marts Componentes de un sistema Datawarehouse
  • 49. División de Alta Tecnología Etapas de un Proceso Data Warehousing (Metodología Ralph Kimball)  El marco presentado por Ralph Kimball bajo el nombre de Business Dimensional Lifecycle (BDL) ilustra las diferentes etapas por las que debe pasar todo proceso de Data Warehousing. Este enfoque de implementación de Data Warehouses es ilustrado en la siguiente figura: Business Dimensional Lifecycle propuesto por Ralph Kimball
  • 50. División de Alta Tecnología Planificación del Proyecto  La planificación busca identificar la definición y el alcance del proyecto de Data Warehouse, incluyendo justificaciones del negocio y evaluaciones de factibilidad. La planificación del proyecto se focaliza sobre recursos, perfiles, tareas, duraciones y secuencialidad. El plan de proyecto resultante identifica todas las tareas asociadas con el BDL e identifica las partes involucradas.
  • 51. División de Alta Tecnología Definición de los Requerimientos del Negocio  Un factor determinante en el éxito de un proceso de Data Warehousing es la interpretación correcta de los diferentes niveles de requerimientos, expresados por los diferentes niveles de usuarios. La técnica utilizada para relevar los requerimientos de los analistas del negocio difiere de los enfoques tradicionales guiados por los datos. Los diseñadores de los Data Warehouses deben entender los factores claves que guían al negocio para determinar efectivamente los requerimientos y traducirlos en consideraciones de diseño apropiadas.
  • 52. División de Alta Tecnología Modelado Dimensional  La definición de los requerimientos del negocio determina los datos necesarios para cumplir los requerimientos analíticos de los usuarios.  Diseñar los modelos de datos para soportar estos análisis requieren un enfoque diferente al usado en los sistemas operacionales.  Básicamente se comienza con una matriz donde se determina la dimensionalidad de cada indicador y luego se especifican los diferentes grados de detalle (atributos) dentro de cada concepto del negocio (dimensión), como así también la granularidad de cada indicador (variable o métrica) y las diferentes jerarquías que dan forma al Modelo Dimensional del Negocio (BDM) o Mapa Dimensional.
  • 53. División de Alta Tecnología Diseño Físico  El diseño físico de las base de datos se focaliza sobre la selección de las estructuras necesarias para soportar el diseño lógico.
  • 54. División de Alta Tecnología Diseño y Desarrollo de Presentación de Datos  Esta etapa es una de las más subestimadas de las tareas en un proyecto de Data Warehouse. Las principales sub etapas de esta zona del ciclo de vida son: la extracción, la transformación y la carga (ETL process). Se definen como procesos de extracción a aquellos requeridos para obtener los datos que permitirán efectuar la carga del Modelo Físico acordado. Así mismo, se definen como procesos de transformación a los procesos para convertir o recodificar los datos fuente a fin poder efectuar la carga efectiva del Modelo Físico. Por otra parte, los procesos de carga de datos son los procesos requeridos para poblar el Data Warehouse.
  • 55. División de Alta Tecnología Diseño y Desarrollo de Presentación de Datos  Como advierte Kimball (1998), el proceso de Data Staging es el iceberg de un proyecto de Data Warehousing. Son muchos los desafíos que deben enfrentarse para lograr datos de alta calidad de los sistemas fuentes. Es una de las etapas más subestimadas, que siempre termina tomando más tiempo del previsto. Ralph Kimball propone un plan de 10 ítems que ayudarán a guiar esta etapa del BDL.
  • 56. División de Alta Tecnología Diseño de la Arquitectura Técnica  Los ambientes de Data Warehousing requieren la integración de numerosas tecnologías. Se debe tener en cuenta tres factores: los requerimientos del negocio, los actuales ambientes técnicos y las directrices técnicas estratégicas futuras planificadas para de esta forma poder establecer el diseño de la arquitectura técnica del ambiente de Data Warehousing.
  • 57. División de Alta Tecnología Selección de Productos e Instalación  Utilizando el diseño de arquitectura técnica como marco, es necesario evaluar y seleccionar componentes específicos de la arquitectura como será la plataforma de hardware, el motor de base de datos, la herramienta de ETL o el desarrollo pertinente, herramientas de acceso, etc.
  • 58. División de Alta Tecnología Especificación de Aplicaciones para Usuarios Finales  No todos los usuarios del Data Warehouse necesitan el mismo nivel de análisis. Es por ello que en esta etapa se identifican los diferentes roles o perfiles de usuarios para determinar los diferentes tipos de aplicaciones necesarias en base al alcance de los diferentes perfiles (gerencial, analista del negocio, vendedor, etc.)  Kimball se concentra sobre el proceso de creación de aplicaciones “Templates”.  Comienza definiendo el concepto de la aplicación para usuario final y su rol en el acceso a la información del negocio.  Brinda un marco metodológico bastante estándar en lo que a desarrollo de aplicaciones (como piezas de software) se refiere.
  • 59. División de Alta Tecnología Desarrollo de Aplicaciones para Usuarios Finales  Siguiendo a la especificación de las aplicaciones para usuarios finales, el desarrollo de las aplicaciones de los usuarios finales involucra configuraciones del metadata y construcción de reportes específicos.  Una vez que se ha cumplido con todos los pasos de la especificación y se tiene la posibilidad de trabajar con algunos datos de prueba, comienza el desarrollo de la aplicación (Kimball, 1998)
  • 60. División de Alta Tecnología Implementación  La implementación representa la analogía de la tecnología, los datos y las aplicaciones de usuarios finales accesibles desde el escritorio del usuario del negocio.  Hay varios factores extras que aseguran el correcto funcionamiento de todas estas piezas, entre ellos se encuentran la capacitación, el soporte técnico, la comunicación, las estrategias de feedback.  Todas estas tareas deben ser tenidas en cuenta antes de que cualquier usuario pueda tener acceso al Data Warehouse.
  • 61. División de Alta Tecnología Mantenimiento y crecimiento  Data Warehousing es un proceso (de etapas bien definidas, con comienzo y fin, pero de naturaleza espiral) pues acompaña a la evolución de la organización durante toda su historia.  Se necesita continuar con los relevamientos de forma constante para poder seguir la evolución de las metas por conseguir.  Según afirma Kimball (1998), “si se ha utilizado el BDL el Data Warehouse está preparado para evolucionar y crecer”.  Al contrario de los sistemas tradicionales, los cambios en el desarrollo deben ser vistos como signos de éxito y no de falla.  Es importante establecer las prioridades para poder manejar los nuevos requerimientos de los usuarios y de esa forma poder evolucionar y crecer.
  • 62. División de Alta Tecnología Mantenimiento y crecimiento Data Warehousing como proceso de naturaleza espiral El sentido de las flechas fija claramente el concepto evolutivo y espiral del Business Dimensional Lifecycle.(BDL)
  • 63. División de Alta Tecnología Gerenciamiento del Proyecto  El gerenciamiento del proyecto asegura que las actividades del BDL se lleven en forma y sincronizadas.  Entre sus actividades principales se encuentra el monitoreo del proyecto y la comunicación entre los requerimientos del negocio. Asimismo, determina las restricciones de información para poder manejar correctamente las expectativas en ambos sentidos.
  • 64. División de Alta Tecnología Soluciones Business Intelligence 1. Herramientas de BI: Executive Information System (EIS), Decision Support Systems (DSS), Reporting Tools (RT), Data Mining. 2. Componentes de una solución BI. 3. Los 5 estilos de BI: Enterprise Reporting, Análisis con Cubos, Consultas Ad Hoc, Análisis Estadísticos y Data Mining, Envio Proactivo de Alertas. 4. Guia para el desarrollo del BI. 5. Ejemplos de lo que se puede obtener con BI. 6. Productos de software de BI.
  • 65. División de Alta Tecnología Herramientas de Business Intelligence  Dentro del mundo de los negocios y, de las organizaciones en general, la Inteligencia de Negocios, es un concepto respaldado por una nueva manera de hacer las cosas. Esto es posible gracias a los avances de los Sistemas de Información y de las Tecnologías de Información.
  • 66. División de Alta Tecnología Executive Information System (EIS)  El EIS es una herramientas de BI orientada al nivel estratégico de las empresas.  Tiene como objetivo primordial proveer de toda la información necesaria al personal que toma decisiones, de modo fácil y prácticamente sin necesidad de interactuar con el mismo sistema.  En términos formales, "un EIS es un sistema de información que permite a los ejecutivos acceso rápido y efectivo a información compartida, crítica para el negocio, utilizando interfaces gráficas.“  Las interfaces que son utilizadas en estos sistemas deben ser más sofisticadas que los sistemas transaccionales y deben incluir, en el menor número de páginas posible, la mayor cantidad de información que el usuario necesita para monitorear su empresa.
  • 67. División de Alta Tecnología  La diferencia de los EIS con otros sistemas no solo es la vistosidad y facilidad de uso.  Aparte del front-end, los EIS interpretan y manipulan de forma diferente la información, pues trabajan con formatos de datos no típicos, tales como Data Warehouse o Data Mart.  Prácticamente todos los EIS obtienen sus datos de matrices multidimensionales denominadas "cubos" y las herramientas en las que se desarrollan estos sistemas tienen tecnología que permite realizar consultas amplias y complejas de diversas fuentes de datos en tiempos mínimos.  Las partes importantes de un EIS son: la interfaz de usuario y la base de datos multidimensional, esto montado en una arquitectura Cliente/Servidor. Executive Information System (EIS)
  • 68. División de Alta Tecnología Lo que debe contener un EIS  Elementos:  Interfaz gráfica fácil de usar y ver  Alarmas o semáforos  Tableros de control  Administración de una sola Página  Integración de información proveniente de los cubos Elementos de un EIS Fuente: BITAM (business Intelligence Tools)
  • 69. División de Alta Tecnología Decision Support Systems (DSS)  "DSS se refiere a cualquier sistema de software que permite análisis de las diferentes variables del negocio para apoyar una decisión.“  Puede considerarse como un sistema que se basa en un almacén de datos y crea una base de datos multidimensional, permitiéndole al usuario procesar analíticamente la información en línea (OLAP), con la habilidad de poder girar y taladrar dentro de los datos.  Como utilidad al usuario final, un DSS se valora cuando se profundiza en la información para conocer los "porqués a" los indicadores presentados, pero la infraestructura y metodologías que soporten el "taladreo" de información son las que completan el esquema de un DSS y le permiten hacer uso de OLAP, Data Warehouse y otros conceptos asociados.  En términos prácticos, el DSS lo vemos cuando analizamos la información, pero realmente involucra todo un proceso previo antes de poner la información en el escritorio del usuario.
  • 70. División de Alta Tecnología Decision Support Systems (DSS)  Un sistema DSS procesa una transacción por día, pero esa transacción es producto de miles o millones de registros que han sido procesados en el día (puede ser por cualquier periodo de tiempo, pero el común es por día).  En vez de llamarle transacción, se le llama Carga de Información de Producción.  En este caso lo importante es el estado de consistencia de la información antes y después de la carga.  En cuanto a los usuarios y administradores de un DSS, no son los que ingresan cada una de las operaciones en sus PCs, sino los que solicitan una o dos hojas con resúmenes totalizados de miles de operaciones.  El usuario de OLTP cambia con frecuencia el tipo de información que solicita, de ahí que sus requerimientos no sean planeados, sino heurísticos.  Una pantalla de un sistema DSS deberá contener la información sobre el por qué de una tabla o gráfica, con algunos números y pantallas, al momento de pedir información sobre el por qué de determinado dato, podrá accederse a otra pantalla con la explicación y así, sucesivamente, hasta llegar al último detalle.
  • 71. División de Alta Tecnología Decision Support Systems (DSS)  La interpretación y manipulación de la información es muy distinta a los formatos típicos. A pesar de que la capacidad de extracción de datos puede ser de archivos de texto, tablas, etc., la forma de organizar esa información es lo que difiere, pues la mayoría de los DSS organizan la información vía matrices multidimensionales denominadas "cubos". Los cubos organizan la información de tal modo que puedan, posteriormente, 'montarse' herramientas para desarrollar sistemas complejos, que permitan realizar una gran cantidad de cálculos, consolidaciones, consultas y despliegues de información, localizadas en múltiples repositorios en un tiempo mínimo. Arquitectura de un DSS
  • 72. División de Alta Tecnología Lo que debe contener un DSS  Elementos:  Análisis Multidimensional (OLAP)  Proyecciones de Información  Tendencias  What... If Fuente: BITAM (Business Intelligence Tools)
  • 73. División de Alta Tecnología  Las herramientas de consulta y reporteo (Query & Reporting Tools) son una categoría de herramientas de BI.  Con las herramientas de reporteo orientadas al usuario final se pretende eliminar la dependencia del área de sistemas al manejar una capa intermedia entre complejidad técnica y usuario final. Herramientas de Consulta y Reporteo
  • 74. División de Alta Tecnología  Todo usuario depende de los reportes para comunicar lo que está ocurriendo en la empresa vía los almacenes de información.  Los reportes tienen en las bases de datos su principal fuente de alimentación y han brindado la posibilidad de consultar y publicar lo que las bases de datos poseen.  Los reportes son requeridos por muchas personas en una organización.  El tiempo de respuesta en la obtención de ellos marca la diferencia entre el éxito o fracaso de un proyecto. Herramientas de Reporteo
  • 75. División de Alta Tecnología  Intuitivo  Seguridad  Publicación y distribución  Navegación  Reportes por excepción  Reportes dinámicos  Programación automática Características de una herramienta de reporteo
  • 76. División de Alta Tecnología Proceso de Data Mining Data Mining (DM)
  • 77. División de Alta Tecnología Fases de un Proyecto de DM  Los pasos a seguir para la realización de un proyecto de minería de datos son siempre los mismos, independientemente de la técnica específica de extracción de conocimiento usada.  Filtrado de datos  Selección de variables  Extracción del conocimiento  Interpretación y evaluación.
  • 78. División de Alta Tecnología ¿Cómo se desarrollan los sistemas Data Mining? Árbol de predicción, que extrae y analiza datos de una datamart Los sistemas Datamining se desarrollan bajo lenguajes de última generación basados en la inteligencia artificial que utilizan modelos matemáticos tales como:Redes neuronales artificiales, Árboles de decisión, Algoritmos genéticos,Regla de inducción y Método del vecino más cercano.
  • 79. División de Alta Tecnología Herramientas del Data Mining  Las herramientas de Data Mining predicen futuras tendencias y comportamientos, permitiendo en los negocios tomar decisiones proactivas y conducidas por un conocimiento acabado de la información (knowledge- driven).  Estas herramientas exploran las bases de datos en busca de patrones ocultos, encontrando información predecible que un experto no puede llegar a encontrar porque se encuentra fuera de su alcance.  Las herramientas de Data Mining pueden analizar bases de datos masivas para brindar respuesta a preguntas tales como:  "¿Qué clientes tienen más probabilidad de responder al próximo mailing promocional, y por qué? y presentar los resultados en formas de tablas, con gráficos, reportes, texto, hipertexto, etc.
  • 80. División de Alta Tecnología Herramientas del Data Mining  Ejemplos de las preguntas que se pueden responder con las herramientas de Data Mining:  ¿Qué características tienen mis mejores clientes?  ¿Qué características tienen los clientes que estoy perdiendo?  ¿A quiénes debería dirigir mi campaña publicitaria?  Ejemplos de las preguntas que se pueden responder con las herramientas de Data Mining:  ¿Cuáles son los factores que inciden en que algunas máquinas tengan mayores tasas de fallas que otras?  ¿A quiénes no debo venderles seguros contra todo riesgo?  ¿Qué factores inciden en el aumento de la tasa de fallas?
  • 81. División de Alta Tecnología  Todas las soluciones de BI tienen funciones parecidas, pero deben de reunir al menos los siguientes componentes:  Multidimensionalidad  Data Mining  Agentes  Data Warehouse Componentes de una solución BI
  • 82. División de Alta Tecnología  Estos cinco estilos representan el espectro completo de la funcionalidad de BI necesaria para dar soporte a las necesidades analíticas, de supervisión y de generación de informes de todos y cada uno de los usuarios empresariales. Los 5 estilos del BI
  • 83. División de Alta Tecnología Los 5 estilos del BI
  • 84. División de Alta Tecnología  Enterprise Reporting Una herramienta Enterprise Reporting debe permitir al usuario crear indicadores, reportes, grillas, gráficos, logos, texto libre y demás objetos sin depender de asistencia de sistemas. De la misma manera debe máximizar todo lo que tenga que ver con la presentación del informe, para incluso, poder visualizarlo de igual modo tanto en la computadora como en una impresión. Los 5 estilos del BI
  • 85. División de Alta Tecnología  Análisis con cubos. Factores determinantes de un buen análisis con cubos:  Rápida performance para niveles sumarizados de información  Cálculos definidos por el usuario  Análisis Offline  Acceso a datos no-relacionales y relacionales  Generación rápida de cubos sin pre-cálculo de datos  Expiración y refresco automático de datos  Creación dinámica por el usuario vía Windows® o Web Los 5 estilos del BI
  • 86. División de Alta Tecnología  Consultas Ad hoc. En toda organización existe un perfil de analista que necesita analizar información a nivel transaccional. Esto no significa, que mire transacción por transacción, sino que el análisis que demanda necesita que la información esté almacenada a nivel transaccional para así lograr obtener análisis de afinidad entre productos, identificar clientes, identificar nuevas oportunidades de venta, etc. Los 5 estilos del BI
  • 87. División de Alta Tecnología  Análisis estadísticos y Data Mining. Comprende la búsqueda de patrones de comportamiento de forma automática. Los usuarios brindan una muestra de datos para que el sistema “aprenda” en base a la búsqueda de patrones de comportamiento similares. Una vez que el sistema “aprende” se le da la muestra real desde donde se quiere inferir cierto comportamiento. Los 5 estilos del BI
  • 88. División de Alta Tecnología Los 5 estilos del BI  Envío proactivo de Alertas Aquí el usuario define exactamente qué información quiere recibir, en qué momento, bajo que formato y por cual medio. Los 5 Estilos de BI han evolucionado para apoyar las diferentes necesidades, del análisis profesional avanzado al consumo de información básico.
  • 89. División de Alta Tecnología Guía para el desarrollo de BI  Introducción:  La mayoría de los proyectos de ingeniería pasan por 6 fases entre el inicio y la implementación. Así mismo, la mayoría de estos procesos son iterativos. Una vez desplegado, un producto se mejora continuamente basado en la retroalimentación. Cada iteración produce una nueva versión del producto.  Las 6 fases de un proyecto de Ingeniería:  Justificación  Planificación  Análisis del Negocio  Diseño  Construcción  Despliegue
  • 90. División de Alta Tecnología Fuente: Business Intelligence Roadmap Autores: Larissa T.Moss / Shaku Atre Guía para el desarrollo de BI Fases de Desarrollo y sus dependencias
  • 91. División de Alta Tecnología Aplicaciones BI
  • 92. División de Alta Tecnología Diseñando las fases y los pasos de desarrollo Los proyectos de BI están organizados de acuerdo a las mismas 6 fases comunes de los procesos de ingeniería mencionados anteriormente, ciertos pasos se llevan a cabo para ver el diseño a través de su realización. Esta guía describirá 16 pasos dentro de estas 6 fases.
  • 93. División de Alta Tecnología Diseñando las fases y los pasos de desarrollo
  • 94. División de Alta Tecnología Diseñando las fases y los pasos de desarrollo
  • 95. División de Alta Tecnología Diseñando las fases y los pasos de desarrollo
  • 96. División de Alta Tecnología Diseñando las fases y los pasos de desarrollo
  • 97. División de Alta Tecnología Diseñando las fases y los pasos de desarrollo
  • 98. División de Alta Tecnología Ejemplos de lo que se puede obtener con Business Intelligence  Mejorar el servicio al cliente  Generar reportes globales o por secciones  Crear escenarios con respecto a una decisión  Hacer pronósticos de ventas y devoluciones  Compartir información entre departamentos  Análisis multidimensionales  Crear una base de datos de clientes (potenciales)  Cambiar la estructura de toma de decisiones
  • 99. División de Alta Tecnología Productos de software de BI
  • 100. División de Alta Tecnología Productos Business Intelligence SAGENT SOLUTION PLATTFORM:
  • 101. División de Alta Tecnología MICROSTRATEGY: Productos Business Intelligence
  • 102. División de Alta Tecnología BUSINESS OBJECTS: Productos Business Intelligence http://www.latam.businessobjects.com/productos/
  • 103. División de Alta Tecnología Productos Business Intelligence http://www.cognos.com/products/cognos8businessintelligence/index.html http://www.cognos.com/es/c8demo/index.html?mc=-web_es_hp COGNOS:
  • 104. División de Alta Tecnología BITAM BUSINESS INTELLIGENCE SUITE: Los productos de BITAM permiten integrar tecnologías OLAP, diferentes plataformas de bases de datos y aplicaciones corporativas de uso diario existentes. Productos Business Intelligence Los productos Artus, Advisor y Papiro permiten a las compañías traducir la información en conocimiento y distribuirlo eficientemente donde las decisiones tienen que tomarse.
  • 105. División de Alta Tecnología Productos Business Intelligence http://www.oracle.com/global/es/consultoria/B_Software.htm ORACLE:
  • 106. División de Alta Tecnología Introducción a la Inteligencia de Negocios  La información cumple un rol vital en el ciclo de vida de toda organización.  Todos los días, las organizaciones producen grandes volúmenes de información, que es utilizada para tomar decisiones de todo tipo.
  • 107. División de Alta Tecnología Características de una solución de Inteligencia de Negocios  Una solución de Inteligencia de Negocios tiene las siguientes características:  Ubica, extrae, transforma y centraliza datos desde múltiples ubicaciones y formatos.  Consolida y estandariza la información.  Proporciona repositorios centralizados de almacenamiento de la información, y herramientas para analizar y explotar dicha información.  La noción generalizada de que los usuarios de las soluciones de Inteligencia de Negocios serán los gerentes y altos directivos de la empresa, es errónea.
  • 108. División de Alta Tecnología Enfoque de la Inteligencia de Negocios en la empresa  El proceso de Inteligencia de Negocios abarca la totalidad de las áreas de interés en una organización.  La figura 1.1 muestra una representación de dicho proceso. Contabilidad (Fox Pro) Logística (SQL Server 6.5) CRM (SQL Server 2005) STAGING AREA ETL ETL DATA MART – DATA WAREHOUSE (Esquemas Star – Snowflake) OLAP – Data Mining Reportes Excel Mobile Devices Excel Figura 1.1: El proceso de la Inteligencia de Negocios
  • 109. División de Alta Tecnología Bases de datos OLAP y OLTP  La siguiente tabla compara las características principales de las bases de datos OLTP y OLAP: Bases de datos OLTP Bases de datos OLAP Frecuencia de actualización Tiempo real Periódica Estructuración Integridad de los datos. Alta normalización Fácil consulta. Información no normalizada. Optimización Procesos transaccionales (modificación de datos) Consultas.
  • 110. División de Alta Tecnología Características especiales de las bases de datos OLAP  Algunas características particulares de una base de datos OLAP son las siguientes:  Datos consolidados y consistentes  Está orientada a temas específicos  Histórica  Es de sólo lectura  Tiene un nivel de granularidad
  • 111. División de Alta Tecnología Ejemplo:  La siguiente tabla que muestra las características esenciales de la información almacenada en Data Marts y Data Warehouses: Característica de los datos Descripción Consolidados Información centralizada de una unidad organizacional o de toda la organización. Cada entidad de negocio está representada de manera única. Por ejemplo, cada cliente está representado por un único registro y una clave uniforme. Consistentes Los resultados son consistentes. Por ejemplo, el total vendido para Lima es la suma de las ventas parciales por distrito. Históricos Copias permanentes de información. Sólo lectura No pueden ser actualizados. Totalizados La información se almacena con un apropiado nivel de detalle, definido en la fase de análisis. Por ejemplo, puede definirse que se almacenarán las ventas semanales, y no la información de cada factura en particular.
  • 112. División de Alta Tecnología Ejemplo: • La ilustración siguiente nos muestra un típico reporte de volúmenes de ventas en diferentes ciudades en un mes específico:
  • 113. División de Alta Tecnología Data Marts & Data Warehouses  Los términos “Data Mart” y “Data Warehouse” pueden causar cierta confusión, debido a que se emplean indistintamente como conceptos equivalentes. A continuación se explicarán las diferencias en el significado de ambas palabras.
  • 114. División de Alta Tecnología Data Marts & Data Warehouses La siguiente figura ilustra el proceso de construcción de Data Marts y Data Warehouses:
  • 115. División de Alta Tecnología El proceso de construcción de un Data Warehouses  Existen dos caminos para la construcción de un Data Warehouse:  Top – Down  Bottom – Up
  • 116. División de Alta Tecnología Enfoque Top – Down: Mover datos del Data Warehouse hacia Data Marts
  • 117. División de Alta Tecnología Enfoque Button – Top: Mover Datos de los Data Marts hacia el Data Warehouse
  • 118. División de Alta Tecnología SQL Server 2005 y el proceso de Inteligencia de Negocios
  • 119. División de Alta Tecnología SQL Server 2005 y el proceso de Inteligencia de Negocios  Las principales herramientas de apoyo en la implementación de soluciones de Inteligencia de Negocios provistas por SQL Server 2005 son:  Database Services  SQL Server Integration Services (SSIS  Analysis Services de SQL Server 2005  Reporting Services de SQL Server 2005
  • 120. División de Alta Tecnología El proceso de la Inteligencia de Negocios  La siguiente exposición se centrará en el proceso de análisis y la determinación de indicadores clave de performance del negocio.  Los pasos principales del proceso de análisis se muestran en el siguiente gráfico:
  • 121. División de Alta Tecnología El proceso de la Inteligencia de Negocios
  • 122. División de Alta Tecnología Alto nivel de análisis de los requerimientos para analizar la información
  • 123. División de Alta Tecnología Roles y Procesos
  • 124. División de Alta Tecnología Identificar los principales indicadores de performance
  • 125. División de Alta Tecnología Identificar los principales indicadores de performance
  • 126. División de Alta Tecnología Identificar los principales indicadores de performance
  • 127. División de Alta Tecnología Dimensiones y Eventos En este punto, ya se cuenta con las bases para formalizar el modelo conceptual.
  • 128. División de Alta Tecnología Fuentes y transformaciones  En esta fase, se identifican las fuentes de datos donde reside la información relevante para la solución de Inteligencia de Negocios. Se determinan también los cambios y transformaciones de datos necesarios para lograr la consistencia de la información. Cada transformación debe documentarse adecuadamente, para facilitar el trabajo técnico de los implementadores.  No es infrecuente descubrir que existe información clave que no se encuentra almacenada en bases de datos relacionales, sino en orígenes atípicos: hojas de cálculo Excel, archivos de texto, documentos Word, etc. Esta información también debe ser transferida al almacén de datos central del Data Mart a través de procesos ETL.
  • 129. División de Alta Tecnología Información de Negocio
  • 130. División de Alta Tecnología Principios de diseño de bases de datos OLAP
  • 131. División de Alta Tecnología El modelo Estrella (STAR)
  • 132. División de Alta Tecnología Componentes de un esquema STAR  A continuación se listan los componentes de un esquema STAR:  Tabla de Hechos  Tablas de Dimensión
  • 133. División de Alta Tecnología Tabla Dimensión  El diseño de las tablas de dimensión es, generalmente, sencillo y de fácil comprensión. Sea, por ejemplo, la dimensión Producto. Los productos de la empresa se agrupan por familias, las cuales contienen subfamilias de productos. Cada subfamilia consta de varias marcas de productos. Finalmente, cada marca contiene múltiples presentaciones de productos. El diseño de la tabla de dimensión PRODUCTO_DIM es:
  • 134. División de Alta Tecnología Tabla de Hechos • Un data mart está constituido por tablas de hechos y tablas de dimensión. Cada tabla de hechos está enlazada con múltiples tablas de dimensión. El siguiente diseño corresponde con una tabla de hechos que almacena información de ventas:
  • 135. División de Alta Tecnología Ejemplo: Modelo Estrella (STAR)
  • 136. División de Alta Tecnología Ejercicio 1: Diseño de un Data Mart para tarjetas de crédito. • El área de tarjetas de crédito de un banco desea implementar un Data Mart. Se desea visualizar la información de créditos concedidos y pagos hasta llegar a cada tarjeta. Las tarjetas pueden ser de dos tipos: “VISA” y “MASTERCARD”. También se desea visualizar los créditos y pagos por cada vendedor y cada cliente. Cada cliente pertenece a un distrito, cada distrito a una provincia y cada provincia a un departamento. Cada vendedor pertenece a una agencia, y cada agencia pertenece a un distrito, cada distrito a una provincia y cada provincia a un departamento. Las métricas deben visualizarse como totalizados anuales, semestrales, trimestrales y mensuales. Diseñe las dimensiones, las medidas y el modelo de datos.
  • 137. División de Alta Tecnología El modelo del STAR para este data mart es: