Introducción Bussines Intelligence

1,144 views
960 views

Published on

Published in: Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
1,144
On SlideShare
0
From Embeds
0
Number of Embeds
6
Actions
Shares
0
Downloads
51
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Introducción Bussines Intelligence

  1. 1. Introducción Bussines Intelligence Jorge Soro Doménech
  2. 2. INDICE  1. SISTEMA OPERACIONAL  2. DATAWAREHOUSE  3. OLTP vs OLAP  4. COMPONENTES DEL SISTEMA  5. MODELO LÓGICO  6. TERMINOLOGÍA  7. HERRAMIENTAS  8. DIFERENTES ENFOQUES
  3. 3. 1. SISTEMA OPERACIONAL OLTP
  4. 4. 1. SISTEMA OPERACIONAL    Generalmente, la información que se quiere investigar sobre un cierto dominio de la organización se encuentra en bases de datos y otras fuentes muy diversas, tanto internas como externas. Muchas de estas fuentes son las que se utilizan para el trabajo transaccional diario (conocido como OLTP, On-Line Transactional Processing). Sobre estas mismas bases de datos de trabajo ya se puede extraer conocimiento (visión tradicional).
  5. 5. 1. SISTEMA OPERACIONAL Problemas para realizar el análisis en este sistema (OLTP):     La información se encuentra en varias y heterogéneas bases de datos y, en consecuencia, no se puede explotar en conjunto. Solo es posible el análisis de los datos actuales, no mantiene valores históricos para tratar evolutivos. Se obstaculiza el trabajo transaccional diario de los sistemas de información originales, no permite el análisis on-line. La base de datos está diseñada para el trabajo transaccional, no para el análisis de los datos.
  6. 6. 2. DATAWAREHOUSE OLAP
  7. 7. 2. DATAWAREHOUSE  Motivación: Disponer de una base de datos que permita extraer conocimiento de la información histórica almacenada en la organización.  Objetivos:  Análisis de la organización  Previsiones de evolución  Diseño de estrategias
  8. 8. 2. DATAWAREHOUSE       Almacén de datos para el análisis y toma de decisiones. Permite realizar análisis on-line, por lo que aumenta el poder de toma de decisiones por parte de los responsables en cuestión Unifica información dispersa de diversos sistemas operacionales Contiene la información relevante de la organización Diseños orientados a conceptos de negocio manejados por el usuario Sistema OLAP (On-Line Analitical Procesing)
  9. 9. 3. OLTP vs OLAP
  10. 10. 3. OLTP vs OLAP Operacional (OLTP) Datawarehouse (OLAP) • Almacén de datos actuales • Almacena datos al detalle • Bases de datos medianas • Los datos son actuales • Los procesos son repetitivos • Tiempo de respuesta pequeño • Soporta decisiones diarias • Almacén de datos históricos • Almacena datos al detalle y datos agregados a distintos niveles • Bases de datos grandes • Los datos son estáticos • Los procesos no son previsibles • Tiempo de respuesta variable • Soporta decisiones estratégicas.
  11. 11. 4. COMPONENTES DE SISTEMA Fuentes externas Presentación de la Información Históricos Datos transaccionales Arquitectura técnica Almacén de datos (DW) ETL Niveles adicionales transformación OLAP Niveles adicionales sumarización Aplicación usuario final Usuario Fuentes de Información Procesos de extracción
  12. 12. 4. COMPONENTES DEL SISTEMA Procesos de extracción (ETL)  Proceso de extracción y carga de la información desde las distintas fuentes origen al Datawarehouse. Incluye las siguientes fases: 1. 2. 3. Extracción: elaboración de interfaces entre sistemas operacionales orígenes de datos Transformación: validación de los datos extraídos, transformándolos al formato deseado Carga: cargar físicamente los datos extraídos de los sistemas operacionales y ya transformados en el modelo de datos del Datawarehouse
  13. 13. 4. COMPONENTES DEL SISTEMA Almacén de datos (Datawarehouse)  Se soporta sobre el modelo físico dimensional diferente de los sistemas de bases de datos que están basados en el modelo Entidad-Relación (E/R). Este modelo contiene la misma información que el modelo E/R pero agrupa los datos con el objetivo de ganar una mayor comprensión para el usuario y garantizar la ejecución rápida y eficiente de las consultas.  Existen dos tecnologías para implementar dicho modelo:   Multidimensional OLAP (MOLAP): se indexa los datos directamente en un modelo multidimensional (cubos) en el cual todas las posibles combinaciones de los datos ya están calculadas en una celda Relational OLAP (ROLAP): implementa las estructuras dimensionales mediante bases de datos con modelos relacionales.
  14. 14. 4. COMPONENTES DEL SISTEMA Presentación de la información  DSS (Decisión Support System):    EIS (Executive Information System):   Informes dinámicos, normalmente para representar un indicador o un grupo de indicadores relacionados funcionalmente en tablas de datos. Además de estos informes predefinidos, los usuarios con capacidades de análisis podrán crear sus propios informes y obtener respuestas en demandas de información puntuales. Informes estáticos, predefinidos, fáciles de manejar y orientados a los directores. Son informes muy visuales (normalmente se utilizan exclusivamente gráficos) y con un nivel alto de agregación de la información. Deben estar orientados a la gestión estratégica. BSC (Balance Scored Card):  Informes estáticos para la gestión estratégica de la empresa. Permite medir el rendimiento de áreas o personas mediante el análisis de diversos de un conjunto de indicadores con valores objetivo y pesos.
  15. 15. 4. COMPONENTES DEL SISTEMA Cuadro de Mando Integral DSS Decision Support System Reporting de Excepción CRC Alta Dirección Analistas lic. Reporting Estándar s Ap Otra GAIA CIRO COMPAS / DM SIA Planificación operativa: Estructura, Actividad Asistencial, RR.HH.,... SIA Gestión Operacional Ag re ga Na ció ve nd ga eI ció nf ne or ma nP SIS AL ció ro fu n nd id ad SIP Gestión Estratégica EIS Executive Information System Nivel Aplicativo Transaccional Información de Gestión Operativa
  16. 16. 5. MODELO LÓGICO EJEMPLO
  17. 17. 5. MODELO LÓGICO Ejemplo Organización: Cadena de supermercados. Actividad objeto de análisis: ventas de productos. Información registrada sobre una venta: “del producto “X” se han vendido en el almacén “nro.1” el día 17/2/2008, 5 unidades por un importe de 100 euros.”
  18. 18. Marca Descripción Semana Categoría Departamento Mes Nro_producto Trimestre Día Año Tipo importe unidades Almacén Ciudad Tipo Región
  19. 19. Dimensiones (puntos de vista) desde los que se puede analizar la actividad. Marca Semana Descripción Categoría Mes Departamento Trimestre Día Nro_producto Año Tipo importe unidades Almacén Actividad que es objeto de análisis con los indicadores que interesa analizar Ciudad Tipo Región
  20. 20. 5. MODELO LÓGICO Modelo multidimensional  en un esquema multidimensional se representa una actividad que es objeto de análisis (hecho) y las dimensiones que caracterizan la actividad (dimensiones).  la información relevante sobre el hecho (actividad) se representa por un conjunto de indicadores.  la información descriptiva de cada dimensión se representa por un conjunto de atributos (atributos de dimensión).
  21. 21. 5. MODELO LÓGICO Entre los atributos de una dimensión se definen jerarquías Producto nro. producto categoría departamento Almacén región ciudad almacén tipo Tiempo día trimestre mes semana año
  22. 22. 6. TERMINOLOGÍA
  23. 23. 6. TERMINOLOGÍA  Hecho   Indicador   Fórmula matemática aplicada a un conjunto de hechos Dimensión/Eje de análisis   Un hecho es un elemento de información del negocio. Es decir, es un elemento que se puede medir Una dimensión es el aspecto o perspectiva mediante las cuales se pueden acceder a los hechos Atributo   Característica de una dimensión  Una jerarquía es la relación padre/hijo en la cual se agrupan los atributos de una dimensión Jerarquía
  24. 24. 6. TERMINOLOGÍA  Agregación   Sumarización   Método por el cual los datos se cambian de nivel de granularidad Desnormalización   Método por el cual los datos, son agrupados para realizar una tabla de hechos específica Introducir redundancias de la información en las tablas de la base de datos para mejorar el rendimiento de la aplicación Datamart  Un Datamart, al igual que un Datawarehouse, es un almacén de datos para el análisis y toma de decisiones. La diferencia esta en el contenido, ya que un Datamart es un subconjunto departamental de un Datawarehouse corporativo o un Datawarehose de un solo sistema funcional.
  25. 25. 6. TERMINOLOGÍA  Drill down / up   DataMining   Sistema estático orientado a los ejecutivos, con informes predefinidos y fácil de manejar DSS (Decision Support System)   Búsqueda de patrones de comportamiento, dentro de datos, ya sea de un Datawarehouse, o cualquier otra fuente de información EIS (Executive Information System)   Navegar dentro de la información, desde niveles mas altos a niveles mas bajos o viceversa Sistema de ayuda a la decisión con la libertad de poder realizar consultas e informes libres sobre la información BSC (Balance Scored Card):  Sistema estático para la gestión estratégica de la empresa
  26. 26. 7. BUSSINES INTELLIGENT
  27. 27. 7. BUSSINES INTELLIGENCE   Business Intelligence suele definirse como la transformación de los datos de la compañía en conocimiento para obtener una ventaja competitiva. Desde un punto de vista más pragmático, y asociándolo directamente a las tecnologías de la información, podemos definir Business Intelligence como:  el conjunto de metodologías, aplicaciones y tecnologías que permiten reunir, depurar y transformar datos de los sistemas transaccionales e información desestructurada (interna y externa a la compañía) en información estructurada, para su explotación directa (reporting, análisis OLAP...) o para su análisis y conversión en conocimiento soporte a la toma de decisiones sobre el negocio.
  28. 28. 8. HERRAMIENTAS
  29. 29. 8. HERRAMIENTAS    IBM InfoSphere DataStage SW ETL de IBM para plataformas distribuidas y mainframes IBM Cognos DecisionStream Software ETL de IBM para la construcción de Data Warehouses y Data Marts para reporting y análisis IBM InfoSphere Change Data Capture (CDC) Software de IBM para la integración de información en tiempo real a través de almacenes de datos heterogeneos.  Informatica Powercenter Software de Integracion de datos empresariales de Informatica  Oracle Data Integrator (ODI) Plataforma de integración de datos de Oracle Fusion Middleware Oracle GoldenGate (CDC) Sofware de integración de datos de Oracle Fusion Middleware, que permite la replicación de datos en tiempo real en entornos de datos heterogéneos 
  30. 30. 8. HERRAMIENTAS    SAP BusinessObjects Data Integrator Software ETL de SAP BO, plataforma de Business Intelligence de SAP SAS Enterprise Data Integration Server Software de ETL y ELT de SAS, que permite transformar datos directamente en las bases de datos origen Microsoft SQL Server Integration Services (SSIS) Software ETL de Microsoft, incluído en la base de datos SQL Server, y que reemplaza a Data Transformation Services (DTS) iWay DataMigrator Herramienta ETL de iWay Software para Data Warehousing.  iWay Enterprise Information (EII) Herramienta ETL de iWay Software para integración en tiempo real entre almacenes de datos heterogéneos. Open Source:  Google Refine  Pentaho Data Integration (PDI) Software ETL Open Source de la suite de BI de Pentaho. La versión Community (PDI CE) es tembién conocida como Kettle, que es el nombre del proyecto open source original.   Talend Open Studio for Data Integration Software ETL Open Source para integración de datos de Talend.
  31. 31. 9. ENFOQUES
  32. 32. 9. ENFOQUES      La solución Business Intelligence abarca tanto la modelización y almacenamiento de los datos, como la explotación de los mismos, para extraer la máxima información y conocimiento. Sistemas sanitarios Sistemas bancarios Sistemas gestión de productos (almacenes) A nivel pequeño, puede servir para predecir:  Costes, recursos necesarios para una tarea/s, tiempo medio de implementación, según tipo de proyecto tiempo estimado de desarrollo, diseño…millones de aspectos se pueden predecir.
  33. 33. ¡GRACIAS! Correo jorsodom@gmail.com

×