Capitulo 2   introducción al business intelligence
Upcoming SlideShare
Loading in...5
×
 

Like this? Share it with your network

Share

Capitulo 2 introducción al business intelligence

on

  • 888 views

 

Statistics

Views

Total Views
888
Views on SlideShare
888
Embed Views
0

Actions

Likes
2
Downloads
55
Comments
0

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

Capitulo 2 introducción al business intelligence Presentation Transcript

  • 1. División de Alta Tecnología FUNDAMENTOS DE APLICACIONES BUSINESS INTELLIGENCE
  • 2. División de Alta Tecnología Introducción al Business Intelligence 1.¿Qué es Business Intelligence? 2.Historia y Evolución de los conceptos de BI 3.Conceptos y Terminología BI: OLTP, OLAP, Data Warehouse, Datamart, Metadata
  • 3. División de Alta Tecnología ¿Qué es Business Intelligence? Business Intelligence o Inteligencia de Negocios, consiste en el proceso de transformación de datos en información, haciendo uso de técnicas de Extracción, Transformación y Carga (ETL), proporcionando información validada para una adecuada toma de decisiones y de manera oportuna.
  • 4. División de Alta Tecnología ¿El valor de la Información? “Transformación Ascendente” DATOS INFORMACION INTELIGENCIA CONOCIMIENTO SABIDURIA
  • 5. División de Alta Tecnología ¿El valor de la Información?  Asignación de valor: Ley de oferta y demanda?  Preguntas claves:  ¿Qué influencia la compra y la demanda?  ¿Qué productos me generan más ingresos?  ¿En dónde hay oportunidades de negocio?  ¿Cómo segmento mis clientes según su comportamiento comercial?  ¿Qué es lo que mueve la calidad del producto y la demanda de los clientes?  “Era de la Información”, la información tiene un valor monetario.
  • 6. División de Alta Tecnología Las Organizaciones y sus Requerimientos de S.I.  Las empresas al querer contar con una mayor automatización en sus procesos, implementan dentro de su organización una gran infraestructura tecnológica.  Sistemas de Procesamiento de Datos (SPD)  Administración de Recursos Empresariales (ERP)  Sistemas de Información Ejecutiva (EIS)  Sistemas de Soporte a Decisiones (DSS)  Manejo de Relación con Clientes (CRM)
  • 7. División de Alta Tecnología ¿ Qué información se necesita?  Antiguamente:  Toma de decisiones = INTUICIÓN , BASADA EN LA EXPERIENCIA  Actualmente:  Más personas toman decisiones  Deben tener información OPORTUNA Y DE CALIDAD
  • 8. División de Alta Tecnología Requerimientos Informativos en la Piramide Organizacional Analistas Consumidores de Información Exploradores de Información 5-10% de los usuarios 15-25% de los usuarios 65-80% de los usuarios Nivel Estratégico Nivel Táctico Nivel Operacional
  • 9. División de Alta Tecnología Historia y Evolución de los conceptos de BI Conceptos de Business Intelligence  Incas, Fenicios, persas, egipcios y otros pueblos usaban informaciones obtenidas de la naturaleza en beneficio propio  Mareas  Periodos de Sequías  Lluvias  Posición de los astros
  • 10. División de Alta Tecnología Historia y Evolución de los conceptos de BI Conceptos de Business Intelligence  Después de la conquista de América, se crea en España la "Casa del Oro“  Las nuevas tecnologías tales como, almacenamiento en tarjetas perforadas, Bases de Datos lineales y Lenguajes de Cuarta Generación (4GL), permitieron darle al usuario la facilidad de tener el control directo de los sistemas y de la información.
  • 11. División de Alta Tecnología Historia y Evolución de los conceptos de BI  En los 70’s se da un gran salto al aparecer : • Los dispositivos de Acceso Directo (DASD)  Acceso veloz a los datos y Búsquedas directas y No lineales • Administración de Bases de Datos (DBMS)  permitía al desarrollador el acceso a la información, al encargarse del almacenamiento e índices.  En los 90’s las grandes empresas contaban con Centros de Información (CI).  Funcionaban como repositorio de datos,  Información poco disponible Conceptos de Business Intelligence
  • 12. División de Alta Tecnología Historia y Evolución de los conceptos de BI Conceptos de Business Intelligence  El concepto de Data Warehouse nace entre los años 1992 y 1993 como base del desarrollo de soluciones Business Intelligence. «repositorio»«repositorio»  En 1996 el concepto de Business Intelligence empezó a difundirse como una evolución de los Executive Information Systems (EIS).
  • 13. División de Alta Tecnología Historia y Evolución de los conceptos de BI Conceptos de Business Intelligence  El término Business Intelligence se extendió hacia otras herramientas como:  EIS (sistema de información ejecutiva)  DSS (sistema de soporte a las decisiones)  Balanced Scorecad (indicadores de gestión)  Dashboard (cuadros de mandos)  ER (reporteadores empresariales)  Data Marts, Data Mining, Herramientas OLAP Resumen : Activar la capacidad de tomar decisiones, afinar estrategias de relaciones con los clientes y satisfacer las necesidades del sector empresarial.
  • 14. División de Alta Tecnología Historia y Evolución de los conceptos de BI Conceptos de Business Intelligence  Los sistemas de Planeamiento de Recursos Empresariales o Enterprise Resource Planning (ERP), tienen como función principal dar soporte a la parte operativa de las diferentes áreas de la organización, y se encuentra muy ligada con la historia del Business Intelligence.  Actualmente los ERP se convierten en el principal origen de datos para soluciones Business Intelligence
  • 15. División de Alta Tecnología ERP El reto es unir elementos de las áreas y proporcionarle a los usuarios una manera universal de utilizar la información almacenada en diferentes sistemas. Utiliza la información a través de la organización de forma más proactiva en áreas claves.
  • 16. División de Alta Tecnología Conceptos y Terminología BI:  OLTP  OLAP  Data Warehouse  Datamart  Metadata
  • 17. División de Alta Tecnología On Line Transacction Processing (OLTP) OLTP esta encargado de dar soporte a los procesos diarios de ingreso y mantenimiento de datos en tiempo real. Características  Diseño orientado a la transacción.  Volatilidad de los datos.  Proporciona soporte muy limitado a la toma de decisiones. Ejemplos: • Cobranzas. • Sistema de control de asistencia. • Control de almacén.
  • 18. División de Alta Tecnología On Line Analytical Processing (OLAP) OnLine Analytical Processing (OLAP) es un proceso en el que se usan herramientas netamente análiticas, que facilitan el análisis de la información del negocio. Se halla organizada en entidades y métricas, que permiten al usuario flexibilidad en la ejecución de consultas complejas.
  • 19. División de Alta Tecnología OLAP Los servicios OLAP proveen de múltiples niveles de análisis entre los cuales podemos mencionar, además de tener la capacidad de realizar consultas complejas: •Realizar actividades intensivas de comparación de datos •Análisis de tendencias •Reportes •Aislar un grupo de datos con características específicas De forma amigable, rápida y confiable.
  • 20. División de Alta Tecnología OLAP Características Es consolidada. La data se agrupada desde todas las áres de la organización y almacenada en un repositorio central y único. Es consistente. Todos los usuarios deben obtener la misma versión de los datos independientemente de donde provengan o cuando hallan sido procesadas. Es orientada al objetivo. Sólo debe contener información importante que permita la toma de decisiones.
  • 21. División de Alta Tecnología OLAP Características Es histórica. Toda la información de la empresa es almacenada como fotografías en el repositorio único de datos. Es de solo lectura. El sistema OLAP es exclusivamente sólo para consultas. No es atómica. La data OLAP principalmente contiene data sumirazada y resumida.
  • 22. División de Alta Tecnología OLAP
  • 23. División de Alta Tecnología OLAP. Un ejemplo Ejemplo: Una cadena de tiendas de alquiler de videos muestra el siguiente cuadro mensual, con las cantidades de videos alquilados por cada una de sus sucursales.
  • 24. División de Alta Tecnología OLAP. Un ejemplo Sin embargo, la tienda de alquiler de videos también desearía ver como se desarrollan las ventas en el tiempo.
  • 25. División de Alta Tecnología OLAP Las mismas celdas de datos se visualizan mediante un cubo. Tiempo Tienda Categoría
  • 26. División de Alta Tecnología OLAP 1. ¿Cuánto se alquila por categoría de video en cada tienda en un mes dado? Resp.: Categoría de video por tienda en un mes dado 2. ¿Qué tiendas han mejorado sus alquileres de video a través del tiempo? Resp. : Tienda por tiempo de una categoría de video dado.
  • 27. División de Alta Tecnología Modelos de Almacenamiento  OLAP Relacional (ROLAP)  OLAP Multidimensional (MOLAP)  OLAP Híbrido (HOLAP)  OLAP de Escritorio (DOLAP)  OLAP Local (LOLAP)
  • 28. División de Alta Tecnología ROLAP  OLAP Relacional (ROLAP) es un sistema en el cual los datos se encuentran almacenados en una base de datos relacional.  Típicamente, los datos son detallados, evitando las agregaciones y las tablas se encuentran normalizadas.  Los esquemas más comunes sobre los que se trabaja son estrella o copo de nieve, aunque es posible trabajar sobre cualquier base de datos relacional.  ROLAP es utilizada en DataMarts con grandes volúmenes de datos como por ejemplo :  Las empresas de telecomunicaciones  Banca, entre otros.
  • 29. División de Alta Tecnología ROLAP  La arquitectura ROLAP está compuesta por un servidor de base de datos Relacional y un motor OLAP en un servidor dedicado.  Esta arquitectura está diseñada para almacenar gran volumen de datos, debido a que su almacenamiento es relacional.
  • 30. División de Alta Tecnología MOLAP  En un sistema OLAP multidimensional (MOLAP) los datos se encuentran almacenados en una estructura multidimensional.  Para optimizar los tiempos de respuesta, el resumen de la información es usualmente calculado por adelantado. Estos valores precalculados o agregaciones son la base de las ganancias de desempeño de este sistema.  Algunos sistemas utilizan técnicas de compresión de datos para disminuir el espacio de almacenamiento en disco debido a los valores precalculados.  MOLAP es utilizada en DataMarts con pequeños volúmenes de datos como por ejemplo :  Medianas empresas  Áreas especificas de una organización
  • 31. División de Alta Tecnología  La arquitectura MOLAP está compuesta por un motor OLAP en un servidor dedicado.  Esta arquitectura está diseñada para almacenar poco volumen de datos lo cual generará una limitación respecto al tamaño de BD.  Esta arquitectura permitir mejoras enormes en la performance con respecto a los tiempos de consulta logrando un análisis más fácil y rápido Base de Datos Relacional Vista de Usuario Base de Datos Multidimensional AGREGACIONES Y DATOS Base de Datos Relacional Vista de Usuario Base de Datos Multidimensional AGREGACIONES Y DATOS MOLAP
  • 32. División de Alta Tecnología HOLAP  Un sistema OLAP Híbrido (HOLAP) mantiene los registros detallados en la base de datos relacional, mientras que los datos resumidos o agregados se almacenan en una base de datos multidimensional separada.  Este método de almacenamiento es una combinación de los dos anteriores e intenta rescatar lo mejor de cada uno.  HOLAP es utilizada en DataMarts con grandes volúmenes de datos como por ejemplo :  Banca  Retail  Seguros  Entre otros.
  • 33. División de Alta Tecnología  La arquitectura HOLAP está compuesta por un servidor de base de datos Relacional y un motor OLAP en un servidor dedicado.  Esta arquitectura permite que el espacio físico, la performance de las consultas y el procesamiento sea menor que MOLAP y mayor que ROLAP. Base de Datos Relacional Vista de Usuario Base de Datos Multidimensional DATOS AGREGACIONES Base de Datos Relacional Vista de Usuario Base de Datos Multidimensional DATOS AGREGACIONES HOLAP
  • 34. División de Alta Tecnología DOLAP y LOLAP  Las Desktop Online Analytical Processing (DOLAP) y Local Online Analytical Processing (LOLAP) se almacena en la estación de trabajo del cliente (que puede ser una PC común).  Este tipo de cubos de información envían al servidor relacional instrucciones SQL desde una estación de trabajo y reciben los datos almacenándolos como micro cubos los cuales son analizados de manera local.  Entre sus desventajas es que el cubo offline no puede ser muy grande y al estar almacenado en la pc del cliente pueden presentarse problemas de seguridad.
  • 35. División de Alta Tecnología ARQUITECTURAS OLAP  Los usuarios que requieren de un alto nivel de detalle necesitarán de una arquitectura ROLAP  Los usuarios que requieren de datos agregados y sumarizados necesitarán de una arquitectura MOLAP  Los analista que requieran ambos tipos de análisis necesitarán una arquitectura HOLAP.
  • 36. División de Alta Tecnología OLTP vs OLAP  Difieren en arquitectura y uso.  Entre los numerosos puntos de diferencias se encuentran:  Los objetivos principales  La orientación de los datos  La integración  La historicidad  El acceso de datos y manipulación  Los patrones de uso  La granularidad de los datos  El perfil de los usuarios  La metodología de desarrollo, etc.
  • 37. División de Alta Tecnología OLTP vs OLAP  Objetivos principales de construcción  Los OLTP están orientados a dar soporte a las operaciones diarias del negocio. Las aplicaciones OLAP se orientan a asistir en el análisis del negocio (consultas).
  • 38. División de Alta Tecnología OLTP vs OLAP  Alineación de datos  Los OLTP están orientados a aplicaciones o sistemas los cuales poseen distintos tipos de datos y diferentes y estructurados para registrar las trascancciones diarias del negocio.  Los sistemas OLAP están alineados por área o tema y están orientados a la consulta del analista de negocio. Se orientan totalmente a las consultas.
  • 39. División de Alta Tecnología OLTP vs. OLAP OLTP OLAP Por ejemplo : En las financieras existen numerosas aplicaciones de cuentas y colocaciones a nivel operacional mientras que en un Data Warehouse la información estaría organizada por cliente, funcionario, tipo de cuenta y tiempo. En las comercializadoras existen aplicaciones sobre registro de ventas, registro de compras, manejo de inventario o stock y presupuesto. En un Data Warehousing hablaríamos de productos, sucursales, proveedores, tiempo y las diferentes métricas propias de negocio (unidades vendidas, monto neto, etc)
  • 40. División de Alta Tecnología OLTP vs. OLAP  Integración de datos  En los OLTP, los datos se encuentran dispersos, son calificados como datos base o datos operacionales. Estos datos son estructurados en forma aislada uno de otros, pudiendo tener diferentes estructuras de llaves y nombres.  En los ambientes OLAP, los datos deben estar integrados, consolidados y orientados a un tema o área de análisis.
  • 41. División de Alta Tecnología OLTP vs. OLAP  Acceso y manipulación de los datos  Los sistemas operacionales realizan operaciones con los datos fila por fila usando genaralmente sentencias inserts, updates y deletes. Además requieren de rutinas de validación como son el commit y el rollback, los bloqueos de registros, etc.  Los sistemas OLAP tienen una carga y acceso masivo de datos, haciendo uso principalmente de sentencias select. Es por esta razón que la estructura de la BD analítica es desnormalizada rompiendo los esquemas clásicos operacionales para beneficiar el tiempo de consulta y proceso.
  • 42. División de Alta Tecnología OLTP vs. OLAP  Granularidad de los datos  Los sistemas OLTP se encuentran los datos a nivel atómico (transacción por transacción).  Los sistemas OLAP tienen adicionalmente de data detallada, datos sumarizados y agregados.
  • 43. División de Alta Tecnología Sistemas OLTP vs OLAP
  • 44. División de Alta Tecnología Data Warehouse  Ralph Kimball: “un data warehouse es una ‘copia’ de los datos transaccionales específicamente estructurados para consultas y análisis”.
  • 45. División de Alta Tecnología Data Warehousing “A Warehouse is a place, Warehousing is a process” [R.Hackathorn]  Existe una gran cantidad de procesos detrás de una arquitectura de Data Warehouse de suma importancia para el mismo. Estos comprenden desde procesos de extracción que estudian y seleccionan los datos fuente adecuados para el Data Warehouse hasta procesos de consulta y análisis de datos que despliegan la información de una forma fácil de interpretar y analizar.  A continuación pasaremos a explicar los procesos básicos de una Data Warehouse: Extracción, Transformación, Carga e Indices, Chequeo de Calidad, Liberación/Publicación, Consulta, Feedback, Auditoria, Seguridad, Respaldo y Recuperación.
  • 46. División de Alta Tecnología  Extracción El proceso de extracción consiste en estudiar y entender los datos fuente, tomando aquellos que son de utilidad para el Data Warehouse.  Transformación Una vez que los datos son extraídos, éstos se transforman. Este proceso incluye corrección de errores, resolución de problemas de dominio, borrado de campos que no son de interés, generación de claves, aumento de información, etc.  Carga e Índices Al terminar el proceso de transformación, se cargan los datos en el Data Warehouse.  Chequeo de Calidad Una vez ingresada la información al Data Warehouse, se realizan controles de calidad para asegurar que la misma sea correcta.     Data Warehousing
  • 47. División de Alta Tecnología  Consulta El usuario final debe disponer de herramientas de consulta y procesamiento de datos. Este proceso incluye consultas ad hoc, reportes, aplicaciones DSS, Data Mining, etc.  Feedback Muchas veces es aconsejable seguir el camino inverso de carga. Por ejemplo, puede alimentarse los sistemas legales con información depurada del Data Warehouse o almacenar en el mismo alguna consulta generada por el usuario que sea de interés.  Auditoria Los procesos de auditoría permiten conocer de donde proviene la información así como también qué cálculos la generaron. Data Warehousing
  • 48. División de Alta Tecnología  Seguridad Una vez construido el Data Warehouse, es de interés para la organización que la información llegue a la mayor cantidad de usuarios pero, por otro lado, se tiene sumo cuidado de protegerla contra posibles 'hackers', 'snoopers' o espías. El desarrollo de Internet a incrementado este dilema.  Respaldo y Recuperación Se deben realizar actividades de backup y restore de la información, tanto la almacenada en el Data Warehouse como la que circula desde los sistemas fuente al Data Warehouse. Data Warehousing
  • 49. División de Alta Tecnología Datamart  Un Datamart es un Data Warehouse mas pequeño.Normalmente la información contenida en un datamart es un subconjunto de un datawarehouse.
  • 50. División de Alta Tecnología Datamart Características  Orientado a un departamento dentro de la organización  Puede ser implementado como una solución para problemas inmediatos  No es necesario para construir un Data Warehouse.   Beneficios  Implementación rápida y sencilla  Menor costo de implementación  Cubre necesidades especificas del Negocio  Respuestas rápidas por el menor volumen de información  Asegura la consistencia de los datos
  • 51. División de Alta Tecnología Datamart Desventajas  Inadvertidamente se puede usar datos no compatibles con otros Datamarts que luego alarguen el tiempo de unificación  Si el Data Warehouse es construido primero, se requiere de hardware adicional para soportar Datamarts individuales.  Datos descentralizados debido a que cada Datamart corresponde a una base de datos individual por tema o por área.
  • 52. División de Alta Tecnología Metadata  Es un componente muy valioso para el Data Warehouse; los datos provenientes de la metadata se sitúa en una dimensión diferente al de otros datos del data warehouse, debido a que su contenido no es tomado directamente desde el ambiente operacional.
  • 53. División de Alta Tecnología La Metadata abarca todos los procesos de Data Warehousing y contiene:    Nombres de campos y definiciones  Mapeo de los datos  Tablas  Índices  Cronogramas de extracción y carga  Criterios de selección  Cálculos de los datos derivados  Transformación de los datos Metadata
  • 54. División de Alta Tecnología Existen 3 tipos de Metadatos: • Metadata del Negocio: Contiene los modelos lógicos y las reglas de negocio. • Metadata Técnica: Contiene los nombres físicos de las tablas, ubicación de almacenamiento, relaciones, llaves, etc. • Metadata Operacional: Contiene la programación de cargas, fechas de actualización de datos, seguridad. Metadata
  • 55. División de Alta Tecnología
  • 56. División de Alta Tecnología 1. ¿Qué beneficios puede brindarle a una empresa el Business Intelligence? Habilidad de tomar las decisiones correctas en el momento correcto Por medio de las herramientas necesarias para poder comparar y analizar tendencias El tiempo invertido en la realización de presentaciones ejecutivas se ve reducido de forma significativa 2. El término Business Intelligence fue adoptado:    a. Por los principales consultores europeos porque comprobaron que la historia  del Viejo Continente traía consigo este concepto en diversos episodios.  b. Para que los conceptos que surgieron con las siglas EIS, DSS y SIG puedan  abarcar cada vez más, dentro de un proceso natural de evolución de  tecnologías y metodologías.    a. Para sustituir la nomenclatura ofrecida a los proyectos de Data Warehouse y  Datamart cuando se los diseña por separado. Preguntas
  • 57. División de Alta Tecnología 3. Según la pirámide organizacional, cuáles son los 3 niveles de información que  se necesitan. Nivel Estratégico Nivel Táctico Nivel Operacional 3. Nombre tres (3) diferencias entre OLTP vs OLAP. La integración La historicidad La granularidad de los datos 3. La tecnología OLAP creció y se multiplicó originando las herramientas: ROLAP MOLAP HOLAP DOLAP y LOLAP Preguntas
  • 58. División de Alta Tecnología 3. Un vistazo a un cubo OLAP Preguntas