• Share
  • Email
  • Embed
  • Like
  • Save
  • Private Content
Sesion 3. inteligencia de negocios
 

Sesion 3. inteligencia de negocios

on

  • 920 views

 

Statistics

Views

Total Views
920
Views on SlideShare
920
Embed Views
0

Actions

Likes
2
Downloads
58
Comments
0

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    Sesion 3. inteligencia de negocios Sesion 3. inteligencia de negocios Document Transcript

    • UNIVERSIDAD TÉCNICA DE MACHALA FACULTAD DE INGENIERÍA CIVIL ESCUELA DE INFORMÁTICA INTELIGENCIA DE NEGOCIOS POR: ING. BERTHA MAZÓN, MG. SC. EL ORO – ECUADOR 2012
    • Inteligencia de Negocios ÍNDICE GENERALRESUMEN ............................................................................................................................................... 5INTRODUCCIÓN ................................................................................................................................. 6 OBJETIVOS................................................................................................................................................ 6 GENERAL ............................................................................................................................................... 6 ESPECÍFICOS: ..................................................................................................................................... 6CAPÍTULO I .......................................................................................................................................... 7INTRODUCCIÓN A SOLUCIONES DE INTELIGENCIA DE NEGOCIOS ......................... 7 1.1.INTRODUCCION .............................................................................................................................. 8 1.2. NECESIDAD DE INFORMACIÓN Y CONOCIMIENTO EN UNA EMPRESA ................... 8 1.2.1.Las empresas en la era de la información .................................................................... 8 1.2.2. El Valor de la Información ................................................................................................. 9 1.2.3. ¿Por qué las Organizaciones Requieren Distintos Sistemas deInformación?10 1.2.4. Información que las empresas necesitan según los niveles organizacionales ................................................................................................................................................................ 12 1.2.5. Objetivos de la información ............................................................................................ 13 1.2.6. Usuarios en los niveles de gestión una organización .......................................... 13 1.2.7. Tipos de preguntas en los niveles de gestión una organización ..................... 13 1.2.8. Cantidad de datos en los diferentes niveles de una organización ................... 14 1.3. INTELIGENCIA DE NEGOCIOS ................................................................................................ 14 1.3.1. Evolución de la Inteligencia de Negocios ................................................................... 14 1.3.2. Definiciones de Inteligencia de Negocios .................................................................. 15 1.3.3. Arquitectura de Inteligencia de Negocios .................................................................. 16 1.3.4. Sistemas de Información Ejecutiva y Sistemas de Soporte a lasDecisiones 18 1.3.4.1. Sistemas de Información Ejecutiva .................................................................... 18 1.3.4.2. Sistema de Soporte de Decisiones ..................................................................... 20 1.4. HERRAMIENTAS PARA INTELIGENCIA DE NEGOCIOS .................................................. 24 1.4.1 HERRAMIENTAS PROPIETARIAS ................................................................................... 24 1.4.2 HERRAMIENTAS OPEN SOURCE...................................................................................... 29 1.4.3. COMPARATIVA DE HERRAMIENTAS BI PROPIETARIAS VERSUS OPENSOURCE .................................................................................................................................... 34 1.4.3.1. DETERMINACIÓN DE CATEGORÍAS Y CAPACIDADES DE COMPARACIÓN DE HERRAMIENTAS BI ............................................................................................................... 34 1.4.3.2. CUADRO COMPARATIVO ENTRE HERRAMIENTAS DE BI PROPIETARIAS VERSUS OPEN SOURCE ............................................................................................................. 37 1.4.3.3. RESULTADOS DE LA COMPARACIÓNENTREHERRAMIENTAS DE BI PROPIETARIAS VERSUS OPEN SOURCE.............................................................................. 40CAPÍTULO II ...................................................................................................................................... 42DATA WAREHOUSE Y DATA MARTS ........................................................................................ 42 2.1. INTRODUCCIÓN ........................................................................................................................... 43Ing. Bertha Mazón, Mg. Sc. 2
    • Inteligencia de Negocios 2.1.1 Concepto de data warehouse .......................................................................................... 43 2.1.2. Problemas que dan origen a un Data Warehouse .................................................. 44 2.1.3. Beneficios Asociados al Data Warehouse .................................................................. 45 2.2. Data warehouse versus Sistemas Transaccionales (OLTP) ......................................... 45 2.3. Introducción a Datamarts (Tienda de datos) ................................................................... 47 2.4. Arquitectura Datawarehouse (DW) ...................................................................................... 47 2.5. Metodologías de diseño y construcción de data warehouse ....................................... 48 2.6. El Proceso ETL .............................................................................................................................. 50 2.7. El Procesamiento Analítico en Línea (OLAP) ..................................................................... 50CAPÍTULO III .................................................................................................................................... 60DISEÑO Y CONSTRUCCIÓN DE UNA SOLUCIÓN DE INTELIGENCIA DENEGOCIOS .......................................................................................................................................... 60 3.1. INTRODUCCIÓN ........................................................................................................................... 61 3.2. METODOLOGÍA UTILIZADA PARA DISEÑAR DATA WAREHOUSE .............................. 61 3.3. METODOLOGÍA HEFESTO ......................................................................................................... 61 3.4. PASOS Y APLICACIÓN METODOLÓGICA HEFESTO ......................................................... 62 PASO 0.ESTUDIO PRELIMINAR ................................................................................................... 62 PASO1.ANÁLISIS DE REQUERIMIENTOS ................................................................................ 63 PASO 2. ANÁLISIS DE OLTP’S ..................................................................................................... 65 PASO 3. MODELO LÓGICO DEL DATA WARE HOUSE ......................................................... 68 PASO 4. DISEÑO DEL PROCESO ETL ........................................................................................ 68 3.5. CREACIÓN DE CUBOS MULTIDIMENSIONALES ............................................................... 70 3.6. DISEÑO DEL SSDPARA EL D. ACADÉMICO DE LA UTSAM (FRONTEND)................ 72 3.6.1. Diagrama de casos de uso del sistema ...................................................................... 72 3.6.2. Diagrama de componentes basado en capas del sistema Ginus BI ................ 72 3.7. IMPLEMENTACIÓN DEL SOFTWARE ..................................................................................... 73 3.8. INTERFACES DEL SOFTWARE ............................................................................................ 74 GLOSARIO ........................................................................................................................................... 80 ÍNDICE DE TABLASTabla 1. Estudio Comparativo Entre Herramientas de BI Propietarias Versus Open Source .......................... 39Tabla 2. Diferencias entre sistemas transaccionales y basados en data warehouse. .................................... 47Tabla 32: Campos del MER GINUS y organizados por perspectivas .......................................................... 67Ing. Bertha Mazón, Mg. Sc. 3
    • Inteligencia de Negocios ÍNDICE DE FIGURASFigura 1.Arquitectura Típica de Soluciones Business Intelligence. ...................................... 16Figura 2.Características de un EIS. ................................................................................................... 19Figura 3. Características de un DSS. ................................................................................................ 20Figura 4.Cuadrante mágico de las Plataformas BI. ..................................................................... 24Figura 5.Arquitectura BI de IBM Cognos. ...................................................................................... 25Figura 6.Arquitectura BI de Microsoft. ............................................................................................. 26Figura 7.Arquitectura BI de OBIEE. ................................................................................................... 27Figura 8.Arquitectura BI de SAP BusinessObjects XI 3.1. ........................................................ 27Figura 9.Arquitectura BI de Microstrategy ...................................................................................... 28Figura 10.Arquitectura BI de SAS ...................................................................................................... 29Figura 11.Arquitectura BI de Pentaho .............................................................................................. 30Figura 12.Arquitectura BI de JasperSoft.......................................................................................... 31Figura 13.Arquitectura BI de Eclipse BIRT ...................................................................................... 31Figura 14.Arquitectura BI de SpagoBI .............................................................................................. 32Figura 15.Arquitectura BI de Palo ...................................................................................................... 33Figura 16.Arquitectura BI de Openi ................................................................................................... 33Figura 17. Estructura básica Data warehouse ............................................................................... 48Figura 18.Arquitectura bottom-up de un DW ................................................................................ 49Figura 19.Arquitectura top-down de un DW................................................................................... 49Figura 20. Ejemplo de Cubo con tres dimensiones. .................................................................... 52Figura 21. Arquitectura básica para OLAP. ..................................................................................... 53Figura 22. Modelo estrella..................................................................................................................... 54Figura 23. Modelo copo de nieve. ...................................................................................................... 55Figura 24. Ejemplo de un almacén formado por 4 data marts. .............................................. 55Figura 25. Un esquema de estrella.................................................................................................... 56Figura 26. Un esquema copo de nieve. ............................................................................................ 57Figura 29.Arquitectura de la Metodología HEFESTO ................................................................... 61Figura 31.Modelo Conceptual ............................................................................................................... 65Figura 32.Correspondencia en el Diagrama de Entidad Relación Base de datos GINUS66Figura 32.Modelo Conceptual Ampliado del DW GINUS BI ....................................................... 67Figura 33.Modelo Lógico del DW GINUS BI .................................................................................... 68Figura 35.Proceso Extracción, Transformación y Carga (ETL) al DW del sistema GINUSBI .................................................................................................................................................................... 70Figura 35.Cubos del sistema GINUS BI ............................................................................................ 71Figura 37.Estructura delos Cubosdel sistema Ginus BI ............................................................. 71Figura 38.Diagrama de casos de uso del sistema Ginus BI ..................................................... 72Figura 38.Diagrama de componentes basado en capas del sistema Ginus BI .................. 73Figura 40. Pantalla de Inicio de sesión al GINUS BI ................................................................. 74Figura 41. Pantalla Principal de GINUS BI .................................................................................... 74Figura 42. Explorar jerarquía de una carrera .............................................................................. 75Figura 43. Generar gráfico estadístico ........................................................................................... 75Figura 44. Matriculados por años y gráfico estadístico ............................................................ 76Figura 45.Matriculados por modalidad, año 2008 y clasificados por escuela enformato PDF ................................................................................................................................................ 77Figura 46.Matriculados por modalidad, año 2008 y clasificados por escuela enformato EXCEL ........................................................................................................................................... 77Ing. Bertha Mazón, Mg. Sc. 4
    • Inteligencia de Negocios RESUMENEl propósito de este módulo es el estudio de bases de datos avanzadas como losalmacenes de datos (Data warehouse) que faciliten, a su vez, el desarrollo deSistemas de Toma de Decisiones (SSD) aplicando herramientas de Inteligencia deNegocios (BI. Business Intelligence). Hoy en día, existen herramientas BI propietariasy open source, en cada caso poseen ventajas y desventajas; sin embargo los altoscostos de las herramientas propietarias las convierten de exclusividad de las grandesempresas; en cambio, las herramientas BI opensource actuales proveen lafuncionalidad suficiente para implementar SSD en PYMES sin mucha inversión. Lamayoría de las herramientas BI, se componen de una infraestructura software deanálisis e informes, integrada a un motor de workflow, capaz de ejecutar reglas denegocio, presentar y entregar la información adecuada en el momento adecuado,mediante tecnología OLAP, cuadros de mando y otras funciones más.Ing. Bertha Mazón, Mg. Sc. 5
    • Inteligencia de Negocios INTRODUCCIÓNEn el presente módulo se ha estructurado algunos capítulos los cuales se describen acontinuación:Capítulo I. INTRODUCCIÓN A SOLUCIONES DE INTELIGENCIA DE NEGOCIOS.Capítulo II. DATA WAREHOUSE Y DATA MARTS.Capítulo III. DISEÑO Y CONSTRUCCIÓN UNA SOLUCIÓN DE INTELIGENCIA DENEGOCIOS.OBJETIVOSGENERAL  Desarrollar soluciones de inteligencia de negocios aplicando metodologías y herramientas de diseño y construcción data warehouse, cubos OLAP, proceso ETL y reporting con el propósito de proveer información estadística, resumida y con una presentación dinámica y oportuna como soporte para la toma de decisiones en los niveles directivo y gerencial de una organización..ESPECÍFICOS:  Conceptualizar y caracterizar terminología de Inteligencia de Negocios mediante la revisión de material de diferentes fuentes.  Diseñar data marts y data warehouse aplicando una metodología de estrella o copos de nieve.  Diseño y construcción de una solución de inteligencia de negocios que incluya: almacén de datos (data warehouse), cubos OLAP, proceso ETL y un sistema de toma de decisiones (SSD) que provea la información adecuada según los requerimientos de los mandos táctico y estratégico de una organización.Ing. Bertha Mazón, Mg. Sc. 6
    • Inteligencia de Negocios CAPÍTULO IINTRODUCCIÓN A SOLUCIONESDE INTELIGENCIA DE NEGOCIOSOBJETIVO:  Realizar una introducción a la Inteligencia de Negocios mediante la conceptualización y caracterización de términos propios del tema.Ing. Bertha Mazón, Mg. Sc. 7
    • Inteligencia de Negocios1.1.INTRODUCCIONEn el último decenio del siglo XX e inicios del siglo XXI, la humanidad ha asistido conasombro a profundas transformaciones en las relaciones económicas nacionales einternacionales, en el campo del conocimiento científico-tecnológico y en laglobalización de la economía que ha establecido y sigue determinando una nuevaestructura empresarial, con un avance vertiginoso por alcanzar altos estándares deproductividad y calidad en las operaciones cotidianas de sus empresas.La Inteligencia de Negocios (Business Intelligence BI), es una alternativa tecnológica yde administración de negocios, que permite manejar la información para la toma dedecisiones acertadas en todos los niveles de una organización, desde la extracción,depuración y transformación de datos, hasta la explotación y distribución de lainformación mediante herramientas de fácil uso para los usuarios. En el ámbitoempresarial, las decisiones se toman en alguno de los tres niveles organizacionales:estratégico, táctico u operativo. Las decisiones estratégicas se centran en ladirección del negocio a largo plazo siendo labor de los ejecutivos de alta gerencia. Lasdecisiones tácticas corresponden a los gerentes de nivel medio y se enfocan en laplaneación, análisis y producción de proyectos; a nivel operativo los empleados tomandecisiones cotidianas que se requieren para convertir los planes en acción.En esta sección se muestra los principios claves de los fundamentos teóricos para unmejor entendimiento de la asignatura. Se comienza con una introducción de lasnecesidades de información de las empresas actuales, se muestra la importancia deuna buena información para la toma de decisiones y el alcance de dicha informaciónen una empresa. Luego se presenta una visión general de la Inteligencia de Negocios,Datawarehousing, OLAP y Data Mining.1.2. NECESIDAD DE INFORMACIÓN Y CONOCIMIENTO EN UNA EMPRESALas empresas actualmente caracterizan a la información como uno de sus activos(Bitam, 2002), es así, que se comienza a tratarla, especialmente aquella relacionadacon datos para tomar decisiones, de una manera más metodológica. A continuación seexponen brevemente algunos conceptos relacionados con la información y suimportancia estratégica para la toma de decisiones en las empresas.1.2.1. Las empresas en la era de la informaciónDesde que las organizaciones comenzaron a guardar los datos de sus operaciones enmedios de almacenamiento físico, con el fin de permitirles una mayor administración ycontrol de la información, ha existido una necesidad de utilizarla para atender lasnecesidades propias del negocio.La información y su importancia estratégica comenzó a surgir cuando la competenciase hizo muy fuerte, y cada vez más y más productos similares, de diferentescompañías, se ponían a la venta, en ese momento el consumidor tuvo la opción deseleccionar aquello que más le conviniera o lo que más se adecuara a sus gustos ypreferencias. Surge entonces la necesidad de brindar servicios adicionales paraobtener la lealtad de los clientes, quienes poco a poco comenzaron a ver, no solo elproducto que compraban, sino cómo eran atendidos, qué garantías se ofrecían sobresu compra, qué ventajas habría entre diferentes productos y, en general, evaluar todolo que genera la diferenciación entre las compras que realizan. Cuando las empresasno tienen garantizada la venta de lo que producen, realizan un cambio paulatino haciaobtener de los datos toda la información útil y estratégica para mantenerse en elmercado, dándole un lugar preponderante al cliente.Ing. Bertha Mazón, Mg. Sc. 8
    • Inteligencia de NegociosActualmente, se le da un peso específico muy importante a la información como elprincipal conocimiento que sostiene el negocio. Existen empresas que, de modopredominante, ofrecen servicios y giran su negocio principal sobre el manejo de lainformación (bancos, aseguradoras, casas de bolsa, internet, etc.), en ellas es fácilidentificar la importancia de la información, si no existiera ésta dejarían de existir. Sinembargo, hay otras en las que su giro principal es alrededor de la producción, en ellasla información debe identificarse para analizar y perfeccionar su producción(porcentajes de desecho, líneas de producción, distribución de materias, suministro,inventarios y almacenes, procesos internos, publicidad y mercadotecnia, preferenciasdel cliente, etc.). De hecho, en cualquier empresa se está tratando de convertir, portodos los medios posibles, esa información en conocimiento que mejore los procesosy, a su vez, se traduzca en ventajas competitivas en los mercados.La idea de las empresas ávidas de información no surge de súbito, en realidad desdeque se almacenan los datos debe entenderse que tendrían un fin utilitario en algúnmomento, caso contrario, cualquier dato de control sería desechadoinstantáneamente. Lo que si surge de súbito es la imprescindible necesidad de darrespuesta rápida a los requerimientos de información para la toma de decisiones paraayudar a mejorar de alguna manera los procesos internos de negocio (Bitam, 2002).1.2.2. El Valor de la InformaciónEn la época actual, que se caracteriza por un crecimiento exponencial de las nuevastecnologías de la información y las telecomunicaciones, los activos más valiosos deuna empresa ya no son activos tangibles o los depósitos en los bancos, sino losconocimientos, habilidades, valores y actitudes de las personas que forman parte deuna empresa. De hecho, para generar riqueza es suficiente tener conocimiento sobreun tema determinado y explotarlo de la mejor manera posible. Los factores de laproducción como capital, tierra y trabajo, han sido sustituidos por el capitalintelectual, que comprende todos aquellos conocimientos tácitos o explícitos quegeneran valor económico para la empresa.Prácticamente nadie cuestiona el hecho de que vivimos en la Era de la Información yque la información tiene un valor económico, esto se evidencia porque existenempresas cuyo único negocio es alrededor de la venta de información, como porejemplo Gartner Group, Empresas de Internet y Amazon, entre otras. Enmercadotecnia, el conocimiento es el único camino posible para sostener ventajascompetitivas. Es más, en la actualidad, la información y el conocimiento sonconsiderados como el capital intelectual que soporta la riqueza de una organización.Para identificar el valor concreto de la información en la organización se puedenrealizar dos evaluaciones:a. Todas las corporaciones tienen un modelo del mundo de negocios basado en la información que poseen, por ejemplo: ¿qué influencia la compra y la demanda?, ¿en dónde hay oportunidades de negocio?, ¿qué es lo que mueve la calidad del producto y la demanda de los clientes? A medida que esta información se vuelve más exacta, la capacidad de la empresa para competir se incrementa. Visto así, la información corporativa es claramente un activo de la empresa que genera valor y su inexistencia genera "desvalor", o sea, pérdidas en caso de que existiera la información y ésta desapareciera, o bien, "no ganancias" en caso de que no exista.b. Otra forma de entender la información como dinero es mediante su transformación en conocimiento tácito o explícito. El conocimiento tácito es el que tienen las personas producto de la experiencia, los estudios y la educación; los conocimientos explícitos son los que se almacenan en medios magnéticos como cintas y disquetes.Ing. Bertha Mazón, Mg. Sc. 9
    • Inteligencia de NegociosEn el momento que una persona decide cambiar de empleo se está llevando consigoinformación, conocimientos y está vendiendo su fuerza intelectual por un mayorprecio; el campo laboral nos indica que la fuerza de trabajo intelectual aumenta sucosto con dos factores básicos que generan conocimiento: la experiencia y laeducación. Por su parte, si un sistema que posee información eventualmentedesaparece o falla, generará pérdidas a la empresa, incluso porcada minuto que estédetenido. En la actualidad las empresas están apostando mucho por la tecnología y losindividuos para que juntos tengan un conocimiento suficiente que acerque la visióninterna de ambos a la realidad exterior, en la medida que esa brecha disminuye, lasdecisiones tomadas se acercan más a la realidad exterior, generando decisiones máscorrectas y en menos tiempo; si la brecha o "gap de información" aumenta, puedeocasionar grandes pérdidas para la organización.Es fácil entenderlo, suponiendo una situación hipotética en la cual un nuevo auto esdiseñado con lujo, pero con algunos toques de un auto deportivo y, sin realizar ningúntipo de estudio previo más que la intuición y el sentido común, se pretende lanzarlopara que sea adquirido por adultos mayores de 30 años. Para ello, una vez que seencuentra listo para la distribución, comienzan las campañas de publicidad ypresentaciones orientadas precisamente a ese mercado potencial.Al cabo de cierto tiempo se dan cuenta que las campañas que lanzaron no han tenidomucho impacto en ese segmento, pero curiosamente un porcentaje similar de lasventas a la fecha se han dado en personas entre 25 y 30 años. La realidad indica queese auto tiene un impacto mayor en un segmento distinto al que suponía. En caso dehaber tenido información suficiente sobre las preferencias delos distintos segmentos,la historia de las ventas y, sobre todo, un estudio previo de mercado se habría sabidocon anticipación hacia dónde dirigir los esfuerzos dela publicidad con dos resultadosbenéficos: en primer lugar, la publicidad no habría sido inefectiva y el dinero utilizadoen las campañas no se habría desperdiciado; y en segundo lugar, se habría atendido alos verdaderos clientes potenciales, con lo cual las ventas habrían sido mayores. Elejemplo es hipotético, pero la situación es muy similar a la cotidianeidad, muchasempresas utilizan el sentido común y la intuición para tomar decisiones, la informaciónque se traduce en conocimientos acerca la visión interna a la realidad y esa diferenciaexistente es la que puede representar miles o millones de dólares. Lo que se pretendees acercar el mundo real a la visión interna para generar ganancias, para convertir lainformación en utilidades, para darle un valor a la información.Si la información es un activo, debemos poder asignarle un valor económico. Lapregunta que surge inmediatamente es cómo podemos asignarle un valor económico ala información. Dado un mercado libre, la primera respuesta es que el valor de lainformación es lo que en el mercado se pague por ella. Este recurso simple, basado enel valor percibido, muchas veces es suficiente para asignarle un valor a la información,sin embargo, no es suficiente en otros casos, por ejemplo, en el caso de una pieza deinformación que no vende y que es utilizada únicamente en procesos internos de tomade decisiones.La importancia de una buena información puede ser vista como la diferencia en valorentre una decisión correcta y una decisión equivocada, en donde la decisión estábasada en esa información. Mientras más grande sea esa diferencia entre decisióncorrecta y errónea, mayor será la importancia de contar con una buena información(Bitam, 2002).1.2.3. ¿Por qué las Organizaciones Requieren Distintos Sistemas deInformación?Para tener completamente automatizada a la empresa es necesaria una graninfraestructura en tecnología que soporta sistemas de información. Este crecimientotecnológico tiene distintos orígenes, que van desde la implementación, crecimiento,Ing. Bertha Mazón, Mg. Sc. 10
    • Inteligencia de Negociosampliación, integración, etc. Las condiciones actuales de los mercados han provocado,la necesidad de tecnología cada vez más avanzada para responder a las peticionesmuy particulares de información.Sistemas de Procesamiento de Datos (SPD o OLTP), Sistemas de Manufactura,Administración de Recursos Empresariales (ERP), Sistemas de Información Ejecutiva(EIS), Sistemas de Soporte a las decisiones (DSS), Sistemas Gerenciales, Manejo deRelación con Clientes (CRM), Suministro de la Cadena de Distribución (SCM), sonalgunos de los sistemas que surgen, se ponen de moda y luego algunos desaparecenacorde a la evolución de las empresas. Lo que es un hecho, independientemente delenfoque que esté de moda o sea más útil en el momento, es que los datos siempreserán almacenados en bases de datos y esos datos serán el soporte total a lasdecisiones de la empresa.Muchos negocios requieren información de su actividad específica, por ejemplo, losERP (Administración de Recursos Empresariales) son sistemas muy grandes ycomplejos en donde gran parte de su contenido se dedica a la producción, sería ilógicoadquirir un sistema tan complejo y costoso si la empresa se dedica a los bienes raíces.En ese mismo sentido existen desarrollos comercializados como productos que soloson configurados en una organización en particular, pero tienen el funcionamientomínimo necesario para cierta industria. Hay software para la industria automotriz,software para hoteles, comercio minorista, transporte, software educativo, entreotros. El motivo por el cual son distintas las herramientas utilizadas obedece a que lasactividades demisión crítica, que soportan cada una de las industrias son diferentes ycomo tal, también es distinto el tipo de información que puede solicitar un directivo encada una de las industrias, motivo por el cual hay muchos productos de softwarededicados a explotar la información de las bases de datos que no tienen característicasestándares, sino más bien son adaptables a cada situación.Considerando las distintas necesidades en cada actividad, es fácil extrapolar la mismasituación a cada empresa, incluso con actividades similares, pero lo importante esentender el último nivel en cuanto a la diferenciación de la información solicitada.La información que fluye en una empresa está destinada a responder a diversos tiposde preguntas de sus usuarios, de ahí la necesidad que existan sistemas de informaciónpara requerimientos muy específicos que permitan la recolección y el manejo dedatos.En el interior de una empresa, los puestos son factores importantes para determinar lainformación que comúnmente es requerida por la gente.Los sistemas de procesamiento de datos (OLTP) hacen uso de medios dealmacenamiento y técnicas para poblarlos. La mayoría de las empresas, por lacantidad de información que manejan, se basan en los OLTP para guardar muchosdatos y tener tiempos de respuesta cortos a los cientos de transacciones realizadascotidianamente, sin embargo, la eficiencia no es para la consulta masiva de grandescantidades de información y mucho menos para el análisis dela misma. La tecnologíaha tenido que adaptar los medios de que se vale para que sean eficientes en el ámbitoespecífico de aplicación, tanto para el diseño de estructuras de datos que ordenen lainformación como se desea, como en las herramientas o software que permitesolucionar en tiempo y forma lo que el usuario demanda. Es importante resaltar quetodos los Sistemas de Información tienen un fin muy particular, y se complementanpara sostener, de la manera más eficiente, un negocio; sin embargo, no todos puedensolucionar las distintas demandas de los usuarios, precisamente porque son diseñadospara alguna área de aplicación muy específica.El motivo por el cual existen varios sistemas de información es porque los usuariostienen preguntas muy específicas que no cualquier sistema puede resolver. De hecho,Ing. Bertha Mazón, Mg. Sc. 11
    • Inteligencia de Negocioslas bases de datos operacionales, que son las indispensables en cualquierorganización, no están organizadas para responder a preguntas globales sino apequeños grupos de datos. Preguntas que involucren consultas complejas podríanresolverse en un lapso extenso, en el cual cabe la posibilidad de que la vigenciadesaparezca. Lo importante es destacar que una base de datos o sistema deinformación no tienen la capacidad de resolver las necesidades informativas de toda laorganización (Bitam, 2002).1.2.4. Información que las empresas necesitan según los nivelesorganizacionalesLa tendencia de las organizaciones actuales es demandar información en los nivelesdonde antes la administración se basaba en la intuición y el sentido común para tomardecisiones. A pesar de que en los niveles operativos siempre se ha demandadoinformación, históricamente no ha existido restricción alguna para brindarla al usuario.Más bien los mercados dinámicos han obligado a las empresas para que la informaciónestratégica sea puesta en las computadoras de los directivos, este comportamiento seha generalizado principalmente motivado por la facilidad y utilidad de la informacióncompartida. En estos momentos la información fluye en todos los niveles de laorganización con diferentes fines (comunicación, control, administración, evaluación,etc.) independientemente de los puestos. Las empresas están entendiendo que losniveles directivos tienen una gran responsabilidad al tomar decisiones, pues el impactoque generan recae sobre toda la organización, pero también existen más personas quetoman decisiones y, a pesar de que éstas no tienen un impacto global, deben sertambién correctas y oportunas, pues ciertos grupos dependen de las mismas.Directores, gerentes, supervisores, jefes, todos aquellos que toman decisiones debentener suficiente información para apoyarse en su trabajo cotidiano, el lugar queocupen en la pirámide organizacional se vuelve secundario cuando el enfoque es haciael manejo de procesos y todos los puestos tienen cierta relación y dependencia entresí.De modo general en una pirámide organizacional, los requerimientos informativos sedividen en 3 partes:  Información Estratégica  Información Táctica  Información Técnico Operacional.Información EstratégicaEstá orientada principalmente a soportar la Toma de Decisiones de las áreas directivaspara alcanzar la misión empresarial. Se caracteriza porque son sistemas sin cargaperiódica de trabajo y sin gran cantidad de datos, sin embargo, la información quealmacenan está relacionada a un aspecto cualitativo más que cuantitativo, que puedeindicar como operará la empresa ahora y en el futuro, el enfoque es distinto, perosobre todo es distinto su alcance. Se asocia este tipo de información a los ejecutivosde primer nivel de las empresas.Un punto importante es que la información estratégica toma grandes cantidades dedatos de áreas relacionadas y no se enfoca específicamente hacia una sola, de ahí quelas decisiones que puedan ser tomadas impactan directamente sobre toda laorganización.Ing. Bertha Mazón, Mg. Sc. 12
    • Inteligencia de NegociosInformación TácticaInformación que soporta la coordinación de actividades y el plano operativo de laestrategia, es decir, se plantean opciones y caminos posibles para alcanzar laestrategia indicada por la dirección de la empresa. Se facilita la gestión independientede la información por parte de los niveles intermedios de la organización. Este tipo deinformación es extraída específicamente de un área o departamento de laorganización, por lo que su alcance es local y se asocia a gerencias o subdirecciones.Información Técnico OperacionalSe refiere a las operaciones tradicionales que son efectuadas de modo rutinario en lasempresas mediante la captura masiva de datos y Sistemas de ProcesamientoTransaccional. Las tareas son cotidianas y soportan la actividad diaria de la empresa(contabilidad, facturación, almacén, presupuesto y otros sistemas administrativos).Tradicionalmente se asocian a las Jefaturas o Coordinaciones operativas o de tercernivel.Si consideramos factores internos y externos de una organización podríamos concluirque los requerimientos actuales se orientan a conocer y mejorar los costos de toda lacadena económica. Estos requerimientos se reflejan en el interés por tener a la manolos diagnósticos que arrojen información específica y clave para determinada área deconocimiento, en el menor tiempo posible. La tendencia es que las áreas directivasnecesitan en su escritorio la información clave de su empresa; en todos los niveles elrequerimiento es similar aunque, evidentemente, tiene objetivos diferentes. Elparadigma de la información exclusiva en los niveles directivos para apoyar la toma dedecisiones no es obsoleto, simplemente se debe mejorar y complementar agregandola información también en otros niveles medios y jefaturas, o sea, en cualquierpersona que tenga el poder de tomar decisiones (Bitam, 2002).1.2.5. Objetivos de la informaciónEl objetivo del usuario operativo es que se le facilite y automatice la operación de unafunción específica de la empresa; el de un estratega es maximizar la función de laempresa.1.2.6. Usuarios en los niveles de gestión una organizaciónEl usuario es distinto incluso en la misma pirámide organizacional. Mientras lossistemas operativos tienen interfaces muy especializadas para un usuario que realizauna operación rutinaria, los usuarios estratégicos realizan consultas variadas y noprevistas de la información, por lo que los sistemas deben ser sencillos y con toda lainformación disponible que cubra cualquier consulta requerida, de este caso elsoftware final debe ser orientado a un usuario en particular y, por ende, deberáadecuarse al conocimiento que tenga sobre el tema.1.2.7. Tipos de preguntas en los niveles de gestión una organizaciónLas preguntas que responde un sistema operacional son referentes a las transaccionesque se realizan diariamente y a nivel registro o suma de registros de un solo tipo. Unusuario operativo realiza frecuentemente preguntas sobre registros como pueden serel estado actual de una factura, movimientos de un cliente, cantidad surtida por unproveedor, fecha del último movimiento de un distribuidor, etc. Las preguntas de unejecutivo pueden también ser específicas, pero se orientan más a agrupamientos dedatos como pueden ser totales por zona, promedios de clientes, tendencias de ventase incluso pronósticos. Toda esta información se encuentra de alguna forma en losalmacenes operativos, pero lanzar una consulta como las ventas totales del añoanterior puede implicar hasta días en resolverse y otro tiempo para publicar los datos.Un sistema organizado para resolver preguntas de ambos tipos en el menor tiempoposible es lo ideal.Ing. Bertha Mazón, Mg. Sc. 13
    • Inteligencia de Negocios1.2.8. Cantidad de datos en los diferentes niveles de una organizaciónSi un usuario procesa la información de las transacciones se mueve en el nivelregistro. Si un usuario procesa información de entidades, se mueve en el nivelagrupamientos de registros, obviamente la cantidad de datos que se necesitan esdistinta y debe ser un sistema diferente el que provea de esa información. Para que undirector o gerente, quien necesita conocer las transacciones de toda una zona paratomar una decisión, pudiera analizar cierto comportamiento, serían necesarias muchashojas de reportes con cientos de datos. El usuario operativo que necesita pocosregistros no tiene mayor problema por recibir una hoja de reportes, pero el directivo sitendría problemas con una cantidad exagerada de papeles. Se necesitan sistemas quebrinden no solo la cantidad ideal de información según el usuario, sino también que laentreguen en tiempos óptimos.Resumiendo, existe una gran necesidad de información en muchos niveles de lasorganizaciones, pero hasta el momento no existe un sistema de información que estédiseñado para dar respuesta cabal a todos ellos. Cada sistema da respuesta a unaparte de los requerimientos de toda la empresa para que, en conjunto, no quede unespacio vacío de información ni en tiempo, ni en forma.1.3. INTELIGENCIA DE NEGOCIOSLa Inteligencia de Negocios (Business Intelligence - BI) es un concepto que hacereferencia a las técnicas de análisis de datos destinados a encontrar información útilpara la toma de decisiones, incluido el conjunto del software que aportan lasinterfaces y funciones necesarias que apoyan dicho proceso.1.3.1. Evolución de la Inteligencia de NegociosLos sistemas de información son bastante recientes si los comparamos con otras áreasde conocimiento. Inicialmente, con la introducción de las computadoras en la décadadel 60, las aplicaciones se corrían de forma individual en archivos maestros quealmacenaban los datos en medios magnéticos, con la limitante del acceso secuencial.El problema del acceso secuencial es la necesidad de recorrer todos los registros antesde encontrar el que se está buscando. Además, al almacenar operaciones individuales,pronto existió una cantidad enorme de cintas y medios de almacenamiento conredundancia, que hacía difícil su administración.En la década del 70, cuando aparecen los dispositivos de almacenamiento de accesodirecto, se da un gran paso en cuanto a la velocidad para acceder a los datos, puescon ellos las búsquedas ya no eran lineales, sino directas. Junto con ello tambiénaparecen sistemas de administración de bases de datos (DBMS), cuyo propósito erafacilitar al programador el acceso a la información al encargarse del almacenamiento eíndices. En ese entonces se definió a la base de datos como "una fuente única deinformación para todo el procesamiento".Tanto la implementación de las bases de datos para el procesamiento en línea comolas nuevas tecnologías y lenguajes de cuarta generación (4GL), proveyeron al usuariola facilidad de tener el control directo de los sistemas y la información, dando origen alos primeros Sistemas de Información formales. Pero también fueron el inicio delparadigma de una sola base de datos que pudiera servir tanto al procesamientooperativo como al procesamiento de alto nivel.La información almacenada en las bases de datos mantiene el registro total de lo quesucede en la organización. Cuando un usuario operativo desea consultar transaccionesunitarias o pequeños grupos de transacciones, se puede acceder directamente yextraer la información en un lapso muy breve (milisegundos); si la base de datos noes muy extensa, incluso un gerente puede también realizar una consulta (víaIng. Bertha Mazón, Mg. Sc. 14
    • Inteligencia de Negociosasistentes) que traiga información resumida sobre muchos registros e, incluso, sobretoda la base de datos, los tiempos para consultas de ese tipo son muy razonables(segundos). ¿Pero qué pasa cuando los datos sobrepasan los límites permisibles paratener la información disponible?Algunos de los factores causales de que las bases de datos se volvieran pocooperativas para consultas extensas son las fusiones, la globalización, las alianzas, ladiversificación de productos, el crecimiento exponencial de las empresas y, en general,todas las condiciones derivadas de la evolución natural de las empresas que trajoconsigo un aumento cuantitativo de los datos que se necesitaba almacenar. A esto hayque agregar que las herramientas o software necesario para obtener la informacióneran muy especializados y rara vez una persona que toma decisiones tenía elbackground necesario para manipular información.La información primitiva se volvió muy extensa y poco práctica para cierto tipo deconsultas, había que desarrollar nueva tecnología que permitiera derivar informacióncalculada o sumarizada para satisfacer las necesidades de la administración, además,la información primitiva representa el valor actual, es utilizada y operada en procesosrepetitivos, por lo tanto, es posible su modificación. La información derivada no puedeser actualizada porque, normalmente, contiene valores históricos, es operada yutilizada por procesos que se ejecutan aleatoriamente. La información primitiva esoperacional apoyando las funciones de empleados de línea, la información derivada espara el soporte de decisiones que normalmente apoya a administradores y ejecutivos.Teniendo tantas diferencias es complicado entender que la misma información puedaresidir en una misma base de datos. De hecho así fue, la gente que toma decisionesdemandó respuesta a sus necesidades en los almacenes operativos encontrandomuchas limitantes en tiempo y forma, a fin de cuentas es posible satisfacer losrequerimientos, pero no como los necesita quien toma decisiones, la tecnologíaintervino para desarrollar arquitecturas especializadas para que resida la informaciónsegún su tipo y que sea operada por el software adecuado para desempeñar susfunciones.Inteligencia de Negocios (BI) es un concepto que se asocia 100% con los nivelesdirectivos, surge de la necesidad de contar con información para dirigir el rumbo de laempresa por los altos mandos, sin embargo, con el tiempo se ha ido ampliando elalcance de este término hasta llegar prácticamente a toda la empresa.A pesar de relacionar completamente el término con conceptos 100%computacionales, sobre todo las herramientas utilizadas para lograr implementar undesarrollo de este tipo, la verdad es que el concepto no se construye basándose enherramientas computacionales, sino de la formulación de estrategias efectivas denegocios que respondieran a los nuevos tiempos y sus demandas. El énfasis es en losrequerimientos y de ahí se desprenden las aplicaciones, es decir, los hombres denegocio dictan las necesidades y la gente técnica investiga y adapta la tecnología pararesolver favorablemente esos requerimientos con todos los medios a su alcance. BI seplantea una sinergia entre los Tomadores de Decisiones y las herramientas queemplean, la tecnología está claramente vinculada al management de las empresas,teniendo como resultado obtener ventajas competitivas, producto de decisiones mejorinformadas. En función de esta se puede entender a BI como una combinación detecnología y desarrollo de negocios (Bitam, 2002).1.3.2. Definiciones de Inteligencia de NegociosComo muchos otros conceptos o términos, el de Inteligencia de Negocios no escapa ala diversidad de interpretaciones. Se justifica su uso y se entiende el que seaconsiderado como una Tecnología de Información, pero no existe un acuerdo encuanto a su definición.Ing. Bertha Mazón, Mg. Sc. 15
    • Inteligencia de NegociosSegún la empresa Abits (2005, http), la “Inteligencia de Negocios, es una alternativatecnológica y de administración de negocios, que permite manejar la información parala toma de decisiones acertadas en todos los niveles de la organización, desde laextracción, depuración y transformación de datos, hasta la explotación y distribuciónde la información mediante herramientas de fácil uso para los usuarios”.Según Nader J. (2006), "Es el conjunto de tecnologías que permiten a las empresasutilizar la información disponible en cualquier parte de la organización para hacermejores análisis, descubrir nuevas oportunidades y tomar decisiones másinformadas."1.3.3. Arquitectura de Inteligencia de NegociosSegún Rodríguez I. La “Inteligencia de Negocios se compone de diferentestecnologías que se integran para formar una solución empresarial, los componentes seorientan a transformar los datos en información oportuna y confiable para el usuariofinal, por consiguiente, una arquitectura BI se divide en las siguientes capas: SistemasFuentes, Capa DataWarehouse y la Capa BI”. Figura 1. Arquitectura Típica de Soluciones Business Intelligence. Fuente: Rodríguez I.Sistemas Fuentes. Los datos administrados por los sistemas de aplicaciónoperacionales son la fuente principal de datos para el data warehouse. Estos sistemasson los encargados de recolectar información diaria de las tareas operativas de laorganización. Estos datos operacionales constituyen la base de todo sistema businessIntelligence ya que de estos dependen la calidad de información que se entregue alusuario final. En muchas ocasiones también se requiere de datos externos paraalimentar al sistema como hojas electrónicas, archivos de texto, debido a que algunasáreas de la institución no se encuentran automatizadas por lo que no cuentan con unsistema transaccional donde almacenar los datos.Capa Data Warehouse. La capa data warehouse es el centro de la arquitectura enun sistema business intelligence, que se encarga de organizar y almacenar los datospara el análisis de los mismos.Ing. Bertha Mazón, Mg. Sc. 16
    • Inteligencia de NegociosCapa Business Intelligence. Comprende un conjunto de herramientas necesariaspara comprender los datos y utilizarlos para tomar decisiones inteligentes.Proporcionan toda la funcionalidad de análisis y creación de informes empresarialesdirigidos a una amplia gama de posibles usuarios. Algunas de estas herramientas son:Query and Reporting, Cuadros de mando, OLAP y Datamining.Analizando las definiciones, queda primeramente claro que BI no es una metodología,software, sistema o herramienta específica, es más bien un conjunto de tecnologíasque van desde arquitecturas para almacenar datos, metodologías, técnicas paraanalizar información y software entre otros, con un fin común para el apoyo a la tomade decisiones. A partir de elementos comunes, podemos obtener una definición queabarca BI en cuando a su utilidad y funcionalidad en las empresas.A. InformaciónEs la esencia de BI. El fin último es proveer de información al usuario final paraapoyarlo en la toma de decisiones, y esta información puede provenir tanto de losalmacenes operacionales como de arquitecturas diseñadas específicamente para elanálisis como Data mart y Data warehouse. El usuario puede necesitar información decualquier fuente primitiva o derivada para apoyarse en su labor, para lo cual BI utilizao construye fuentes de datos o de información interna o externa, que son la principalmateria prima de esta Tecnología.B. Apoyo a la toma de DecisionesUn sistema que exclusivamente brinde información no representa lo que se busca conBI, una segunda característica consiste en organizar y presentar los datos relevantespara que puedan verdaderamente apoyar una Toma de Decisiones. Esto implicatecnologías, técnicas de análisis y todo aquello que sea necesario para obtener de losdatos, solo aquella información relevante y útil a la labor del usuario. Recordando elorigen de BI, surge en la toma de decision espara obtener ventajas competitivasproducto de decisiones mejor informadas. Si su origen cae en el desarrollo denegocios, es lógico entender que BI sea un apoyo para tal efecto. BI abarca cualquierforma de organizar información, siempre y cuando sostenga la Toma de Decisiones.C. Orientación al Usuario FinalUn factor que incidió en la tecnología BI para explotar información fue que el usuariofinal no poseía conocimientos técnicos que le permitieran tener un acceso sencillo ydirecto a los datos operacionales, pues esa área está reservada para informáticos. Portal motivo, el usuario final no tenía de primera mano la información que necesitaba ylas consultas no definidas, que son las que tradicionalmente realiza un ejecutivo, eranrealizadas por terceras personas (léase secretarios, asistentes técnicos o gente desistemas) con la dependencia consecuente. BI incluye herramientas de explotación deinformación orientadas a usuario final, para eliminar la dependencia de terceraspersonas. Se pretende brindar las facilidades necesarias para que, con la tecnología, elusuario actúe solo. Las herramientas de BI son sencillas, intuitivas y fáciles deentender y usar; pueden tener diversos fines, como son: Informar, reportar, permitiranálisis, identificar tendencias, proyectar, etc. Cualquiera que sea su función final, elcomún es el mismo: orientación a usuario final. Considerando los elementos comunesen cualquier definición, puede implementarse una definición más acabada.Inteligencia de Negocios es una combinación de tecnologías de colección de datos ymanejo de información, que implementa soluciones orientadas al usuario final paraapoyar la toma de decisiones, aprovechando la información estratégica disponible encualquier parte de la organización.Ing. Bertha Mazón, Mg. Sc. 17
    • Inteligencia de NegociosPara la colección de datos usa o construye almacenes de datos y los maneja contécnicas de análisis y herramientas orientadas al usuario final. Los almacenes de datosson las fuentes operacionales (bases de datos, archivos de texto, hojas de cálculo,administradores de archivos, etc.), bases de datos operacionales, bases de datosexternas, data warehouse y data marts. Las técnicas de análisis principales son losSistemas de Información Ejecutiva (EIS), Sistemas de Soporte de Decisiones (DSS),Data Mining y Herramientas de Reportes, estas últimas a veces forman parte de lasanteriores.BI es un término "agrupador". El que sea considerado como un conjunto deconceptos le da un poder enorme, pues pueden integrarse funciones quetradicionalmente estaban separadas, tales como el acceso de datos, reportes,explotación, pronóstico y análisis. De ese modo, al menos en la actualidad enempresas grandes, BI se ha convertido en un apoyo indispensable para la Toma deDecisiones, en cualquier nivel de la organización y mucha gente está explotando elpotencial estratégico de los datos operativos. Bien utilizada, BI puede ser un armaestratégica de la gente de negocios, sustentada en tecnología de sistemas (Bitam,2002).1.3.4. Sistemas de Información Ejecutiva y Sistemas de Soporte a lasDecisionesA continuación se realiza una explicación de las características principales delosSistemas de Información Ejecutiva (Executive Informations System-EIS-) y delosSistemas de Soporte a las Decisiones (Decision Support System -DSS-) que por mediode estos tipos de sistemas se brinda información de toma de decisiones a los usuariosfinales.1.3.4.1. Sistemas de Información EjecutivaEn la década del 90, desde que las grandes empresas iniciaron su camino para quesus ejecutivos manipularan la información como deseaban para lograr una visióncompleta del negocio, hubo muchos intentos y malas acogidas motivadas por razonesde tecnología, costos o simplemente cultura. El Data Warehouse fue un esquema deinformación que mantenía datos para efectos exclusivamente de análisis yestadísticos, con este avance en el almacén, los esfuerzos se centraron en utilizarlo yproveer de la información que necesitaba el ejecutivo. Los primeros intentos secentraron en la incursión al mercado de soluciones con alarmas, instrumentos deconsulta, sistemas expertos y mucho más, pero la evolución, incluso a la fecha, esalcanzar a colocar en una pantalla la mayor cantidad posible de datos para realizaranálisis gráficos, visuales y rápidos basados en técnicas de consolidación,agrupamiento y tendencia. Esto dio origen a los Sistemas de Información Ejecutiva(Bitam, 2002).¿Qué es un EIS?EIS se refiere a cualquier sistema de software que muestre información ejecutiva delas diferentes áreas del negocio en un solo sistema, facilitando el monitoreo de laempresa. El EIS es una técnica de más alto nivel dentro de las herramientas de BI.Tiene como objetivo primordial proveer de toda la información necesaria a la genteque toma decisiones, de modo fácil y prácticamente con una mínima interacción con elsistema. En términos formales, "un EIS es un sistema de información que permite alos ejecutivos acceso rápido y efectivo a información compartida, crítica para elnegocio, utilizando interfaces gráficas". Las interfaces que son utilizadas en estossistemas deben ser más sofisticadas que los sistemas transaccionales y deben incluir,en el menor número de páginas posible, la mayor cantidad de información que elusuario necesita para monitorear su empresa.Ing. Bertha Mazón, Mg. Sc. 18
    • Inteligencia de Negocios¿Qué debe contener un EIS?Las partes importantes de un EIS son: la interfaz de usuario y la base de datosmultidimensional, esto montado en una arquitectura Cliente/Servidor. La figura 11muestra las características principales de un EIS. Figura 2.Características de un EIS. Fuente: Nader, J.,2003  Interfaz Gráfica y fácil de usar. posean interfaces gráficas sencillas, que tengan una curva de aprendizaje corta y, además, deberán ser vistosas e intuitivas para facilitar la labor de monitoreo del tomador de decisiones.  Alarmas o semáforos. Un típico EIS cuenta con funciones que le permiten al usuario notar rápidamente los errores y los valores destacables de la información.  Tableros de Control. El Tablero de Control es una herramienta que en un principio utilizaba indicadores financieros para permitir desarrollar diferentes procesos de negocio. Su especialización ha tomado el camino hacia el CMI (Cuadro de Mando Integral), que ya es una poderosa herramienta para dirección, que no solo utiliza indicadores financieros, sino también los no financieros para dirigir de forma proactiva a la empresa en la consecución de objetivos a mediano y largo plazo.  Administración de una sola página. De la mano del Tablero de Control, la Administración de una sola página significa colocar el mayor número posible de indicadores destacables de la empresa en el menor número posible de páginas, además, permitir la navegación hacia otras páginas con más información, ya que, es prácticamente imposible colocar toda la información valiosa en un solo lugar.  Integración de información proveniente de los cubos. El usuario tiene muchas veces la necesidad de tener información proveniente de múltiples sistemas o bases de datos. De hecho, para tomar una decisión estratégica es necesario poseer información de toda la empresa, no solo de una parte de ella. Un EIS debe permitir integrar información de cualquier aplicación yIng. Bertha Mazón, Mg. Sc. 19
    • Inteligencia de Negocios presentársela al usuario final de una forma transparente para él. Esto es la base para no moverse entre aplicaciones, al integrar la información de múltiples fuentes de información es posible la Administración de una Sola Página en un Tablero de Control, el no hacerlo representa una limitante al usuario con la consecuencia de moverse hacia otras pantallas e, incluso, hacia otras aplicaciones con información dispersa.1.3.4.2. Sistema de Soporte de DecisionesA continuación de define que es un DSS y se detallan las principales características deeste tipo de sistemas.¿Qué es un DSS?Los límites y el concepto de un DSS no han sido completamente precisados, a pesarde que la utilidad ha sido justificada en las organizaciones. Su uso indiscriminado confrecuencia lo lleva a rebasar límites de su aplicación y confundirse con términos comoOLAP, Data Warehouse o EIS, lo cierto es que, independientemente, del término quellegue a utilizar, siempre se asocia al soporte a la toma de decisiones y, de algunaforma, todos los conceptos señalados tienen en la toma de decisiones el punto deencuentro (Bitam, 2002)."DSS se refiere a cualquier sistema de software que permite análisis de lasdiferentes variables del negocio para apoyar una decisión."Características de un DSS Figura 3. Características de un DSS. Fuente: Nader, J.,2003Análisis Multidimensional (OLAP)El análisis multidimensional no es privativo de arquitecturas multidimensionales,puede también llevarse a cabo en arquitectura relacional, diseñada para tal caso, loimportante para poder hacer Análisis Multidimensional no son las bases de datos, sinola estructura de la base de datos y las técnicas que se utilicen para su explotación.Dentro de los niveles estratégicos organizacionales, la información se concibe comouna serie de hechos multidimensionales, jerárquicos y relacionados; como ejemplo,Ing. Bertha Mazón, Mg. Sc. 20
    • Inteligencia de Negocioslos datos de inventarios, ventas y compras están interrelacionados y dependen entresi. La idea del análisis multidimensional es facilitar la consulta y análisis al usuario alpresentar una visión muy sencilla de los datos, muy similar a la forma como él ve laorganización. La información puede ser accedida desde diferentes variablesorganizacionales y mostrando diferentes las perspectivas(pivotear).Herramientas de ReportesEn este apartado se presenta una introducción a uno de los componentes quedansoporte a la Inteligencia de Negocios, que son los reportes y las herramientas para suconstrucción. A continuación se explica el estado actual de los reportes, su necesidady las características principales que deben reunir las herramientas que los construyeny administran.Estado Actual de los ReportesTradicionalmente, los reportes han sido el medio principal para disponer deinformación. Tanto reportes en papel como en el escritorio, el usuario depende deellos para comunicar a la gente lo que está ocurriendo en la empresa vía losalmacenes de información. Los reportes tienen en las bases de datos su principalfuente de alimentación y han brindado al usuario final entendido éste como cualquierpersona que requiera un reporte, la posibilidad de consultar y publicar lo que las basesde datos poseen, la limitante que siempre ha existido en este sentido es que elgenerar un reporte implica manejar algunas habilidades técnicas relacionadas con lasbases de datos y las herramientas de software.Los reportes o las consultas son requeridos por cualquier persona dentro de laorganización, de hecho, no es una labor que esté limitada a un nivel jerárquicoopuesto. Cuando un usuario con poca preparación técnica (secretarias, ejecutivos,etc.) requiere de un reporte o consulta, lo hace vía terceros, el tradicional entorno eshacer la solicitud de información a sistemas y obtenerla después de cierto tiempo, eltiempo puede ser irrelevante o puede significar la pérdida de vigencia de lainformación solicitada.El usuario técnico realiza los reportes y para ello necesita conectarse a la base dedatos, posteriormente, diseñar el formato requerido y, al final, obtener los datos.Tanto la conexión a la base de datos como la construcción del formato del reporte sontareas de sistemas, la obtención de datos se comparte con el usuario final, con estalógica se entiende que el usuario final no puede manipular sus reportes en caso denecesitar modificaciones o adecuaciones al mismo, por lo tanto continúa ladependencia, incluso, para modificaciones mínimas.Los usuarios con algunas habilidades computacionales pueden hacer uso delasherramientas de reportes orientadas a los usuarios de sistemas, pero solo paraobtener reportes sencillos, no el tradicional reporte complejo que es el más útil,además, la gente que toma decisiones no debe perder su tiempo en procesarlainformación para después analizarla.Algunas de las limitantes propias de la generación de reportes en la actualidad son:IntegraciónLos reportes complejos que necesitan de más de una fuente de información se realizanextrayendo los datos en un primer momento y, posteriormente, procesándolos en unaherramienta que los integre (hojas de cálculo, archivos de texto, Access, etc.). Estoimplica preparar la información antes de que se encuentre lista para ser enviada alusuario y la preparación normalmente llevan horas o hasta días con la consecuentepérdida de tiempo en funciones secundarias improductivas.Ing. Bertha Mazón, Mg. Sc. 21
    • Inteligencia de NegociosDistribuciónLos reportes se imprimen y posteriormente se distribuyen de forma manual omediante fax. También se generan en pantalla y, luego, se envían mediante fax ocorreo electrónico, con lo que hay dos actividades involucradas que generan pérdidade tiempo en su ejecución: la publicación y la distribución.Dependencias de sistemasLas bases de datos se construyen en general para ser eficaces al almacenar datos nopara consultarlos. Los lenguajes de consulta se adaptan a la estructura de las basesde datos. En función del conocimiento necesario, tanto de las bases de datos aconsultar como de los lenguajes técnicos necesarios, el usuario final no está enposibilidad real de obtener su propia información, por tal motivo la dependencia degente de sistemas es muy grande y provoca el que se tengan los reportes cuando lagente de sistemas dispone de tiempo y recursos para hacerlo, visto de otro modo, si lagente de sistemas no lo hace, el usuario final no los tendría a la mano.SeguridadAl dejar en manos de terceros la generación de reportes se puede incurrir en que lainformación valiosa para la empresa pueda ser filtrada y utilizada por personas que noson los directamente interesados en utilizarla. Un reporte de sueldos y prestaciones delos empleados, solicitado por Recursos Humanos, puede ser un detonante de conflictosen manos de inconformes.Herramientas de consulta y reportesLas herramientas de consulta y reportes (Query & Reporting Tools) son una categoríade herramientas de BI. Con las herramientas de reportes orientadas al usuario final sepretende mejorar la obtención de información mejorando el área de sistemas aldisminuir una capa intermedia entre complejidad técnica y usuario final.Las herramientas de reportes orientadas al usuario final son software que aíslalacompleja capa técnica propia del lenguaje de sistemas, tal como lenguaje SQL,uniones de tablas y nombres crípticos, al organizar los datos de la terminología denegocios. El resultado es que el usuario final o intermedio tiene una vista mucho másparecida a su concepción del negocio, o al menos lo suficiente como para podergenerar sus propios reportes y publicación de los mismos, sin depender delos usuariostécnicos.El usuario de sistemas continúa participando, pero básicamente en el control sobre elacceso a bases de datos, administración, mantenimiento, seguridad, impacto en la rede incluso, creación única de reportes complejos; el usuario final tiene solo un ambienteamigable en el que es posible crear sus propias consultas y reportes. Una herramientade reportes puede también publicar los datos que se encuentran almacenados en unData Warehouse. Desde ese punto de vista, se brinda con la tecnología, la posibilidadde que el usuario final no solo consulte y publique la información a detalle, sinoinformación concentrada y agrupada; de ahí que también sea considerada como elsoporte último para el máximo nivel de detalle de un DSS.Cierta duda ha surgido en cuanto a la verdadera posibilidad para que el usuario finalrealice sus reportes y posteriormente los explote. Definitivamente depende del nivelen el cual ubiquemos al usuario final y, evidentemente, del nivel de conocimientos enmateria de computación que pueda tener. Un usuario final puede ser cualquierpersona que requiera hacer una consulta o reporte y éste puede ir desde unasecretaria, un asistente, un gerente o un director, cualquiera que necesite informaciónprocesada de fuentes de datos es un usuario potencial.Ing. Bertha Mazón, Mg. Sc. 22
    • Inteligencia de NegociosSin embargo, a pesar de que el manejo de una herramienta como Excel se haconsiderado un estándar que pueda utilizar cualquier administrativo de cualquier nivel,no todas las personas pueden decir que verdaderamente saben utilizar, para finesprácticos, esa herramienta. Precisamente, para ese tipo de usuarios, las herramientasde reportes no serán útiles más que para explotar los reportes que previamente sehayan realizado, es decir, ejecutar reportes. Otro tipo de usuario, con algunosconocimientos, si podrá construir sus propios reportes, que siguen siendo tarea degente de sistemas, pues requieren de un procesamiento de la información antes deque sea "pintada" y, para ello, son necesarios procedimientos externos a los datos conlenguajes de consulta altamente técnicos.Dependiendo del nivel del usuario puede disminuirse o eliminarse la dependencia desistemas y pueden las herramientas de reportes mantener 3 niveles de dificultad:  Usuarios poco expertos (gerentes tácticos, directores ejecutivos) quienes solicitan la ejecución de reportes o consultas predefinidas, según parámetros predeterminados.  Usuarios con cierta experiencia (asistentes, gerentes operativos, secretarias especializadas) pueden generar consultas o reportes flexibles, apoyándose en una interfaz gráfica intuitiva.  Usuarios muy experimentados (sistemas) pueden crear e incluso escribir, total o parcialmente, la consulta en un lenguaje de consulta.Características de una herramienta de reportesUna herramienta de reportes orientada al usuario final debe también poseer algunasutilidades adicionales que faciliten la generación y publicación de reportes.IntuitivoComo cualquier herramienta de BI, la característica común es su facilidad de uso eintuición. Con apoyo en interfaces gráficas y visuales, un usuario con una formaciónestándar podrá hacer uso de una herramienta de este tipo.SeguridadDeben brindar seguridad para el acceso a los reportes, tanto a nivel usuario como porgrupos e, incluso, en el grado de profundidad de cada usuario a la información. Estocon la idea de que la información privada no sea accesible por cualquier persona.Publicación y distribución.Una función importante de las herramientas es eliminar la doble actividad de ejecutary publicar primero un reporte y, posteriormente, distribuirlo a quien lo necesita. Lapublicación de una consulta normalmente se realiza mediante fax, correo electrónico,archivo e, incluso, de mano en mano. El objetivo con las nuevas herramientas esfacilitar estas actividades. En el momento que un usuario pueda ejecutar, desdecualquier lugar, una consulta y mandarla imprimir on-site, se está eliminando la doblefunción de publicación y distribución. Las herramientas de reportes deben permitirrealizar consultas desde su PC en modo Cliente / Servidor, Intranet o Internet eimprimir cualquier consulta.Ing. Bertha Mazón, Mg. Sc. 23
    • Inteligencia de NegociosNavegaciónLa interrelación de reportes es también frecuente para generar sistemas basados enreportes y reportes auxiliares. La navegación entre ellos mediante ligas e hipervínculoses una funcionalidad más.Programación automáticaGeneración de instrucciones para que los reportes se ejecuten automáticamente eincluso se distribuyan mediante correo electrónico.Reportes dinámicosPermitir el ingreso de parámetros de valor que hagan un reporte flexible y dinámico enel momento de su ejecución. Con esto se economizan esfuerzos al ejecutar muchasconsultas a partir de un solo reporte.Reportes por excepciónPara no consultar una cantidad muy grande de información debe existir la posibilidadde brindar reportes por excepción, es decir, lo que no cumplan con las condiciones degeneralidad.1.4. HERRAMIENTAS PARA INTELIGENCIA DE NEGOCIOS1.4.1 HERRAMIENTAS PROPIETARIASEL CUADRANTE MÁGICO Figura 4. Cuadrante mágico de las Plataformas BI. Fuente: Gartner, 2009. http://mediaproducts.gartner.com/reprints/oracle/article56/article56.htmlIng. Bertha Mazón, Mg. Sc. 24
    • Inteligencia de NegociosSegún el informe de investigación “Magic Quadrant for Business IntelligencePlatforms” presentado por la empresa Gartner en enero del 2009 (ver Figura 13), seobserva que las plataformas de BI predominantes siguen siendo propietarias,destacándose Cognos de IBM, Microsoft, Oracle, SAP, SAS, Micro Strategy eInformation Builder.A continuación se describen y se muestra la arquitectura de las plataformas BIpropietarias más relevantes:  COGNOS COGNOS: Proveedor de tecnología y servicios para el Business Intelligence (BI) y la Gestión del Rendimiento, ofrece una plataforma basada en estándares abiertos para generación reportes, análisis y scorecards que se integran con los presupuestos, planes, proyecciones e informes financieros conducidos por finanzas. Figura 5. Arquitectura BI de IBM Cognos. Fuente: IBM Cognos. http://www.cognos.com/nl/products/now/architecture.html  MICROSOFT La plataforma Business Intelligence de Microsoft comprende aplicaciones de servidor, cliente y programador. Está basada en Microsoft SQL Server 2008, que incluye administración de bases de datos relacionales, SQL Server Integration Services, SQL Server Analysis Services, SQL Server ReportingServices y las capacidades de análisis de datos SQL Server Data Mining y está integrada con la plataforma de desarrollo Microsoft Visual Studio 2010 y conIng. Bertha Mazón, Mg. Sc. 25
    • Inteligencia de Negocios Microsoft Office 2010. Figura 6. Arquitectura BI de Microsoft. Fuente: Microsoft. http://www.microsoft.com/bi/aboutbi/default.aspx  ORACLE ORACLE BUSINESS INTELLIGENCE SUITE ENTERPRISE EDITION (OBIEE): Integra tecnología de Siebel con Oracle Fusion Middleware. Incluye: consulta y análisis relacional y OLAP de entornos Oracle y de otros proveedores, herramientas de análisis y consulta ad-hoc, dashboards analíticos, creación de informes y herramientas de publicación, alertas en tiempo real, capacidades analíticas para dispositivos móviles e integración con las herramientas de escritorio de Microsoft.Ing. Bertha Mazón, Mg. Sc. 26
    • Inteligencia de Negocios Figura 7. Arquitectura BI de OBIEE. Fuente: Oracle. http://www.b-eye-network.com/blogs/mcknight/  BUSINESS OBJECT DE SAP La empresa SAP compró en el 2008 a Business Object, convirtiéndose en un fuerte competidor de tecnologías de inteligencia de negocios. Suministra a los usuarios el poder acceder de forma sencilla a los datos, analizar la información almacenada y creación de informes. Figura 8. Arquitectura BI de SAP Business Objects XI 3.1. Fuente: SAP. http://www.businessobjects.comIng. Bertha Mazón, Mg. Sc. 27
    • Inteligencia de Negocios  MICROSTRATEGY MICROSTRATEGY provee soluciones a clientes de cualquier industria y/o área funcional con el fin de ayudarlos en la obtención de un mayor conocimiento sobre la información manejada en su empresa. Figura 9. Arquitectura BI de Microstrategy Fuente: Microstrategy. http://www.microstrategy.com  SAS SAS provee una Plataforma de Inteligencia abierta y extensible que sirve de base para la creación y entrega de inteligencia a la organización; incluye herramientas: ETL para extracción, transformación y carga independiente a la plataforma; Intelligence Storage para distribuir información a aplicaciones de BI y analíticas desde SAS o terceros; SAS Enterprise BI Server brinda acceso a la información en diferentes formatos; SAS Analytic Technologies para manejo y modelación de información analítica, algorítmica y matemática.Ing. Bertha Mazón, Mg. Sc. 28
    • Inteligencia de Negocios Figura 10. Arquitectura BI de SAS Fuente: SAS. http://support.sas.com/documentation/cdl/en/biov/60947/HTML/default/a003069226.htm1.4.2 HERRAMIENTAS OPEN SOURCEEl software libre dispone al día de hoy de casi todas las herramientas necesarias parael trabajo informático. Incluso hay campos en donde su supremacía no se discute y nisiquiera se contempla la posibilidad de usar otro tipo de software.En el informe de investigación “Magic Quadrant for Business IntelligencePlatforms” presentado por la empresa Gartner en enero del 2009, que trata de unestudio de mercado de las plataformas de inteligencia de negocios a nivel mundial, dioseria consideración a la inclusión de proveedores de código abierto de BI; pero aún nogeneran los suficientes ingresos para su visualización en el Magic Quadrant; sinembargo, destacan la presencia en el mercado a Jasper Soft y Pentaho.A continuación se describen los productos open source más relevantes para BI:  PENTAHO De todas las iniciativas, la más completa es la de Pentaho, que abarca una serie de componentes Open Source muy utilizados y fiables: Mondrian OLAP server, JPivot, Firebird RDBMS, Enhrydra ETL, Shark and JaWE, JBoss, Hibernate, JBoss Portal, Weka Data Mining, Eclipse, BIRT, JOSSO, Mozilla Rhino.Ing. Bertha Mazón, Mg. Sc. 29
    • Inteligencia de Negocios Figura 11. Arquitectura BI de Pentaho Fuente: http://www.pentaho.com  JASPERSOFT JasperSoft a través de su plataforma de BI en código abierto JasperIntelligence proporciona productos propios actualizados como: JasperAnalysis, JasperReports, iReports, JasperETL y JasperServer. JasperAnalysis, diseñado para proporcionar a las empresas medianas análisis online en tiempo real de grandes volúmenes de datos. JasperServer, dirigido a la integración de fuentes de datos y otros servicios, aporta funciones como scheduling y control de la seguridad de acceso de los usuarios. JasperReports e iReport incluyen un plug-in para JasperServer. JasperSoftofrece sus productos sin coste y licencias comerciales que incluyen soporte y servicios.Ing. Bertha Mazón, Mg. Sc. 30
    • Inteligencia de Negocios Figura 12. Arquitectura BI de JasperSoft Fuente: http://www.jaspersoft.com  ECLIPSE BIRRT Actuate es una empresa que figura en el cuadrante mágico y es miembro del proyecto Eclipse “Business Intelligence and Reporting Tools (BIRT)”ofrece un conjunto de herramientas open source para desarrollar cuadros de mando y gestor de informes avanzados, entre sus módulos destacan: BIRT Report Designer Prof, BIRT Chart Engine SDK, BIRT Report Engine. Figura 13. Arquitectura BI de Eclipse BIRT Fuente: http://www.eclipse.org/birt/phoenix/Ing. Bertha Mazón, Mg. Sc. 31
    • Inteligencia de Negocios  SPAGOBI SpagoBIofrece un conjunto de nuevas funcionalidades para apoyar actividades de usuarios de toma de decisiones y operacional. Consta de 5 módulos: SpagoBI Server que abarca SpagoBI Studio, un entorno de desarrollo único eintegrado, SpagoBI Meta entorno enfocado en metadatos; SpagoBI SDK para integración con aplicaciones externas y Spago BI Applications para mantener los modelos verticales de análisis. Figura 14. Arquitectura BI de SpagoBI Fuente: http://spagobi.eng.it/ecm/faces/public/guest/home/solutions/spagobi  PALO DE JEDOX La firma alemana Jedox presenta Palo como una plataforma de código abierto para soluciones BI basado en la planificación, análisis y presentación de informes. Las soluciones que provee PALO son: Indicadores de rendimiento clave (KPI), Gestión de liquidez y Previsión, Presupuesto y Planificación y Balanced Scorecards, Cockpits, Dash boards. Las herramientas que integran esta plataforma son: Palo OLAP Server, Palo ETL Server, Palo Supervisión Server, Palo WorkSheet Server y Open-APIIng. Bertha Mazón, Mg. Sc. 32
    • Inteligencia de Negocios Figura 15. Arquitectura BI de Palo Fuente: http://www.jedox.com/en/products/palo_olap_server/Introduction.html  OPENI.ORG Openi es una aplicación de Inteligencia de Negocios, diseñado para el uso basado en la web. Basado en J2EE y sus aplicaciones corren sobre Apache Tomcat, OpenI es una solución para la construcción y publicación de informes de XMLA compatible con fuentes de datos OLAP, como Microsoft Analysis Services o Mondrian. Su objetivo es proporcionar análisis consolidado de los principales componentes de datos de una aplicación inteligente, incluyendo: fuentes de datos OLAP, bases de datos relacionales, modelos de datos estadísticos y modelos de minería de datos. Figura 16. Arquitectura BI de Openi Fuente: http://www.openi.org/Ing. Bertha Mazón, Mg. Sc. 33
    • Inteligencia de Negocios1.4.3. COMPARATIVA DE HERRAMIENTAS BI PROPIETARIAS VERSUSOPENSOURCE1.4.3.1. DETERMINACIÓN DE CATEGORÍAS Y CAPACIDADES DECOMPARACIÓN DE HERRAMIENTAS BIPara el establecimiento del proceso comparativo, se realizó un estudio las diferentesplataformas de inteligencia de negocios (BI) tanto propietarias como open source; porotra parte se buscaron fuentes científicas que caracterizaran a la tecnología BI, tal esel caso de la empresa Gartner que define una plataforma de BI como una plataformade software que debe ofrecer 12 capacidades clasificadas en 3 categorías:“Integración, presentación de la información y Análisis”. A continuación sedescriben las categorías con sus respectivas capacidades.A. INTEGRACIÓN 1. Infraestructura BI. Todas las herramientas en la plataforma deben utilizar las mismas normas de seguridad, los metadatos, la administración, la integración del portal, el modelo de objetos, el motor de consulta y deben poseer consistencia en el interfaz. 2. Gestión de metadatos. Herramientas para buscar, capturar, almacenar, publicar y reutilizar objetos de metadatos tales como dimensiones, jerarquías, medidas, parámetros de rendimiento y plantillas de diseño de informes. En esta capacidad se incluye ETL y construcción de data marts. o ETL. Es el proceso que permite a las organizaciones mover datos desde múltiples fuentes, reformatearlos y limpiarlos, y cargarlos en otra base de datos, data mart, o data warehouse para analizar, o en otro sistema operacional para apoyar un proceso de negocio. o Cubos de información (Data marts). Son subconjuntos de datos con el propósito de ayudar a que un área específica dentro del negocio pueda tomar mejores decisiones. Los datos existentes en este contexto pueden ser agrupados, explorados y propagados de múltiples formas para que diversos grupos de usuarios realicen la explotación de los mismos de la forma más conveniente según sus necesidades. 3. Herramientas de Desarrollo - Una plataforma BI debe proporcionar un conjunto de herramientas de desarrollo de aplicaciones BI que pueden ser integrados en un proceso de negocio y / o incrustados en otra aplicación. Una plataforma de BI también debe permitir a los desarrolladores construir aplicaciones BI sin codificación mediante el uso de asistentes. El entorno de desarrollo debería utilizar servicios Web para controlar el desempeño de las tareas comunes tales como la programación, la entrega, la administración y la gestión. 4. Flujo de trabajo (Workflow) y colaboración - Esta capacidad permite a los usuarios de BI compartir y discutir información a través de carpetas públicas y foros de discusión y realizar seguimiento de eventos o tareas asignadas a usuarios específicos. A menudo, esta capacidad ha sido controlada mediante un portal o herramienta de trabajo.B. PRESENTACIÓN DE LA INFORMACIÓN 5. Presentación de informes (Reporting) - Permitir la posibilidad de crear informes formateados, interactivos y altamente escalables en su distribución y capacidad de programación. Además, los proveedores de plataformas BI debenIng. Bertha Mazón, Mg. Sc. 34
    • Inteligencia de Negocios manejar una amplia gama de estilos de presentación de informes (por ejemplo, financieros, operativos y paneles de rendimiento). 6. Paneles de administración o tableros (Dashboards).Proporcionan una representación gráfica del rendimiento empresarial incluyendo todas las áreas de actividad. Incluyen la capacidad de publicar la información de forma gráfica e intuitiva como tablas, gráficos, indicadores o medidores, semáforos y otros controles. Estas pantallas indican el estado de las métricas de rendimiento, en comparación con una meta o valor objetivo. Cada vez más, los paneles se utilizan para difundir en tiempo real los datos de las aplicaciones operacionales. 7. Consultas específicas (Ad hoc query).Esto implica que el sistema permite al usuario personalizar una consulta en la base de datos en tiempo real, en vez de estar atado a las consultas prediseñadas para informes. En particular, las herramientas deben tener una sólida capa semántica o GUI que permita a los usuarios navegar por las fuentes de datos disponibles. Además, estas herramientas de consulta deberían ofrecer la capacidad de gestión y auditoría para asegurar que las consultas funcionen bien. 8. Integración a distribución. A Microsoft Office. En algunos casos, se utilizan plataformas de BI como un nivel medio para gestionar, asegurar y ejecutar tareas de BI, pero Microsoft Office (especialmente Excel) actúa como cliente de la BI. En estos casos, es indispensable que el proveedor de BI proporcione integración con herramientas de oficina, incluyendo soporte para formatos de documentos, fórmulas, refrescamiento de datos y tablas de pivote.C. ANÁLISIS 9. OLAP(On-Line Analytical Processing).Permite a los usuarios finales un uso más eficaz de los data warehouse para el análisis de datos en línea, lo que proporciona respuestas rápidas a consultas analíticas complejas e iterativas utilizadas generalmente para sistemas de ayuda para la toma de decisiones; ofrece la capacidad de consultar y estudiar las diferentes dimensiones de un conjunto de datos relacionales, multidimensionales o híbridos. 10. Visualización avanzada (Advanced visualization). Proporcionar la capacidad de mostrar numerosos aspectos de los datos de manera más eficiente mediante el uso interactivo de imágenes y gráficos, en lugar de filas y columnas. 11. Modelado predictivo y data mining. Esta capacidad permite a las organizaciones clasificar por categorías a las variables y estimar su continuidad utilizando avanzadas técnicas matemáticas e inteligencia artificial. 12. Tableros de Control (Scorecards).Proporcionan una representación visual de los indicadores claves de rendimiento (KPI): métricas cuidadosamente seleccionadas que permiten a las empresas medir y gestionar el rendimiento alineado sus objetivos estratégicos (planificación). Además, debe permitir crear un número ilimitado de KPI’s basándose en una metodología específica, como Balanced Scorecard, Six Sigma, gestión basada en actividades o un diseño empresarial concreto.Debido a que las 3 categorías y 12 capacidades definidas por Gartner corresponden ala Capa BI y Capa Data Warehouse(según Rodríguez I.) y teniendo en consideraciónIng. Bertha Mazón, Mg. Sc. 35
    • Inteligencia de Negociosque la arquitectura de una solución de inteligencia de negocios abarca también las:Fuente de Datos, entonces se ha visto conveniente incluir la categoría de“Aprovisionamiento” y “Plataformas de soporte”.D. APROVISIONAMIENTO 13. Fuentes de datos. Los datos administrados por los sistemas de aplicación operacionales son la fuente principal de datos para el data warehouse. Estos sistemas son los encargados de recolectar información diaria de las tareas operativas de la organización. Es posible dividir las fuentes de información en las siguientes: (1) Información generada por los sistemas transaccionales, (2) Información externa, (3) Información generada por los departamentos de la empresa que no corresponden a un sistema transaccional oficial, (4) Datos tomados de bases de datos relacionales que forman parte de los sistemas transaccionales. Estas fuentes pueden ser de varios tipos, dependiendo del tamaño de la organización y de los niveles de tecnología y sistemas de información que se utilicen en la empresa.E. PLATAFORMAS DE SOPORTE 14. Sistemas operativos. Que soporta la plataforma BI 15.DBMS Servers para Data Warehouse. Sistemas manejadores de bases de datos que brinde soporte a almacenes de datos. 16.Servidor web y/o aplicaciones web. Que las aplicaciones de BI corran en servidores web o servidores de aplicaciones web.Además de las categorías citadas se incluye el factor costo como un indicativopreponderante a la hora de decidir por una u otra plataforma.F. COSTO 17. Costo de Licencia. Involucra el precio de la Licencia(s) de la plataforma BIIng. Bertha Mazón, Mg. Sc. 36
    • Inteligencia de Negocios 1.4.3.2. CUADRO COMPARATIVO ENTRE HERRAMIENTAS DE BI PROPIETARIAS VERSUS OPEN SOURCE Plataformas de Business Intelligence Propietarias Plataformas de Business Intelligence Open Source Jedox Palo Microstra- JasperSoft Categorías y Capacidades de Microsoft COGNOS Business Pentaho SpagoBI (Oracle) Comparación de soluciones BI Eclipse Object Openi OBIEE BIRT tegy IBM SAP SASA. INTEGRACIÓN Business Pentaho BI Jasper1. Infraestructura BI COGNOS MS BI OBIEE Microstra-tegy SAS Eclipse BIRT SpagoBI Palo BI Suite Openi Object Suite Intelligence Oracle BI: MicroStrategy: Pentaho SAP Business SAS Metadata2. Gestión de metadatos Data Manager Sql Server 2008 Server, Desktop, Data Objects Server Administration Architect Integration Enterprise ETL SAS Workspace Kettle Spoon i. ETL X Sql Server 2008 Rapid Marts X JasperETL SpagoBI Meta Palo ETL Server - Option Server ETL Workbench, ii. Diseño de cubos(Data Cognos Power Warehouse SAS OLAP Server, Pentaho Sql Server 2008 Rapid Marts X - - SpagoBI Server Palo OLAP Server Workbench marts) Cubes Builder OLAP Cube Studio Cube Designer Eclipse 3.2 y JDK, Web con SpagoBI Studio J2EE SDK,3. Herramientas de Desarrollo Cognos SDK .NET 2008 DeveloperSuit X JDK JDK o J2EE JDK o J2EE J2EE con Eclipse IDE, MS .NET J2EE, JDK .NET SDK SpagoBI SDK4. Flujo de trabajo (Workflow) y Office SharePoint SAP X Workflow X X - - - X - - colaboración Server 2007 Workflow SAP B.O.: JFreeChart Office 2007, Report Server, BIRT Report SpagoBI Server,B. PRESENTACIÓN DE LA IBM Cognos Xcelsius, MicroStrategy Web application Pentaho BI JasperReports Palo Worksheet and SharePoint Server Presentation Designer, BIRT SpagoBI INFORMACIÓN BI Web Reporting Suite server Suite y JasperServer Server JasperReport 2007 Services Report Engine Applications Intelligence s5. Presentación de informes SAS Web Report (Reporting) en formatos Excel, Excel 2007, Pentaho X X X X Studio, OLAP iReport X X X X PDF, XML, HTML y CSV y envío Outlook Reporting Viewer for Java por correo electrónico6. Paneles de administración o Pentaho X Excel 2007 X X X SAS Dashboard X X X X X tableros (Dashboards). Dashboards7. Consultas específicas (Ad hoc SQL Server SAS Web Report X X X X X X X X - - query). ReportingServices Studio Palo Worksheet SAS Data 8. Integración y distribución a: Server, Palo Integration Studio Server Service i. Microsoft Office(Excel) X X X X X SAS Add-In for X X X X Palo OLAP - Ing. Bertha Mazón, Mg. Sc. 37
    • Inteligencia de Negocios Microsoft Office Server, Palo Excel Add-in SAP ii. Dispositivos móviles X X X Netweaver X - - - - - - - Mobile IBM MS SharePoint, WebSphere, Oracle IBM Office SharePoint IBM SAP Application WebSphere, SAS Information iii. Portales web Server 2007, .NET X J2EE server WebSphere, - - - J2EE server Enterprise Server Portal, SAP Delivery Portal 2008 BEA WebLogic Portal, WebSphere NetWeaver, Plumtree BEA WebLogic IE, Firefox IE, Firefox, IE, Firefox, Mozilla, IE, Firefox IE, Firefox IE, Firefox iv. Navegadores web: IE IE, Firefox IE, Firefox Mozilla X X X Opera, otros Netscape Safari, Mozilla Mozilla Mozilla Netscape Performance- Palo OLAP Oracle BI MicroStrategyI SpagoBI Server, IBM Cognos Point, SqlServer SAP Business Pentaho BI Server, Palo Mondrian,C. ANÁLISIS PresentationS ntelligence SAS BI JasperAnalysis SpagoBIApplica BI Analysis Objects Suite Worksheet SSAS ervices Server tions Services(SSAS) Server JPivot, JPivot y JPivot, 9. OLAP (On-Line Analytical OLAP Viewer for servidor servidor X Excel X Voyager X X - X Mondrian Processing) Java, Help Viewer Mondrian Mondrian OLAP OLAP OLAP 10. Visualización avanzada SAS Information X X X X X X X - X - X (Advanced visualization) Map Studio Pentaho 11. Modelado predictivo y data PredictiveWo SAS Enterprise X X X X Data Mining - - X X X mining rkbench Miner con WeKa 12. Tableros de Control Performance X X X X X X - X X X - (Scorecards-KPI) ManagerD. APROVISIONAMIENTO 13. Fuentes de datos JDBC, JDBC,Oracle, DB2, Informix, SQL SQL Server, Oracle, IBM IBM DB2, MS Oracle, SQL Oracle, Server,HP DB2, Oracle, Oracle,DB2, DB2, MS SQL Apache Derby Sql Server, SQL Server, RDBM’s RDBM’s Server, SQL Server, Neoview, Teradata, Teradata, ODBC, Server, Data Base, i. Bases de datos ORACLE, IBM, MySQL, accedidos RDBM’s accedidosme Sybase, DB2, Teradata, Netezza, Sybase, MS SQL Server, MySQL, MySql, JDBC, ODBC PostgreSQL, mediante JDBC diante JDBC Teradata, ODBC Teradata, Postgre, Sybase PostgreSQL, otras EnterpriseDB, ODBC ODBC MySQL, Otras EnterpriseD otras B, otras XMLA, Oracle SAP R/3, Siebel, OLAP SAP SAP BW, SAP OLAP Option, Oracle databases NetWeaver ii. Multi-dimensional, ERP’s R/3 y Siebel SAP, Siebel MS Analysis X applications, via XML/A X - - X - BI, SAP BW, CRM Services, SAP PeopleSoft, SAS and MDX otros BW OLAP cubes standards, Ing. Bertha Mazón, Mg. Sc. 38
    • Inteligencia de Negocios ERP’s SAS data sets, SAS Mainframes, Mainframe, XML/A, EJB, XML, Excel, SPD Engine iii. Otras fuentes Web services, Microsoft XML, CRM X X POJO, XML XML X XMLA Text tables, SAS SPD otras Dinamics Hybernate ServerE. PLATAFORMAS DE SOPORTE Windows, Linux, Novell Windows, IBM AIX, HP- Windows, SUSE Linux, Debian, Windows XP, UX, SuSE Linux, IBM AIX HP-UX,UNIX, Windows, Sun Solaris, Windows, Windows, Windows, 14. Sistemas operativos Windows Mandriva, Server 2003, Redhat Linux, Windows (UNIX), Sun Windows, z/OS Linux OpenSolaris, Linux, UNIX Linux, Linux, Novell, Red Vista Oracle Linux, Solaris, HP-UX Mac OS X, HP- Hat, Ubuntu Sun Solaris UX, FreeBSD, IBM AIX JDBC,Oracle, SQL Server, SQL Server, Oracle,DB2, IBM DB2, MS DB2, Oracle, DB2, HP Neoview, Teradata, ODBC, SQL Server, RDBM’S RDBM’S 15. DBMS Servers para Data Teradata, SQL Server, otros Teradata, HP, Sql Server 2008 Oracle DB Netezza, SQL Server, MySQL, accedidos con - accedidos con MySQL, otras Warehouse Sybase, RDBM’s otros Teradata, Sybase, SAS SPD PostgreSQL, JDBC 2.0 JDBC 2.0 Postgre, ODBC Server Enterprise MySQL, Otras DB, otras IIS, iPlanet, IIS, Apache IBM Http WebSphere, JBoss, IIS, Tomcat, Apache Tomcat, JBoss, Apache 16. Servidor web y/o aplicaciones Server, Apache/Tomca WebSphere, Apache Apache IIS Websphere, IIS, Tomcat Tomcat, WebSphere, IIS Tomcat, web Apache t, Oracle App. BEA WebLogic Tomcat, JBoss Tomcat, JBoss iPlanet JBoss WebLogic, Sun JBoss Tomcat, BEA Server, BEA Server GlassFish Weblogic WebLogic SQLServer 2008: OBIEE Plus: Licencia por $3900 x 5 clientes $ 2000 x user Usuario: ó $12000 x CPU (min 5) Consumidor: Office 2007 ó $295.000 x $575 x CPU ó VersiónF. COSTO. No publica $1100. profesional: CPU $350 x user $220 x User min. Comunitaria: $0.00 $0.00 $0.00 $0.00 $0.00 17. Costo de Licencia costos BI $1100 BI Server 5 $0.00 Profesional:$4 VS .NET 2008: EE:$580 x user 000 $1700 ó $86.500 x Share Point: $500 CPU Notación: Si se observa una (X) significa que posee la capacidad pero integrada a una herramienta. (-) No posee la capacidad. Tabla 1. Estudio Comparativo Entre Herramientas de BI Propietarias Versus Open Source Fuente: Elaboración propia Ing. Bertha Mazón, Mg. Sc. 39
    • 1.4.3.3. RESULTADOS DE LA COMPARACIÓNENTREHERRAMIENTAS DE BIPROPIETARIAS VERSUS OPEN SOURCEDel estudio realizado, se evidencia que las herramientas de Inteligencia de Negociospropietarias cumplen en su mayoría las Capacidades definidas, se evidencia una fuertecompetencia entre las herramientas propietarias como: IBM COGNOS, Oracle,Microsoft, Micro Strategy, SAP Business Object, SAS y otras. Las herramientas BIpropietarias por sus altos costos de licencias están dedicadas a grandes empresas; porotra parte, los costos y el tiempo de implementación se ven reducidos por lasfacilidades que brindan. SAP y SAS parecen ser las de menos costo.En cambio, a las herramientas BI open source aún les falta desarrollarse para cumplircon todas las capacidades planteadas en este estudio, lo que corrobora lainvestigación realizada por la empresa Gartner, que aún no ubica a ningunaherramienta BI open source en el cuadrante mágico; a pesar de ello, en su informedestaca el esfuerzo realizado por Pentaho y Jaspersoft. A continuación se mencionanalgunas conclusiones en base al cuadro comparativo y a la revisión de fuentesbibliográficas:  La mayoría de las herramientas BI open source son jóvenes, tienen máximo unos 5 0 6 años de haber incursionado en el mercado, aún están en proceso de desarrollo y fusión. Por ejemplo Pentaho apareció en el 2004.  De entre todas las herramientas BI open source la más importante es Pentaho, debido a que cumple la mayoría de capacidades y sobre todo porque tiene muchos seguidores que han formado comunidades de desarrollo y aprendizaje a nivel mundial. Se observa en el cuadro comparativo de cumplimiento de capacidades que es la plataforma más destacada entre sus homólogas open source. Pentaho tiene un promedio de 3.8/4 de cumplimiento y la menor desviación estándar (0.45); a este análisis incluimos el costo de licencia comunitaria que es gratis lo que la convierte en una opción viable y conveniente para implementar soluciones BI.  La mayoría de las herramientas BI open source se han desarrollado bajo plataforma Java tal es el caso de Pentaho, JasperSoft, Eclipse BIRT, SpagoBI y Openi. Sólo Jedox Palo se evidencia su desarrollo en plataforma .NET de Microsoft.  Pentaho, SpagoBI y Openi utilizan algunas herramientas comunes, tal es el caso de JPivot, el servidor OLAP Mondrian y WorkBench. Así también ciertos componentes Jasper y Eclipse son igualmentecompartidos.  Tanto Pentaho como las otras herramientas BI opensource no son 100% gratuitas; manejan versiones de costo y una versión comunitaria, en la cual se limita sus capacidades y tanto el soporte técnico como el documental es escaso.  Al proporcionarse escaso soporte técnico y documental de las versiones comunitarias, se elevan los costos y el tiempo de aprendizaje, desarrollo e implementación y esto puede ser un factor decisivo al momento de elegir.  Sin embargo las personas que deciden dedicar su tiempo al aprendizaje de estas herramientas BI open source tienen grandes oportunidades debido a que la mayoría de las empresas existentes son PYMES y es posible proporcionarles soluciones parciales y de bajo costo; de bajo costo porque solo involucra el servicio técnico, más no a las licencias del producto.  A pesar de las conclusiones no tanto favorables para las herramientas BI open source se destaca su importancia y su incursión en el mercado debido a que
    • son una alternativa viable y quizá la única para las pequeñas y medianasempresas (PYMES).
    • CAPÍTULO II DATA WAREHOUSE Y DATA MARTSOBJETIVO:  Diseñar data marts y data warehouse aplicando una metodología de estrella, copos de nieve o constelación.
    • 2.1. INTRODUCCIÓNLos continuos cambios en los mercados crearán, y de hecho ya están creando, nuevasoportunidades de negocio, así como una competencia implacable. A medida que estapugna se intensifica, las empresas se enfrentan con la necesidad de reducir los costos,añadir valor a sus productos y servicios y asegurar la diferenciación como señal deidentidad. En un mercado en el que el cliente puede escoger entre distintas empresas,la inteligencia de negocios se convierte en una función estratégica para la retención eincremento del segmento de mercado de la empresa.Todos estos cambios exigen de las empresas una infraestructura receptiva y flexible,en una palabra: ágil. Ágil en su enfoque del mercado, en la manera en que responde asus clientes y en la puesta en marcha de los nuevos servicios o el desarrollo de losnuevos productos. El desafío no es ser el más grande, sino el más ágil en adaptarse alcambio.Hacer accesible la información de ayuda a la toma de decisiones, de manerainstantánea a los responsables de la gestión de la empresa, constituye en definitiva elobjetivo intrínseco del Data Warehouse. Cuando se construye adecuadamente el DataWarehouse, en unión con un conjunto de aplicaciones de ayuda a la toma dedecisiones, proporciona de manera natural un mejor conocimiento de la rentabilidad yla orientación adecuada al esfuerzo de las metas empresariales.El material básico necesario (los datos operacionales) para el desarrollo de un DataWarehouse corporativo es abundante. La información sobre los clientes y losproductos, por ejemplo, son a la vez recursos disponibles en grandes cantidades einfrautilizados. Por ende, los datos operacionales por sí solos no generan informaciónsignificativa y conocimiento, a menos que los objetivos empresariales de la compañíay la tecnología de la información estén alineados.Para que la tecnología se convierta en un elemento que facilite la creación de nuevasestrategias, debe primero integrarse en las funciones de negocio de la empresa. Elfuturo éxito o fracaso de las compañías dependerá en gran medida del conocimientode la propia empresa, el cual a su vez se basará en la construcción exitosa deherramientas como el Data Warehouse.Dada la gran importancia del Data Warehouse para el crecimiento de la empresa, sehace necesario conocer los conceptos relacionados a su filosofía de trabajo, a suproceso y la forma de utilizarlo. En este trabajo expondremos las característicasprincipales, su estructura y su funcionamiento, así como los resultados que puedeesperar el usuario final al interactuar con las aplicaciones que utilizan esaherramienta. Para ello, junto con el desarrollo teórico hemos tomado un caso prácticode aplicación que permitirá ver la implementación de la tecnología de DataWarehouse. Este caso se describe a continuación.2.1.1 Concepto de data warehouseEl almacén de datos es el lugar donde se acumulan todos los datos de la empresa. Elcreador del concepto de almacén de datos, Bill Inmon, lo define de la siguientemanera:"Un almacén de datos es una recopilación de datos temáticos, integrados, no volátilesy con historial para la toma de decisiones".A continuación describiremos las características distintivas de un Data Warehouse, lascuales nos ayudarán a comprender mejor su concepto.
    •  Almacena Información Histórica. El tiempo es parte implícita de la información contenida en un data warehouse. A diferencia de los sistemas transaccionales, que mantienen los datos actualizados a un instante determinado en el tiempo, un DW puede mantener información de más de un instante. La bodega se carga con los distintos valores que toma una variable en el tiempo y de esta manera los datos pueden ser analizados y comparados, facilitando las labores gerenciales. Contiene Información No volátil. La información de un DW existe para ser leída y no modificada, por lo tanto, se carga una sola vez y permanece igual en adelante. De esta manera la actualización del DW es la incorporación de los últimos valores que tomaron las distintas variables, sin ningún tipo de acción sobre lo que ya existía. Esto está en contraste con la información de un sistema transaccional que está sujeta a permanentes inserciones, actualizaciones, reemplazos o borrados. Organiza la Información de forma Temática. El almacén de datos está orientado a los principales temas o entidades de la organización lo cual está en contraste con la mayoría de los sistemas de hoy en día cuya orientación se basa en los procesos o funciones. Administra grandes cantidades de información. La mayoría de los Data Warehouse contienen información histórica que se retira con frecuencia de los sistemas operacionales porque ya no es necesaria para las aplicaciones operativas y de producción. Por el volumen de información que un Data Warehouse debe manejar, también debe ofrecer opciones para la adición y la condensación que clasifiquen esta inmensa cantidad de datos, es decir, un Data Warehouse maneja información a diferentes niveles de detalle. Por lo tanto, el volumen de los datos que debe almacenar es generalmente mayor al de los datos de las bases de datos operacionales. Gestiona múltiples versiones de un esquema de base de datos. Debido a que el Data Warehouse tiene que guardar la información histórica y administrarla, y como esta información histórica ha sido manejada en distintos momentos por diferentes versiones de esquemas de bases de datos, en ocasiones el Data Warehouse tiene que controlar información originada en organizaciones de bases de datos diferentes. Condensa y agrega información. Con frecuencia, es muy alto el nivel de detalle de la información almacenada por bases de datos operacionales para cualquier toma de decisiones sensata. Un Data Warehouse condensa y agrega información para presentarla en forma comprensible a los usuarios finales.2.1.2. Problemas que dan origen a un Data WarehouseLos Data Warehouse surgen por los siguientes problemas: Falta de integración de la información. Muchos de los datos de que disponen las empresas se encuentra en diversos almacenes de datos porque han evolucionado como sistemas independientes, en diferentes lenguajes, desarrollados por diferentes personas y en diferentes momentos. Estos almacenes de datos son incapaces de ofrecer a la empresa una visión consolidada ya que no poseen vinculación entre ellos. Sobrecarga de información. En las últimas décadas, los sistemas operacionales han producido una gran cantidad de datos, los que son difíciles de analizar para tomar decisiones de negocio. A pesar de las grandes sumas invertidas en tecnología de la información, los distintos departamentos dentro de las empresas todavía carecen de herramientas para explorar esos datos de una manera ágil y eficaz. Exceso de información genérica y despersonalizada. Por lo general, los informes producidos por un sistema operacional contienen una gran cantidad de datos. Sin embargo, ofrecen muy poca información que ayude a la toma de decisiones. Estos informes no tienen la capacidad de adaptarse a las necesidades actuales de los usuarios, y carecen de información personalizada y/o relevante para los distintos perfiles que existen en un negocio.
    •  Falta de retroalimentación oportuna para la mejora de los negocios. En las organizaciones, los ejecutivos trabajan haciéndose preguntas e imaginando posibles situaciones futuras. Los resultados obtenidos de esa labor generarán a su vez más preguntas y el planteo de nuevas situaciones repitiendo el ciclo hasta conseguir los fundamentos para tomar una decisión. Con el uso de los sistemas operacionales, este proceso se hace dificultoso, sino imposible, al no tener posibilidad de generar informes adaptados a las necesidades del momento.2.1.3. Beneficios Asociados al Data WarehouseUn Data Warehouse puede dar lugar a una serie de importantes beneficios para laorganización. En cualquier caso, su utilización permitirá que la información de gestiónsea: Accesible, correcta, uniforme y actualizada. Estas características asociadas a la información contenida en un Data Warehouse, junto con otra serie de aspectos inherentes al mismo dan lugar a la obtención de un conjunto de ventajas, que podemos resumir del siguiente modo: Menor costo en la toma de decisiones. Se suprime el desperdicio de tiempo que se podía producir al intentar ejecutar consultas de datos largas y complejas con bases de datos que estaban diseñadas específicamente para transacciones más cortas y sencillas. Posibilidad de encontrar relaciones ocultas. Facilita la aplicación de técnicas estadísticas de análisis y modelización para encontrar relaciones ocultas entre los datos, obteniendo un valor añadido para el negocio. Aprendizaje del pasado. Proporciona la capacidad de aprender de los datos del pasado y de predecir situaciones futuras en diversos escenarios. Mayor flexibilidad ante el entorno. El Data Warehouse convierte los datos operacionales en información relacionada y estructurada, que genera el conocimiento necesario para la toma de decisiones. Esto permite establecer una base única del modelo de información de la organización, que puede dar lugar a una visión global de la información en base a los conceptos de negocio que tratan los usuarios. Además, aporta una mejor calidad y flexibilidad en el análisis del mercado, y del entorno en general. Esta visión global puede conllevar también la obtención de otras ventajas competitivas, al permitir el desempeño de tareas que en los sistemas tradicionales sufrirían un costo adicional, por ejemplo:  Mejor servicio al cliente. Lo dicho en el punto anterior implica una importante mejora en la calidad de gestión, lo que también repercute en la relación con el cliente. De hecho, el que un Data Warehouse implique una mayor flexibilidad ante el entorno tiene una consecuencia directa en una mayor capacidad para responder a las necesidades de los clientes.  Rediseño de procesos. Ofrecer a los usuarios una capacidad de análisis de la información de su negocio que tiende a ser ilimitada y permite con frecuencia obtener una visión más profunda y clara de los procesos de negocio propiamente dichos, lo que a su vez permite obtener ideas renovadoras para el rediseño de los mismos.2.2. Data warehouse versus Sistemas Transaccionales (OLTP)Hoy en día las empresas cuentan en su mayoría con sus procesos automatizados,manejando gran cantidad de datos en forma centralizada y manteniendo sus sistemasen línea. En esta información descansa el conocimiento de la empresa, constituyendoun recurso corporativo primario y parte importante de su patrimonio.El nivel competitivo alcanzado en las empresas les ha exigido desarrollar nuevasestrategias de gestión. En el pasado, las organizaciones fueron típicamenteestructuradas en forma piramidal con información generada en su base fluyendo hacialo alto; y era en el estrato de la pirámide más alto donde se tomaban decisiones apartir de la información proporcionada por la base, con un bajo aprovechamiento del
    • potencial de esta información. Las empresas han reestructurado y eliminado estratosde estas pirámides y han autorizado a los usuarios de todos los niveles a tomarmayores decisiones y responsabilidades. Sin embargo, sin información sólida paraayudar y apoyar las decisiones, la automatización no tiene sentido.Esta necesidad de obtener información para una amplia variedad de individuos es laprincipal razón de negocios que conduce al concepto de. El énfasis no está sólo enllevar la información hacia lo alto sino a través de la organización, para que todos losempleados que la necesiten la tengan a su disposición (Sperley, 1999).El DW (de ahora en adelante los términos Data warehouse, Datawarehousing,Warehouse, Almacén de Datos y DW son utilizados en forma indistinta) convierteentonces los datos operacionales de una organización en una herramienta competitiva,por hacerlos disponibles a los empleados que lo necesiten para el análisis y toma dedecisiones.El objetivo del DW es el de satisfacer los requerimientos de información interna de laempresa para una mejor gestión. El contenido de los datos, la organización yestructura son dirigidos a satisfacer las necesidades de información de los analistas yusuarios tomadores de decisiones. El DW es el lugar donde la gente puede acceder asus datos.El DW puede verse como una bodega donde están almacenados todos los datosnecesarios para realizar las funciones de gestión de la empresa, de manera quepuedan utilizarse fácilmente según se necesiten. Los sistemas transaccionales sondinámicos, constantemente se encuentran actualizando datos. Analizar estainformación puede presentar resultados distintos en cuestión de minutos, por lo quese deben extraer y almacenar fotografías de datos (snapshots, en inglés), para estosefectos, con la implicancia de un consumo adicional de recursos de cómputo. Llevar acabo un análisis complejo sobre un sistema transaccional, puede resultar en ladegradación del sistema, con el consiguiente impacto en la operación del negocio. Losalmacenes de datos (o Data warehouse) generan bases de datos tangibles con unaperspectiva histórica, utilizando datos de múltiples fuentes que se fusionan en formacongruente. Estos datos se mantienen actualizados, pero no cambian al ritmo de lossistemas transaccionales. Muchos data warehouse se diseñan para contener un nivelde detalle hasta el nivel de transacción, con la intención de hacer disponible todo tipode datos y características, para reportar y analizar. Así un data warehouse resulta serun recipiente de datos transaccionales para proporcionar consultas operativas, y lainformación para poder llevar a cabo análisis multidimensional. De esta forma, dentrode un data warehouse existen dos tecnologías que se pueden ver comocomplementarias, una relacional para consultas y una multidimensional para análisis(Sperley, 1999).Puede considerarse que el modelo relacional en el cual se basa OLTP - ProcesamientoTransaccional en Línea (OnLine Transational Procesing, en inglés), tiene como objetivomantener la integridad de la información (relaciones entre los datos) necesaria paraoperar un negocio de la manera más eficiente. Sin embargo, este modelo nocorresponde a la forma como el usuario percibe la operación de un negocio.DW está basado en un procesamiento distinto al utilizado por los sistemasoperacionales, es decir, este se basa en OLAP -Procesos de Análisis en Línea- (OnLineAnalysis Process, en inglés), usado en el análisis de negocios y otras aplicaciones querequieren una visión flexible del negocio.Para ampliar los conceptos anteriores, en la Tabla 2 se exponen las principalesdiferencias entre los sistemas Transaccionales (OLTP) y los basados en Datawarehouse. Transaccionales Basados en Data warehouseAdmiten el acceso simultáneo de muchos usuarios Admiten el acceso simultáneo de muchos usuarios
    • Transaccionales Basados en Data warehouse-miles- que agregan y modifican datos. -cientos- que consultan y no modifican datos.Representan el estado, en cambio constante, de Guardan el historial de una organización.una organización, pero no guardan su historial.Contienen grandes cantidades de datos, incluidos Contienen grandes cantidades de datos,los datos extensivos utilizados para comprobar sumarizados, consolidados y transformados.transacciones También de detalle pero solo los necesarios para el análisis.Tienen estructuras de base de datos complejas. Tienen estructuras de Base de datos simples.Se ajustan para dar respuesta a la actividad Se ajustan para dar respuesta a la actividad detransaccional. consultas.Proporcionan la infraestructura tecnológica Proporcionan la infraestructura tecnológicanecesaria para admitir las operaciones diarias de la necesaria para admitir análisis de los datos de laempresa. empresa.Los analistas carecen de la experiencia técnica Pueden combinar datos de orígenes heterogéneosnecesaria para crear consultas "ad hoc" contra la en una única estructura homogénea y simple,compleja estructura de datos. facilitando la creación de informes y consultas.Las consultas analíticas que resumen grandes Organizan los datos en estructuras simplificadasvolúmenes de datos afectan negativamente a la buscando la eficiencia de las consultas analíticascapacidad del sistema para responder a las más que del proceso de transacciones.transacciones en línea.El rendimiento del sistema cuando está Contienen datos transformados que son válidos,respondiendo a consultas analíticas complejas coherentes, consolidados y con el formatopuede ser lento o impredecible, lo que causa un adecuado para realizar el análisis sin interferir en laservicio poco eficiente a los usuarios del proceso operatoria transaccional diaria.analítico en línea.Los datos que se modifican con frecuencia Proporcionan datos estables que representan elinterfieren en la coherencia de la información historial de la empresa. Se actualizananalítica. periódicamente con datos adicionales, no con transacciones frecuentes.La seguridad se complica cuando se combina el Simplifican los requisitos de seguridad.análisis en línea con el proceso de transaccionesen línea. Tabla 2. Diferencias entre sistemas transaccionales y basados en data warehouse. Fuente: Nader, Javier, 2006A continuación se realiza una breve explicación de una especialización de los datawarehouses, denominada datamart.2.3. Introducción a Datamarts (Tienda de datos)El acceso a los datos de toda la empresa a veces no es conveniente (o necesario) paradeterminados usuarios que solo necesitan un subconjunto de estos datos, en estoscasos se utilizan los Datamarts. El concepto Datamart es una especialización del datawarehouse, y está enfocado a un departamento o área específica, como por ejemplolos departamentos de Finanzas o Marketing. Permitiendo así un mejor control de lainformación que se está abarcando (Poe et al., 1998).Los principales beneficios de utilizar Data marts son:  Acelerar las consultas reduciendo el volumen de datos a recorrer  Estructurar los datos para su adecuado acceso por una herramienta  Dividir los datos para imponer estrategias de control de acceso  Segmentar los datos en diferentes plataformas hardware  Permite el acceso a los datos por medio de un gran número de herramientas del mercado, logrando independencia de estas.2.4. Arquitectura Data warehouse (DW)
    • Antes de describir la arquitectura data warehouse se señala la siguiente consideraciónya generalizada, presente en la literatura: el término Data warehouse se utilizaindistintamente para hablar de la arquitectura en sí como también para uno de loscomponentes que la conforman, específicamente el que tiene relación con elalmacenamiento físico de los datos (Poe et al., 1998). Ahora, con el propósito defacilitar el entendimiento por parte del lector, se hace especial énfasis en esta partedel capítulo sobre el contexto del cual se estará hablando al hacer referencia altérmino data warehouse.La estructura básica de la arquitectura DW incluye: 1. Datos operacionales: un origen o fuente de datos para poblar el componente de almacenamiento físico DW. El origen de los datos son los sistemas transaccionales internos de la organización como también datos externos a ésta. 2. Extracción de Datos: selección sistemática de datos operacionales usados para poblar el componente de almacenamiento físico DW. 3. Transformación de datos: procesos para sumarizar y realizar otros cambios en los datos operacionales para reunir los objetivos de orientación a temas e integración principalmente. 4. Carga de Datos: inserción sistemática de datos en el componente de almacenamiento físico data warehouse 5. Data warehouse: componente de almacenamiento físico. 6. Herramientas de acceso a los datos en el componente de almacenamiento físico data warehouse. Estas herramientas pueden ser de visualización multidimensional específicas para el acceso a un data mart que está contenido en un data warehouse como también aplicaciones desarrolladas dentro de la organización del tipo EIS/DSS. Correspondencia Aplicaciones EIS/DSS Carga o Extracción Transporte Bases de datos Transformación Almacén de operacionales datos Almacenamiento Acceso a Datos intermedio FuentesExternas Figura 17. Estructura básica Data warehouse Fuente: Hernández J., 2003Los pasos 2, 3 y 4 considerados en la figura anterior, conforman el proceso conocidocomo ETL (Extracción, Transformación y Carga).2.5. Metodologías de diseño y construcción de data warehouse
    • En los últimos años se han propuesto distintas metodologías para el diseño deAlmacenes de Datos (AD) o Data Warehouse (DW), aunque ninguna de ellas ha sidoaceptada plenamente.En algunos casos, las metodologías son extensiones de las metodologías clásicas parabases de datos, en otros casos se ha adoptado un enfoque completamente nuevo.Intentando analizar el trabajo hecho hasta el momento en el área del diseño, laspropuestas metodológicas pueden clasificarse en tres grupos: metodologías dirigidaspor datos, metodologías dirigidas por procesos y metodologías compuestas (datos-procesos). El objetivo de las metodologías dirigidas por datos es obtener el esquemaconceptual del DW a partir de la descripción de las bases de datos operacionales de laorganización, por el contrario, las metodologías dirigidas por procesos derivan elesquema conceptual del DW a partir de los requisitos de usuario. Finalmente, lasmetodologías compuestas realizan una combinación de las dos aproximacionesanteriores, es decir, consideran los requisitos de usuario así como la descripción de labase de datos operacional. A continuación se citan algunas:  Metodología de Kimball. Kimball fue quien determinó que un data warehouse no era más que: "la unión de todos los Data marts de una entidad". Defiende por tanto una metodología ascendente (bottom-up) a la hora de diseñar un almacén de datos. Figura 18. Arquitectura bottom-up de un DW Fuente: BERNABEU, Ricardo  Metodología de Inmon. Inmon defiende una metodología descendente (top- down) a la hora de diseñar un almacén de datos, ya que de esta forma se considerarán mejor todos los datos corporativos. En esta metodología los Data marts se crearán después de haber terminado el data warehouse completo de la organización. Figura 19. Arquitectura top-down de un DW Fuente: BERNABEU, Ricardo  Model Driven Architecture 2.0 (MDA 2.0).Desarrollado por “The Object Management Group” (OMG). Consiste en un conjunto de estándares que
    • asisten en la creación, implementación, evolución y desarrollo de sistemas dirigido por modelos. Los estándares que constituyen MDA son: Lenguaje Unificado de Modelado (UML), Meta-Object-Facility (MOF), Meta-Data Interchange (XMI) y Common Warehouse Metamodel (CWM).  Multidimensional FactModel (DFM) propuesta por Golfarelly, M. y Dario. Permite hacer una representación de los hechos y dimensiones con una notación gráfica propia, además proponen una metodología semiautomática para obtener un esquema multidimensional a partir de un diagrama Entidad Relación (ER). Un esquema en DFM se define como una colección de esquemas de hechos, cuyos elementos básicos son los hechos, los atributos, las dimensiones y las jerarquías.  Modelo Multidimensional (MD).Cabibbo y Torlone proponen el método de diseñoMD, que definen como un modelo lógico para sistemas OLAP, sin embargo los autores mencionan que es independiente de cualquier implementación, por lo que lo ubican en el nivel conceptual. El método de diseño que proponen construye un es quema MD a partir de una base de datos operacional existente, el esquema MD consiste de un conjunto finito de Dimensiones y un conjunto finito de F-Tables (Hechos), donde las dimensiones son categorías sintácticas que permiten especificar múltiples caminos para la búsqueda de información y cada dimensión se organiza en una jerarquía de niveles correspondientes.  Metodología HEFESTO. Propuesta por Bernabéu D. Es una metodología fundamentada en metodologías existentes y experiencias propias del autor respecto al proceso de confección de almacenes de datos. La construcción e implementación de un DW puede adaptarse muy bien a cualquier ciclo de vida de desarrollo de software, con la salvedad de que para algunas fases en particular, las acciones que se han de realizar serán muy diferentes. Lo que se debe tener muy en cuenta, es no entrar en la utilización de metodologías que requieran fases extensas de reunión de requerimientos y análisis, fases de desarrollo monolítico que conlleve demasiado tiempo y fases de despliegue muy largas. Lo que se busca, es entregar una primera implementación que satisfaga una parte de las necesidades, para demostrar las ventajas del DW y motivar a los usuarios.2.6. El Proceso ETLfalta2.7. El Procesamiento Analítico en Línea (OLAP)La tecnología de Procesamiento Analítico en Línea –OLAP- (OnlineAnalyticalProcessing) permite un uso más eficaz de data warehouse para el análisis dedatos en línea, lo que proporciona respuestas rápidas a consultas analíticas complejase iterativas utilizada generalmente para sistemas de ayuda para la toma dedecisiones. Primero y más importante, el OLAP presenta los datos a los usuarios através de un modelo de datos intuitivo y natural. Con este estilo de navegación, losusuarios finales pueden ver y entender más efectivamente la información de sus basesde datos, permitiendo así a las organizaciones reconocer mejor el valor de sus datos.En segundo lugar, el OLAP acelera la entrega de información a los usuarios finales queven estas estructuras de datos como cubos denominadas multidimensionales debido aque la información es vista en varias dimensiones.Esta entrega es optimizada ya que se prepararan algunos valores calculados en losdatos por adelantado, en vez de de realizar el cálculo al momento de la solicitud. Lacombinación de navegación fácil y rápida le permite a los usuarios ver y analizarinformación más rápida y eficientemente que lo que es posible con tecnologías debases de datos relacionales solamente. El resultado final: se pasa más tiempoanalizando los datos y menos tiempo analizando las bases de datos.
    • A pesar del proceso de almacenamiento de datos de preparar información para elconsumo del usuario final se debe facilitar la búsqueda de la información.Generalmente, las estructuras de datos de las bases tienen cierta complejidad para elusuario final, principalmente para responder a preguntas tales como:"¿Quiénes fueron los mejores vendedores de cada región durante el año pasado,mensualmente?" son complejas cuando se expresan en lenguaje SQL.Estos retos son enfrentados con herramientas avanzadas de peticiones (queries), lascuáles ocultan al usuario final la complejidad de las base de datos. Esta es la funciónde las herramientas OLAP.Todas las organizaciones tienen datos multidimensionales y la complejidad no esnecesariamente una función del tamaño de la compañía. Aún a las más pequeñascompañías les gustaría poder rastrear sus ventas por producto, vendedor, geografía,cliente y tiempo. Las organizaciones han buscado durante mucho tiempo herramientaspara acceder, navegar y analizar información multidimensional de una manera fácil ynatural.Las aplicaciones OLAP deberían proporcionar análisis rápidos de informaciónmultidimensional compartida. Las características principales del OLAP son(Pence&Creeth, 2002):  Rápido: proporciona la información al usuario a una velocidad constante. La mayoría de las peticiones se deben de responder al usuario en cinco segundos o menos.  Análisis: realiza análisis estadísticos y numéricos básicos de los datos, predefinidos por el desarrollador de la aplicación o definido “ad hoc” por el usuario.  Compartida: implementa los requerimientos de seguridad necesarios para compartir datos potencialmente confidenciales a través de una gran población de usuarios.  Multidimensional: llena la característica esencial del OLAP, que es ver la información en determinadas vistas o dimensiones.  Información: acceden a todos los datos y a la información necesaria y relevante para la aplicación, donde sea que ésta resida y no esté limitada por el volumen.El OLAP es un componente clave en el proceso de almacenamiento de datos (datawarehousing) y los servicios OLAP proporcionan la funcionalidad esencial para unagran variedad de aplicaciones que van desde reportes corporativos hasta soporteavanzado de decisiones.Vistas del Usuario.En un modelo de datos OLAP, la información es vista como cubos, los cuáles consistende categorías descriptivas (dimensiones) y valores cuantitativos (medidas). El modelode datos multidimensional simplifica a los usuarios el formular peticiones complejas,arreglar datos en un reporte, cambiar de datos de resumen a datos de detalle y filtraro seccionar los datos en subconjuntos significativos.Por ejemplo, las dimensiones típicas de un cubo que contenga información de ventas,incluiría tiempo, geografía, producto, canal, organización y escenario (planeado oreal). Las medidas típicas incluirían ventas en euros (u otra moneda), unidadesvendidas, número de personas, ingresos y gastos.
    • Ventas en LUGAR: Murcia Alicante Jerarquía de dimensiones: miles de Euros ciudad Zaragoza Madrid Barcelona Valencia PRODUCTO LUGAR TIEMPO Zumo Piña 1l. 17 Categoría País AñoPRODUCTO: Cola 33cl. 57   / JabónSalitre 93 artículo Tauritón 33cl 22 Gama Prov. Ciudad Trimestre Cerveza Kiel 20 cl 5 / /  LecheEnteraCabra 1l 12 Artículo Supermercado Mes Semana 1 2 3 4 1 2 2004 2005 TIEMPO: trimestre HECHO: “El primer trimestre de 2004 la empresa vendió en Valencia por un importe de 22.000 euros del producto tauritón 33 cl.” Figura 20. Ejemplo de Cubo con tres dimensiones. Fuente: Hernández J., 2003 Dentro de cada dimensión de un modelo de datos OLAP, los datos se pueden organizar en una jerarquía que represente niveles de detalle de los datos. La funcionalidad de los sistemas OLAP se caracteriza por ser un análisis multidimensional de datos corporativos, que soportan los análisis del usuario y unas posibilidades de navegación, seleccionando la información a obtener. Normalmente este tipo de selecciones se ve reflejada en la visualización de la estructura multidimensional, en unos campos de selección que permitan elegir el nivel de agregación (jerarquía) de la dimensión, y/o la elección de un dato en concreto, la visualización de los atributos del sujeto, frente a una(s) dimensiones en modo tabla, pudiendo con ello realizar, entre otras las siguientes acciones (Pence&Creeth, 2002):  Rotar (Swap): alterar las filas por columnas (permutar dos dimensiones de análisis)  Bajar (Down): bajar el nivel de visualización en las filas a una jerarquía inferior  Detallar (Drilldown): informar para una fila en concreto de datos a un nivel inferior  Expandir (Expand): ídem anterior sin perder la información a nivel superior para éste y el resto de los valores Arquitectura OLAP Aunque en ocasiones se utilizan indistintamente, los términos data warehouse y proceso analítico en línea (OLAP) se aplican a diferentes componentes de sistemas de ayuda a la toma de decisiones o sistemas de inteligencia empresarial. Los datos contenidos en undata warehouse se encuentran organizados para permitir el análisis por medio de herramientas OLAP. La tecnología OLAP permite un uso más eficaz de los almacenes de datos para el análisis en línea, lo que proporciona respuestas rápidas a consultas analíticas complejas e iterativas. Los modelos de datos multidimensionales de OLAP y las técnicas de agregados de datos organizan y resumen grandes cantidades de datos para que puedan ser evaluados con rapidez mediante el análisis en línea y las herramientas gráficas. La respuesta a una consulta realizada sobre datos históricos a
    • menudo suele conducir a consultas posteriores en las que el analista busca respuestasmás concretas o explora posibilidades.Los sistemas OLAP proporcionan la velocidad y la flexibilidad necesarias para darapoyo al analista en tiempo real. La figura 21 muestra la integración del datawarehouse y los procesos OLAP, que generalmente se implementan por medio de unaaplicación servidora que accede al data warehouse y realiza los procesos de análisis. Através de este servicio OLAP, los usuarios acceden a la información residente en lasbases de datos (Microsoft Corp, 2002). Figura 21. Arquitectura básica para OLAP. Fuente: http://cgmlab.cs.dal.ca/Members/obaltzer/SOLAP/A continuación se explica el modelo de datos donde se sustenta esta tecnología.El modelo de datos OLAP.Un reto fundamental en la implementación del OLAP es mapear el esquema inicial dela base de datos a un modelo multidimensional.En la mayoría de las implementaciones de OLAP, se asume que los datos han sidopreparados para el análisis a través del almacenamiento de datos (data warehousing)y que la información se ha extraído de sistemas operacionales, limpiado, validado yresumido antes de incorporarse en una aplicación OLAP. Este es un paso vital en elproceso, que asegura que los datos que son vistos por el usuario OLAP son correctos,consistentes y que llenan las definiciones organizacionales para los datos.Cada vez más, la información en un data warehouse se organiza en esquemas deestrella o de copo de nieve. El esquema estrella, considerado como jerarquía dedimensiones lineal (figura 22) se basa en una tabla de hechos central (las medidas)que se enlaza a las tablas de dimensiones relacionadas (las categorías descriptivas delas medidas), mientras que el esquema copo de nieve, considerado como estrellajerárquica o modelo no lineal (figura 23), es una tabla de hechos central se enlaza a
    • las tablas de dimensiones relacionadas, pero estas a su vez se enlaza a otras tablasdimensionales.Con este tipo de esquemas simplifica el entendimiento de los datos por parte delusuario, maximiza el desempeño de las peticiones (queries) de la base de datos paraaplicaciones de soporte de decisiones y requiere menor espacio de almacenamientopara bases de datos grandes. Tabla Dimensión Tabla Tabla Tabla Dimensión Hechos Dimensión Tabla Dimensión Ejemplo: Figura 22. Modelo estrella. Fuente: Hernández J., 2003. Tabla Tabla Dimensión Dimensión Tabla Tabla Tabla Dimensión Hechos Dimensión
    • Ejemplo: Figura 23. Modelo copo de nieve. Fuente: Hernández J., 2003Una tabla de hechos contiene generalmente los valores o medidas que se quiereanalizar, mientras las tablas de dimensiones contienen las vistas en que se quiereanalizar esas medidas.Luego de analizar los dos tipos de esquemas, cabe una pregunta ¿Se puede recopilartoda la información necesaria en un único esquema estrella o copo de nieve? Larespuesta es NO. Realmente se requiere de varios esquemas y cada uno de ellos sedenomina data mart como se ejemplifica en la figura 24. Figura 24. Ejemplo de un almacén formado por 4 data marts. Fuente: Hernández J., 2003La figura 9 muestra un ejemplo de esquema de estrella. En este tipo de base de datos,una tabla de hechos central se enlaza a las tablas de dimensiones relacionadas.
    • Figura 25. Un esquema de estrella. Fuente: Nader, J.,2003La figura 10 muestra un ejemplo de esquema copo de nieve. Este tipo de esquema secaracteriza por tener tablas dimensionales relacionadas con otras tablas dimensionalesademás de vincularse a la tabla de hechos. A continuación se enumeran algunas de lasprincipales ventajas del esquema estrella:  Crea una base de datos con tiempos de respuesta rápido.  Diseño fácil de modificar.  Simula como ven los datos los usuarios finales.  Simplifica la navegación.  Facilita la interacción con herramientas.
    • Figura 26. Un esquema copo de nieve. Fuente: Nader, J., 2003Los esquemas de estrella y copo de nieve son aproximaciones relacionales del modelode datos OLAP y son un punto de partida excelente para construir definiciones de cuboOLAP. Pocos productos OLAP han tomado ventaja de este hecho. Generalmente nohan provisto herramientas sencillas para mapear un esquema de estrella a un modeloOLAP y como resultado mantienen el costo de construir el modelo OLAPextremadamente alto y el tiempo de desarrollo innecesariamente largo.Debido a la explosión de datos, las aplicaciones OLAP pueden sufrir aún más cuandolos datos de detalle o fuente están distribuidos dispersamente en todo lo amplio delcubo multidimensional. Los valores faltantes o inválidos crean dispersión en el modelode datos OLAP. En el peor caso, un producto OLAP podría almacenar un valor vacío.Por ejemplo, una compañía podría no vender todos los productos en todas lasregiones, así que no aparecerían valores en la intersección donde los productos no sevenden en una región particular.La dispersión de datos, un reto para las compañías de OLAP, se ha vencido con variosgrados de éxito. Las peores implementaciones resultan en bases de datos quealmacenan valores vacíos, por tanto teniendo baja densidad y desperdiciando espacioy recursos. Los servicios OLAP no almacenan valores vacíos y como resultado, aún loscubos dispersamente poblados no se inflarán de tamaño. Mientras que este asunto esfrecuentemente subrayado como un factor decisivo de arquitecturas OLAP, poralgunos vendedores de OLAP, las diferencias entre las implementaciones de lascompañías en el manejo de la dispersión son mínimas comparadas a las másimportantes explosiones de datos causadas por precalcular demasiados agregados.
    • Implementación del OLAPLos cubos, las dimensiones y las jerarquías son la esencia de la navegaciónmultidimensional del OLAP. Al describir y representar la información en esta forma, losusuarios pueden navegar intuitivamente en un conjunto complejo de datos. Sinembargo, el solo describir el modelo de datos en una forma más intuitiva, hace muypoco para ayudar a entregar la información al usuario más rápidamente.El Almacén de Datos y las herramientas OLAP se pueden basar físicamente en variasorganizaciones: Sistemas ROLAP  se implementan sobre tecnología relacional, pero disponen de algunas facilidades para mejorar el rendimiento (índices de mapas de bits, índices de JOIN). Sistemas MOLAP  disponen de estructuras de almacenamiento específicas (arrays) y técnicas de compactación de datos que favorecen el rendimiento del almacén. Sistemas HOLAP  sistemas híbridos entre ambos.
    • CAPÍTULO III DISEÑO Y CONSTRUCCIÓN DE UNA SOLUCIÓN DE INTELIGENCIA DE NEGOCIOSOBJETIVO:Diseñar y construir una solución de inteligencia de negocios que incluya:almacén de datos (data warehouse), cubos OLAP, proceso ETL y un sistemade toma de decisiones (SSD) que provea la información adecuada según losrequerimientos de los mandos táctico y estratégico de una organización.
    • 3.1. INTRODUCCIÓNEl diseño de data warehouse es posible hacerlo aplicando el procedimiento de algunametodología.3.2. METODOLOGÍA UTILIZADA PARA DISEÑAR DATA WAREHOUSEExisten algunas metodologías para el diseño de Data Warehouse, sin embargo se haelegido la metodología HEFESTO, debido a que define claramente el ¿Qué? Y el¿Cómo? de cada una de sus fases y actividades.3.3. METODOLOGÍA HEFESTOLa Metodología HEFESTO, es una metodología para la construcción del almacén dedatos que servirá de soporte para la aplicación de inteligencia de negocios.A continuación se presenta la arquitectura de la metodología y se la describe brevemente: 0) ESTUDIO PRELIMINAR Figura 27.Arquitectura de la Metodología HEFESTO Fuente: BERNABEU, RicardoComo se puede apreciar, se comienza recolectando las necesidades de información de losusuarios y se obtienen las preguntas claves del negocio. Luego, se deben identificarlos indicadoresresultantes de los interrogativos y sus respectivas perspectivas de análisis, mediante las cuales seconstruirá el modelo conceptual de datos del DW.
    • Después, se analizarán los OLTP para determinar cómo se construirán los indicadores, señalar lascorrespondencias con los datos fuentes y para seleccionar los campos de estudio de cadaperspectiva.Una vez hecho esto, se pasará a la construcción del modelo lógico del depósito, en donde sedefinirá cuál será el tipo de esquema que se implementará. Seguidamente, se confeccionarán lastablas de dimensiones y las tablas de hechos, para luego efectuar sus respectivas uniones.Por último, se definirán los procesos de extracción, transformación y carga de los datos fuente,que poblarán y actualizarán el DW.3.4. PASOS Y APLICACIÓN METODOLÓGICA HEFESTOPASO 0.ESTUDIO PRELIMINAR 1. DATOS INFORMATIVOS DE LA EMPRESA Nombre: Dirección: Ciudad: Teléfono: 2. IDENTIFICACIÓN DE LA EMPRESA 2.1. DESCRIPCIÓN DE LA EMPRESA Describir brevemente el objeto de negocio de la empresa 2.2. ANTECEDENTES HISTÓRICOS Describir los hechos históricos destacables de la empresa 3. MISIÓN, VISIÓN Y OBJETIVOS 3.1. VISIÓN La visión se conoce como el camino al cual se dirige la empresa a largo plazo y sirve de rumbo y aliciente para orientar decisiones estratégicas de crecimiento junto a las de competitividad. 3.2. MISIÓN La misión es el motivo, propósito, fin o razón de ser de la existencia de una empresa u organización. 3.3. OBJETIVOS Listar los objetivos de la empresa o institución 4. ORGANIGRAMA Gráfico que representa la estructura organizativa de la empresa. 5. RELACIÓN DE LAS METAS DE LA ORGANIZACIÓN CON LAS DEL DATA WAREHOUSE Se debe definir las metas que proporcionarán el data warehouse al negocio o la empresa. Por ejemplo: El Data Warehouse aportará un gran valor a la empresa, y su alcance es el siguiente: - Permitirá a las autoridades y personal administrativo contar con una herramienta que brindará soporte en la toma de decisiones.
    • - Transformará datos operativos en información analítica, enfocada en las estrategias de la empresa. - Se podrán generar reportes dinámicos y personalizados con información estadística, resumida (es decir sumarizados, promediados o contabilizados) y mediante gráficos representativos. - Se podrá visualizar en los reportes información historial de la empresa y serán posibles presentarlos en diferentes formatos como PDF, HTML, EXCEL - Será posible explorar y navegar de forma rápida en la información de los reportes - El costo y el empleo de recursos materiales para la elaboración de reportes o informes necesarios para la toma de decisiones serán mínimos.PASO1.ANÁLISIS DE REQUERIMIENTOSLo primero que se hará será identificar los requerimientos del usuario a través depreguntas que expliciten los objetivos de la organización. Luego, se analizarán lasestas preguntas a fin de identificar cuáles serán los indicadores y perspectivas queserán tomadas en cuenta para la construcción del DW. Finalmente se confeccionará unmodelo conceptual en donde se podrá visualizar el resultado obtenido en este primerpaso.a)Identificar preguntasEl objetivo principal de esta fase, es la de obtener e identificar las necesidades deinformación clave de alto nivel, que es esencial para llevar a cabo las metas yestrategias de la empresa y que facilitará una eficaz y eficiente toma de decisiones.Ejemplo Aplicativo. Para este ejemplo se considera una universidad como empresa oinstitución de estudio.
    • DESCRIPCIÓN DE PROCESOS PARA LA TOMA DE DECISIONES ACADÉMICAS EN LA UNIVERSIDAD XYZ La Universidad XYZ está estructurada en escuelas: Informática, Gestión, Derecho, Educación y Salud. Cada escuela tiene un director y agrupa una o varias carreras. Las modalidades de estudio son: presencial, semi-presencial y a distancia. Cada año académico comienza en enero y culmina en diciembre y se divide en dos periodos lectivos: Enero-Junio y Julio-Diciembre. En cada periodo lectivo los estudiantes deben matricularse en el semestre o nivel que le corresponde. Cada director de escuela es el responsable de llevar las estadísticas de cada carrera pero de modalidad presencial: matriculados por semestre, egresados y graduados, retirados, mejores estudiantes y otros reportes. Las modalidades de estudio semipresencial y a distancia tienen un director y dos coordinadores que se encargan del control y planificación del desarrollo de cada módulo (asignatura) de cada carrera. Dependiendo del número de alumnos, las autoridades toman decisiones tales como: si se apertura un nuevo paralelo o si se cierra un curso, planificación horarios de uso de los laboratorios, construir nueva infraestructura física para aulas y/o laboratorios, adquirir nueva infraestructura tecnológica, u otra decisión.Preguntas identificadas: - ¿Se cuenta con estadísticas de crecimiento estudiantil de toda la Universidad? - ¿Se cuenta con estadísticas de crecimiento estudiantil por carreras, destacando la de mayor crecimiento? - ¿Se cuenta con estadística de estudiantes matriculados por modalidad de estudios? - ¿Es posible detallar el crecimiento estudiantil por modalidad de estudio, carrera y periodo lectivo? - ¿Es posible presentar la información en gráficos estadísticos? - ¿Es posible la generación de informes en formato PDF, Excel y HTML? - Para el desarrollo el prototipo de este sistema, se ha considerado centrar el estudio en el ámbito académico y específicamente en información de matrículas de estudiantes.b) Identificar indicadores y perspectivas de análisisUna vez que se han establecido las preguntas claves, se debe proceder a sudescomposición para descubrir los indicadores que se utilizarán y las perspectivas deanálisis que intervendrán. Los indicadores deben ser realmente efectivos y por logeneral son valores numéricos. En cambio, las perspectivas se refieren a los objetosmediante los cuales se quiere examinar los indicadores, con el fin de responder a laspreguntas planteadas.Aplicando al caso de estudio. De entrevistas realizadas al personal administrativo se obtuvo unlistado de los reportes que más prioridad tienen: - Total de alumnos matriculados en la UTSAM desde su creación - Total de alumnos matriculados por escuela
    • - Número de alumnos matriculados por escuela, carrera y por años - Número de alumnos matriculados por escuela, carrera, años, periodo, semestre y modalidad - Número de alumnos matriculados por años, escuela, carrera, modalidad, periodo, semestre y sección. - Número de alumnos matriculados por modalidad, años, escuela, carrera, periodo, semestre y sección.Ejemplo de análisis de indicadores y perspectivas: Número de alumnos matriculados porescuela, carrera y por años Indicador PerspectivasIndicadores: - Número de alumnos matriculados - Total de alumnos matriculadosPerspectiva de Análisis: - Escuela - Carrera - Modalidad - Tiempo - Semestrec) Modelo ConceptualEn esta etapa, se construirá un modelo conceptual a partir de los indicadores yperspectivas obtenidas en el paso anterior. A través de este modelo, se podráobservar con claridad cuáles son los alcances del proyecto, para luego poder trabajarsobre ellos, además al poseer un alto nivel de definición de los datos, permite quepueda ser presentado ante los usuarios y explicado con facilidad.Aplicando al caso de estudio. La representación gráfica del modelo conceptual del caso deestudio es la siguiente: Escuela Número de Carrera Estudiantes Modalidad Matrícula Total de Tiempo estudiantes Semestre Figura 28. Modelo Conceptual Fuente: Elaboración propiaPASO 2. ANÁLISIS DE OLTP’SSeguidamente, se analizarán las fuentes OLTP para determinar cómo serán calculadoslos indicadores y para establecer las respectivas correspondencias entre el modeloconceptual creado en el paso anterior y las fuentes de datos. Luego, se definirán quécampos se incluirán en cada perspectiva. Finalmente, se ampliará el modeloconceptual con la información obtenida en este paso.a) Determinación de Indicadores
    • En este paso se deberán explicitar cómo se calcularán los indicadores, definiendo lossiguientes conceptos para cada uno de ellos: - Hecho/s que lo componen, con su respectiva fórmula de cálculo. Por ejemplo: Hecho1+ Hecho2. - Función de sumarización que se utilizará para su agregación. Por ejemplo: SUM,AVG, COUNT, etc.Aplicando al caso de estudio, tenemos: - Indicador1: Número de alumnos matriculados= COUNT(Matriculados por semestre) - Indicador2: Total de alumnos matriculados=SUM(Indicador1)b) Establecer correspondenciasEl objetivo de este paso, es el de examinar los OLTP disponibles que contengan lainformación requerida, como así también sus características, para poder identificar lascorrespondencias entre el modelo conceptual y las fuentes de datos.Aplicando al caso de estudio, se tiene: Escuela Carrera Semestre Tiempo Modalidad Número de Total estudiantes estudiantesFigura 29.Correspondencia en el Diagrama de Entidad Relación Base de datos GINUS Fuente: GINUSc) Nivel de granularidad
    • Una vez que se han establecido las relaciones con los OLTP, se examinarán yseleccionarán los campos que contendrá cada perspectiva, ya que será a través deestos por los que se manipularán y filtrarán los indicadores.De acuerdo a las correspondencias establecidas, se analizaron los campos residentesen cada tabla a la que se hacía referencia, a través de dos métodos diferentes.Primero se examinó la base de datos para intuir los significados de cada campo, yluego se consultó con el encargado del sistema sobre algunos aspectos de los cualesno se comprendía su sentido. De todas formas, y como puede apreciarse en eldiagrama de entidad relación antes expuesto, los nombres de los campos son bastanteexplícitos y se deducen con facilidad.Aplicando al caso de estudio. Se identifica el nivel de granularidad Perspectiva Datos Descripción Escuela Esc_cod Código de la escuela Esc_nom Nombre de la escuela Carrera Car_cod Código de carrera Car_nom Nombre de carrera Modalidad Mod_cod Código de Modalidad Mod_desc Descripción de la modalidad de estudio Tiempo Anio Corresponde al Año académico Periodo En un año académico se pueden aperturar uno o varios periodos de clases. Cada periodo de clase tiene un mes y año de inicio y un mes y año de culminación. Un semestre se desarrolla en un periodo de clases. Sem_cod Código del semestre Semestre Sem_desc Descripción del Semestre Sem_sec Sección de estudios Matrícula Mat_cod Código de matrícula Tabla 3: Campos del MER GINUS y organizados por perspectivas Fuente: GINUS UTSAMd) Modelo Conceptual ampliadoEn este paso, y con el fin de graficar los resultados obtenidos en los pasos anteriores,se ampliará el modelo conceptual, colocando bajo cada perspectiva los camposelegidos y bajo cada indicador su respectiva fórmula de cálculo. Aplicando al casode estudio se tiene la siguiente figura: ESCUELA Esc_nom CARRERA Número de Car_nom Estudiantes COUNT(mat_cod) MODALIDAD por cada semestre Mod_desc TIEMPO Matrícula Anio periodo Total de estudiantes SUM(Número de SEMESTRE Estudiantes) Sem_desc Sem_sec Figura 30. Modelo Conceptual Ampliado del DW GINUS BI
    • Fuente: Elaboración propiaPASO 3. MODELO LÓGICO DEL DATA WARE HOUSEA continuación, se confeccionará el modelo lógico de la estructura del DW, teniendocomo base el modelo conceptual que ya ha sido creado. Para ello, primero se definiráel tipo de modelo que se utilizará y luego se llevarán a cabo las acciones propias alcaso, para diseñar las tablas de dimensiones y de hechos. Finalmente, se realizaránlas uniones pertinentes entre estas tablas.a) Tipo de Modelo Lógico del DWSe debe seleccionar cuál será el tipo de esquema que se utilizará para contener laestructura del DW, que se adapte mejor a los requerimientos y necesidades delusuario. Es muy importante definir objetivamente si se empleará un esquema enestrella, constelación o copo de nieve, ya que esta decisión afectaráconsiderablemente la elaboración del modelo lógico.Aplicando al caso de estudio. El esquema que se utilizará será en estrella, debidoa sus características, ventajas y diferencias con los otros esquemas.b) Diseño de tablas de dimensiones, hechos y unionesEn este paso se deben diseñar las tablas de dimensiones que formarán parte del DW.Para los tres tipos de esquemas, cada perspectiva definida en el modelo conceptualconstituirá una tabla de dimensión. Para ello deberá tomarse cada perspectiva con suscampos relacionados y realizarse el siguiente proceso: - Se elegirá un nombre que identifique la tabla de dimensión. - Se añadirá un campo que represente su clave principal. - Se redefinirán los nombres de los campos si es que no son lo suficientemente intuitivos.Aplicando al caso de estudio: Figura 31. Modelo Lógico del DW GINUS BI Fuente: Elaboración propiaPASO 4. DISEÑO DEL PROCESO ETLUna vez construido el modelo lógico, se deberá proceder a probarlo con datos, através de procesos ETL.
    • Para realizar la compleja actividad de extraer datos de diferentes fuentes, para luegointegrarlos, filtrarlos y depurarlos; existen varios software que facilitan estas tareas,por lo cual este paso se centrará solo en la generación de las sentencias SQL quecontendrán los datos que serán de interés.Antes de realizar la carga de datos, es conveniente efectuar una limpieza de losmismos, para evitar valores faltantes y anómalos. Se debe tener en cuenta cuál es lainformación que se desea almacenaren el DW, para ello se pueden establecercondiciones adicionales y restricciones.Aplicando al caso de estudio:En este proceso se ha diseñado una consulta que extrae los datos de la base de datosdel GINUS transaccional y carga a un archivo de Excel que posteriormente se importóen una base de datos y tabla temporal. A continuación se explica el proceso: SENTENCIA SQL DE EXTRACCIÓN DE DATOS DEL SISTEMA GINUS TRANSACCIONALSELECTescuelas.Esc_Nom,carreras.Car_Nom,YEAR(Per_Fea) as Año,CONCAT(IF(MONTH(periodos.Per_Fea) = 1, Enero, IF(MONTH(periodos.Per_Fea) = 2, Febrero, IF(MONTH(periodos.Per_Fea) = 3, Marzo,IF(MONTH(periodos.Per_Fea) = 4, Abril, IF(MONTH(periodos.Per_Fea) = 5, Mayo, IF(MONTH(periodos.Per_Fea) = 6, Junio,IF(MONTH(periodos.Per_Fea) = 7, Julio, IF(MONTH(periodos.Per_Fea) = 8, Agosto, IF(MONTH(periodos.Per_Fea) = 9, Septiembre,IF(MONTH(periodos.Per_Fea) = 10, Octubre, IF(MONTH(periodos.Per_Fea) = 11, Noviembre, Diciembre))))))))))), - ,YEAR(periodos.Per_Fea), ,IF(MONTH(periodos.Per_Fef) = 1, Enero, IF(MONTH(periodos.Per_Fef) = 2, Febrero,IF(MONTH(periodos.Per_Fef) = 3, Marzo, IF(MONTH(periodos.Per_Fef) = 4, Abril, IF(MONTH(periodos.Per_Fef) = 5, Mayo,IF(MONTH(periodos.Per_Fef) = 6, Junio, IF(MONTH(periodos.Per_Fef) = 7, Julio, IF(MONTH(periodos.Per_Fef) = 8, Agosto,IF(MONTH(periodos.Per_Fef) = 9, Septiembre,IF(MONTH(periodos.Per_Fef) = 10, Octubre, IF(MONTH(periodos.Per_Fef)= 11, Noviembre, Diciembre))))))))))), - , YEAR(periodos.Per_Fef))AS Periodo,niveles.Niv_Des,modalidad.Mod_Des,semestres.Sem_Sec,count(matriculas.Mat_Int) AS TotalFROMmatriculas INNER JOIN semestres ON (matriculas.Sem_Cod = semestres.Sem_Cod) INNER JOIN periodos ON (semestres.Per_Int = periodos.Per_Int) INNER JOIN promocione ON (semestres.Pro_Cod = promocione.Pro_Cod) INNER JOIN carreras ON (promocione.Car_Int = carreras.Car_Int) INNER JOIN escuelas ON (carreras.Esc_Int = escuelas.Esc_Int) INNER JOIN modalidad ON (periodos.Mod_Cod = modalidad.Mod_Cod) INNER JOIN niveles ON (semestres.Niv_Cod = niveles.Niv_Cod)WHEREmatriculas.Mat_Est = A
    • Luego de extraer los datos de la base de datos transaccional se procedió a colocar enun base de datos temporal para posterior cargar al data warehouse del sistema GINUSBI. SERVIDOR BD SERVIDOR BD MYSQL MYSQL SCRIPT SQL HOJA DE EXCEL BD DW GINUS TEMPORAL BI BD GINUS TRANSACCIONAL EXTRACCIÓN TRANSFORMACIÓN CARGA Figura 32. Proceso Extracción, Transformación y Carga (ETL) al DW del sistema GINUS BI Fuente: Elaboración propia3.5. CREACIÓN DE CUBOS MULTIDIMENSIONALESUn cubo multidimensional o hipercubo, representa o convierte los datos planos que seencuentran en filas y columnas, en una matriz de N dimensiones. Los objetos másimportantes que se pueden incluir en un cubo multidimensional, son los siguientes: - Indicadores: sumarizaciones que se efectúan sobre algún hecho, perteneciente a una tabla de hechos. - Atributos: campos o criterios de análisis, pertenecientes a tablas de dimensiones.
    • - Jerarquías: representa una relación lógica entre dos o más atributos.Aplicando al caso de estudio: Para diseñar los cubos se ha utilizado unaherramienta denominada Workbench, esta herramienta permite diseñar fácilmentelos cubos en formato XML estableciendo en primera instancia la conexión con el datawarehouse GINUS BI.En la siguiente figura se muestra los 3 cubos creados: Matriculas_esc, Matricula_anio,Matriculas_mod. Figura 33.Cubos del sistema GINUS BI Fuente: Elaboración propiaEstructura de los cubos del sistema GINUS BI Figura 34. Estructura delos Cubos del sistema Ginus BI Fuente: Elaboración propiaPara cada cubo se debe definir la tabla de hechos, las dimensiones, la jerarquía y lasmedidas.Ejemplo del cubo Matriculas_mod del sistema GINUS BI CÓDIGO XML DEL CUBO MATRICULAS_MOD<Cube name="Matriculas_mod" cache="false" enabled="true"><Table name="hechos"></Table><Dimension type="StandardDimension" name="Modalidad"><HierarchyhasAll="true"> <Level name="Modalidad" column="modalidad" type="String" uniqueMembers="false" levelType="Regular" hideMemberIf="Never"></Level><Level name="Anio" column="anio" type="String" uniqueMembers="false" levelType="Regular" hideMemberIf="Never"></Level>
    • - Tabla de hechos: hechos - Dimensiones: Modalidad - Jerarquía: Modalidad, Anio, Escuela, Carrera, Periodo, Semestre y Sección - Atributos: Modalidad, Anio, Escuela, Carrera, Periodo, Semestre y Sección - Medida: nro_matriculados3.6. DISEÑO DEL SSDPARA EL D. ACADÉMICO DE LA UTSAM (FRONTEND)3.6.1. Diagrama de casos de uso del sistema Iniciar sesión Generar Gráfico <<include>> estadístico Generar estadísticas de matriculados <<include>> Presentar en <<extends>> formatos XLS, Tomador de <<extends>> <<extends>> decisiones HTML y PDF G. E. M. por G. E. M. por G. E. M. por escuela y carrera año modalidad Figura 35. Diagrama de casos de uso del sistema Ginus BI Fuente: Elaboración propia3.6.2. Diagrama de componentes basado en capas del sistema Ginus BI
    • CAPA DE PRESENTACIÓN Interfaz de Usuario web del Tomador de Decisiones CAPA DE APLICACIÓN Aplicación OLAP (JPivot) Servidor OLAP (Mondrian) CUBOS XML Matriculas_esc, Matricula_anio, Matriculas_mod CAPA DE INFORMACIÓN DATA WAREHOUSE SERVIDOR DE BD GINUS BI MYSQL Figura 36. Diagrama de componentes basado en capas del sistema Ginus BI Fuente: Elaboración propia3.7. IMPLEMENTACIÓN DEL SOFTWAREHerramientas utilizadas. La mayoría de herramientas utilizadas son open source. Acontinuación se presenta y se describe cada herramienta utilizada. - mysql-5.0.45-win32. Es el servidor de bases de datos donde se almacena del Data warehouse del sistema Ginus BI. - mysql_yog. Esta herramienta es un FrontEnd que permite la gestión del servidor de bases de datos. - apache-tomcat-6.0.18. Es el servidor web utilizado para aplicaciones JAVA. - jdk-6u10-windows-i586-p.Es el Kit de desarrollo de JAVA. Sirve de soporte para que el servidor web Apache Tomcat ejecute aplicaciones JAVA. - jpivot-1.8.0. Es el visor de los cubos que son administrados por un servidor OLAP. - mondrian-3.0.4.11371. Servidor de cubos OLAP y se integra a Jpivot.
    • - mysql-connector-java-5.0.5-bin. Java Data Base Conectivity. Conector a bases de datos Mysql desde aplicaciones Java. - workbench-2.3.2.9247. Herramienta para el diseño de cubos OLAP.3.8. INTERFACES DEL SOFTWAREA continuación se muestran algunas pantallas del sistema GINUS BI: Figura 37. Pantalla de Inicio de sesión al GINUS BI Fuente: GINUS BI Figura 38. Pantalla Principal de GINUS BI Fuente: GINUS BI
    • Figura 39. Explorar jerarquía de una carrera Fuente: GINUS BI Figura 40. Generar gráfico estadístico Fuente: GINUS BI
    • Figura 41. Matriculados por años y gráfico estadístico Fuente: GINUS BI
    • Figura 42. Matriculados por modalidad, año 2008 y clasificados por escuela en formato PDF Fuente: GINUS BIFigura 43. Matriculados por modalidad, año 2008 y clasificados por escuela en formato EXCEL Fuente: GINUS BI
    • REFERENCIAS BIBLIOGRÁFICAS BUTTERWORTH, Heinemann. Oracle Database 10 g Data Warehousing. Ed. Digital Pr. CABENA, Peter; HADJINIAN, Pablo; STADLER, Rolf; VERHEES, Jaap; ZANASI, Alessandro. Discovering Data Mining: From Concept to Implementation. Prentice Hall. 1998. ISBN: 0-13-743980-6. GROTH, Robert. Data Mining: A Hands On Approach for Business Professionals. Prentice Hall. 1998. ISBN: 0-13-756412-0. INMON, W. H.; Hackathorn; Richard D. 1994. Using the Data Warehouse. New York: John Wiley & Sons. ISBN: 0-471-05966-8. WILEY, John & SONS. Inmon W.H. Building the Data Warehouse., 3rd edition, 2002. NADER, Javier. Sistema de Apoyo Gerencial. Tesis de Grado. 2006. BALLARD, C. HERREMAN, D. SCHAU, D. BELL, R. KIM, E. VALNCIC, A.:Data Modeling Techniques for Data Warehousing. SG24-2238-00. IBM Red Book. 1998. CABIBBO, L. TORLONE, R.:"A Logical Approach to MultidimensionalDatabases", EDBT, 1998. CARPANI, F.: CMDM: A conceptual multidimensional model for Data Warehouse. Master Thesis. Advisor: Ruggia. InCo - Pedeciba, UdelaR, Uruguay, 2000. FRANCONI, E. SATTLER, U.:A Data Warehouse Conceptual Data Model for Multidimensional Aggregation, DMDW’99, Germany, 1999. GOLFARELLI, M. MAIO, D. RIZZI, S.:Conceptual Design of Data Warehouses from E/R Schemes, HICSS’98, IEEE, Hawaii, 1998. HÜSEMANN, B. LECHTENBÖRGER, J. VOSSEN, G.:Conceptual Data Warehouse Design. DMDW’00, Sweden, 2000. Kenan Technologies:An Introduction to Multidimensional Databases. White Paper, Kenan Technologies, 1996. KIMBALL, R.: The Data warehouse Toolkit. John Wiley & Son, Inc., 1996. PICERNO, A. FONTAN, M.: Un editor para CMDM. Undergraduate Project. Advisor: Carpani. InCo, UdelaR, Uruguay. 2000. SAPIA, C. BLASCHKA, M. HÖFLING, G. DINTER, B.: Extending the E/R Model for the Multidimensional Paradigm. DWDM’98, Singapure, 1998. THOMSEN, E.:OLAP Solutions. Building Multidimensional Information. John Wiley & Sons, Inc. 1997. Gartner. Magic Quadrant for Business Intelligence Platforms. Enero 2009 (http://mediaproducts.gartner.com/reprints/oracle/article56/article56.html) RODRÍGUEZ, Ivonne.Soluciones Tecnológicas Integrales para las Empresas. Presentación electrónica .PPT. HERNANDEZ, José. Análisis y Extracción de Conocimiento en Sistemas de Información: Data warehouse y Datamining. Departamento de Sistemas Informáticos y Computación, Universidad Politécnica de Valencia. (URL. http://www.dsic.upv.es/~jorallo/cursoDWDM/). CASARES, Claudio. Data Warehousing.Programación en Castellano. (URL: http://www.programacion.com/bbdd/tutorial/warehouse/) BITAM. Business Intelligence. Febrero 2002. (URL: http://www.bitam.com/spanish/AcercaDeBI.htm) CSI, I. Development Datawarehousing. Julio 2002. (URL: http://www.data warehousecenter.com) GUPTA, V. An introduction to Data Warehousing. Febrero 2002. (URL:http://www.system-services.com/dwintro.htm) Web Site Tic &Tac. (URL:http://tikitak.blogspot.com/) MANZANO, Oscar. A Bit of an apple. (URL:http://oscarmanzano.f2o.org/applebit/) ARIAS, Emilio. Stratebi Business Solutions. (URL: http://www.stratebi.com) ARIAS, Emilio. El recurso en español sobre Business Intelligence. (URL: http://www.TodoBI.com)
    •  Abits Software de Colombia. (URL: http://www.abits.com.co/productos/inteligencia.asp) Fyc - Servicios - Información - Inteligencia de Negocios. (URL: http://www.fyccorp.com/servicios-informacion-inteligencia-negocios.htm) GopacBI. (URL: http://www.gopac.com.mx/bi/que.htm) Revista pc-news.com. La importancia de la inteligencia de negocios (entrevista a Raúl Roldán, gerente de Business InnovationServices de IBM Venezuela). (URL: http://www.pc-news.com/detalle.asp?sid=&id=9&Ida=266) Inteligencia de Negocios(URL: http://www.ibix.com.mx/Inteligencia.htm) Business intelligence y proyectos Data warehouse - SOLUZIONA Consultoria (http://www.soluziona.es/htdocs/areas/consultoria/servicios/bi/index_bi.shtml) RAMÍREZ ROMERO, Luz María. Inteligencia de negocios para la toma de decisiones. (URL:http://www.enterate.unam.mx/Articulos/2004/octubre/inteligen.htm) SPSS. Reportes OLAP: Opciones Tecnológicas Para Quienes Toman Decisiones(URL:http://www.spss.com/la) MARTÍNEZ,Andrés. Curso gratis de SPSS para todos. (URL: http://www.spssparatodos.com) INEI,Instituto Nacional de Estadística e Informática - Perú.Data warehouse. (URL: http://www.inei.gob.pe/web/metodologias/attach/lib619/index.htm) BACH, Torben Pedersen & JENSEN, Christian. Multidimensional Database Technology. AalborgUniversity& IEEE. (URL:http://computer.org/dsonline) Gobierno Nacional de la República del Ecuador. Decreto 1014 respecto al uso del software Libre. Abril 2008. (URL: http://www.presidencia.gov.ec/noticias.asp?noid=13318) CGMLAB. OLAP Spatial. Abril 2009. (URL: http://cgmlab.cs.dal.ca/Members/obaltzer/SOLAP/) IBM Cognos. Arquitectura BI de IBM Cognos. Mayo 2009. (URL: http:// www.cognos.com/nl/products/now/architecture.html) Microsoft. Arquitectura BI de Microsoft. Mayo 2009. (URL: http://www.microsoft.com/bi/aboutbi/default.aspx) ORACLE. Arquitectura BI de OBIEE. Mayo 2009. (URL: http://www.b-eye-network.com/blogs/mcknight/) SAP. Arquitectura BI de SAP BusinessObjects XI 3.1. Mayo 2009. (URL: http://www.businessobjects.com) Microstrategy. Arquitectura BI de Microstrategy. Mayo 2009. (URL: http://www.microstrategy.com) SAS. Arquitectura BI de SAS. Mayo 2009. (URL:http://support.sas.com/documentation/cdl/en/biov/60947/HTML/default/a003069226.htm) Pentaho. Arquitectura BI de Pentaho. Mayo 2009. (URL: http://www.pentaho.com)
    •  JasperSoft. Arquitectura BI de JasperSoft. Mayo 2009. (URL: http://www.jaspersoft.com) Eclipse BIRT. Arquitectura BI de Eclipse BIRT. Mayo 2009. (URL: http://www.eclipse.org/birt/phoenix/) SpagoBI. Arquitectura BI de SpagoBI. Mayo 2009. (URL: http://spagobi.eng.it/ecm/faces/public/guest/home/solutions/spagobi) Palo. Arquitectura BI de Palo. Mayo 2009. (URL: http://www.jedox.com/en/products/palo_olap_server/Introduction.html) Openi. Arquitectura BI de Openi. Mayo 2009. (URL: http://www.openi.org/) GARCÍA, Mariano. Montar MySQL + Mondrian + OpenI + Tomcat6. Video Tutoriales.(URL: http://www.youtube.com/view_play_list?p=73466B47EC452C82) GOLFARELLI M., MAIO D., RIZZI S. The Dimensional Fact Model: A Conceptual Model for Data Warehouses. International Journal of CooperativeInformation System, 1998. BERNABEU, Ricardo Darío. Metodología HEFESTO 1.1. Metodología propia para la Construcción de un Data Warehouse. Abril 2009. (URL: http://tgx-hefesto.blogspot.com). CABIBBO L., TORLONE R. A Logical Approach to Multidimensional Databases. In Proceedings of the 6th International Conference on Extending Database Technology (EDBT’98), Volume 1377 of Lecture Notes in Computer Science, Valencia, Spain, March 23 - 27 1998. Springer-Verlag LIND, MARCHAL, MASON. Estadística para Administración y Economía. Ed. Alfaomega, México 2004.GLOSARIOBajar (Drill-Down): Es una operación de acceso a datos en cubos multidimensionales que significa bajar el nivel de visualización en las filas a una jerarquía inferior.Balanced Scorecard: Término utilizado para expresar un sistema de medicióndel logro de objetivos de una empresa que permite traducir la visión de la organización, expresada a través de su estrategia, en términos y objetivos específicos.Colapsar (Collapse): Es una operación de acceso a datos en cubos multidimensionales que significa ocultar los detalles hacia un nivel superior mostrando los resúmenes correspondientes.Data mart: Conjunto de hechos y datos organizados para soporte decisional basados en la necesidad de un área o departamento específico. Los datos son orientados a satisfacer las necesidades particulares de un departamento dado teniendo sólo sentido para el personal de ese departamento y sus datos no tienen
    • por qué tener las mismas fuentes que los de otro Data mart.Dataminig: Análisis de los datos para descubrir relaciones, patrones, o asociaciones desconocidas.Data warehouse: Base de datos que almacena una gran cantidad de datos transaccionales integrados para ser usados para análisis de gestión por usuarios especializados (tomadores de decisión de la empresa).Dimensión: Entidad independiente dentro del modelo multidimensional de una organización, que sirve como llave de búsqueda (actuando como índice), o como mecanismo de selección de datos.Drill-Down: Es una operación de acceso a datos en cubos multidimensionales, que significa exponer progresivamente más detalle (dentro de un reporte o consulta), mediante selecciones de ítems sucesivamente.Drill-Up: Es una operación de accesos a datos en cubos multidimensionales, es el efecto contrario a drill-down. Significa ver menos nivel de detalle. Sobre la jerarquía significa generalizar o sumarizar, es decir, subir en el árbol jerárquico.DSS Sistema de aplicaciones automatizadas que asiste a la(Decisión Support organización en la toma de decisiones mediante unSystem- Sistema de análisis estratégico de la información histórica.Soporte de Decisiones):EIS (Executive Sere fiere a cualquier sistema de software que muestreInformation System – información ejecutiva delas diferentes áreas del negocioSistema de Información en un solo sistema, facilitando el monitoreo de laEjecutiva) empresa.Esquema Constelación de Es un esquema de base de datos en donde varias tablasHechos: de hechos se enlazan a las tablas de dimensiones.Esquema Copo de Nieve: Es un esquema de base de datos en donde una tabla de hechos central se enlaza a las tablas de dimensiones relacionadas, pero éstas a su vez se enlazan con otras tablas dimensionales.Esquema Estrella: Es un esquema de base de datos en donde una tabla de hechos central se enlaza a las tablas de dimensiones relacionadas.PYME’S Pequeñas y Medianas EmpresasETL (Extracción, Pasos por los que atraviesan los datos para ir desde elTransformación y sistema OLTP (o la fuente de datos utilizada) a laTransporte de datos): bodega dimensional. Extracción, se refiere al mecanismo por medio del cual los datos son leídos desde su fuente original. Transformación (también conocida como limpieza) es la etapa por la que puede atravesar una base de datos para estandarizar los datos de las distintas fuentes, normalizando y fijando una estructura para los datos. El Transporte consiste básicamente en llevar los datos leídos y estandarizados a la bodega dimensional (puede ser remota o localmente). Generalmente, para un Data Mart no es necesario atravesar por todos estos pasos, pues al ser información localizada, sus datos suelen estar
    • naturalmente estandarizados (hay una sola fuente).Expandir (Expand): Es una operación de accesos a datos en cubos multidimensionales que significa ampliar la información hacia más detalle sin perder la información a nivel superior.Inteligencia de Negocios: Es el conjunto de tecnologías que permiten a las empresas utilizar la información disponible en cualquier parte de la organización para hacer mejores análisis, descubrir nuevas oportunidades y tomar decisiones más informadas.MDDB: Base de datos multidimensional. Se utiliza para almacenar la información de los cubos, pertenecientes a un sistema OLAP.MOLAP: La arquitectura MOLAP usa unas bases de datos multidimensionales para proporcionar el análisis, su principal premisa es que el OLAP está mejor implantado almacenando los datos multidimensionalmente.OLAP(On-line Analytical Conjunto de principios que proveen una ambiente deProcessing): trabajo dimensional para soporte decisional.OLTP (On-line Sistema transaccional diario (o en detalle) queTransaction Processing): mantiene los datos operacionales del negocio.ROLAP: La arquitectura ROLAP, accede a los datos almacenados en un Data Warehouse para proporcionar los análisis OLAP. La premisa de los sistemas ROLAP es que las capacidades OLAP se soportan mejor contra las bases dedatos relacionales.Rotar (Swap): Alterarlas filas por columnas (permutar dos dimensiones de análisis).Snapshot: Imagen instantánea de los datos en un tiempo dado.Sumarización: Actividad de incremento de la granularidad de la información en una base de datos. La sumarización reduce el nivel de detalle, y es muy útil para presentar los datos para apoyar al proceso de Toma de Decisiones.Tabla Dimensional: Dentro del esquema estrella, copo de nieve o constelación de hechos, corresponde a las tablas que están unidas a la tabla central a través de sus respectivas llaves. La cantidad de estas tablas le otorgan la característica de multidimensionalidad a esta estrategia.Tabla Hechos: Dentro del esquema estrella, copo de nieve o constelación de hechos, contiene las medidas o valores de las dimensiones de análisis. Está unida a las tablas de dimensiones.XML(eXtended Markup Es un lenguaje que consiste en una serie de reglas,Lenguaje – Lenguaje de pautas, convenciones para planificar formatos textoDenotación Extendido): para datos, de manera que produzcan archivos que sean fácilmente generados y leídos (por un ordenador) que son inequívocos, y que evitan escollos comunes como la falta de extensibilidad, falta de soporte para la internacionalización o localismo, y la dependencia de una determinada plataforma.