El documento describe los componentes y funciones de un observatorio. Explica que un observatorio reúne y facilita información a usuarios y profesionales para adoptar medidas, integrando datos parcialmente dispersos y generando estadísticas y análisis. También sirve para la toma de decisiones, evaluar políticas e identificar riesgos. Propone una solución basada en Pentaho, que incluye módulos de ETL, reporting, OLAP y minería de datos para gestionar la información del observatorio.
Louis Jean François Lagrenée. Erotismo y sensualidad. El erotismo en la Hist...
Observatorio de Información Opensource
1. Soluciones Business Intelligence Propuesta Proyecto Final de Carrera Alberto García Moreno – 53409848F Sistemas de Información Facultad de Informática (UPM) - Observatorio Open Source -
2. Índice Qué es un Observatorio 01 02 Para qué sirve un Observatorio Componentes de un Observatorio 03 04 Panel de configuración de un Observatorio Caso de éxito 05 06 Solución analítica Estudio Open Source 07 08 Ventajas e Inconvenientes de una solución Open Source 1 Solución elegida 09 Alberto García Moreno Propuesta de PFC Sistemas de Información Facultad de Informática - UPM
3. Qué es un Observatorio 01 ...es una estructura que reúne y facilita a los usuarios, profesionales y directores , la información necesaria para adoptar medidas en un ámbito de actuación... “ Un Observatorio es un sistema permanente y actualizado que, ... integra información parcialmente dispersa, ... elabora estadísticas globales y específicas, ... formula análisis y proyecciones sobre una cuestión específica, y ... alimenta de forma periódica información y estadísticas a organismos y particulares relacionados con una materia. 2 Alberto García Moreno Propuesta de PFC Sistemas de Información Facultad de Informática - UPM
4. 02 Para qué sirve un Observatorio ... un observatorio se debe de constituir como un mecanismo permanente de información, consulta y aporte a la investigación, formulación de políticas, planes de trabajo y toma de decisiones relacionadas con la materia en cuestión ... “ ” ... para crear de una base de datos de integración de información parcialmente dispersa. ... para organizar la información disponible de acuerdo a estándares e indicadores. ... para promover la investigación. ... para suministrar en forma periódica estadísticas globales y específicas, análisis, proyecciones y demás información generada. ... para facilitar el intercambio periódico y armónico de información, con la comunidad científica e investigadora, entidades nacionales, regionales e internacionales, etc. ... para realizar el seguimiento de las políticas relacionadas ... para evaluar el impacto de las acciones dirigidas a un propósito ... para detectar nuevas tendencias y proyecciones de futuro ... para Identificar zonas de riesgo y vulnerabilidades en el control, para la adopción de estrategias de solución investigación divulgación intervención Se trata de un instrumento polivalente que se basa en tres ejes : 3 Alberto García Moreno Propuesta de PFC Sistemas de Información Facultad de Informática - UPM
5. ... en resumen, un observatorio es muy útil ... 02 Para qué sirve un Observatorio 4 ... para la toma de decisiones y la adopción de medidas y políticas necesarias para desarrollar programas/ intervenciones basadas en información confiable y validada ... Alberto García Moreno Propuesta de PFC Sistemas de Información Facultad de Informática - UPM
6. Componentes de un Observatorio 03 Función de difusión externa Función de relación con el público objetivo Función de difusión interna Función de gestión del conocimiento Función de simulación Datos Básicos Indicadores Noticias Estudios Encuestas Revistas Publicaciones Un observatorio está estructurado en dos grandes componentes: Elementos : son los contenidos sobre la materia objeto del observatorio. Pueden ser datos, indicadores, encuestas, estudios, publicaciones, noticias, etc. Funciones : son las acciones que se pueden realizar sobre los elementos que componen el observatorio. Las funciones pueden ser muchas: gestión de datos, seguimiento de indicadores, gestión de información variada, gestión interna del conocimiento en la organización, difusión interna y externa del observatorio, simulación de datos e indicadores, gestión de la relación con el público objetivo del observatorio, etc. Función de gestión de información desestructurada Función de seguimiento y evolución Función de gestión de datos (query & análisis) Enlaces 5 Alberto García Moreno Propuesta de PFC Sistemas de Información Facultad de Informática - UPM
7. 04 Panel de configuración de un Observatorio Análisis datos Difusión (externa) Investigación (interna) CUADRANTE DE ANALISIS DE DATOS Y DIFUSIÓN CUADRANTE DE SEGUIM. DE INDICADORES Y DIFUSIÓN CUADRANTE DE ANALISIS DE DATOS E INVESTIGACIÓN CUADRANTE DE SEGUIM. INDICADORES E INVESTIGACIÓN Publicación externa de gran cantidad de datos Orientado a a un público especialista en la materia La seguridad en los accesos a los datos es un elemento esencial Equilibrio entre soluciones de publicación y gestión de datos Repositorio interno de referencia para la gestión de datos Orientado a analístas dentro de nuestra organización El nivel de seguridad de accesos es similar al de otros sistemas Son necesarias potentes soluciones de gestión de datos Publicación de indicadores, estudios, objetivos, encuestas,... Orientado a a un público generalista El nivel de seguridad de acceso a la informacón es bajo Priman las soluciones de publicación de información (portales) Seguimiento interno de indicadores y repositorio de inform. Orientado a toda la organización interna El nivel de seguridad de accesos es similar al de otros sistemas Priman las soluciones de seguimiento de interno de indicadores Seguimiento de indicadores 6 Alberto García Moreno Propuesta de PFC Sistemas de Información Facultad de Informática - UPM
8. Análisis datos Seguimiento de indicadores Difusión (externa) Investigación (interna) CUADRANTE DE ANALISIS DE DATOS Y DIFUSIÓN CUADRANTE DE ANALISIS DE DATOS E INVESTIGACIÓN SOLUCIÓN DE QUERY & REPORTING PORTAL DE PUBLICACIÓN (INTERNET) 50% 50% SOLUCIÓN DE QUERY & REPORTING 75% PORTAL DE PUBLICACIÓN (INTRANET) 25% 75% 25% SOLUCIÓN DE CUADRO DE MANDO PORTAL DE PUBLICACIÓN (INTERNET) SOLUCIÓN DE CUADRO DE MANDO PORTAL DE PUBLICACIÓN (INTRANET) 50% 50% CUADRANTE DE SEGUIM. DE INDICADORES Y DIFUSIÓN CUADRANTE DE SEGUIM. INDICADORES E INVESTIGACIÓN 04 Panel de configuración de un Observatorio 7 Alberto García Moreno Propuesta de PFC Sistemas de Información Facultad de Informática - UPM
9. Análisis datos Seguimiento de indicadores Difusión (externa) Investigación (interna) CUADRANTE DE ANALISIS DE DATOS Y DIFUSIÓN CUADRANTE DE ANALISIS DE DATOS E INVESTIGACIÓN SOLUCIÓN DE QUERY & REPORTING PORTAL DE PUBLICACIÓN (INTERNET) 50% 50% SOLUCIÓN DE QUERY & REPORTING 75% PORTAL DE PUBLICACIÓN (INTRANET) 25% 75% 25% SOLUCIÓN DE CUADRO DE MANDO PORTAL DE PUBLICACIÓN (INTERNET) SOLUCIÓN DE CUADRO DE MANDO PORTAL DE PUBLICACIÓN (INTRANET) 50% 50% CUADRANTE DE SEGUIM. DE INDICADORES Y DIFUSIÓN CUADRANTE DE SEGUIM. INDICADORES E INVESTIGACIÓN 04 Panel de configuración de un Observatorio 8 OBSERVATORIO PERSONALIZADO Observatorio orientado al seguimiento de indicadores globales pero que será utilizado de para la difusión externa y para la investigación interna (equilibrio entre ambas funciones) CUADRO DE MANDO PORTAL INTERNO (INTRANET) PORTAL EXTERNO (EXTRANET) 33% 33% 33% Alberto García Moreno Propuesta de PFC Sistemas de Información Facultad de Informática - UPM
10. Caso de éxito 05 CASO DE ÉXITO OBSERVATORIO ESTATAL DE LAS CONDICIONES DE TRABAJO Instituto Nacional de Seguridad e Higiene en el Trabajo Ministerio de Trabajo y Asuntos Sociales El proyecto ha consistido en definir el marco general para la implantación del nuevo Observatorio Estatal de las Condiciones de Trabajo para el Instituto Nacional de Seguridad e Higiene en el Trabajo (INSHT), mediante un Plan de Acción que integre y plasme todos los elementos del proyecto dentro de un marco de ejecución organizado y planificado. El proyecto se ha realizado desde dos ámbitos de actuación distintos: Ámbito interno: se ha definido el observatorio con el objetivo de dotar a los gestores del INSHT de un instrumento de análisis de la información en materia de condiciones de trabajo y sus consecuencias para la salud de los trabajadores. Ámbito externo: otra función esencial del observatorio definido es proveer a todos los organismos y agentes implicados en la prevención de Riesgos Laborales (administración del Estado, autonómica y local, interlocutores sociales, profesionales de la prevención, empresas y trabajadores) de los indicadores en materia de condiciones de trabajo que el INSHT considere de interés general. “ ..el Instituto Nacional de Seguridad e Higiene en el Trabajo tenía claro que necesitaba disponer, de forma centralizada, de toda la información existente en la organización sobre las Condiciones de Trabajo en España. Por este motivo, solicitó nuestra colaboración para que le propusiéramos como debía ser el futuro Observatorio de las Condiciones de Trabajo...” 9 Alberto García Moreno Propuesta de PFC Sistemas de Información Facultad de Informática - UPM
11. Solución analítica 06 10 Alberto García Moreno Propuesta de PFC Sistemas de Información Facultad de Informática - UPM
12. Estudio Open Source 07 11 ETL Reporting ENHYDRA OCTOPUS CLOVER OLAP Data mining Dashboards BIRT Alberto García Moreno Propuesta de PFC Sistemas de Información Facultad de Informática - UPM
13. 08 Ventajas e Inconvenientes de una solución Open Source 12 1. No es muy conocido . Su uso no se encuentra tan extendido como el software propietario, aunque como hemos comentado este año está suponiendo un punto de inflexión en la tendencia. 2. Dificultad en el intercambio de archivos (Integración). En muchos entornos se presentan dificultades para poder migrar datos de un sistema a otro. En éste punto la administración goza de un papel relevante en la medida que puede obligar a las empresas a cumplir los estándares. 3. Adolescencia tecnológica . A nivel tecnológico la diferencia con el software propietario es abismal. Aunque esto constituye una dificultad, probablemente es una cuestión de tiempo. 4. Costes de implantación e interoperabilidad. Al tratarse de “algo nuevo” supone afrontar un coste de aprendizaje, migración, interoperabilidad, etc. 5. Falta de responsabilidad. Dada la complejidad de los sistemas informáticos y, por tanto, la dificultad de garantizar en los mismos que el funcionamiento vaya a ser siempre óptimo, una costumbre que muchos programadores de software libre tienen es incluir en sus programas la frase típica que enuncia “el programa se distribuye sin ningún tipo de garantía, como está permitido por la legislación vigente” 1. Flexibilidad. No se esta a expensas de los planes de desarrollo y actualizaciones del proveedor con lo que no se limita el desarrollo natural de nuestro negocio. El software libre está orientado a los procesos y no a la herramienta. 2. Independencia del proveedor. Con el modelo de software Libre el usuario/cliente es quien decide lo que le interesa o lo que no, ya que al ser los programas de dominio público, la independencia esta garantizada a la hora de contratar a los proveedores. 3. Seguridad. El hecho de que el software libre no está condicionado a plazos de entrega o beneficio económico permite que un programa no se libere antes de tiempo. 4. Costes de licencias nulos. El código es gratis. 5. La comunidad de software libre. Verdadero punto fuerte ya que como si de una red neuronal se tratara asume bajo criterios muy diferentes el hacer el software libre una realidad. 6. Tendencia a la calidad y a la utilización de estándares. Lo que permite una mayor accesibilidad no solo en el uso sino también en la mejora, ya que los estándares aseguran un uso no restrictivo. VENTAJAS INCONVENIENTES Alberto García Moreno Propuesta de PFC Sistemas de Información Facultad de Informática - UPM
14. Solución elegida 13 BASE DE DATOS – Datamarts Definición del conjunto de datos necesarios para dotar al observatorio de la Información específica para la toma de decisiones QUERY & REPORTING Parametrización de las soluciones de análisis y divulgación de la información del observatorio CUADRO DE MANDO Definición y divulgación de un sistema de KPIs (Key Performance Indicators) para la dirección. 09 Alberto García Moreno Propuesta de PFC Sistemas de Información Facultad de Informática - UPM
15. 14 Solución elegida 09 Alberto García Moreno Propuesta de PFC Sistemas de Información Facultad de Informática - UPM DATAMART 1 2 Query&Reporting 3 CdM INTELIGENCIA 4
16. 15 Solución elegida: PENTAHO 09 DATOS BÁSICOS ETL REPORTING ¿Quiénes son? Módulos de Business Intelligence ETL Reporting OLAP Data Mining Dashboard Otros Productos Software Libre Profesional Comentarios Fundado por veteranos con gran experiencia en empresas comerciales del sector de Business Intelligence, tales como Business Objects, Cognos, Hyperion, IBM, Oracle y SAS. Workflow OLAP Data Mining Dashboard Servicios Soporte Técnico Otros Consultoría Formación Algunos socios … Se definen a sí mismo como una plataforma de BI orientada a “la solución” y centrada en los procesos. Su modelo de ingresos parece estar orientado a los servicios aunque en algunos de los documentos y paginas analizados se mencionan funcionalidades Premium que hacen pensar en ingresos por futuras versiones o funcionalidades de pago. Utiliza toda una serie de componentes Open Source muy utilizados y fiables: Mondrian OLAP Server, Jpivot, Jboss, Jboss Portal, ENHYDRA Shark y JaWE, Weka Data Mining, Eclipse, BIRT, Kettle. Plataforma Los productos son los mismos solo que las opciones avanzadas se incluyen en la versión profesional. Soporte a ISVs Distribuciones OEM Alberto García Moreno Propuesta de PFC Sistemas de Información Facultad de Informática - UPM
17.
18.
19. 18 Solución elegida: PENTAHO 09 DATOS BÁSICOS ETL REPORTING Productos OLAP Data Mining Dashboard Plataforma PENTAHO está incorporando la tecnología WEKA a su proyecto (Ver diapositiva de WEKA). Decimos incorporando porque a día de hoy el roadmap de pentahoo indica que están en ello. WEKA es una herramienta extensible he integrable que incluye herramientas para realizar transformaciones sobre los datos, tareas de clasificación, regresión, clustering, asociación y visualización. Alberto García Moreno Propuesta de PFC Sistemas de Información Facultad de Informática - UPM
20.
21. 20 Solución elegida: PENTAHO 09 DATOS BÁSICOS ETL REPORTING Productos OLAP Data Mining Dashboard Plataforma Los Dashboard son un desarrollo propio de PENTAHO Recogen información de todos los componentes de la plataforma incluyendo aplicaciones externas, feeds RSS y páginas WEB. Incluye gestión y filtrado de contenidos, seguridad basada en roles y funcionalidades OLAP (Profundizar y sintetizar). Pueden ser integrados en terceras aplicaciones, en portales o en la plataforma de PENTAHO. Para generar gráficos se apoyan en JFREECHART, una librería para generar los gráficos más comunes (2D, 3D, barras, líneas series temporales, Gantt,…) Contienen interfaces para acceder a diferentes fuentes de datos. Exporta en PNG, JPEG y PDF. Soporte para Servlets, JSPs, applets y aplicaciones clientes. Alberto García Moreno Propuesta de PFC Sistemas de Información Facultad de Informática - UPM
22. 21 Solución elegida: PENTAHO 09 DATOS BÁSICOS ETL REPORTING PENTAHO Open BI Suite OLAP Data Mining Dashboard Plataforma PENTAHO está construido en torno al servidor de aplicaciones J2EE Jboss y Jboss Portal , habilitando que toda información sea accesible desde un navegador en la intranet de la empresa. Su diseño permite despliegue escalables. Las acciones, que son las tareas mas sencillas que constituyen la solución, pueden publicarse como Webservices. Apache Axis es el motor de los WebServices y WSDL el lenguaje de definición. Los contenidos definidos en XML Repositorios centrales que proporcionan servicios de almacenamiento y administración de los informes, plantillas, cuadros de mando, consultas, y otros contenidos. Las herramientas gráficas de administración y diseño están integradas en la suite de PENTAHO. La seguridad incluye seguridad por perfil/roles de usuarios, por reglas de negocio. Integrable a Seguridad corporativa (Java Single Sign-On JOSSO y LDAP) La principal herramienta en manos de los administradores es PENTAHO Design Studio con la que estos crean y mantienen las aplicaciones de BI. Con el objeto de aumentar la productividad de los administradores se ha incluido un asistente para el diseño de informes y se ha integrado con el PENTAHO Data Integration que les permite definir y editar transformaciones de datos desde el mismo interfaz. Alberto García Moreno Propuesta de PFC Sistemas de Información Facultad de Informática - UPM 1 2 3 4 5
23. Alberto García Moreno 53409848F [email_address] Consultor Business Intelligence Soluciones Business Intelligence Propuesta Proyecto Final de Carrera - Observatorio Open Source -