2. Arquitectura orientada a servicios
La arquitectura orientada a servicios de cliente (en
inglés Service Oriented Architecture), es un concepto
de arquitectura de software que define la utilización de
servicios para dar soporte a los requisitos del negocio.
Permite la creación de sistemas de información
altamente escalables que reflejan el negocio de la
organización, a su vez brinda una forma bien definida
de exposición e invocación de servicios (comúnmente
pero no exclusivamente servicios web), lo cual facilita
la interacción entre diferentes sistemas propios o de
terceros.
3. Arquitectura orientada a servicios
SOA define las siguientes capas de software:
Aplicaciones básicas - Sistemas desarrollados bajo cualquier
arquitectura o tecnología, geográficamente dispersos y bajo
cualquier figura de propiedad.
De exposición de funcionalidades - Donde las funcionalidades
de la capa aplicativa son expuestas en forma de servicios
(generalmente como servicios web).
De integración de servicios - Facilitan el intercambio de datos
entre elementos de la capa aplicativa orientada a procesos
empresariales internos o en colaboración.
De composición de procesos - Que define el proceso en términos
del negocio y sus necesidades, y que varía en función del negocio.
De entrega - donde los servicios son desplegados a los usuarios
finales.
6. INTRODUCCIÓN
DW es una tecnología construida para optimizar el
uso y análisis de información utilizado por las
organizaciones para adaptarse a los cambios en los
mercados.
Su función esencial es ser la base de un sistema de
información gerencial. Debe cumplir el rol de
integrador de información proveniente de fuentes
funcionalmente distintas.
7. DATA WAREHOUSE
Se caracteriza por ser integrado, no volátil y variable en el
tiempo, que ayuda a la toma de decisiones en la entidad en
la que se utiliza
9. OLTP
Es un tipo de sistemas que facilitan y administran
aplicaciones transaccionales, usualmente para entrada
de datos y recuperación y procesamiento de
transacciones.
Los paquetes de software para OLTP se basan en la
arquitectura cliente-servidor ya que suelen ser
utilizados por empresas con una red informática
distribuida.
Algunos ejemplos de este tipo de aplicaciones son:-
Compras, - Ventas, - Inventario, - Sueldos
10. OLAP
Es una solución utilizada en el campo de la llamada
Inteligencia empresarial (o Business Intelligence) cuyo
objetivo es agilizar la consulta de grandes cantidades
de datos. Para ello utiliza estructuras
multidimensionales (o Cubos OLAP) que contienen
datos resumidos de grandes Bases de Datos o Sistemas
Transaccionales (OLTP). Se usa en informes de
negocios de ventas, marketing, informes de dirección,
minería de datos y áreas similares.
11. TIPOS DE SISTEMAS OLAP
ROLAP
Motor relacional. Datos detallados,
tablas normalizadas. Los esquemas más
comunes sobre los que se trabaja son estrella
ó copo de nieve
MOLAP
Base de datos multidimensional. el
resumen de la información es usualmente
calculado por adelantado.
HOLAP (Hybrid OLAP)
Almacena algunos datos en un motor
relacional y otros en una base de datos
multidimensional
13. ESQUEMA EN ESTRELLA
• Modelo de datos que tiene
una tabla de hechos (o
tabla fact) que contiene
los datos para el análisis,
rodeada de las
dimensiones estas tiene
una clave primaria
simple, mientras que en la
tabla de hechos,
la clave principal estará
compuesta por las claves
principales de las demás.
14. ESQUEMA EN COPO DE NIEVE
Un esquema en copo
de nieve es una
estructura algo más
compleja que el
esquema en estrella. Se
da cuando alguna de las
dimensiones se
implementa con más de
una tabla de datos. La
finalidad es normalizar
las tablas y así reducir el
espacio de
almacenamiento al
eliminar la redundancia
de datos
17. DATAesWAREHOUSE
Un Datawarehouse una
base de datos corporativa
que se caracteriza por
integrar y depurar
información de una o más
fuentes distintas, para luego
procesarla permitiendo su
análisis desde infinidad de
pespectivas y con grandes
velocidades de respuesta. La
creación de un
datawarehouse representa en
la mayoría de las ocasiones el
primer paso, desde el punto
de vista técnico, para
implantar una solución
completa y fiable de Business
Intelligence.
18. Los elementos básicos de un Data
WareHouse
OLAP: actividad general de búsquedas para presentación de texto y
números del Data WareHouse, también un estilo dimensional
especifico de búsquedas y presentación de información y que es
ejemplificada por vendedores de OLAP.
ROLAP: un grupo de interfases de usuarios y aplicaciones que le dan a
la base de datos relacional un estilo dimensional.
MOLAP: un grupo de interfases de usuarios, aplicaciones y
propietarios de tecnología de bases de datos que tienen un fuerte estilo
dimensional
Ad Hoc Query Tool: un tipo especifico de herramientas de acceso a
datos por usuarios finales que invita al usuario a formas sus propios
queries manipulando directamente las tablas relacionales y sus
uniones.
Modelado de aplicaciones: un sofisticado tipo de cliente de Data
WareHouse con capacidades analíticas que transforma o digiere las
20. Principales aportaciones de un datawarehouse
Proporciona una herramienta para la toma de decisiones en
cualquier área funcional, basándose en información integrada y
global del negocio.
Facilita la aplicación de técnicas estadísticas de análisis y
modelización para encontrar relaciones ocultas entre los datos
del almacén; obteniendo un valor añadido para el negocio de
dicha información.
Proporciona la capacidad de aprender de los datos del pasado y
de predecir situaciones futuras en diversos escenarios.
Simplifica dentro de la empresa la implantación de sistemas de
gestión integral de la relación con el cliente.
Supone una optimización tecnológica y económica en entornos
de Centro de Información, estadística o de generación de
informes con retornos de la inversión espectaculares
21. USOS DEL DATA WAREHOUSE
Los datos operacionales y los datos del data warehouse son
accesados por usuarios que usan los datos de maneras
diferentes.
22. USOS DEL DATA WAREHOUSE
Sólo pocos usuarios accesan a los datos concurrentemente
En contraste a la producción de sistemas que pueden manejar
cientos o miles de usuarios concurrentes, al data warehouse accesa
un limitado conjunto de usuarios en cualquier tiempo determinado.
Los usuarios generan un procesamiento no predecible
complejo
Los usuarios del data warehouse generan consultas complejas. A
veces la respuesta a una consulta conduce a la formulación de otras
preguntas más detalladas, en un proceso llamado drilling down. El
data warehouse puede incluir niveles de resúmenes múltiples,
derivado de un conjunto principal, único, de datos detallados, para
soportar este tipo de uso.
23. USOS DEL DATA WAREHOUSE
Las consultas de los usuarios accesan a cantidades grandes de datos
Debido a la necesidad de investigar tendencias y evaluar las relaciones entre
muchas clases de datos, las consultas al data warehouse permiten accesar a
volúmenes muy grandes tanto de data detallada como resumida. Debido a los
requerimientos de datos históricos, los data warehouses evolucionan para llegar
a un tamaño más grande que sus orígenes operacionales (de 10 a 100 veces más
grande).
Las consultas de los usuarios no tienen tiempos de respuesta críticos
Las transacciones operacionales necesitan una respuesta inmediata porque un
cliente puede estar esperando una respuesta. En el data warehouse, por el
contrario, tiene un requerimiento de respuesta no-crítico porque el resultado
frecuentemente se usa en un proceso de análisis y toma de decisiones. Aunque
los tiempos de respuesta no son críticos, los usuarios esperan una respuesta
dentro del mismo día en que es hecha la consulta.
25. USOS DEL DATA WAREHOUSE
Ejemplo:
Preparación de un reporte complejo
Considere un problema bastante típico en una compañía de fabricación grande
en el que se pide una información (un reporte) que no está disponible.
El informe incluye las finanzas actuales, el inventario y la condición de personal,
acompañado de comparaciones del mes actual con el anterior y el mismo mes
del año anterior, con una comparación adicional de los 3 años precedentes. Se
debe explicar cada desviación de la tendencia que cae fuera de un rango
predefinido.
Sin un data warehouse, el informe es preparado de la manera siguiente:
La información financiera actual se obtiene desde una base de datos mediante
un programa de extracción de datos, el inventario actual de otro programa de
extracción de otra base de datos, la condición actual de personal de un tercer
programa de extracción y la información histórica desde un backup de cinta
magnética o CD-ROM.
27. VENTAJAS DE DATA WAREHOUSE
Se deben considerar los siguientes beneficios empresariales potenciales:
Los Procesos de Toma de Decisiones pueden ser mejorados mediante la
disponibilidad de información. Las decisiones empresariales se hacen más rápidas por
gente más informada.
Los procesos empresariales pueden ser optimizados. El tiempo perdido esperando por
información que finalmente es incorrecta o no encontrada, es eliminada.
Procesos y datos de los sistemas operacionales, así como los datos en el Data
Warehouse, son usados y examinados.
Apenas el Data Warehouse comienza a ser fuente primaria de información empresarial
consistente, pueden comenzar a presentarse las siguientes situaciones:
La gente tiene mayor confianza en las decisiones empresariales que se toman. Ambos,
quienes toman las decisiones como los afectados conocen que está basada en buena
información.
La información compartida conduce a un lenguaje común, conocimiento común, y
mejoramiento de la comunicación en la empresa. Se mejora la confianza y cooperación
entre distintos sectores de la empresa, viéndose reducida la sectorización de funciones.
Visibilidad, accesibilidad, y conocimiento de los datos producen mayor confianza en los
sistemas operacionales.
28. Desventajas del Data Ware House
No es muy útil para la toma de decisiones en tiempo real
debido al largo tiempo de procesamiento que puede
requerir. En cualquier caso la tendencia de los productos
actuales (junto con los avances del hardware) es la de
solventar este problema convirtiendo la desventaja en una
ventaja.
Requiere de continua limpieza, transformación e
integración de datos. Mantenimiento.
En un proceso de implantación puede encontrarse
dificultades ante los diferentes objetivos que pretende una
organización.
Una vez implementado puede ser complicado añadir
nuevas fuentes de datos.
30. Operaciones en un Data
Warehouse
a) Sistemas Operacionales
Los datos administrados por los sistemas de aplicación operacionales son la fuente principal de
datos para el data warehouse.
Las bases de datos operacionales se organizan como archivos indexados (UFAS, VSAM), bases
de datos de redes/jerárquicas (I-D-S/II, IMS, IDMS) o sistemas de base de datos relacionales
(DB2, Oracle, Informix, etc.). Según las encuestas, aproximadamente del 70% a 80% de las
bases de datos de las empresas se organizan usando DBMSs no relacional.
b) Extracción, Transformación y Carga de los Datos
Se requieren herramientas de gestión de datos para extraer datos desde bases de datos y/o
archivos operacionales, luego es necesario manipular o transformar los datos antes de cargar
los resultados en el data warehouse.
Tomar los datos desde varias bases de datos operacionales y transformarlos en datos requeridos
para el depósito, se refiere a la transformación o a la integración de datos. Las bases de datos
operacionales, diseñadas para el soporte de varias aplicaciones de producción, frecuentemente
difieren en el formato.
Los mismos elementos de datos, si son usados por aplicaciones diferentes o administrados por
diferentes software DBMS, pueden definirse al usar nombres de elementos inconsistentes, que
tienen formatos inconsistentes y/o ser codificados de manera diferente. Todas estas
inconsistencias deben resolverse antes que los elementos de datos sean almacenados en el data
warehouse.
31. Operaciones en un Data
Warehouse
c) Metadata
Otro paso necesario es crear la metadata. La metadata (es decir, datos acerca de
datos) describe los contenidos del data warehouse. La metadata consiste de
definiciones de los elementos de datos en el depósito, sistema(s) del (os)
elemento(s) fuente. Como la data, se integra y transforma antes de ser
almacenada en información similar.
d) Acceso de usuario final
Los usuarios accesan al data warehouse por medio de herramientas de
productividad basadas en GUI (Graphical User Interface - Interfase gráfica de
usuario). Pueden proveerse a los usuarios del data warehouse muchos de estos
tipos de herramientas.
Estos pueden incluir software de consultas, generadores de reportes,
procesamiento analítico en línea, herramientas data/visual mining, etc.,
dependiendo de los tipos de usuarios y sus requerimientos particulares. Sin
embargo, una sola herramienta no satisface todos los requerimientos, por lo
que es necesaria la integración de una serie de herramientas.
34. ¿PORQUE CONSTRUIR BLOQUES
DE DATA WAREHOUSE?
1° Se ha reconocido los beneficios del procesamiento analítico en línea (On
Line Analytical Processing - OLAP), más allá de las áreas tradicionales de
marketing y finanzas.
Las organizaciones saben que los conocimientos inmersos en las masas de
datos que rutinariamente recogen sobre sus clientes, productos, operaciones y
actividades comerciales, contribuyen a reducir los costos de operación y
aumentar las rentas, por no mencionar que es más fácil la toma de decisiones
estratégicas.
2° El crecimiento de la computación cliente/servidor, ha creado servidores de
hardware y software más poderosos y sofisticados que nunca. Los servidores de
hoy compiten con las mainframes de ayer y ofrecen arquitecturas de memoria
tecnológicamente superiores, procesadores de alta velocidad y capacidades de
almacenamiento masivas.
Al mismo tiempo, los Sistemas de Gestión de Base de Datos (Data Base
Management Systems - DBMS(s)) modernos, proporcionan mayor soporte para
las estructuras de datos complejas.
35. CONSIDERACIONES PREVIAS AL
DESARROLLO DE UN DATA
WAREHOUSE
Hay muchas
maneras para
desarrollar data
warehouses como
tantas
organizaciones
existen. Sin
embargo, hay un
número de
dimensiones
diferentes que
necesitan ser
consideradas:
Alcance de un
data warehouse
Redundancia
de datos
Tipo de usuario
final
38. IMPLEMENTACION
En esta fase, el proyecto de data warehouse debe tener
asignado el liderazgo adecuado, así como, los recursos
humanos, recursos tecnológicos y el presupuesto
apropiado.
Sin embargo, deben evaluarse otros aspectos, como
desarrollar un proyecto en su totalidad o por fases y
además, diferenciar el tipo de proyecto a realizar