Manual Analysis Services

15,869 views

Published on

Published in: Technology
0 Comments
2 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
15,869
On SlideShare
0
From Embeds
0
Number of Embeds
6
Actions
Shares
0
Downloads
906
Comments
0
Likes
2
Embeds 0
No embeds

No notes for slide

Manual Analysis Services

  1. 1. Analysis Services <br /> TOC o " 1-5" h z u 1.Introducción PAGEREF _Toc250705174 h 3<br />1.1¿Qué es Analysis Services 2005? PAGEREF _Toc250705175 h 3<br />1.2Introducción a La Tecnología OLAP PAGEREF _Toc250705176 h 3<br />1.3Tecnología OLTP PAGEREF _Toc250705177 h 4<br />1.4Tecnología OLAP Vs. Tecnología OLTP PAGEREF _Toc250705178 h 6<br />1.5Minería de Datos PAGEREF _Toc250705179 h 6<br />1.6Unified Dimensional Model PAGEREF _Toc250705180 h 8<br />2.Objetos de Analysis Services PAGEREF _Toc250705181 h 10<br />2.1Orígenes de datos PAGEREF _Toc250705182 h 10<br />2.2Vistas de origen de datos PAGEREF _Toc250705183 h 10<br />2.3Cubos PAGEREF _Toc250705184 h 10<br />2.4Dimensiones PAGEREF _Toc250705185 h 11<br />2.5Funciones PAGEREF _Toc250705186 h 11<br />2.6Ensamblados PAGEREF _Toc250705187 h 12<br />3.Soluciones y proyectos de Analysis Services PAGEREF _Toc250705188 h 13<br />4.Procesamiento Analítico en Línea (OLAP) PAGEREF _Toc250705189 h 15<br />5.Mineria de Datos PAGEREF _Toc250705190 h 16<br />6.Programando Analysis Services PAGEREF _Toc250705191 h 17<br />6.1Referencia de expresiones multidimensionales (MDX) PAGEREF _Toc250705192 h 17<br />6.2Referencia de Extensiones de minería de datos (DMX) PAGEREF _Toc250705193 h 17<br />7.Administrar Analysis Services PAGEREF _Toc250705194 h 18<br />Introducción<br />¿Qué es Analysis Services 2005?<br />Microsoft SQL Server 2005 Analysis Services proporciona funciones de procesamiento analítico en línea (OLAP) y minería de datos para aplicaciones de Business Intelligence (BI). Analysis Services admite OLAP al permitirle diseñar, crear y administrar estructuras multidimensionales que contienen datos agregados desde otros orígenes de datos, por ejemplo bases de datos relacionales.<br />Introducción a La Tecnología OLAP<br />Los almacenes y puestos de datos son los almacenes donde se analizan los datos, el Proceso analítico en línea (OLAP) es la tecnología que permite a las aplicaciones de cliente el acceso eficiente a estos datos. OLAP proporciona muchas ventajas a los usuarios que realizan análisis, por ejemplo:<br />• Un modelo de datos intuitivo y multidimensional que facilita la selección, recorrido y exploración de los datos.<br />• Un lenguaje analítico de consulta que proporciona la capacidad de explorar las complejas relaciones existentes entre los datos empresariales.<br />• Un precálculo de los datos consultados con más frecuencia que permite una rápida respuesta a las consultas ad hoc.<br />Una de las herramientas que incluyen el procesamiento analítico en línea (OLAP) y la Minería de datos más utilizadas es Microsoft SQL Server Analysis Services, el contenido del curso se desarrollará usando esta herramienta, a continuación estudiaremos los conceptos principales de esta tecnología.<br />Se pueden considerar los sistemas OLAP (On Line Analytical Processing) como pertenecientes a los sistemas de información para ejecutivos, EIS, utilizados para proporcionar al nivel estratégico información útilpara la toma de decisiones.<br />En un modelo de datos OLAP, la información es vista como cubos, los cuales consisten de categorías descriptivas (dimensiones) y valores cuantitativos (medidas). El modelo de datos multidimensional simplifica a los usuarios formular consultas complejas, arreglar datos en un reporte, cambiar de datos resumidos a datos detallados y filtrar o rebanar los datos en subconjuntos significativos.<br />Por ejemplo, las dimensiones típicas de un cubo que contenga información de ventas incluirían: tiempo, región, producto, canal, organización y escenario (planeado o real). Las medidas típicas incluirían: ventas en dólares (u otra moneda), unidades vendidas, número de personas, ingresos y gastos.<br />Aunque en ocasiones se utilizan indistintamente, los términos almacén de datos y proceso analítico en línea (OLAP, Online Analytical Processing) se aplican a diferentes componentes de sistemas conocidos como sistemas de ayuda a la toma de decisiones o sistemas de inteligencia empresarial. Los componentes de estos tipos de sistemas incluyen bases de datos y aplicaciones que proporcionan las herramientas que necesitan los analistas para tomar decisiones en relación con el soporte técnico de la organización.<br />Un almacén de datos es una base de datos que contiene la información que, normalmente, representa el historial empresarial de una organización. Estos datos históricos se utilizan para realizar análisis que apoyen las decisiones empresariales a diferentes niveles, desde el diseño estratégico a la evaluación del rendimiento de una unidad determinada de la organización. Los datos contenidos en un almacén de datos se encuentran organizados para permitir el análisis más que para procesar transacciones en tiempo real como ocurre en los sistemas de proceso de transacciones en línea (OLTP, Online Transaction Processing).<br />La tecnología OLAP permite un uso más eficaz de los almacenes de datos para el análisis en línea, lo que proporciona respuestas rápidas a consultas analíticas complejas e iterativas. Los modelos de datos multidimensionales de OLAP y las técnicas de agregados de datos organizan y resumen grandes cantidades de datos para que puedan ser evaluados con rapidez mediante el análisis en línea y las herramientas gráficas. La respuesta a una consulta realizada sobre datos históricos a menudo suele conducir a consultas posteriores en las que el analista busca respuestas más concretas o explora posibilidades. Los sistemas OLAP proporcionan la velocidad y la flexibilidad necesarias para dar apoyo al analista en tiempo real.<br />Cabe indicar que la Tecnología OLAP tiene como base el proceso de transacciones en línea (OLTP). A continuación veremos una breve definición del concepto OLTP y sus diferencias marcadas con la tecnología OLAP que desarrollaremos en el curso.<br />Tecnología OLTP<br />En muchas ocasiones, un almacén de datos se utiliza como el fundamento de un sistema de ayuda para la toma de decisiones. Los almacenes de datos se han diseñado para superar algunos de los problemas que una organización encuentra cuando intenta realizar un análisis estratégico mediante la misma base de datos que utiliza para realizar el proceso de transacciones en línea (OLTP).<br />Normalmente, los sistemas OLTP:<br />• Admiten el acceso simultáneo de muchos usuarios que agregan y modifican datos.<br />• Representan el estado, en cambio constante, de una organización, pero no guardan su historial.<br />• Contienen grandes cantidades de datos, incluidos los datos extensivos utilizados para comprobar transacciones.<br />• Tienen estructuras complejas.<br />• Se ajustan para dar respuesta a la actividad transaccional.<br />• Proporcionan la infraestructura tecnológica necesaria para admitir las operaciones diarias de la empresa.<br />A continuación se enumeran algunas de las dificultades que se suelen encontrar al utilizar bases de datos OLTP para realizar análisis en línea:<br />• Los analistas carecen de la experiencia técnica necesaria para crear consultas " ad hoc" contra la compleja estructura de datos.<br />• Las consultas analíticas que resumen grandes volúmenes de datos afectan negativamente a la capacidad del sistema para responder a las transacciones en línea.<br />• El rendimiento del sistema cuando está respondiendo a consultas analíticas complejas puede ser lento o impredecible, lo que causa un servicio poco eficiente a los usuarios del proceso analítico en línea.<br />• Los datos que se modifican con frecuencia interfieren en la coherencia de la información analítica.<br />• La seguridad se complica cuando se combina el análisis en línea con el proceso de transacciones en línea.<br />El almacén de datos proporciona una de las claves para resolver estos problemas al organizar los datos para analizarlos. Los almacenes de datos:<br />• Pueden combinar datos de orígenes heterogéneos en una única estructura homogénea.<br />• Organizan los datos en estructuras simplificadas buscando la eficiencia de las consultas analíticas más que del proceso de transacciones.<br />• Contienen datos transformados que son válidos, coherentes, consolidados y con el formato adecuado para realizar el análisis.<br />• Proporcionan datos estables que representan el historial de la empresa<br />Se actualizan periódicamente con datos adicionales, no con transacciones frecuentes.<br />• Simplifican los requisitos de seguridad.<br />• Proporcionan una base de datos organizada para OLAP, no para OLTP.<br />Un puesto de datos es un formato especial de almacén de datos que suele contener un subconjunto de datos de la empresa orientado a un tema determinado y apropiado para una función empresarial específica.<br />Tecnología OLAP Vs. Tecnología OLTP<br />Los doce errores más comunes en la construcción de un datawarehouse son:<br />Error 12: Incluir atributos de texto en una tabla de hechos, si se hace con la intención de filtrar o agrupar.<br />Error 11: Abreviar las descripciones en las tablas de dimensión con la intención de reducir el espacio requerido.<br />Error 10: Dividir las jerarquías y los niveles de las jerarquías en múltiples dimensiones.<br />Error 9: No afrontar el tratamiento de las dimensiones lentamente cambiantes.<br />Error 8: Crear “smart keys” para relacionar una tabla de dimensión con una tabla de hechos.<br />Error 7: Añadir dimensiones en una tabla de hechos antes de definir su granularidad.<br />Error 6: Crear un modelo dimensional para resolver un informe en particular.<br />Error 5: Mezclar hechos de diferente granularidad en una misma tabla de hechos.<br />Error 4: Olvidarse del máximo nivel de detalle en el modelo entidad-relación.<br />Error 3: Omitir las tablas agregadas y comprimir las tablas de dimensión para afrontar los problemas de rendimiento.<br />Error 2: No unificar los hechos entre distintas tablas de hechos<br />Error 1: No compartir dimensiones entre diferentes tablas de hechos.<br />Minería de Datos<br />Data Mining constituye un miembro clave del Business Intelligence (BI) y permite analizar datos, hallando patrones escondidos, de manera automática o semi-automatica. En lo que va del tiempo muchas empresas han acumulado una gran cantidad de datos en sus bases de datos, el resultado de esta colección de datos es que las organizaciones tienen “datos ricos” pero “pobre conocimiento”.<br />El propósito principal de la Mineria de Datos (Data Mining) es extraer de los datos patrones, incrementar su valor intrínseco y transformar la data en conocimiento.<br />El DM proporciona un enorme valor a las organizaciones. En estos tiempos el DM puede implementarse con más transparencia:<br />Gran cantidad de data disponible: las organizaciones llegaron a implementar sistemas transaccionales (ventas, almacenes, producción, personal, contabilidad, etc) y estos en el tiempo han ido almacenando información aunado a la baja de los costos de almacenamiento han acumulado grandes volúmenes de datos.<br />Alto nivel de competencia: la competencia actualmente es alta como resultado de marketing moderno y canales de distribución como internet y comunicaciones, así como la participación de corporaciones nacionales y extranjeras en el mercado. En este 2008 en nuestra ciudad Trujillo estamos siendo testigos de la aparición de 2 malls con una infraestructura bastante atractiva para los clientes, por mencionar un ejemplo de competencia.<br />Tecnología Lista: el DM anteriormente era mayormente una solución de laboratorio, ahora ya es una tecnología madura y está lista para ser aplicada en las organizaciones. Los algoritmos y el equipamiento existente son más eficientes para trabajar con data complicada si fuera el caso. Las API del DM están estandarizándose cada vez más amplitud y esto permite a los desarrolladores construir aplicaciones.<br />Son varios los objetos que intervienen en la minería de datos en Microsoft SQL Server 2005 Analysis Services (SSAS). Los dos objetos principales que se utilizan son:<br />Estructura de minería de datos <br />La estructura de minería de datos es una estructura de datos que define el dominio de datos a partir del cual se generan los modelos de minería de datos. Una única estructura de minería de datos puede contener varios modelos de minería de datos que comparten el mismo dominio. <br />Las unidades de creación de la estructura de minería de datos son las columnas de la estructura de minería de datos, que describen los datos que contiene el origen de datos. Estas columnas contienen información como el tipo de datos, el tipo de contenido y el modo en que se distribuyen los datos. <br />Una estructura de minería de datos también puede contener tablas anidadas. Una tabla anidada representa una relación de uno a varios entre la entidad de un escenario y sus atributos relacionados. Por ejemplo, si la información que describe al cliente se encuentra en una tabla y las compras del cliente en otra, puede utilizar tablas anidadas para combinar la información en un único escenario. El identificador del cliente es la entidad y las compras son los atributos relacionados. <br />La estructura de minería de datos no contiene información sobre el modo en que las columnas se utilizan para un modelo de minería de datos concreto, ni sobre el tipo de algoritmo que se utiliza para generarlo; esta información se define en el propio modelo de minería de datos.<br />Modelo de minería de datos <br />Un modelo de minería de datos aplica un algoritmo de modelo de minería de datos a los datos que representa una estructura de minería de datos. Al igual que la estructura de minería de datos, el modelo de minería de datos contiene columnas. Un modelo de minería de datos está contenido en la estructura de minería de datos y hereda todos los valores de las propiedades definidas por la estructura de minería de datos. El modelo puede utilizar todas las columnas de la estructura de minería de datos o un subconjunto de las mismas.<br />Además de los parámetros que se definen en la estructura de minería de datos, el modelo de minería de datos contiene dos propiedades: Algorithm y Usage. El parámetro lgorithm se define en el modelo de minería de datos y el parámetro sage en la columna del modelo de minería de datos. Estos parámetros se describen en la siguiente tabla.<br />Algorithm: Propiedad del modelo que define el algoritmo que se utiliza para crearlo.<br />Usage: Propiedad de la columna del modelo que define el modo en que el modelo utiliza una columna. Puede definir las columnas de modo que sean columnas de entrada, de clave o de predicción. <br />Un modelo de minería de datos es simplemente un objeto vacío hasta que se procesa. Al procesar un modelo, los datos que define la estructura se pasan por el algoritmo. El algoritmo identifica las reglas y los patrones en los datos y, después, utiliza dichas reglas y patrones para rellenar el modelo. <br />Una vez procesado un modelo, puede explorarlo utilizando los visores personalizados que se incluyen en Business Intelligence Development Studio y SQL Server Management Studio, o realizando consultas al modelo para llevar a cabo predicciones.<br />Puede crear varios modelos basados en la misma estructura. Todos los modelos generados a partir de la misma estructura deben proceder del mismo origen de datos. No obstante, los modelos puede diferir en lo que respecta a qué columnas de la estructura se van a usar, el modo en que se van a usar, el tipo de algoritmo que se emplea para crear cada modelo y la configuración de los parámetros de cada algoritmo. Por ejemplo, puede generar modelos de árbol de decisión o de clústeres independientes, cada uno con columnas diferentes de la estructura y utilizado para llevar a cabo diferentes tareas empresariales.<br />Unified Dimensional Model<br />Un usuario que desee recuperar información directamente de un origen de datos, como una base de datos de ERP (Planeamiento de recursos de empresa), se enfrenta a varios retos importantes:<br />Con frecuencia, resulta difícil comprender el contenido de estos orígenes de datos, ya que están diseñados desde la perspectiva de los sistemas y los programadores, en lugar de los usuarios finales. <br />La información interesante para el usuario se distribuye generalmente en varios orígenes de datos heterogéneos. Aunque sólo se manejen distintas bases de datos relacionales, el usuario debe comprender los detalles de cada una, como el dialecto de SQL que se utiliza. Además, los orígenes de datos pueden ser de tipos muy distintos, ya que no sólo incluyen bases de datos relacionales, sino también archivos y servicios Web. <br />Mientras que muchos orígenes de datos están concebidos para contener una gran cantidad de detalles de los niveles de transacción, con frecuencia las consultas que admiten la toma de decisiones corporativas precisan información agregada y de resumen. Al aumentar el volumen de datos, el tiempo necesario para recuperar los valores de resumen para un análisis de un usuario final interactivo puede ser prohibitivo. <br />Por lo general, las reglas de negocios no están encapsuladas en los orígenes de datos. Los usuarios deben realizar su propia interpretación de los datos.<br />La función de un modelo UDM (Unified Dimensional Model) es aproximar los orígenes de datos al usuario. Un UDM se genera a partir de uno o varios orígenes de datos físicos. El usuario emite consultas en el UDM mediante diversas herramientas de cliente, como Microsoft Excel.<br />Existen ventajas para el usuario final aun cuando el modelo UDM sólo se genere como una fina capa sobre el origen de datos: un modelo de datos más sencillo y más fácil de comprender, el aislamiento de orígenes de datos de servidor heterogéneos y un rendimiento mejorado para las consultas de tipo de resumen. En algunos escenarios, un modelo UDM simple se puede generar automáticamente. Una mayor inversión en la generación del modelo UDM puede generar ventajas adicionales por la gran cantidad de metadatos que puede proporcionar el modelo.<br />El modelo UDM proporciona las siguientes ventajas:<br />Mejora notablemente el modelo del usuario.<br />Proporciona consultas de alto rendimiento que admiten un análisis interactivo, incluso con grandes volúmenes de datos.<br />Captura las reglas de negocio del modelo para proporcionar un análisis mejorado.<br />Admite " cerrar el ciclo" , lo que permite que los usuarios actúen según los datos que ven. <br />Objetos de Analysis Services<br />Orígenes de datos<br />Un origen de datos de Microsoft SQL Server 2005 Analysis Services (SSAS) representa una conexión a un origen de datos y contiene la cadena de conexión que define el modo en que Analysis Services conecta con un almacén de datos físico mediante un proveedor Microsoft .NET Framework administrado o un proveedor OLE DB nativo. La cadena de conexión contiene información sobre el nombre del servidor, la base de datos, la seguridad, el tiempo de espera y otra relacionada con la conexión. Analysis Services admite directamente muchos orígenes de datos. Entre los orígenes de datos admitidos se incluyen las bases de datos de Microsoft SQL Server y las creadas mediante otros productos, como Oracle, DB2 y Teradata.<br />Vistas de origen de datos<br />Una vista de origen de datos contiene el modelo lógico del esquema que utilizan los objetos de las bases de datos de Analysis Services: cubos, dimensiones y estructuras de minería de datos. Una vista de origen de datos es la definición de metadatos, almacenada en formato XML, de estos elementos de esquema que utilizan el modelo UDM (Unified Dimensional Model) y las estructuras de minería de datos. Una vista de origen de datos:<br />Contiene los metadatos que representan objetos seleccionados a partir de uno o más orígenes de datos subyacentes, o bien los metadatos que se utilizarán para generar un almacén de datos relacional subyacente<br />Se puede generar con uno o más orígenes de datos, lo que permite definir objetos OLAP y de minería de datos que integren datos de varios orígenes.<br />Puede contener relaciones, claves principales, nombres de objeto, columnas calculadas y consultas que no están presentes en un origen de datos subyacente y que son independientes de los orígenes de datos subyacentes.<br />No está visible ni disponible para que las aplicaciones cliente realicen consultas.<br />La vista de origen de datos le ofrece flexibilidad a la hora de crear objetos en SQL Server 2005 Analysis Services (SSAS), SQL Server 2005 Integration Services (SSIS) y SQL Server 2005 Reporting Services (SSRS), dado que los objetos de bases de datos Analysis Services están vinculados a los objetos lógicos contenidos en la vista de origen de datos en lugar de estar directamente vinculados a los objetos físicos subyacentes definidos en el origen de datos subyacente. Por lo tanto, el usuario puede definir objetos lógicos, como columnas calculadas o consultas con nombre, que no existen en un origen de datos subyacente y a los que es posible que no tenga permisos para definir en un origen de datos subyacente.<br />Cubos<br />Un cubo es un conjunto de medidas y dimensiones relacionadas que se usa para analizar datos. <br />Una medida es un hecho, que es un valor o medida transaccional que un usuario podría desear agregar. Las medidas se obtienen de las columnas de una o varias tablas de origen y se agrupan en grupos de medida.<br />Una dimensión es un grupo de atributos que representa un área de interés relacionada con las medidas del cubo y que se usan para analizar las medidas del cubo. Por ejemplo, una dimensión Customer podría tener los atributos Customer Name, Customer Gender y Customer City, lo que permitiría que Customer Name, Customer Gender y Customer City analizaran las medidas del cubo. Los atributos se obtienen de las columnas de una o varias tablas de origen. Los atributos de cada dimensión se pueden organizar en jerarquías para proporcionar rutas para el análisis. <br />Un cubo se aumenta con cálculos, indicadores clave de rendimiento (KPI), acciones, particiones, perspectivas y traducciones. Los cubos son esencialmente sinónimos de un modelo UDM (Unified Dimensional Model). En Microsoft SQL Server 2005 Analysis Services (SSAS), los cubos se desarrollan en función de tablas y vistas modeladas en una vista de origen de datos. <br />Los cubos pueden desarrollarse con o sin un origen de datos relacional subyacente. <br />Los hechos de un cubo se agregan a todas las dimensiones, en función de las jerarquías de dimensiones. <br />Dimensiones<br />En Microsoft SQL Server 2005 Analysis Services (SSAS), las dimensiones constituyen un componente fundamental de los cubos. Las dimensiones organizan los datos en función de un área de interés para los usuarios, por ejemplo clientes, almacenes o empleados. Las dimensiones en Analysis Services contienen atributos que corresponden a columnas de tablas de dimensiones. Estos atributos aparecen como jerarquías de atributo y se pueden organizar en jerarquías definidas por el usuario, o bien se pueden definir como jerarquías de elementos primarios y secundarios basadas en columnas en la tabla de dimensiones subyacente. Las jerarquías se utilizan para organizar las medidas incluidas en un cubo.<br />Funciones<br />Las funciones se utilizan en Microsoft SQL Server 2005 Analysis Services (SSAS) para administrar la seguridad de los objetos y datos de Analysis Services. En términos simples, una función asocia los identificadores de seguridad (SID) de usuarios y grupos de Microsoft Windows que tienen derechos y permisos de acceso específicos a los objetos administrados por una instancia de Analysis Services. En Analysis Services se incluyen dos tipos de funciones: <br />La función del servidor, que es una función fija que proporciona acceso de administrador a una instancia de Analysis Services.<br />Las funciones de base de datos, que son funciones definidas por los administradores para controlar el acceso a los objetos y datos de los usuarios que no son administradores.<br />Función del servidor <br />La función del servidor de Analysis Services define el acceso administrativo de los usuarios y grupos de Windows a una instancia de Analysis Services. Los miembros de esta función tienen acceso a todas las bases de datos y objetos de Analysis Services en una instancia de Analysis Services y pueden realizar las siguientes tareas: <br />Realizar funciones administrativas de nivel de servidor utilizando SQL Server Management Studio o Business Intelligence Development Studio, incluida la creación de bases de datos y la configuración de propiedades de nivel de servidor.<br />Realizar funciones administrativas mediante programación con Objetos de administración de Análisis (AMO).<br />Mantener las funciones de base de datos de Analysis Services.<br />Iniciar trazas (distintas de eventos de procesamiento, que puede realizar una función de base de datos con acceso de proceso).<br />Cada instancia de Analysis Services tiene una función de servidor que define qué usuarios pueden administrar la instancia. El nombre e Id. de esta función es Administradores y, a diferencia de las funciones de base de datos, no puede eliminarse la función del servidor ni pueden agregarse ni quitarse permisos. En otras palabras, un usuario puede o no ser un administrador para una instancia de Analysis Services, según esté incluido en la función del servidor de la instancia de Analysis Services. <br /> Funciones de base de datos <br />Una función de base de datos de Analysis Services define el acceso de usuario a los objetos y datos de una base de datos de Analysis Services. Una función de base de datos se crea como objeto independiente en una base de datos de Analysis Services y sólo se aplica a la base de datos en la que se crea la función. El administrador incluye los usuarios y grupos de Windows en la función y también define los permisos de la función. <br />Los permisos de una función pueden permitir a los miembros obtener acceso y administrar la base de datos, además de los objetos y los datos de la misma. Cada permiso tiene uno o más derechos de acceso asociados, que a su vez proporcionan al permiso más control sobre el acceso a un objeto específico de la base de datos.<br />Ensamblados<br />Microsoft SQL Server 2005 Analysis Services (SSAS) proporciona gran cantidad de funciones intrínsecas que se pueden utilizar con los lenguajes MDX (Expresiones multidimensionales) y DMX (Extensiones de minería de datos), diseñados para realizar multitud de tareas, desde el cálculo estadístico estándar hasta recorridos de miembros de una jerarquía. No obstante, al igual que con cualquier otro producto complejo, existe siempre la necesidad de ampliar la funcionalidad. <br />Por lo tanto, Analysis Services permite agregar ensamblados a una instancia o base de datos de Analysis Services. Los ensamblados permiten crear funciones externas definidas por el usuario mediante cualquier lenguaje CLR (Common Language Runtime), como por ejemplo Microsoft Visual Basic .NET o Microsoft Visual C#. También puede utilizar lenguajes de automatización COM (Modelo de objetos componentes), como Microsoft Visual Basic o Microsoft Visual C++.<br />Los ensamblados le permiten ampliar la funcionalidad empresarial de MDX y DMX. Cree la funcionalidad que desee en una biblioteca, como por ejemplo una biblioteca de vínculos dinámicos (DLL), y agregue la biblioteca como ensamblado a una instancia de Analysis Services o a una base de datos de Analysis Services. Los métodos públicos de la biblioteca se ofrecerán como funciones definidas por el usuario a procedimientos, cálculos, acciones, aplicaciones cliente y expresiones de MDX y DMX. <br />Soluciones y proyectos de Analysis Services<br />Microsoft SQL Server 2005 ofrece dos entornos diferentes para crear, implementar y administrar soluciones de Analysis Services: Business Intelligence Development Studio y SQL Server Management Studio. Estos entornos implementan un sistema de proyectos que refleja el principal propósito de la herramienta. <br />Business Intelligence Development Studio es un entorno de desarrollo basado en Microsoft Visual Studio 2005 que se emplea para crear y modificar soluciones de Business Intelligence. Con Business Intelligence Development Studio, se pueden crear proyectos de Analysis Services que contienen definiciones de objetos de Analysis Services (cubos, dimensiones,etc.), que se almacenan en archivos XML que contienen elementos ASSL (Analysis Services Scripting Language). Estos proyectos se incluyen en soluciones que a su vez pueden contener proyectos de otros componentes de SQL Server, incluidos SQL Server 2005 Integration Services (SSIS) y SQL Server 2005 Reporting Services (SSRS). En Business Intelligence Development Studio, puede desarrollar proyectos de Analysis Services como parte de una solución independiente de cualquier instancia de Analysis Services concreta. Puede implementar los objetos en una instancia de un servidor de pruebas para realizar comprobaciones durante el desarrollo y, a continuación, utilizar el mismo proyecto de Analysis Services para implementar los objetos en instancias de uno o más servidores de ensayo o de producción. Los proyectos y elementos de una solución que incluya Analysis Services, Integration Services y Reporting Services se pueden integrar con control de código fuente, como Microsoft Visual SourceSafe. <br />También puede usar Business Intelligence Development Studio para conectar directamente con una instancia existente de Analysis Services a fin de crear y modificar objetos de Analysis Services, sin necesidad de trabajar con un proyecto ni de almacenar definiciones de objeto en archivos XML.<br />SQL Server Management Studio es un entorno de administración basado en Visual Studio 2005 que se usa principalmente para administrar instancias de Analysis Services, SQL Server, Integration Services y Reporting Services. Con SQL Server Management Studio, puede administrar objetos de Analysis Services (realizar copias de seguridad, procesar, etc.), así como crear objetos nuevos directamente en una instancia de Analysis Services existente utilizando secuencias de comandos XML. SQL Server Management Studio proporciona un proyecto de secuencias de comandos de Analysis Server en el que puede programar y guardar las secuencias de comandos escritas en expresiones MDX (Expresiones multidimensionales), Extensiones de minería de datos (DMX) y XML for Analysis (XMLA). Normalmente, los proyectos de secuencias de comandos de Analysis Server se utilizan para llevar a cabo tareas de administración o para volver a crear objetos, como bases de datos o cubos, en instancias de Analysis Services. Estos proyectos se pueden guardar como parte de una solución e integrarlos con un control de código fuente.<br />Tanto Business Intelligence Development Studio como SQL Server Management Studio proporcionan proyectos que están organizados en soluciones. Una solución puede contener varios proyectos y un proyecto normalmente contiene varios elementos. Al crear un proyecto se genera automáticamente una nueva solución; puede agregar proyectos adicionales a una solución a medida que los vaya necesitando. Los objetos que contiene un proyecto dependen del tipo de proyecto. Los elementos de cada contenedor de proyectos se guardan como archivos en las carpetas de proyecto del sistema de archivos. <br />Business Intelligence Development Studio contiene los siguientes proyectos en el tipo de proyecto Proyectos de Business Intelligence. <br />Proyecto Descripción Proyecto de Analysis ServicesContiene las definiciones de objeto de una única base de datos de Analysis Services. Importar base de datos de Analysis Services 9.0Proporciona un asistente que se puede utilizar para crear un nuevo proyecto de Analysis Services importando definiciones de objeto de una base de datos de Analysis Services existente. Use este proyecto para crear un proyecto a partir de una base de datos de migración de SQL Server 2000 Analysis Services o una base de datos de Analysis Services que SQL Server Management Studio o Business Intelligence Development Studio haya modificado directamente.Proyecto de Integration ServicesContiene las definiciones de objeto de un conjunto de paquetes de Integration Services.Asistente de proyectos de informesProporciona un asistente que le guía en el proceso de creación de un proyecto de informe con Reporting Services.Proyecto de modelos de informeContiene las definiciones de objeto de un modelo de informe de Reporting Services..Proyecto de informeContiene las definiciones de objeto de uno o más informes de Reporting Services.<br />SQL Server Management Studio también contiene una serie de tipos de proyectos, cada uno de ellos centrado en diferentes tipos de consultas o secuencias de comandos, como se muestra en la siguiente tabla. <br />Proyecto Descripción Secuencias de comandos de Analysis ServicesContiene secuencias de comandos DMX, MDX y XMLA para Analysis Services, así como conexiones con instancias de Analysis Services en las que se pueden ejecutar dichas secuencias de comandos.Secuencias de comandos de SQL Server 2005 Compact EditionContiene secuencias de comandos SQL para SQL Server Compact Edition, así como conexiones con instancias de SQL Server 2005 Compact Edition en las que se pueden ejecutar dichas secuencias de comandos.Secuencias de comandos de SQL ServerContiene secuencias de comandos Transact-SQL y XQuery para una instancia de SQL Server 2005 Database Engine (Motor de base de datos de SQL Server 2005), así como conexiones con instancias de SQL Server Database Engine (Motor de base de datos de SQL Server) en las que se pueden ejecutar dichas secuencias de comandos. <br />Procesamiento Analítico en Línea (OLAP)<br />El procesamiento analítico en línea (OLAP) le permite obtener acceso a datos organizados y agregados de orígenes de datos empresariales, como por ejemplo almacenamientos de datos, en una estructura multidimensional denominada cubo. Microsoft SQL Server 2005 Analysis Services (SSAS) proporciona herramientas y características para OLAP que puede utilizar para diseñar, implementar y mantener cubos y otros objetos compatibles. <br />Trabajar en modo de proyecto o en modo en línea <br />Puede definir y crear instancias de objetos OLAP directamente en una base de datos de Analysis Services (se denomina modo en línea o, a veces, modo de conexión directa) o en un proyecto de Analysis Services (se denomina modo de proyecto). Normalmente, desarrollará la solución OLAP en un proyecto de Analysis Services. <br />Trabajar con esquemas relacionales <br />Por lo general, los objetos OLAP se definen a partir de un origen de datos existente, por ejemplo un almacén de datos o una base de datos de producción. Con todo, también puede definir objetos OLAP sin un origen de datos y, después, hacer que el Asistente para generar esquemas cree el esquema relacional subyacente a partir de objetos OLAP definidos en un proyecto de Analysis Services. <br />Definir y configurar dimensiones, atributos y jerarquías <br />Las dimensiones, atributos y jerarquías son objetos OLAP que se definen y configuran en el nivel de base de datos de Analysis Services. Estos objetos OLAP son independientes de los cubos OLAP y se pueden usar en uno o varios cubos. En cierta medida, estos objetos se pueden personalizar en cada cubo. <br />Definir y configurar cubos y propiedades de cubo <br />Los cubos son objetos OLAP que se componen de medidas y dimensiones relacionadas que se configuran en una base de datos de Analysis Services. Puede definir y configurar varios cubos en una única base de datos; y cada cubo puede usar algunas de las mismas dimensiones o todas ellas. También puede definir un solo cubo que contenga varios grupos de medida en la misma base de datos en lugar de definir cubos independientes. Al definir un cubo con varios grupos de medida, debe definir cómo se relacionan las dimensiones con cada grupo de medida y personalizar, según corresponda, los objetos de dimensión de cada cubo y grupo de medida. Al definir un cubo, también se definen propiedades avanzadas del mismo: cálculos, KPI, acciones, particiones, agregaciones, perspectivas y traducciones.<br /> <br />Mineria de Datos<br />La minería de datos le da acceso a la información que necesita para tomar decisiones inteligentes sobre complejos problemas empresariales. Microsoft SQL Server 2005 Analysis Services (SSAS) ofrece herramientas para la minería de datos con las cuales puede identificar reglas y patrones en los datos, y así determinar las razones por las que suceden las cosas y predecir lo que puede pasar en el futuro. Cuando se crea una solución de minería de datos en Analysis Services, primero se crea un modelo que describe el problema y después se procesan los datos mediante un algoritmo que genera un modelo matemático de ellos, un proceso que se conoce como entrenamiento del modelo. A continuación, puede explorar visualmente el modelo de minería de datos o crear consultas de predicción en él. Analysis Services puede utilizar conjuntos de datos a partir de bases de datos relacionales u OLAP, e incluye una variedad de algoritmos que se pueden usar para analizar estos datos<br />El objetivo principal de la mayoría de los proyectos de minería de datos es usar un modelo de minería de datos para crear predicciones. Después de explorar y comparar modelos de minería de datos, puede utilizar una de las diferentes herramientas de creación de predicciones. Analysis Services ofrece un lenguaje de consulta denominado Extensiones de minería de datos (DMX) que es la base para la creación de predicciones. Para ayudar a generar consultas de predicción DMX, SQL Server proporciona un generador de consultas, disponible en SQL Server Management Studio y Business Intelligence Development Studio, y plantillas DMX para el editor de consultas de Management Studio. Dentro de BI Development Studio, puede obtener acceso al generador de consultas desde la ficha Predicción de modelo de minería de datos del Diseñador de minería de datos.<br />Analysis Services ofrece varias herramientas para trabajar con minería de datos mediante programación. El lenguaje DMX (Extensiones de minería de datos) ofrece instrucciones para crear, entrenar y usar los modelos de minería de datos. También puede llevar a cabo estas tareas mediante una combinación de XML for Analysis (XMLA) y ASSL (Lenguaje de secuencias de comandos de Analysis Services), o bien usando Objetos de administración de análisis (AMO).<br />Puede tener acceso a todos los metadatos asociados con la minería de datos utilizando conjuntos de filas de esquema de minería de datos. Por ejemplo, puede usar conjuntos de filas de esquema para determinar los tipos de datos que admite un algoritmo o los nombres de los modelos que existen en una base de datos.<br />Programando Analysis Services<br />Referencia de expresiones multidimensionales (MDX)<br />Expresiones multidimensionales (MDX) es el lenguaje de consulta que se utiliza para trabajar con datos multidimensionales y para recuperarlos en Microsoft SQL Server 2005 Analysis Services (SSAS). MDX está basado en la especificación XML for Analysis (XMLA), con extensiones específicas para SQL Server 2005 Analysis Services. MDX utiliza expresiones compuestas de identificadores, valores, instrucciones, funciones y operadores que Analysis Services puede evaluar para recuperar un objeto (por ejemplo, un conjunto o un miembro) o un valor escalar (por ejemplo, una cadena o un número). <br />Las consultas y expresiones MDX de SQL Server 2005 Analysis Services se utilizan para lo siguiente:<br />Devolver datos a una aplicación cliente desde un cubo de SQL Server 2005 Analysis Services.<br />Aplicar formato a los resultados de las consultas.<br />Realizar tareas de diseño de cubos, como la definición de miembros calculados, conjuntos con nombre, asignaciones con ámbito e indicadores clave de rendimiento (KPI).<br />Realizar tareas administrativas, incluida la seguridad de dimensión y de celda.<br />MDX es superficialmente similar en muchos aspectos a la sintaxis SQL, que se suele utilizar con bases de datos relacionales. Sin embargo, MDX no es una extensión del lenguaje SQL y es diferente de SQL en muchos aspectos. Para crear expresiones MDX utilizadas para diseñar o proteger cubos, o para crear consultas MDX que devuelvan y apliquen formato a los datos multidimensionales, debe comprender los conceptos básicos de MDX y el modelado dimensional, los elementos de sintaxis MDX, los operadores MDX, las instrucciones MDX y las funciones MDX. <br />Referencia de Extensiones de minería de datos (DMX)<br />Extensiones de minería de datos (DMX) es un lenguaje que sirve para crear y trabajar con modelos de minería de datos en Microsoft SQL Server 2005 Analysis Services (SSAS). <br />Puede usar DMX para crear la estructura de modelos de minería de datos nuevos, para entrenar esos modelos y para explorar, administrar y realizar predicciones con ellos. DMX se compone de instrucciones de lenguaje de definición de datos (DDL), instrucciones de lenguaje de manipulación de datos (DML), y funciones y operadores.<br />Puede usar instrucciones DMX para crear, procesar, eliminar, copiar, examinar y realizar predicciones con modelos de minería de datos. Hay dos tipos de instrucciones en DMX: instrucciones para la definición de datos e instrucciones para la manipulación de datos. Cada tipo de instrucción lleva a cabo distintos tipos de tareas.<br />Puede realizar las siguientes tareas con las instrucciones de definición de datos de DMX:<br />Crear una estructura de minería de datos con la instrucción CREATE MINING STRUCTURE y agregar un modelo de minería de datos a la estructura de minería de datos con la instrucción ALTER MINING STRUCTURE. <br />Crear un modelo de minería de datos y su estructura de minería de datos asociada de forma simultánea con la instrucción CREATE MINING MODEL para generar un objeto de modelo de minería de datos vacío.<br />Exportar a un archivo un modelo de minería de datos y su estructura de minería de datos asociada con la instrucción EXPORT. Importar un modelo de minería de datos y su estructura de minería de datos asociada desde un archivo creado con la instrucción EXPORT mediante la instrucción IMPORT.<br />Copiar la estructura de un modelo de minería de datos en un modelo nuevo y entrenarla con los mismos datos con la instrucción SELECT INTO.<br />Quitar completamente un modelo de minería de datos de una base de datos con la instrucción DROP MINING MODEL. Quitar completamente una estructura de minería de datos y todos sus modelos de minería de datos asociados de una base de datos con la instrucción DROP MINING STRUCTURE.<br />Administrar Analysis Services<br />La administración de Microsoft SQL Server 2005 Analysis Services (SSAS) incluye la administración de todas las instancias mediante el mantenimiento de la seguridad óptima, la implementación, la copia de seguridad y restauración de las bases de datos, el procesamiento de objetos, la automatización de tareas y la supervisión de la actividad de una instancia de Analysis Services.<br />Administrar y mantener Analysis Services<br />La administración de una instancia de Microsoft SQL Server 2005 Analysis Services (SSAS) se compone de la administración del propio servicio Analysis Services, el establecimiento de las propiedades de configuración de Analysis Services, la administración del almacenamiento de datos utilizando particiones locales y remotas, la copia de seguridad y la restauración, y la finalización de la actividad del usuario cuando sea necesario.<br />Realizar copias de seguridad y restaurar una base de datos de Analysis Services<br />Las copias de seguridad permiten a los administradores guardar un estado específico de una base de datos de Microsoft SQL Server 2005 Analysis Services (SSAS) y sus objetos. <br />La restauración permite a los administradores restaurar una base de datos Analysis Services a un estado anterior. <br />Las razones para hacer copias de seguridad incluyen la recuperación de datos y la preparación de auditorías. Si aún no tiene un plan de copias de seguridad y sus datos son importantes, debe diseñar e implementar un plan lo antes posible. Para realizar una copia de seguridad completa que incluya los datos de origen, debe hacer una copia de seguridad de la base de datos que contiene los datos de detalle. En general, las copias de seguridad de Analysis Services contienen metadatos y un subconjunto de datos de origen y/o agregaciones, no la totalidad de los datos de detalle subyacentes. Sin embargo, si todos los objetos son MOLAP, la copia de seguridad contiene metadatos y datos de origen.<br />Una ventaja evidente de las copias de seguridad automáticas es que la instantánea de los datos siempre estará tan actualizada como determina la frecuencia de la copia de seguridad automática. Las programaciones automatizadas garantizan que no se olvida efectuar copias de seguridad. También puede automatizarse la restauración de una base de datos; ésta puede ser una buena forma de hacer réplicas de los datos, pero no debe olvidar realizar la copia de seguridad del archivo de clave de cifrado en la instancia donde se hace la réplica. La característica de sincronización se ocupa de la réplica de las bases de datos de Analysis Services, pero sólo para los datos obsoletos. Todas las características aquí mencionadas pueden implementarse a través de la interfaz de usuario, por medio de comandos XML/A o mediante programación que se ejecuta a través de AMO. <br />Administrar las particiones de Analysis Services<br />Una partición es un archivo en un disco duro que contiene un subconjunto de datos incluidos en una base de datos de Analysis Services. Las particiones permiten repartir los datos en varios discos duros. Esto incluye combinaciones de particiones locales (almacenadas en el disco duro local) y remotas (distribuidas en varios discos duros). Las particiones se basan en los parámetros de almacenamiento para definir el formato y la programación de procesamiento de la base de datos, y utilizan la configuración de reescritura para habilitar análisis de escenarios condicionales. El análisis de escenarios condicionales permite que un usuario incluya sus propios datos y evalúe los cambios que se producen en el cubo.<br />Procesamiento en Analysis Services<br />Como administrador, debe mantener actualizados los objetos de Microsoft SQL Server 2005 Analysis Services (SSAS) en las bases de datos de producción actuales mediante su procesamiento. El procesamiento es el paso, o la serie de pasos, que llenan los objetos de Analysis Services con datos de orígenes de datos relacionales. El procesamiento varía en función del tipo de objeto y la selección de las opciones de procesamiento.<br />Mientras el trabajo de procesamiento está en funcionamiento, se puede obtener acceso a los objetos afectados de Analysis Services para realizar consultas. El trabajo de procesamiento funciona dentro de una transacción y la transacción se puede confirmar o revertir. Si se produce un error en el trabajo de procesamiento, la transacción se revierte. Si el trabajo de procesamiento se realiza correctamente, se aplica un bloqueo exclusivo al objeto al confirmar los cambios, lo que significa que el objeto no está disponible temporalmente para consultas o procesamiento. Durante la fase de confirmación de la transacción, se pueden seguir enviando consultas al objeto, pero se pondrán en cola hasta que la confirmación se complete. <br />Finalizar la actividad de los usuarios<br />Es posible que un administrador de Microsoft SQL Server 2005 Analysis Services (SSAS) desee dar por terminada la actividad de los usuarios como parte de la administración de la carga de trabajo. Esto se lleva a cabo cancelando sesiones y conexiones. Las sesiones se pueden formar automáticamente cuando se ejecuta una consulta (implícito) o definirse en el momento en que las crea el administrador (explícito). Las conexiones son conductos abiertos con los que se pueden ejecutar las consultas. Tanto las sesiones como las conexiones se pueden terminar aunque estén activas. Por ejemplo, es posible que un administrador desee finalizar el procesamiento de una sesión si dicho procesamiento está tardando demasiado o si han surgido dudas sobre si el comando que se está ejecutando está correctamente escrito.<br />Terminar sesiones y conexiones <br />Debido a que no hay interfaz de usuario para administrar sesiones y conexiones, el administrador utiliza el comando Cancelar a través de XMLA EXECUTE METHOD para finalizar una sesión o una conexión. La finalización de una sesión detiene todos los comandos que se están ejecutando como parte de dicha sesión. La finalización de una conexión cierra su sesión del host. No obstante, Analysis Services no puede cerrar una conexión si no puede realizar un seguimiento de todas las sesiones que ha abierto, por ejemplo, cuando hay varias sesiones abiertas en un escenario HTTP.<br />

×