Your SlideShare is downloading. ×
0
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Sql server analysis services 2008
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

Sql server analysis services 2008

2,903

Published on

good

good

1 Comment
4 Likes
Statistics
Notes
No Downloads
Views
Total Views
2,903
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
153
Comments
1
Likes
4
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. Código: HOL-SQL27
  • 2. ►IntroducciónCaracterísticas Generales de SQL Server 2008►Conceptos y Arquitectura de SQL Server 2008Analysis Services (SSAS)►Diseño y despliegue de un Unified DimensionalModel (UDM)►Administración de SSAS 2008►Programación en SSAS 2008►Soluciones de minería de datos en SSAS 2008
  • 3. • Alta disponibilidad para aplicaciones corporativas• Mejoras en la seguridad• Foco en la capacidad de administración. Auto optimizaciónGestión de datoscorporativosProductividad deldesarrolladorInteligencia deNegocio• Integración con Visual Studio and .NET• Tecnología XML nativa• Interoperabilidad: estándares abiertos, Servicios Web• Solución ETL completa• Ayuda a la decisión en tiempo real: informes, Data Mining• Mejoras en escalabilidad y disponibilidad
  • 4. Conceptos y Arquitectura de SQLServer 2008 Analysis Services
  • 5. ►Microsoft® SQL Server™ 2008 Analysis Services (SSAS) aportafuncionalidades OLAP y de minería de datos utilizando unacombinación de tecnologías de cliente y servidor Los servicios OLAP organizan los datos de un almacén de datos enestructuras multidimensionales aportando respuestas a consultas deanálisis.►SSAS aporta: Organización y resumen de datos en estructuras multidimensionales pararesponder consultas en tiempo real. Ayuda en la toma de decisiones criticas mediante el uso de patrones eindicadores
  • 6. Datos brutos frente a información de negocioCaptura de datos en brutoDerivando la información de negocio de los datos en brutoDevolución de datos en información valiosaSistema deSoporte deDecisionesProceso en tiempo real de transacciones del negocioContienen estructuras de datos optimizados para ediciónProvee de capacidades de soporte de decisión limitadoSistemas de fuentes de datos OLTPSistematransaccional denegocioCaracterísticas• Proveen de datos para el proceso de análisis del negocio• Integran datos desde sistemas de fuentes de datos heterogéneos• Combinan datos validados frente a las reglas de negocio• Organiza información no volátil• Los datos se almacenan en estructuras que son optimizadas para extracción y consulta.
  • 7. Característica de basede datosBase de datos OLTP Base de datos OLAPOrientación del sistema Ejecución y procesamiento de transacciones diarias Generación de información estratégica e históricaUsuarios Oficinistas, contadores, personal informático, clientes,jefes de departamentos operativosGerentes, ejecutivos, juntas directivas, analistas deinformación.Tipo de diseño de base de datos Modelo de datos entidad-relación y/o sistemas de base dedatos orientados a aplicaciones OLTPBase de datos multidimensionales, esquemasrelacionales del tipo estrella, con objetivos estratégicosen la informaciónNivel de detalle de los datos Se almacenan con el mayor detalle ya que se trata de lastransacciones específicasDatos agregados en distintos niveles, no interesa eldetalle sino el resumen de los datosCaracterísticas del Hardware yconfiguraciónServidores de pequeños a medianos, sistemas de altaredundancia, configurados para tener recuperacionesante fallos y optimizados para realizar transaccionespuntuales en línea y con multitud de usuariosServidores de grandes a gigantes, optimizados paraalmacenar grandes volúmenes de datos y responder aconsultas complejas que involucran mucha informacióny con pocos usuariosOperaciones normales Mucha lectura y escritura: actualizaciones, inserciones,sistemas de seguridad con alta redundancia, consultas.Básicamente, lectura de los datos: consultas complejasde los usuariosVolúmenes de datos La información es siempre la actual, el volumen de datosno responde a la cantidad de transacciones que sealmacenen. De 100 MB a 1 o 2 GB.Se almacena información histórica, creciendo losDatawarehouse constantemente. Los volúmenes semiden en Gigabytes a Terabytes.
  • 8. ►SSAS permite consultas grandescantidades de datos de forma flexiblegracias al almacenamiento de lainformación en cubos El cubo es el interfaz primario entreusuarios y datos en una aplicación de BI Representa un conjunto lógico de datos enun empresa, ventas, inventarios,transacciones, finanzas etc. Es una estructura multidimensionalcompuesta por varias celdas Mantiene los datos organizados dentro deun almacén de datosProducto 1Producto 2Producto 3
  • 9. ►En el ejemplo anterior:Dimensiones:ModeloColorVendedorFechaMedida:Cantidad Vendida
  • 10. Tabla de hechosTabla de dimensionesEmployee_DimEmployeeKeyEmployeeID...Time_DimTimeKeyTheDate...Product_DimProductKeyProductID...Customer_DimCustomerKeyCustomerID...Shipper_DimShipperKeyShipperID...Sales_FactTimeKeyEmployeeKeyProductKeyCustomerKeyShipperKeySales AmountUnit Sales ...
  • 11. ► Los data source contienen las tablas dehecho y dimensión incluidas en el cubo► Encapsula las cadenas de conexión y usaproveedores de datos (OLEDB or .NET) paracrear la conexión al almacén de datos► Aporta las credenciales para autentificar laconexión► Un data source view (DSV) representa elmodelo de datos en función de undeterminado data source.► Permite encapsular el modelo de datos deldata source para crear consultas yrelaciones.► El Data Source View Wizard especifica elesquema del DSV y lo hace apuntar a un ovarios data sources
  • 12. ► Organizan los datos en los cubos► Describen una colección de atributos deinterés para un usuario► Basados directa o indirectamente en tablas► El nivel más bajo de definición de lasdimensiones son los atributos, que secorresponden con las columnas de las tablasde dimensión► Dentro de una dimensión los atributos seorganizan en jerarquías para permitir alusuario la navegación entre contenidos► El orden de los atributos en una jerarquía seespecifica en función de niveles, desde el másresumido al más detallado► Los valores actuales de los atributos queconstituyen una jerarquía se denominanmiembros.► Las dimensiones pueden generarse ymantenerse mediante el Dimension Wizard yel Dimension Designer.
  • 13. ► Un data source contiene tablas de hecho y tablas de medidas de un cubo► Las tablas de hecho contienen datos numéricos del cubo que se corresponden con una columna en lastablas de hecho denominada medida► Las tablas de hecho también contienen las claves secundarias que se unen a las claves primarias en lastablas de dimensión► Las medidas representan elementos que son cuantificables► SSAS resume las medidas y las hace visibles a través de jerarquías de varias dimensiones para ayudar en latoma de decisiones► Grupos de medidas Representan todas las medidas de una tabla de hecho dentro de un cubo Se usan para asociar dimensiones comunes a múltiples medidas
  • 14. ►Representa un conjunto de medidas agrupadas yjerárquicamente organizadas por dimensiones►Las celdas de los cubos aumentan exponencialmenteen función de los atributos que contienen.►Los cubos se almacenan en particiones que no sonvisibles a los usuarios de los cubos►Las particiones permiten la distribución de losorígenes de datos entre múltiples servidores
  • 15. ►Soporte para cluster►Múltiples instancias►Copia de seguridad de bases de datos SSASen un único archivo►Mejoras de seguridadSeguridad por defectoEncriptación de bases de datosMayor granularidad de permisosAutentificación WindowsPermisos a nivel de cubo ,dimensión e inclusoceldas individuales
  • 16. ►El número de miembros de las dimensiones notiene un limite en 64000►Múltiples modelos de almacenamientoRelational OLAP (ROLAP)Multidimensional OLAP (MOLAP)Hybrid OLAP (HOLAP)►Soporte multilenguaje►Nuevos asistentes de minería de datos►Posibilidad de modificar cálculos sin tener quereprocesar cubos
  • 17. ►Entornos de gestión: Intelligence Development Studio (BIDS) SQL Server Management Studio►MDX Scripting Posibilidad de integrar los scripts con ensamblados externos►XML/A Esta basado en Simple Object Access Protocol (SOAP) Aporta acceso universal a cualquier entorno multidimensional através de HTTP►ADOMD.NET proveedor estándar de .NET que permite a los clientes acceder aorígenes de datos multidimensionales►AMO Librería de objetos .NET utilizada en aplicaciones para administrarSSAS mediante programaciónDimensiones, atributos, cubos, seguridad.
  • 18. ► Combina el modelo relacional, el multidimensional y el híbrido en un solo modelo dedatos► Permite a los procesos de análisis y reporting de OLAP ser transparentes al método dealmacenamiento.► Está construido como una capa de abstracción sobre los datos y aporta una pasarelaentre cómo los usuarios finales ven los datos y cómo los datos finales son físicamentealmacenados
  • 19. DWDatamartDatamartModelosReportingTool (3)MOLAPMOLAPReportingTool (2)HerramientasDatosOLAPBrowser (2)OLAPBrowser (1)ReportingTool (1)
  • 20. DWDatamartDatamartModelosReportingTool (3)MOLAPMOLAPReportingTool (1)HerramientasDatosOLAPBrowser (2)OLAPBrowser (1)ReportingTool (1)DatosDuplicadosModelosDuplicadosOLAPvs.Relacional
  • 21. Característica Relacional OLAPFlexibilidad del esquema  Acceso a datos en tiempo real  Almacenamiento único de datos  Gestión simple  Informes detallados  Alto rendimiento  Orientación al usuario final  Facilidad de exploración y navegación  Riqueza analítica  Riqueza semántica  
  • 22. DWDatamartDatamartModelosBI ApplicationsMOLAPMOLAPReportingTool (1)HerramientasDatosOLAPBrowser (2)OLAPBrowser (1)ReportingTool (1)UDM
  • 23. LOBAnalysisServicesMOLAPMOLAPDWDatamartDatamartModelos HerramientasDatosUDMCacheDashboardsInformes ricosFrontales de BIHojas de cálculoInformes Ad-HocXML/AorOLEDBDWDatamart
  • 24. UDMSeguridadVistas de orígenes de datosCustomerID (PK)NameAgeOrderOrder#(PK)CustomerIDDueDateModelo dimensional base• Cubos y DimensionesCálculos (scripts Mdx)Scope(Customer.Country.USA, *);Sales = 2;End Scope;Modelo usuario final• Multi lenguaje• Acciones• KPIs …Políticas de Almacenamiento/Caching
  • 25. Característica Relacional OLAPFlexibilidad del esquema  Acceso a datos en tiempo real  Almacenamiento único de datos  Gestión simple  Informes detallados  Alto rendimiento  Orientación al usuario final  Facilidad de exploración y navegación  Riqueza analítica  Riqueza semántica  AS 2008 UDM
  • 26. ► Versión personalizada de Visual Studio que permite diseñar y desplegar solucionesend-to-end de business intelligence.► Proyectos de Analysis Services que contienen la definición de objetos de AnalysisServices
  • 27. ►Recibe la información necesaria para definir : Data Source View Tablas de hecho y dimensión Jerarquías►Una vez creado el cubo puede ser modificado mediante el Cube Designer.
  • 28. ►Puede generarse un cubo empleando o no un data source Con data source, es necesario especificar un data source view valido y seleccionarlas tablas de hecho y de dimensión Sin data source es necesario definir las tablas para generar el data source view
  • 29. ► Una vez seleccionado el data source view el Cube Wizard automáticamente analiza las relaciones entre lastablas► Para esto se basa en las claves primarias y secundarias, así como en los datos numéricos de las tablas► Cuenta con la posibilidad de seleccionar tablas de hecho y dimensiones para representar la dimensióntiempo► Ofrece la posibilidad de especificar dimensiones compartidas incluida a través de múltiples cubos
  • 30. ►Creación de jerarquías de dimensiones de tiempo basándonos en lascolumnas seleccionadas de la tabla de dimensión de tiempo.►La granularidad de la dimensión de tiempo se determina en función de lasreglas de negocio de la organización y de las necesidades de reporting
  • 31. ► Las medidas son las cantidades agregadas que son analizadas a través de variasdimensiones► Las columnas clave o de referencia no participan en los grupos de medidas.► El asistente para cubos automáticamente detecta las jerarquías entre medidas y nosofrece la posibilidad de revisar sus resultados para excluir dimensiones o jerarquías.
  • 32. ► Pueden añadírsele al cubo expresiones MDX o scripts , así como modificar cálculos.► La clase de BI elegida determina los elementos de la solución que serán afectados► El asistente realiza cambios en los data source views, dimensiones y definiciones decubo en base al tipo de inteligencia seleccionada
  • 33. ►Solo podemos añadir KPI si el cuboestá procesado►Una vez añadidas es necesarioreprocesar el cubo
  • 34. ► Son sentencias MDX almacenadas y mantenidas por una base de datos de Analysis Services► Son ejecutadas por aplicaciones cliente► Contienen información sobre cuando y como las sentencias MDX serán mostradas ymanejadas por las aplicaciones cliente► Para ejecutar una acción un usuario final debe realizar una operación especifica que lainicialice
  • 35. ►Aportan facilidad de acceso a los datos►Similares a las vistas en SQL Server►Aportan un subconjunto de datos
  • 36. ► SSAS aporta funciones intrínsecas para utilizarse con MDX y con lenguajes Data Mining Extensions (DMX)► Posibilidad de añadir esemblados a instancias o bases de datos de Analysis Services, para crear funcionesexternas definidas por el usuario en lenguajes como Visual Basic® .NET o Microsoft Visual C#® .NET.► Tras añadir el ensamblado los métodos públicos de la librería son expuestos como funciones definidas porel usuario a las expresiones, procedimientos, cálculos y acciones MDX y DMX.► Para llamar a una función definida por el usuario es necesario hacer referencia a su nombre completo Select<Assembly>.<Class>.<Method>(<parameters>)on 0 from<Cube>
  • 37. Administración de SSAS 2008
  • 38. ► Analysis Services Migration Wizard: Gráficamente Línea de comandos:MigrationWizard.exe MSSQLServerOLAPService arrancadoen origen y destino► En el proceso de migración el asistentecopia las bases de datos de SSAS 2000 ylas recrea en una instancia de SSAS 2008.► Las bases de datos de origen semantienen intactas► Para un mayor rendimiento resultainteresante migrar las bases de datos deuna en una
  • 39. ►Autentificación por defecto►Si la instancia está configurada para permitir accesoanónimo Windows no autentica a los usuarios►Tras autenticar a un usuario Analysis Services compruebalos permisos asociados para visualizar, actualizar datos orealizar tareas administrativas.►Para poder realizar tareas los roles tienen que tenerpermiso a nivel de los distintos objetos de la base dedatos►Al instalar una instancia de SSAS todos los miembros degrupo local de administradores (incluidos losadministradores del dominio) tienen permiso pararealizar cualquier tarea►Como novedad, se requiere aprovisionamiento para lascuentas administrativas
  • 40. ►Rol fijo que aporta acceso administrativo a objetos en unainstancia de SSAS.►No pueden añadirse o eliminarse permisos de este rol►Los miembros pueden acceder a todos las bases de datosy objetos de las instancias de SSAS. Creación de bases de datos y configuración de propiedades Mantenimiento de roles de base de datos Gestión de trazas►Por defecto todos los administradores del domino sonadministradores locales Es posible deshabilitar la opción de servidor Security-BuiltinAdminsAreServerAdmins Aunque los administradores locales son miembros por defecto delrol no aparecen en el interface de usuario
  • 41. ►Se definen para gestionar elacceso a los objetos y a los datospor parte de usuarios noadministradores►Un Rol de base de datos con FullControl (Administrator) puederealizar las siguientes tareas Gestionar objetos de base dedatos Leer datos y metadatos Añadir usuarios a roles existentes Generar nuevos roles de base dedatos Definir permisos para los roles debase de datos
  • 42. ► Implica una serie de pasos que convierten y almacenan losdatos de un data source en un formato multidimensional paraaportar mayor velocidad en las consultas► Mediante el proceso pueden actualizarse datos en la enAnalysis Services con respecto al origen de los datos► Si se realizan cambios en un objeto es necesario volver a hacerun deploy del cubo► Los objetos que deben mantenerse actualizados a través delproceso son Grupos de medidas Particiones Dimensiones Cubos Bases de datos► El proceso de los objetos contenedores implica el proceso detodos los objetos contenidos► El proceso puede hacerse mediante: SQL Server Management Studio Business Intelligence Development Studio. XML for Analysis Services (XMLA) Analysis Management Objects (AMO). Tareas de SSIS
  • 43. ►Mediante el SQL Profilerpodemos:►Depurar sentencias MDX.►Identificar instrucciones MDXque funcionan con lentitud►Auditar y revisar lasactividades que suceden enuna instancia de AnalysisServices►Se dispone del asistente deoptimización de agregacionesbasado en el uso
  • 44. ► Las particiones se basan en grupos de medidas► Pueden utilizarse para mantener la integridad de los datos derivados de una tabla dehecho, una vista en un data source, o una consulta con nombre en un data source view► Las particiones mejorar el rendimiento distribuyendo los orígenes de datos y losagregados entre múltiples discos o múltiples servidores► Por defecto una partición se crea cuando un grupo de medidas es definido en un cubo► Partición horizontal Cada partición se basa en una consulta SQL que filtra los datos para la particiónPor ejemplo una tabla contiene datos de varios países, el grupo de medidaspuede dividirse por países podemos hacer esto mediante una cláusula WHERE.► Partición vertical Cada partición se basa en tablas separadasPor ejemplo varias bases de datos tienen tablas separadas para los datos de cadapaís
  • 45. ►Cada partición puede tener una opción de almacenamientodistinta para cada grupo de medidas►MOLAP los datos y los agregados se almacenan en archivosmultidimensionales.►ROLAP los agregados se almacenan en tablas de las bases dedatos relacionales especificadas en el data source Permite navegar inmediatamente por los cambios más recientes delorigen de datos aunque el rendimiento es menos eficiente que enMOLAP►HOLAP combina los dos anteriores Como en ROLAP los detalles se almacenan en formato relacional Como en MOLAP los agregados de la partición se almacenan en unaestructura multidimensional
  • 46. ► Las consultas definidas contra objetos OLAP van contra elalmacenamiento ROLAP o MOLAP en función de si los datos han sidomodificados recientemente► Estas consultas se dirigen y almacenan el área de almacenamientoMOLAP hasta que los cambios ocurren en el origen de datos► Después que los datos cambian en el origen de datos, los datos en elcaché MOLAP se eliminan y se colocan en el área de almacenamientoROLAP.► Mientras tanto los objetos MOLAP se reconstruyen en caché► Después de que las consultas se reconstruyen y procesan son devueltasal área de almacenamiento MOLAP.► También se puede hacer caché proactivo borrando los objetos MOLAPactuales, las consultas son entonces definidas contra los objetos MOLAPmientras los datos son leídos y procesados en una nueva caché estemétodo aporta mejor rendimiento pero muchos resultados en lasconsultas pueden retornar datos antiguos mientras la nueva caché estásiendo generada
  • 47. Programación en SSAS 2008
  • 48. ►Permite la creación, comprobación y ejecución de consultas
  • 49. ►Aporta la organización jerárquica de los objetos de base de datos
  • 50. ►Son bloques de construcción de dimensiones►Cada atributo se corresponde con una o más columnas de latabla de dimensiones►Los cubos contienen atributos organizados en dimensiones queapuntan a las medidas►En una dimensión los atributos están tipicamente organizadosen jerarquías.►Una dimensión es una colección de atributos utilizados paraorganizar un cubo.►Un cubo puede contener atributos a través de variasdimensiones►Como resultado los atributos no son jerarquicos y se utilizanpara obtener datos de los miembros de un cubo.
  • 51. ►Es un conjunto lógico de un cubo que puede sertratado como un cubo►Es un conjunto persistente de celdas que es devueltadesde un cubo cuando una expresión MDX lo evalúa►CREATE SUBCUBE.
  • 52. ►Expresión a la que se le asigna un alias►Se usan para definir objetos asociados a un cubo►Se almacena como parte de la definición de un cubo►Se crea para ser reutilizado en consultas MDX►Permite identificar expresiones de sintaxis compleja►CREATE [SESSION] SETCube_Expression.<Set_Identifier ASSet_Expression>►Pueden crearse conjuntos de nombres en lossiguientes ámbitos: ConsultaWITH SET < Set_Identifier AS Set_Expression>) Sesión
  • 53. ►Un calculo es una expresión MDX o script que se utiliza para definir objetosasociados con un cubo►Podemos generarlo con el Cube Designer
  • 54. ►XML/A►ADOMD.NET►ANALYSIS MANAGAMENT OBJECTS (AMO)
  • 55. ► Protocolo estandarizado para acceder a datos mediante servicios Web sin necesidad deinterfaces COM► AMO y ADOMD.NET utilizan XMLA cuando se comunican con una instancia de SSAS.► Hace referencia a dos métodos accesibles Discover y Execute► Discover devuelve información desde un servicio Web la información puede ser una lista deorígenes de datos disponibles en un servidor o detalles sobre un origen de datos especifico► Execute Envía comandos a una instancia utilizando SOAP y protocolos HTTP.
  • 56. ►Aporta acceso a clientes a orígenes de datosmultidimensionales►Permite entornos conectados y desconectadosConectados objeto AdomdDataReaderDesconectados objeto CellSet
  • 57. ►La librería AMO de .NET permite manejar objetos deAnalysis Services , así como la seguridad y el procesode cubos
  • 58. ►SQL Server 2005/2008 Reporting Services►Microsoft Excel 2003/2007/2010►Microsoft Data Analyzer►Herramientas desarrolladasAddIn para ExcelAplicaciones Asp o Asp.netWebparts para Sharepoint (Scorecard Accelerator)►BI Portal►Microsoft Office Bussiness Scorecard Manager 2005►Microsoft Office PerformancePoint Server 2007►Herramientas de terceros
  • 59. ►Asistente de Dimensiones mejorado (Atributos“browsables”)►Recomendaciones de mejores prácticas en el entorno►Entorno gráfico para relaciones de atributos mejorado►Conjuntos dinámicos mejorados (Dynamics Set)►Uso de vistas de rendimiento dinámico (DynamicsManagements Views)
  • 60. Soluciones de minería dedatos en SSAS 2008
  • 61. ►Su razón de ser el analizar conjuntos de datos y plantearlescuestiones de negocio►También permite generar modelos de predicción y evaluar suacierto►Antes de generar soluciones de Data Mining es preciso crearmodelos que describan el problema de negocio►Un modelo de data mining se basa en un conjunto dealgoritmos que se construyen a partir de las reglasfundamentales del analisis. Exploracion Descubrimiento de patrones Prediccion de patrones►Por ultimo es preciso definir los datos que se emplearan pararealizar predicciones en el modelo
  • 62. “Data mining es la extracción semi-automática de patrones, cambios, asociaciones, anomalías yotras estructuras estadísiticas significativas de grandes volúmenes de datos”- R. Grossman“La extracción no-trivial de información implícita, previamente desconocida y potencialmenteútil desde los datos"- W. Frawley, et al 1992“La ciencia de extraer información útil desde grandes volúmenes de datos o bases de datos”- D. Hand, et al 2001►También conocido como: Máquina de aprendizaje Análysis Predictivo
  • 63. ►Qué clientes comprarán un determinado producto con una probabilidad X? Clasificación (Predicción)►Cúal es el perfil de un cliente? Segmentación►Recomendar un producto a un cliente que realiza una determianda compra Asociación►Probabilidad de que un cliente compre un producto en el futuro Predicción de secuencias►Predecir la venta de los próximos 5 meses y su error (stdev) Forecasting
  • 64. ►Decision Trees►Naïve Bayesian►Clustering►Sequence Clustering►Association Rules►Neural Network►Time Series►….
  • 65. √ √ √ √ √ √√ √ √ √ √√ √ √√ √ √ √ √ √√ √ √√√ClassificationRegressionSegmentaionAssoc. AnalysisAnomaly Detect.Seq. AnalysisTime series√ - Segunda Opción√ - Primera Opción
  • 66. ►Naive Bayes Identifica atributos mas aproximados a un resultado final Es el algoritmo más simple►Decision Tree Identifica el arbol de atributos que mejor predice unresultado Aporta una jerarquia de atributos utiles para tomar unadecision►Cluster Identifica como los datos forman subgrupos y como estossubgrupos son diferentes unos de otros, encuentra patronessin un objetivo especifico
  • 67. ►Association rule Identifica un subgrupo de datos que participa en unatransacción especifica. Suele emplearse para localizartendencias de consumo►Sequence cluster Identifica el evento que probablemente ocurrirá acontinuación►Time Series Identifica tendencias que están sucediendo Toma como parámetro un atributo baso en tiempo Útil para realizar pronósticos►Neural network Identifica el arbol de atributos que mejor predice el resultado Similar al de decission pero tiene una estructuratridimensional
  • 68. ►Podemos aplicar modelos a los siguientes escenarios: Tendencias de ventas Que productos pueden venderse juntos Secuencia en la que los consumidores añaden productos asus cestas►Se crean después de que un algoritmo analiza unconjunto de datos y encuentra patrones y tendenciasen los datos►El resultado se emplea para establecer parámetrosen el modelo►Tipos Relacionales OLAP
  • 69. ► Definir el problema► Preparar los datos► Explorar los datos► Construir el modelo► Explorar y evaluar el modelo► Desplegar y actualizar el modelo
  • 70. ►Especificaremos los siguiente: El algoritmo inicial del modelo. La dimensión del cubo que sequiere usar como origen de datos Un atributo que puede emplearsecomo clave de modelo, en base alque se seleccionaran los atributosy las medidas utilizadas Contenidos y tipos de datos decada columna
  • 71. ►Lenguaje para crear y trabajar con modelos de mineria►Contiene instrucciones DML y DDL

×