1Preparar: Proyecto de Analysis Service, Origen de datos y Vista al origen de datos.     El primer paso para poder impleme...
2                                       Figura 22. Preparar origen de datos     Hacer click con el botón derecho sobre “Or...
3                                          Figura 4      Proporcionar los datos con los cuales nos conectaremos a la base ...
4                                      Figura 6Con esto ya se encuentra listo el origen de datos.
53. Crear vista al origen de datos     Realizar click con el botón derecho sobre “Vistas del Origen de Datos” y a continua...
6     Ahora aparecerá un listado que contiene las tablas y vistas de la base de datosseleccionada, debe seleccionar las ta...
7                                           Figura 10     Ahora se hay que relacionar el atributo OrderNumber de la vista ...
8Figura 12
9Implementación de escenarios de minería de datos permitidos por SQL Server 2008   Este anexo tiene por objetivo mostrar e...
10                                          Figura 13Seleccionamos el método a utilizar para crear la definición de la est...
11                                          Figura 15Seleccionamos la vista del origen de datos que se realizo con anterio...
12                                          Figura 17En la página Especificar los datos de aprendizaje debemos seleccionar...
13                                           Figura 18En la página Especificar el contenido y el tipo de datos de las colu...
14Después de hacer clic en Detectar, debemos revisar las entradas de las columnas Tipo decontenido y Tipo de datos, y camb...
15En la página Crear Conjunto de Pruebas debemos dejar el porcentaje de datos para pruebas pordefecto (30%) y debemos fija...
16Figura 21
17                Al terminar los pasos anteriores debemos tener lo siguiente.                                         Fig...
18Aparecerá la siguiente ventana, en la cual hacemos clic en ejecutar.                                           Figura 24...
19Ahora nos vamos a la pestaña de visor de modelos de minería de datos, en la cual podemosobservar lo siguiente:          ...
20Clústeres de MicrosoftDebido a que para nuestro escenario de correo directo ya tenemos configurados los datos deentrada ...
21Click en Aceptar y ahora tendremos lo siguiente:                                          Figura 29A nuestro Escenario d...
22                                          Figura 30Ahora nos aparecerá la siguiente ventana, en la cual presionamos Ejec...
23Ahora nos vamos a la pestaña de visor de modelos de minería de datos, en la cual podemosobservar lo siguiente:En algunos...
24Bayes naive de MicrosoftComo ya vimos en el caso anterior debido a que para nuestro escenario de correo directo yatenemo...
25Click en aceptar y nos mostrara el mensaje que este algoritmo no admite el tipo de contenidode ciertas columnas, además ...
26Ahora para procesar nuestro nuevo modelo de minería de datos realizamos un click con elbotón derecho sobre la columna Ba...
27Seguidamente nos aparecerá una ventana que nos indica el progreso del proceso, el cual unavez que finalice lo cerramos. ...
28Escenario de previsión.       Como analista de ventas de Adventure Works, se ha solicitado una previsión de lasventas de...
29                                           Figura 41Seleccionamos la técnica de minería de datos a utilizar en este caso...
30Figura 43
31Activamos la casilla escenario de la tabla vtimeSeries                                           Figura 44Especificamos ...
32Siguiente                                         Figura 46En este paso debemos especificar el nombre de la estructura d...
33Al terminar los pasos anteriores debemos tener lo siguiente.                                           Figura 48Ahora es...
34Aparecerá la siguiente ventana, en la cual colocamos ejecutar.                                           Figura 50Seguid...
35Ahora nos vamos a la pestaña de visor de modelos de minería de datos, en la cual podemosobservar la predicción realizada...
36Escenario de la cesta de compra     El departamento de marketing de Adventure Works desea mejorar el sitio Web de laempr...
37Figura 54
38Seleccionamos la técnica de minería de datos a utilizar en este caso Reglas de asociación deMicrosoft.                  ...
39Seleccionamos las tablas de la siguiente manera:En tabla vAssocSeqOrders actibamos la casilla escenario.En tabla vAssocS...
40como una clave para la tabla anidada. Para este modelo de asociación, todo lo que necesita esOrderNumber porque combina ...
41   Especificamos el nombre de la estructura de minería de datos y el nombre del modelo de      minería de datos, ademas ...
42Ahora es el momento de procesar nuestra estructura de minería de datos de la siguiente forma:                           ...
43Seguidamente los aparecerá una ventana que nos indica el progreso del proceso, el cual unavez que finalice lo cerramos. ...
44Figura 67
45Escenario de clústeres de secuencia     El departamento de marketing de Adventure Works desea saber cómo se mueven loscl...
46Figura 69
47Seleccionamos la técnica de minería de datos a utilizar en este caso Clústeres de secuencia deMicrosoft.                ...
48Seleccionamos las tablas de la siguiente manera:En tabla vAssocSeqOrders actibamos la casilla escenario.En tabla vAssocS...
49En la página Especificar el contenido y el tipo de datos de las columnas, compruebe que lacuadrícula contiene los tipos ...
50   Especificamos el nombre de la estructura de minería de datos y el nombre del modelo de      minería de datos, además ...
51Ahora es el momento de procesar nuestra estructura de minería de datos, haciendo clic enProcesar estructuras de minería ...
52Seguidamente nos aparecerá una ventana que nos indica el progreso del proceso, el cual unavez que finalice lo cerramos. ...
53Ahora nos vamos a la pestaña de visor de modelos de minería de datos, en la cual podemosobservar lo siguiente:          ...
54Escenario de red neuronal y de regresión logística     El departamento de operaciones de Adventure Works está ocupado en...
55Figura 82
56Seleccionamos el método a utilizar para crear la definición de la estructura, en este caso apartir de una base de datos ...
57Seleccionamos la vista del origen de datos que se realizo con anterioridad.                                           Fi...
58En la página Especificar los datos de aprendizaje debemos seleccionar las columnas de la tablaseleccionada de la siguien...
59En la página Especificar el contenido y el tipo de datos de las columnas, compruebe que lacuadrícula contiene los tipos ...
60Especificamos el nombre de la estructura de minería de datos y el nombre del modelo deminería de datos.Finalizar        ...
61Ahora es el momento de procesar nuestra estructura de minería de datos, haciendo clic enProcesar estructuras de minería ...
62Seguidamente nos aparecerá una ventana que nos indica el progreso del proceso, el cual unavez que finalice lo cerramos. ...
63Escenario de regresión logística de MicrosoftDebido a que para nuestro escenario de red neuronal y regresión logística y...
64Click en Aceptar y ahora tendremos lo siguiente:                                          Figura 98Al Escenario de red n...
65Ahora nos aparecerá la siguiente ventana, en la cual presionamos Ejecutar.                                          Figu...
66Ahora nos vamos a la pestaña de visor de modelos de minería de datos, en la cual podemosobservar lo siguiente:En algunos...
Upcoming SlideShare
Loading in …5
×

Iemdsql server2008

539 views

Published on

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
539
On SlideShare
0
From Embeds
0
Number of Embeds
2
Actions
Shares
0
Downloads
14
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Iemdsql server2008

  1. 1. 1Preparar: Proyecto de Analysis Service, Origen de datos y Vista al origen de datos. El primer paso para poder implementar los escenarios de minería de datos es preparar elProyecto de Analysis Service, Origen de datos y Vista al origen de datos. Dicho proceso semuestra a continuación.1. Crear Proyecto de Analysis Service Ejecutamos SQL Server Business Intelligence Development Studio ubicado en inicio,todos los programas, Microsoft SQL Server 2008 (esta ubicación puede variar dependiendode la versión de Windows). Generar un nuevo Proyecto de Analysis Services y definir un nombre. (Archivo, Nuevo,Proyecto…) Figura 1 Hacer click en Aceptar. Ahora ya esta creado el Proyecto de Analysis Service.
  2. 2. 2 Figura 22. Preparar origen de datos Hacer click con el botón derecho sobre “Origenes de Datos” y seguidamente en “NuevoOrigen de Datos”. Figura 3 Seleccionar la base de datos de donde se leerán los datos, en este caso“AdventureWorksDW2008”.
  3. 3. 3 Figura 4 Proporcionar los datos con los cuales nos conectaremos a la base de datos (en este casose utilizara la cuenta de servicio) Figura 5 Asignar un nombre al origen de datos (AdventureWorksDW2008) y finalizar.
  4. 4. 4 Figura 6Con esto ya se encuentra listo el origen de datos.
  5. 5. 53. Crear vista al origen de datos Realizar click con el botón derecho sobre “Vistas del Origen de Datos” y a continuaciónclick sobre “Nueva Vista del Origen de Datos…”. Figura 7 Seleccionar el origen de datos (creado con anterioridad) y realizar click en siguiente. Figura 8
  6. 6. 6 Ahora aparecerá un listado que contiene las tablas y vistas de la base de datosseleccionada, debe seleccionar las tablas y vistas necesarias para llevar a cabo los escenariosde minería de datos (FactCallCenter, ProspectiveBuyer, vAssocSeqLineItems,vAssocSeqOrders, vTargetMail y vTimeSeries). Figura 9 Una vez realizado esto hacer click en siguiente. Asignar un nombre a la vista del origen de datos (AdventureWorksDW2008) yfinalizamos.
  7. 7. 7 Figura 10 Ahora se hay que relacionar el atributo OrderNumber de la vista vAssocSeqLineItemscon la vista vAssocSeqOrders. Esto se realiza arrastrando el atributo OrderNumber de la tablavAssocSeqLineItems al atributo OrderNumber de la tabla vAssocSeqOrders. Figura 11 Así debería lucir el proyecto con la relación entre las vistas, el origen de datos y la vistaal origen de datos creados.
  8. 8. 8Figura 12
  9. 9. 9Implementación de escenarios de minería de datos permitidos por SQL Server 2008 Este anexo tiene por objetivo mostrar el paso a paso de la implementación de los distintosescenarios de minería de datos permitidos por SQL Server, los cuales son: escenario de correodirecto, escenario de previsión, escenario de la cesta de compra, escenario de clústeres desecuencia, escenario de red neuronal y de regresión logística.Escenario de correo directo El departamento de marketing de Adventure Works desea aumentar las ventas dirigiendouna campaña de correo directo a clientes específicos. Mediante el análisis de los atributos declientes conocidos, la empresa espera determinar los patrones que posteriormente se aplicarána clientes potenciales. La empresa pretende utilizar los patrones hallados para predecir quéclientes potenciales tienen más probabilidades de comprar un producto. Algoritmos a utilizar: • Árboles de decisión de Microsoft • Clústeres de Microsoft • Bayes naive de MicrosoftÁrboles de decisión de MicrosoftPreparamos el origen de datos y la vista al origen de datos.Seleccionamos una nueva estructura de minería de datos.
  10. 10. 10 Figura 13Seleccionamos el método a utilizar para crear la definición de la estructura, en este caso apartir de una base de datos relacional. Figura 14Seleccionamos la técnica de minería de datos a utilizar en este caso Árboles de decisión deMicrosoft.
  11. 11. 11 Figura 15Seleccionamos la vista del origen de datos que se realizo con anterioridad. Figura 16Seleccionamos las tablas de la siguiente manera:En tabla vTargetMail activamos la casilla escenario.
  12. 12. 12 Figura 17En la página Especificar los datos de aprendizaje debemos seleccionar:Columna clave: CustomerKeyColumna predicción: BikeBuyerColumna entrada: BikeBuyer, Age, CommuteDistance, EnglishEducation,EnglishOccupation, FirstName, Gender, GeographyKey, HouseOwnerFlag, LastName,MaritalStatus, NumberCarsOwned, NumberChildrenAtHome, Region, TotalChildren yYearlyIncome.
  13. 13. 13 Figura 18En la página Especificar el contenido y el tipo de datos de las columnas, haga clic en Detectarpara ejecutar un algoritmo que ejecute los datos numéricos de los ejemplos y determine si lascolumnas numéricas contienen valores continuos o discretos. Por ejemplo, una columna puedecontener información salarial como valores de sueldo actuales, que son continuos, o bienintegrales que representan rangos de sueldo codificados, como 1 = < $25.000; 2 = de $25.000a $50.000, que son discretos. Figura 19
  14. 14. 14Después de hacer clic en Detectar, debemos revisar las entradas de las columnas Tipo decontenido y Tipo de datos, y cambiarlas si es necesario para asegurarse de que laconfiguración es igual que la que se muestra en la tabla siguiente. Columna Tipo de contenido Tipo de datosAge Continuous LongBikeBuyer Discrete LongCommuteDistance Discrete TextCustomerKey Key LongEnglishEducation Discrete TextEnglishOccupation Discrete TextFirstName Discrete TextGender Discrete TextGeographyKey Discrete TextHouseOwnerFlag Discrete TextLastName Discrete TextMaritalStatus Discrete TextNumberCarsOwned Discrete LongNumberChildrenAtHome Discrete LongRegion Discrete TextTotalChildren Discrete LongYearlyIncome Continuous Double Tabla 1Una vez que hemos verificado esto podemos hacer click en siguiente.
  15. 15. 15En la página Crear Conjunto de Pruebas debemos dejar el porcentaje de datos para pruebas pordefecto (30%) y debemos fijar el Número máximo de casos en el conjunto de datos de pruebaen 1000.Clic en siguiente. Figura 20Especificamos el nombre de la estructura de minería de datos y el nombre del modelo deminería de datos, además debemos marcar la casilla Permitir obtención de detalles.Finalizar
  16. 16. 16Figura 21
  17. 17. 17 Al terminar los pasos anteriores debemos tener lo siguiente. Figura 22Ahora es el momento de procesar nuestra estructura de minería de datos, haciendo clic enProcesar estructuras de minería de datos y todos los modelos… Figura 23
  18. 18. 18Aparecerá la siguiente ventana, en la cual hacemos clic en ejecutar. Figura 24Seguidamente nos aparecerá una ventana que nos indica el progreso del proceso, el cual unavez que finalice lo cerramos. Además debemos cerrar la ventana anteriormente. Figura 25Una vez terminados los pasos anteriores estamos en condiciones de explorar nuestro proyectode minería de datos recién creado.
  19. 19. 19Ahora nos vamos a la pestaña de visor de modelos de minería de datos, en la cual podemosobservar lo siguiente: Figura 26
  20. 20. 20Clústeres de MicrosoftDebido a que para nuestro escenario de correo directo ya tenemos configurados los datos deentrada (como se realizo en el punto a), lo único que tenemos que modificar a nuestroescenario es agregar una nueva estructura de minería de datos. Para lo cual realizamos losiguiente:Nos vamos a la ficha Modelos de Minería de Datos, luego a la columna Estructura y sobre estarealizamos un click con el botón derecho del mouse y seleccionamos Nuevo Modelo deMinería de Datos. Figura 27Especificamos el Nombre del modelo y el Algoritmo a utilizar que en este caso es MicrosoftClustering. Figura 28
  21. 21. 21Click en Aceptar y ahora tendremos lo siguiente: Figura 29A nuestro Escenario de correo directo le agregamos otro modelo de minería de datos, por lotanto en el mismo escenario tenemos dos modelos de minería de datos Árboles de decisión deMicrosoft y Clústeres de Microsoft.Ahora para procesar nuestro nuevo modelo de minería de datos realizamos un click con elbotón derecho sobre la columna Clústeres de Microsoft y después hacemos click sobre laopción Procesar modelo ...
  22. 22. 22 Figura 30Ahora nos aparecerá la siguiente ventana, en la cual presionamos Ejecutar. Figura 31Seguidamente nos aparecerá una ventana que nos indica el progreso del proceso, el cual unavez que finalice lo cerramos. Además debemos cerrar la ventana mostrada anteriormente.Una vez terminados los pasos anteriores estamos en condiciones de explorar nuestro proyectode minería de datos recién creado.
  23. 23. 23Ahora nos vamos a la pestaña de visor de modelos de minería de datos, en la cual podemosobservar lo siguiente:En algunos casos debemos especificar el Modelo de minería “Clústeres de Microsoft”, ya quees posible que nos muestre el modelo anterior (Árboles de decisión). Figura 32
  24. 24. 24Bayes naive de MicrosoftComo ya vimos en el caso anterior debido a que para nuestro escenario de correo directo yatenemos configurados los datos de entrada (como se realizo en el punto a), lo único quetenemos que modificar a nuestro escenario es agregar una nueva estructura de minería dedatos. Para lo cual realizamos lo siguiente:Nos vamos a la ficha Modelos de Minería de Datos, luego a la columna Estructura y sobre estarealizamos un click con el botón derecho del mouse y seleccionamos Nuevo Modelo deMinería de Datos. Figura 33Especificamos el Nombre del modelo y el Algoritmo a utilizar que en este caso es Bayes naivede Microsoft. Figura 34
  25. 25. 25Click en aceptar y nos mostrara el mensaje que este algoritmo no admite el tipo de contenidode ciertas columnas, además nos preguntara si deseamos continuar. Figura 35Click en Sí y ahora tendremos lo siguiente: Figura 36A nuestro Escenario de correo directo le agregamos otro modelo de minería de datos, por lotanto en el mismo escenario tenemos tres modelos de minería de datos Árboles de decisión deMicrosoft, Clústeres de Microsoft y Bayes Naive Microsoft.
  26. 26. 26Ahora para procesar nuestro nuevo modelo de minería de datos realizamos un click con elbotón derecho sobre la columna Bayes naive de Microsoft y después hacemos click sobre laopción Procesar modelo ... Figura 37Ahora nos aparecerá la siguiente ventana, en la cual presionamos Ejecutar. Figura 38
  27. 27. 27Seguidamente nos aparecerá una ventana que nos indica el progreso del proceso, el cual unavez que finalice lo cerramos. Además debemos cerrar la ventana mostrada anteriormente.Ahora nos vamos a la pestaña de visor de modelos de minería de datos, en la cual podemosobservar lo siguiente:En algunos casos debemos especificar el Modelo de minería “Bayes naive de Microsoft”, yaque es posible que nos muestre algunos de los modelos anteriores (Árboles de decisión oClústeres de Microsoft). Figura 39
  28. 28. 28Escenario de previsión. Como analista de ventas de Adventure Works, se ha solicitado una previsión de lasventas de modelos individuales de bicicletas para el “próximo año”. En concreto, se debeobtener los altos en las ventas de bicicletas y determinar qué regiones lideran las ventas ycuáles van por detrás. Además, se debe determinar si las ventas de diferentes modelos varíanen función de la época del año.Algoritmo a utilizar: Serie temporal de Microsoft.Preparamos el origen de datos y la vista al origen de datos (Ver anexo A).Seleccionamos una nueva estructura de minería de datos. Figura 40Seleccionamos el método a utilizar para crear la definición de la estructura, en este caso apartir de una base de datos relacional.
  29. 29. 29 Figura 41Seleccionamos la técnica de minería de datos a utilizar en este caso serie temporal deMicrosoft. Figura 42Seleccionamos la vista del origen de datos que se realizo con anterioridad.
  30. 30. 30Figura 43
  31. 31. 31Activamos la casilla escenario de la tabla vtimeSeries Figura 44Especificamos las columnas que utilizaremos en el análisis como se observa en la figura. Figura 45
  32. 32. 32Siguiente Figura 46En este paso debemos especificar el nombre de la estructura de minería de datos y el nombredel modelo de minería de datos.Finalizar Figura 47
  33. 33. 33Al terminar los pasos anteriores debemos tener lo siguiente. Figura 48Ahora es el momento de procesar nuestra estructura de minería de datos de la siguiente forma: Figura 49
  34. 34. 34Aparecerá la siguiente ventana, en la cual colocamos ejecutar. Figura 50Seguidamente los aparecerá una ventana que nos indica el progreso del proceso, el cual unavez que finalice lo cerramos. Además debemos cerrar la ventana mostrada anteriormente. Figura 51
  35. 35. 35Ahora nos vamos a la pestaña de visor de modelos de minería de datos, en la cual podemosobservar la predicción realizada. Figura 52
  36. 36. 36Escenario de la cesta de compra El departamento de marketing de Adventure Works desea mejorar el sitio Web de laempresa para promover las ventas cruzadas. Antes de actualizar el sitio, necesitan crear un modelo de minería de datos que puedapredecir los productos cuya adquisición podría interesar a los clientes, basándose en otrosproductos que ya se encuentran en las cestas de la compra en línea de los clientes. Estaspredicciones también ayudarán al departamento de marketing a agrupar en el sitio Webaquellos artículos que los clientes suelen comprar juntos. Algoritmo a utilizar: Reglas de asociación de Microsoft.Preparamos el origen de datos y la vista al origen de datos (Ver anexo A).Seleccionamos una nueva estructura de minería de datos. Figura 53Seleccionamos el método a utilizar para crear la definición de la estructura, en este caso apartir de una base de datos relacional.
  37. 37. 37Figura 54
  38. 38. 38Seleccionamos la técnica de minería de datos a utilizar en este caso Reglas de asociación deMicrosoft. Figura 55Seleccionamos la vista del origen de datos que se realizo con anterioridad. Figura 56
  39. 39. 39Seleccionamos las tablas de la siguiente manera:En tabla vAssocSeqOrders actibamos la casilla escenario.En tabla vAssocSeqLineItems activamos la casilla anidado. Figura 57Debemos seleccionar las columnas de las tablas seleccionadas como se muestra en la figura. Figura 58Dado que el propósito del análisis de la cesta de la compra es determinar qué productos estánincluidos en una transacción única, no tiene que usar el campo CustomerKey. En su lugar,usaremos OrderNumber como la clave para la tabla de casos. No tiene que usar LineNumber
  40. 40. 40como una clave para la tabla anidada. Para este modelo de asociación, todo lo que necesita esOrderNumber porque combina la tabla de pedidos con la tabla anidada de productoscomprados.En esta ventana solo hacemos clic en siguiente Figura 59Aceptamos el porcentaje de datos de prueba (30%).Solo hacemos clic en siguiente. Figura 60
  41. 41. 41 Especificamos el nombre de la estructura de minería de datos y el nombre del modelo de minería de datos, ademas debemos marcar la casilla Permitir obtención de detalles.Finalizar Figura 61Al terminar los pasos anteriores debemos tener lo siguiente. Figura 62
  42. 42. 42Ahora es el momento de procesar nuestra estructura de minería de datos de la siguiente forma: Figura 63Aparecerá la siguiente ventana, en la cual colocamos ejecutar. Figura 64
  43. 43. 43Seguidamente los aparecerá una ventana que nos indica el progreso del proceso, el cual unavez que finalice lo cerramos. Además debemos cerrar la ventana mostrada anteriormente. Figura 65Ahora nos vamos a la pestaña de visor de modelos de minería de datos, en la cual podemosobservar la predicción realizada. Figura 66
  44. 44. 44Figura 67
  45. 45. 45Escenario de clústeres de secuencia El departamento de marketing de Adventure Works desea saber cómo se mueven losclientes por el sitio Web de Adventure Works. La empresa cree que existe un patrón según elcual los clientes incluyen productos en las cestas de la compra. Con el algoritmo de Clústeresde secuencia de Microsoft, pueden buscar secuencias que proporcionen información sobre lamanera en la que los clientes agregan elementos relacionados a sus cestas. Posteriormente,esta información se puede utilizar para mejorar el flujo del sitio Web y propiciar que losclientes adquieran productos adicionales. Algoritmo a utilizar: Clústeres de secuencia de Microsoft.Preparamos el origen de datos y la vista al origen de datos (Ver anexo A).Seleccionamos una nueva estructura de minería de datos. Figura 68Seleccionamos el método a utilizar para crear la definición de la estructura, en este caso apartir de una base de datos relacional.
  46. 46. 46Figura 69
  47. 47. 47Seleccionamos la técnica de minería de datos a utilizar en este caso Clústeres de secuencia deMicrosoft. Figura 70Seleccionamos la vista del origen de datos que se realizo con anterioridad. Figura 71
  48. 48. 48Seleccionamos las tablas de la siguiente manera:En tabla vAssocSeqOrders actibamos la casilla escenario.En tabla vAssocSeqLineItems activamos la casilla anidado. Figura 72En la página Especificar los datos de aprendizaje debemos seleccionar las columnas de lastablas seleccionadas como se muestra en la figura. Figura 73
  49. 49. 49En la página Especificar el contenido y el tipo de datos de las columnas, compruebe que lacuadrícula contiene los tipos de contenido y las columnas siguientes y, a continuación, hagaclic en Siguiente. Figura 74En esta página debemos modificar el porcentaje de datos para pruebas de 30% a 20%.Clic en siguiente. Figura 75
  50. 50. 50 Especificamos el nombre de la estructura de minería de datos y el nombre del modelo de minería de datos, además debemos marcar la casilla Permitir obtención de detalles.Finalizar Figura 76Al terminar los pasos anteriores debemos tener lo siguiente. Figura 77
  51. 51. 51Ahora es el momento de procesar nuestra estructura de minería de datos, haciendo clic enProcesar estructuras de minería de datos y todos los modelos… Figura 78Aparecerá la siguiente ventana, en la cual hacemos clic en ejecutar. Figura 79
  52. 52. 52Seguidamente nos aparecerá una ventana que nos indica el progreso del proceso, el cual unavez que finalice lo cerramos. Además debemos cerrar la ventana mostrada anteriormente. Figura 80Una vez terminados los pasos anteriores estamos en condiciones de explorar nuestro proyectode minería de datos recién creado.
  53. 53. 53Ahora nos vamos a la pestaña de visor de modelos de minería de datos, en la cual podemosobservar lo siguiente: Figura 81El visor de clústeres de secuencia de Microsoft contiene cinco fichas: Diagrama del clúster,Perfiles del clúster, Características del clúster, Distinción del clúster y Transiciones de estado.
  54. 54. 54Escenario de red neuronal y de regresión logística El departamento de operaciones de Adventure Works está ocupado en un proyecto paramejorar la satisfacción del cliente con su centro de llamadas. Han contratado a un proveedorpara administrar el centro de llamadas y proporcionar métricas sobre la efectividad del centrode llamadas, y han solicitado el análisis de algunos datos preliminares que proporciona elproveedor con el fin de encontrar hallazgos interesantes. En particular, desean saber si losdatos sugieren algún problema con el personal o métodos para mejorar el tipo de respuesta. El conjunto de datos cubre un período de 30 días en el funcionamiento del centro dellamadas. Los datos realizan el seguimiento del número de operadores en cada turno, elnúmero de llamadas y pedidos, el tiempo de respuestas y una métrica de grado de serviciobasado en la tasa de abandono, un indicador de la frustración del cliente. Puesto que no se cuenta con expectativas a priori sobre lo que mostrarán los datos, sedecide usar un modelo de red neuronal para explorar posibles correlaciones. En la detección deconocimiento se suelen utilizar modelos de red neuronal que pueden analizar relacionescomplejas entre un alto número de entradas y salidas. Cuando se determinen los factores que contribuyen a la satisfacción del cliente con elcentro de llamadas, se generará un modelo de regresión que se pueda utilizar para realizarpredicciones sobre cómo el personal y otras decisiones comerciales cotidianas. Algoritmos a utilizar: • Red Neuronal de Microsoft • Regresión logística de MicrosoftEscenario de Red Neuronal de MicrosoftPreparamos el origen de datos y la vista al origen de datos (Ver anexo A).Seleccionamos una nueva estructura de minería de datos.
  55. 55. 55Figura 82
  56. 56. 56Seleccionamos el método a utilizar para crear la definición de la estructura, en este caso apartir de una base de datos relacional. Figura 83Seleccionamos la técnica de minería de datos a utilizar en este caso Red Neuronal deMicrosoft. Figura 84
  57. 57. 57Seleccionamos la vista del origen de datos que se realizo con anterioridad. Figura 85Seleccionamos las tablas de la siguiente manera:En tabla FactCallCenter la casilla escenario. Figura 86
  58. 58. 58En la página Especificar los datos de aprendizaje debemos seleccionar las columnas de la tablaseleccionada de la siguiente forma:Clave: FactCallCentreIDEntrada: AutomaticResponses, AverageTimePerIssue, Calls, IssuesRaised,LevelOneOperators, LevelTwoOperators, Orders, ServiceGrade, Shift y WageType.De predicción: AverageTimePerIssue, LevelOneOperators, Orders, ServiceGrade. Figura 87
  59. 59. 59En la página Especificar el contenido y el tipo de datos de las columnas, compruebe que lacuadrícula contiene los tipos de contenido y las columnas siguientes y, a continuación, hagaclic en Siguiente. Figura 88En la página Crear conjunto de pruebas, debemos modificar el porcentaje de datos parapruebas de 30% a 20%.Clic en siguiente. Figura 89
  60. 60. 60Especificamos el nombre de la estructura de minería de datos y el nombre del modelo deminería de datos.Finalizar Figura 90Al terminar los pasos anteriores debemos tener lo siguiente. Figura 91
  61. 61. 61Ahora es el momento de procesar nuestra estructura de minería de datos, haciendo clic enProcesar estructuras de minería de datos y todos los modelos… Figura 92Aparecerá la siguiente ventana, en la cual hacemos clic en ejecutar. Figura 93
  62. 62. 62Seguidamente nos aparecerá una ventana que nos indica el progreso del proceso, el cual unavez que finalice lo cerramos. Además debemos cerrar la ventana mostrada anteriormente. Figura 94Una vez terminados los pasos anteriores estamos en condiciones de explorar nuestro proyectode minería de datos recién creado.Ahora nos vamos a la pestaña de visor de modelos de minería de datos, en la cual podemosobservar lo siguiente: Figura 95
  63. 63. 63Escenario de regresión logística de MicrosoftDebido a que para nuestro escenario de red neuronal y regresión logística ya tenemosconfigurados los datos de entrada (como se realizo en el punto a), lo único que tenemos quemodificar a nuestro escenario es agregar una nueva estructura de minería de datos. Para lo cualrealizamos lo siguiente:Nos vamos a la ficha Modelos de Minería de Datos, luego a la columna Estructura y sobre estarealizamos un click con el botón derecho del mouse y seleccionamos Nuevo Modelo deMinería de Datos. Figura 96Especificamos el Nombre del modelo y el Algoritmo a utilizar que en este caso es MicrosoftLogistic Regression. Figura 97
  64. 64. 64Click en Aceptar y ahora tendremos lo siguiente: Figura 98Al Escenario de red neuronal y regresión logística se le ha agregado otro modelo de minería dedatos, por lo tanto en el mismo escenario tenemos dos modelos de minería de datos RedesNeuronales y Regresión Logística.Ahora para procesar nuestro nuevo modelo de minería de datos realizamos un click con elbotón derecho sobre la columna Regresión Logística y después hacemos click sobre la opciónProcesar modelo ... Figura 99
  65. 65. 65Ahora nos aparecerá la siguiente ventana, en la cual presionamos Ejecutar. Figura 100Seguidamente nos aparecerá una ventana que nos indica el progreso del proceso, el cual unavez que finalice lo cerramos. Además debemos cerrar la ventana anteriormente.Una vez terminados los pasos anteriores estamos en condiciones de explorar nuestro proyectode minería de datos recién creado.
  66. 66. 66Ahora nos vamos a la pestaña de visor de modelos de minería de datos, en la cual podemosobservar lo siguiente:En algunos casos debemos especificar el Modelo de minería “Regresión Logística”, ya que esposible que nos muestre el modelo anterior (Red neuronal). Figura 101

×