SlideShare a Scribd company logo
1 of 33
Download to read offline
#SQSummit
Maching Learning vs
SSAS Data Mining
Daniel Gil - DPS (dgil@solidq.com)
Pau Sempere – DPA
(psempere@solidq.com)
Contenido de la sesión
• Introducción
• Enfrentando las herramientas
• Limitaciones y diferencias
• Market Basket Analysis
• Clasificación
• Series temporales
Contenido de la sesión
• Introducción
• Enfrentando las herramientas
• Limitaciones y diferencias
• Market Basket Analysis
• Clasificación
• Series temporales
Introducción
SSAS Data Mining
• On premises
• Integrado en SSAS
• 9 algoritmos disponibles
• DMX
Introducción
Azure Machine Learning
• Cloud
• Múltiples orígenes, todos desde nube
• Transformaciones específicas
• 25+ algoritmos disponibles
• Integra Python y R
• Servicios web
Contenido de la sesión
• Introducción
• Enfrentando las herramientas
• Limitaciones y diferencias
• Market Basket Analysis
• Clasificación
• Series temporales
¡Enfrentando las herramientas!
Contenido de la sesión
• Introducción
• Enfrentando las herramientas
• Limitaciones y diferencias
• Market Basket Analysis
• Clasificación
• Series temporales
Diferencias - Orígenes
Azure ML
• Hive
• SQL Database
• Blob Storage
• Table Storage
• Odata
• HTTP
SSAS Data Mining
• Bases de datos
• Cubos SSAS
Diferencias - Dimensionamiento
Azure ML
• 10 GB en total
• Hay módulos que
aceptan menos
• Recomendadores
• SMOTE
• Scripts (R, Python, SQL)
• Cross-validation, Tune
Model Hyperparameters
SSAS Data Mining
• Dependiente del
hardware
Diferencias - Tiempos
Azure ML
• 1 hora en versión free
• 7 días de ejecución
• 24 horas por módulo
SSAS Data Mining
• Ilimitado
Contenido de la sesión
• Introducción
• Enfrentando las herramientas
• Limitaciones y diferencias
• Market Basket Analysis
• Clasificación
• Series temporales
Market Basket Analysis
¿Qué compran nuestros usuarios?
¿Cómo lo compran? ¿Siguen un patrón?
Market Basket Analysis
Usuario Producto Cantidad
Dani Disfraz 1
Pau Disfraz 1
Dani Capa 1
Pau Cables 2
Pau Switch 1
Pau Capa 1
Usuario Edad Sueldo
Daniel 25 Poco
Pau 29 Menos aun
Market Basket Analysis
Usuario Edad Sueldo Producto Cantidad
Daniel 25 Poco Disfraz 1
Capa 1
Pau 29 Menos aun Disfraz 1
Capa 1
Cables 2
Switch 1
Market Basket Analysis
• Association rules / Árboles de decisión
• Podemos añadir clustering para identificar
patrones de compra
Demo
Market Basket Analysis con SSAS
Market Basket Analysis
• No hay un algoritmo específico
• Preprocesado del dato para darle otra forma
Matriz de productos / Usuarios
Dani Pau
Disfraz 1 1
Capa 1 1
Cable 0 1
Switch 0 1
Demo
Market Basket Analysis con Azure ML
Contenido de la sesión
• Introducción
• Enfrentando las herramientas
• Limitaciones y diferencias
• Market Basket Analysis
• Clasificación
• Series temporales
Clasificación
• Predicción de categorías
• Muerto / vivo
• Solvente / deudor
• Comprador / no comprador
• …
Clasificación
Clasificación
• Varios algoritmos:
• Árboles de decision
• Múltiples modos de ejecución
• Regresión logística
• Red neural
• Clustering
• Análisis de precisión
• Lift chart
• Profit chart
• Red de dependencias
Clasificación
• Múltiples algoritmos
• Boosted decision tree
• Red neural
• Regresión logística
• Máquina bayesiana
• …
• Análisis de precisión
• ROC
• Lift chart
• Puntuaciones ponderadas
Demo
Clasificación binaria
Contenido de la sesión
• Introducción
• Enfrentando las herramientas
• Limitaciones y diferencias
• Market Basket Analysis
• Clasificación
• Series temporales
Series temporales
• Datos sobre un eje temporal / numérico
• Cumplen patrones cíclicos
Series temporales
• Dos algoritmos nativos
• ARTXP
• ARIMA
• Comprar contra casos conocidos (training-test)
• Visualmente
• Métricas de error
Series temporales
• No hay un algoritmo nativo
• Pero siempre está … 
• ARIMA
• ETS
• Otros
• Mismo método para estimar la precision que
en SSAS
Demo
Series temporales
Conclusiones
Azure ML
• Fuentes Azure
• Variedad de algoritmos
• R! Python!
• 100 % Online
• Todo en 1
SSAS Data Mining
• On premises
• Sin limite de datos y
tiempos
• Menos algoritmos nativos
• Necesidad de
herramientas
complementarias
¿PREGUNTAS?
También puedes preguntar tus
dudas con el hashtag
#SQSummit en Twitter
ADAPTIVE BI FRAMEWORK
Te ayudaremos a mejorar la velocidad de desarrollo de tu plataforma de
analítica de negocio basada en nuestra experiencia:
•Diseña antes de construir
•Automatización de procesos por ETL
•Servicios de mentoring para ayudarte a conseguir mejores prácticas para la construcción
de procesos específicos y plataformas de analítica de negocio
•Muy fácil de mantener
SOLIDQ FLEX SERVICES
Con SolidQ Flex Services evitarás sustos, consiguiendo que tus sistemas
sean estables. Desde una solución sencilla de monitorización, hasta un
servicio de atención de incidencias 24/7, mantenimiento proactivo,
resolución de problemas y línea de soporte.
Todo con un coste fijo mensual… y tú dedica el tiempo a las cosas
importantes.
¡Gracias!

More Related Content

Viewers also liked

Viewers also liked (6)

BI real time analytics
BI real time analyticsBI real time analytics
BI real time analytics
 
Boosted decision tree를 활용한 lending club의 채무자 원리금 상환 여부 예측
Boosted decision tree를 활용한 lending club의 채무자 원리금 상환 여부 예측Boosted decision tree를 활용한 lending club의 채무자 원리금 상환 여부 예측
Boosted decision tree를 활용한 lending club의 채무자 원리금 상환 여부 예측
 
Polybase
PolybasePolybase
Polybase
 
Tree models with Scikit-Learn: Great models with little assumptions
Tree models with Scikit-Learn: Great models with little assumptionsTree models with Scikit-Learn: Great models with little assumptions
Tree models with Scikit-Learn: Great models with little assumptions
 
Minería de datos / Machine Learning
Minería de datos / Machine LearningMinería de datos / Machine Learning
Minería de datos / Machine Learning
 
Cómo descargar presentaciones desde SlideShare
Cómo descargar presentaciones desde SlideShareCómo descargar presentaciones desde SlideShare
Cómo descargar presentaciones desde SlideShare
 

More from SolidQ

More from SolidQ (20)

SolidQ Summit 2018 - Qué necesita saber un DBA de Integration Services
SolidQ Summit 2018 - Qué necesita saber un DBA de Integration ServicesSolidQ Summit 2018 - Qué necesita saber un DBA de Integration Services
SolidQ Summit 2018 - Qué necesita saber un DBA de Integration Services
 
SolidQ Summit 2018 - Seguridad a nivel datos. RLS
SolidQ Summit 2018 - Seguridad a nivel datos. RLSSolidQ Summit 2018 - Seguridad a nivel datos. RLS
SolidQ Summit 2018 - Seguridad a nivel datos. RLS
 
SolidQ Summit 2018 - Todo lo que un integrador de datos debería tener... y pa...
SolidQ Summit 2018 - Todo lo que un integrador de datos debería tener... y pa...SolidQ Summit 2018 - Todo lo que un integrador de datos debería tener... y pa...
SolidQ Summit 2018 - Todo lo que un integrador de datos debería tener... y pa...
 
SolidQ Summit 2018 - ¿Dificultades gestionando relaciones muchos a muchos? De...
SolidQ Summit 2018 - ¿Dificultades gestionando relaciones muchos a muchos? De...SolidQ Summit 2018 - ¿Dificultades gestionando relaciones muchos a muchos? De...
SolidQ Summit 2018 - ¿Dificultades gestionando relaciones muchos a muchos? De...
 
SolidQ Summit 2018 - Report Server: Nuevos mutantes
SolidQ Summit 2018 - Report Server: Nuevos mutantesSolidQ Summit 2018 - Report Server: Nuevos mutantes
SolidQ Summit 2018 - Report Server: Nuevos mutantes
 
Cuando QueryStore no sirve, ¿qué opciones tenemos?
Cuando QueryStore no sirve, ¿qué opciones tenemos?Cuando QueryStore no sirve, ¿qué opciones tenemos?
Cuando QueryStore no sirve, ¿qué opciones tenemos?
 
SQL Server 2017 en Linux
SQL Server 2017 en LinuxSQL Server 2017 en Linux
SQL Server 2017 en Linux
 
Columnstore en la vida real
Columnstore en la vida realColumnstore en la vida real
Columnstore en la vida real
 
PowerApprízate
PowerApprízatePowerApprízate
PowerApprízate
 
Jugando a ser rico: Machine Learning para predicción de stocks
Jugando a ser rico: Machine Learning para predicción de stocksJugando a ser rico: Machine Learning para predicción de stocks
Jugando a ser rico: Machine Learning para predicción de stocks
 
Analizando tus Redes Sociales con Power BI
Analizando tus Redes Sociales con Power BIAnalizando tus Redes Sociales con Power BI
Analizando tus Redes Sociales con Power BI
 
Mantenimiento de SQL Server para Dummies
Mantenimiento de SQL Server para DummiesMantenimiento de SQL Server para Dummies
Mantenimiento de SQL Server para Dummies
 
R en relacional
R en relacionalR en relacional
R en relacional
 
Cuando haces bot ya no hay stop!!
Cuando haces bot ya no hay stop!!Cuando haces bot ya no hay stop!!
Cuando haces bot ya no hay stop!!
 
Arquitecturas lambda en Azure
Arquitecturas lambda en AzureArquitecturas lambda en Azure
Arquitecturas lambda en Azure
 
Bot Framework: otra manera de acceder a tus datos - SolidQ Summit 2018
Bot Framework: otra manera de acceder a tus datos - SolidQ Summit 2018Bot Framework: otra manera de acceder a tus datos - SolidQ Summit 2018
Bot Framework: otra manera de acceder a tus datos - SolidQ Summit 2018
 
BIE2E en Azure - SolidQ Summit 2018
BIE2E en Azure - SolidQ Summit 2018BIE2E en Azure - SolidQ Summit 2018
BIE2E en Azure - SolidQ Summit 2018
 
¿Qué viene GDPR? Mi SQL está preparado- SolidQ Summit 2018
¿Qué viene GDPR? Mi SQL está preparado- SolidQ Summit 2018¿Qué viene GDPR? Mi SQL está preparado- SolidQ Summit 2018
¿Qué viene GDPR? Mi SQL está preparado- SolidQ Summit 2018
 
Hilando fino en SSAS multidimensional - SolidQ Summit 2018
Hilando fino en SSAS multidimensional - SolidQ Summit 2018Hilando fino en SSAS multidimensional - SolidQ Summit 2018
Hilando fino en SSAS multidimensional - SolidQ Summit 2018
 
Adaptive Query Processing: Mejoras en el motor de consulta de SQL Server 2017...
Adaptive Query Processing: Mejoras en el motor de consulta de SQL Server 2017...Adaptive Query Processing: Mejoras en el motor de consulta de SQL Server 2017...
Adaptive Query Processing: Mejoras en el motor de consulta de SQL Server 2017...
 

Recently uploaded

Modulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdfModulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdf
AnnimoUno1
 

Recently uploaded (11)

Modulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdfModulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdf
 
Avances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estosAvances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estos
 
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNIT
 
Avances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvanaAvances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvana
 
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdfRefrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
 
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptxEVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
 
Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21
 
How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.
 
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptxEL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
 
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptxPROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
 

Maching learning vs SSAS Data mining

  • 1. #SQSummit Maching Learning vs SSAS Data Mining Daniel Gil - DPS (dgil@solidq.com) Pau Sempere – DPA (psempere@solidq.com)
  • 2. Contenido de la sesión • Introducción • Enfrentando las herramientas • Limitaciones y diferencias • Market Basket Analysis • Clasificación • Series temporales
  • 3. Contenido de la sesión • Introducción • Enfrentando las herramientas • Limitaciones y diferencias • Market Basket Analysis • Clasificación • Series temporales
  • 4. Introducción SSAS Data Mining • On premises • Integrado en SSAS • 9 algoritmos disponibles • DMX
  • 5. Introducción Azure Machine Learning • Cloud • Múltiples orígenes, todos desde nube • Transformaciones específicas • 25+ algoritmos disponibles • Integra Python y R • Servicios web
  • 6. Contenido de la sesión • Introducción • Enfrentando las herramientas • Limitaciones y diferencias • Market Basket Analysis • Clasificación • Series temporales
  • 8. Contenido de la sesión • Introducción • Enfrentando las herramientas • Limitaciones y diferencias • Market Basket Analysis • Clasificación • Series temporales
  • 9. Diferencias - Orígenes Azure ML • Hive • SQL Database • Blob Storage • Table Storage • Odata • HTTP SSAS Data Mining • Bases de datos • Cubos SSAS
  • 10. Diferencias - Dimensionamiento Azure ML • 10 GB en total • Hay módulos que aceptan menos • Recomendadores • SMOTE • Scripts (R, Python, SQL) • Cross-validation, Tune Model Hyperparameters SSAS Data Mining • Dependiente del hardware
  • 11. Diferencias - Tiempos Azure ML • 1 hora en versión free • 7 días de ejecución • 24 horas por módulo SSAS Data Mining • Ilimitado
  • 12. Contenido de la sesión • Introducción • Enfrentando las herramientas • Limitaciones y diferencias • Market Basket Analysis • Clasificación • Series temporales
  • 13. Market Basket Analysis ¿Qué compran nuestros usuarios? ¿Cómo lo compran? ¿Siguen un patrón?
  • 14. Market Basket Analysis Usuario Producto Cantidad Dani Disfraz 1 Pau Disfraz 1 Dani Capa 1 Pau Cables 2 Pau Switch 1 Pau Capa 1 Usuario Edad Sueldo Daniel 25 Poco Pau 29 Menos aun
  • 15. Market Basket Analysis Usuario Edad Sueldo Producto Cantidad Daniel 25 Poco Disfraz 1 Capa 1 Pau 29 Menos aun Disfraz 1 Capa 1 Cables 2 Switch 1
  • 16. Market Basket Analysis • Association rules / Árboles de decisión • Podemos añadir clustering para identificar patrones de compra
  • 18. Market Basket Analysis • No hay un algoritmo específico • Preprocesado del dato para darle otra forma Matriz de productos / Usuarios Dani Pau Disfraz 1 1 Capa 1 1 Cable 0 1 Switch 0 1
  • 20. Contenido de la sesión • Introducción • Enfrentando las herramientas • Limitaciones y diferencias • Market Basket Analysis • Clasificación • Series temporales
  • 21. Clasificación • Predicción de categorías • Muerto / vivo • Solvente / deudor • Comprador / no comprador • …
  • 23. Clasificación • Varios algoritmos: • Árboles de decision • Múltiples modos de ejecución • Regresión logística • Red neural • Clustering • Análisis de precisión • Lift chart • Profit chart • Red de dependencias
  • 24. Clasificación • Múltiples algoritmos • Boosted decision tree • Red neural • Regresión logística • Máquina bayesiana • … • Análisis de precisión • ROC • Lift chart • Puntuaciones ponderadas
  • 26. Contenido de la sesión • Introducción • Enfrentando las herramientas • Limitaciones y diferencias • Market Basket Analysis • Clasificación • Series temporales
  • 27. Series temporales • Datos sobre un eje temporal / numérico • Cumplen patrones cíclicos
  • 28. Series temporales • Dos algoritmos nativos • ARTXP • ARIMA • Comprar contra casos conocidos (training-test) • Visualmente • Métricas de error
  • 29. Series temporales • No hay un algoritmo nativo • Pero siempre está …  • ARIMA • ETS • Otros • Mismo método para estimar la precision que en SSAS
  • 31. Conclusiones Azure ML • Fuentes Azure • Variedad de algoritmos • R! Python! • 100 % Online • Todo en 1 SSAS Data Mining • On premises • Sin limite de datos y tiempos • Menos algoritmos nativos • Necesidad de herramientas complementarias
  • 33. También puedes preguntar tus dudas con el hashtag #SQSummit en Twitter ADAPTIVE BI FRAMEWORK Te ayudaremos a mejorar la velocidad de desarrollo de tu plataforma de analítica de negocio basada en nuestra experiencia: •Diseña antes de construir •Automatización de procesos por ETL •Servicios de mentoring para ayudarte a conseguir mejores prácticas para la construcción de procesos específicos y plataformas de analítica de negocio •Muy fácil de mantener SOLIDQ FLEX SERVICES Con SolidQ Flex Services evitarás sustos, consiguiendo que tus sistemas sean estables. Desde una solución sencilla de monitorización, hasta un servicio de atención de incidencias 24/7, mantenimiento proactivo, resolución de problemas y línea de soporte. Todo con un coste fijo mensual… y tú dedica el tiempo a las cosas importantes. ¡Gracias!