Your SlideShare is downloading. ×

Visualización de Big Data con Power View

209

Published on

Saludos, …

Saludos,

Ing. Eduardo Castro, PhD
Microsoft SQL Server MVP
http://tinyurl.com/comunidadwindows

Published in: Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
209
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
8
Comments
0
Likes
0
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. Visualización de BigData con PowerView 28 de Agosto (12 pm GMT -5) Eduardo Castro Resúmen: En esta sesión veremos ejemplos,de como realizar análisis de big data con PowerView integrato con HDInsight y HortonWorks. Próximos Eventos Mejores prácticas de SQL Server para implementar SharePoint 3 de Septiembre David Sánchez Indices columnares en SQL Server 2014 10 de Septiembre José L. Rivera Aprendamos DAX 10 de Septiembre José Ahias López Portillo Está por comenzar:
  • 2. Visualización de Big Data con Power View 27 Agosto 2014 Eduardo Castro SQL Server MVP PASS Regional Mentor Comunidad Windows PASS Chapter
  • 3. Objetivos de la sesión Qué es Big data  Introducción a HDInsight Autoservicio de Inteligencia de Negocios (BI):  Excel 2013 PowerPivot  Excel 2013 Power View Características de BI de Excel 2013 Creación de un solución de BI con Big Data BI dentro de Excel 2013
  • 4. Qué es Big Data? Petabytes Terabytes Gigabytes Megabytes BIG DATA WEB CRM ERP Web logs Customer Touches Support Contacts Offer details Segmentation Spatial & GPS Coordinates Search Marketing Offer history A/B testing Dynamic Pricing Affiliate Networks Behavioral Targeting Dynamic Funnels User Generated Content Mobile Web Sentiment SMS/MMS External Demographics HD Video, Audio, Images Speech to Text Product/Service Logs Social Interactions & Feeds Business Data Feeds User Click Stream Sensors / RFID / Devices Incremento de variedad y cantidad de datos Transacciones + Interacciones = BIG DATA
  • 5. Dominio Escenarios de grandes volúmenes datos comunes Servicios financieros Modelado riesgo verdadero Análisis de las amenazas y detección de fraude Vigilancia Comercio El puntaje de crédito y análisis Medios y Entretenimiento Los motores de recomendación Focalización Ad Buscar calidad Los abusos y detección de fraude de clics Venta al por menor Punto de análisis de las transacciones de ventas Análisis de la pérdida de clientes El análisis de sentimientos (sentiment analysis) Telecomunicaciones Cliente prevención del churn La optimización del rendimiento de la red Detalles de llamadas (CDR) y su análisis Predicción de fallos de red Gobierno Seguridad Cibernética (botnets, fraudes) La congestión del tráfico y re-enrutamiento Monitoreo Ambiental Monitoreo Antisocial través de medios sociales Salud La investigación del genoma La investigación del cáncer Pandemias detección temprana Monitoreo de la calidad del aire
  • 6. Procesamiento de datos y análisis: The Old Way
  • 7. La naturaleza cambiante del Big Data Volumen - La cantidad de datos que han creado las empresas a través de  La web  Dispositivos móviles  Infraestructura de TI  y otras fuentes está creciendo exponencialmente cada año.
  • 8. Principales fuentes de datos Redes sociales y medios de comunicación  700 millones de usuarios de Facebook, 250 millones de usuarios de Twitter y 156 millones de blogs públicos Dispositivos móviles  Más de 5 mil millones de teléfonos móviles en uso en todo el mundo Transacciones en Internet  miles de millones de compras en línea, operaciones de bolsa y otras transacciones ocurren todos los días Dispositivos de red y sensores
  • 9. Plataforma de Big Data Micrsooft
  • 10. Integración con herramientas Microsoft Integración con las herramientas de Análisis de Microsoft DATA SYSTEMS APPLICATIONS Aplicaciones Microsoft HORTONWORKS DATA PLATFORM For Windows DATA SOURCES MOBILE DATA OLTP, POS SYSTEMS Fuentes tradicionales (RDBMS, OLTP, OLAP) Nuevas Fuentes (web logs, email, sensor data, social media)
  • 11. HADOOP PARA WINDOWS
  • 12. HDP para Windows Hortonworks Data Platform (HDP) For Windows 100% Open Source Enterprise Hadoop Manage & Operate at PLATFORM SERVICES HORTONWORKS DATA PLATFORM (HDP) For Windows HADOOP CORE DATA SERVICES Store, Process and Access Data OPERATIONAL SERVICES Manage & Operate at Scale Scale Store, Process and Access Data Distributed Storage & Processing Enterprise Readiness
  • 13. Parallel Data Warehouse HDP Windows Azure La distribución de Apache Hadoop distribución desarrollado por Hortonworks y Microsoft Integrado con Microsoft BI Microsoft HDInsight
  • 14. Big data + BI tradicional = BI Poderoso grandes cantidades de datos Microsoft HDInsight Tabular OLAP SQL 010101010101010101 1010101010101010 01010101010101 101010101010 Visualización PDW + Polibase
  • 15. Microsoft Azure HDInsight Cómo instalar un clúster HDInsight Introducción a HDFS Ejecución de una tarea de Map / Reduce El procesamiento de los datos con Pig Creación de tablas Hive Cargando Tablas Datos en Hive Consulta de Tablas con HiveQL
  • 16. Windows Azure HDInsight Service Query & Metadata: Data Movement: Workflow: Monitoring:
  • 17. Windows Azure HDInsight Service
  • 18. Creación de tablas Hive • Utilice la sentencia CREATE TABLE HiveQL • Define los metadatos del esquema que se establece sobre los datos en una carpeta cuando se consulta la table • Especifica el formato de archivo y ubicación • Por defecto el formato es un archivo secuencial en la ruta /hive/warehouse/<table_name> • Crear tablas internas o tablas externas
  • 19. Crear tabla externa CREATE EXTERNAL TABLE table_name ({<column_definition>}[,..n ]) {WITH ( DATA_SOURCE = <data_source>, FILE_FORMAT = <file_format>, LOCATION =‘<file_path>’, [REJECT_VALUE = <value>], …)}; Hacer referencia a la fuente de datos externa 1 Hacer referencia a formato de archivo externo 2 Ruta de acceso del archivo / carpeta Hadoop 3 (4 Opcional) Rechazar parámetros
  • 20. Cargando Datos en Hive • Guarde los archivos de datos en los directories para tablas • Utilice la instrucción LOAD • Mueve o copia los archivos al directorio correspondiente • Utilice la sentencia INSERT • Inserta datos de una tabla a otra
  • 21. Crear origen de datos externo CREATE EXTERNAL DATA SOURCE datasource_name {WITH ( TYPE = <data_source>, LOCATION =‘<location>’, [JOB_TRACKER_LOCATION = ‘<jb_location>’] }; 1 Tipo de fuente de datos externa 2 Lugar de origen de datos externos La activación o desactivación de la generación de trabajo MapReduce 3
  • 22. Consulta de Tablas con HiveQL • Consultar datos utilizando la sentencia TSQL SELECT • Hive traduce la consulta en tareas de Map/Reduce y aplica el esquema de la tabla a los archivos de datos
  • 23. Big Data en Excel Acceso a Hadoop o HDInsight desde Excel Uso del proveedor Hive ODBC Uso de las consultas con HDInsight
  • 24. Acceder HDInsight desde Excel • Driver Hive ODBC para HDInsight • Soporta sintaxis similar a T-SQL para consultar las tablas del clúster • Requiere un clúster HDInsight activo • PowerQuery • Soporta la importación de datos desde cualquier archivo en HDFS • Se puede utilizar cuando el clúster HDInsight está inactivo
  • 25. Instalar el Hive ODBC Driver 1. Descargue e instale el driver Hive ODBC para HDInsight 2. Crear un nombre de origen de datos (DSN) para el clúster de HDInsight 3. Utilice el Asistente para la conexión de datos en Excel para importar datos
  • 26. Importación de datos Windows Azure Marketplace En Excel • Puede importar datos de Windows Azure Marketplace directamente en Excel usando: • PowerQuery • PowerPivot • PowerView
  • 27. 28 | ecastro@simsasys.com ecastrom.blogspot.com Eduardo Castro edocastro PREGUNTAS Y RESPUESTAS
  • 28. Manténgase conectado a nosotros! Visítenos en http://globalspanish.sqlpass.org 29 /SpanishPASSVC lnkd.in/dtYBzev /user/SpanishPASSVC /SpanishPASSVC
  • 29. PASS Community News August 2014
  • 30. Planning on attending PASS Summit 2014? Start saving today! • The world’s largest gathering of SQL Server & BI professionals • Take your SQL Server skills to the next level by learning from the world’s SQL Server experts, in 190+ technical sessions • Over 5000 attendees, representing 2000 companies, from 52 countries, ready to network & learn Ask your Chapter Leader how to save $150 off registration! $1,895 UNTIL SEPTEMBER 26, 2014
  • 31. PASS Virtual Chapters Listing Check out the sqlpass.org for more information on all the Virtual Chapters: • Application Development • Big Data • Book Readers • Business Analytics • Business Intelligence • Cloud • Data Architecture • Database Administration • DBA Fundamentals • Excel BI • Healthcare • High Availability and Disaster Recovery • InMemory • Master DataData Quality • Oracle SQL • Performance • Powershell • Professional Development • Security • Virtualization • Women in Technology • Global Chinese • Global French • Global Hebrew • Global Italian • Global Portuguese • Global Russian • Global Spanish
  • 32. Virtual Chapter Meetings – August VIRTUAL CHAPTER MEETING TOPIC DBA Fundamentals Aug 5 11:00– 12:00 CDT (UTC -05:00) Rolling Upgraders, The Easy Way Presented by Argenis Fernandez Global Spanish Aug 6 12:00-12:30 (UTC -05:00) Los Caso de Uso Para In-Memory OLTP Presented by Warner Chaves Global Hebrew Aug 10 17:30-18:30 JDT (UTC +02:00) Take Your SQL Server Development Process Forward! Presented by Itai Binyamin Professional Development Aug 12 12:00-13:00 EDT (UTC -04:00) Bridging the Communication Gap Between DBA and Developer Presented by Robert Davis High Availability and Disaster Recovery Aug 12 12:00-13:00 CDT (UTC -05:00) Mirroring Start to Finish Presented by Ryan Adams
  • 33. Virtual Chapter Meetings – August VIRTUAL CHAPTER MEETING TOPIC Global Spanish Aug 13 12:00-13:00 (UTC -05:00) Haciendo Preguntas Básicas en Power BI Presented by Andrei Garzon Excel Business Intelligence Aug 14 11:00-12:00 EDT (UTC-04:00) Advanced Analytics: Excel Solver Presented by Dan Fylstra Business Intelligence Aug 14 11:00-12:00 EDT (UTC -04:00) Continuous Integration for Reporting Services Presented by Nat Sundar DBA Fundamentals Aug 19 11:00-12:00 CDT (UTC -05:00) The Roadmap to Better Performance: Reading Query Plans Presented by Erin Stellato Global Spanish Aug 20 12:00-12:30 (UTC -05:00) Fundamentos sobre lost indices end SQL Presented by Enrique Puig
  • 34. Virtual Chapter Meetings – August VIRTUAL CHAPTER MEETING TOPIC Global Russian Aug 20 15:00-16:30 (UTC +03:00) SSIS - Повышение производительности обработки потоков данных Global French Aug 21 20:00-21:00 RST (UTC +01:00) Power BI Hybride avec la Passerelle de Gestion de Données Presented by Jean-Pierre Riehl Business Analytics Aug 21 12:00-13:00 CDT (UTC -05:00) Looking Through the Windshield: Creating forward-looking Dashboards and KPI’s Presented by Brian Larson Business Intelligence Aug 27 12:00-13:00 GMT (UTC-00:00) Intro to R Presented by Stephanie Locke Global Spanish Aug 27 12:00-13:00 (UTC-05:00) Visualización de Big Data Con Power View Presented by Eduardo Castro
  • 35. Upcoming SQLSaturdays Upcoming North America Events Upcoming International Events • Aug 2 #324 Baton Rouge • Aug 9 #304 Indianapolis • Aug 23 #328 Birmingham • Aug 23 #309 Oklahoma City • Sep 6 #320 Raleigh • Sep 13 #300 Kansas City • Sep 20 #331 Denver • Sept 20 # 340 San Diego • Aug 30 #327 Johannesburg • Aug 30 #317 Oslo • Sep 6 #301 Cape Town • Sep 13 # 323 Paris • Sep 20 #290 Kiev • Sep 20 #310 Dublin • Sep 27 #325 Sao Paulo Visit www.sqlsaturday.com to register for an event near you!
  • 36. 37 Volunteering with PASS Volunteer Today! Now it’s easier than ever to volunteer with PASS. Let us know your volunteer preferences by updating the “myVolunteering” section of your myPASS profile. PASS would not exist without our passionate, dedicated, and hardworking volunteers from around the globe.
  • 37. 38 Volunteering with PASS Outstanding Volunteer Award Do you know a volunteer that has gone above and beyond recently? Nominate them for the monthly OVA. VolunteerRecognition@sqlpass.org PASSion Award The highest of PASS accolades presented yearly to a volunteer. Nominations will open in August 2014. Stay tuned!
  • 38. Stay Involved! • Sign up for a free membership today at sqlpass.org • Linked In: http://www.sqlpass.org/linkedin • Facebook: http://www.sqlpass.org/facebook • Twitter: @SQLPASS • PASS: http://www.sqlpass.org
  • 39. Programa de Reconocimiento Programa de Voluntario Sobresaliente • PASS le invita a nominar a su voluntario favorito para ser “Voluntario Sobresaliente del Mes” • Enviar nominaciones en todo momento a: VolunteerRecognition@sqlpass.org Favor proveer: • Información de contacto del nominado, • una lista breve de los programas de PASS que a participado el nominado • los años que lleva activo en la comunidad • una corta descripción por el cual considera que esta persona debe ser reconocida • Los nominados seleccionados serán anunciados en la edición del boletín PASS Connector y recibirán un certificado de apreciación.
  • 40. Mejores prácticas de SQL Server para implementar sharepoint 3 de Septiembre (12 pm GMT -5) David Sánchez Resúmen: En esta sesión tendremos la oportunidad de conocer las mejores prácticas para una implementación de SQL Server para la plataforma de SharePoint Server. Próximo Evento

×