Cómo empezar a implementar proyectos Big Data en tu organización

3,635 views

Published on

Presentación de Sonia Sánchez de BEEVA para Foro IT sobre Big Data aplicado al Business Intelligence.

Published in: Data & Analytics

Cómo empezar a implementar proyectos Big Data en tu organización

  1. 1. [+34] 902 20 25 52 hablemos@beeva.com www.beeva.com
  2. 2. 2014 2 BIG DATA bla, bla, bla bla, bla, Bla, bla, bla bla bla, bla, bla, bla bla, bla
  3. 3. 2014 3 + - +- descriptive analytics predictive analytics DataVariety&Volume structured data unstructured data Big Data Analytics Big Data Models Performance Mgmt Data Mining • Pattern-Based Analysis • Textual Analysis • Sentiment Analysis • Social Analysis • Visual Data Analysis… • OLAP • Relational DDBB / SQL • Reporting • Descriptive Statistics • Predictive BI • Regression Analysis • Cluster Analysis • Anomaly Detection • Decision Support • Machine Learning • Unstructured Data Mining • Statistical Pattern Matching • Metric Learning • …
  4. 4. 2014 4 VOLUMEN CRECIMIENTO INFORMACIÓN MEGAS GIGAS TERAS EXABYTES, PETABYTES VARIEDAD NUEVAS FUENTES Fuentes tradicionales: Clientes, Catalogo, Ventas CRM CDRs, Transacciones, detalle de fuentes operacionales Total de fuentes Internas sin agregar , Logs, smart meters Fuentes externas VELOCIDAD REFRESCO INFORMACIÓN PUNTUAL PERIÓDICO NEAR REAL TIME REAL TIME PROCESAMIENTO BATCH STREAMING DATA REPORTING EXCELES INFORMES MONITORIZACIÓN PREDICCIÓN
  5. 5. 2014 5
  6. 6. 2014 6 Fuentes de datos internas, limitadas y ya estructuradas Necesidad de crear hechos y dimensiones por limitaciones tecnológicas Problemas en ETL = Cuello de botella Reducción/ Racionalización de costes Alto coste Vendor lock-in
  7. 7. 2014 7 Agilidad para nuevos desarrollos, pruebas, pilotos, procesos puntuales Bajo rendimiento en consultas La mayoría de la analítica es descriptiva o reporting La preparación de datos para modelos analíticos es lenta Analistas separados de los responsables de negocio Time-to-market lento
  8. 8. 2014 8 Dar respuesta al Negocio, sin limitar la visión de negocio Acceso total a la información: “High resolution view” Perfiles avanzados: Data Scientists Paralelización de procesos Modelización predictiva Necesidades de Negocio no son homogéneas
  9. 9. 2014 9  Escalable  Flexible  Modular  Coste Racional  Rendimiento óptimo en los procesos  Permitir que la información fluya a lo largo de todas las áreas.
  10. 10. 2014 10 Nuevos modelos de negocio basados en datos Nuevos servicios, productos y venta de datos a terceros Transformación de los modelos de negocio Optimización de la cadena de valor gracias a los datos C D 2. Transformación de los negocios1. Analítica avanzada Plataforma analítica Optimización de los procesos core y la operativa diaria A Analítica estratégica Insights para la resolución de nuevos problemas o desafíos B
  11. 11. 2014 11 ↑ ↑ ↓
  12. 12. 2014 12 Extracción y carga de archivosETL CRM Legacy Supply Chain ERP SW de 3ºs Social Media Webs Logs Texto Sensores BI Tools Developer Tools Power User Business User Desarrollador Data Scientist Datos tratados Data Warehouse RDBMS Capa de Servicio Vistas de negocio Hadoop Plataforma Analítica Big Data Business User BI Tools
  13. 13. 2014 13 SW de 3ºs ERP Supply Chain Legacy Data Mart 1…N ETL Fuentes ODS Business Warehouse Explotación Plataforma BI Estándard BI / Data Analysts End users Regulatorio Otros Sistemas… Salidas CRM ETL MdN Data Warehouse RDBMS
  14. 14. 2014 14 ETL EMR Data Pipeline AWS S3 Extrac,CargayProcesam. Carga  Ejemplo: Cálculo de indicadores o variables en la nube. Descarga de trabajo a plataforma informacional. Optimización uso de ventana Batch Data Platform de BEEVA SW de 3ºs ERP Supply Chain Legacy Data Mart 1…N ETL Fuentes ODS Business Warehouse Explotación Plataforma BI Estándard BI / Data Analysts End users Regulatorio Otros Sistemas… Salidas CRM ETL MdN Data Warehouse RDBMS
  15. 15. 2014 15 Amazon Redshift DynamoDB  Ejemplo: Informacionales departamentales con necesidades especificas en la nube. Data Platform de BEEVA SW de 3ºs ERP Supply Chain Legacy Data Mart 1…N ETL Fuentes ODS Business Warehouse Explotación Plataforma BI Estándard BI / Data Analysts End users Regulatorio Otros Sistemas… Salidas CRM ETL MdN Data Warehouse RDBMS ETL EMR Data Pipeline AWS S3 Extrac,CargayProcesam. Carga
  16. 16. 2014 16 Data Platform de BEEVA BI / Data Analysts End users APIsDesarrolladorLogs, text, IoT Nuevos canales  Ejemplo: Cálculo gestión riesgos en la nube. Enriquecimiento datos de cliente con este indicador. Nuevas fuentes SW de 3ºs ERP Supply Chain Legacy Data Mart 1…N ETL Fuentes ODS Business Warehouse Explotación Plataforma BI Estándard BI / Data Analysts End users Regulatorio Otros Sistemas… Salidas CRM ETL MdN Data Warehouse RDBMS Amazon Redshift DynamoDB Data Pipeline ETL EMR AWS S3 Extrac,CargayProcesam. Carga Federación de DWHs
  17. 17. 2014 17          
  18. 18. 2014 18
  19. 19. 2014 19 ENCUÉNTRANOS EN… CALLE CLARA DEL REY, 26 28002 MADRID 902 20 25 52 hablemos@beeva.es www.beeva.es @beeva_es

×