SlideShare una empresa de Scribd logo
1 de 20
Descargar para leer sin conexión
Big Data para
Javeros con
Apache Flink
Luis O. Roldán
@cloudhispano
Yo
• Desarrollando desde 1999
• Con Java desde 2001
• En Altran desde 2007
• Participando en proyectos de I+D desde 2013
• AGILE - BIG DATA - CLOUD - IOT - JAVA - MOBILE -
NOSQL - PERFORMANCE - WEB DEV - DEVOPS
18/11/2016 Big Data para Javeros con Apache Flink 3
¿Por qué Flink?
• Java
• Big Data envy
• Cloud ready
• Comunidad
18/11/2016 Big Data para Javeros con Apache Flink 4
Historia de Flink
• 05/2011: Stratosphere 0.1
• 05/2014: Stratosphere 0.5 (Apache Incubator)
• 08/2014: Apache Flink 0.6-incubating
• 01/2015: Apache Flink 0.8-incubating
• 06/2015: Apache Flink 0.9
• 08/2016: Apache Flink 1.1
• 12/10/2016: Apache Flink 1.1.3
18/11/2016 Big Data para Javeros con Apache Flink 5
Intro de flink
• Apache Flink es una plataforma Open Source
• Procesado distribuido de datos tanto en
Stream como en Batch.
– Comunicación.
– Tolerancia a fallos.
– Gestión de memoria.
– Optimización del Job.
18/11/2016 Big Data para Javeros con Apache Flink 6
Deploy
• Local
• Cluster
– Standalone
– YARN
• Cloud
– GCE
– EC2
– Amazon Elastic MapReduce (EMR)
18/11/2016 Big Data para Javeros con Apache Flink 7
Core
18/11/2016 Big Data para Javeros con Apache Flink 8
• La capa de Runtime recibe un programa en
forma de gráfico de tareas. Un Job Graph es
un flujo de datos paralelo genérico con tareas
arbitrarias que consumen y producen flujos de
datos.
APIs: Batch y Streaming
Batch
• DataSet Transformations
• File systems:
– Hadoop Distributed File
System (HDFS)
– Amazon S3
– MapR file system
– Alluxio
– ¿MongoDB?
Streaming
• DataStream Windows
• Connectores:
– Apache Kafka (sink/source)
– Elasticsearch (sink)
– Elasticsearch 2x (sink)
– Hadoop FileSystem (sink)
– RabbitMQ (sink/source)
– Amazon Kinesis Streams
(sink/source)
– Twitter Streaming API (source)
– Apache NiFi (sink/source)
– Apache Cassandra (sink)
– Redis (sink)
18/11/2016 Big Data para Javeros con Apache Flink 9
Librerías
• El stack de Flink ofrece bibliotecas de alto
nivel para diferentes casos de uso:
– Procesamiento de eventos complejos (CEP)
– Aprendizaje automático (FlinkML)
– Análisis gráfico (Gelly)
– Consultas relacionales (Table)
18/11/2016 Big Data para Javeros con Apache Flink 10
Casos de uso: Play
18/11/2016 Big Data para Javeros con Apache Flink 11
Casos de uso: Bond
18/11/2016 Big Data para Javeros con Apache Flink 12
Casos de uso: Bond
18/11/2016 Big Data para Javeros con Apache Flink 13
HeatMap example
18/11/2016 Big Data para Javeros con Apache Flink 14
HeatMap example
18/11/2016 Big Data para Javeros con Apache Flink 15
HeatMap example
18/11/2016 Big Data para Javeros con Apache Flink 16
HeatMap example
18/11/2016 Big Data para Javeros con Apache Flink 17
Contras
• Apoyo de las distribuciones Hadoop
(Cloudera, MapR, etc)
• FlinkML: Faltan algoritmos “potentes”
• Third party packages: Evolucionando…
18/11/2016 Big Data para Javeros con Apache Flink 18
Pros
• Es JAVA!
• Streaming First
• Arquitectura Lambda
18/11/2016 Big Data para Javeros con Apache Flink 19
¿Preguntas?
18/11/2016 Big Data para Javeros con Apache Flink 20
18/11/2016 Big Data para Javeros con Apache Flink 21

Más contenido relacionado

Similar a Codemotion 2016 - Big Data para Javeros con Apache Flink

Embrapa ribda-2009-es2
Embrapa ribda-2009-es2Embrapa ribda-2009-es2
Embrapa ribda-2009-es2RIBDA 2009
 
Polybase
PolybasePolybase
PolybaseSolidQ
 
Plataforma de desarrollo
Plataforma de desarrolloPlataforma de desarrollo
Plataforma de desarrolloosvaldo molina
 
Fi ware en Hack for good (#H4G)
Fi ware en Hack for good  (#H4G) Fi ware en Hack for good  (#H4G)
Fi ware en Hack for good (#H4G) Joaquín Salvachúa
 
Industry 4.0 y Big Data ¿Quién está accediendo a tus datos?
Industry 4.0 y Big Data ¿Quién está accediendo a tus datos?Industry 4.0 y Big Data ¿Quién está accediendo a tus datos?
Industry 4.0 y Big Data ¿Quién está accediendo a tus datos?Iñaki Garitano
 
Industry 4.0 y Big Data. ¿Quién está accediendo a tus datos? - LibreCon 2016
Industry 4.0 y Big Data. ¿Quién está accediendo a tus datos? - LibreCon 2016Industry 4.0 y Big Data. ¿Quién está accediendo a tus datos? - LibreCon 2016
Industry 4.0 y Big Data. ¿Quién está accediendo a tus datos? - LibreCon 2016LibreCon
 
Mirando a Alfresco desde Minecraft
Mirando a Alfresco desde MinecraftMirando a Alfresco desde Minecraft
Mirando a Alfresco desde MinecraftAngel Borroy López
 
Conociendo los servicios adicionales en big data
Conociendo los servicios adicionales en big dataConociendo los servicios adicionales en big data
Conociendo los servicios adicionales en big dataSpanishPASSVC
 

Similar a Codemotion 2016 - Big Data para Javeros con Apache Flink (20)

Embrapa ribda-2009-es2
Embrapa ribda-2009-es2Embrapa ribda-2009-es2
Embrapa ribda-2009-es2
 
Aula virtual apache_hadoop_v3 1
Aula virtual apache_hadoop_v3 1Aula virtual apache_hadoop_v3 1
Aula virtual apache_hadoop_v3 1
 
Introducción a Hadoop
Introducción a HadoopIntroducción a Hadoop
Introducción a Hadoop
 
Polybase
PolybasePolybase
Polybase
 
Apache
ApacheApache
Apache
 
Plataforma de desarrollo
Plataforma de desarrolloPlataforma de desarrollo
Plataforma de desarrollo
 
Fi ware en Hack for good (#H4G)
Fi ware en Hack for good  (#H4G) Fi ware en Hack for good  (#H4G)
Fi ware en Hack for good (#H4G)
 
Tipos de sistemas de información
Tipos de sistemas de informaciónTipos de sistemas de información
Tipos de sistemas de información
 
Koha biblioteca nacional v3
Koha biblioteca nacional v3Koha biblioteca nacional v3
Koha biblioteca nacional v3
 
SGBD y tecnologías de aplicaciones web 2.0
SGBD y tecnologías de aplicaciones web 2.0SGBD y tecnologías de aplicaciones web 2.0
SGBD y tecnologías de aplicaciones web 2.0
 
Industry 4.0 y Big Data ¿Quién está accediendo a tus datos?
Industry 4.0 y Big Data ¿Quién está accediendo a tus datos?Industry 4.0 y Big Data ¿Quién está accediendo a tus datos?
Industry 4.0 y Big Data ¿Quién está accediendo a tus datos?
 
Industry 4.0 y Big Data. ¿Quién está accediendo a tus datos? - LibreCon 2016
Industry 4.0 y Big Data. ¿Quién está accediendo a tus datos? - LibreCon 2016Industry 4.0 y Big Data. ¿Quién está accediendo a tus datos? - LibreCon 2016
Industry 4.0 y Big Data. ¿Quién está accediendo a tus datos? - LibreCon 2016
 
Hadoop: tecnologias relacionadas
Hadoop: tecnologias relacionadasHadoop: tecnologias relacionadas
Hadoop: tecnologias relacionadas
 
SOFTWARE APACHE.
SOFTWARE APACHE.SOFTWARE APACHE.
SOFTWARE APACHE.
 
Mirando a Alfresco desde Minecraft
Mirando a Alfresco desde MinecraftMirando a Alfresco desde Minecraft
Mirando a Alfresco desde Minecraft
 
Presentación1
Presentación1Presentación1
Presentación1
 
OpenShift y PostgreSQL
OpenShift y PostgreSQLOpenShift y PostgreSQL
OpenShift y PostgreSQL
 
Conociendo los servicios adicionales en big data
Conociendo los servicios adicionales en big dataConociendo los servicios adicionales en big data
Conociendo los servicios adicionales en big data
 
Big data2
Big data2Big data2
Big data2
 
software APACHE.
software APACHE.software APACHE.
software APACHE.
 

Último

ROMA Y EL IMPERIO, CIUDADES ANTIGUA ROMANAS
ROMA Y EL  IMPERIO, CIUDADES  ANTIGUA ROMANASROMA Y EL  IMPERIO, CIUDADES  ANTIGUA ROMANAS
ROMA Y EL IMPERIO, CIUDADES ANTIGUA ROMANASanyahelmont
 
Letra de cambio definición y características.ppt
Letra de cambio definición y características.pptLetra de cambio definición y características.ppt
Letra de cambio definición y características.pptssuserbdc329
 
EPIDEMIO CANCER PULMON resumen nnn.pptx
EPIDEMIO CANCER PULMON  resumen nnn.pptxEPIDEMIO CANCER PULMON  resumen nnn.pptx
EPIDEMIO CANCER PULMON resumen nnn.pptxJEFFERSONMEDRANOCHAV
 
02 protocolo en caso de robo o asalto.pdf
02 protocolo en caso de robo o asalto.pdf02 protocolo en caso de robo o asalto.pdf
02 protocolo en caso de robo o asalto.pdfguillermobernalocamp1
 
Los idiomas más hablados en el mundo (2024).pdf
Los idiomas más hablados en el mundo  (2024).pdfLos idiomas más hablados en el mundo  (2024).pdf
Los idiomas más hablados en el mundo (2024).pdfJC Díaz Herrera
 
decreto 2090 de 2003.pdf actividades de alto riesgo en Colombia
decreto 2090 de 2003.pdf actividades de alto riesgo en Colombiadecreto 2090 de 2003.pdf actividades de alto riesgo en Colombia
decreto 2090 de 2003.pdf actividades de alto riesgo en Colombiaveronicayarpaz
 
max-weber-principales-aportes de la sociologia (2).pptx
max-weber-principales-aportes de la sociologia (2).pptxmax-weber-principales-aportes de la sociologia (2).pptx
max-weber-principales-aportes de la sociologia (2).pptxMarioKing10
 
Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1alfredo130306
 
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024IrapuatoCmovamos
 
Conversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latinoConversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latinoBESTTech1
 
Adultos Mayores más de 60 años como de la población total (2024).pdf
Adultos Mayores más de 60 años como  de la población total (2024).pdfAdultos Mayores más de 60 años como  de la población total (2024).pdf
Adultos Mayores más de 60 años como de la población total (2024).pdfJC Díaz Herrera
 
Perú en el ranking mundial, segun datos mineria
Perú en el ranking mundial, segun datos mineriaPerú en el ranking mundial, segun datos mineria
Perú en el ranking mundial, segun datos mineriaItalo838444
 
Los primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdfLos primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdfJC Díaz Herrera
 
P.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptx
P.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptxP.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptx
P.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptxJafetColli
 
Análisis del Modo y Efecto de Fallas AMEF.ppt
Análisis del Modo y Efecto de Fallas AMEF.pptAnálisis del Modo y Efecto de Fallas AMEF.ppt
Análisis del Modo y Efecto de Fallas AMEF.pptProduvisaCursos
 
6.3 Hidrologia Geomorfologia Cuenca.pptx
6.3 Hidrologia Geomorfologia Cuenca.pptx6.3 Hidrologia Geomorfologia Cuenca.pptx
6.3 Hidrologia Geomorfologia Cuenca.pptxBrallanDanielRamrezS
 
procedimiento paran la planificación en los centros educativos tipo v(multig...
procedimiento  paran la planificación en los centros educativos tipo v(multig...procedimiento  paran la planificación en los centros educativos tipo v(multig...
procedimiento paran la planificación en los centros educativos tipo v(multig...claudioluna1121
 
MARCO TEORICO, SEMINARIO DE INVESTIGACION,
MARCO TEORICO, SEMINARIO DE INVESTIGACION,MARCO TEORICO, SEMINARIO DE INVESTIGACION,
MARCO TEORICO, SEMINARIO DE INVESTIGACION,EmmanuelDelJessGonza
 
aine-2014.pdf/tipos de aines-clasificación
aine-2014.pdf/tipos de aines-clasificaciónaine-2014.pdf/tipos de aines-clasificación
aine-2014.pdf/tipos de aines-clasificaciónJhon Jimenez
 
PRESENTACIÓN DR. ÓSCAR CABRERA - Visión Económica de El Salvador.pptx
PRESENTACIÓN DR. ÓSCAR CABRERA - Visión Económica de El Salvador.pptxPRESENTACIÓN DR. ÓSCAR CABRERA - Visión Económica de El Salvador.pptx
PRESENTACIÓN DR. ÓSCAR CABRERA - Visión Económica de El Salvador.pptxMiguelHernndez589343
 

Último (20)

ROMA Y EL IMPERIO, CIUDADES ANTIGUA ROMANAS
ROMA Y EL  IMPERIO, CIUDADES  ANTIGUA ROMANASROMA Y EL  IMPERIO, CIUDADES  ANTIGUA ROMANAS
ROMA Y EL IMPERIO, CIUDADES ANTIGUA ROMANAS
 
Letra de cambio definición y características.ppt
Letra de cambio definición y características.pptLetra de cambio definición y características.ppt
Letra de cambio definición y características.ppt
 
EPIDEMIO CANCER PULMON resumen nnn.pptx
EPIDEMIO CANCER PULMON  resumen nnn.pptxEPIDEMIO CANCER PULMON  resumen nnn.pptx
EPIDEMIO CANCER PULMON resumen nnn.pptx
 
02 protocolo en caso de robo o asalto.pdf
02 protocolo en caso de robo o asalto.pdf02 protocolo en caso de robo o asalto.pdf
02 protocolo en caso de robo o asalto.pdf
 
Los idiomas más hablados en el mundo (2024).pdf
Los idiomas más hablados en el mundo  (2024).pdfLos idiomas más hablados en el mundo  (2024).pdf
Los idiomas más hablados en el mundo (2024).pdf
 
decreto 2090 de 2003.pdf actividades de alto riesgo en Colombia
decreto 2090 de 2003.pdf actividades de alto riesgo en Colombiadecreto 2090 de 2003.pdf actividades de alto riesgo en Colombia
decreto 2090 de 2003.pdf actividades de alto riesgo en Colombia
 
max-weber-principales-aportes de la sociologia (2).pptx
max-weber-principales-aportes de la sociologia (2).pptxmax-weber-principales-aportes de la sociologia (2).pptx
max-weber-principales-aportes de la sociologia (2).pptx
 
Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1
 
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
 
Conversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latinoConversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latino
 
Adultos Mayores más de 60 años como de la población total (2024).pdf
Adultos Mayores más de 60 años como  de la población total (2024).pdfAdultos Mayores más de 60 años como  de la población total (2024).pdf
Adultos Mayores más de 60 años como de la población total (2024).pdf
 
Perú en el ranking mundial, segun datos mineria
Perú en el ranking mundial, segun datos mineriaPerú en el ranking mundial, segun datos mineria
Perú en el ranking mundial, segun datos mineria
 
Los primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdfLos primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdf
 
P.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptx
P.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptxP.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptx
P.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptx
 
Análisis del Modo y Efecto de Fallas AMEF.ppt
Análisis del Modo y Efecto de Fallas AMEF.pptAnálisis del Modo y Efecto de Fallas AMEF.ppt
Análisis del Modo y Efecto de Fallas AMEF.ppt
 
6.3 Hidrologia Geomorfologia Cuenca.pptx
6.3 Hidrologia Geomorfologia Cuenca.pptx6.3 Hidrologia Geomorfologia Cuenca.pptx
6.3 Hidrologia Geomorfologia Cuenca.pptx
 
procedimiento paran la planificación en los centros educativos tipo v(multig...
procedimiento  paran la planificación en los centros educativos tipo v(multig...procedimiento  paran la planificación en los centros educativos tipo v(multig...
procedimiento paran la planificación en los centros educativos tipo v(multig...
 
MARCO TEORICO, SEMINARIO DE INVESTIGACION,
MARCO TEORICO, SEMINARIO DE INVESTIGACION,MARCO TEORICO, SEMINARIO DE INVESTIGACION,
MARCO TEORICO, SEMINARIO DE INVESTIGACION,
 
aine-2014.pdf/tipos de aines-clasificación
aine-2014.pdf/tipos de aines-clasificaciónaine-2014.pdf/tipos de aines-clasificación
aine-2014.pdf/tipos de aines-clasificación
 
PRESENTACIÓN DR. ÓSCAR CABRERA - Visión Económica de El Salvador.pptx
PRESENTACIÓN DR. ÓSCAR CABRERA - Visión Económica de El Salvador.pptxPRESENTACIÓN DR. ÓSCAR CABRERA - Visión Económica de El Salvador.pptx
PRESENTACIÓN DR. ÓSCAR CABRERA - Visión Económica de El Salvador.pptx
 

Codemotion 2016 - Big Data para Javeros con Apache Flink

  • 1. Big Data para Javeros con Apache Flink Luis O. Roldán @cloudhispano
  • 2. Yo • Desarrollando desde 1999 • Con Java desde 2001 • En Altran desde 2007 • Participando en proyectos de I+D desde 2013 • AGILE - BIG DATA - CLOUD - IOT - JAVA - MOBILE - NOSQL - PERFORMANCE - WEB DEV - DEVOPS 18/11/2016 Big Data para Javeros con Apache Flink 3
  • 3. ¿Por qué Flink? • Java • Big Data envy • Cloud ready • Comunidad 18/11/2016 Big Data para Javeros con Apache Flink 4
  • 4. Historia de Flink • 05/2011: Stratosphere 0.1 • 05/2014: Stratosphere 0.5 (Apache Incubator) • 08/2014: Apache Flink 0.6-incubating • 01/2015: Apache Flink 0.8-incubating • 06/2015: Apache Flink 0.9 • 08/2016: Apache Flink 1.1 • 12/10/2016: Apache Flink 1.1.3 18/11/2016 Big Data para Javeros con Apache Flink 5
  • 5. Intro de flink • Apache Flink es una plataforma Open Source • Procesado distribuido de datos tanto en Stream como en Batch. – Comunicación. – Tolerancia a fallos. – Gestión de memoria. – Optimización del Job. 18/11/2016 Big Data para Javeros con Apache Flink 6
  • 6. Deploy • Local • Cluster – Standalone – YARN • Cloud – GCE – EC2 – Amazon Elastic MapReduce (EMR) 18/11/2016 Big Data para Javeros con Apache Flink 7
  • 7. Core 18/11/2016 Big Data para Javeros con Apache Flink 8 • La capa de Runtime recibe un programa en forma de gráfico de tareas. Un Job Graph es un flujo de datos paralelo genérico con tareas arbitrarias que consumen y producen flujos de datos.
  • 8. APIs: Batch y Streaming Batch • DataSet Transformations • File systems: – Hadoop Distributed File System (HDFS) – Amazon S3 – MapR file system – Alluxio – ¿MongoDB? Streaming • DataStream Windows • Connectores: – Apache Kafka (sink/source) – Elasticsearch (sink) – Elasticsearch 2x (sink) – Hadoop FileSystem (sink) – RabbitMQ (sink/source) – Amazon Kinesis Streams (sink/source) – Twitter Streaming API (source) – Apache NiFi (sink/source) – Apache Cassandra (sink) – Redis (sink) 18/11/2016 Big Data para Javeros con Apache Flink 9
  • 9. Librerías • El stack de Flink ofrece bibliotecas de alto nivel para diferentes casos de uso: – Procesamiento de eventos complejos (CEP) – Aprendizaje automático (FlinkML) – Análisis gráfico (Gelly) – Consultas relacionales (Table) 18/11/2016 Big Data para Javeros con Apache Flink 10
  • 10. Casos de uso: Play 18/11/2016 Big Data para Javeros con Apache Flink 11
  • 11. Casos de uso: Bond 18/11/2016 Big Data para Javeros con Apache Flink 12
  • 12. Casos de uso: Bond 18/11/2016 Big Data para Javeros con Apache Flink 13
  • 13. HeatMap example 18/11/2016 Big Data para Javeros con Apache Flink 14
  • 14. HeatMap example 18/11/2016 Big Data para Javeros con Apache Flink 15
  • 15. HeatMap example 18/11/2016 Big Data para Javeros con Apache Flink 16
  • 16. HeatMap example 18/11/2016 Big Data para Javeros con Apache Flink 17
  • 17. Contras • Apoyo de las distribuciones Hadoop (Cloudera, MapR, etc) • FlinkML: Faltan algoritmos “potentes” • Third party packages: Evolucionando… 18/11/2016 Big Data para Javeros con Apache Flink 18
  • 18. Pros • Es JAVA! • Streaming First • Arquitectura Lambda 18/11/2016 Big Data para Javeros con Apache Flink 19
  • 19. ¿Preguntas? 18/11/2016 Big Data para Javeros con Apache Flink 20
  • 20. 18/11/2016 Big Data para Javeros con Apache Flink 21