SlideShare a Scribd company logo
1 of 27
Download to read offline
Técnicas de Inyección / Extracción de Datos en #BigData
+
Técnicas Drag & Drop en Apache Cassandra
@javituiter	
  
www.franciscojavierpulido.com	
  
@exploradata	
  
www.exploradata.com	
  
Sobre mí
Graduado	
  en	
  
Ingeniera	
  del	
  
So;ware	
  
Master	
  en	
  
Sistemas	
  en	
  
Ingeniería	
  de	
  la	
  
Información	
  
Big	
  Data	
  Specialist	
  
www.ExploraData.com	
  
Bloguero	
  
&	
  
Tuitero	
  
ExploraBrand: Marketing Digital
www.explorabrand.com	
  
Inyección/Extracción
de Datos en #BigData
Inyección / Extracción de datos en #BigData
Inyección / Extracción de datos en #BigData
Inyección / Extracción de datos en #BigData
Inyección/Extracción
de Datos
en Cassandra
Inyección / Extración de datos en Cassandra
Comando	
  COPY	
  
Inyección / Extración de datos en Cassandra
Comando	
  COPY	
  
-­‐  Desarrollar	
  desde	
  0	
  un	
  programa	
  para	
  lanzar	
  múlMples	
  
instancias	
  del	
  comando	
  (secuencialmente,	
  ya	
  que	
  
paralelamente	
  estaba	
  sujeto	
  a	
  errores	
  de	
  
concurrencia)	
  
-­‐  Paralelizable	
  en	
  varios	
  nodos	
  manualmente	
  
-­‐  Limitado	
  a	
  500.000	
  registros	
  por	
  hilo/lanzamiento	
  
Inyección / Extración de datos en Cassandra
Apache	
  Sqoop	
  
·∙	
  Relacional	
  
·∙	
  NoSQL	
  
·∙	
  Relacional	
  
·∙	
  NoSQL	
  
Hadoop	
  
Inyección / Extración de datos en Cassandra
Apache	
  Flume	
  
-­‐  Herramienta	
  exclusiva	
  para	
  la	
  etapa	
  de	
  
Obtención	
  de	
  datos	
  
-­‐  Source	
  
-­‐  Channel	
  
-­‐  Sink	
  
-­‐  Interceptor	
  
Inyección / Extración de datos en Cassandra
Apache	
  Flume	
  
Channel	
  1	
  
Channel	
  N	
  
Source	
  1	
   .	
  
.	
  
.	
  
.	
  
.	
  
.	
  
Source	
  2	
  
Sink	
  1	
  
Sink	
  2	
  
Inyección / Extración de datos en Cassandra
Apache	
  Flume	
  
Inyección / Extración de datos en Cassandra
Apache	
  Flume	
  
+	
  Sink	
  a	
  Cassandra	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  
Personalizado	
  
hbp://www.treselle.com/blog/flume-­‐with-­‐
cassandra-­‐integraMon	
  	
  
Inyección / Extración de datos en Cassandra
DataStax:	
  SSTableLoader	
  
Técnicas Drag&Drop
en Cassandra
Técnicas Drag&Drop en Cassandra
ETL	
  
•  Extraer, Transformar y Cargar (Load). En definitiva:
•  Extraer datos de múltiples fuentes
• Aplicar calidad y consistencia (limpiar) a los datos
•  Conformar (unificar) los datos
•  Cargar los datos en un DW
•  La idea de Flujo.
• Actividad inicial y con ejecución periódica/programable.
•  Herramientas: Talend, JasperSoft, Pentaho Data Integration
Técnicas Drag&Drop en Cassandra
Pentaho	
  Data	
  IntegraMon	
  
•  PDI es un set de herramientas, que permite diseñar ETLs, mediante
transformaciones y trabajos que pueden ser ejecutadas por las herramientas de
Spoon, Pan y Kitchen. Antes se le conocía con el nombre de Kettle.
•  Spoon interfaz gráfica para diseño de trasformaciones y trabajos ETL.
•  Pan es un motor capaz de ejecutar múltiples transformaciones de datos como leer, manipular y
escribir desde y en distintos orígenes de datos.
•  Kitchen es un programa que ejecuta los trabajos diseñados por Spoon. Normalmente estos
trabajos son planificados en modo batch para ejecutar automáticamente a periodos regulares
(crontab -e).
Técnicas Drag&Drop en Cassandra
Técnicas Drag&Drop en Cassandra
Conectores	
  Big	
  Data	
  en	
  PDI	
  
•  En PDI tenemos múltiples conectores para sistemas Big Data:
• AVRO
•  Cassandra
•  CouchDB
•  Hadoop
•  Hbase
•  Map Reduce
•  MongoDB
Técnicas Drag&Drop en Cassandra
Cassandra	
  en	
  PDI	
  
• Tenemos tres tipos de “pasos” para Apache Cassandra:
•  Cassandra Input: se utiliza para realizar lecturas
•  Cassandra Output: se utiliza para realizar escrituras
•  SSTable Output: se utiliza para volcar a una SSTable de Cassandra.
•  Requisitos:
• Apache Cassandra 1.2.X
•  PDI 5.0.1 Stable
•  Librerías oficiales de Apache Cassandra para PDI
•  Limitaciones:
•  Los “pasos” funcionan correctamente con hasta 500K registros
Técnicas Drag&Drop en Cassandra
Cassandra	
  Input	
  
Técnicas Drag&Drop en Cassandra
Cassandra	
  Output	
  
Técnicas Drag&Drop en Cassandra
SSTable	
  Output	
  
*	
  Este	
  paso	
  necesita	
  ser	
  ejecutado	
  siempre	
  en	
  un	
  nodo	
  de	
  Cassandra.	
  
PDI en Acción
?	
  
¿ Dudas ?
@javituiter	
  
www.franciscojavierpulido.com	
  
@exploradata	
  
www.exploradata.com	
  

More Related Content

What's hot

Big data para desarrolladores utilizando hadoop y openstack
Big data para desarrolladores utilizando hadoop y openstack Big data para desarrolladores utilizando hadoop y openstack
Big data para desarrolladores utilizando hadoop y openstack Guillermo Alvarado Mejía
 
El mundo Big Data y las APIs
El mundo Big Data y las APIsEl mundo Big Data y las APIs
El mundo Big Data y las APIsBig Data Spain
 
Monta una Infraestructura Big Data para tu Empresa - Sesión I
Monta una Infraestructura Big Data para tu Empresa - Sesión IMonta una Infraestructura Big Data para tu Empresa - Sesión I
Monta una Infraestructura Big Data para tu Empresa - Sesión IUrko Zurutuza
 

What's hot (7)

Introducción a hadoop
Introducción a hadoopIntroducción a hadoop
Introducción a hadoop
 
Big data para desarrolladores utilizando hadoop y openstack
Big data para desarrolladores utilizando hadoop y openstack Big data para desarrolladores utilizando hadoop y openstack
Big data para desarrolladores utilizando hadoop y openstack
 
Hadoop
HadoopHadoop
Hadoop
 
El mundo Big Data y las APIs
El mundo Big Data y las APIsEl mundo Big Data y las APIs
El mundo Big Data y las APIs
 
Introducción a Hadoop
Introducción a HadoopIntroducción a Hadoop
Introducción a Hadoop
 
Hadoop en accion
Hadoop en accionHadoop en accion
Hadoop en accion
 
Monta una Infraestructura Big Data para tu Empresa - Sesión I
Monta una Infraestructura Big Data para tu Empresa - Sesión IMonta una Infraestructura Big Data para tu Empresa - Sesión I
Monta una Infraestructura Big Data para tu Empresa - Sesión I
 

Similar to Cassandra Meet Up Noviembre - Drag & Drop Techs With Cassandra

Tecnicas Big Data: Meetup Cassandra
Tecnicas Big Data: Meetup CassandraTecnicas Big Data: Meetup Cassandra
Tecnicas Big Data: Meetup CassandraStratebi
 
Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...Joseph Lopez
 
Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...Joseph Lopez
 
Why Apache Flink is better than Spark by Rubén Casado
Why Apache Flink is better than Spark by Rubén CasadoWhy Apache Flink is better than Spark by Rubén Casado
Why Apache Flink is better than Spark by Rubén CasadoBig Data Spain
 
Herramientas de visualización de datos
Herramientas de visualización de datosHerramientas de visualización de datos
Herramientas de visualización de datosBBVA API Market
 
SPS Madrid 2019 - Eleva tu aplicaciones de PowerApps a otro nivel
SPS Madrid 2019 - Eleva tu aplicaciones de PowerApps a otro nivelSPS Madrid 2019 - Eleva tu aplicaciones de PowerApps a otro nivel
SPS Madrid 2019 - Eleva tu aplicaciones de PowerApps a otro nivelImanol Iza Martin
 
Analitica y toma de decisiones en tiempo real sobre plataformas big data
Analitica y toma de decisiones en tiempo real sobre plataformas big dataAnalitica y toma de decisiones en tiempo real sobre plataformas big data
Analitica y toma de decisiones en tiempo real sobre plataformas big dataJosé Carlos García Serrano
 
Introducción a Apache Spark
Introducción a Apache SparkIntroducción a Apache Spark
Introducción a Apache SparkSocialmetrix
 
Polybase
PolybasePolybase
PolybaseSolidQ
 
Comparativa herramientas ETL
Comparativa herramientas ETLComparativa herramientas ETL
Comparativa herramientas ETLJorge Bustillos
 
Pizza Fast Assistant Presentación de Proyecto
Pizza Fast Assistant Presentación de ProyectoPizza Fast Assistant Presentación de Proyecto
Pizza Fast Assistant Presentación de ProyectoEdisson Loja
 
Empleos con futuro. Perfil de un ingeniero de datos
Empleos con futuro. Perfil de un ingeniero de datosEmpleos con futuro. Perfil de un ingeniero de datos
Empleos con futuro. Perfil de un ingeniero de datosAntonio Santos Ramos
 
M04 09 20_v05_plataformas_bd
M04 09 20_v05_plataformas_bdM04 09 20_v05_plataformas_bd
M04 09 20_v05_plataformas_bdrussellmrr
 

Similar to Cassandra Meet Up Noviembre - Drag & Drop Techs With Cassandra (20)

Tecnicas Big Data: Meetup Cassandra
Tecnicas Big Data: Meetup CassandraTecnicas Big Data: Meetup Cassandra
Tecnicas Big Data: Meetup Cassandra
 
Scala@real life
Scala@real lifeScala@real life
Scala@real life
 
Scala @ Real life
Scala @ Real lifeScala @ Real life
Scala @ Real life
 
Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...
 
DBA del Futuro (Un nuevo paradigma)
DBA del Futuro (Un nuevo paradigma)DBA del Futuro (Un nuevo paradigma)
DBA del Futuro (Un nuevo paradigma)
 
Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...
 
Arquitectura Lambda
Arquitectura LambdaArquitectura Lambda
Arquitectura Lambda
 
Big data, Hadoop, HDInsight
Big data, Hadoop, HDInsightBig data, Hadoop, HDInsight
Big data, Hadoop, HDInsight
 
Why Apache Flink is better than Spark by Rubén Casado
Why Apache Flink is better than Spark by Rubén CasadoWhy Apache Flink is better than Spark by Rubén Casado
Why Apache Flink is better than Spark by Rubén Casado
 
Herramientas de visualización de datos
Herramientas de visualización de datosHerramientas de visualización de datos
Herramientas de visualización de datos
 
SPS Madrid 2019 - Eleva tu aplicaciones de PowerApps a otro nivel
SPS Madrid 2019 - Eleva tu aplicaciones de PowerApps a otro nivelSPS Madrid 2019 - Eleva tu aplicaciones de PowerApps a otro nivel
SPS Madrid 2019 - Eleva tu aplicaciones de PowerApps a otro nivel
 
Analitica y toma de decisiones en tiempo real sobre plataformas big data
Analitica y toma de decisiones en tiempo real sobre plataformas big dataAnalitica y toma de decisiones en tiempo real sobre plataformas big data
Analitica y toma de decisiones en tiempo real sobre plataformas big data
 
Introducción a Apache Spark
Introducción a Apache SparkIntroducción a Apache Spark
Introducción a Apache Spark
 
Polybase
PolybasePolybase
Polybase
 
Comparativa herramientas ETL
Comparativa herramientas ETLComparativa herramientas ETL
Comparativa herramientas ETL
 
Spark meetup barcelona
Spark meetup barcelonaSpark meetup barcelona
Spark meetup barcelona
 
spiceworks
spiceworksspiceworks
spiceworks
 
Pizza Fast Assistant Presentación de Proyecto
Pizza Fast Assistant Presentación de ProyectoPizza Fast Assistant Presentación de Proyecto
Pizza Fast Assistant Presentación de Proyecto
 
Empleos con futuro. Perfil de un ingeniero de datos
Empleos con futuro. Perfil de un ingeniero de datosEmpleos con futuro. Perfil de un ingeniero de datos
Empleos con futuro. Perfil de un ingeniero de datos
 
M04 09 20_v05_plataformas_bd
M04 09 20_v05_plataformas_bdM04 09 20_v05_plataformas_bd
M04 09 20_v05_plataformas_bd
 

Recently uploaded

Maquinaria Agricola utilizada en la produccion de Piña.pdf
Maquinaria Agricola utilizada en la produccion de Piña.pdfMaquinaria Agricola utilizada en la produccion de Piña.pdf
Maquinaria Agricola utilizada en la produccion de Piña.pdfdanielJAlejosC
 
Desigualdades e inecuaciones-convertido.pdf
Desigualdades e inecuaciones-convertido.pdfDesigualdades e inecuaciones-convertido.pdf
Desigualdades e inecuaciones-convertido.pdfRonaldLozano11
 
Introduction to Satellite Communication_esp_FINAL.ppt
Introduction to Satellite Communication_esp_FINAL.pptIntroduction to Satellite Communication_esp_FINAL.ppt
Introduction to Satellite Communication_esp_FINAL.pptReYMaStERHD
 
Libro de ingeniería sobre Tecnología Eléctrica.pdf
Libro de ingeniería sobre Tecnología Eléctrica.pdfLibro de ingeniería sobre Tecnología Eléctrica.pdf
Libro de ingeniería sobre Tecnología Eléctrica.pdfCristinCrdova1
 
Tippens fisica 7eDIAPOSITIVAS TIPENS Tippens_fisica_7e_diapositivas_33.ppt
Tippens fisica 7eDIAPOSITIVAS TIPENS Tippens_fisica_7e_diapositivas_33.pptTippens fisica 7eDIAPOSITIVAS TIPENS Tippens_fisica_7e_diapositivas_33.ppt
Tippens fisica 7eDIAPOSITIVAS TIPENS Tippens_fisica_7e_diapositivas_33.pptNombre Apellidos
 
27311861-Cuencas-sedimentarias-en-Colombia.ppt
27311861-Cuencas-sedimentarias-en-Colombia.ppt27311861-Cuencas-sedimentarias-en-Colombia.ppt
27311861-Cuencas-sedimentarias-en-Colombia.pptjacnuevarisaralda22
 
Resistencia-a-los-antimicrobianos--laboratorio-al-cuidado-del-paciente_Marcel...
Resistencia-a-los-antimicrobianos--laboratorio-al-cuidado-del-paciente_Marcel...Resistencia-a-los-antimicrobianos--laboratorio-al-cuidado-del-paciente_Marcel...
Resistencia-a-los-antimicrobianos--laboratorio-al-cuidado-del-paciente_Marcel...GuillermoRodriguez239462
 
Six Sigma Process and the dmaic metodo process
Six Sigma Process and the dmaic metodo processSix Sigma Process and the dmaic metodo process
Six Sigma Process and the dmaic metodo processbarom
 
TIPOS DE SOPORTES - CLASIFICACION IG.pdf
TIPOS DE SOPORTES - CLASIFICACION IG.pdfTIPOS DE SOPORTES - CLASIFICACION IG.pdf
TIPOS DE SOPORTES - CLASIFICACION IG.pdfssuser202b79
 
libro de ingeniería de petróleos y operaciones
libro de ingeniería de petróleos y operacioneslibro de ingeniería de petróleos y operaciones
libro de ingeniería de petróleos y operacionesRamon Bartolozzi
 
Cereales tecnología de los alimentos. Cereales
Cereales tecnología de los alimentos. CerealesCereales tecnología de los alimentos. Cereales
Cereales tecnología de los alimentos. Cerealescarlosjuliogermanari1
 
Clasificación de Equipos e Instrumentos en Electricidad.docx
Clasificación de Equipos e Instrumentos en Electricidad.docxClasificación de Equipos e Instrumentos en Electricidad.docx
Clasificación de Equipos e Instrumentos en Electricidad.docxwilliam801689
 
Ficha Tecnica de Ladrillos de Tabique de diferentes modelos
Ficha Tecnica de Ladrillos de Tabique de diferentes modelosFicha Tecnica de Ladrillos de Tabique de diferentes modelos
Ficha Tecnica de Ladrillos de Tabique de diferentes modelosRamiroCruzSalazar
 
FUNCION DE ESTADO EN LA TERMODINAMICA.pdf
FUNCION DE ESTADO EN LA TERMODINAMICA.pdfFUNCION DE ESTADO EN LA TERMODINAMICA.pdf
FUNCION DE ESTADO EN LA TERMODINAMICA.pdfalfredoivan1
 
ELASTICIDAD PRECIO DE LA DEMaaanANDA.ppt
ELASTICIDAD PRECIO DE LA DEMaaanANDA.pptELASTICIDAD PRECIO DE LA DEMaaanANDA.ppt
ELASTICIDAD PRECIO DE LA DEMaaanANDA.pptRobertoCastao8
 
ATS-FORMATO cara.pdf PARA TRABAJO SEGURO
ATS-FORMATO cara.pdf  PARA TRABAJO SEGUROATS-FORMATO cara.pdf  PARA TRABAJO SEGURO
ATS-FORMATO cara.pdf PARA TRABAJO SEGUROalejandrocrisostomo2
 
CALCULO DE ENGRANAJES RECTOS SB-2024.pptx
CALCULO DE ENGRANAJES RECTOS SB-2024.pptxCALCULO DE ENGRANAJES RECTOS SB-2024.pptx
CALCULO DE ENGRANAJES RECTOS SB-2024.pptxCarlosGabriel96
 
Matrices Matemáticos universitario pptx
Matrices  Matemáticos universitario pptxMatrices  Matemáticos universitario pptx
Matrices Matemáticos universitario pptxNancyJulcasumaran
 
ANALISIS Y DISEÑO POR VIENTO, DE EDIFICIOS ALTOS, SEGUN ASCE-2016, LAURA RAMIREZ
ANALISIS Y DISEÑO POR VIENTO, DE EDIFICIOS ALTOS, SEGUN ASCE-2016, LAURA RAMIREZANALISIS Y DISEÑO POR VIENTO, DE EDIFICIOS ALTOS, SEGUN ASCE-2016, LAURA RAMIREZ
ANALISIS Y DISEÑO POR VIENTO, DE EDIFICIOS ALTOS, SEGUN ASCE-2016, LAURA RAMIREZgustavoiashalom
 
Aportes a la Arquitectura de Le Corbusier y Mies Van der Rohe
Aportes a la Arquitectura de Le Corbusier y Mies Van der RoheAportes a la Arquitectura de Le Corbusier y Mies Van der Rohe
Aportes a la Arquitectura de Le Corbusier y Mies Van der RoheElisaLen4
 

Recently uploaded (20)

Maquinaria Agricola utilizada en la produccion de Piña.pdf
Maquinaria Agricola utilizada en la produccion de Piña.pdfMaquinaria Agricola utilizada en la produccion de Piña.pdf
Maquinaria Agricola utilizada en la produccion de Piña.pdf
 
Desigualdades e inecuaciones-convertido.pdf
Desigualdades e inecuaciones-convertido.pdfDesigualdades e inecuaciones-convertido.pdf
Desigualdades e inecuaciones-convertido.pdf
 
Introduction to Satellite Communication_esp_FINAL.ppt
Introduction to Satellite Communication_esp_FINAL.pptIntroduction to Satellite Communication_esp_FINAL.ppt
Introduction to Satellite Communication_esp_FINAL.ppt
 
Libro de ingeniería sobre Tecnología Eléctrica.pdf
Libro de ingeniería sobre Tecnología Eléctrica.pdfLibro de ingeniería sobre Tecnología Eléctrica.pdf
Libro de ingeniería sobre Tecnología Eléctrica.pdf
 
Tippens fisica 7eDIAPOSITIVAS TIPENS Tippens_fisica_7e_diapositivas_33.ppt
Tippens fisica 7eDIAPOSITIVAS TIPENS Tippens_fisica_7e_diapositivas_33.pptTippens fisica 7eDIAPOSITIVAS TIPENS Tippens_fisica_7e_diapositivas_33.ppt
Tippens fisica 7eDIAPOSITIVAS TIPENS Tippens_fisica_7e_diapositivas_33.ppt
 
27311861-Cuencas-sedimentarias-en-Colombia.ppt
27311861-Cuencas-sedimentarias-en-Colombia.ppt27311861-Cuencas-sedimentarias-en-Colombia.ppt
27311861-Cuencas-sedimentarias-en-Colombia.ppt
 
Resistencia-a-los-antimicrobianos--laboratorio-al-cuidado-del-paciente_Marcel...
Resistencia-a-los-antimicrobianos--laboratorio-al-cuidado-del-paciente_Marcel...Resistencia-a-los-antimicrobianos--laboratorio-al-cuidado-del-paciente_Marcel...
Resistencia-a-los-antimicrobianos--laboratorio-al-cuidado-del-paciente_Marcel...
 
Six Sigma Process and the dmaic metodo process
Six Sigma Process and the dmaic metodo processSix Sigma Process and the dmaic metodo process
Six Sigma Process and the dmaic metodo process
 
TIPOS DE SOPORTES - CLASIFICACION IG.pdf
TIPOS DE SOPORTES - CLASIFICACION IG.pdfTIPOS DE SOPORTES - CLASIFICACION IG.pdf
TIPOS DE SOPORTES - CLASIFICACION IG.pdf
 
libro de ingeniería de petróleos y operaciones
libro de ingeniería de petróleos y operacioneslibro de ingeniería de petróleos y operaciones
libro de ingeniería de petróleos y operaciones
 
Cereales tecnología de los alimentos. Cereales
Cereales tecnología de los alimentos. CerealesCereales tecnología de los alimentos. Cereales
Cereales tecnología de los alimentos. Cereales
 
Clasificación de Equipos e Instrumentos en Electricidad.docx
Clasificación de Equipos e Instrumentos en Electricidad.docxClasificación de Equipos e Instrumentos en Electricidad.docx
Clasificación de Equipos e Instrumentos en Electricidad.docx
 
Ficha Tecnica de Ladrillos de Tabique de diferentes modelos
Ficha Tecnica de Ladrillos de Tabique de diferentes modelosFicha Tecnica de Ladrillos de Tabique de diferentes modelos
Ficha Tecnica de Ladrillos de Tabique de diferentes modelos
 
FUNCION DE ESTADO EN LA TERMODINAMICA.pdf
FUNCION DE ESTADO EN LA TERMODINAMICA.pdfFUNCION DE ESTADO EN LA TERMODINAMICA.pdf
FUNCION DE ESTADO EN LA TERMODINAMICA.pdf
 
ELASTICIDAD PRECIO DE LA DEMaaanANDA.ppt
ELASTICIDAD PRECIO DE LA DEMaaanANDA.pptELASTICIDAD PRECIO DE LA DEMaaanANDA.ppt
ELASTICIDAD PRECIO DE LA DEMaaanANDA.ppt
 
ATS-FORMATO cara.pdf PARA TRABAJO SEGURO
ATS-FORMATO cara.pdf  PARA TRABAJO SEGUROATS-FORMATO cara.pdf  PARA TRABAJO SEGURO
ATS-FORMATO cara.pdf PARA TRABAJO SEGURO
 
CALCULO DE ENGRANAJES RECTOS SB-2024.pptx
CALCULO DE ENGRANAJES RECTOS SB-2024.pptxCALCULO DE ENGRANAJES RECTOS SB-2024.pptx
CALCULO DE ENGRANAJES RECTOS SB-2024.pptx
 
Matrices Matemáticos universitario pptx
Matrices  Matemáticos universitario pptxMatrices  Matemáticos universitario pptx
Matrices Matemáticos universitario pptx
 
ANALISIS Y DISEÑO POR VIENTO, DE EDIFICIOS ALTOS, SEGUN ASCE-2016, LAURA RAMIREZ
ANALISIS Y DISEÑO POR VIENTO, DE EDIFICIOS ALTOS, SEGUN ASCE-2016, LAURA RAMIREZANALISIS Y DISEÑO POR VIENTO, DE EDIFICIOS ALTOS, SEGUN ASCE-2016, LAURA RAMIREZ
ANALISIS Y DISEÑO POR VIENTO, DE EDIFICIOS ALTOS, SEGUN ASCE-2016, LAURA RAMIREZ
 
Aportes a la Arquitectura de Le Corbusier y Mies Van der Rohe
Aportes a la Arquitectura de Le Corbusier y Mies Van der RoheAportes a la Arquitectura de Le Corbusier y Mies Van der Rohe
Aportes a la Arquitectura de Le Corbusier y Mies Van der Rohe
 

Cassandra Meet Up Noviembre - Drag & Drop Techs With Cassandra

  • 1. Técnicas de Inyección / Extracción de Datos en #BigData + Técnicas Drag & Drop en Apache Cassandra @javituiter   www.franciscojavierpulido.com   @exploradata   www.exploradata.com  
  • 2. Sobre mí Graduado  en   Ingeniera  del   So;ware   Master  en   Sistemas  en   Ingeniería  de  la   Información   Big  Data  Specialist   www.ExploraData.com   Bloguero   &   Tuitero  
  • 5. Inyección / Extracción de datos en #BigData
  • 6. Inyección / Extracción de datos en #BigData
  • 7. Inyección / Extracción de datos en #BigData
  • 9. Inyección / Extración de datos en Cassandra Comando  COPY  
  • 10. Inyección / Extración de datos en Cassandra Comando  COPY   -­‐  Desarrollar  desde  0  un  programa  para  lanzar  múlMples   instancias  del  comando  (secuencialmente,  ya  que   paralelamente  estaba  sujeto  a  errores  de   concurrencia)   -­‐  Paralelizable  en  varios  nodos  manualmente   -­‐  Limitado  a  500.000  registros  por  hilo/lanzamiento  
  • 11. Inyección / Extración de datos en Cassandra Apache  Sqoop   ·∙  Relacional   ·∙  NoSQL   ·∙  Relacional   ·∙  NoSQL   Hadoop  
  • 12. Inyección / Extración de datos en Cassandra Apache  Flume   -­‐  Herramienta  exclusiva  para  la  etapa  de   Obtención  de  datos   -­‐  Source   -­‐  Channel   -­‐  Sink   -­‐  Interceptor  
  • 13. Inyección / Extración de datos en Cassandra Apache  Flume   Channel  1   Channel  N   Source  1   .   .   .   .   .   .   Source  2   Sink  1   Sink  2  
  • 14. Inyección / Extración de datos en Cassandra Apache  Flume  
  • 15. Inyección / Extración de datos en Cassandra Apache  Flume   +  Sink  a  Cassandra                           Personalizado   hbp://www.treselle.com/blog/flume-­‐with-­‐ cassandra-­‐integraMon    
  • 16. Inyección / Extración de datos en Cassandra DataStax:  SSTableLoader  
  • 18. Técnicas Drag&Drop en Cassandra ETL   •  Extraer, Transformar y Cargar (Load). En definitiva: •  Extraer datos de múltiples fuentes • Aplicar calidad y consistencia (limpiar) a los datos •  Conformar (unificar) los datos •  Cargar los datos en un DW •  La idea de Flujo. • Actividad inicial y con ejecución periódica/programable. •  Herramientas: Talend, JasperSoft, Pentaho Data Integration
  • 19. Técnicas Drag&Drop en Cassandra Pentaho  Data  IntegraMon   •  PDI es un set de herramientas, que permite diseñar ETLs, mediante transformaciones y trabajos que pueden ser ejecutadas por las herramientas de Spoon, Pan y Kitchen. Antes se le conocía con el nombre de Kettle. •  Spoon interfaz gráfica para diseño de trasformaciones y trabajos ETL. •  Pan es un motor capaz de ejecutar múltiples transformaciones de datos como leer, manipular y escribir desde y en distintos orígenes de datos. •  Kitchen es un programa que ejecuta los trabajos diseñados por Spoon. Normalmente estos trabajos son planificados en modo batch para ejecutar automáticamente a periodos regulares (crontab -e).
  • 21. Técnicas Drag&Drop en Cassandra Conectores  Big  Data  en  PDI   •  En PDI tenemos múltiples conectores para sistemas Big Data: • AVRO •  Cassandra •  CouchDB •  Hadoop •  Hbase •  Map Reduce •  MongoDB
  • 22. Técnicas Drag&Drop en Cassandra Cassandra  en  PDI   • Tenemos tres tipos de “pasos” para Apache Cassandra: •  Cassandra Input: se utiliza para realizar lecturas •  Cassandra Output: se utiliza para realizar escrituras •  SSTable Output: se utiliza para volcar a una SSTable de Cassandra. •  Requisitos: • Apache Cassandra 1.2.X •  PDI 5.0.1 Stable •  Librerías oficiales de Apache Cassandra para PDI •  Limitaciones: •  Los “pasos” funcionan correctamente con hasta 500K registros
  • 23. Técnicas Drag&Drop en Cassandra Cassandra  Input  
  • 24. Técnicas Drag&Drop en Cassandra Cassandra  Output  
  • 25. Técnicas Drag&Drop en Cassandra SSTable  Output   *  Este  paso  necesita  ser  ejecutado  siempre  en  un  nodo  de  Cassandra.  
  • 27. ?   ¿ Dudas ? @javituiter   www.franciscojavierpulido.com   @exploradata   www.exploradata.com