SlideShare una empresa de Scribd logo
1 de 14
¿Storm? ¿Qué es?
Conceptos básicos
Apache Storm
● Sistema de computación distribuida en tiempo real y tolerante a
fallos.
● Storm hace fácil la tarea de procesar streams de datos
● El procesado hace en tiempo real lo que Hadoop hace en
procesos batch
● Simple, se puede utilizar cualquier lenguaje de programación
● Libre y Open Source (Licencia Apache).
Apache Storm
● General: Soporta una variedad de casos de uso posibles.
● Escalabilidad: Simplemente añadiendo nuevas máquinas e incrementado
la configuración de paralelismo de la topología. Primeras implementaciones
1M msg/seg en un cluster 10 máquinas.
● Garantía de no perder datos: A diferencia de otros sistemas como S4,
Storm garantiza que no hay perdida de mensajes.
● Robusto: Los clusters se pueden configurar de forma sencilla.
● Tolerante a fallos: Si existen fallos, storm re-asigna las tareas.
● Agnóstico del lenguaje: Los componentes de storm se pueden definir en
cualquier lenguaje de programación.
Casos de uso
● Procesamiento de Streams: Con Storm no es necesario mantener colas
intermedias para realizar el procesamiento de streams.
● Computación continua: Permite enviar datos de forma continua para y por
tanto actualizar y mostrar resultados en tiempo real (Como métricas web).
● Llamadas a procedimientos remotos distribuidos: Permite paralelizar de
forma muy sencilla operaciones costosas de CPU.
Componentes Cluster Storm
● En Hadoop se ejecutan M-R Jobs; en Storm se ejecutan topologies. La
principal diferencia es que un job M-R termina y un topologie se ejecuta
indefinidamente.
● Dos tipos de nodos: master node y worker node.
● El master node ejecuta el demonio “Nimbus” (~jobtracker en Hadoop).
● Cada worker node ejecuta un demonio llamado “Supervisor”. El
supervisor escucha trabajos asignados a su máquina y arranca y detiene
procesos worker. Cada proceso worker ejecuta un subconjunto de la
topología.
● Una topología en ejecución consiste en muchos procesos worker a lo largo
de muchas máquinas.
Coordinación Cluster Storm
● Una topologie es un grafo de computación. Cada nodo en la topologie
contiene lógica de procesado y enlaces entre nodos para indicar cómo los
datos se deben comunicar.
● Para ejecutar una topología se empaqueta todo el código y sus
dependencias en un jar.
storm jar allmycode.jar backtype.storm.MyTopology arg1 arg2
● Ejecuta la clase bactype.storm.MyTopology con sus argumentos y la envía
al cluster storm.
● Las definiciones de las topologías son estructuras Thrift y como Nimbus es
un servicio Thrift se pueden crear topologías utilizando cualquier lenguaje.
Streams
● Es la abstracción principal en Storm. Se trata de una secuencia sin límite de
tuplas.
● Storm proporciona abstracciones para transformar streams.
● Las abstracciones básicas son spouts y bolts. Spouts y bolts tienen
interfaces que hay que implementar para ejecutar la lógica de aplicación
específica.
Spout
● El Spout es una fuente de streams en un topology.
● Generalmente leen tuplas de la fuente externa y los emiten en la topología.
● Un spout es una secuencia de streams. Por ejemplo un spout puede leer
tuplas de una queue y emitirlas como stream o bien conectarse a la twitter
API y emitir un stream de tweets
Bolt
● Todo el procesamiento del topology se hace en los Bolts. Los Bolts pueden
realizar operaciones de filtrado, funciones, agregados, conexiones con BBDD y
más.
● Un bolt consume cualquier número de streams de entrada, realiza algún
procesado sobre ellos y posiblemente emite nuevos streams.
● Transformaciones de stream complejas como calcular un trending topic de un
stream de tweets requieren múltiples pasos y múltiples bolts.
Topologies
● Las redes de Spouts y Bolts se empaquetan en una Topologie. Una
topologie es un grafo donde cada nodo es un Spout o Bolt.
● Enlaces entre nodos indican como se pasan las tuplas.
● Cada nodo en la topología se ejecuta en paralelo.
● En la topología se puede especificar cuanto paralelismo se desea para cada
nodo.
● Todos los nodos de la topología deben ser capaces de ejecutarse de forma
individual.
Modelo de datos
● Storm utiliza tuplas como modelo de datos. Una tupla es una lista de valores
con nombre, cada campo en una tupla puede ser un objeto de cualquier
tipo.
● Storm soporta todos los tipos primitivos y se pueden crear nuevos
implementando un serializador.
● Cada nodo en una topology debe declarar los campos de salida para las
tuplas que emite.
Ejecución Spouts y Bolts
www.TodoBI.com
info@stratebi.co
m
www.stratebi.com
Mas información
Tfno:
91.788.34.10
Madrid: Pº de la Castellana, 164, 1º
Barcelona: C/ Valencia, 63
Brasil: Av. Paulista, 37 4 andar
Stratebi: Quiénes somos

Más contenido relacionado

La actualidad más candente

El código de calidad segun A.M.A.
El código de calidad segun A.M.A.El código de calidad segun A.M.A.
El código de calidad segun A.M.A.Andres Rodriguez
 
Caso sephora final
Caso sephora finalCaso sephora final
Caso sephora finaljulian1204
 
Análisis FODA McDonald's Javier Molina
Análisis FODA McDonald's Javier MolinaAnálisis FODA McDonald's Javier Molina
Análisis FODA McDonald's Javier MolinaJavierMolina158232
 
ANÁLISIS DE LOS COMPRADORES DE UNA PASTELERIA D’LIPOSTRES
ANÁLISIS DE LOS COMPRADORES DE UNA PASTELERIA D’LIPOSTRESANÁLISIS DE LOS COMPRADORES DE UNA PASTELERIA D’LIPOSTRES
ANÁLISIS DE LOS COMPRADORES DE UNA PASTELERIA D’LIPOSTRESangietr
 
Logística y distribución
Logística y distribuciónLogística y distribución
Logística y distribucióntami1992
 
Calidad Y El Mundo Globalizado
Calidad Y El Mundo GlobalizadoCalidad Y El Mundo Globalizado
Calidad Y El Mundo Globalizadocalidadsoftware
 
Proceso cognitivo en la toma de decisiones del consumidor. (william rondon)
Proceso cognitivo en la toma de decisiones del consumidor. (william rondon)Proceso cognitivo en la toma de decisiones del consumidor. (william rondon)
Proceso cognitivo en la toma de decisiones del consumidor. (william rondon)WilliamRondon
 
Evolución mercados (empresas)
Evolución mercados (empresas)Evolución mercados (empresas)
Evolución mercados (empresas)Eduardo Aparicio
 
Analisis de Caso Procter & Gamble Noviembre 2018
Analisis de Caso Procter & Gamble Noviembre 2018Analisis de Caso Procter & Gamble Noviembre 2018
Analisis de Caso Procter & Gamble Noviembre 2018Luis Baquero
 
CICLO DE VIDA DE LA PEPSI
CICLO DE VIDA DE LA PEPSICICLO DE VIDA DE LA PEPSI
CICLO DE VIDA DE LA PEPSIFelipe Suarez
 
Ampliacion de la linea de productos
Ampliacion de la linea de productosAmpliacion de la linea de productos
Ampliacion de la linea de productosDanii Monedero
 
El rol del gerente de Mercadeo
El rol del gerente de MercadeoEl rol del gerente de Mercadeo
El rol del gerente de MercadeoBees2biz
 
Posicionamiento Capítulos 1 al 5
Posicionamiento Capítulos 1 al 5Posicionamiento Capítulos 1 al 5
Posicionamiento Capítulos 1 al 5Brandon Escobedo
 

La actualidad más candente (20)

El código de calidad segun A.M.A.
El código de calidad segun A.M.A.El código de calidad segun A.M.A.
El código de calidad segun A.M.A.
 
Caso sephora final
Caso sephora finalCaso sephora final
Caso sephora final
 
Análisis FODA McDonald's Javier Molina
Análisis FODA McDonald's Javier MolinaAnálisis FODA McDonald's Javier Molina
Análisis FODA McDonald's Javier Molina
 
6. Transparencia Y Quiebre
6. Transparencia Y Quiebre6. Transparencia Y Quiebre
6. Transparencia Y Quiebre
 
ANÁLISIS DE LOS COMPRADORES DE UNA PASTELERIA D’LIPOSTRES
ANÁLISIS DE LOS COMPRADORES DE UNA PASTELERIA D’LIPOSTRESANÁLISIS DE LOS COMPRADORES DE UNA PASTELERIA D’LIPOSTRES
ANÁLISIS DE LOS COMPRADORES DE UNA PASTELERIA D’LIPOSTRES
 
Logística y distribución
Logística y distribuciónLogística y distribución
Logística y distribución
 
Calidad Y El Mundo Globalizado
Calidad Y El Mundo GlobalizadoCalidad Y El Mundo Globalizado
Calidad Y El Mundo Globalizado
 
Proceso cognitivo en la toma de decisiones del consumidor. (william rondon)
Proceso cognitivo en la toma de decisiones del consumidor. (william rondon)Proceso cognitivo en la toma de decisiones del consumidor. (william rondon)
Proceso cognitivo en la toma de decisiones del consumidor. (william rondon)
 
Presentacion blockbuster (1)
Presentacion blockbuster (1)Presentacion blockbuster (1)
Presentacion blockbuster (1)
 
Caso zara
Caso zaraCaso zara
Caso zara
 
Evolución mercados (empresas)
Evolución mercados (empresas)Evolución mercados (empresas)
Evolución mercados (empresas)
 
Presentación bimbo
Presentación bimboPresentación bimbo
Presentación bimbo
 
Analisis de Caso Procter & Gamble Noviembre 2018
Analisis de Caso Procter & Gamble Noviembre 2018Analisis de Caso Procter & Gamble Noviembre 2018
Analisis de Caso Procter & Gamble Noviembre 2018
 
Entidades Reguladoras
Entidades ReguladorasEntidades Reguladoras
Entidades Reguladoras
 
CICLO DE VIDA DE LA PEPSI
CICLO DE VIDA DE LA PEPSICICLO DE VIDA DE LA PEPSI
CICLO DE VIDA DE LA PEPSI
 
Ampliacion de la linea de productos
Ampliacion de la linea de productosAmpliacion de la linea de productos
Ampliacion de la linea de productos
 
Caso Zara Moda Rápida
Caso Zara Moda RápidaCaso Zara Moda Rápida
Caso Zara Moda Rápida
 
Tesis de calzado
Tesis de calzadoTesis de calzado
Tesis de calzado
 
El rol del gerente de Mercadeo
El rol del gerente de MercadeoEl rol del gerente de Mercadeo
El rol del gerente de Mercadeo
 
Posicionamiento Capítulos 1 al 5
Posicionamiento Capítulos 1 al 5Posicionamiento Capítulos 1 al 5
Posicionamiento Capítulos 1 al 5
 

Similar a Apache Storm: Introduccion

Similar a Apache Storm: Introduccion (20)

Storm
StormStorm
Storm
 
Apache Storm: Instalación
Apache Storm: InstalaciónApache Storm: Instalación
Apache Storm: Instalación
 
De Threads a CompletableFutures
De Threads a CompletableFuturesDe Threads a CompletableFutures
De Threads a CompletableFutures
 
Lab5 guia
Lab5 guiaLab5 guia
Lab5 guia
 
Switches gestionables
Switches gestionablesSwitches gestionables
Switches gestionables
 
Openmp
OpenmpOpenmp
Openmp
 
Estudio sobre Spark, Storm, Kafka y Hive
Estudio sobre Spark, Storm, Kafka y HiveEstudio sobre Spark, Storm, Kafka y Hive
Estudio sobre Spark, Storm, Kafka y Hive
 
T0 -arquitectura de internet
T0  -arquitectura de internetT0  -arquitectura de internet
T0 -arquitectura de internet
 
Thread
ThreadThread
Thread
 
Tema 3 -_switches_gestionables
Tema 3 -_switches_gestionablesTema 3 -_switches_gestionables
Tema 3 -_switches_gestionables
 
Switch
SwitchSwitch
Switch
 
Ud3 inocente alcaide
Ud3 inocente alcaideUd3 inocente alcaide
Ud3 inocente alcaide
 
Arqui hardware
Arqui hardwareArqui hardware
Arqui hardware
 
Funcionamiento Del Switch Y Del Router
Funcionamiento Del Switch Y Del RouterFuncionamiento Del Switch Y Del Router
Funcionamiento Del Switch Y Del Router
 
Clase 4 redes
Clase 4 redesClase 4 redes
Clase 4 redes
 
Prototipo de informe laboratorio nat
Prototipo de informe laboratorio natPrototipo de informe laboratorio nat
Prototipo de informe laboratorio nat
 
Información básica
Información básicaInformación básica
Información básica
 
Docker y Kubernetes, en busca de la alta disponibilidad
Docker y Kubernetes, en busca de la alta disponibilidadDocker y Kubernetes, en busca de la alta disponibilidad
Docker y Kubernetes, en busca de la alta disponibilidad
 
Hilos con Posix
Hilos con PosixHilos con Posix
Hilos con Posix
 
Practica4jpmstp
Practica4jpmstpPractica4jpmstp
Practica4jpmstp
 

Más de Stratebi

Destinos turisticos inteligentes
Destinos turisticos inteligentesDestinos turisticos inteligentes
Destinos turisticos inteligentesStratebi
 
Azure Synapse
Azure SynapseAzure Synapse
Azure SynapseStratebi
 
Options for Dashboards with Python
Options for Dashboards with PythonOptions for Dashboards with Python
Options for Dashboards with PythonStratebi
 
Dashboards with Python
Dashboards with PythonDashboards with Python
Dashboards with PythonStratebi
 
PowerBI Tips y buenas practicas
PowerBI Tips y buenas practicasPowerBI Tips y buenas practicas
PowerBI Tips y buenas practicasStratebi
 
Machine Learning Meetup Spain
Machine Learning Meetup SpainMachine Learning Meetup Spain
Machine Learning Meetup SpainStratebi
 
LinceBI IIoT (Industrial Internet of Things)
LinceBI IIoT (Industrial Internet of Things)LinceBI IIoT (Industrial Internet of Things)
LinceBI IIoT (Industrial Internet of Things)Stratebi
 
SAP - PowerBI integration
SAP - PowerBI integrationSAP - PowerBI integration
SAP - PowerBI integrationStratebi
 
Aplicaciones Big Data Marketing
Aplicaciones Big Data MarketingAplicaciones Big Data Marketing
Aplicaciones Big Data MarketingStratebi
 
A federated information infrastructure that works
A federated information infrastructure that works A federated information infrastructure that works
A federated information infrastructure that works Stratebi
 
9 problemas en proyectos Data Analytics
9 problemas en proyectos Data Analytics9 problemas en proyectos Data Analytics
9 problemas en proyectos Data AnalyticsStratebi
 
PowerBI: Soluciones, Aplicaciones y Cursos
PowerBI: Soluciones, Aplicaciones y CursosPowerBI: Soluciones, Aplicaciones y Cursos
PowerBI: Soluciones, Aplicaciones y CursosStratebi
 
Sports Analytics
Sports AnalyticsSports Analytics
Sports AnalyticsStratebi
 
Vertica Extreme Analysis
Vertica Extreme AnalysisVertica Extreme Analysis
Vertica Extreme AnalysisStratebi
 
Businesss Intelligence con Vertica y PowerBI
Businesss Intelligence con Vertica y PowerBIBusinesss Intelligence con Vertica y PowerBI
Businesss Intelligence con Vertica y PowerBIStratebi
 
Vertica Analytics Database general overview
Vertica Analytics Database general overviewVertica Analytics Database general overview
Vertica Analytics Database general overviewStratebi
 
Talend Cloud en detalle
Talend Cloud en detalleTalend Cloud en detalle
Talend Cloud en detalleStratebi
 
Master Data Management (MDM) con Talend
Master Data Management (MDM) con TalendMaster Data Management (MDM) con Talend
Master Data Management (MDM) con TalendStratebi
 
Talend Introducion
Talend IntroducionTalend Introducion
Talend IntroducionStratebi
 
Talent Analytics
Talent AnalyticsTalent Analytics
Talent AnalyticsStratebi
 

Más de Stratebi (20)

Destinos turisticos inteligentes
Destinos turisticos inteligentesDestinos turisticos inteligentes
Destinos turisticos inteligentes
 
Azure Synapse
Azure SynapseAzure Synapse
Azure Synapse
 
Options for Dashboards with Python
Options for Dashboards with PythonOptions for Dashboards with Python
Options for Dashboards with Python
 
Dashboards with Python
Dashboards with PythonDashboards with Python
Dashboards with Python
 
PowerBI Tips y buenas practicas
PowerBI Tips y buenas practicasPowerBI Tips y buenas practicas
PowerBI Tips y buenas practicas
 
Machine Learning Meetup Spain
Machine Learning Meetup SpainMachine Learning Meetup Spain
Machine Learning Meetup Spain
 
LinceBI IIoT (Industrial Internet of Things)
LinceBI IIoT (Industrial Internet of Things)LinceBI IIoT (Industrial Internet of Things)
LinceBI IIoT (Industrial Internet of Things)
 
SAP - PowerBI integration
SAP - PowerBI integrationSAP - PowerBI integration
SAP - PowerBI integration
 
Aplicaciones Big Data Marketing
Aplicaciones Big Data MarketingAplicaciones Big Data Marketing
Aplicaciones Big Data Marketing
 
A federated information infrastructure that works
A federated information infrastructure that works A federated information infrastructure that works
A federated information infrastructure that works
 
9 problemas en proyectos Data Analytics
9 problemas en proyectos Data Analytics9 problemas en proyectos Data Analytics
9 problemas en proyectos Data Analytics
 
PowerBI: Soluciones, Aplicaciones y Cursos
PowerBI: Soluciones, Aplicaciones y CursosPowerBI: Soluciones, Aplicaciones y Cursos
PowerBI: Soluciones, Aplicaciones y Cursos
 
Sports Analytics
Sports AnalyticsSports Analytics
Sports Analytics
 
Vertica Extreme Analysis
Vertica Extreme AnalysisVertica Extreme Analysis
Vertica Extreme Analysis
 
Businesss Intelligence con Vertica y PowerBI
Businesss Intelligence con Vertica y PowerBIBusinesss Intelligence con Vertica y PowerBI
Businesss Intelligence con Vertica y PowerBI
 
Vertica Analytics Database general overview
Vertica Analytics Database general overviewVertica Analytics Database general overview
Vertica Analytics Database general overview
 
Talend Cloud en detalle
Talend Cloud en detalleTalend Cloud en detalle
Talend Cloud en detalle
 
Master Data Management (MDM) con Talend
Master Data Management (MDM) con TalendMaster Data Management (MDM) con Talend
Master Data Management (MDM) con Talend
 
Talend Introducion
Talend IntroducionTalend Introducion
Talend Introducion
 
Talent Analytics
Talent AnalyticsTalent Analytics
Talent Analytics
 

Último

Los más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfLos más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfJC Díaz Herrera
 
Presentacion-Prevencion-Incendios-Forestales.pdf
Presentacion-Prevencion-Incendios-Forestales.pdfPresentacion-Prevencion-Incendios-Forestales.pdf
Presentacion-Prevencion-Incendios-Forestales.pdfDodiAcuaArstica
 
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptx
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptxINTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptx
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptxJamesHerberthBacaTel
 
Qué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaQué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaJoellyAlejandraRodrg
 
Evolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdfEvolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdfJC Díaz Herrera
 
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICACNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICAYOSHELINSARAIMAMANIS2
 
Familias_más_ricas_de_AL_en_la_historia.pdf
Familias_más_ricas_de_AL_en_la_historia.pdfFamilias_más_ricas_de_AL_en_la_historia.pdf
Familias_más_ricas_de_AL_en_la_historia.pdfJC Díaz Herrera
 
Premios_nobel_por_grupo_racial_ (2024).pdf
Premios_nobel_por_grupo_racial_ (2024).pdfPremios_nobel_por_grupo_racial_ (2024).pdf
Premios_nobel_por_grupo_racial_ (2024).pdfJC Díaz Herrera
 
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdfPosiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdfJC Díaz Herrera
 
Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...israel garcia
 
Posiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdfPosiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdfJC Díaz Herrera
 
Data Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosData Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosssuser948499
 
Triptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudirTriptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudirluis809799
 
Posiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdfPosiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdfJC Díaz Herrera
 
Panorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATOPanorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATOJuan Carlos Fonseca Mata
 
Listas de Fundamentos de Programación 2024
Listas de Fundamentos de Programación 2024Listas de Fundamentos de Programación 2024
Listas de Fundamentos de Programación 2024AndrsReinosoSnchez1
 
Las mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfLas mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfJC Díaz Herrera
 
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
Novelas Turcas vs Series de EUA en audiencia  (2024).pdfNovelas Turcas vs Series de EUA en audiencia  (2024).pdf
Novelas Turcas vs Series de EUA en audiencia (2024).pdfJC Díaz Herrera
 
presentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.pptpresentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.pptMelina Alama Visitacion
 
Los_países_con_la_mayor_cantidad_de_rascacielos (2023).pdf
Los_países_con_la_mayor_cantidad_de_rascacielos (2023).pdfLos_países_con_la_mayor_cantidad_de_rascacielos (2023).pdf
Los_países_con_la_mayor_cantidad_de_rascacielos (2023).pdfJC Díaz Herrera
 

Último (20)

Los más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfLos más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
 
Presentacion-Prevencion-Incendios-Forestales.pdf
Presentacion-Prevencion-Incendios-Forestales.pdfPresentacion-Prevencion-Incendios-Forestales.pdf
Presentacion-Prevencion-Incendios-Forestales.pdf
 
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptx
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptxINTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptx
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptx
 
Qué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaQué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problema
 
Evolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdfEvolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdf
 
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICACNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
 
Familias_más_ricas_de_AL_en_la_historia.pdf
Familias_más_ricas_de_AL_en_la_historia.pdfFamilias_más_ricas_de_AL_en_la_historia.pdf
Familias_más_ricas_de_AL_en_la_historia.pdf
 
Premios_nobel_por_grupo_racial_ (2024).pdf
Premios_nobel_por_grupo_racial_ (2024).pdfPremios_nobel_por_grupo_racial_ (2024).pdf
Premios_nobel_por_grupo_racial_ (2024).pdf
 
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdfPosiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
 
Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...
 
Posiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdfPosiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdf
 
Data Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosData Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datos
 
Triptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudirTriptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudir
 
Posiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdfPosiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdf
 
Panorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATOPanorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATO
 
Listas de Fundamentos de Programación 2024
Listas de Fundamentos de Programación 2024Listas de Fundamentos de Programación 2024
Listas de Fundamentos de Programación 2024
 
Las mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfLas mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdf
 
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
Novelas Turcas vs Series de EUA en audiencia  (2024).pdfNovelas Turcas vs Series de EUA en audiencia  (2024).pdf
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
 
presentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.pptpresentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.ppt
 
Los_países_con_la_mayor_cantidad_de_rascacielos (2023).pdf
Los_países_con_la_mayor_cantidad_de_rascacielos (2023).pdfLos_países_con_la_mayor_cantidad_de_rascacielos (2023).pdf
Los_países_con_la_mayor_cantidad_de_rascacielos (2023).pdf
 

Apache Storm: Introduccion

  • 3. Apache Storm ● Sistema de computación distribuida en tiempo real y tolerante a fallos. ● Storm hace fácil la tarea de procesar streams de datos ● El procesado hace en tiempo real lo que Hadoop hace en procesos batch ● Simple, se puede utilizar cualquier lenguaje de programación ● Libre y Open Source (Licencia Apache).
  • 4. Apache Storm ● General: Soporta una variedad de casos de uso posibles. ● Escalabilidad: Simplemente añadiendo nuevas máquinas e incrementado la configuración de paralelismo de la topología. Primeras implementaciones 1M msg/seg en un cluster 10 máquinas. ● Garantía de no perder datos: A diferencia de otros sistemas como S4, Storm garantiza que no hay perdida de mensajes. ● Robusto: Los clusters se pueden configurar de forma sencilla. ● Tolerante a fallos: Si existen fallos, storm re-asigna las tareas. ● Agnóstico del lenguaje: Los componentes de storm se pueden definir en cualquier lenguaje de programación.
  • 5. Casos de uso ● Procesamiento de Streams: Con Storm no es necesario mantener colas intermedias para realizar el procesamiento de streams. ● Computación continua: Permite enviar datos de forma continua para y por tanto actualizar y mostrar resultados en tiempo real (Como métricas web). ● Llamadas a procedimientos remotos distribuidos: Permite paralelizar de forma muy sencilla operaciones costosas de CPU.
  • 6. Componentes Cluster Storm ● En Hadoop se ejecutan M-R Jobs; en Storm se ejecutan topologies. La principal diferencia es que un job M-R termina y un topologie se ejecuta indefinidamente. ● Dos tipos de nodos: master node y worker node. ● El master node ejecuta el demonio “Nimbus” (~jobtracker en Hadoop). ● Cada worker node ejecuta un demonio llamado “Supervisor”. El supervisor escucha trabajos asignados a su máquina y arranca y detiene procesos worker. Cada proceso worker ejecuta un subconjunto de la topología. ● Una topología en ejecución consiste en muchos procesos worker a lo largo de muchas máquinas.
  • 7. Coordinación Cluster Storm ● Una topologie es un grafo de computación. Cada nodo en la topologie contiene lógica de procesado y enlaces entre nodos para indicar cómo los datos se deben comunicar. ● Para ejecutar una topología se empaqueta todo el código y sus dependencias en un jar. storm jar allmycode.jar backtype.storm.MyTopology arg1 arg2 ● Ejecuta la clase bactype.storm.MyTopology con sus argumentos y la envía al cluster storm. ● Las definiciones de las topologías son estructuras Thrift y como Nimbus es un servicio Thrift se pueden crear topologías utilizando cualquier lenguaje.
  • 8. Streams ● Es la abstracción principal en Storm. Se trata de una secuencia sin límite de tuplas. ● Storm proporciona abstracciones para transformar streams. ● Las abstracciones básicas son spouts y bolts. Spouts y bolts tienen interfaces que hay que implementar para ejecutar la lógica de aplicación específica.
  • 9. Spout ● El Spout es una fuente de streams en un topology. ● Generalmente leen tuplas de la fuente externa y los emiten en la topología. ● Un spout es una secuencia de streams. Por ejemplo un spout puede leer tuplas de una queue y emitirlas como stream o bien conectarse a la twitter API y emitir un stream de tweets
  • 10. Bolt ● Todo el procesamiento del topology se hace en los Bolts. Los Bolts pueden realizar operaciones de filtrado, funciones, agregados, conexiones con BBDD y más. ● Un bolt consume cualquier número de streams de entrada, realiza algún procesado sobre ellos y posiblemente emite nuevos streams. ● Transformaciones de stream complejas como calcular un trending topic de un stream de tweets requieren múltiples pasos y múltiples bolts.
  • 11. Topologies ● Las redes de Spouts y Bolts se empaquetan en una Topologie. Una topologie es un grafo donde cada nodo es un Spout o Bolt. ● Enlaces entre nodos indican como se pasan las tuplas. ● Cada nodo en la topología se ejecuta en paralelo. ● En la topología se puede especificar cuanto paralelismo se desea para cada nodo. ● Todos los nodos de la topología deben ser capaces de ejecutarse de forma individual.
  • 12. Modelo de datos ● Storm utiliza tuplas como modelo de datos. Una tupla es una lista de valores con nombre, cada campo en una tupla puede ser un objeto de cualquier tipo. ● Storm soporta todos los tipos primitivos y se pueden crear nuevos implementando un serializador. ● Cada nodo en una topology debe declarar los campos de salida para las tuplas que emite.
  • 14. www.TodoBI.com info@stratebi.co m www.stratebi.com Mas información Tfno: 91.788.34.10 Madrid: Pº de la Castellana, 164, 1º Barcelona: C/ Valencia, 63 Brasil: Av. Paulista, 37 4 andar Stratebi: Quiénes somos