SlideShare a Scribd company logo
1 of 18
Download to read offline
MONITORIZACIÓN Y ANÁLISIS DE TRÁFICO
DE RED CON APACHE HADOOP
Rubén García-Valcárcel, Rafael Leira, Iván González,
Jorge E. López de Vergara
ruben4593@gmail.com, {rafael.leira, ivan.gonzalez,
jorge.lopez_vergara}@uam.es
JITEL 2015 – 15 de Octubre de 2015
Introducción
Estado del arte
Sistema propuesto
Experimentos
Conclusiones
Tabla de contenidos
1 Introducción
2 Estado del arte
3 Sistema propuesto
Arquitectura de la red
Sistema de captura
Arquitectura del sistema
Procesamiento en Hadoop
4 Experimentos
Análisis mediante Hive
Rendimiento
Sistemas utilizados
Comparativa global
5 Conclusiones
R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 2
Introducción
Estado del arte
Sistema propuesto
Experimentos
Conclusiones
Introducción
Objetivo: Monitorización pasiva y Análisis de redes de
comunicaciones.
Necesidad de un sistema escalable y fiable frente al crecimiento
exponencial de las redes
Diseño de un sistema para la captura, el almacenamiento, el
procesamiento y el análisis de tráfico de red basado en Hadoop
Evaluación del sistema mediante la monitorización de la red de los
laboratorios docentes de la Escuela Politécnica Superior (en la
UAM).
R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 3
Introducción
Estado del arte
Sistema propuesto
Experimentos
Conclusiones
Estado del arte
Herramientas habituales para la captura y procesamiento de tráfico
Bajas tasas de red (tcpdump, wireshark...)
Altas tasas de red
APIs de alta velocidad (Intel DPDK...)
Hardware dedicado (GPUs, FPGAs...)
Computación distribuida
Google: GFS y MapReduce
Apache: HDFS y YARN
Procesamiento de tráfico mediante Hadoop
[RIPE]: Pesada, lenta y limitada. Librerías de terceros
[Yeonhee Lee]: Heurística de fragmentado PCAP. Código liberado
incompleto
R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 4
Introducción
Estado del arte
Sistema propuesto
Experimentos
Conclusiones
Arquitectura de la red
Sistema de captura
Arquitectura del sistema
Procesamiento en Hadoop
Sistema propuesto
Arquitectura de la red de prueba
Red interna
Internet
Sonda de
captura
Firewall
Hadoop
TAP
Servidor DNS
R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 5
Introducción
Estado del arte
Sistema propuesto
Experimentos
Conclusiones
Arquitectura de la red
Sistema de captura
Arquitectura del sistema
Procesamiento en Hadoop
Sistema de captura
FlowProcess
La sonda de captura:
Almacena los paquetes:
En formato PCAP
Truncados a 300 bytes (por motivos de privacidad, también reduce el
espacio consumido)
Crea archivos de aproxidamente 1 GB
La sonda descarta los paquetes que contengan la dirección IP de la
propia sonda.
Genera archivos en texto plano con información relativa a los flujos
(Netflow extendido)
R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 6
Introducción
Estado del arte
Sistema propuesto
Experimentos
Conclusiones
Arquitectura de la red
Sistema de captura
Arquitectura del sistema
Procesamiento en Hadoop
Sistema propuesto
Arquitectura del sistema
Hadoop
AnálisisPreprocesamientoCaptura
PCAPs
Flujos
DNS
HTTP
HTTPS
Tareas
MapReduce
Hive
PCAPs
Tablas
Gráficas
Deseria-
lizador
PrediccionesWeka
Admin
Sonda de
captura
R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 7
Introducción
Estado del arte
Sistema propuesto
Experimentos
Conclusiones
Arquitectura de la red
Sistema de captura
Arquitectura del sistema
Procesamiento en Hadoop
Procesamiento
Se parte del trabajo de [RIPE], pero:
Se han reimplementado de los disectores de HTTP y DNS
Implementación de un nuevo disector de HTTPS
Mejora de rendimiento
Eliminación del reensamblado TCP
Guardado de los campos en estructuras fijas en lugar de una tabla
hash.
R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 8
Introducción
Estado del arte
Sistema propuesto
Experimentos
Conclusiones
Análisis mediante Hive
Rendimiento
Experimentos
Análisis mediante Hive
R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 9
Introducción
Estado del arte
Sistema propuesto
Experimentos
Conclusiones
Análisis mediante Hive
Rendimiento
Experimentos
Análisis mediante Hive
Series temporales del consumo de la red por días (periodo 20/02/15 − 01/05/15)
Series temporales del consumo de la red por horas (periodo 16/03/15 − 20/03/15)
R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 10
Introducción
Estado del arte
Sistema propuesto
Experimentos
Conclusiones
Análisis mediante Hive
Rendimiento
Experimentos
Análisis mediante Hive
Bytes (exterior) y flujos (interior) usados por cada protocolo y puerto
R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 11
Introducción
Estado del arte
Sistema propuesto
Experimentos
Conclusiones
Análisis mediante Hive
Rendimiento
Experimentos
Análisis mediante Hive
Las 16 asignaturas que más han consumido (periodo 02/02/15 − 01/05/15)
R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 12
Introducción
Estado del arte
Sistema propuesto
Experimentos
Conclusiones
Análisis mediante Hive
Rendimiento
Experimentos
Análisis mediante Hive
Ordenadores encendidos cada noche (periodo 02/02/15 − 01/05/15)
Ordenadores inactivos cada semana (periodo 02/02/15 − 01/05/15)
R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 13
Introducción
Estado del arte
Sistema propuesto
Experimentos
Conclusiones
Análisis mediante Hive
Rendimiento
Experimentos
Análisis mediante Hive
Páginas web más solicitadas vía HTTP (izquierda) y HTTPS (derecha)
agrupadas por dominio de segundo nivel
R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 14
Introducción
Estado del arte
Sistema propuesto
Experimentos
Conclusiones
Análisis mediante Hive
Rendimiento
Pruebas de rendimiento
Sistemas utilizados
Características de los sistemas de pruebas
Sistema
RAM
Discos CPU
Total Red
(GB) cores (Gbps)
Hadoop
Esclavo 1 32 5x 3 TB 1x Xeon L5408 @ 2,13 GHz 4 1
Esclavo 2 32 5x 3 TB 1x Xeon L5408 @ 2,13 GHz 4 1
Esclavo 3 256 4x 3 TB 4x Xeon E7-4830 @ 2,13 GHz 32 1
Esclavo 4 64 7x 3 TB 2x Xeon E5-2620 v3 @ 2,40 GHz 12 1
Esclavo 5 64 7x 3 TB 2x Xeon E5-2620 v3 @ 2,40 GHz 12 1
Servidor Alto Rendimiento 32 RAID 0: 9x 3 TB 2x Xeon E5-2630 @ 2,6 GHz 12 -
[Y. Lee] (30 nodos) 30x 19 30x 4 TB 30x 8 cores @ 2,93 GHz 240 1
R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 15
Introducción
Estado del arte
Sistema propuesto
Experimentos
Conclusiones
Análisis mediante Hive
Rendimiento
Pruebas de rendimiento
Comparativa global
Rendimiento de cada sistema al procesar 1 TB
Programa Gbps Gbps/core
Hadoop
Disector HTTP 7,13 0,11
Disector HTTPS 7,41 0,12
Disector DNS 7,72 0,12
Test de lectura 4,98 0,08
Disector HTTP serie (en c) en S.A.R. 4,21 4,21 (1 core)
Versión de [Y. Lee]
5 nodos 1,9 0,05
30 nodos 14,0 0,06
R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 16
Introducción
Estado del arte
Sistema propuesto
Experimentos
Conclusiones
Conclusiones
Se ha creado una batería de consultas en Hive, y un medio para
crear nuevos análisis de la red.
El proyecto Apache Hadoop permite escalar horizontalmente con
facilidad.
Con un bajo coste de desarrollo se han alcanzado 7 Gbps.
Se pretende integrar el sistema con otros de Big Data como Apache
Mahout, extendiendo así sus capacidades.
No obstante Hadoop tiene limitaciones: Java,
homogeneidad/heterogeneidad del clúster, etc.
Dichas limitaciones se pretenden superar investigando en el campo
del almacenamiento (HDFS), así como en las posibles uniones de
Hadoop con hardware específico (GPUs, FPGAs...) con el objetivo
de crear un sistema más económico y estable.
R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 17
Introducción
Estado del arte
Sistema propuesto
Experimentos
Conclusiones
Gracias por su atención
R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 18

More Related Content

Viewers also liked

Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...Joseph Lopez
 
Big Data a traves de una implementación
Big Data a traves de una implementaciónBig Data a traves de una implementación
Big Data a traves de una implementaciónDiego Krauthamer
 
nerdear.la 2016 - Docker workshop
nerdear.la 2016 - Docker workshopnerdear.la 2016 - Docker workshop
nerdear.la 2016 - Docker workshopRestorando
 
Herramientas y ejemplos de trabajos MapReduce con Apache Hadoop
Herramientas y ejemplos de trabajos MapReduce con Apache HadoopHerramientas y ejemplos de trabajos MapReduce con Apache Hadoop
Herramientas y ejemplos de trabajos MapReduce con Apache HadoopDavid Albela Pérez
 
Polybase
PolybasePolybase
PolybaseSolidQ
 
Como de grandes son tus datos
Como de grandes son tus datosComo de grandes son tus datos
Como de grandes son tus datosAntonio Rodriguez
 
¿Por que cambiar de Apache Hadoop a Apache Spark?
¿Por que cambiar de Apache Hadoop a Apache Spark?¿Por que cambiar de Apache Hadoop a Apache Spark?
¿Por que cambiar de Apache Hadoop a Apache Spark?Socialmetrix
 
Monta una Infraestructura para Big Data en tu Empresa
Monta una Infraestructura para Big Data en tu EmpresaMonta una Infraestructura para Big Data en tu Empresa
Monta una Infraestructura para Big Data en tu EmpresaUrko Zurutuza
 
Creación de un clúster de Hadoop con Cloudera
Creación de un clúster de Hadoop con ClouderaCreación de un clúster de Hadoop con Cloudera
Creación de un clúster de Hadoop con ClouderaDavid Albela Pérez
 
Big Data Open Source Analytics (español)
Big Data Open Source Analytics (español)Big Data Open Source Analytics (español)
Big Data Open Source Analytics (español)Stratebi
 
Administración de Apache Hadoop a través de Cloudera
Administración de Apache Hadoop a través de ClouderaAdministración de Apache Hadoop a través de Cloudera
Administración de Apache Hadoop a través de ClouderaDavid Albela Pérez
 
Monta una Infraestructura Big Data para tu Empresa - Sesión I
Monta una Infraestructura Big Data para tu Empresa - Sesión IMonta una Infraestructura Big Data para tu Empresa - Sesión I
Monta una Infraestructura Big Data para tu Empresa - Sesión IUrko Zurutuza
 
Big data con Hadoop y SSIS 2016
Big data con Hadoop y SSIS 2016Big data con Hadoop y SSIS 2016
Big data con Hadoop y SSIS 2016Ángel Rayo
 
Creando su primera aplicación de Big Data en AWS
Creando su primera aplicación de Big Data en AWSCreando su primera aplicación de Big Data en AWS
Creando su primera aplicación de Big Data en AWSAmazon Web Services LATAM
 

Viewers also liked (18)

Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...
 
Big Data a traves de una implementación
Big Data a traves de una implementaciónBig Data a traves de una implementación
Big Data a traves de una implementación
 
Aula virtual apache_hadoop_v3 1
Aula virtual apache_hadoop_v3 1Aula virtual apache_hadoop_v3 1
Aula virtual apache_hadoop_v3 1
 
Hadoop: tecnologias relacionadas
Hadoop: tecnologias relacionadasHadoop: tecnologias relacionadas
Hadoop: tecnologias relacionadas
 
nerdear.la 2016 - Docker workshop
nerdear.la 2016 - Docker workshopnerdear.la 2016 - Docker workshop
nerdear.la 2016 - Docker workshop
 
Herramientas y ejemplos de trabajos MapReduce con Apache Hadoop
Herramientas y ejemplos de trabajos MapReduce con Apache HadoopHerramientas y ejemplos de trabajos MapReduce con Apache Hadoop
Herramientas y ejemplos de trabajos MapReduce con Apache Hadoop
 
Polybase
PolybasePolybase
Polybase
 
Como de grandes son tus datos
Como de grandes son tus datosComo de grandes son tus datos
Como de grandes son tus datos
 
¿Por que cambiar de Apache Hadoop a Apache Spark?
¿Por que cambiar de Apache Hadoop a Apache Spark?¿Por que cambiar de Apache Hadoop a Apache Spark?
¿Por que cambiar de Apache Hadoop a Apache Spark?
 
Monta una Infraestructura para Big Data en tu Empresa
Monta una Infraestructura para Big Data en tu EmpresaMonta una Infraestructura para Big Data en tu Empresa
Monta una Infraestructura para Big Data en tu Empresa
 
Introducción a Docker
Introducción a DockerIntroducción a Docker
Introducción a Docker
 
Creación de un clúster de Hadoop con Cloudera
Creación de un clúster de Hadoop con ClouderaCreación de un clúster de Hadoop con Cloudera
Creación de un clúster de Hadoop con Cloudera
 
Big Data Open Source Analytics (español)
Big Data Open Source Analytics (español)Big Data Open Source Analytics (español)
Big Data Open Source Analytics (español)
 
Administración de Apache Hadoop a través de Cloudera
Administración de Apache Hadoop a través de ClouderaAdministración de Apache Hadoop a través de Cloudera
Administración de Apache Hadoop a través de Cloudera
 
Monta una Infraestructura Big Data para tu Empresa - Sesión I
Monta una Infraestructura Big Data para tu Empresa - Sesión IMonta una Infraestructura Big Data para tu Empresa - Sesión I
Monta una Infraestructura Big Data para tu Empresa - Sesión I
 
Oracle SOA Suite
Oracle SOA SuiteOracle SOA Suite
Oracle SOA Suite
 
Big data con Hadoop y SSIS 2016
Big data con Hadoop y SSIS 2016Big data con Hadoop y SSIS 2016
Big data con Hadoop y SSIS 2016
 
Creando su primera aplicación de Big Data en AWS
Creando su primera aplicación de Big Data en AWSCreando su primera aplicación de Big Data en AWS
Creando su primera aplicación de Big Data en AWS
 

Similar to MONITORIZACIÓN Y ANÁLISIS DE RED CON HADOOP

Hadoop, Cloud y Spring
Hadoop, Cloud y Spring Hadoop, Cloud y Spring
Hadoop, Cloud y Spring Miguel Pastor
 
Log -Analytics con Apache-Flume Elasticsearch HDFS Kibana
 Log -Analytics con Apache-Flume  Elasticsearch HDFS Kibana Log -Analytics con Apache-Flume  Elasticsearch HDFS Kibana
Log -Analytics con Apache-Flume Elasticsearch HDFS KibanaFelix Rodriguez
 
OpenAnalytics 04/2015 - Data Analytics con Hadoop
OpenAnalytics 04/2015 - Data Analytics con HadoopOpenAnalytics 04/2015 - Data Analytics con Hadoop
OpenAnalytics 04/2015 - Data Analytics con HadoopOpenAnalytics Spain
 
Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...Joseph Lopez
 
Conociendo los servicios adicionales en big data
Conociendo los servicios adicionales en big dataConociendo los servicios adicionales en big data
Conociendo los servicios adicionales en big dataSpanishPASSVC
 
¿Cómo se despliega y autoescala Couchbase en Cloud? ¡Aprende de manera práctica!
¿Cómo se despliega y autoescala Couchbase en Cloud? ¡Aprende de manera práctica!¿Cómo se despliega y autoescala Couchbase en Cloud? ¡Aprende de manera práctica!
¿Cómo se despliega y autoescala Couchbase en Cloud? ¡Aprende de manera práctica!Paradigma Digital
 
Pablo Doval | Plain Concepts | Open Data
Pablo Doval | Plain Concepts | Open DataPablo Doval | Plain Concepts | Open Data
Pablo Doval | Plain Concepts | Open DataSmash Tech
 
SolidQ Business Analytics Day | Como de grandes son tus datos
SolidQ Business Analytics Day | Como de grandes son tus datosSolidQ Business Analytics Day | Como de grandes son tus datos
SolidQ Business Analytics Day | Como de grandes son tus datosSolidQ
 
Codemotion 2016 - Big Data para Javeros con Apache Flink
Codemotion 2016 - Big Data para Javeros con Apache FlinkCodemotion 2016 - Big Data para Javeros con Apache Flink
Codemotion 2016 - Big Data para Javeros con Apache FlinkLuis Roldán
 
11- Unidad 3: Webservices - 3.2 Uso de Web services (aplicaciones))
11- Unidad 3: Webservices - 3.2 Uso de Web services (aplicaciones)) 11- Unidad 3: Webservices - 3.2 Uso de Web services (aplicaciones))
11- Unidad 3: Webservices - 3.2 Uso de Web services (aplicaciones)) Luis Fernando Aguas Bucheli
 
An evening with... Apache hadoop Meetup
An evening with...  Apache hadoop MeetupAn evening with...  Apache hadoop Meetup
An evening with... Apache hadoop MeetupArkhotech
 
11-Unidad 3: Diseños de Vista-3.2 Usos Web Services
11-Unidad 3: Diseños de Vista-3.2 Usos Web Services11-Unidad 3: Diseños de Vista-3.2 Usos Web Services
11-Unidad 3: Diseños de Vista-3.2 Usos Web ServicesLuis Fernando Aguas Bucheli
 

Similar to MONITORIZACIÓN Y ANÁLISIS DE RED CON HADOOP (20)

Introducción a Hadoop
Introducción a HadoopIntroducción a Hadoop
Introducción a Hadoop
 
3. Hadoop
3.  Hadoop3.  Hadoop
3. Hadoop
 
Hadoop, Cloud y Spring
Hadoop, Cloud y Spring Hadoop, Cloud y Spring
Hadoop, Cloud y Spring
 
Presentacion
PresentacionPresentacion
Presentacion
 
Log -Analytics con Apache-Flume Elasticsearch HDFS Kibana
 Log -Analytics con Apache-Flume  Elasticsearch HDFS Kibana Log -Analytics con Apache-Flume  Elasticsearch HDFS Kibana
Log -Analytics con Apache-Flume Elasticsearch HDFS Kibana
 
Open analytics. data analytics con hadoop
Open analytics. data analytics con hadoopOpen analytics. data analytics con hadoop
Open analytics. data analytics con hadoop
 
OpenAnalytics 04/2015 - Data Analytics con Hadoop
OpenAnalytics 04/2015 - Data Analytics con HadoopOpenAnalytics 04/2015 - Data Analytics con Hadoop
OpenAnalytics 04/2015 - Data Analytics con Hadoop
 
Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...
 
Conociendo los servicios adicionales en big data
Conociendo los servicios adicionales en big dataConociendo los servicios adicionales en big data
Conociendo los servicios adicionales en big data
 
¿Cómo se despliega y autoescala Couchbase en Cloud? ¡Aprende de manera práctica!
¿Cómo se despliega y autoescala Couchbase en Cloud? ¡Aprende de manera práctica!¿Cómo se despliega y autoescala Couchbase en Cloud? ¡Aprende de manera práctica!
¿Cómo se despliega y autoescala Couchbase en Cloud? ¡Aprende de manera práctica!
 
Pablo Doval | Plain Concepts | Open Data
Pablo Doval | Plain Concepts | Open DataPablo Doval | Plain Concepts | Open Data
Pablo Doval | Plain Concepts | Open Data
 
SolidQ Business Analytics Day | Como de grandes son tus datos
SolidQ Business Analytics Day | Como de grandes son tus datosSolidQ Business Analytics Day | Como de grandes son tus datos
SolidQ Business Analytics Day | Como de grandes son tus datos
 
Codemotion 2016 - Big Data para Javeros con Apache Flink
Codemotion 2016 - Big Data para Javeros con Apache FlinkCodemotion 2016 - Big Data para Javeros con Apache Flink
Codemotion 2016 - Big Data para Javeros con Apache Flink
 
11- Unidad 3: Webservices - 3.2 Uso de Web services (aplicaciones))
11- Unidad 3: Webservices - 3.2 Uso de Web services (aplicaciones)) 11- Unidad 3: Webservices - 3.2 Uso de Web services (aplicaciones))
11- Unidad 3: Webservices - 3.2 Uso de Web services (aplicaciones))
 
SMBD 2011
SMBD 2011SMBD 2011
SMBD 2011
 
SMBD 2011
SMBD 2011SMBD 2011
SMBD 2011
 
Best hadoop bigdata architecture resume
Best hadoop bigdata architecture resume Best hadoop bigdata architecture resume
Best hadoop bigdata architecture resume
 
An evening with... Apache hadoop Meetup
An evening with...  Apache hadoop MeetupAn evening with...  Apache hadoop Meetup
An evening with... Apache hadoop Meetup
 
11-Unidad 3: Diseños de Vista-3.2 Usos Web Services
11-Unidad 3: Diseños de Vista-3.2 Usos Web Services11-Unidad 3: Diseños de Vista-3.2 Usos Web Services
11-Unidad 3: Diseños de Vista-3.2 Usos Web Services
 
Hadoop en accion
Hadoop en accionHadoop en accion
Hadoop en accion
 

More from Jorge E. López de Vergara Méndez

On the feasibility of 40 Gbps network data capture and retention with general...
On the feasibility of 40 Gbps network data capture and retention with general...On the feasibility of 40 Gbps network data capture and retention with general...
On the feasibility of 40 Gbps network data capture and retention with general...Jorge E. López de Vergara Méndez
 
Evaluación de equipamiento de bajo coste para realizar medidas de red en ento...
Evaluación de equipamiento de bajo coste para realizar medidas de red en ento...Evaluación de equipamiento de bajo coste para realizar medidas de red en ento...
Evaluación de equipamiento de bajo coste para realizar medidas de red en ento...Jorge E. López de Vergara Méndez
 
Dictyogram: a Statistical Approach for the Definition and Visualization of Ne...
Dictyogram: a Statistical Approach for the Definition and Visualization of Ne...Dictyogram: a Statistical Approach for the Definition and Visualization of Ne...
Dictyogram: a Statistical Approach for the Definition and Visualization of Ne...Jorge E. López de Vergara Méndez
 
Análisis de Datos Funcionales para Gestión de Red: Téecnicas, Retos y Oportun...
Análisis de Datos Funcionales para Gestión de Red: Téecnicas, Retos y Oportun...Análisis de Datos Funcionales para Gestión de Red: Téecnicas, Retos y Oportun...
Análisis de Datos Funcionales para Gestión de Red: Téecnicas, Retos y Oportun...Jorge E. López de Vergara Méndez
 
Multimedia flow classification at 10 Gbps using acceleration techniques on co...
Multimedia flow classification at 10 Gbps using acceleration techniques on co...Multimedia flow classification at 10 Gbps using acceleration techniques on co...
Multimedia flow classification at 10 Gbps using acceleration techniques on co...Jorge E. López de Vergara Méndez
 
Evaluating Quality of Experience in IPTV Services Using MPEG Frame Loss Rate
Evaluating Quality of Experience in IPTV Services Using MPEG Frame Loss RateEvaluating Quality of Experience in IPTV Services Using MPEG Frame Loss Rate
Evaluating Quality of Experience in IPTV Services Using MPEG Frame Loss RateJorge E. López de Vergara Méndez
 
Integración semántica de información de distintos repositorios de medidas de red
Integración semántica de información de distintos repositorios de medidas de redIntegración semántica de información de distintos repositorios de medidas de red
Integración semántica de información de distintos repositorios de medidas de redJorge E. López de Vergara Méndez
 

More from Jorge E. López de Vergara Méndez (9)

On the feasibility of 40 Gbps network data capture and retention with general...
On the feasibility of 40 Gbps network data capture and retention with general...On the feasibility of 40 Gbps network data capture and retention with general...
On the feasibility of 40 Gbps network data capture and retention with general...
 
Evaluación de equipamiento de bajo coste para realizar medidas de red en ento...
Evaluación de equipamiento de bajo coste para realizar medidas de red en ento...Evaluación de equipamiento de bajo coste para realizar medidas de red en ento...
Evaluación de equipamiento de bajo coste para realizar medidas de red en ento...
 
Dictyogram: a Statistical Approach for the Definition and Visualization of Ne...
Dictyogram: a Statistical Approach for the Definition and Visualization of Ne...Dictyogram: a Statistical Approach for the Definition and Visualization of Ne...
Dictyogram: a Statistical Approach for the Definition and Visualization of Ne...
 
Análisis de Datos Funcionales para Gestión de Red: Téecnicas, Retos y Oportun...
Análisis de Datos Funcionales para Gestión de Red: Téecnicas, Retos y Oportun...Análisis de Datos Funcionales para Gestión de Red: Téecnicas, Retos y Oportun...
Análisis de Datos Funcionales para Gestión de Red: Téecnicas, Retos y Oportun...
 
Merging heterogeneous network measurement data
Merging heterogeneous network measurement dataMerging heterogeneous network measurement data
Merging heterogeneous network measurement data
 
Multimedia flow classification at 10 Gbps using acceleration techniques on co...
Multimedia flow classification at 10 Gbps using acceleration techniques on co...Multimedia flow classification at 10 Gbps using acceleration techniques on co...
Multimedia flow classification at 10 Gbps using acceleration techniques on co...
 
Evaluating Quality of Experience in IPTV Services Using MPEG Frame Loss Rate
Evaluating Quality of Experience in IPTV Services Using MPEG Frame Loss RateEvaluating Quality of Experience in IPTV Services Using MPEG Frame Loss Rate
Evaluating Quality of Experience in IPTV Services Using MPEG Frame Loss Rate
 
Defining ontologies for IP traffic measurements at MOI ISG
Defining ontologies for IP traffic measurements at MOI ISGDefining ontologies for IP traffic measurements at MOI ISG
Defining ontologies for IP traffic measurements at MOI ISG
 
Integración semántica de información de distintos repositorios de medidas de red
Integración semántica de información de distintos repositorios de medidas de redIntegración semántica de información de distintos repositorios de medidas de red
Integración semántica de información de distintos repositorios de medidas de red
 

Recently uploaded

Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfIndustria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfJC Díaz Herrera
 
Presentacion-Prevencion-Incendios-Forestales.pdf
Presentacion-Prevencion-Incendios-Forestales.pdfPresentacion-Prevencion-Incendios-Forestales.pdf
Presentacion-Prevencion-Incendios-Forestales.pdfDodiAcuaArstica
 
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICACNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICAYOSHELINSARAIMAMANIS2
 
Posiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdfPosiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdfJC Díaz Herrera
 
llllllllllllllllllllllllllllllllllllllllllllllllllllllllll
llllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllll
llllllllllllllllllllllllllllllllllllllllllllllllllllllllllJulietaCarbajalOsis
 
Técnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalTécnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalIngrid459352
 
COMUNICADO PARA TODO TIPO DE REUNIONES .
COMUNICADO PARA TODO TIPO DE REUNIONES .COMUNICADO PARA TODO TIPO DE REUNIONES .
COMUNICADO PARA TODO TIPO DE REUNIONES .GIANELAKAINACHALLCOJ2
 
Panorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATOPanorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATOJuan Carlos Fonseca Mata
 
Las mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfLas mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfJC Díaz Herrera
 
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfLos más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfJC Díaz Herrera
 
Cesar Vilchis Vieyra Cesar Vilchis Vieyra
Cesar Vilchis Vieyra  Cesar Vilchis VieyraCesar Vilchis Vieyra  Cesar Vilchis Vieyra
Cesar Vilchis Vieyra Cesar Vilchis Vieyraestudiantes2010
 
PIB PERÚ datos y análisis de los últimos años
PIB PERÚ datos y análisis de los últimos añosPIB PERÚ datos y análisis de los últimos años
PIB PERÚ datos y análisis de los últimos añosEstefaniaRojas54
 
AA CUADRO DE TEORIA DEL CASO. (1) (1).docx
AA CUADRO DE TEORIA DEL CASO. (1) (1).docxAA CUADRO DE TEORIA DEL CASO. (1) (1).docx
AA CUADRO DE TEORIA DEL CASO. (1) (1).docxLuisAngelYomonaYomon
 
Gestión Logística maria palmira guti cabajal
Gestión Logística maria palmira guti cabajalGestión Logística maria palmira guti cabajal
Gestión Logística maria palmira guti cabajalMarcosAlvarezSalinas
 
Posiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdfPosiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdfJC Díaz Herrera
 
Las marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfLas marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfJC Díaz Herrera
 
Tipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptxTipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptxMiguelPerz4
 
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdfCALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdfPOULANDERSONDELGADOA2
 
Países por velocidad de sus misiles hipersónicos (2024).pdf
Países por velocidad de sus misiles hipersónicos  (2024).pdfPaíses por velocidad de sus misiles hipersónicos  (2024).pdf
Países por velocidad de sus misiles hipersónicos (2024).pdfJC Díaz Herrera
 
Tendencias en la Gestión del Talento Humano.pdf
Tendencias en la Gestión del Talento Humano.pdfTendencias en la Gestión del Talento Humano.pdf
Tendencias en la Gestión del Talento Humano.pdfdanaeamadot
 

Recently uploaded (20)

Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfIndustria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
 
Presentacion-Prevencion-Incendios-Forestales.pdf
Presentacion-Prevencion-Incendios-Forestales.pdfPresentacion-Prevencion-Incendios-Forestales.pdf
Presentacion-Prevencion-Incendios-Forestales.pdf
 
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICACNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
 
Posiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdfPosiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdf
 
llllllllllllllllllllllllllllllllllllllllllllllllllllllllll
llllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllll
llllllllllllllllllllllllllllllllllllllllllllllllllllllllll
 
Técnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalTécnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dental
 
COMUNICADO PARA TODO TIPO DE REUNIONES .
COMUNICADO PARA TODO TIPO DE REUNIONES .COMUNICADO PARA TODO TIPO DE REUNIONES .
COMUNICADO PARA TODO TIPO DE REUNIONES .
 
Panorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATOPanorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATO
 
Las mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfLas mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdf
 
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfLos más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
 
Cesar Vilchis Vieyra Cesar Vilchis Vieyra
Cesar Vilchis Vieyra  Cesar Vilchis VieyraCesar Vilchis Vieyra  Cesar Vilchis Vieyra
Cesar Vilchis Vieyra Cesar Vilchis Vieyra
 
PIB PERÚ datos y análisis de los últimos años
PIB PERÚ datos y análisis de los últimos añosPIB PERÚ datos y análisis de los últimos años
PIB PERÚ datos y análisis de los últimos años
 
AA CUADRO DE TEORIA DEL CASO. (1) (1).docx
AA CUADRO DE TEORIA DEL CASO. (1) (1).docxAA CUADRO DE TEORIA DEL CASO. (1) (1).docx
AA CUADRO DE TEORIA DEL CASO. (1) (1).docx
 
Gestión Logística maria palmira guti cabajal
Gestión Logística maria palmira guti cabajalGestión Logística maria palmira guti cabajal
Gestión Logística maria palmira guti cabajal
 
Posiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdfPosiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdf
 
Las marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfLas marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdf
 
Tipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptxTipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptx
 
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdfCALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
 
Países por velocidad de sus misiles hipersónicos (2024).pdf
Países por velocidad de sus misiles hipersónicos  (2024).pdfPaíses por velocidad de sus misiles hipersónicos  (2024).pdf
Países por velocidad de sus misiles hipersónicos (2024).pdf
 
Tendencias en la Gestión del Talento Humano.pdf
Tendencias en la Gestión del Talento Humano.pdfTendencias en la Gestión del Talento Humano.pdf
Tendencias en la Gestión del Talento Humano.pdf
 

MONITORIZACIÓN Y ANÁLISIS DE RED CON HADOOP

  • 1. MONITORIZACIÓN Y ANÁLISIS DE TRÁFICO DE RED CON APACHE HADOOP Rubén García-Valcárcel, Rafael Leira, Iván González, Jorge E. López de Vergara ruben4593@gmail.com, {rafael.leira, ivan.gonzalez, jorge.lopez_vergara}@uam.es JITEL 2015 – 15 de Octubre de 2015
  • 2. Introducción Estado del arte Sistema propuesto Experimentos Conclusiones Tabla de contenidos 1 Introducción 2 Estado del arte 3 Sistema propuesto Arquitectura de la red Sistema de captura Arquitectura del sistema Procesamiento en Hadoop 4 Experimentos Análisis mediante Hive Rendimiento Sistemas utilizados Comparativa global 5 Conclusiones R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 2
  • 3. Introducción Estado del arte Sistema propuesto Experimentos Conclusiones Introducción Objetivo: Monitorización pasiva y Análisis de redes de comunicaciones. Necesidad de un sistema escalable y fiable frente al crecimiento exponencial de las redes Diseño de un sistema para la captura, el almacenamiento, el procesamiento y el análisis de tráfico de red basado en Hadoop Evaluación del sistema mediante la monitorización de la red de los laboratorios docentes de la Escuela Politécnica Superior (en la UAM). R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 3
  • 4. Introducción Estado del arte Sistema propuesto Experimentos Conclusiones Estado del arte Herramientas habituales para la captura y procesamiento de tráfico Bajas tasas de red (tcpdump, wireshark...) Altas tasas de red APIs de alta velocidad (Intel DPDK...) Hardware dedicado (GPUs, FPGAs...) Computación distribuida Google: GFS y MapReduce Apache: HDFS y YARN Procesamiento de tráfico mediante Hadoop [RIPE]: Pesada, lenta y limitada. Librerías de terceros [Yeonhee Lee]: Heurística de fragmentado PCAP. Código liberado incompleto R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 4
  • 5. Introducción Estado del arte Sistema propuesto Experimentos Conclusiones Arquitectura de la red Sistema de captura Arquitectura del sistema Procesamiento en Hadoop Sistema propuesto Arquitectura de la red de prueba Red interna Internet Sonda de captura Firewall Hadoop TAP Servidor DNS R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 5
  • 6. Introducción Estado del arte Sistema propuesto Experimentos Conclusiones Arquitectura de la red Sistema de captura Arquitectura del sistema Procesamiento en Hadoop Sistema de captura FlowProcess La sonda de captura: Almacena los paquetes: En formato PCAP Truncados a 300 bytes (por motivos de privacidad, también reduce el espacio consumido) Crea archivos de aproxidamente 1 GB La sonda descarta los paquetes que contengan la dirección IP de la propia sonda. Genera archivos en texto plano con información relativa a los flujos (Netflow extendido) R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 6
  • 7. Introducción Estado del arte Sistema propuesto Experimentos Conclusiones Arquitectura de la red Sistema de captura Arquitectura del sistema Procesamiento en Hadoop Sistema propuesto Arquitectura del sistema Hadoop AnálisisPreprocesamientoCaptura PCAPs Flujos DNS HTTP HTTPS Tareas MapReduce Hive PCAPs Tablas Gráficas Deseria- lizador PrediccionesWeka Admin Sonda de captura R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 7
  • 8. Introducción Estado del arte Sistema propuesto Experimentos Conclusiones Arquitectura de la red Sistema de captura Arquitectura del sistema Procesamiento en Hadoop Procesamiento Se parte del trabajo de [RIPE], pero: Se han reimplementado de los disectores de HTTP y DNS Implementación de un nuevo disector de HTTPS Mejora de rendimiento Eliminación del reensamblado TCP Guardado de los campos en estructuras fijas en lugar de una tabla hash. R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 8
  • 9. Introducción Estado del arte Sistema propuesto Experimentos Conclusiones Análisis mediante Hive Rendimiento Experimentos Análisis mediante Hive R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 9
  • 10. Introducción Estado del arte Sistema propuesto Experimentos Conclusiones Análisis mediante Hive Rendimiento Experimentos Análisis mediante Hive Series temporales del consumo de la red por días (periodo 20/02/15 − 01/05/15) Series temporales del consumo de la red por horas (periodo 16/03/15 − 20/03/15) R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 10
  • 11. Introducción Estado del arte Sistema propuesto Experimentos Conclusiones Análisis mediante Hive Rendimiento Experimentos Análisis mediante Hive Bytes (exterior) y flujos (interior) usados por cada protocolo y puerto R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 11
  • 12. Introducción Estado del arte Sistema propuesto Experimentos Conclusiones Análisis mediante Hive Rendimiento Experimentos Análisis mediante Hive Las 16 asignaturas que más han consumido (periodo 02/02/15 − 01/05/15) R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 12
  • 13. Introducción Estado del arte Sistema propuesto Experimentos Conclusiones Análisis mediante Hive Rendimiento Experimentos Análisis mediante Hive Ordenadores encendidos cada noche (periodo 02/02/15 − 01/05/15) Ordenadores inactivos cada semana (periodo 02/02/15 − 01/05/15) R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 13
  • 14. Introducción Estado del arte Sistema propuesto Experimentos Conclusiones Análisis mediante Hive Rendimiento Experimentos Análisis mediante Hive Páginas web más solicitadas vía HTTP (izquierda) y HTTPS (derecha) agrupadas por dominio de segundo nivel R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 14
  • 15. Introducción Estado del arte Sistema propuesto Experimentos Conclusiones Análisis mediante Hive Rendimiento Pruebas de rendimiento Sistemas utilizados Características de los sistemas de pruebas Sistema RAM Discos CPU Total Red (GB) cores (Gbps) Hadoop Esclavo 1 32 5x 3 TB 1x Xeon L5408 @ 2,13 GHz 4 1 Esclavo 2 32 5x 3 TB 1x Xeon L5408 @ 2,13 GHz 4 1 Esclavo 3 256 4x 3 TB 4x Xeon E7-4830 @ 2,13 GHz 32 1 Esclavo 4 64 7x 3 TB 2x Xeon E5-2620 v3 @ 2,40 GHz 12 1 Esclavo 5 64 7x 3 TB 2x Xeon E5-2620 v3 @ 2,40 GHz 12 1 Servidor Alto Rendimiento 32 RAID 0: 9x 3 TB 2x Xeon E5-2630 @ 2,6 GHz 12 - [Y. Lee] (30 nodos) 30x 19 30x 4 TB 30x 8 cores @ 2,93 GHz 240 1 R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 15
  • 16. Introducción Estado del arte Sistema propuesto Experimentos Conclusiones Análisis mediante Hive Rendimiento Pruebas de rendimiento Comparativa global Rendimiento de cada sistema al procesar 1 TB Programa Gbps Gbps/core Hadoop Disector HTTP 7,13 0,11 Disector HTTPS 7,41 0,12 Disector DNS 7,72 0,12 Test de lectura 4,98 0,08 Disector HTTP serie (en c) en S.A.R. 4,21 4,21 (1 core) Versión de [Y. Lee] 5 nodos 1,9 0,05 30 nodos 14,0 0,06 R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 16
  • 17. Introducción Estado del arte Sistema propuesto Experimentos Conclusiones Conclusiones Se ha creado una batería de consultas en Hive, y un medio para crear nuevos análisis de la red. El proyecto Apache Hadoop permite escalar horizontalmente con facilidad. Con un bajo coste de desarrollo se han alcanzado 7 Gbps. Se pretende integrar el sistema con otros de Big Data como Apache Mahout, extendiendo así sus capacidades. No obstante Hadoop tiene limitaciones: Java, homogeneidad/heterogeneidad del clúster, etc. Dichas limitaciones se pretenden superar investigando en el campo del almacenamiento (HDFS), así como en las posibles uniones de Hadoop con hardware específico (GPUs, FPGAs...) con el objetivo de crear un sistema más económico y estable. R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 17
  • 18. Introducción Estado del arte Sistema propuesto Experimentos Conclusiones Gracias por su atención R. García-Valcárcel, R. Leira, I. González, J.E. López de Vergara Monitorización y Análisis de Tráfico de Red con Apache Hadoop 18