SlideShare a Scribd company logo
1 of 31
Download to read offline
www.consultec.es
Introducción a Big Data
www.consultec.es
¿Quiénes somos?
Gorka Armentia
Developer
garmentia@consultec.es
@joruus
MCSA: SQL Server 2012
MCSD: Application Lifecycle Management
Constantin Cuciurean
Developer
ccuciurean@consultec.es
MCSA: SQL Server 2012
MCSD: Web Applications
Índice
1. Introducción
1. ¿Qué no es Big Data?
2. Situación actual
3. ¿Y entonces qué es Big Data exactamente?
4. Las 3 Vs de Big Data
5. Retos actuales
2. Big Data llevado a la práctica
1. Utilidades
2. Ejemplo real: Walmart
3. ¿Qué mueve Big Data?
1. Características Técnicas
2. Software
3. Markets de Datos
4. Hadoop
5. Microsoft HDInsight
4. Demos
www.consultec.es
Introducción
“Big Data” es desde hace dos o tres años una de las grandes
tendencias dentro del mundo de la tecnología y del marketing, uno
de esos “buzzwords” que en un momento dado empiezan a
propagarse y aparecer por todo internet, las grandes empresas se
interesan por ello, se crea una industria alrededor y, de repente,
todo el mundo sabe lo que es Big Data. O no …
BIG DATA
www.consultec.es
¿Qué no es Big Data?
Antes de empezar, lo primero es desengañarnos.
• Big Data no es una base de datos enorme
• Big Data no es un data warehouse enorme
• Big Data no es una nueva forma de Business Intelligence
• Big Data no es llevar las base de datos a la nube
• …
www.consultec.es
Situación actual
Bases de
Datos
Relacionales
Bases de
Datos
Analíticas
(Data
Warehouse)
Archivos
(XML,
Logs, …)
ERP/CRM
Redes Sociales
Base de
Datos NoSQL
APIs
Sensores
RFID
Información
generada por
apps móviles
Y mucho más.
Y lo que está
por venir …
Big Data
GPS
Internet de
las Cosas
Información
generada por
máquinas
eMails
www.consultec.es
¿Y entonces qué es Big Data exactamente?
• Definiciones encontradas en internet
• Información que tiene un orden de magnitud más grande de lo que
estamos acostumbrados.
• Información que es muy grande, se mueve muy rápido y no se ajusta a
las estructuras de las base de datos actuales.
• Es un conjunto de datos cuyo tamaño está más allá de la capacidad de la
mayoría de los software utilizados para capturar, gestionar y procesar la
información dentro de un lapso tolerable de tiempo.
www.consultec.es
Las 3 Vs de Big Data
Volume: grandes volúmenes de información
• Se está pasando de hablar en Gigabytes o Terabytes a tamaños de datos de
Petabytes, Exabytes o Zettabytes. Volúmenes que se nos escapan.
www.consultec.es
Las 3 Vs de Big Data
Variety: información de tipos muy diversos
• Ya no solo tenemos información estructurada en Bases de Datos o Archivos.
Ahora empezamos a tener información con tipos diferentes y totalmente
desestructurada.
www.consultec.es
Las 3 Vs de Big Data
Velocity: velocidad con la que se genera la información
• La velocidad a la que se genera esta información hace imposible gestionarla
con sistemas de base de datos convencionales. Las empresas y las personas
ya no quieren estar al día, quieren “estar al segundo”.
www.consultec.es
Retos actuales
• Dar sentido al gran volumen de datos
• Necesitamos las herramientas adecuadas para dar sentido de la abrumadora
cantidad de datos generados por la disminución de los costos de hardware y de las
fuentes de datos “complejas”.
• La comprensión de una variedad cada vez mayor de datos
• Debemos poder analizar datos tanto relacionales como no relacionales. Más del 85%
de los datos capturados son desestructurados.
• Habilitación de análisis en tiempo real de los datos
• Los nuevos generadores de datos (Twitter, Facebook, Apps, …) están produciendo
volúmenes de datos sin precedentes y en tiempo real, lo que no se puede analizar
eficazmente mediante procesos por lotes normales.
www.consultec.es
Utilidades
Toma de decisiones
El valor del Big Data no es la información, sino la nueva forma de toma de
decisiones basada en evidencias y datos empíricos.
Tomar decisiones en base a datos empíricos y tendencias
Tomar decisiones en base a corazonadas, instinto o
experiencias pasadas
www.consultec.es
Utilidades
Experimentación
Una vez recopilados los datos que nos
interesan, la experimentación y la
exploración de los mismos puede
mostrarnos información que a primera vista
nunca hubiésemos encontrado o que nunca
se nos hubiese ocurrido buscar.
www.consultec.es
Utilidades
Transparencia
Compartir y hacer accesible grandes volúmenes de datos a las partes interesadas
y de manera oportuna puede crear un enorme valor y aumentar la eficiencia.
www.consultec.es
Utilidades
Innovación
Permite crear nuevos productos y servicios, mejorar los existentes e, incluso, crear
nuevos modelos de negocio.
www.consultec.es
Ejemplo real: Walmart
• Walmart es una multinacional de grandes almacenes
• Es la segunda mayor empresa del mundo por ingresos
www.consultec.es
Ejemplo real: Walmart
• Algunos datos:
• 200 millones de clientes a la semana
• 10700 tiendas
• 27 países
• 2 millones de trabajadores
• 1,5 millones de transacciones por hora
• Varios Terabytes de información generada en tiempo real
• Base de datos de 3 Petabytes
www.consultec.es
Ejemplo real: Walmart
Guardando todas las compras de todos los clientes se dieron cuenta que
en época de huracanes los Walmart de las zonas afectadas vendían más
cajas de Pop-Tarts que en otras épocas.
Se indicó a los gerentes de las tiendas que en esas épocas pusiesen los
Pop-Tarts en la entrada de las tiendas.
Resultado: Aumento extraordinario de las ventas
¿A quién se le hubiese ocurrido cruzar los
datos de ventas con los datos meteorológicos
o con los calendarios de huracanes?
www.consultec.es
Ejemplo real: Walmart
Hanna twitea:
“I love Salt!”.
En unos segundos el Tweet llega a los sistemas de Walmart, se analiza y
unos minutos más tarde le llega a una amiga suya el siguiente email:
“Buenos días!
Nos pediste que te avisásemos cuando fuese el cumpleaños
de Hanna. Pues ya está aquí y acaba de tweetear algo
bueno sobre la película “Salt” de Angelina Jolie.
¿Quieres regalarle algo relacionado con ello?
Tenemos algunas sugerencias que hacerte …”
www.consultec.es
Ejemplo real: Walmart
• Social Genome
Base de conocimiento que captura entidades y relaciones del mundo
social.
Obtiene información de su base de datos, de otros datos tanto públicos
como privados y de redes sociales.
A partir de ahí identifican entidades “interesantes” y las relacionan
entre sí, consiguiendo toda la información de la que son capaces.
Es un sistema vivo, en constante evolución.
www.consultec.es
Ejemplo real: Walmart
• Entidades: • Relaciones
• Una persona interesada en un tema
• Una persona que asiste a un evento
• Un evento sobre un tema
• Una asociación entre empresa y
producto
www.consultec.es
Ejemplo real: Walmart
• Resumiendo
www.consultec.es
Características Técnicas
Arquitectura
• Alta escalabilidad
• Procesamiento paralelo
• Baja latencia
• Datos no estructurados y estructurados
• NoSQL
• By-pass de datos – Alta disponibilidad
www.consultec.es
Markets de Datos
Además de las fuentes de datos que tengamos en nuestra organización:
bases de datos, emails, logs, documentos, etc … Podemos acceder a
grandes volúmenes de datos (Data Sets) en los markets.
Hay gratuitos y de pago.
www.consultec.es
Hadoop
• Es una plataforma diseñada para almacenar y analizar grandes
volúmenes de datos de diferentes tipos. Basada en Google
Map/Reduce y Google Filesystem.
• Map/Reduce:
• Map: recoger los datos, estructurarlos, extraer la
información interesante, etc … para poder trabajar con
ellos.
Los trabajos se distribuyen en los nodos para
procesarse paralelamente.
• Reduce: combina la información generada en los Map.
• HDFS (Hadoop Distributed File System):
• Sistema de archivos distribuidos, con replicación
automática y optimizado para lectura. Cada fichero se
particiona y se distribuye en todos los servidores.
www.consultec.es
Hadoop
• Otros proyectos alrededor de Hadoop
• Hive: Data Warehouse sobre Hadoop con lenguaje HiveQL (“SQL”).
• Pig: Lenguaje de script para consulta y análisis de la información. Desarrollado
por Yahoo!.
• Sqoop: Framework para la integración de bases de datos relacionales con
Hadoop
• Flume: Servicio para recolectar, agregar y mover grandes volúmenes de datos
de eventos/logs y streaming.
• …
www.consultec.es
Microsoft HDInsight
• Servicio basado en Hadoop.
• Dos versiones:
• Windows Azure HDInsight (on-demand)
• HDInsight Server (on-premise)
www.consultec.es
Microsoft HDInsight
• Acceso a todo tipo de usuarios, incluidos desarrolladores y
profesionales IT. Fácil instalación, administración y configuración.
• Integración con herramientas conocidas como Excel, PowerPivot,
PowerView, SQL Server Analysis Services o Reporting Services.
• .NET SDK para Hadoop (a través e NuGet):
• Map/Reduce
• LINQ to Hive
• WebHDFS Client
www.consultec.es
Microsoft HDInsight
www.consultec.es
¿Dudas?
Gorka Armentia
Developer
garmentia@consultec.es
@joruus
MCSA: SQL Server 2012
MCSD: Application Lifecycle Management
Constantin Cuciurean
Developer
ccuciurean@consultec.es
MCSA: SQL Server 2012
MCSD: Web Applications
www.consultec.es
Gracias!

More Related Content

What's hot

Big data en entornos corporativos - CommCorp
Big data en entornos corporativos - CommCorpBig data en entornos corporativos - CommCorp
Big data en entornos corporativos - CommCorpGrupo DIRCOM
 
Dirigiendo y gestionando proyectos Big Data
Dirigiendo y gestionando proyectos Big DataDirigiendo y gestionando proyectos Big Data
Dirigiendo y gestionando proyectos Big DataEmilio del Prado
 
2016 ULL Cabildo KEEDIO - Como se empieza
2016 ULL Cabildo KEEDIO - Como se empieza2016 ULL Cabildo KEEDIO - Como se empieza
2016 ULL Cabildo KEEDIO - Como se empiezaKEEDIO
 
Semana de la Ciencia 2014 (Martínez-Prieto)
Semana de la Ciencia 2014 (Martínez-Prieto)Semana de la Ciencia 2014 (Martínez-Prieto)
Semana de la Ciencia 2014 (Martínez-Prieto)Carlos Cuesta
 
2016 ULL Cabildo KEEDIO - BigData
2016 ULL Cabildo KEEDIO - BigData2016 ULL Cabildo KEEDIO - BigData
2016 ULL Cabildo KEEDIO - BigDataKEEDIO
 
Big Data y Minería de datos
Big Data y Minería de datos Big Data y Minería de datos
Big Data y Minería de datos Luis Joyanes
 
Desayuno amdia: Big Data, hacia una visión 360° de mis clientes
Desayuno amdia: Big Data, hacia una visión 360° de mis clientesDesayuno amdia: Big Data, hacia una visión 360° de mis clientes
Desayuno amdia: Big Data, hacia una visión 360° de mis clientesamdia
 
Tecnologías exponenciales
Tecnologías exponencialesTecnologías exponenciales
Tecnologías exponencialesLeonardo Clavijo
 
BDAS-2017 | Convergencia entre Open Data y Big Data, casos y tendencias
BDAS-2017 | Convergencia entre Open Data y Big Data, casos y tendenciasBDAS-2017 | Convergencia entre Open Data y Big Data, casos y tendencias
BDAS-2017 | Convergencia entre Open Data y Big Data, casos y tendenciasBig-Data-Summit
 
CRM y Big Data: el nuevo cliente vitaminado
CRM y Big Data: el nuevo cliente vitaminadoCRM y Big Data: el nuevo cliente vitaminado
CRM y Big Data: el nuevo cliente vitaminadoAndres Karp
 
Relaciones Públicas y Big Data
Relaciones Públicas y Big DataRelaciones Públicas y Big Data
Relaciones Públicas y Big DataGrupo DIRCOM
 
Big data
Big dataBig data
Big dataTaniaQu
 
1 big data y redes sociales
1 big data y redes sociales1 big data y redes sociales
1 big data y redes sociales.. ..
 
Estado del arte del BI | Jornada Madrid 2014 | UOC
Estado del arte del BI | Jornada Madrid 2014 | UOCEstado del arte del BI | Jornada Madrid 2014 | UOC
Estado del arte del BI | Jornada Madrid 2014 | UOCJosep Curto
 
Qué es el Big Data?
Qué es el Big Data?Qué es el Big Data?
Qué es el Big Data?Carla Buj
 

What's hot (20)

Big data en entornos corporativos - CommCorp
Big data en entornos corporativos - CommCorpBig data en entornos corporativos - CommCorp
Big data en entornos corporativos - CommCorp
 
Dirigiendo y gestionando proyectos Big Data
Dirigiendo y gestionando proyectos Big DataDirigiendo y gestionando proyectos Big Data
Dirigiendo y gestionando proyectos Big Data
 
Big data
Big data Big data
Big data
 
2016 ULL Cabildo KEEDIO - Como se empieza
2016 ULL Cabildo KEEDIO - Como se empieza2016 ULL Cabildo KEEDIO - Como se empieza
2016 ULL Cabildo KEEDIO - Como se empieza
 
Semana de la Ciencia 2014 (Martínez-Prieto)
Semana de la Ciencia 2014 (Martínez-Prieto)Semana de la Ciencia 2014 (Martínez-Prieto)
Semana de la Ciencia 2014 (Martínez-Prieto)
 
2016 ULL Cabildo KEEDIO - BigData
2016 ULL Cabildo KEEDIO - BigData2016 ULL Cabildo KEEDIO - BigData
2016 ULL Cabildo KEEDIO - BigData
 
Big Data y Minería de datos
Big Data y Minería de datos Big Data y Minería de datos
Big Data y Minería de datos
 
Big Data
Big DataBig Data
Big Data
 
Desayuno amdia: Big Data, hacia una visión 360° de mis clientes
Desayuno amdia: Big Data, hacia una visión 360° de mis clientesDesayuno amdia: Big Data, hacia una visión 360° de mis clientes
Desayuno amdia: Big Data, hacia una visión 360° de mis clientes
 
Tecnologías exponenciales
Tecnologías exponencialesTecnologías exponenciales
Tecnologías exponenciales
 
Tendencias en Big Data (2015-2016)
Tendencias en Big Data (2015-2016)Tendencias en Big Data (2015-2016)
Tendencias en Big Data (2015-2016)
 
BDAS-2017 | Convergencia entre Open Data y Big Data, casos y tendencias
BDAS-2017 | Convergencia entre Open Data y Big Data, casos y tendenciasBDAS-2017 | Convergencia entre Open Data y Big Data, casos y tendencias
BDAS-2017 | Convergencia entre Open Data y Big Data, casos y tendencias
 
Iniciación al BiG Data - español
Iniciación al BiG Data - españolIniciación al BiG Data - español
Iniciación al BiG Data - español
 
CRM y Big Data: el nuevo cliente vitaminado
CRM y Big Data: el nuevo cliente vitaminadoCRM y Big Data: el nuevo cliente vitaminado
CRM y Big Data: el nuevo cliente vitaminado
 
Relaciones Públicas y Big Data
Relaciones Públicas y Big DataRelaciones Públicas y Big Data
Relaciones Públicas y Big Data
 
Big data
Big dataBig data
Big data
 
Big data
Big dataBig data
Big data
 
1 big data y redes sociales
1 big data y redes sociales1 big data y redes sociales
1 big data y redes sociales
 
Estado del arte del BI | Jornada Madrid 2014 | UOC
Estado del arte del BI | Jornada Madrid 2014 | UOCEstado del arte del BI | Jornada Madrid 2014 | UOC
Estado del arte del BI | Jornada Madrid 2014 | UOC
 
Qué es el Big Data?
Qué es el Big Data?Qué es el Big Data?
Qué es el Big Data?
 

Viewers also liked

Viewers also liked (8)

Big Data and Predictive Analytics - Marketing's Holy Grail
Big Data and Predictive Analytics - Marketing's Holy GrailBig Data and Predictive Analytics - Marketing's Holy Grail
Big Data and Predictive Analytics - Marketing's Holy Grail
 
Empresa nike
Empresa nikeEmpresa nike
Empresa nike
 
Trabajo de huawey
Trabajo de huaweyTrabajo de huawey
Trabajo de huawey
 
Huawei diapositiva
Huawei diapositivaHuawei diapositiva
Huawei diapositiva
 
Huawei
HuaweiHuawei
Huawei
 
Huawei en Entel Summit 2010
Huawei en Entel Summit 2010Huawei en Entel Summit 2010
Huawei en Entel Summit 2010
 
Big Data World
Big Data WorldBig Data World
Big Data World
 
"Casos de uso del Big Data" por Wolfram Rozas
"Casos de uso del Big Data" por Wolfram Rozas"Casos de uso del Big Data" por Wolfram Rozas
"Casos de uso del Big Data" por Wolfram Rozas
 

Similar to Big Data Introducción

Aplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de DatosAplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de DatosLuis Fernando Aguas Bucheli
 
SQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight ServerSQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight ServerEduardo Castro
 
Big-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptxBig-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptxJavierNavarrete43
 
01. Introducción a la Analítica de Datos.pptx
01. Introducción a la Analítica de Datos.pptx01. Introducción a la Analítica de Datos.pptx
01. Introducción a la Analítica de Datos.pptxJuanCarlosRomanPerez1
 
Big Data para analizar las redes sociales
Big Data para analizar las redes socialesBig Data para analizar las redes sociales
Big Data para analizar las redes socialesDatKnoSys
 
Tópicos de Big Data - Introducción
Tópicos de Big Data - IntroducciónTópicos de Big Data - Introducción
Tópicos de Big Data - IntroducciónErnesto Mislej
 
Bigdata trabajo de investigacion
Bigdata trabajo de investigacion Bigdata trabajo de investigacion
Bigdata trabajo de investigacion Ris Fernandez
 
HD Insight Integracion con SQL Server Power-Pivot Excel
HD Insight Integracion con SQL Server Power-Pivot ExcelHD Insight Integracion con SQL Server Power-Pivot Excel
HD Insight Integracion con SQL Server Power-Pivot ExcelEduardo Castro
 
Big Data con Sql Server 2014 y la nube
Big Data con Sql Server 2014 y la nubeBig Data con Sql Server 2014 y la nube
Big Data con Sql Server 2014 y la nubeEduardo Castro
 
Big data con SQL Server 2014
Big data con SQL Server 2014Big data con SQL Server 2014
Big data con SQL Server 2014Eduardo Castro
 
Código de buenas prácticas en protección de datos para proyectos Big Data
Código de buenas prácticas en protección de datos para proyectos Big DataCódigo de buenas prácticas en protección de datos para proyectos Big Data
Código de buenas prácticas en protección de datos para proyectos Big DataAlfredo Vela Zancada
 
UNLZ - Sistemas de Informacion - Unidad 4 - Big Data.pdf
UNLZ - Sistemas de Informacion - Unidad 4 - Big Data.pdfUNLZ - Sistemas de Informacion - Unidad 4 - Big Data.pdf
UNLZ - Sistemas de Informacion - Unidad 4 - Big Data.pdflaubritez2001
 

Similar to Big Data Introducción (20)

Aplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de DatosAplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de Datos
 
Trabajo de-big-data
Trabajo de-big-dataTrabajo de-big-data
Trabajo de-big-data
 
El big data
El big dataEl big data
El big data
 
Que es big data
Que es big dataQue es big data
Que es big data
 
SQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight ServerSQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight Server
 
Big-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptxBig-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptx
 
Big data
Big dataBig data
Big data
 
Big data
Big dataBig data
Big data
 
01. Introducción a la Analítica de Datos.pptx
01. Introducción a la Analítica de Datos.pptx01. Introducción a la Analítica de Datos.pptx
01. Introducción a la Analítica de Datos.pptx
 
Big Data para analizar las redes sociales
Big Data para analizar las redes socialesBig Data para analizar las redes sociales
Big Data para analizar las redes sociales
 
Tópicos de Big Data - Introducción
Tópicos de Big Data - IntroducciónTópicos de Big Data - Introducción
Tópicos de Big Data - Introducción
 
Big Data para mortales
Big Data para mortalesBig Data para mortales
Big Data para mortales
 
Bigdata trabajo de investigacion
Bigdata trabajo de investigacion Bigdata trabajo de investigacion
Bigdata trabajo de investigacion
 
HD Insight Integracion con SQL Server Power-Pivot Excel
HD Insight Integracion con SQL Server Power-Pivot ExcelHD Insight Integracion con SQL Server Power-Pivot Excel
HD Insight Integracion con SQL Server Power-Pivot Excel
 
Big Data con Sql Server 2014 y la nube
Big Data con Sql Server 2014 y la nubeBig Data con Sql Server 2014 y la nube
Big Data con Sql Server 2014 y la nube
 
Big data con SQL Server 2014
Big data con SQL Server 2014Big data con SQL Server 2014
Big data con SQL Server 2014
 
Big data
Big dataBig data
Big data
 
big data
big  databig  data
big data
 
Código de buenas prácticas en protección de datos para proyectos Big Data
Código de buenas prácticas en protección de datos para proyectos Big DataCódigo de buenas prácticas en protección de datos para proyectos Big Data
Código de buenas prácticas en protección de datos para proyectos Big Data
 
UNLZ - Sistemas de Informacion - Unidad 4 - Big Data.pdf
UNLZ - Sistemas de Informacion - Unidad 4 - Big Data.pdfUNLZ - Sistemas de Informacion - Unidad 4 - Big Data.pdf
UNLZ - Sistemas de Informacion - Unidad 4 - Big Data.pdf
 

Recently uploaded

Triptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudirTriptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudirluis809799
 
Las mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfLas mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfJC Díaz Herrera
 
Investigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfInvestigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfalexanderleonyonange
 
Posiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdfPosiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdfJC Díaz Herrera
 
Las familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdfLas familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdfJC Díaz Herrera
 
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
Novelas Turcas vs Series de EUA en audiencia  (2024).pdfNovelas Turcas vs Series de EUA en audiencia  (2024).pdf
Novelas Turcas vs Series de EUA en audiencia (2024).pdfJC Díaz Herrera
 
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfIndustria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfJC Díaz Herrera
 
llllllllllllllllllllllllllllllllllllllllllllllllllllllllll
llllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllll
llllllllllllllllllllllllllllllllllllllllllllllllllllllllllJulietaCarbajalOsis
 
Los primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdfLos primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdfJC Díaz Herrera
 
INFORME DE EVALUACIÓN DE LOS REQUERIMIENTOS.pdf
INFORME DE EVALUACIÓN DE LOS REQUERIMIENTOS.pdfINFORME DE EVALUACIÓN DE LOS REQUERIMIENTOS.pdf
INFORME DE EVALUACIÓN DE LOS REQUERIMIENTOS.pdfMiguelGomez900779
 
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptx
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptxINTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptx
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptxJamesHerberthBacaTel
 
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICACNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICAYOSHELINSARAIMAMANIS2
 
Cesar Vilchis Vieyra Cesar Vilchis Vieyra
Cesar Vilchis Vieyra  Cesar Vilchis VieyraCesar Vilchis Vieyra  Cesar Vilchis Vieyra
Cesar Vilchis Vieyra Cesar Vilchis Vieyraestudiantes2010
 
Los idiomas más hablados en el mundo (2024).pdf
Los idiomas más hablados en el mundo  (2024).pdfLos idiomas más hablados en el mundo  (2024).pdf
Los idiomas más hablados en el mundo (2024).pdfJC Díaz Herrera
 
MÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptx
MÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptxMÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptx
MÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptxCristianCastro978067
 
presentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.pptpresentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.pptMelina Alama Visitacion
 
Qué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaQué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaJoellyAlejandraRodrg
 
Gestión Logística maria palmira guti cabajal
Gestión Logística maria palmira guti cabajalGestión Logística maria palmira guti cabajal
Gestión Logística maria palmira guti cabajalMarcosAlvarezSalinas
 
Posiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdfPosiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdfJC Díaz Herrera
 
Listas de Fundamentos de Programación 2024
Listas de Fundamentos de Programación 2024Listas de Fundamentos de Programación 2024
Listas de Fundamentos de Programación 2024AndrsReinosoSnchez1
 

Recently uploaded (20)

Triptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudirTriptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudir
 
Las mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfLas mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdf
 
Investigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfInvestigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdf
 
Posiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdfPosiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdf
 
Las familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdfLas familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdf
 
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
Novelas Turcas vs Series de EUA en audiencia  (2024).pdfNovelas Turcas vs Series de EUA en audiencia  (2024).pdf
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
 
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfIndustria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
 
llllllllllllllllllllllllllllllllllllllllllllllllllllllllll
llllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllll
llllllllllllllllllllllllllllllllllllllllllllllllllllllllll
 
Los primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdfLos primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdf
 
INFORME DE EVALUACIÓN DE LOS REQUERIMIENTOS.pdf
INFORME DE EVALUACIÓN DE LOS REQUERIMIENTOS.pdfINFORME DE EVALUACIÓN DE LOS REQUERIMIENTOS.pdf
INFORME DE EVALUACIÓN DE LOS REQUERIMIENTOS.pdf
 
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptx
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptxINTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptx
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptx
 
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICACNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
 
Cesar Vilchis Vieyra Cesar Vilchis Vieyra
Cesar Vilchis Vieyra  Cesar Vilchis VieyraCesar Vilchis Vieyra  Cesar Vilchis Vieyra
Cesar Vilchis Vieyra Cesar Vilchis Vieyra
 
Los idiomas más hablados en el mundo (2024).pdf
Los idiomas más hablados en el mundo  (2024).pdfLos idiomas más hablados en el mundo  (2024).pdf
Los idiomas más hablados en el mundo (2024).pdf
 
MÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptx
MÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptxMÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptx
MÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptx
 
presentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.pptpresentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.ppt
 
Qué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaQué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problema
 
Gestión Logística maria palmira guti cabajal
Gestión Logística maria palmira guti cabajalGestión Logística maria palmira guti cabajal
Gestión Logística maria palmira guti cabajal
 
Posiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdfPosiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdf
 
Listas de Fundamentos de Programación 2024
Listas de Fundamentos de Programación 2024Listas de Fundamentos de Programación 2024
Listas de Fundamentos de Programación 2024
 

Big Data Introducción

  • 2. www.consultec.es ¿Quiénes somos? Gorka Armentia Developer garmentia@consultec.es @joruus MCSA: SQL Server 2012 MCSD: Application Lifecycle Management Constantin Cuciurean Developer ccuciurean@consultec.es MCSA: SQL Server 2012 MCSD: Web Applications
  • 3. Índice 1. Introducción 1. ¿Qué no es Big Data? 2. Situación actual 3. ¿Y entonces qué es Big Data exactamente? 4. Las 3 Vs de Big Data 5. Retos actuales 2. Big Data llevado a la práctica 1. Utilidades 2. Ejemplo real: Walmart 3. ¿Qué mueve Big Data? 1. Características Técnicas 2. Software 3. Markets de Datos 4. Hadoop 5. Microsoft HDInsight 4. Demos
  • 4. www.consultec.es Introducción “Big Data” es desde hace dos o tres años una de las grandes tendencias dentro del mundo de la tecnología y del marketing, uno de esos “buzzwords” que en un momento dado empiezan a propagarse y aparecer por todo internet, las grandes empresas se interesan por ello, se crea una industria alrededor y, de repente, todo el mundo sabe lo que es Big Data. O no … BIG DATA
  • 5. www.consultec.es ¿Qué no es Big Data? Antes de empezar, lo primero es desengañarnos. • Big Data no es una base de datos enorme • Big Data no es un data warehouse enorme • Big Data no es una nueva forma de Business Intelligence • Big Data no es llevar las base de datos a la nube • …
  • 6. www.consultec.es Situación actual Bases de Datos Relacionales Bases de Datos Analíticas (Data Warehouse) Archivos (XML, Logs, …) ERP/CRM Redes Sociales Base de Datos NoSQL APIs Sensores RFID Información generada por apps móviles Y mucho más. Y lo que está por venir … Big Data GPS Internet de las Cosas Información generada por máquinas eMails
  • 7. www.consultec.es ¿Y entonces qué es Big Data exactamente? • Definiciones encontradas en internet • Información que tiene un orden de magnitud más grande de lo que estamos acostumbrados. • Información que es muy grande, se mueve muy rápido y no se ajusta a las estructuras de las base de datos actuales. • Es un conjunto de datos cuyo tamaño está más allá de la capacidad de la mayoría de los software utilizados para capturar, gestionar y procesar la información dentro de un lapso tolerable de tiempo.
  • 8. www.consultec.es Las 3 Vs de Big Data Volume: grandes volúmenes de información • Se está pasando de hablar en Gigabytes o Terabytes a tamaños de datos de Petabytes, Exabytes o Zettabytes. Volúmenes que se nos escapan.
  • 9. www.consultec.es Las 3 Vs de Big Data Variety: información de tipos muy diversos • Ya no solo tenemos información estructurada en Bases de Datos o Archivos. Ahora empezamos a tener información con tipos diferentes y totalmente desestructurada.
  • 10. www.consultec.es Las 3 Vs de Big Data Velocity: velocidad con la que se genera la información • La velocidad a la que se genera esta información hace imposible gestionarla con sistemas de base de datos convencionales. Las empresas y las personas ya no quieren estar al día, quieren “estar al segundo”.
  • 11. www.consultec.es Retos actuales • Dar sentido al gran volumen de datos • Necesitamos las herramientas adecuadas para dar sentido de la abrumadora cantidad de datos generados por la disminución de los costos de hardware y de las fuentes de datos “complejas”. • La comprensión de una variedad cada vez mayor de datos • Debemos poder analizar datos tanto relacionales como no relacionales. Más del 85% de los datos capturados son desestructurados. • Habilitación de análisis en tiempo real de los datos • Los nuevos generadores de datos (Twitter, Facebook, Apps, …) están produciendo volúmenes de datos sin precedentes y en tiempo real, lo que no se puede analizar eficazmente mediante procesos por lotes normales.
  • 12. www.consultec.es Utilidades Toma de decisiones El valor del Big Data no es la información, sino la nueva forma de toma de decisiones basada en evidencias y datos empíricos. Tomar decisiones en base a datos empíricos y tendencias Tomar decisiones en base a corazonadas, instinto o experiencias pasadas
  • 13. www.consultec.es Utilidades Experimentación Una vez recopilados los datos que nos interesan, la experimentación y la exploración de los mismos puede mostrarnos información que a primera vista nunca hubiésemos encontrado o que nunca se nos hubiese ocurrido buscar.
  • 14. www.consultec.es Utilidades Transparencia Compartir y hacer accesible grandes volúmenes de datos a las partes interesadas y de manera oportuna puede crear un enorme valor y aumentar la eficiencia.
  • 15. www.consultec.es Utilidades Innovación Permite crear nuevos productos y servicios, mejorar los existentes e, incluso, crear nuevos modelos de negocio.
  • 16. www.consultec.es Ejemplo real: Walmart • Walmart es una multinacional de grandes almacenes • Es la segunda mayor empresa del mundo por ingresos
  • 17. www.consultec.es Ejemplo real: Walmart • Algunos datos: • 200 millones de clientes a la semana • 10700 tiendas • 27 países • 2 millones de trabajadores • 1,5 millones de transacciones por hora • Varios Terabytes de información generada en tiempo real • Base de datos de 3 Petabytes
  • 18. www.consultec.es Ejemplo real: Walmart Guardando todas las compras de todos los clientes se dieron cuenta que en época de huracanes los Walmart de las zonas afectadas vendían más cajas de Pop-Tarts que en otras épocas. Se indicó a los gerentes de las tiendas que en esas épocas pusiesen los Pop-Tarts en la entrada de las tiendas. Resultado: Aumento extraordinario de las ventas ¿A quién se le hubiese ocurrido cruzar los datos de ventas con los datos meteorológicos o con los calendarios de huracanes?
  • 19. www.consultec.es Ejemplo real: Walmart Hanna twitea: “I love Salt!”. En unos segundos el Tweet llega a los sistemas de Walmart, se analiza y unos minutos más tarde le llega a una amiga suya el siguiente email: “Buenos días! Nos pediste que te avisásemos cuando fuese el cumpleaños de Hanna. Pues ya está aquí y acaba de tweetear algo bueno sobre la película “Salt” de Angelina Jolie. ¿Quieres regalarle algo relacionado con ello? Tenemos algunas sugerencias que hacerte …”
  • 20. www.consultec.es Ejemplo real: Walmart • Social Genome Base de conocimiento que captura entidades y relaciones del mundo social. Obtiene información de su base de datos, de otros datos tanto públicos como privados y de redes sociales. A partir de ahí identifican entidades “interesantes” y las relacionan entre sí, consiguiendo toda la información de la que son capaces. Es un sistema vivo, en constante evolución.
  • 21. www.consultec.es Ejemplo real: Walmart • Entidades: • Relaciones • Una persona interesada en un tema • Una persona que asiste a un evento • Un evento sobre un tema • Una asociación entre empresa y producto
  • 23. www.consultec.es Características Técnicas Arquitectura • Alta escalabilidad • Procesamiento paralelo • Baja latencia • Datos no estructurados y estructurados • NoSQL • By-pass de datos – Alta disponibilidad
  • 24. www.consultec.es Markets de Datos Además de las fuentes de datos que tengamos en nuestra organización: bases de datos, emails, logs, documentos, etc … Podemos acceder a grandes volúmenes de datos (Data Sets) en los markets. Hay gratuitos y de pago.
  • 25. www.consultec.es Hadoop • Es una plataforma diseñada para almacenar y analizar grandes volúmenes de datos de diferentes tipos. Basada en Google Map/Reduce y Google Filesystem. • Map/Reduce: • Map: recoger los datos, estructurarlos, extraer la información interesante, etc … para poder trabajar con ellos. Los trabajos se distribuyen en los nodos para procesarse paralelamente. • Reduce: combina la información generada en los Map. • HDFS (Hadoop Distributed File System): • Sistema de archivos distribuidos, con replicación automática y optimizado para lectura. Cada fichero se particiona y se distribuye en todos los servidores.
  • 26. www.consultec.es Hadoop • Otros proyectos alrededor de Hadoop • Hive: Data Warehouse sobre Hadoop con lenguaje HiveQL (“SQL”). • Pig: Lenguaje de script para consulta y análisis de la información. Desarrollado por Yahoo!. • Sqoop: Framework para la integración de bases de datos relacionales con Hadoop • Flume: Servicio para recolectar, agregar y mover grandes volúmenes de datos de eventos/logs y streaming. • …
  • 27. www.consultec.es Microsoft HDInsight • Servicio basado en Hadoop. • Dos versiones: • Windows Azure HDInsight (on-demand) • HDInsight Server (on-premise)
  • 28. www.consultec.es Microsoft HDInsight • Acceso a todo tipo de usuarios, incluidos desarrolladores y profesionales IT. Fácil instalación, administración y configuración. • Integración con herramientas conocidas como Excel, PowerPivot, PowerView, SQL Server Analysis Services o Reporting Services. • .NET SDK para Hadoop (a través e NuGet): • Map/Reduce • LINQ to Hive • WebHDFS Client
  • 30. www.consultec.es ¿Dudas? Gorka Armentia Developer garmentia@consultec.es @joruus MCSA: SQL Server 2012 MCSD: Application Lifecycle Management Constantin Cuciurean Developer ccuciurean@consultec.es MCSA: SQL Server 2012 MCSD: Web Applications