SlideShare a Scribd company logo
1 of 42
RODRIGO CORRAL GONZÁLEZ
ALM TEAM LEAD & SOFTWARE ARCHITECT
RCORRAL@PLAINCONCEPTS.COM
@R_CORRAL
TIPOS DE DATOS
Datos operacionales
Datos de lectura y escritura
que representan el estado
de la aplicación
Ejemplos: Ordenes en una
aplicación de comercio
electrónico, información del
cliente en un CRM…
Datos analíticos
Datos de solo lectura
usados para análisis
Ejemplos: Data
warehouses, machine
learning data
Datos en Streaming
Datos producidos en tiempo
real
Examples: Internet of Things
(IoT), e.g., sensor data
SQL Database
SQL Data
Warehouse
Stream
Analytics
DATOS EN AZURE, UN RESUMEN
Operacionales Analíticos Streaming
Tables
Cosmos DB
HBase
Storm/Spark
Streaming/Kafka
Data Lake
Analytics/Store
Machine
Learning
Hive/Spark/…
Event Hubs
IoT Hub
Data Factory
HDInsight
GENERALIDADES SOBRE DATOS EN LA NUBE
Azure proporciona servicios
PaaS para datos
Todo lo que veremos cae
en esta categoria (con
pequeñas excepciones)
Beneficios comunes de los
servicios PassS
Nada que instalar, nada
que actualizar
Pago por uso
Alta disponibilidad
garantizada
Escalado sencillo
Sin duda es el futuro en
almacenamiento y
procesamiento de datos
Por que no usar servicios que
hacen la gran mayoría del
trabajo sucio por nosotros y
centrarnos en lo que es de
valor
- Volúmenes de datos siempre crecientes
- Valor futuro de los datos desconocido
- Datos semi-estructurados
- Datos ligados a eventos y al tiempo
IOT Y DATOS
- Paradigma perfectamente conocido
- Mínimos cambios (si alguno) en aplicaciones existentes
- Geo-replicación
- Escalado muy simple
- Optimización automática
- Seguridad
- - Detección automática de amenazas
- - Encriptación transparente
SQL AZURE
- MariaDB
- PostgreSQL
- MySQL
OTRAS BBDD RELACIONALES EN AZURE
Ingest all data
regardless of
requirements
Store all data
in native format
without schema
definition
Do analysis
Hadoop, Spark, R,
Azure Data Lake
Analytics (ADLA)
Interactive queries
Batch queries
Machine Learning
Data warehouse
Real-time analytics
Devices
DISEÑADO PARA PODER RESPONDER PREGUNTAS QUE AUN NO CONOCEMOS
DATA LAKES
AZURE DATA LAKE
AZURE DATA LAKE (STORE & ANALYTICS)
HDFS Compatible REST API
ADL Store
.NET, SQL, Python, R
scaled out by U-SQL
ADL Analytics
Open Source Apache
Hadoop ADL Client
HDInsight
Hive
• Redimiento y
escalabilidad sin limites
• Optimizado para análisis
• Soporte para tu
herramienta de análisis
favorita
• Un punto central de
almacenamiento de
información en bruto
• Seguridad integrada con
AAD
- Optimizado para cargas de trabajo de análisis de datos
- Carpetas y archivos vs. Contenedores y blobs
- Sistema jerarquico vs. Espacio de nombres plano
- Ambos API Rest HTTPS
- API compatible con WebHDFS y por lo tanto con el ecosistema Hive, Spark,
Storm
- Seguridad basada en identidades vs. seguridad basada en claves
- Sin limites de tamaños
- Almacenamiento extremadamente económico
DATA LAKE STORE VS. AZURE STORAGE
Con cargas de trabajo BATCH, Data Lake Analytics es ideal
• Para la transformación y preparación de datos para su uso en otros sistemas
• el Análisis de volumenes de datos ENORMES
• de Manera Paralela con programas escritos en .NET, Python y R, escalados con U-SQL
• Y con funciones Cognitivas sobre colecciones de datos
DATA LAKE ANALYTICS
y paraleliza código en .NET, Python o R sobre tu Data Lake
Sintasis familiar para millones de desarrolladores SQL & .NET
Unifica
• La naturaleza declarative de SQL con el poder de C#
• Procesa datos estructurados, semistructurados y no estructurados
• Permite consultar multiples fuentes de datos en Azure
• Permite analizar mediante batches, interactivamente, en streaming y con ciertas
capacidades de ML en un lenguaje
U-SQL
Un framework para Big Data
@searchlog =
EXTRACT UserId int,
Start DateTime,
Region string,
Query string,
Duration int?,
Urls string,
ClickedUrls string
FROM "/Samples/Data/SearchLog.tsv"
USING Extractors.Tsv();
OUTPUT @searchlog
TO "/output/SearchLog-first-u-sql.csv"
USING Outputters.Csv();
U-SQL SYNTAX
https://github.com/Azure/usql/tree/master/Examples/ImageApp/Images
ADLA: USAR CÓDIGO C#
CREATE ASSEMBLY IF NOT EXISTS Images FROM
@"/assemblies/Images.dll"; REFERENCE ASSEMBLY
Images;
ADLA: EXTRAER IMAGEN
@image_data = EXTRACT image_data byte[] FROM
@"/Samples/input/guard.jpg" USING new
Images.ImageExtractor();
ADLA: EXTRAER IMAGEN
@image_data = EXTRACT image_data byte[] FROM
@"/Samples/input/guard.jpg" USING new
Images.ImageExtractor();
ADLA: TRANSFORMAR
DECLARE @image_copyright_id int = 0x8298;
DECLARE @image_make_id int = 0x010F;
DECLARE @image_model_id int = 0x0110;
DECLARE @image_description_id int = 0x010E;
@image_properties = SELECT Images.ImageOps.getImageProperty(image_data, @image_copyright_id) AS
image_copyright, Images.ImageOps.getImageProperty(image_data, @image_make_id) AS image_equipment_make,
Images.ImageOps.getImageProperty(image_data, @image_model_id) AS image_equipment_model,
Images.ImageOps.getImageProperty(image_data, @image_description_id) AS image_description FROM
@image_data;
@scaled_image = SELECT Images.ImageOps.scaleImageTo(image_data, 150, 150) AS thumbnail_image FROM
@image_data;
ADLA: EXTRAER RESULTADOS
OUTPUT @image_properties TO
@"/Samples/output/metadata.csv" USING
Outputters.Csv(); OUTPUT @scaled_image TO
"/Samples/output/thumbnail.jpg" USING new
Images.ImageOutputter();
DEMO: DATA LAKE
¿POR QUÉ USAR NOSQL?
Para escalar a muchos
usuarios y muchos datos
Pros: NoSQL proporciona
mayor escalabilidad que los
Sistemas SQL tradicionales
Cons: Con ciertos sacrificios,
transaccionalidad,
orientación a conjuntos,
familiaridad
Mayor flexibilidad en el
trabajo con datos
Pros: No hay esquemas
fijos
Cons: Los esquemas
previenen errores
To work better with different
data models
Pros: Cada vez manejamos
más datos no relacionales
Cons: No estamos
familiarizados con estos
modelos de datos
NOSQL DATA MODELS
DIFERENTES APROXIMACIONES
Key/Value
K V V V V
K V V
K V V V
K V V V V
Document
{ … }
{ … }
{ … }
GraphColumn Family
Tables
TABLES
ALMACENAMIENTO KEY/VALUE
Application
Key/Value Data
K V V V V
K V V
K V V V
K V V V V
Send key
K
Return
values
V V V
TABLES
¿POR QUÉ?
Simplicidad
Key/value propone un
paradigma muy sencillo
Muy escalable
Una base de datos puede
contener teras de datos
El sharding es muy simple
Low cost
Almacenamiento muy
eficiente en coste
Cosmos DB
COSMOS DB
A MULTI-MODEL STORE
Application
Data
K V V V V
K V V
K V V V
K V V V V
{ … }
{ … }
{ … }
Tables API
(key/value
data)
DocumentDB SQL,
MongoDB
(document data)
Gremlin API
(graph data)
Column API
(column family
data)
A globally distributed, massively scalable, multi-model database service
Column-family
Document
Graph
Turnkey global distribution
Elastic scale out
of storage & throughput
Guaranteed low latency at the 99th percentile
Comprehensive SLAs
Five well-defined consistency models
Table API
Key-value
Azure Cosmos DB
MongoDB API
COSMOS DB
¿POR QUÉ?
Globalmente distribuida
Acceso de baja latencia
desde cualquier lugar del
mundo garantizado
Multiples niveles de
consistencia
Strong
Eventual
Session
…
99% SLAs for many things
Disponibilidad
Redimiento
Latencia (<10ms en lecturas)
Consistencia
Servicio básico de Azure presente en todos
los datacenters
Replicación multiregión automática
Multi-homing APIs
Failover automático (o manual)
Diseñado para alta disponibilidad
DISTRIBUCIÓN GLOBAL ‘OUT OF THE BOX’
Peticiones servidas desde la misma región
Latencia de un solo dígito en todo el mundo
Motor optimizado para escrituras sin bloqueos y
para SSD
Indexación síncrona transparente con ritmos
sostenidos de ingesta de datos
BAJA LATENCIA GARANTIZADA
Escribir aplicaciones distribuidas con cosistencia de datos
es dificil
Cinco niveles bien definidos
Se pueden cambiar por código en cualquier momento
Se pueden sobreescribir por petición
MULTIPLES NIVELES DE CONSISTENCIA BIEN DEFINIDOS
Single machine is never a bottle neck
Transparent server-side partition management
Elastically scale storage (GB to PB) and throughput (100 to 100M req/sec)
across many machines and multiple regions
Automatic expiration via policy based TTL
Pay by the hour, change throughput at any time for only what you need
Support for both request per second and requests per minute to handle
spikes cost-effectively
Provisionedrequest/sec
Time
12000000
10000000
8000000
6000000
4000000
2000000
Nov 2016 Dec 2016
Black Friday
Hourly throughput (request/sec)
ESCALADO ELÁSTICO DE ALMACENAMIENTO Y RENDIMIENTO
Database engine operates on Atom-Record-Sequence type system
All data models can be efficiently translated to ARS
Multi-model: Key-value, Document, and Graph
Multi-API: SQL (DocumentDB), MongoDB, Table, and Gremlin
More data-models and APIs to be added
MULTI MODELO Y MULTI API
En sistemas distribuidos mantener índices y esquemas es muy
complejo.
Indexado automático y sincrono
Hash, range, y geospatial
Funciona con todos los modelos
Muy optimizado para escrituras
Physical index
Schema
INDEXADO AUTOMÁTICO INDEPENDIENTE DEL ESQUEMA
Always encrypted at rest and in motion
Fine grained “row level” authorization
Network security with IP firewall rules
Comprehensive Azure compliance certification:
• ISO 27001
• ISO 27018
• EUMC
• HIPAA
• PCI
• SOC1 and SOC2
SEGURIDAD
DEMO: COSMOS DB PLAYGROUND
DEMO: COSMOS DB
- Optimizadas para datos cuando el tiempo es la clave
- La principal diferencia es que las consultas se filtran
y agregan por cuando ocurrieron
- Además esta optimizadas para almacenar y medir
cambios en el tiempo
- Arquitectura
Almacenamiento y compresión basados en
timespam
Purgado de datos automático
Almacemiento basado en tendencias
BASE DE DATOS DE SERIES TEMPORALES
- InfluxDB (VM)
- OpenTSDB sobre HDInsights Hbase
- Azure Time Series
BASE DE DATOS DE SERIES TEMPORALES
DEMO: GRAFANA
THANKS!

More Related Content

What's hot

Administracion de la seguridad de sql server
Administracion de la seguridad de sql serverAdministracion de la seguridad de sql server
Administracion de la seguridad de sql serveranaleydilinaresserra1
 
Novedades en seguridad en SQL Server 2012 v1 | SolidQ Summit 2012
Novedades en seguridad en SQL Server 2012 v1 | SolidQ Summit 2012Novedades en seguridad en SQL Server 2012 v1 | SolidQ Summit 2012
Novedades en seguridad en SQL Server 2012 v1 | SolidQ Summit 2012SolidQ
 
Proyecto teórico práctico
Proyecto teórico prácticoProyecto teórico práctico
Proyecto teórico prácticoTitiushko Jazz
 
Esquemas de seguridad en los sistemas de bases de datos juan anaya manzano
Esquemas de seguridad en los sistemas de bases de datos juan anaya manzanoEsquemas de seguridad en los sistemas de bases de datos juan anaya manzano
Esquemas de seguridad en los sistemas de bases de datos juan anaya manzanoJuan Anaya
 
Diplomado Técnico SQL Server 2012 - Sesión 7/8
Diplomado Técnico SQL Server 2012 - Sesión 7/8Diplomado Técnico SQL Server 2012 - Sesión 7/8
Diplomado Técnico SQL Server 2012 - Sesión 7/8John Bulla
 
Herramientas Control, Monitoreo Y Estadisticas De Bases De Datos Sql
Herramientas Control, Monitoreo Y Estadisticas De Bases De Datos SqlHerramientas Control, Monitoreo Y Estadisticas De Bases De Datos Sql
Herramientas Control, Monitoreo Y Estadisticas De Bases De Datos SqlOlaya Molina
 
MS SQL Server 2012 SP1 para desarrolladores
MS SQL Server 2012 SP1 para desarrolladoresMS SQL Server 2012 SP1 para desarrolladores
MS SQL Server 2012 SP1 para desarrolladoresJoseph Lopez
 
Curso sql server 2012 clase 3
Curso sql server 2012 clase 3Curso sql server 2012 clase 3
Curso sql server 2012 clase 3josealopezpastor
 
Presentacion sobre cassandra
Presentacion sobre cassandraPresentacion sobre cassandra
Presentacion sobre cassandrajesusnoseq
 
ENTERPRISE MANAGER DE LA BASE DE DATOS ORACLE VERSIÓN 11G
ENTERPRISE MANAGER DE LA BASE DE DATOS ORACLE VERSIÓN 11GENTERPRISE MANAGER DE LA BASE DE DATOS ORACLE VERSIÓN 11G
ENTERPRISE MANAGER DE LA BASE DE DATOS ORACLE VERSIÓN 11G1712223955
 
Curso sql server 2012 clase 1
Curso sql server 2012 clase 1Curso sql server 2012 clase 1
Curso sql server 2012 clase 1josealopezpastor
 
Administración y programación en sql server
Administración y programación en sql serverAdministración y programación en sql server
Administración y programación en sql serverIsabel_Samir
 

What's hot (19)

Administracion de la seguridad de sql server
Administracion de la seguridad de sql serverAdministracion de la seguridad de sql server
Administracion de la seguridad de sql server
 
Novedades en seguridad en SQL Server 2012 v1 | SolidQ Summit 2012
Novedades en seguridad en SQL Server 2012 v1 | SolidQ Summit 2012Novedades en seguridad en SQL Server 2012 v1 | SolidQ Summit 2012
Novedades en seguridad en SQL Server 2012 v1 | SolidQ Summit 2012
 
Proyecto teórico práctico
Proyecto teórico prácticoProyecto teórico práctico
Proyecto teórico práctico
 
Esquemas de seguridad en los sistemas de bases de datos juan anaya manzano
Esquemas de seguridad en los sistemas de bases de datos juan anaya manzanoEsquemas de seguridad en los sistemas de bases de datos juan anaya manzano
Esquemas de seguridad en los sistemas de bases de datos juan anaya manzano
 
Diplomado Técnico SQL Server 2012 - Sesión 7/8
Diplomado Técnico SQL Server 2012 - Sesión 7/8Diplomado Técnico SQL Server 2012 - Sesión 7/8
Diplomado Técnico SQL Server 2012 - Sesión 7/8
 
Herramientas Control, Monitoreo Y Estadisticas De Bases De Datos Sql
Herramientas Control, Monitoreo Y Estadisticas De Bases De Datos SqlHerramientas Control, Monitoreo Y Estadisticas De Bases De Datos Sql
Herramientas Control, Monitoreo Y Estadisticas De Bases De Datos Sql
 
Taller de Base de Datos - Unidad 4 seguridad
Taller de Base de Datos - Unidad 4 seguridadTaller de Base de Datos - Unidad 4 seguridad
Taller de Base de Datos - Unidad 4 seguridad
 
MS SQL Server 2012 SP1 para desarrolladores
MS SQL Server 2012 SP1 para desarrolladoresMS SQL Server 2012 SP1 para desarrolladores
MS SQL Server 2012 SP1 para desarrolladores
 
Curso sql server 2012 clase 3
Curso sql server 2012 clase 3Curso sql server 2012 clase 3
Curso sql server 2012 clase 3
 
Presentacion sobre cassandra
Presentacion sobre cassandraPresentacion sobre cassandra
Presentacion sobre cassandra
 
Microsoft SQL Server 2012
 Microsoft SQL  Server  2012 Microsoft SQL  Server  2012
Microsoft SQL Server 2012
 
ENTERPRISE MANAGER DE LA BASE DE DATOS ORACLE VERSIÓN 11G
ENTERPRISE MANAGER DE LA BASE DE DATOS ORACLE VERSIÓN 11GENTERPRISE MANAGER DE LA BASE DE DATOS ORACLE VERSIÓN 11G
ENTERPRISE MANAGER DE LA BASE DE DATOS ORACLE VERSIÓN 11G
 
Curso sql server 2012 clase 1
Curso sql server 2012 clase 1Curso sql server 2012 clase 1
Curso sql server 2012 clase 1
 
Taller de Base de Datos - Unidad 6 SQL procedural
Taller de Base de Datos - Unidad 6 SQL proceduralTaller de Base de Datos - Unidad 6 SQL procedural
Taller de Base de Datos - Unidad 6 SQL procedural
 
Base de-datos-en-microsoft-sql-server
Base de-datos-en-microsoft-sql-serverBase de-datos-en-microsoft-sql-server
Base de-datos-en-microsoft-sql-server
 
Presentación SQL Server 2012
Presentación SQL Server 2012Presentación SQL Server 2012
Presentación SQL Server 2012
 
Administración y programación en sql server
Administración y programación en sql serverAdministración y programación en sql server
Administración y programación en sql server
 
Caracteristicas Microsoft SQL Server
Caracteristicas Microsoft SQL ServerCaracteristicas Microsoft SQL Server
Caracteristicas Microsoft SQL Server
 
Presentacion de Microsoft SQL Server.
Presentacion de Microsoft SQL Server. Presentacion de Microsoft SQL Server.
Presentacion de Microsoft SQL Server.
 

Similar to Industria 4.0 2017 - Almacenamiento y procesamiento de datos en la nube

El mundo Big Data y las APIs
El mundo Big Data y las APIsEl mundo Big Data y las APIs
El mundo Big Data y las APIsBig Data Spain
 
Big data y las apis (big data spain)
Big data y las apis (big data spain)Big data y las apis (big data spain)
Big data y las apis (big data spain)CloudAppi
 
Expert Academy Chile - Azure Cosmos DB and Open Source
Expert Academy Chile - Azure Cosmos DB and Open SourceExpert Academy Chile - Azure Cosmos DB and Open Source
Expert Academy Chile - Azure Cosmos DB and Open SourceMatias Quaranta
 
AWS Summit Barcelona - Data Analysis on AWS
AWS Summit Barcelona - Data Analysis on AWSAWS Summit Barcelona - Data Analysis on AWS
AWS Summit Barcelona - Data Analysis on AWSAmazon Web Services
 
Expert Academy Argentina - Azure Cosmos DB Fundamentals
Expert Academy Argentina - Azure Cosmos DB FundamentalsExpert Academy Argentina - Azure Cosmos DB Fundamentals
Expert Academy Argentina - Azure Cosmos DB FundamentalsMatias Quaranta
 
Expert Academy Chile - Azure Cosmos DB SQL
Expert Academy Chile - Azure Cosmos DB SQLExpert Academy Chile - Azure Cosmos DB SQL
Expert Academy Chile - Azure Cosmos DB SQLMatias Quaranta
 
Mejores prácticas para migrar sus bases de datos a AWS
Mejores prácticas para migrar sus bases de datos a AWSMejores prácticas para migrar sus bases de datos a AWS
Mejores prácticas para migrar sus bases de datos a AWSAmazon Web Services LATAM
 
Mejores prácticas para migrar sus bases de datos a AWS
Mejores prácticas para migrar sus bases de datos a AWSMejores prácticas para migrar sus bases de datos a AWS
Mejores prácticas para migrar sus bases de datos a AWSAmazon Web Services LATAM
 
Data Platform de BEEVA
Data Platform de BEEVAData Platform de BEEVA
Data Platform de BEEVABEEVA_es
 
Los beneficios de migrar sus cargas de trabajo de big data a AWS
Los beneficios de migrar sus cargas de trabajo de big data a AWSLos beneficios de migrar sus cargas de trabajo de big data a AWS
Los beneficios de migrar sus cargas de trabajo de big data a AWSAmazon Web Services LATAM
 
Integración de Datos sin límites con Pentaho
Integración de Datos sin límites con PentahoIntegración de Datos sin límites con Pentaho
Integración de Datos sin límites con PentahoDatalytics
 

Similar to Industria 4.0 2017 - Almacenamiento y procesamiento de datos en la nube (20)

El mundo Big Data y las APIs
El mundo Big Data y las APIsEl mundo Big Data y las APIs
El mundo Big Data y las APIs
 
Big data y las apis (big data spain)
Big data y las apis (big data spain)Big data y las apis (big data spain)
Big data y las apis (big data spain)
 
Big Data en Azure: Azure Data Lake
Big Data en Azure: Azure Data LakeBig Data en Azure: Azure Data Lake
Big Data en Azure: Azure Data Lake
 
Expert Academy Chile - Azure Cosmos DB and Open Source
Expert Academy Chile - Azure Cosmos DB and Open SourceExpert Academy Chile - Azure Cosmos DB and Open Source
Expert Academy Chile - Azure Cosmos DB and Open Source
 
Servicios de Bases de Datos de AWS
Servicios de Bases de Datos de AWSServicios de Bases de Datos de AWS
Servicios de Bases de Datos de AWS
 
AWS Summit Barcelona - Data Analysis on AWS
AWS Summit Barcelona - Data Analysis on AWSAWS Summit Barcelona - Data Analysis on AWS
AWS Summit Barcelona - Data Analysis on AWS
 
Sistema de Bases de Datos AWS
Sistema de Bases de Datos AWSSistema de Bases de Datos AWS
Sistema de Bases de Datos AWS
 
Servicios de Bases de Datos de AWS
Servicios de Bases de Datos de AWSServicios de Bases de Datos de AWS
Servicios de Bases de Datos de AWS
 
Expert Academy Argentina - Azure Cosmos DB Fundamentals
Expert Academy Argentina - Azure Cosmos DB FundamentalsExpert Academy Argentina - Azure Cosmos DB Fundamentals
Expert Academy Argentina - Azure Cosmos DB Fundamentals
 
Expert Academy Chile - Azure Cosmos DB SQL
Expert Academy Chile - Azure Cosmos DB SQLExpert Academy Chile - Azure Cosmos DB SQL
Expert Academy Chile - Azure Cosmos DB SQL
 
Mejores prácticas para migrar sus bases de datos a AWS
Mejores prácticas para migrar sus bases de datos a AWSMejores prácticas para migrar sus bases de datos a AWS
Mejores prácticas para migrar sus bases de datos a AWS
 
Mejores prácticas para migrar sus bases de datos a AWS
Mejores prácticas para migrar sus bases de datos a AWSMejores prácticas para migrar sus bases de datos a AWS
Mejores prácticas para migrar sus bases de datos a AWS
 
Data Platform de BEEVA
Data Platform de BEEVAData Platform de BEEVA
Data Platform de BEEVA
 
Base de datos3
Base de datos3Base de datos3
Base de datos3
 
Base de datos
Base de datosBase de datos
Base de datos
 
Bases de datos
Bases de datosBases de datos
Bases de datos
 
392354189-SGBD.pptx
392354189-SGBD.pptx392354189-SGBD.pptx
392354189-SGBD.pptx
 
Los beneficios de migrar sus cargas de trabajo de big data a AWS
Los beneficios de migrar sus cargas de trabajo de big data a AWSLos beneficios de migrar sus cargas de trabajo de big data a AWS
Los beneficios de migrar sus cargas de trabajo de big data a AWS
 
Bases de Datos
Bases de Datos Bases de Datos
Bases de Datos
 
Integración de Datos sin límites con Pentaho
Integración de Datos sin límites con PentahoIntegración de Datos sin límites con Pentaho
Integración de Datos sin límites con Pentaho
 

More from Rodrigo Corral

El lenguaje de pogramación C++
El lenguaje de pogramación C++El lenguaje de pogramación C++
El lenguaje de pogramación C++Rodrigo Corral
 
CAS 2016 Scrum internals - Por qué scrum funciona
CAS 2016   Scrum internals - Por qué scrum funcionaCAS 2016   Scrum internals - Por qué scrum funciona
CAS 2016 Scrum internals - Por qué scrum funcionaRodrigo Corral
 
DotNet Spain 2016 - Añadiendo visibilidad a tus aplicaciones.pptx
DotNet Spain 2016 - Añadiendo visibilidad a tus aplicaciones.pptxDotNet Spain 2016 - Añadiendo visibilidad a tus aplicaciones.pptx
DotNet Spain 2016 - Añadiendo visibilidad a tus aplicaciones.pptxRodrigo Corral
 
Alm como factor diferenciador
Alm como factor diferenciadorAlm como factor diferenciador
Alm como factor diferenciadorRodrigo Corral
 
Introducción a phone gap
Introducción a phone gapIntroducción a phone gap
Introducción a phone gapRodrigo Corral
 
Llevando scrum a grandes organizaciones
Llevando scrum a grandes organizacionesLlevando scrum a grandes organizaciones
Llevando scrum a grandes organizacionesRodrigo Corral
 
Leyes que todo agilista debería conocer
Leyes que todo agilista debería conocerLeyes que todo agilista debería conocer
Leyes que todo agilista debería conocerRodrigo Corral
 
Caminando hacia la agilidad con Visual Studio 2010
Caminando hacia la agilidad con Visual Studio 2010Caminando hacia la agilidad con Visual Studio 2010
Caminando hacia la agilidad con Visual Studio 2010Rodrigo Corral
 
Ingeniería del software y metodologías ágiles
Ingeniería del software y metodologías ágilesIngeniería del software y metodologías ágiles
Ingeniería del software y metodologías ágilesRodrigo Corral
 
ALM09 - Scrum, Visual Studio y Buenas Prácticas
ALM09 - Scrum, Visual Studio y Buenas PrácticasALM09 - Scrum, Visual Studio y Buenas Prácticas
ALM09 - Scrum, Visual Studio y Buenas PrácticasRodrigo Corral
 
Scrum, Team System y el mundo real
Scrum, Team System y el mundo realScrum, Team System y el mundo real
Scrum, Team System y el mundo realRodrigo Corral
 
Control de proyectos con Metodologías ágiles y Team System
Control de proyectos con Metodologías ágiles y Team SystemControl de proyectos con Metodologías ágiles y Team System
Control de proyectos con Metodologías ágiles y Team SystemRodrigo Corral
 
Windows Azure: ¿Quieres estar en las nubes?
Windows Azure: ¿Quieres estar en las nubes?Windows Azure: ¿Quieres estar en las nubes?
Windows Azure: ¿Quieres estar en las nubes?Rodrigo Corral
 
Novedades en la gestión de proyectos en VS2010
Novedades en la gestión de proyectos en VS2010Novedades en la gestión de proyectos en VS2010
Novedades en la gestión de proyectos en VS2010Rodrigo Corral
 

More from Rodrigo Corral (15)

El lenguaje de pogramación C++
El lenguaje de pogramación C++El lenguaje de pogramación C++
El lenguaje de pogramación C++
 
CAS 2016 Scrum internals - Por qué scrum funciona
CAS 2016   Scrum internals - Por qué scrum funcionaCAS 2016   Scrum internals - Por qué scrum funciona
CAS 2016 Scrum internals - Por qué scrum funciona
 
DotNet Spain 2016 - Añadiendo visibilidad a tus aplicaciones.pptx
DotNet Spain 2016 - Añadiendo visibilidad a tus aplicaciones.pptxDotNet Spain 2016 - Añadiendo visibilidad a tus aplicaciones.pptx
DotNet Spain 2016 - Añadiendo visibilidad a tus aplicaciones.pptx
 
Alm como factor diferenciador
Alm como factor diferenciadorAlm como factor diferenciador
Alm como factor diferenciador
 
Introducción a phone gap
Introducción a phone gapIntroducción a phone gap
Introducción a phone gap
 
Llevando scrum a grandes organizaciones
Llevando scrum a grandes organizacionesLlevando scrum a grandes organizaciones
Llevando scrum a grandes organizaciones
 
Leyes que todo agilista debería conocer
Leyes que todo agilista debería conocerLeyes que todo agilista debería conocer
Leyes que todo agilista debería conocer
 
Deuda técnica
Deuda técnicaDeuda técnica
Deuda técnica
 
Caminando hacia la agilidad con Visual Studio 2010
Caminando hacia la agilidad con Visual Studio 2010Caminando hacia la agilidad con Visual Studio 2010
Caminando hacia la agilidad con Visual Studio 2010
 
Ingeniería del software y metodologías ágiles
Ingeniería del software y metodologías ágilesIngeniería del software y metodologías ágiles
Ingeniería del software y metodologías ágiles
 
ALM09 - Scrum, Visual Studio y Buenas Prácticas
ALM09 - Scrum, Visual Studio y Buenas PrácticasALM09 - Scrum, Visual Studio y Buenas Prácticas
ALM09 - Scrum, Visual Studio y Buenas Prácticas
 
Scrum, Team System y el mundo real
Scrum, Team System y el mundo realScrum, Team System y el mundo real
Scrum, Team System y el mundo real
 
Control de proyectos con Metodologías ágiles y Team System
Control de proyectos con Metodologías ágiles y Team SystemControl de proyectos con Metodologías ágiles y Team System
Control de proyectos con Metodologías ágiles y Team System
 
Windows Azure: ¿Quieres estar en las nubes?
Windows Azure: ¿Quieres estar en las nubes?Windows Azure: ¿Quieres estar en las nubes?
Windows Azure: ¿Quieres estar en las nubes?
 
Novedades en la gestión de proyectos en VS2010
Novedades en la gestión de proyectos en VS2010Novedades en la gestión de proyectos en VS2010
Novedades en la gestión de proyectos en VS2010
 

Industria 4.0 2017 - Almacenamiento y procesamiento de datos en la nube

  • 1.
  • 2. RODRIGO CORRAL GONZÁLEZ ALM TEAM LEAD & SOFTWARE ARCHITECT RCORRAL@PLAINCONCEPTS.COM @R_CORRAL
  • 3. TIPOS DE DATOS Datos operacionales Datos de lectura y escritura que representan el estado de la aplicación Ejemplos: Ordenes en una aplicación de comercio electrónico, información del cliente en un CRM… Datos analíticos Datos de solo lectura usados para análisis Ejemplos: Data warehouses, machine learning data Datos en Streaming Datos producidos en tiempo real Examples: Internet of Things (IoT), e.g., sensor data
  • 4. SQL Database SQL Data Warehouse Stream Analytics DATOS EN AZURE, UN RESUMEN Operacionales Analíticos Streaming Tables Cosmos DB HBase Storm/Spark Streaming/Kafka Data Lake Analytics/Store Machine Learning Hive/Spark/… Event Hubs IoT Hub Data Factory HDInsight
  • 5. GENERALIDADES SOBRE DATOS EN LA NUBE Azure proporciona servicios PaaS para datos Todo lo que veremos cae en esta categoria (con pequeñas excepciones) Beneficios comunes de los servicios PassS Nada que instalar, nada que actualizar Pago por uso Alta disponibilidad garantizada Escalado sencillo Sin duda es el futuro en almacenamiento y procesamiento de datos Por que no usar servicios que hacen la gran mayoría del trabajo sucio por nosotros y centrarnos en lo que es de valor
  • 6. - Volúmenes de datos siempre crecientes - Valor futuro de los datos desconocido - Datos semi-estructurados - Datos ligados a eventos y al tiempo IOT Y DATOS
  • 7. - Paradigma perfectamente conocido - Mínimos cambios (si alguno) en aplicaciones existentes - Geo-replicación - Escalado muy simple - Optimización automática - Seguridad - - Detección automática de amenazas - - Encriptación transparente SQL AZURE
  • 8. - MariaDB - PostgreSQL - MySQL OTRAS BBDD RELACIONALES EN AZURE
  • 9. Ingest all data regardless of requirements Store all data in native format without schema definition Do analysis Hadoop, Spark, R, Azure Data Lake Analytics (ADLA) Interactive queries Batch queries Machine Learning Data warehouse Real-time analytics Devices DISEÑADO PARA PODER RESPONDER PREGUNTAS QUE AUN NO CONOCEMOS DATA LAKES
  • 11. AZURE DATA LAKE (STORE & ANALYTICS) HDFS Compatible REST API ADL Store .NET, SQL, Python, R scaled out by U-SQL ADL Analytics Open Source Apache Hadoop ADL Client HDInsight Hive • Redimiento y escalabilidad sin limites • Optimizado para análisis • Soporte para tu herramienta de análisis favorita • Un punto central de almacenamiento de información en bruto • Seguridad integrada con AAD
  • 12. - Optimizado para cargas de trabajo de análisis de datos - Carpetas y archivos vs. Contenedores y blobs - Sistema jerarquico vs. Espacio de nombres plano - Ambos API Rest HTTPS - API compatible con WebHDFS y por lo tanto con el ecosistema Hive, Spark, Storm - Seguridad basada en identidades vs. seguridad basada en claves - Sin limites de tamaños - Almacenamiento extremadamente económico DATA LAKE STORE VS. AZURE STORAGE
  • 13. Con cargas de trabajo BATCH, Data Lake Analytics es ideal • Para la transformación y preparación de datos para su uso en otros sistemas • el Análisis de volumenes de datos ENORMES • de Manera Paralela con programas escritos en .NET, Python y R, escalados con U-SQL • Y con funciones Cognitivas sobre colecciones de datos DATA LAKE ANALYTICS
  • 14. y paraleliza código en .NET, Python o R sobre tu Data Lake Sintasis familiar para millones de desarrolladores SQL & .NET Unifica • La naturaleza declarative de SQL con el poder de C# • Procesa datos estructurados, semistructurados y no estructurados • Permite consultar multiples fuentes de datos en Azure • Permite analizar mediante batches, interactivamente, en streaming y con ciertas capacidades de ML en un lenguaje U-SQL Un framework para Big Data
  • 15. @searchlog = EXTRACT UserId int, Start DateTime, Region string, Query string, Duration int?, Urls string, ClickedUrls string FROM "/Samples/Data/SearchLog.tsv" USING Extractors.Tsv(); OUTPUT @searchlog TO "/output/SearchLog-first-u-sql.csv" USING Outputters.Csv(); U-SQL SYNTAX
  • 17. ADLA: USAR CÓDIGO C# CREATE ASSEMBLY IF NOT EXISTS Images FROM @"/assemblies/Images.dll"; REFERENCE ASSEMBLY Images;
  • 18. ADLA: EXTRAER IMAGEN @image_data = EXTRACT image_data byte[] FROM @"/Samples/input/guard.jpg" USING new Images.ImageExtractor();
  • 19. ADLA: EXTRAER IMAGEN @image_data = EXTRACT image_data byte[] FROM @"/Samples/input/guard.jpg" USING new Images.ImageExtractor();
  • 20. ADLA: TRANSFORMAR DECLARE @image_copyright_id int = 0x8298; DECLARE @image_make_id int = 0x010F; DECLARE @image_model_id int = 0x0110; DECLARE @image_description_id int = 0x010E; @image_properties = SELECT Images.ImageOps.getImageProperty(image_data, @image_copyright_id) AS image_copyright, Images.ImageOps.getImageProperty(image_data, @image_make_id) AS image_equipment_make, Images.ImageOps.getImageProperty(image_data, @image_model_id) AS image_equipment_model, Images.ImageOps.getImageProperty(image_data, @image_description_id) AS image_description FROM @image_data; @scaled_image = SELECT Images.ImageOps.scaleImageTo(image_data, 150, 150) AS thumbnail_image FROM @image_data;
  • 21. ADLA: EXTRAER RESULTADOS OUTPUT @image_properties TO @"/Samples/output/metadata.csv" USING Outputters.Csv(); OUTPUT @scaled_image TO "/Samples/output/thumbnail.jpg" USING new Images.ImageOutputter();
  • 23. ¿POR QUÉ USAR NOSQL? Para escalar a muchos usuarios y muchos datos Pros: NoSQL proporciona mayor escalabilidad que los Sistemas SQL tradicionales Cons: Con ciertos sacrificios, transaccionalidad, orientación a conjuntos, familiaridad Mayor flexibilidad en el trabajo con datos Pros: No hay esquemas fijos Cons: Los esquemas previenen errores To work better with different data models Pros: Cada vez manejamos más datos no relacionales Cons: No estamos familiarizados con estos modelos de datos
  • 24. NOSQL DATA MODELS DIFERENTES APROXIMACIONES Key/Value K V V V V K V V K V V V K V V V V Document { … } { … } { … } GraphColumn Family
  • 25. Tables TABLES ALMACENAMIENTO KEY/VALUE Application Key/Value Data K V V V V K V V K V V V K V V V V Send key K Return values V V V
  • 26. TABLES ¿POR QUÉ? Simplicidad Key/value propone un paradigma muy sencillo Muy escalable Una base de datos puede contener teras de datos El sharding es muy simple Low cost Almacenamiento muy eficiente en coste
  • 27. Cosmos DB COSMOS DB A MULTI-MODEL STORE Application Data K V V V V K V V K V V V K V V V V { … } { … } { … } Tables API (key/value data) DocumentDB SQL, MongoDB (document data) Gremlin API (graph data) Column API (column family data)
  • 28. A globally distributed, massively scalable, multi-model database service Column-family Document Graph Turnkey global distribution Elastic scale out of storage & throughput Guaranteed low latency at the 99th percentile Comprehensive SLAs Five well-defined consistency models Table API Key-value Azure Cosmos DB MongoDB API
  • 29. COSMOS DB ¿POR QUÉ? Globalmente distribuida Acceso de baja latencia desde cualquier lugar del mundo garantizado Multiples niveles de consistencia Strong Eventual Session … 99% SLAs for many things Disponibilidad Redimiento Latencia (<10ms en lecturas) Consistencia
  • 30. Servicio básico de Azure presente en todos los datacenters Replicación multiregión automática Multi-homing APIs Failover automático (o manual) Diseñado para alta disponibilidad DISTRIBUCIÓN GLOBAL ‘OUT OF THE BOX’
  • 31. Peticiones servidas desde la misma región Latencia de un solo dígito en todo el mundo Motor optimizado para escrituras sin bloqueos y para SSD Indexación síncrona transparente con ritmos sostenidos de ingesta de datos BAJA LATENCIA GARANTIZADA
  • 32. Escribir aplicaciones distribuidas con cosistencia de datos es dificil Cinco niveles bien definidos Se pueden cambiar por código en cualquier momento Se pueden sobreescribir por petición MULTIPLES NIVELES DE CONSISTENCIA BIEN DEFINIDOS
  • 33. Single machine is never a bottle neck Transparent server-side partition management Elastically scale storage (GB to PB) and throughput (100 to 100M req/sec) across many machines and multiple regions Automatic expiration via policy based TTL Pay by the hour, change throughput at any time for only what you need Support for both request per second and requests per minute to handle spikes cost-effectively Provisionedrequest/sec Time 12000000 10000000 8000000 6000000 4000000 2000000 Nov 2016 Dec 2016 Black Friday Hourly throughput (request/sec) ESCALADO ELÁSTICO DE ALMACENAMIENTO Y RENDIMIENTO
  • 34. Database engine operates on Atom-Record-Sequence type system All data models can be efficiently translated to ARS Multi-model: Key-value, Document, and Graph Multi-API: SQL (DocumentDB), MongoDB, Table, and Gremlin More data-models and APIs to be added MULTI MODELO Y MULTI API
  • 35. En sistemas distribuidos mantener índices y esquemas es muy complejo. Indexado automático y sincrono Hash, range, y geospatial Funciona con todos los modelos Muy optimizado para escrituras Physical index Schema INDEXADO AUTOMÁTICO INDEPENDIENTE DEL ESQUEMA
  • 36. Always encrypted at rest and in motion Fine grained “row level” authorization Network security with IP firewall rules Comprehensive Azure compliance certification: • ISO 27001 • ISO 27018 • EUMC • HIPAA • PCI • SOC1 and SOC2 SEGURIDAD
  • 37. DEMO: COSMOS DB PLAYGROUND
  • 39. - Optimizadas para datos cuando el tiempo es la clave - La principal diferencia es que las consultas se filtran y agregan por cuando ocurrieron - Además esta optimizadas para almacenar y medir cambios en el tiempo - Arquitectura Almacenamiento y compresión basados en timespam Purgado de datos automático Almacemiento basado en tendencias BASE DE DATOS DE SERIES TEMPORALES
  • 40. - InfluxDB (VM) - OpenTSDB sobre HDInsights Hbase - Azure Time Series BASE DE DATOS DE SERIES TEMPORALES

Editor's Notes

  1. WPC 2012
  2. WPC 2012
  3. 27
  4. 28
  5. WPC 2012
  6. 30
  7. 31
  8. 32
  9. 33
  10. 34
  11. 35
  12. 36