SlideShare a Scribd company logo
1 of 31
Download to read offline
Explorando los Sabores de Azure Data Factory
09 de Agosto (12 pm GMT -5)
Raúl Martín Saráchaga Díaz
Resumen:
En esta charla se explorarán las principales características que nos brinda este
servicio de Data Factory para la migración de datos ubicados on premises o en la
nube, así como la creación de tareas ELT para la migración de datos locales.
Está por comenzar:
Moderador: Kenneth Ureña
Manténgase conectado a nosotros!
Visítenos en http://globalspanish.sqlpass.org
/SpanishPASSVC
lnkd.in/dtYBzev
/user/SpanishPASSVC
/SpanishPASSVC
3
4
Oportunidades de Voluntariado
PASS no pudiera existir sin personas apasionadas y
dedicadas de todas partes del mundo que dan de su
tiempo como voluntarios.
Se un voluntario ahora!!
Para identificar oportunidades locales visita
volunteer.sqlpass.org
Recuerda actualizar tu perfil en las secciones de
“MyVolunteering” y MyPASS para mas detalles.
Sigan Participando!
• Obtén tu membresía gratuita en sqlpass.org
• Linked In: http://www.sqlpass.org/linkedin
• Facebook: http://www.sqlpass.org/facebook
• Twitter: @SQLPASS
• PASS: http://www.sqlpass.org
Explorando los Sabores de Azure Data Factory
Agosto 9 de 2017
Raúl Martín Saráchaga Díaz
Consultor en Inteligencia de Negocios y Plataforma de Datos con experiencia en áreas de
salud y retail, donde he realizado proyectos que incluyen integración, modelado, análisis y
visualización de datos, teniendo como base fundamental la plataforma de datos de
Microsoft. Ponente habitual en eventos organizados por la comunidad del SQLPASS Lima ,
Peru Bi & Analytics Group y el Power BI User Group Lima.
Moderador: Kenneth Ureña
AGENDA DE HOY
7
05 IMPLEMENTAR LO APRENDIO CON AZ. DATA FACTORY
Demos colocándonos en varios escenarios de integración.
04 CARACTERÍSTICAS CLAVES DE AZURE DATA FACTORY
Por donde comenzar con este servicio en la nube
03 UNA LUZ AL FINAL DEL CAMINO CON AZ. DATA FACTORY
Como el servicio de Data Factory nos ayuda para la integración.
02 SOLUCIONES DE DW A LA NUBE , SUPER RETO
Que variantes existen cuando se lleva una solución de DW a la nube.
01 SOLUCIONES DE DW, VAYA RETO
Explorar las características de una solución de DW Tradicional
06 PREGUNTAS & RESPUESTAS
Tú preguntas… Yo respondo
Conocer cómo es que Azure Data Factory puede ayudarnos
en la integración de datos en nuestra organización.
8
LES PASA A MUCHOS, LES PASA A TODOS
ESTE ESCENARIO APOCALÍPTICO DE INTEGRACIÓN NO ES EXCLUSIVO DE TU EMPRESA
Data Warehouse Tradicional
9
Acceso a Datos Visualización de
Datos
On-premises Data
Sources
SQL Database
XLS / XLSX / CSV /
TXT / PBIX / +
Modelo
Semántico
Metadata
Integración Almacenamiento
Data
Warehouse
Staging
10
Capa de Integración
Modern BI & Analytics
Integración
Staging
▪ Esta capa de integración servirá de almacén de
los orígenes de datos.
▪ Almacenará por un determinado periodo de
tiempo los datos de las diferentes cargas.
▪ Me permitirá realizar transformación antes de ser
cargados al Data Warehouse.
11
Capa de Almacenamiento
Modern BI & Analytics
Integración
Staging
▪ Esta capa de almacenamiento contendrá algunos
datos de la capa de integración.
▪ La data es transformada antes de llegar a esta
capa.
▪ Se almacenan de forma normalizada.
▪ Los datos de los distintos orígenes de datos se
encuentran centralizados.
Almacenamient
o
Data
Warehouse
12
Capa de Acceso a Datos
Modern BI & Analytics
Integración
Staging
▪ En esta capa de acceso a datos se encontrarán
los repositorios desde donde los usuarios finales
se conectarán para poder analizar los datos.
▪ Esta data se encuentra des normalizada para
lograr un mejor rendimiento en tiempo de
respuesta.
▪ Se encuentra con un lenguaje natural para el
usuario final.
Acceso a Datos
Modelo
Semántico
13
Capa de Metadata
Modern BI & Analytics
▪ En esta capa de metadata almacena información
sobre los procesos ejecutados al llevar datos de una
capa a otra.
▪ Se pueden realizar consultas a esta capa para
verificar si los procesos de Extracción , Carga y
Transformación finalizaron correctamente.
Metadata
14
ES HORA DE LLEVAR
EL DATA WAREHOUSE A LA NUBE
VAMOS , SI SE PUEDE !!!!
Data Warehouse en la Nube
15
Acceso a Datos Visualización de
Datos
On-premises Data
Sources
CSV / TXT
Azure
Analysis Services
Metadata
Integración Almacenamiento
Azure SQL Data
Warehouse
Azure Data
Lake Store
Power BI
Excel
Azure SQL Data
Base
Azure
Storage
Blob
16
On-premises Data
Modern BI & Analytics
▪ Se recomienda que los archivos de orígenes sean
archivos planos como .csv o .txt.
On-premises
Data Sources
17
Acceso a Datos
Integración
Modern BI & Analytics
▪ Azure Data Lake Store:
▪ Almacenamiento optimizado para grandes
cargas de trabajo de análisis de datos
▪ Azure Storage Blob:
▪ Almacén de objetos de propósito general
para una amplia variedad de escenarios de
almacenamiento.
▪ Las tecnologías podría utilizarse como capas de
stage.
Integración
Azure Data
Lake Store
Azure
Storage
Blob
18
Acceso a Datos
Almacenamiento
Modern BI & Analytics
▪ Azure Data Warehouse:
▪ Solución especializada para grandes
volúmenes de datos.
▪ Procesamiento MPP (Massively Parallel
Processing).
▪ Mejor tiempo de respuesta en el
procesamiento de datos.
▪ Puede encenderse o apagar el servicio para
reducción de costos.
Almacenamient
o
Azure SQL Data
Warehouse
19
Acceso a Datos
Almacenamiento
Modern BI & Analytics
▪ Azure Analysis Services:
▪ Solución que tiene como base un motor
analítico de eficacia probada de Microsoft
SQL Server Analysis Services.
▪ Permite crear un modelo semántico con un
lenguaje más cercano al usuario final.
▪ Servicio especializado en la creación KPIs.
Acceso a Datos
Azure
Analysis Services
20
Acceso a Datos
Almacenamiento
Modern BI & Analytics
▪ Azure SQL Database:
▪ Base de Datos transaccional de Microsoft.
▪ Permite almacenar información de los distintos
procesos que con ejecutados durante el proceso
de ELT en la solución de Data Warehouse.
Metadata
Azure SQL Data
Base
Integración de Data en la Nube
21
Acceso a Datos Visualización de
Datos
On-premises Data
Sources
CSV / TXT
Azure
Analysis Services
Metadata
Integración Almacenamiento
Azure SQL Data
Warehouse
Azure Data
Lake Store
Power BI
Excel
Azure SQL Data
Base
PolybaseAzure Data
Factory
Azure
Storage
Blob
Azure Data
Factory
Azure Data
Factory
Azure Data Factory
22
SERVICIO
AZURE
Servicio de movimiento
de datos globalmente
implementado en la nube.
Permite conectarse a orígenes
en nube y locales
ANALIZAR &
TRANSFORMAR
Programe y administre el
proceso de transformación
y análisis de datos
PUBLICAR &
CONSUMIR
Utilice canalizaciones de datos
para transformar datos
sin procesar en datos finalizados o
formados preparados para
que las aplicaciones o herramientas
de BI los consuman.
Relación entre Entidades de Azure Data Factory
23
PIPELINE
Una canalización es
un grupo de actividades
ACTIVITY
Definen las acciones
que se van a realizar en los datos
DATA SET
Cada actividad toma
cero o más conjuntos
de datos como entrada y
genera uno o varios conjuntos
de datos como salida
LINKED
SERVICE
Son muy similares a las cadenas de
conexión que definen
la información de conexión
Linked Service
Categoría Almacén de datos Se admite como origen Se admite como receptor
Las tablas de Azure Almacenamiento de blobs de Azure ✓ ✓
Azure Cosmos DB (API de DocumentDB) ✓ ✓
Almacén de Azure Data Lake ✓ ✓
Azure SQL Database ✓ ✓
Azure SQL Data Warehouse ✓ ✓
Índice de Azure Search ✓
Azure Table Storage ✓ ✓
Bases de datos Amazon Redshift ✓
DB2* ✓
MySQL* ✓
Oracle* ✓ ✓
PostgreSQL* ✓
SAP Business Warehouse* ✓
SAP HANA* ✓
SQL Server* ✓ ✓
Sybase* ✓
24
Activity
Actividad de transformación de datos Entorno de procesos
Hive HDInsight [Hadoop]
Pig HDInsight [Hadoop]
MapReduce HDInsight [Hadoop]
Hadoop Streaming HDInsight [Hadoop]
Spark HDInsight [Hadoop]
Actividades de Machine Learning: ejecución de Batch y recurso de
actualización
MV de Azure
Procedimiento almacenado SQL Azure, Almacenamiento de datos SQL de Azure o SQL Server
U-SQL de análisis con Data Lake Análisis con Azure Data Lake
DotNet HDInsight [Hadoop] o Lote de Azure
25
DEMO
26
Azure Data
Factory
DEMO
27
Azure Data
Factory
CSV / TXT
Azure Data
Management Gateway
DEMO
28
Azure Data
Factory / Activity con
Data Lake Analytics
29
Referencias
https://docs.microsoft.com/es-es/azure/data-factory/data-factory-introduction
https://docs.microsoft.com/es-es/azure/data-factory/data-factory-use-custom-activities
https://aprendebi.wordpress.com/category/azure-data-factory/
30
Me puedes encontrar como :
Raúl Saráchaga
Correo : raulsarachaga@kaitsconsulting.com
Blog: aprendebi.wordpress.com
Facebook: Aprende BI
31
GRACIAS.

More Related Content

What's hot

Data Mesh Part 4 Monolith to Mesh
Data Mesh Part 4 Monolith to MeshData Mesh Part 4 Monolith to Mesh
Data Mesh Part 4 Monolith to Mesh
Jeffrey T. Pollock
 

What's hot (20)

Microsoft Azure Data Factory Hands-On Lab Overview Slides
Microsoft Azure Data Factory Hands-On Lab Overview SlidesMicrosoft Azure Data Factory Hands-On Lab Overview Slides
Microsoft Azure Data Factory Hands-On Lab Overview Slides
 
1- Introduction of Azure data factory.pptx
1- Introduction of Azure data factory.pptx1- Introduction of Azure data factory.pptx
1- Introduction of Azure data factory.pptx
 
Azure Data Factory
Azure Data FactoryAzure Data Factory
Azure Data Factory
 
Data Mesh Part 4 Monolith to Mesh
Data Mesh Part 4 Monolith to MeshData Mesh Part 4 Monolith to Mesh
Data Mesh Part 4 Monolith to Mesh
 
Azure data factory
Azure data factoryAzure data factory
Azure data factory
 
Building Serverless ETL Pipelines with AWS Glue
Building Serverless ETL Pipelines with AWS GlueBuilding Serverless ETL Pipelines with AWS Glue
Building Serverless ETL Pipelines with AWS Glue
 
AWS Tutorial | AWS Certified Solutions Architect | Amazon AWS | AWS Training ...
AWS Tutorial | AWS Certified Solutions Architect | Amazon AWS | AWS Training ...AWS Tutorial | AWS Certified Solutions Architect | Amazon AWS | AWS Training ...
AWS Tutorial | AWS Certified Solutions Architect | Amazon AWS | AWS Training ...
 
Mapping Data Flows Training deck Q1 CY22
Mapping Data Flows Training deck Q1 CY22Mapping Data Flows Training deck Q1 CY22
Mapping Data Flows Training deck Q1 CY22
 
Data Catalog & ETL - Glue & Athena
Data Catalog & ETL - Glue & AthenaData Catalog & ETL - Glue & Athena
Data Catalog & ETL - Glue & Athena
 
Databricks for Dummies
Databricks for DummiesDatabricks for Dummies
Databricks for Dummies
 
Etl And Data Test Guidelines For Large Applications
Etl And Data Test Guidelines For Large ApplicationsEtl And Data Test Guidelines For Large Applications
Etl And Data Test Guidelines For Large Applications
 
Pengantar Cloud Computing dengan AWS - Petra Novandi Barus
Pengantar Cloud Computing dengan AWS - Petra Novandi BarusPengantar Cloud Computing dengan AWS - Petra Novandi Barus
Pengantar Cloud Computing dengan AWS - Petra Novandi Barus
 
ADV Slides: Strategies for Fitting a Data Lake into a Modern Data Architecture
ADV Slides: Strategies for Fitting a Data Lake into a Modern Data ArchitectureADV Slides: Strategies for Fitting a Data Lake into a Modern Data Architecture
ADV Slides: Strategies for Fitting a Data Lake into a Modern Data Architecture
 
Data Catalogs Are the Answer – What is the Question?
Data Catalogs Are the Answer – What is the Question?Data Catalogs Are the Answer – What is the Question?
Data Catalogs Are the Answer – What is the Question?
 
Journey to Cloud Analytics
Journey to Cloud Analytics Journey to Cloud Analytics
Journey to Cloud Analytics
 
Achieving Lakehouse Models with Spark 3.0
Achieving Lakehouse Models with Spark 3.0Achieving Lakehouse Models with Spark 3.0
Achieving Lakehouse Models with Spark 3.0
 
How to Strengthen Enterprise Data Governance with Data Quality
How to Strengthen Enterprise Data Governance with Data QualityHow to Strengthen Enterprise Data Governance with Data Quality
How to Strengthen Enterprise Data Governance with Data Quality
 
Azure data bricks by Eugene Polonichko
Azure data bricks by Eugene PolonichkoAzure data bricks by Eugene Polonichko
Azure data bricks by Eugene Polonichko
 
DataOps - The Foundation for Your Agile Data Architecture
DataOps - The Foundation for Your Agile Data ArchitectureDataOps - The Foundation for Your Agile Data Architecture
DataOps - The Foundation for Your Agile Data Architecture
 
(BDT208) A Technical Introduction to Amazon Elastic MapReduce
(BDT208) A Technical Introduction to Amazon Elastic MapReduce(BDT208) A Technical Introduction to Amazon Elastic MapReduce
(BDT208) A Technical Introduction to Amazon Elastic MapReduce
 

Similar to Explorando los Sabores de Azure Data Factory

PLANTILLA INCEPERÚ Sesión 3.pdf-xxxxxxxx
PLANTILLA INCEPERÚ Sesión 3.pdf-xxxxxxxxPLANTILLA INCEPERÚ Sesión 3.pdf-xxxxxxxx
PLANTILLA INCEPERÚ Sesión 3.pdf-xxxxxxxx
edwin520324
 

Similar to Explorando los Sabores de Azure Data Factory (20)

Azure DataFactory
Azure DataFactoryAzure DataFactory
Azure DataFactory
 
Migrando mis datos a la nube con Azure Data Factory
Migrando mis datos a la nube con Azure Data FactoryMigrando mis datos a la nube con Azure Data Factory
Migrando mis datos a la nube con Azure Data Factory
 
Enterprise Ready Data Warehousing in the Cloud
Enterprise Ready Data Warehousing in the CloudEnterprise Ready Data Warehousing in the Cloud
Enterprise Ready Data Warehousing in the Cloud
 
Explorando los Sabores de Azure DW
Explorando los Sabores de Azure DWExplorando los Sabores de Azure DW
Explorando los Sabores de Azure DW
 
Explorando los Sabores con Azure DW
Explorando los Sabores con Azure DWExplorando los Sabores con Azure DW
Explorando los Sabores con Azure DW
 
Azure SQL Data Warehouse - 24 horas de PASS
Azure SQL Data Warehouse - 24 horas de PASS Azure SQL Data Warehouse - 24 horas de PASS
Azure SQL Data Warehouse - 24 horas de PASS
 
Azure Data Lake
Azure Data LakeAzure Data Lake
Azure Data Lake
 
Azure data lake
Azure data lakeAzure data lake
Azure data lake
 
Data ware house, sebastian pozo
Data ware house, sebastian pozoData ware house, sebastian pozo
Data ware house, sebastian pozo
 
Business Intelligence en Azure
Business Intelligence en AzureBusiness Intelligence en Azure
Business Intelligence en Azure
 
El mundo Big Data y las APIs
El mundo Big Data y las APIsEl mundo Big Data y las APIs
El mundo Big Data y las APIs
 
Qué es Snowflake y cómo funciona.docx
Qué es Snowflake y cómo funciona.docxQué es Snowflake y cómo funciona.docx
Qué es Snowflake y cómo funciona.docx
 
Big Data en Azure: Azure Data Lake
Big Data en Azure: Azure Data LakeBig Data en Azure: Azure Data Lake
Big Data en Azure: Azure Data Lake
 
Big data y las apis (big data spain)
Big data y las apis (big data spain)Big data y las apis (big data spain)
Big data y las apis (big data spain)
 
Introducción a Microsoft Azure SQL Data Warehouse
Introducción a Microsoft Azure SQL Data WarehouseIntroducción a Microsoft Azure SQL Data Warehouse
Introducción a Microsoft Azure SQL Data Warehouse
 
PLANTILLA INCEPERÚ Sesión 3.pdf-xxxxxxxx
PLANTILLA INCEPERÚ Sesión 3.pdf-xxxxxxxxPLANTILLA INCEPERÚ Sesión 3.pdf-xxxxxxxx
PLANTILLA INCEPERÚ Sesión 3.pdf-xxxxxxxx
 
DOCENTE
DOCENTEDOCENTE
DOCENTE
 
Sistemas de soporte
Sistemas de soporteSistemas de soporte
Sistemas de soporte
 
Sistemas de soporte
Sistemas de soporteSistemas de soporte
Sistemas de soporte
 
Big Data - Desarrollando soluciones efectivas
Big Data - Desarrollando soluciones efectivasBig Data - Desarrollando soluciones efectivas
Big Data - Desarrollando soluciones efectivas
 

More from Raul Martin Sarachaga Diaz

More from Raul Martin Sarachaga Diaz (20)

Webinar_Data Integration en Alibaba Cloud.pdf
Webinar_Data Integration en Alibaba Cloud.pdfWebinar_Data Integration en Alibaba Cloud.pdf
Webinar_Data Integration en Alibaba Cloud.pdf
 
Data Modeling with Power BI
Data Modeling with Power BIData Modeling with Power BI
Data Modeling with Power BI
 
Modelo Tabulares con Azure SSAS
Modelo Tabulares con Azure SSASModelo Tabulares con Azure SSAS
Modelo Tabulares con Azure SSAS
 
Dashboards de Alto Impacto con Power BI
Dashboards de Alto Impacto con Power BIDashboards de Alto Impacto con Power BI
Dashboards de Alto Impacto con Power BI
 
Data Model with Power BI
Data Model with Power BIData Model with Power BI
Data Model with Power BI
 
DevOps SQL Server
DevOps SQL ServerDevOps SQL Server
DevOps SQL Server
 
Azure SQL Databases para DBAs
Azure SQL Databases para DBAsAzure SQL Databases para DBAs
Azure SQL Databases para DBAs
 
Creacion de Cubos Tabulares en SSAS 2016
Creacion de Cubos Tabulares en SSAS 2016Creacion de Cubos Tabulares en SSAS 2016
Creacion de Cubos Tabulares en SSAS 2016
 
Data Modeling With Power BI
Data Modeling With Power BIData Modeling With Power BI
Data Modeling With Power BI
 
Explorando los Sabores de Power Query
Explorando los Sabores de Power QueryExplorando los Sabores de Power Query
Explorando los Sabores de Power Query
 
El Despertar de la Fuerza con SSRS 2016
El Despertar de la Fuerza con SSRS 2016El Despertar de la Fuerza con SSRS 2016
El Despertar de la Fuerza con SSRS 2016
 
Azure SQL Database para DBAs
Azure SQL Database para DBAsAzure SQL Database para DBAs
Azure SQL Database para DBAs
 
Tus Datos en la Nube con Azure SQL Database
Tus Datos en la Nube con Azure SQL DatabaseTus Datos en la Nube con Azure SQL Database
Tus Datos en la Nube con Azure SQL Database
 
Analisis de Sentimientos con Power BI
Analisis de Sentimientos con Power BIAnalisis de Sentimientos con Power BI
Analisis de Sentimientos con Power BI
 
Datos Siempre Actualizados con Power BI
Datos Siempre Actualizados con Power BIDatos Siempre Actualizados con Power BI
Datos Siempre Actualizados con Power BI
 
De 0 a 100 con Azure Machine Learning
De 0 a 100 con Azure Machine LearningDe 0 a 100 con Azure Machine Learning
De 0 a 100 con Azure Machine Learning
 
Introduccion Azure Machine Learning
Introduccion Azure Machine LearningIntroduccion Azure Machine Learning
Introduccion Azure Machine Learning
 
Explorando los Sabores de SSIS 2016
Explorando los Sabores de SSIS 2016Explorando los Sabores de SSIS 2016
Explorando los Sabores de SSIS 2016
 
Implementando un Data Mart con SQL Server 2016
Implementando un Data Mart con SQL Server 2016Implementando un Data Mart con SQL Server 2016
Implementando un Data Mart con SQL Server 2016
 
Monitoreo de Base de Datos en Azure
Monitoreo de Base de Datos en AzureMonitoreo de Base de Datos en Azure
Monitoreo de Base de Datos en Azure
 

Recently uploaded

Los más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfLos más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
JC Díaz Herrera
 
Conversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latinoConversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latino
BESTTech1
 
Letra de cambio definición y características.ppt
Letra de cambio definición y características.pptLetra de cambio definición y características.ppt
Letra de cambio definición y características.ppt
ssuserbdc329
 

Recently uploaded (20)

EPIDEMIO CANCER PULMON resumen nnn.pptx
EPIDEMIO CANCER PULMON  resumen nnn.pptxEPIDEMIO CANCER PULMON  resumen nnn.pptx
EPIDEMIO CANCER PULMON resumen nnn.pptx
 
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfLos más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
 
Las familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdfLas familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdf
 
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdfCALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
 
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticAnálisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
 
Conversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latinoConversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latino
 
COMUNICADO PARA TODO TIPO DE REUNIONES .
COMUNICADO PARA TODO TIPO DE REUNIONES .COMUNICADO PARA TODO TIPO DE REUNIONES .
COMUNICADO PARA TODO TIPO DE REUNIONES .
 
Los países por porcentaje de población blanca europea en AL (2024).pdf
Los países por porcentaje de población blanca europea en AL (2024).pdfLos países por porcentaje de población blanca europea en AL (2024).pdf
Los países por porcentaje de población blanca europea en AL (2024).pdf
 
Las mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfLas mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdf
 
Tipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptxTipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptx
 
Letra de cambio definición y características.ppt
Letra de cambio definición y características.pptLetra de cambio definición y características.ppt
Letra de cambio definición y características.ppt
 
Triptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudirTriptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudir
 
Posiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdfPosiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdf
 
Principales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto RicoPrincipales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto Rico
 
diseño de una linea de produccion de jabon liquido.pptx
diseño de una linea de produccion de jabon liquido.pptxdiseño de una linea de produccion de jabon liquido.pptx
diseño de una linea de produccion de jabon liquido.pptx
 
P.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptx
P.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptxP.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptx
P.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptx
 
Análisis del Modo y Efecto de Fallas AMEF.ppt
Análisis del Modo y Efecto de Fallas AMEF.pptAnálisis del Modo y Efecto de Fallas AMEF.ppt
Análisis del Modo y Efecto de Fallas AMEF.ppt
 
PIB PERÚ datos y análisis de los últimos años
PIB PERÚ datos y análisis de los últimos añosPIB PERÚ datos y análisis de los últimos años
PIB PERÚ datos y análisis de los últimos años
 
presentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.pptpresentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.ppt
 
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
Novelas Turcas vs Series de EUA en audiencia  (2024).pdfNovelas Turcas vs Series de EUA en audiencia  (2024).pdf
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
 

Explorando los Sabores de Azure Data Factory

  • 1. Explorando los Sabores de Azure Data Factory 09 de Agosto (12 pm GMT -5) Raúl Martín Saráchaga Díaz Resumen: En esta charla se explorarán las principales características que nos brinda este servicio de Data Factory para la migración de datos ubicados on premises o en la nube, así como la creación de tareas ELT para la migración de datos locales. Está por comenzar: Moderador: Kenneth Ureña
  • 2. Manténgase conectado a nosotros! Visítenos en http://globalspanish.sqlpass.org /SpanishPASSVC lnkd.in/dtYBzev /user/SpanishPASSVC /SpanishPASSVC
  • 3. 3
  • 4. 4 Oportunidades de Voluntariado PASS no pudiera existir sin personas apasionadas y dedicadas de todas partes del mundo que dan de su tiempo como voluntarios. Se un voluntario ahora!! Para identificar oportunidades locales visita volunteer.sqlpass.org Recuerda actualizar tu perfil en las secciones de “MyVolunteering” y MyPASS para mas detalles.
  • 5. Sigan Participando! • Obtén tu membresía gratuita en sqlpass.org • Linked In: http://www.sqlpass.org/linkedin • Facebook: http://www.sqlpass.org/facebook • Twitter: @SQLPASS • PASS: http://www.sqlpass.org
  • 6. Explorando los Sabores de Azure Data Factory Agosto 9 de 2017 Raúl Martín Saráchaga Díaz Consultor en Inteligencia de Negocios y Plataforma de Datos con experiencia en áreas de salud y retail, donde he realizado proyectos que incluyen integración, modelado, análisis y visualización de datos, teniendo como base fundamental la plataforma de datos de Microsoft. Ponente habitual en eventos organizados por la comunidad del SQLPASS Lima , Peru Bi & Analytics Group y el Power BI User Group Lima. Moderador: Kenneth Ureña
  • 7. AGENDA DE HOY 7 05 IMPLEMENTAR LO APRENDIO CON AZ. DATA FACTORY Demos colocándonos en varios escenarios de integración. 04 CARACTERÍSTICAS CLAVES DE AZURE DATA FACTORY Por donde comenzar con este servicio en la nube 03 UNA LUZ AL FINAL DEL CAMINO CON AZ. DATA FACTORY Como el servicio de Data Factory nos ayuda para la integración. 02 SOLUCIONES DE DW A LA NUBE , SUPER RETO Que variantes existen cuando se lleva una solución de DW a la nube. 01 SOLUCIONES DE DW, VAYA RETO Explorar las características de una solución de DW Tradicional 06 PREGUNTAS & RESPUESTAS Tú preguntas… Yo respondo Conocer cómo es que Azure Data Factory puede ayudarnos en la integración de datos en nuestra organización.
  • 8. 8 LES PASA A MUCHOS, LES PASA A TODOS ESTE ESCENARIO APOCALÍPTICO DE INTEGRACIÓN NO ES EXCLUSIVO DE TU EMPRESA
  • 9. Data Warehouse Tradicional 9 Acceso a Datos Visualización de Datos On-premises Data Sources SQL Database XLS / XLSX / CSV / TXT / PBIX / + Modelo Semántico Metadata Integración Almacenamiento Data Warehouse Staging
  • 10. 10 Capa de Integración Modern BI & Analytics Integración Staging ▪ Esta capa de integración servirá de almacén de los orígenes de datos. ▪ Almacenará por un determinado periodo de tiempo los datos de las diferentes cargas. ▪ Me permitirá realizar transformación antes de ser cargados al Data Warehouse.
  • 11. 11 Capa de Almacenamiento Modern BI & Analytics Integración Staging ▪ Esta capa de almacenamiento contendrá algunos datos de la capa de integración. ▪ La data es transformada antes de llegar a esta capa. ▪ Se almacenan de forma normalizada. ▪ Los datos de los distintos orígenes de datos se encuentran centralizados. Almacenamient o Data Warehouse
  • 12. 12 Capa de Acceso a Datos Modern BI & Analytics Integración Staging ▪ En esta capa de acceso a datos se encontrarán los repositorios desde donde los usuarios finales se conectarán para poder analizar los datos. ▪ Esta data se encuentra des normalizada para lograr un mejor rendimiento en tiempo de respuesta. ▪ Se encuentra con un lenguaje natural para el usuario final. Acceso a Datos Modelo Semántico
  • 13. 13 Capa de Metadata Modern BI & Analytics ▪ En esta capa de metadata almacena información sobre los procesos ejecutados al llevar datos de una capa a otra. ▪ Se pueden realizar consultas a esta capa para verificar si los procesos de Extracción , Carga y Transformación finalizaron correctamente. Metadata
  • 14. 14 ES HORA DE LLEVAR EL DATA WAREHOUSE A LA NUBE VAMOS , SI SE PUEDE !!!!
  • 15. Data Warehouse en la Nube 15 Acceso a Datos Visualización de Datos On-premises Data Sources CSV / TXT Azure Analysis Services Metadata Integración Almacenamiento Azure SQL Data Warehouse Azure Data Lake Store Power BI Excel Azure SQL Data Base Azure Storage Blob
  • 16. 16 On-premises Data Modern BI & Analytics ▪ Se recomienda que los archivos de orígenes sean archivos planos como .csv o .txt. On-premises Data Sources
  • 17. 17 Acceso a Datos Integración Modern BI & Analytics ▪ Azure Data Lake Store: ▪ Almacenamiento optimizado para grandes cargas de trabajo de análisis de datos ▪ Azure Storage Blob: ▪ Almacén de objetos de propósito general para una amplia variedad de escenarios de almacenamiento. ▪ Las tecnologías podría utilizarse como capas de stage. Integración Azure Data Lake Store Azure Storage Blob
  • 18. 18 Acceso a Datos Almacenamiento Modern BI & Analytics ▪ Azure Data Warehouse: ▪ Solución especializada para grandes volúmenes de datos. ▪ Procesamiento MPP (Massively Parallel Processing). ▪ Mejor tiempo de respuesta en el procesamiento de datos. ▪ Puede encenderse o apagar el servicio para reducción de costos. Almacenamient o Azure SQL Data Warehouse
  • 19. 19 Acceso a Datos Almacenamiento Modern BI & Analytics ▪ Azure Analysis Services: ▪ Solución que tiene como base un motor analítico de eficacia probada de Microsoft SQL Server Analysis Services. ▪ Permite crear un modelo semántico con un lenguaje más cercano al usuario final. ▪ Servicio especializado en la creación KPIs. Acceso a Datos Azure Analysis Services
  • 20. 20 Acceso a Datos Almacenamiento Modern BI & Analytics ▪ Azure SQL Database: ▪ Base de Datos transaccional de Microsoft. ▪ Permite almacenar información de los distintos procesos que con ejecutados durante el proceso de ELT en la solución de Data Warehouse. Metadata Azure SQL Data Base
  • 21. Integración de Data en la Nube 21 Acceso a Datos Visualización de Datos On-premises Data Sources CSV / TXT Azure Analysis Services Metadata Integración Almacenamiento Azure SQL Data Warehouse Azure Data Lake Store Power BI Excel Azure SQL Data Base PolybaseAzure Data Factory Azure Storage Blob Azure Data Factory Azure Data Factory
  • 22. Azure Data Factory 22 SERVICIO AZURE Servicio de movimiento de datos globalmente implementado en la nube. Permite conectarse a orígenes en nube y locales ANALIZAR & TRANSFORMAR Programe y administre el proceso de transformación y análisis de datos PUBLICAR & CONSUMIR Utilice canalizaciones de datos para transformar datos sin procesar en datos finalizados o formados preparados para que las aplicaciones o herramientas de BI los consuman.
  • 23. Relación entre Entidades de Azure Data Factory 23 PIPELINE Una canalización es un grupo de actividades ACTIVITY Definen las acciones que se van a realizar en los datos DATA SET Cada actividad toma cero o más conjuntos de datos como entrada y genera uno o varios conjuntos de datos como salida LINKED SERVICE Son muy similares a las cadenas de conexión que definen la información de conexión
  • 24. Linked Service Categoría Almacén de datos Se admite como origen Se admite como receptor Las tablas de Azure Almacenamiento de blobs de Azure ✓ ✓ Azure Cosmos DB (API de DocumentDB) ✓ ✓ Almacén de Azure Data Lake ✓ ✓ Azure SQL Database ✓ ✓ Azure SQL Data Warehouse ✓ ✓ Índice de Azure Search ✓ Azure Table Storage ✓ ✓ Bases de datos Amazon Redshift ✓ DB2* ✓ MySQL* ✓ Oracle* ✓ ✓ PostgreSQL* ✓ SAP Business Warehouse* ✓ SAP HANA* ✓ SQL Server* ✓ ✓ Sybase* ✓ 24
  • 25. Activity Actividad de transformación de datos Entorno de procesos Hive HDInsight [Hadoop] Pig HDInsight [Hadoop] MapReduce HDInsight [Hadoop] Hadoop Streaming HDInsight [Hadoop] Spark HDInsight [Hadoop] Actividades de Machine Learning: ejecución de Batch y recurso de actualización MV de Azure Procedimiento almacenado SQL Azure, Almacenamiento de datos SQL de Azure o SQL Server U-SQL de análisis con Data Lake Análisis con Azure Data Lake DotNet HDInsight [Hadoop] o Lote de Azure 25
  • 27. DEMO 27 Azure Data Factory CSV / TXT Azure Data Management Gateway
  • 28. DEMO 28 Azure Data Factory / Activity con Data Lake Analytics
  • 29. 29
  • 31. Me puedes encontrar como : Raúl Saráchaga Correo : raulsarachaga@kaitsconsulting.com Blog: aprendebi.wordpress.com Facebook: Aprende BI 31 GRACIAS.