SlideShare a Scribd company logo
1 of 31
SQL Server 2019
Big Data Cluster
Luiz Henrique Garetti
sys.stdout.write (“Luiz")
Bacharel em Ciências da Computação;
MBA em Big Data;
www.dataisbig.com.br
www.Imasters.com.br
‘s
“Ecossistema Big Data”
“SQL Server”
“Desenvolvimento”
Qual
nossa
missão
para hoje ?
New
SQL Server 2019
MS quebrando paradigmas
SQL Server 2014:
• AlwaysOn (desde o 2012)
• In-Memory (desde o 2012)
• Integração com Azure
SQL Server 2016:
• Polybase
• Json
• R Services
SQL Server 2017:
• Linux e Docker
• Python
https://www.sqlshack.com/history-sql-server-evolution-sql-server-features/
SQL Server 2019:
• Spark
• Kubernetes
• Polybase (expansão)
• Big Data Cluster
Mas antes…
Big Data
3 V’s
5 V’s
“Big data são dados com maior variedade que chegam em
volumes crescentes e com velocidade cada vez maior”
Gartner
Ecossistema Big Data
Ecossistema Hadoop
• Framework Open-source mantido pela Apache
• Processamento e armazenamento massivo
• Escalabilidade, “Desempenho”, Flexibilidade, Baixo Custo
-> Hadoop Common,
-> Hadoop HDFS,
-> Hadoop YARN,
-> Hadoop MapReduce
Hadoop
HDFS (Hadoop Distributed File System)
• Sistema de arquivos escalável e distribuído.
• Projeto Apache, Subprojeto do Hadoop.
• Baseado no GFS (Google File System).
• Processamento Massivo Paralelo (MPP).
Armazenamento e Blocos (64 mb) , múltiplas
réplicas.
MapReduce
• Modelo de programação desenhado para
processor grandes volumes de dados (Paralelo e
Distribuído.
• Map e Reduce
Hadoop – Infra Cluster
De onde veio o nome “Hadoop” ?
Docker e Kubernetes
Docker
• Empacota os binários, códigos, bibliotecas
• Open-Source escrita em GO
• Configure uma vez e replique N
• Diminui tempo de Deploy
• Ótimo para criação de Micro serviços
• Escala
Kubernetes
• Orquestração e gerenciamento para Dockers
• k8s (k + 8 caracteres + s) ou “kube”
• Criado pelo Google e cedido para a Apache
foundation
• Elimina grande parte do processo manual, para
implantar ou escalar container
Docker e Kubernetes
Docker Kubernetes
Big Data Cluster
SQL Server 2019
Proposito
Big Data gera mais valor, quando somado a dados do
mundo relacional.
É justamente esse o objetivo do BDC.
SQL Server 2019 - Big Data Cluster (BDC)
Conceitualmente:
• O BDC com aprimoramentos no PolyBase atuam como um hub de dados para
integrar dados estruturados e não estruturados - SQL Server, Oracle, Teradata,
MongoDB, HDFS.
• Permite implantar clusters escalonáveis de contêineres SQL Server, Spark e HDFS
em execução no Kubernetes.
• Os Clusters de Big Data do SQL Server unem o SQL Server às ferramentas de Big
Data padrão do setor em um pacote suportado pela Microsoft.
Big Data Cluster (BDC) – Arquitetura - Polybase
• PushDown – External Table
• Escalabilidade (elasticidade) no processamento dos dados na camada “Compute Plane”.
Big Data Cluster (BDC) – Arquitetura - Data Mart
• Scale-out Data Mart
• Polybase + BDC, External Table, Data Pool
• Combinando dados de vários origens
Big Data Cluster (BDC) - Arquitetura
Big Data Cluster (BDC) – Control Plane
• Controla o gerenciamento, segurança para o Cluster.
• Kubernetes Master
• SQL Server Master
• Hive Metadados
• Driver’s
• Grafana...
Big Data Cluster (BDC) – Compute Plane
• Fornece poder/recurso computacional para o cluster
• SQL Server em execução em Pods (Docker/Kubernetes)
• Conjuntos de Pods para processamento específicos (ex: Polybase)
• Scale-out para consultas distribuídas
Big Data Cluster (BDC) – Data Plane
• Persistência de dados e armazenamento em cache:
• SQL Data Pool:
• Pods SQL Server Linux
• Dados em Shared + Desempenho
• Data Marts (Retorno dos Polybases) – Joins com o mundo Relacional
• Storage Pool:
• Pods (SQL + Spark + HDFS)
• Ingestão de dados via Spark
• Acesso a dados por meio de Endpoints do HDFS e SQL Server
Big Data Cluster (BDC)
Big Data Cluster (BDC) - Gerenciamento
Big Data Cluster (BDC)
Minha visão de Futuro
BDC – Big Data
Big Data Cluster (BDC) – Links para estudo
• https://key2consulting.com/sql-server-2019-big-data-review/
• https://xaviergeerinck.com/sql-server-2019-big-data-clusters
• https://myignite.techcommunity.microsoft.com/sessions/65967?source=sessions
• https://onlineitguru.com/blog/highlights-of-sql-server-2019
• https://cloudblogs.microsoft.com/sqlserver/2018/09/25/introducing-microsoft-sql-server-2019-big-
data-clusters/
• https://github.com/Microsoft/sqlworkshops/blob/master/sqlserver2019bigdataclusters/SQL2019BDC
/01%20-%20The%20Big%20Data%20Landscape.md
• www.dataisbig.com.br
https://sqlservervnexteap.azurewebsites.net/
Valeu Galera
Luiz Henrique Garetti
@luizhgaretti
www.dataisbig.com.br
luizhrosario@gmail.com.br
Bom evento!!!

More Related Content

What's hot

Azure SQL DataWarehouse
Azure SQL DataWarehouseAzure SQL DataWarehouse
Azure SQL DataWarehouseVitor Fava
 
Banco de Dados NoSQL - Disciplina: Sistemas Distribuídos
Banco de Dados NoSQL - Disciplina: Sistemas DistribuídosBanco de Dados NoSQL - Disciplina: Sistemas Distribuídos
Banco de Dados NoSQL - Disciplina: Sistemas DistribuídosJoão Helis Bernardo
 
Oracle - Visão Geral de IaaS e PaaS dos serviços de Nuvem da Oracle
Oracle - Visão Geral de IaaS e PaaS dos serviços de Nuvem da OracleOracle - Visão Geral de IaaS e PaaS dos serviços de Nuvem da Oracle
Oracle - Visão Geral de IaaS e PaaS dos serviços de Nuvem da OracleLuciano Condé
 
Datawarehouse - Obtenha insights consistentes para o seu negócio: conheça o n...
Datawarehouse - Obtenha insights consistentes para o seu negócio: conheça o n...Datawarehouse - Obtenha insights consistentes para o seu negócio: conheça o n...
Datawarehouse - Obtenha insights consistentes para o seu negócio: conheça o n...iMasters
 
Realmente devo pensar na versão Enterprise do MySQL?
Realmente devo pensar na versão Enterprise do MySQL?Realmente devo pensar na versão Enterprise do MySQL?
Realmente devo pensar na versão Enterprise do MySQL?Juliano de Oliveira Falcao
 
My sql enterprise vs community
My sql enterprise vs communityMy sql enterprise vs community
My sql enterprise vs communityMySQL Brasil
 
Deep Dive sobre Entity Framework
Deep Dive sobre Entity FrameworkDeep Dive sobre Entity Framework
Deep Dive sobre Entity FrameworkLuciano Condé
 
Pgday Campinas 2015 - Uma visão do PPAS 9.4 e PEM 5.0
Pgday Campinas 2015 - Uma visão do PPAS 9.4 e PEM 5.0Pgday Campinas 2015 - Uma visão do PPAS 9.4 e PEM 5.0
Pgday Campinas 2015 - Uma visão do PPAS 9.4 e PEM 5.0Marcos William Valentini
 
Construção da Plataforma de dados Autônoma e em Escala
Construção da Plataforma de dados Autônoma e em EscalaConstrução da Plataforma de dados Autônoma e em Escala
Construção da Plataforma de dados Autônoma e em Escalarkwseijuurou
 
STB Tour - Visão Geral do Windows Azure
STB Tour - Visão Geral do Windows AzureSTB Tour - Visão Geral do Windows Azure
STB Tour - Visão Geral do Windows AzureLuciano Condé
 
Microsoft 5 Cal Dispositivo Local P/ Windows Server 2019 Standard R18-05766
Microsoft 5 Cal Dispositivo Local P/ Windows Server 2019 Standard R18-05766Microsoft 5 Cal Dispositivo Local P/ Windows Server 2019 Standard R18-05766
Microsoft 5 Cal Dispositivo Local P/ Windows Server 2019 Standard R18-05766Stryhn49Ritter
 
RDBMS x NoSQL x NewSQL
RDBMS x NoSQL x NewSQLRDBMS x NoSQL x NewSQL
RDBMS x NoSQL x NewSQLOrlando Vitali
 
STB Tour - Cresça os seus negócios com Windows azure
STB Tour - Cresça os seus negócios com Windows azureSTB Tour - Cresça os seus negócios com Windows azure
STB Tour - Cresça os seus negócios com Windows azureLuciano Condé
 
Inter Dev Ops Conf 2016 - IaaS behind the scenes
Inter Dev Ops Conf 2016 - IaaS behind the scenesInter Dev Ops Conf 2016 - IaaS behind the scenes
Inter Dev Ops Conf 2016 - IaaS behind the scenesRoberto Gaiser
 
Oracle Premier Support para MySQL
Oracle Premier Support para MySQLOracle Premier Support para MySQL
Oracle Premier Support para MySQLMySQL Brasil
 
Oracle Exadata
Oracle ExadataOracle Exadata
Oracle ExadataiMasters
 
Oracle d guard11g r2_final(oracledataguardwithoracledb11gr2)-1
Oracle d guard11g r2_final(oracledataguardwithoracledb11gr2)-1Oracle d guard11g r2_final(oracledataguardwithoracledb11gr2)-1
Oracle d guard11g r2_final(oracledataguardwithoracledb11gr2)-1Rodrigo Raposo
 

What's hot (19)

Azure SQL DataWarehouse
Azure SQL DataWarehouseAzure SQL DataWarehouse
Azure SQL DataWarehouse
 
Banco de Dados NoSQL - Disciplina: Sistemas Distribuídos
Banco de Dados NoSQL - Disciplina: Sistemas DistribuídosBanco de Dados NoSQL - Disciplina: Sistemas Distribuídos
Banco de Dados NoSQL - Disciplina: Sistemas Distribuídos
 
Oracle - Visão Geral de IaaS e PaaS dos serviços de Nuvem da Oracle
Oracle - Visão Geral de IaaS e PaaS dos serviços de Nuvem da OracleOracle - Visão Geral de IaaS e PaaS dos serviços de Nuvem da Oracle
Oracle - Visão Geral de IaaS e PaaS dos serviços de Nuvem da Oracle
 
Datawarehouse - Obtenha insights consistentes para o seu negócio: conheça o n...
Datawarehouse - Obtenha insights consistentes para o seu negócio: conheça o n...Datawarehouse - Obtenha insights consistentes para o seu negócio: conheça o n...
Datawarehouse - Obtenha insights consistentes para o seu negócio: conheça o n...
 
Realmente devo pensar na versão Enterprise do MySQL?
Realmente devo pensar na versão Enterprise do MySQL?Realmente devo pensar na versão Enterprise do MySQL?
Realmente devo pensar na versão Enterprise do MySQL?
 
My sql enterprise vs community
My sql enterprise vs communityMy sql enterprise vs community
My sql enterprise vs community
 
Deep Dive sobre Entity Framework
Deep Dive sobre Entity FrameworkDeep Dive sobre Entity Framework
Deep Dive sobre Entity Framework
 
Pgday Campinas 2015 - Uma visão do PPAS 9.4 e PEM 5.0
Pgday Campinas 2015 - Uma visão do PPAS 9.4 e PEM 5.0Pgday Campinas 2015 - Uma visão do PPAS 9.4 e PEM 5.0
Pgday Campinas 2015 - Uma visão do PPAS 9.4 e PEM 5.0
 
Construção da Plataforma de dados Autônoma e em Escala
Construção da Plataforma de dados Autônoma e em EscalaConstrução da Plataforma de dados Autônoma e em Escala
Construção da Plataforma de dados Autônoma e em Escala
 
SQL Maniacs - SQL Server 2019 Big Data Clusters
SQL Maniacs - SQL Server 2019 Big Data ClustersSQL Maniacs - SQL Server 2019 Big Data Clusters
SQL Maniacs - SQL Server 2019 Big Data Clusters
 
STB Tour - Visão Geral do Windows Azure
STB Tour - Visão Geral do Windows AzureSTB Tour - Visão Geral do Windows Azure
STB Tour - Visão Geral do Windows Azure
 
Microsoft 5 Cal Dispositivo Local P/ Windows Server 2019 Standard R18-05766
Microsoft 5 Cal Dispositivo Local P/ Windows Server 2019 Standard R18-05766Microsoft 5 Cal Dispositivo Local P/ Windows Server 2019 Standard R18-05766
Microsoft 5 Cal Dispositivo Local P/ Windows Server 2019 Standard R18-05766
 
RDBMS x NoSQL x NewSQL
RDBMS x NoSQL x NewSQLRDBMS x NoSQL x NewSQL
RDBMS x NoSQL x NewSQL
 
STB Tour - Cresça os seus negócios com Windows azure
STB Tour - Cresça os seus negócios com Windows azureSTB Tour - Cresça os seus negócios com Windows azure
STB Tour - Cresça os seus negócios com Windows azure
 
Inter Dev Ops Conf 2016 - IaaS behind the scenes
Inter Dev Ops Conf 2016 - IaaS behind the scenesInter Dev Ops Conf 2016 - IaaS behind the scenes
Inter Dev Ops Conf 2016 - IaaS behind the scenes
 
Oracle Premier Support para MySQL
Oracle Premier Support para MySQLOracle Premier Support para MySQL
Oracle Premier Support para MySQL
 
Sql Server
Sql ServerSql Server
Sql Server
 
Oracle Exadata
Oracle ExadataOracle Exadata
Oracle Exadata
 
Oracle d guard11g r2_final(oracledataguardwithoracledb11gr2)-1
Oracle d guard11g r2_final(oracledataguardwithoracledb11gr2)-1Oracle d guard11g r2_final(oracledataguardwithoracledb11gr2)-1
Oracle d guard11g r2_final(oracledataguardwithoracledb11gr2)-1
 

Similar to Sql server 2019 big data cluster

Stream de dados e Data Lake com Debezium, Delta Lake e EMR
Stream de dados e Data Lake com Debezium, Delta Lake e EMRStream de dados e Data Lake com Debezium, Delta Lake e EMR
Stream de dados e Data Lake com Debezium, Delta Lake e EMRCicero Joasyo Mateus de Moura
 
QCon 2016 - Como migramos uma solução de 4 milhões de usuários para o Azure
QCon 2016 - Como migramos uma solução de 4 milhões de usuários para o AzureQCon 2016 - Como migramos uma solução de 4 milhões de usuários para o Azure
QCon 2016 - Como migramos uma solução de 4 milhões de usuários para o AzureFabrício Lopes Sanchez
 
[DTC21] André Marques - Jornada do Engenheiro de Dados
[DTC21] André Marques - Jornada do Engenheiro de Dados[DTC21] André Marques - Jornada do Engenheiro de Dados
[DTC21] André Marques - Jornada do Engenheiro de DadosDeep Tech Brasil
 
AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...
AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...
AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...Amazon Web Services LATAM
 
Big data e mineração de dados
Big data e mineração de dadosBig data e mineração de dados
Big data e mineração de dadosElton Meira
 
Carreira do profissional de dados
Carreira do profissional de dadosCarreira do profissional de dados
Carreira do profissional de dadosEdvaldo Castro
 
Bancos NoSQL no Microsoft Azure
Bancos NoSQL no Microsoft AzureBancos NoSQL no Microsoft Azure
Bancos NoSQL no Microsoft AzureJoel Rodrigues
 
Tecnologias para mineração de dados nas nuvens
Tecnologias para mineração de dados nas nuvensTecnologias para mineração de dados nas nuvens
Tecnologias para mineração de dados nas nuvensAlessandro Binhara
 
CPBSB 2022 - Big Data e Machine Learning na Prática Construindo um Data Lake...
CPBSB 2022 - Big Data e  Machine Learning na Prática Construindo um Data Lake...CPBSB 2022 - Big Data e  Machine Learning na Prática Construindo um Data Lake...
CPBSB 2022 - Big Data e Machine Learning na Prática Construindo um Data Lake...Cicero Joasyo Mateus de Moura
 
Cenário das Plataformas de Dados 2017/2018
Cenário das Plataformas de Dados 2017/2018Cenário das Plataformas de Dados 2017/2018
Cenário das Plataformas de Dados 2017/2018Raul Oliveira
 
Pgday Campinas 2015 - Uma visão do PPAS 9.4 e PEM 5.0
Pgday Campinas 2015 - Uma visão do PPAS 9.4 e PEM 5.0Pgday Campinas 2015 - Uma visão do PPAS 9.4 e PEM 5.0
Pgday Campinas 2015 - Uma visão do PPAS 9.4 e PEM 5.0Marcos William Valentini
 
Arquitetura para solução Big Data – open source
Arquitetura para solução Big Data – open sourceArquitetura para solução Big Data – open source
Arquitetura para solução Big Data – open sourceFelipe RENZ - MBA TI / Big
 
Migrando Aplicações para o SQL Azure Database
Migrando Aplicações para o SQL Azure DatabaseMigrando Aplicações para o SQL Azure Database
Migrando Aplicações para o SQL Azure DatabaseRoberto Fonseca
 

Similar to Sql server 2019 big data cluster (20)

Sql maniacs sql server 2019 Big Data Clusters
Sql maniacs   sql server 2019 Big Data ClustersSql maniacs   sql server 2019 Big Data Clusters
Sql maniacs sql server 2019 Big Data Clusters
 
Meetup Tivir - Big Data Clusters
Meetup Tivir - Big Data ClustersMeetup Tivir - Big Data Clusters
Meetup Tivir - Big Data Clusters
 
Meetup - Data Lake
Meetup - Data LakeMeetup - Data Lake
Meetup - Data Lake
 
TDC - Planejando data Lake com big data clusters
TDC - Planejando data Lake com big data clustersTDC - Planejando data Lake com big data clusters
TDC - Planejando data Lake com big data clusters
 
Streaming architecture with big data clusters
Streaming architecture with big data clustersStreaming architecture with big data clusters
Streaming architecture with big data clusters
 
Stream de dados e Data Lake com Debezium, Delta Lake e EMR
Stream de dados e Data Lake com Debezium, Delta Lake e EMRStream de dados e Data Lake com Debezium, Delta Lake e EMR
Stream de dados e Data Lake com Debezium, Delta Lake e EMR
 
Cv luciano stoppa ptb
Cv luciano stoppa ptbCv luciano stoppa ptb
Cv luciano stoppa ptb
 
QCon 2016 - Como migramos uma solução de 4 milhões de usuários para o Azure
QCon 2016 - Como migramos uma solução de 4 milhões de usuários para o AzureQCon 2016 - Como migramos uma solução de 4 milhões de usuários para o Azure
QCon 2016 - Como migramos uma solução de 4 milhões de usuários para o Azure
 
[DTC21] André Marques - Jornada do Engenheiro de Dados
[DTC21] André Marques - Jornada do Engenheiro de Dados[DTC21] André Marques - Jornada do Engenheiro de Dados
[DTC21] André Marques - Jornada do Engenheiro de Dados
 
AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...
AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...
AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...
 
Big data e mineração de dados
Big data e mineração de dadosBig data e mineração de dados
Big data e mineração de dados
 
5. rodando containers docker na aws
5. rodando containers docker na aws5. rodando containers docker na aws
5. rodando containers docker na aws
 
Carreira do profissional de dados
Carreira do profissional de dadosCarreira do profissional de dados
Carreira do profissional de dados
 
Bancos NoSQL no Microsoft Azure
Bancos NoSQL no Microsoft AzureBancos NoSQL no Microsoft Azure
Bancos NoSQL no Microsoft Azure
 
Tecnologias para mineração de dados nas nuvens
Tecnologias para mineração de dados nas nuvensTecnologias para mineração de dados nas nuvens
Tecnologias para mineração de dados nas nuvens
 
CPBSB 2022 - Big Data e Machine Learning na Prática Construindo um Data Lake...
CPBSB 2022 - Big Data e  Machine Learning na Prática Construindo um Data Lake...CPBSB 2022 - Big Data e  Machine Learning na Prática Construindo um Data Lake...
CPBSB 2022 - Big Data e Machine Learning na Prática Construindo um Data Lake...
 
Cenário das Plataformas de Dados 2017/2018
Cenário das Plataformas de Dados 2017/2018Cenário das Plataformas de Dados 2017/2018
Cenário das Plataformas de Dados 2017/2018
 
Pgday Campinas 2015 - Uma visão do PPAS 9.4 e PEM 5.0
Pgday Campinas 2015 - Uma visão do PPAS 9.4 e PEM 5.0Pgday Campinas 2015 - Uma visão do PPAS 9.4 e PEM 5.0
Pgday Campinas 2015 - Uma visão do PPAS 9.4 e PEM 5.0
 
Arquitetura para solução Big Data – open source
Arquitetura para solução Big Data – open sourceArquitetura para solução Big Data – open source
Arquitetura para solução Big Data – open source
 
Migrando Aplicações para o SQL Azure Database
Migrando Aplicações para o SQL Azure DatabaseMigrando Aplicações para o SQL Azure Database
Migrando Aplicações para o SQL Azure Database
 

More from Luiz Henrique Garetti Rosário

More from Luiz Henrique Garetti Rosário (7)

SQL SAT Salvador - Arquitetando Data Lake Multicloud
SQL SAT Salvador - Arquitetando Data Lake MulticloudSQL SAT Salvador - Arquitetando Data Lake Multicloud
SQL SAT Salvador - Arquitetando Data Lake Multicloud
 
Imasters - HA e DR como seguro de vida do DBA
Imasters - HA e DR como seguro de vida do DBAImasters - HA e DR como seguro de vida do DBA
Imasters - HA e DR como seguro de vida do DBA
 
Otimizando a performance com in-memory no SQL 2016
Otimizando a performance com in-memory no SQL 2016Otimizando a performance com in-memory no SQL 2016
Otimizando a performance com in-memory no SQL 2016
 
High Availability and Disaster Recovery salvando vidas
High Availability and Disaster Recovery salvando vidasHigh Availability and Disaster Recovery salvando vidas
High Availability and Disaster Recovery salvando vidas
 
Otimizando a performance com in memory no sql 2016
Otimizando a performance com in memory no sql 2016Otimizando a performance com in memory no sql 2016
Otimizando a performance com in memory no sql 2016
 
High availability e Disaster Recovery é o seguro de vida de todo DBA
High availability e Disaster Recovery é o seguro de vida de todo DBAHigh availability e Disaster Recovery é o seguro de vida de todo DBA
High availability e Disaster Recovery é o seguro de vida de todo DBA
 
Escovando bit com alwayson sql server 2014
Escovando bit com alwayson sql server 2014Escovando bit com alwayson sql server 2014
Escovando bit com alwayson sql server 2014
 

Sql server 2019 big data cluster

  • 1. SQL Server 2019 Big Data Cluster Luiz Henrique Garetti
  • 2.
  • 3. sys.stdout.write (“Luiz") Bacharel em Ciências da Computação; MBA em Big Data; www.dataisbig.com.br www.Imasters.com.br ‘s “Ecossistema Big Data” “SQL Server” “Desenvolvimento”
  • 6.
  • 7. MS quebrando paradigmas SQL Server 2014: • AlwaysOn (desde o 2012) • In-Memory (desde o 2012) • Integração com Azure SQL Server 2016: • Polybase • Json • R Services SQL Server 2017: • Linux e Docker • Python https://www.sqlshack.com/history-sql-server-evolution-sql-server-features/ SQL Server 2019: • Spark • Kubernetes • Polybase (expansão) • Big Data Cluster
  • 9. Big Data 3 V’s 5 V’s “Big data são dados com maior variedade que chegam em volumes crescentes e com velocidade cada vez maior” Gartner
  • 11. Ecossistema Hadoop • Framework Open-source mantido pela Apache • Processamento e armazenamento massivo • Escalabilidade, “Desempenho”, Flexibilidade, Baixo Custo -> Hadoop Common, -> Hadoop HDFS, -> Hadoop YARN, -> Hadoop MapReduce
  • 12. Hadoop HDFS (Hadoop Distributed File System) • Sistema de arquivos escalável e distribuído. • Projeto Apache, Subprojeto do Hadoop. • Baseado no GFS (Google File System). • Processamento Massivo Paralelo (MPP). Armazenamento e Blocos (64 mb) , múltiplas réplicas. MapReduce • Modelo de programação desenhado para processor grandes volumes de dados (Paralelo e Distribuído. • Map e Reduce
  • 13. Hadoop – Infra Cluster
  • 14. De onde veio o nome “Hadoop” ?
  • 15. Docker e Kubernetes Docker • Empacota os binários, códigos, bibliotecas • Open-Source escrita em GO • Configure uma vez e replique N • Diminui tempo de Deploy • Ótimo para criação de Micro serviços • Escala Kubernetes • Orquestração e gerenciamento para Dockers • k8s (k + 8 caracteres + s) ou “kube” • Criado pelo Google e cedido para a Apache foundation • Elimina grande parte do processo manual, para implantar ou escalar container
  • 17. Big Data Cluster SQL Server 2019
  • 18. Proposito Big Data gera mais valor, quando somado a dados do mundo relacional. É justamente esse o objetivo do BDC.
  • 19. SQL Server 2019 - Big Data Cluster (BDC) Conceitualmente: • O BDC com aprimoramentos no PolyBase atuam como um hub de dados para integrar dados estruturados e não estruturados - SQL Server, Oracle, Teradata, MongoDB, HDFS. • Permite implantar clusters escalonáveis de contêineres SQL Server, Spark e HDFS em execução no Kubernetes. • Os Clusters de Big Data do SQL Server unem o SQL Server às ferramentas de Big Data padrão do setor em um pacote suportado pela Microsoft.
  • 20. Big Data Cluster (BDC) – Arquitetura - Polybase • PushDown – External Table • Escalabilidade (elasticidade) no processamento dos dados na camada “Compute Plane”.
  • 21. Big Data Cluster (BDC) – Arquitetura - Data Mart • Scale-out Data Mart • Polybase + BDC, External Table, Data Pool • Combinando dados de vários origens
  • 22. Big Data Cluster (BDC) - Arquitetura
  • 23. Big Data Cluster (BDC) – Control Plane • Controla o gerenciamento, segurança para o Cluster. • Kubernetes Master • SQL Server Master • Hive Metadados • Driver’s • Grafana...
  • 24. Big Data Cluster (BDC) – Compute Plane • Fornece poder/recurso computacional para o cluster • SQL Server em execução em Pods (Docker/Kubernetes) • Conjuntos de Pods para processamento específicos (ex: Polybase) • Scale-out para consultas distribuídas
  • 25. Big Data Cluster (BDC) – Data Plane • Persistência de dados e armazenamento em cache: • SQL Data Pool: • Pods SQL Server Linux • Dados em Shared + Desempenho • Data Marts (Retorno dos Polybases) – Joins com o mundo Relacional • Storage Pool: • Pods (SQL + Spark + HDFS) • Ingestão de dados via Spark • Acesso a dados por meio de Endpoints do HDFS e SQL Server
  • 27. Big Data Cluster (BDC) - Gerenciamento
  • 29. Minha visão de Futuro BDC – Big Data
  • 30. Big Data Cluster (BDC) – Links para estudo • https://key2consulting.com/sql-server-2019-big-data-review/ • https://xaviergeerinck.com/sql-server-2019-big-data-clusters • https://myignite.techcommunity.microsoft.com/sessions/65967?source=sessions • https://onlineitguru.com/blog/highlights-of-sql-server-2019 • https://cloudblogs.microsoft.com/sqlserver/2018/09/25/introducing-microsoft-sql-server-2019-big- data-clusters/ • https://github.com/Microsoft/sqlworkshops/blob/master/sqlserver2019bigdataclusters/SQL2019BDC /01%20-%20The%20Big%20Data%20Landscape.md • www.dataisbig.com.br https://sqlservervnexteap.azurewebsites.net/
  • 31. Valeu Galera Luiz Henrique Garetti @luizhgaretti www.dataisbig.com.br luizhrosario@gmail.com.br Bom evento!!!