Wprowadzenie
do Cloud Storage
Łukasz Grala
Architect Data Platform & Advanced Analytics & BI Solutions
Data Platform MVP
@Łukasz Grala – lukasz@tidk.pl
• Architekt rozwiązań Platformy Danych & Business Intelligence & Zaawansowanej Analityki w TIDK
• Certyfikowany trener Microsoft i wykładowca na wyższych uczelniach
• Autor zaawansowanych szkoleń i warsztatów, oraz licznych publikacji i webcastów
• Od 2010 roku wyróżniany nagrodą Microsoft Data Platform MVP
• Doktorant Politechnika Poznańska – Wydział Informatyki (obszar bazy danych, eksploracja danych,
uczenie maszynowe)
• Prelegent na licznych konferencjach w kraju i na świecie
• Posiada liczne certyfikaty (MCT, MCSE, MCSA, MCITP,…)
• Członek Polskiego Towarzystwa Informatycznego
• Członek i lider Polish SQL Server User Group (PLSSUG)
• Pasjonat analizy, przechowywania i przetwarzania danych, miłośnik Jazzu
Overview Storage
lukasz@tidk.pl
Azure Blob Storage
• Blob Storage
• Table Storage
• Queue Storage
• File Storage
lukasz@tidk.pl
Relational Data
• Azure SQL Database
• Azure SQL Data Warehouse
lukasz@tidk.pl
Azure SQL Database
lukasz@tidk.pl
Azure SQL Database & Elastic Database Pool
lukasz@tidk.pl
Azure SQL Data Warehouse
lukasz@tidk.pl
Stretch Database – SQL Server 2016 + Azure
lukasz@tidk.pl
DocumentDB
lukasz@tidk.pl
DocumentDB & SQL Server 2016
Schema-free NoSQL
document store
Scalable transactional
processing for rapidly
changing apps
Premium relational
DB capable to
exchange data with
modern apps & services
Derives unified insights from
structured/unstructured data
JSON
JS
JS
JSON
lukasz@tidk.pl
Azure Search
• Azure SQL Database
• Azure Blob
• Azure DocumentDB
lukasz@tidk.pl
Big Data - HDInsight
• HDInsight is a Hadoop-based service that brings 100% Apache
Hadoop solution running on the Microsoft Azure platform
• Based on the Hortonworks Data Platform (HDP)
• Scalable, on-demand service
lukasz@tidk.pl
RDBMS vs Hadoop
lukasz@tidk.pl
Storage
Azure Storage
(Blob)
File System
lukasz@tidk.pl
Hadoop Ecosystem
Management & Monitoring
(Ambari)
Coordination
(ZooKeeper)
Workflow&Scheduling
(Oozie) Scripting
(Pig)
Machine Learning
(Mahout)
Query
(Hive)
Distributed Processing
(MapReduce)
Distributed Storage
(HDFS)
NoSQLDatabase
(HBase)
DataIntegration
(Sqoop/REST/ODBC)
lukasz@tidk.pl
HDInsight
lukasz@tidk.pl
HDInsight & SQL Server 2016
Query relational
and non-relational
data, on-premises
and in Azure
Apps
T-SQL query
SQL Server Hadoop
lukasz@tidk.pl
Summary
• Azure Blob Storage
• Azure SQL Database
• Azure SQL Data Warehouse
• Azure DocumentDB
• Azure Search
• Azure HDInsight (Hadoop, Spark, Hbase)
lukasz@tidk.pl
lukasz@tidk.pl
Question?
lukasz@tidk.pl
• 16-18 maj 2016
• Wrocław Centrum Konferencyjne
• 3 dni, 6 warsztatów, 4 ścieżki, ponad 30 prelegentów, 50 sesji
• 600 uczestników + sponsorzy + prelegenci + organizatorzy
• Goście między innymi z USA, Anglii, Niemiec, Ukrainy, Bułgarii, Słoweni
• Premiera techniczna SQL Server 2016
sqlday.pl @sqlday
lukasz@tidk.pl
W tym warsztat Big Data Analytics – Łukasz Grala & Marcin Szeliga
Masterclass: Cloud Storage
23-25.05.2016, Warszawa
Azure SQL Server i Azure SQL Database, Skalowanie bazy relacyjnej w
chmurze, Hurtownia danych w chmurze PowerShell i bazy danych w
Azure, Azure BLOB Storage, Bazy dokumentowe, Big Data z
HDInsight, Hadoop, Apache Spark, Pozostałe komponenty HDInsight i
Hadoop, Wirtualne maszyny
Masterclass: Cloud Analytics
20-22.06.2016, Warszawa
Data Catalog, Data Factory, Data Lake, PowerBI i dane relacyjne w
chmurze, Hadoop, Apache Spark, Analiza danych strumieniowych,
Analiza z baz danych dokumentowych i grafowych, Uczenie
maszynowe, Polybase w SQL Server 2016
Łukasz Grala
Data Platform MVP,
MCT, MCSE, MCSA,
MCITP, MCSA,
MCP, MTA
Łukasz o szkoleniach:
„Danych produkowanych jest
więcej niż kiedykolwiek, pochodzą
z sieci Internet, z portali społecznościowych, z
urządzeń. Bardzo duży rozwój Internetu Rzeczy
(IoT) ilość tych danych jeszcze bardziej
zwiększa. Dlatego przygotowaliśmy dwa
specjalne kursy Cloud Storage i Cloud Analytics,
przedstawiające mechanizmy składowania,
przetwarzania i analizy danych z
wykorzystaniem chmury.”
Big Data, BI, Analityka, SQL
Standard -25% na hasło TechStolicawww.hexcode.pl

20160316 techstolica - cloudstorage -tidk

  • 1.
    Wprowadzenie do Cloud Storage ŁukaszGrala Architect Data Platform & Advanced Analytics & BI Solutions Data Platform MVP
  • 2.
    @Łukasz Grala –lukasz@tidk.pl • Architekt rozwiązań Platformy Danych & Business Intelligence & Zaawansowanej Analityki w TIDK • Certyfikowany trener Microsoft i wykładowca na wyższych uczelniach • Autor zaawansowanych szkoleń i warsztatów, oraz licznych publikacji i webcastów • Od 2010 roku wyróżniany nagrodą Microsoft Data Platform MVP • Doktorant Politechnika Poznańska – Wydział Informatyki (obszar bazy danych, eksploracja danych, uczenie maszynowe) • Prelegent na licznych konferencjach w kraju i na świecie • Posiada liczne certyfikaty (MCT, MCSE, MCSA, MCITP,…) • Członek Polskiego Towarzystwa Informatycznego • Członek i lider Polish SQL Server User Group (PLSSUG) • Pasjonat analizy, przechowywania i przetwarzania danych, miłośnik Jazzu
  • 3.
  • 4.
    Azure Blob Storage •Blob Storage • Table Storage • Queue Storage • File Storage lukasz@tidk.pl
  • 5.
    Relational Data • AzureSQL Database • Azure SQL Data Warehouse lukasz@tidk.pl
  • 6.
  • 7.
    Azure SQL Database& Elastic Database Pool lukasz@tidk.pl
  • 8.
    Azure SQL DataWarehouse lukasz@tidk.pl
  • 9.
    Stretch Database –SQL Server 2016 + Azure lukasz@tidk.pl
  • 10.
  • 11.
    DocumentDB & SQLServer 2016 Schema-free NoSQL document store Scalable transactional processing for rapidly changing apps Premium relational DB capable to exchange data with modern apps & services Derives unified insights from structured/unstructured data JSON JS JS JSON lukasz@tidk.pl
  • 12.
    Azure Search • AzureSQL Database • Azure Blob • Azure DocumentDB lukasz@tidk.pl
  • 13.
    Big Data -HDInsight • HDInsight is a Hadoop-based service that brings 100% Apache Hadoop solution running on the Microsoft Azure platform • Based on the Hortonworks Data Platform (HDP) • Scalable, on-demand service lukasz@tidk.pl
  • 14.
  • 15.
  • 16.
    Hadoop Ecosystem Management &Monitoring (Ambari) Coordination (ZooKeeper) Workflow&Scheduling (Oozie) Scripting (Pig) Machine Learning (Mahout) Query (Hive) Distributed Processing (MapReduce) Distributed Storage (HDFS) NoSQLDatabase (HBase) DataIntegration (Sqoop/REST/ODBC) lukasz@tidk.pl
  • 17.
  • 18.
    HDInsight & SQLServer 2016 Query relational and non-relational data, on-premises and in Azure Apps T-SQL query SQL Server Hadoop lukasz@tidk.pl
  • 19.
    Summary • Azure BlobStorage • Azure SQL Database • Azure SQL Data Warehouse • Azure DocumentDB • Azure Search • Azure HDInsight (Hadoop, Spark, Hbase) lukasz@tidk.pl
  • 20.
  • 21.
    • 16-18 maj2016 • Wrocław Centrum Konferencyjne • 3 dni, 6 warsztatów, 4 ścieżki, ponad 30 prelegentów, 50 sesji • 600 uczestników + sponsorzy + prelegenci + organizatorzy • Goście między innymi z USA, Anglii, Niemiec, Ukrainy, Bułgarii, Słoweni • Premiera techniczna SQL Server 2016 sqlday.pl @sqlday lukasz@tidk.pl W tym warsztat Big Data Analytics – Łukasz Grala & Marcin Szeliga
  • 23.
    Masterclass: Cloud Storage 23-25.05.2016,Warszawa Azure SQL Server i Azure SQL Database, Skalowanie bazy relacyjnej w chmurze, Hurtownia danych w chmurze PowerShell i bazy danych w Azure, Azure BLOB Storage, Bazy dokumentowe, Big Data z HDInsight, Hadoop, Apache Spark, Pozostałe komponenty HDInsight i Hadoop, Wirtualne maszyny Masterclass: Cloud Analytics 20-22.06.2016, Warszawa Data Catalog, Data Factory, Data Lake, PowerBI i dane relacyjne w chmurze, Hadoop, Apache Spark, Analiza danych strumieniowych, Analiza z baz danych dokumentowych i grafowych, Uczenie maszynowe, Polybase w SQL Server 2016 Łukasz Grala Data Platform MVP, MCT, MCSE, MCSA, MCITP, MCSA, MCP, MTA Łukasz o szkoleniach: „Danych produkowanych jest więcej niż kiedykolwiek, pochodzą z sieci Internet, z portali społecznościowych, z urządzeń. Bardzo duży rozwój Internetu Rzeczy (IoT) ilość tych danych jeszcze bardziej zwiększa. Dlatego przygotowaliśmy dwa specjalne kursy Cloud Storage i Cloud Analytics, przedstawiające mechanizmy składowania, przetwarzania i analizy danych z wykorzystaniem chmury.” Big Data, BI, Analityka, SQL Standard -25% na hasło TechStolicawww.hexcode.pl