SlideShare a Scribd company logo
1 of 129
Download to read offline
Thinnaphat Borirak
WORKSHOP
BIG DATA ANALYTIC TOOLS ON MICROSOFT AZURE
Hadoop migration to Azure
WORKSHOP: Create Resource Groups with Azure subscription
Example:
ลูกค้าต้องการสร้างเว็บไซต์ของบริษัท NSA โดยมี โดเมนชือ nsa.com ซึงมาให้ผมพัฒนาเว็บไซต์ดังกล่าวเพือขายอุปกรณ์คอมพิวเตอร์ แล้วก็ขอให้ระบบนันมี
การตอบคําถามอัตโนมัติ (Chat Bot) ผมก็จะทําการสร้าง Resource Group ของบริษัท NSA เอาไว้ เพือบอกว่าไฟล์งานทีเกียวข้องทังหมดของบริษัทฯ จะอยู่ใน
Directory นี
แล้วพอมีบริษัท ThaiIOT มาจ้างผมทําการจัดเก็บข้อมูลจากอุปกรณ์ IoT เพือนํามาวิเคราะห์ข้อมูลภายในบริษัทฯ ผมก็จําเป็นทีจะต้องสร้างโดเมน iot.co.th โดย
มี Resource Group ของบริษัท ThaiIOT มา เพือบอกว่างานของบริษัท ThaiIOT ทังหมดอยู่ใน Resource Group เช่นกัน
วัตถุประสงค์ การใช้งาน Resource Group จะเหมือนกับเราสร้าง Directory ในเครือง
คอมพิวเตอร์เพือนํามาใช้งาน อาทิเช่น กรณีทีต้องการพัฒนาโปรแกรมสักอย่างนึง เราก็จะ
ไปสร้าง Project Directory ซึงภายใต้กลุ่มของ Directory ก็ไว้ใช้ทีทําหน้าทีรวบรวมไฟล์ต่างๆ
ทีเกียวข้อง เพือเอาไว้บริหารจัดการ หรือแบ่งแยกโปรเจคออกเป็นเรืองๆ
โดย Microsoft Azure จะเรียกกระบวนการนีว่า Resource Group นันเอง
1
Thinnaphat Borirak
https://azure.microsoft.com/en-us
https://portal.azure.com/#home
Example: Azure subscription 50177004-XX
XX: คือรหัสลําดับที
Example: hdfs-50177004-XX
XX: คือรหัสลําดับที
https://learn.microsoft.com/en-us/azure/azure-resource-manager/management/tag-resources?tabs=json
Example:
Properties :
Name Value
Status Normal
Dept Finance
Team Compliance
Environment Production
WORKSHOP: Building Data On Microsoft Azure
Data Warehouse / Data Mart / Data Lake
รวบรวมข้อมูลมาเก็บไว้ทีส่วนกลาง แล้วนําไปทํา Visualization
Data Warehouse คือทีเก็บขนาดใหญ่สําหรับข้อมูลทีมีโครงสร้างชัดเจนจากหลายแหล่ง
(สามารถเก็บข้อมูลกึงโครงสร้างได้ใน Data Warehouse ทีแอดวานซ์) มารวมกันไว้ โดยที
บริษัทขนาดกลางไปจนถึงขนาดใหญ่มักจะมีไว้ใช้ในการแชร์ข้อมูลระหว่างทีม หรือระหว่าง
แผนก นักวิเคราะห์ธุรกิจ (Business Analyst) สามารถดึง insight ออกมา ทําเป็นรายงาน
ไว้สําหรับการตัดสินใจด้านธุรกิจของฝังบริหาร เรียกได้ว่าเป็นแกนหลักสําหรับการวิเคราะห์
ข้อมูล
Data Lake คือทีเก็บขนาดใหญ่ทีสามารถเก็บข้อมูลได้ทุกรูปแบบจาก
หลายแหล่งโดยทีไม่ต้องมีการแปลงข้อมูลก่อน พูดให้เข้าใจง่ายๆ ก็คือ
สามารถเก็บข้อมูลดิบได้ ตังแต่ข้อมูลทีมีโครงสร้างชัดเจน (Structured
Data) ข้อมูลกึงโครงสร้าง (Semi-Structured Data) และข้อมูลทีไม่มี
โครงสร้างแน่นอน (Unstructured Data)
Azure Data Lake Storage Amazon S3
Amazon Redshift
Snowflake Elastic
Data Warehouse
Data Mart คือ ระบบพืนทีเก็บข้อมูลทีมีข้อมูลเฉพาะสําหรับหน่วยธุรกิจของ
องค์กร ประกอบด้วยข้อมูลเล็กๆ ทีเลือกไว้บางส่วนทีบริษัทจัดเก็บไว้ในระบบ
จัดเก็บข้อมูลขนาดใหญ่ บริษัทต่างๆ ใช้ Data Mart เพือวิเคราะห์ข้อมูลเฉพาะ
แผนกได้อย่างมีประสิทธิภาพมากขึน โดยให้ข้อมูลสรุปทีผู้มีส่วนได้ส่วนเสีย
หลักสามารถใช้เพือตัดสินใจได้อย่างรวดเร็ว
2
Thinnaphat Borirak
WORKSHOP: Run SQL Server on Azure SQL
https://www.microsoft.com/en-us/sql-server/sql-server-downloads
https://portal.azure.com/#home
3
Thinnaphat Borirak
WORKSHOP: Visualization AdventureWorksLT on Power BI from SQL Database in Microsoft Azure
Power BI เป็นผลิตภัณฑ์ซอฟต์แวร์การแสดงภาพข้อมูลเชิงโต้ตอบทีพัฒนาโดย
Microsoft โดยเน้นทีข่าวกรองธุรกิจเป็นหลัก เป็นส่วนหนึงของ Microsoft Power
Platform
AdventureWorks Database คือตัวอย่างผลิตภัณฑ์ของ Microsoft สําหรับฐานข้อมูล
การประมวลผลธุรกรรมออนไลน์ (Online Transaction Processing: OLTP)
ฐานข้อมูล AdventureWorks สนับสนุนบริษัทผู้ผลิตข้ามชาติทีสมมติขึนชือว่า
Adventure Works Cycles
https://reportingengineer.com/2020/10/21/summary-misunderstand-powerbi/
4
Thinnaphat Borirak
WORKSHOP: Create Azure HDInsight ?
Data warehousing
You can use HDInsight to perform interactive queries at petabyte scales over structured or unstructured data in any format. You can also
build models connecting them to BI tools.
Internet of Things (IoT)
You can use HDInsight to process streaming data that's received in real time from different kinds of devices
Azure HDInsight เป็นบริการวิเคราะห์โอเพ่นซอร์สทีมีการจัดการเต็มรูปแบบ
สเปกตรัมในระบบคลาวด์สําหรับองค์กร โดย HDInsight ทีทํางานบน Azure
สามารถใช้เฟรมเวิร์กโอเพ่นซอร์ส เช่น Apache Spark, Apache Hive, LLAP-
Live Long and Process, Apache Kafka, Hadoop และอืนๆ ใน Account ของ
พวกคุณได้
https://learn.microsoft.com/en-us/azure/hdinsight/hdinsight-overview
5
Thinnaphat Borirak
Before Installation HDInsight Clusters. Your Can Check Resource providers in Subscriptions
Go to Home
Because Create HDInsight cluster
Requesting quota increases for Azure HDInsight
Thinnaphat Borirak

More Related Content

Similar to Workshop_BDATools-MSAzure.pdf

IT Trends eMagazine Vol 4. No.11
IT Trends eMagazine  Vol 4. No.11IT Trends eMagazine  Vol 4. No.11
IT Trends eMagazine Vol 4. No.11IMC Institute
 
คุณสมบัติของข้อมูลกิจกรรมและองค์ประกอบอื่นๆ ที่เกี่ยวข้องกับความมั่นคงปลอดภัย...
คุณสมบัติของข้อมูลกิจกรรมและองค์ประกอบอื่นๆ ที่เกี่ยวข้องกับความมั่นคงปลอดภัย...คุณสมบัติของข้อมูลกิจกรรมและองค์ประกอบอื่นๆ ที่เกี่ยวข้องกับความมั่นคงปลอดภัย...
คุณสมบัติของข้อมูลกิจกรรมและองค์ประกอบอื่นๆ ที่เกี่ยวข้องกับความมั่นคงปลอดภัย...Chaisuriya
 
Chapter 4 ERP and related technologies
Chapter 4 ERP and related technologiesChapter 4 ERP and related technologies
Chapter 4 ERP and related technologiesTeetut Tresirichod
 
บทความ Big Data จากบล็อก thanachart.org
บทความ Big Data จากบล็อก thanachart.orgบทความ Big Data จากบล็อก thanachart.org
บทความ Big Data จากบล็อก thanachart.orgIMC Institute
 
BigData และการนำมาใช้BigData และการนำมาใช้
BigData และการนำมาใช้BigData และการนำมาใช้BigData และการนำมาใช้BigData และการนำมาใช้
BigData และการนำมาใช้BigData และการนำมาใช้SUMETRATPRACHUM1
 
30879960 geospatial-system-on-cloud-computing
30879960 geospatial-system-on-cloud-computing30879960 geospatial-system-on-cloud-computing
30879960 geospatial-system-on-cloud-computingAyutthaya GIS
 
นุ๊ก
นุ๊กนุ๊ก
นุ๊กsirinet
 
หมวย
หมวยหมวย
หมวยsirinet
 
ดรีม
ดรีมดรีม
ดรีมsirinet
 

Similar to Workshop_BDATools-MSAzure.pdf (20)

IT Trends eMagazine Vol 4. No.11
IT Trends eMagazine  Vol 4. No.11IT Trends eMagazine  Vol 4. No.11
IT Trends eMagazine Vol 4. No.11
 
20110816 oss4edu-nsru
20110816 oss4edu-nsru20110816 oss4edu-nsru
20110816 oss4edu-nsru
 
Proposal
ProposalProposal
Proposal
 
Data base programming
Data base programmingData base programming
Data base programming
 
Managing Big Data with Apache Hadoop.pdf
Managing Big Data with Apache Hadoop.pdfManaging Big Data with Apache Hadoop.pdf
Managing Big Data with Apache Hadoop.pdf
 
Yuu
YuuYuu
Yuu
 
Ten
TenTen
Ten
 
New
NewNew
New
 
คุณสมบัติของข้อมูลกิจกรรมและองค์ประกอบอื่นๆ ที่เกี่ยวข้องกับความมั่นคงปลอดภัย...
คุณสมบัติของข้อมูลกิจกรรมและองค์ประกอบอื่นๆ ที่เกี่ยวข้องกับความมั่นคงปลอดภัย...คุณสมบัติของข้อมูลกิจกรรมและองค์ประกอบอื่นๆ ที่เกี่ยวข้องกับความมั่นคงปลอดภัย...
คุณสมบัติของข้อมูลกิจกรรมและองค์ประกอบอื่นๆ ที่เกี่ยวข้องกับความมั่นคงปลอดภัย...
 
Chapter 4 ERP and related technologies
Chapter 4 ERP and related technologiesChapter 4 ERP and related technologies
Chapter 4 ERP and related technologies
 
บทความ Big Data จากบล็อก thanachart.org
บทความ Big Data จากบล็อก thanachart.orgบทความ Big Data จากบล็อก thanachart.org
บทความ Big Data จากบล็อก thanachart.org
 
BigData และการนำมาใช้BigData และการนำมาใช้
BigData และการนำมาใช้BigData และการนำมาใช้BigData และการนำมาใช้BigData และการนำมาใช้
BigData และการนำมาใช้BigData และการนำมาใช้
 
Unit3
Unit3Unit3
Unit3
 
Technology-based Learning
Technology-based LearningTechnology-based Learning
Technology-based Learning
 
30879960 geospatial-system-on-cloud-computing
30879960 geospatial-system-on-cloud-computing30879960 geospatial-system-on-cloud-computing
30879960 geospatial-system-on-cloud-computing
 
นุ๊ก
นุ๊กนุ๊ก
นุ๊ก
 
โบ
โบโบ
โบ
 
Best
BestBest
Best
 
หมวย
หมวยหมวย
หมวย
 
ดรีม
ดรีมดรีม
ดรีม
 

More from NETsolutions Asia: NSA – Thailand, Sripatum University: SPU (11)

Les12 creating views
Les12 creating viewsLes12 creating views
Les12 creating views
 
Les09 Manipulating Data
Les09 Manipulating DataLes09 Manipulating Data
Les09 Manipulating Data
 
Les04 Displaying Data From Multiple Table
Les04 Displaying Data From Multiple TableLes04 Displaying Data From Multiple Table
Les04 Displaying Data From Multiple Table
 
Les11 Including Constraints
Les11 Including ConstraintsLes11 Including Constraints
Les11 Including Constraints
 
Les10 Creating And Managing Tables
Les10 Creating And Managing TablesLes10 Creating And Managing Tables
Les10 Creating And Managing Tables
 
Les02 Restricting And Sorting Data
Les02 Restricting And Sorting DataLes02 Restricting And Sorting Data
Les02 Restricting And Sorting Data
 
Les00 Intoduction
Les00 IntoductionLes00 Intoduction
Les00 Intoduction
 
Les06 Subqueries
Les06 SubqueriesLes06 Subqueries
Les06 Subqueries
 
Les05 Aggregating Data Using Group Function
Les05 Aggregating Data Using Group FunctionLes05 Aggregating Data Using Group Function
Les05 Aggregating Data Using Group Function
 
Les01 Writing Basic Sql Statements
Les01 Writing Basic Sql StatementsLes01 Writing Basic Sql Statements
Les01 Writing Basic Sql Statements
 
Les03 Single Row Function
Les03 Single Row FunctionLes03 Single Row Function
Les03 Single Row Function
 

Workshop_BDATools-MSAzure.pdf

  • 1. Thinnaphat Borirak WORKSHOP BIG DATA ANALYTIC TOOLS ON MICROSOFT AZURE Hadoop migration to Azure
  • 2. WORKSHOP: Create Resource Groups with Azure subscription Example: ลูกค้าต้องการสร้างเว็บไซต์ของบริษัท NSA โดยมี โดเมนชือ nsa.com ซึงมาให้ผมพัฒนาเว็บไซต์ดังกล่าวเพือขายอุปกรณ์คอมพิวเตอร์ แล้วก็ขอให้ระบบนันมี การตอบคําถามอัตโนมัติ (Chat Bot) ผมก็จะทําการสร้าง Resource Group ของบริษัท NSA เอาไว้ เพือบอกว่าไฟล์งานทีเกียวข้องทังหมดของบริษัทฯ จะอยู่ใน Directory นี แล้วพอมีบริษัท ThaiIOT มาจ้างผมทําการจัดเก็บข้อมูลจากอุปกรณ์ IoT เพือนํามาวิเคราะห์ข้อมูลภายในบริษัทฯ ผมก็จําเป็นทีจะต้องสร้างโดเมน iot.co.th โดย มี Resource Group ของบริษัท ThaiIOT มา เพือบอกว่างานของบริษัท ThaiIOT ทังหมดอยู่ใน Resource Group เช่นกัน วัตถุประสงค์ การใช้งาน Resource Group จะเหมือนกับเราสร้าง Directory ในเครือง คอมพิวเตอร์เพือนํามาใช้งาน อาทิเช่น กรณีทีต้องการพัฒนาโปรแกรมสักอย่างนึง เราก็จะ ไปสร้าง Project Directory ซึงภายใต้กลุ่มของ Directory ก็ไว้ใช้ทีทําหน้าทีรวบรวมไฟล์ต่างๆ ทีเกียวข้อง เพือเอาไว้บริหารจัดการ หรือแบ่งแยกโปรเจคออกเป็นเรืองๆ โดย Microsoft Azure จะเรียกกระบวนการนีว่า Resource Group นันเอง 1 Thinnaphat Borirak
  • 5.
  • 6.
  • 7.
  • 8. Example: Azure subscription 50177004-XX XX: คือรหัสลําดับที
  • 9.
  • 12.
  • 13.
  • 14.
  • 15.
  • 16.
  • 17.
  • 18.
  • 19.
  • 20.
  • 21. WORKSHOP: Building Data On Microsoft Azure Data Warehouse / Data Mart / Data Lake รวบรวมข้อมูลมาเก็บไว้ทีส่วนกลาง แล้วนําไปทํา Visualization Data Warehouse คือทีเก็บขนาดใหญ่สําหรับข้อมูลทีมีโครงสร้างชัดเจนจากหลายแหล่ง (สามารถเก็บข้อมูลกึงโครงสร้างได้ใน Data Warehouse ทีแอดวานซ์) มารวมกันไว้ โดยที บริษัทขนาดกลางไปจนถึงขนาดใหญ่มักจะมีไว้ใช้ในการแชร์ข้อมูลระหว่างทีม หรือระหว่าง แผนก นักวิเคราะห์ธุรกิจ (Business Analyst) สามารถดึง insight ออกมา ทําเป็นรายงาน ไว้สําหรับการตัดสินใจด้านธุรกิจของฝังบริหาร เรียกได้ว่าเป็นแกนหลักสําหรับการวิเคราะห์ ข้อมูล Data Lake คือทีเก็บขนาดใหญ่ทีสามารถเก็บข้อมูลได้ทุกรูปแบบจาก หลายแหล่งโดยทีไม่ต้องมีการแปลงข้อมูลก่อน พูดให้เข้าใจง่ายๆ ก็คือ สามารถเก็บข้อมูลดิบได้ ตังแต่ข้อมูลทีมีโครงสร้างชัดเจน (Structured Data) ข้อมูลกึงโครงสร้าง (Semi-Structured Data) และข้อมูลทีไม่มี โครงสร้างแน่นอน (Unstructured Data) Azure Data Lake Storage Amazon S3 Amazon Redshift Snowflake Elastic Data Warehouse Data Mart คือ ระบบพืนทีเก็บข้อมูลทีมีข้อมูลเฉพาะสําหรับหน่วยธุรกิจของ องค์กร ประกอบด้วยข้อมูลเล็กๆ ทีเลือกไว้บางส่วนทีบริษัทจัดเก็บไว้ในระบบ จัดเก็บข้อมูลขนาดใหญ่ บริษัทต่างๆ ใช้ Data Mart เพือวิเคราะห์ข้อมูลเฉพาะ แผนกได้อย่างมีประสิทธิภาพมากขึน โดยให้ข้อมูลสรุปทีผู้มีส่วนได้ส่วนเสีย หลักสามารถใช้เพือตัดสินใจได้อย่างรวดเร็ว 2 Thinnaphat Borirak
  • 22.
  • 23.
  • 24.
  • 25.
  • 26.
  • 27.
  • 28.
  • 29.
  • 30.
  • 31.
  • 32.
  • 33.
  • 34.
  • 35.
  • 36.
  • 37.
  • 38.
  • 39.
  • 40.
  • 41.
  • 42.
  • 43.
  • 44. WORKSHOP: Run SQL Server on Azure SQL https://www.microsoft.com/en-us/sql-server/sql-server-downloads https://portal.azure.com/#home 3 Thinnaphat Borirak
  • 45.
  • 46.
  • 47.
  • 48.
  • 49.
  • 50.
  • 51.
  • 52.
  • 53.
  • 54.
  • 55.
  • 56.
  • 57.
  • 58.
  • 59.
  • 60.
  • 61.
  • 62.
  • 63.
  • 64.
  • 65.
  • 66.
  • 67.
  • 68.
  • 69.
  • 70.
  • 71.
  • 72.
  • 73.
  • 74.
  • 75.
  • 76.
  • 77.
  • 78.
  • 79.
  • 80.
  • 81.
  • 82.
  • 83.
  • 84. WORKSHOP: Visualization AdventureWorksLT on Power BI from SQL Database in Microsoft Azure Power BI เป็นผลิตภัณฑ์ซอฟต์แวร์การแสดงภาพข้อมูลเชิงโต้ตอบทีพัฒนาโดย Microsoft โดยเน้นทีข่าวกรองธุรกิจเป็นหลัก เป็นส่วนหนึงของ Microsoft Power Platform AdventureWorks Database คือตัวอย่างผลิตภัณฑ์ของ Microsoft สําหรับฐานข้อมูล การประมวลผลธุรกรรมออนไลน์ (Online Transaction Processing: OLTP) ฐานข้อมูล AdventureWorks สนับสนุนบริษัทผู้ผลิตข้ามชาติทีสมมติขึนชือว่า Adventure Works Cycles https://reportingengineer.com/2020/10/21/summary-misunderstand-powerbi/ 4 Thinnaphat Borirak
  • 85.
  • 86.
  • 87.
  • 88.
  • 89.
  • 90.
  • 91.
  • 92.
  • 93.
  • 94.
  • 95.
  • 96.
  • 97.
  • 98.
  • 99.
  • 100.
  • 101.
  • 102.
  • 103.
  • 104.
  • 105.
  • 106. WORKSHOP: Create Azure HDInsight ? Data warehousing You can use HDInsight to perform interactive queries at petabyte scales over structured or unstructured data in any format. You can also build models connecting them to BI tools. Internet of Things (IoT) You can use HDInsight to process streaming data that's received in real time from different kinds of devices Azure HDInsight เป็นบริการวิเคราะห์โอเพ่นซอร์สทีมีการจัดการเต็มรูปแบบ สเปกตรัมในระบบคลาวด์สําหรับองค์กร โดย HDInsight ทีทํางานบน Azure สามารถใช้เฟรมเวิร์กโอเพ่นซอร์ส เช่น Apache Spark, Apache Hive, LLAP- Live Long and Process, Apache Kafka, Hadoop และอืนๆ ใน Account ของ พวกคุณได้ https://learn.microsoft.com/en-us/azure/hdinsight/hdinsight-overview 5 Thinnaphat Borirak
  • 107. Before Installation HDInsight Clusters. Your Can Check Resource providers in Subscriptions
  • 108.
  • 109.
  • 110.
  • 111.
  • 113.
  • 114.
  • 115.
  • 116.
  • 117.
  • 118.
  • 119.
  • 120.
  • 121.
  • 122.
  • 123.
  • 124.
  • 125. Because Create HDInsight cluster Requesting quota increases for Azure HDInsight
  • 126.
  • 127.
  • 128.