21. WORKSHOP: Building Data On Microsoft Azure
Data Warehouse / Data Mart / Data Lake
รวบรวมข้อมูลมาเก็บไว้ทีส่วนกลาง แล้วนําไปทํา Visualization
Data Warehouse คือทีเก็บขนาดใหญ่สําหรับข้อมูลทีมีโครงสร้างชัดเจนจากหลายแหล่ง
(สามารถเก็บข้อมูลกึงโครงสร้างได้ใน Data Warehouse ทีแอดวานซ์) มารวมกันไว้ โดยที
บริษัทขนาดกลางไปจนถึงขนาดใหญ่มักจะมีไว้ใช้ในการแชร์ข้อมูลระหว่างทีม หรือระหว่าง
แผนก นักวิเคราะห์ธุรกิจ (Business Analyst) สามารถดึง insight ออกมา ทําเป็นรายงาน
ไว้สําหรับการตัดสินใจด้านธุรกิจของฝังบริหาร เรียกได้ว่าเป็นแกนหลักสําหรับการวิเคราะห์
ข้อมูล
Data Lake คือทีเก็บขนาดใหญ่ทีสามารถเก็บข้อมูลได้ทุกรูปแบบจาก
หลายแหล่งโดยทีไม่ต้องมีการแปลงข้อมูลก่อน พูดให้เข้าใจง่ายๆ ก็คือ
สามารถเก็บข้อมูลดิบได้ ตังแต่ข้อมูลทีมีโครงสร้างชัดเจน (Structured
Data) ข้อมูลกึงโครงสร้าง (Semi-Structured Data) และข้อมูลทีไม่มี
โครงสร้างแน่นอน (Unstructured Data)
Azure Data Lake Storage Amazon S3
Amazon Redshift
Snowflake Elastic
Data Warehouse
Data Mart คือ ระบบพืนทีเก็บข้อมูลทีมีข้อมูลเฉพาะสําหรับหน่วยธุรกิจของ
องค์กร ประกอบด้วยข้อมูลเล็กๆ ทีเลือกไว้บางส่วนทีบริษัทจัดเก็บไว้ในระบบ
จัดเก็บข้อมูลขนาดใหญ่ บริษัทต่างๆ ใช้ Data Mart เพือวิเคราะห์ข้อมูลเฉพาะ
แผนกได้อย่างมีประสิทธิภาพมากขึน โดยให้ข้อมูลสรุปทีผู้มีส่วนได้ส่วนเสีย
หลักสามารถใช้เพือตัดสินใจได้อย่างรวดเร็ว
2
Thinnaphat Borirak
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44. WORKSHOP: Run SQL Server on Azure SQL
https://www.microsoft.com/en-us/sql-server/sql-server-downloads
https://portal.azure.com/#home
3
Thinnaphat Borirak
45.
46.
47.
48.
49.
50.
51.
52.
53.
54.
55.
56.
57.
58.
59.
60.
61.
62.
63.
64.
65.
66.
67.
68.
69.
70.
71.
72.
73.
74.
75.
76.
77.
78.
79.
80.
81.
82.
83.
84. WORKSHOP: Visualization AdventureWorksLT on Power BI from SQL Database in Microsoft Azure
Power BI เป็นผลิตภัณฑ์ซอฟต์แวร์การแสดงภาพข้อมูลเชิงโต้ตอบทีพัฒนาโดย
Microsoft โดยเน้นทีข่าวกรองธุรกิจเป็นหลัก เป็นส่วนหนึงของ Microsoft Power
Platform
AdventureWorks Database คือตัวอย่างผลิตภัณฑ์ของ Microsoft สําหรับฐานข้อมูล
การประมวลผลธุรกรรมออนไลน์ (Online Transaction Processing: OLTP)
ฐานข้อมูล AdventureWorks สนับสนุนบริษัทผู้ผลิตข้ามชาติทีสมมติขึนชือว่า
Adventure Works Cycles
https://reportingengineer.com/2020/10/21/summary-misunderstand-powerbi/
4
Thinnaphat Borirak
85.
86.
87.
88.
89.
90.
91.
92.
93.
94.
95.
96.
97.
98.
99.
100.
101.
102.
103.
104.
105.
106. WORKSHOP: Create Azure HDInsight ?
Data warehousing
You can use HDInsight to perform interactive queries at petabyte scales over structured or unstructured data in any format. You can also
build models connecting them to BI tools.
Internet of Things (IoT)
You can use HDInsight to process streaming data that's received in real time from different kinds of devices
Azure HDInsight เป็นบริการวิเคราะห์โอเพ่นซอร์สทีมีการจัดการเต็มรูปแบบ
สเปกตรัมในระบบคลาวด์สําหรับองค์กร โดย HDInsight ทีทํางานบน Azure
สามารถใช้เฟรมเวิร์กโอเพ่นซอร์ส เช่น Apache Spark, Apache Hive, LLAP-
Live Long and Process, Apache Kafka, Hadoop และอืนๆ ใน Account ของ
พวกคุณได้
https://learn.microsoft.com/en-us/azure/hdinsight/hdinsight-overview
5
Thinnaphat Borirak