บทที่ 2
คุณลักษณะสำคัญของ
คลังข้อมูล
อ.ดร.พลอยพรรณ สอนสุวิทย์
บทนำ
◦ คุณลักษณะของคลังข้อมูลแบบออกแบบ 2 อย่าง คือ
◦ แบบเพียงบางส่วน
◦ แบบทั้งหมด
คลังข้อมูล
◦ หมายถึง ข้อมูลขนาดใหญ่ที่มีการรวบรวมจากแหล่งต่างๆ ข้อมูลที่
จัดเก็บในคลังนั้นเป็นข้อมูลที่เกิดขึ้นในอดีต โดยมาจากแหล่ง
เดียวกัน หรือหลายแหล่ง
◦ ถูกนำมาใช้ในการประมวลผลสารสนเทศเชิงบริหาร
◦ เช่น เปรียบเทียบยอดขายสินค้าทั้งหมดระหว่างปี 2010-2014
◦ เปรียบเทียบกำไรและยอดขายในแต่ละสาขา ในช่วงเดียวกัน 3 ปี ย้อน
หลัง
◦ …..
◦ ….
คลังข้อมูล (ต่อ)
◦ ประวัติคลังข้อมูล
◦ เริ่มแนวคิดการพัฒนาคลังข้อมูลตั้งแต่ปี 1980
◦ องค์กรเริ่มตระหนักถึงความสำคัญของการจัดเก็บและการพัฒนา ใน
ช่วงที่มีการใช้ฐานข้อมูลเชิงสัมพันธ์มีบทบาท
◦ แนวคิดการพัฒนาคลังข้อมูล
◦ ข้อมูลที่จัดเก็บในคลังข้อมูลจะเป็นข้อมูลทุติยภูมิ เนื่องจากต้องมีการ
เชื่อมโยงข้อมูลจากแหล่งต่างๆ โดยจะต้องผ่านการสกัด แปลง และการ
โหลดข้อมูล
Relational
Database
Data
Warehouse
Insert/ Update/ Delete/ Read Read Only
Operational Database
Decision Support
System
การพัฒนาคลังข้อมูลมีความซับซ้อน ซึ่งต้องมีการ
วิเคราะห์และออกแบบโครงสร้างสถาปัตยกรรมให้เหมาะ
สมกับรูปแบบและวัตถุประสงค์ของการนำไปใช้
ประโยชน์
โครงสร้างพื้นฐานของเครือข่ายและระบบ
เครือข่าย
◦ สถาปัตยกรรม Hardware
◦ เครื่องแม่ข่ายสำหรับคลังข้อมูล
◦ เป็นเครื่องคอมพิวเตอร์ที่มีหน่วยประมวลผลสูง ทั้งหน่วยประมวลผล
ความจำ และพื้นที่จัดเก็บข้อมูล
◦ อาจประมวลผลเป็นแบบคู่ขนาน
◦ ต้องออกแบบวางแผนรองรับการขยายตัวของข้อมูลในอนาคต
คุณสมบัติของคลังข้อมูล
◦ Subject Oriented
◦ ข้อมูลจะถูกจัดเก็บแยกตามหมวดหมู่ที่สัมพันธ์กันอย่างชัดเจน เช่น ข้อมูล
ฝ่ายขายก็เก็บเอาไว้ในข้อมูลฝ่ายขาย ข้อมูลการซื้อ ข้อมูลสินค้า ข้อมูล
ลูกค้า เป็นต้น ซึ่งการเก็บข้อมูลอย่างมีระเบียบ นอกจากจะช่วยให้ผู้
บริหารธุรกิจ หรือผู้เรียกใช้ข้อมูลสามารถติดตามผลการดำเนินการงานได้
รวดเร็วแล้ว ยังทำให้ธุรกิจรู้ด้วยว่า สาเหตุที่ได้ผลการดำเนินงานเช่นนี้ เกิด
จากอะไร
ความแตกต่างระหว่าง “คลังข้อมูล” กับ “ฐานข้อมูล”
ข้อมูลในฐานข้อมูลธรรมดา (Operational database) มีการจัดเก็บข้อมูล
แบบ Product Orientation คือข้อมูลที่เป็น transaction ข้อมูลที่เป็นการ
เก็บรายวัน ต่อวัน ไม่มีข้อมูลในอดีต
คุณสมบัติของคลังข้อมูล
◦ Integrate Data
◦ ข้อมูลในคลังข้อมูลมาจากหลายๆแหล่ง แต่
การนำข้อมูลมาเก็บไว้ในที่เดียว ต้องมีกระบร
วนการทำให้มันอยู่ในรูปแบบเดียวกันก่อน
เช่น กรุงเทพมหานคร บางฐานข้อมูลอาจเก็บ
ข้อมูลเป็น กทม. บางฐานข้อมูลเก็บเป็น
กรุงเทพ หน้าที่ของคลังข้อมูล คือต้อง
integrate คือต้องบูรณาการ และแก้ไขรูป
แบบของข้อมูลให้เป็นคำเดียวกันหมด
คุณสมบัติของคลังข้อมูล
◦ ขั้นตอน Integrate Data มีการเชื่อมโยงข้อมูลจากแหล่งต่างๆ มี
ดังต่อไปนี้
◦ Data Source Identification
◦ Data Source Analysis
◦ Data Integration
ส่วนประกอบของ Data warehouse แบบไม่ละเอียด (คร่าวๆ)
ส่วนประกอบของ Data warehouse แบบละเอียด (1/2)
Operational data
(ระบบขาย)
Historical data
(ระบบขาย)
Operational data
(ระบบการผลิต)
Historical data
(ระบบการผลิต)
External data
External data
Internal
Data
Sources
External
Data
Sources
Extract
Transform
Load
ETL
Extract การสกัดข้อมูล เป็นเลือกข้อมูลที่ดี และข้อมูลตาม
ต้องการ
Transform การแปลงรูปแบบข้อมูล ให้อยู่รูปแบบที่ต้องการ เช่น แปลงข้อมูลเงินจาก 50
เป็น 50.00
Staging
Databse
Extract
Transform
Load
ETL
Data
Warehouse
Cleansing
and Filtering
Load การนำข้อมูลที่แปลงรูปแบบ แล้วนำไปเก็บยัง DW, P10, P56, P156,
Data Acquisition
ส่วนประกอบของ Data warehouse แบบละเอียด (2/2) (ต่อ)
Data
Warehouse
Data
Mart
Data
Mart
Extract
Transform
Load
(ETL)
Data
Mart
เลือกใช้แบบจำลอง
(Model) ต่างๆ
DW, P10, P56, P156, MIS P 254
Business Intelligence (BI)
End User
Operational data
Historical data
Operational data
Historical data
External data
External data
Internal
Data
Sources
External
Data
Sources
Extract
Transform
Load
ETL
Staging
Databse
Extract
Transform
Load
ETL
Data
Warehouse
Cleansing
and Filtering
Data Acquisition
Data
Mart
Data
Mart
Extract
Transform
Load
(ETL)
Data
Mart Á̈º
° Äo
 Î
µ
¨
°
„    ‹ Š
(M
o
d
e
l) n
µÇ
˜ Š
Business Intelligence (BI)
End User
คุณสมบัติของคลังข้อมูล
◦ Time- Variant Data
◦ ข้อมูลในฐานข้อมูลเชิงปฏิบัติการมุ่งเน้นความเป็นปัจจุบัน และจะต้อง
ปรับปรุงให้ทันสมัยอยู่ตลอดเวลา แต่ข้อมูลในคลังข้อมูล จะเป็นข้อมูลที่มีช่วง
อายุในระยะเวลาใด เวลาหนึ่ง ซึ่งอาจจะเป็นตั้งแต่ 5 ถึง 10 ปี แต่ทั้งนี้ก็ขึ้น
อยู่กับความเหมาะสมเป็นหลักด้วย การนำข้อมูลย้อนหลังที่เก็บรวบรวมไว้ ก็
เพื่อนำมาวิเคราะห์เปรียบเทียบหาแนวโน้มและใช้พยากรณ์ทางธุรกิจ
◦ Non-Volatile data
◦ หลังจากข้อมูลถูกบันทึกเข้าสู่คลังข้อมูลแล้ว ผู้ใช้จะไม่สามารถเปลี่ยนแปลง
หรือแก้ไขข้อมูลได้ เพราะวัตถุประสงค์ของคลังข้อมูล คือ เพื่อการอ่านข้อมูล
หรือการเรียกดูข้อมูล และใช้ในการวิเคราะห์ ประกอบการตัดสินใจเท่านั้น
คลังข้อมูล (Data Warehouse) :
สถาปัตยกรรมของคลังข้อมูล (1/2)
Data Source
Data Staging
Area
Data Warehouse
Database
Data Analysis
and Report
Data
Metadata Repository
Metdata
Data Data
Metadata
Metadata
Metadata
Data
Terminal
◦ Data Source:
ทำหน้าที่รับข้อมูลจากภายใน/นอกองค์กร มีการตรวจสอบ
ความถูกต้อง
◦ Data Staging Area :
ทำหน้าที่ Cleansing & Filtering เลือกเฉพาะข้อมูลที่เป็น
ประโยชน์ ( Filtering), แปลงข้อมูล และ ตรวจสอบความถูกต้องใน
เบื้องต้น ก่อนจะโหลดเข้าสู่ Data Warehouse Database
◦ Data Warehouse Database :
บันทึกข้อมูลต่าง ๆ ที่จำเป็นสำหรับการวิเคราะห์ข้อมูลของ
องค์กร
◦ Data Analysis and Report:
เหมือน Data Warehouse Database แต่ขอบเขตเนื้อหา
ข้อมูลจะแคบกว่า คือ เพื่อกลุ่มงานใดกลุ่มงานหนึ่ง หรืออาจเป็น
โครงสร้างข้อมูลที่เหมาะสมที่จะนำไปใช้งาน (Report, Cube)
◦ End Users Terminal :
นำเสนอผลลัพธ์ออกจากหน้าจอ โดยจะใช้เครื่องมือหรือ
ระบบที่ทำหน้าที่ออกรายงาน เช่น Simple Reporting Tools,
Multi-Dimensional Tools หรือ Data Mining Tools ก็ได้
◦ Metadata Repository :
2.7 ความละเอียดของข้อมูล (Data
Granularity)
◦ 1. Highly summarized data
◦ ข้อมูลสรุประดับสูง รอบเวลาของการสรุปมีระยะเวลานาน เช่นข้อมูลยอดขายรายเดือน หรือ
ราย 6 เดือน หรือ ข้อมูลการลงทะเบียนของนักศึกษาในรอบปี เป๋นต้น
◦ 2. Light summarized dataฃ
◦ ข้อมูลที่มีการสรุปในระดับปานกลาง คือมีรอบเวลาในการสรุปข้อมูลมีความถี่ขึ้น เช่น ข้อมูล
สรุปรายวัน รายสัปดาห์หรือรายเดือน เป็นข้อมูลที่มีความเคลื่อนไหวตลอดเวลา จำเป็น
ต้องใช้ข้อมูลสรุปเป็นตัวเลขสรุป เช่น ความเคลื่อนไหวของคลังสินค้า หรือ ข้อมูลการขนส่ง
สินค้า เป็นต้น
◦ 3. Detail summarized data
◦ ข้อมูลสรุปในระดับที่น้อย หรือไม่มีการสรุปเลย นั่นคือ เป็นรายละเอียดข้อมูลในระดับเร
คอร์ด คล้ายฐานข้อมูลเชิงปฏิบัติการ เช่น ข้อมูลความเคลื่อนไหวรายหารหุ้น เป็นต้น
Detail
Data
Highly
Summarized
Data
Lightly
Summarized Data
InFlow
OutFlow
DownFlow
ภาพประกอบหน้า 40
2.7 ความละเอียดของข้อมูล (Data
Granularity)
ข้อมูลเข้า
ข้อมูลออก
ข้อมูลจัดเก็บ
UpFlow
MeatFlow
5 ขั้นตอนประกอบด้วย
◦ Inflow
◦ การสกัด ตตรวจสอบความถูกต้อง และการโหลดข้อมูลเข้าสู่คลังข้อมูล (ETL)
◦ UpFlow
◦ การเพิ่มมูลค่าของข้อมูลโดยนำเสนอข้อมุลเชิงสรุป และขัดเก็บข้อมูลในรูปแบบแพ็คเกจ
◦ DownFlow
◦ การสร้างและสำรองข้อมูลออกจากคลังข้อมูล
◦ OutFlow
◦ การเตรียมตวามพร้อมของข้อมูลที่จัดเก็บภายในคลังข้อมูลเพื่อให้ผู้ใช้งานนำไปใช้
ประโยชน์
◦ MetaFlow
◦ การจัดการกับโครงสร้างข้อมูลระดับเมตาดาต้า
ความแตกต่างระหว่างคลังข้อมูลกับดาต้า
มาร์ท
DataMart เป็น
เซทย่อยของคลัง
ข้อมูล เน้นกลุ่ม
ข้อมูลที่มีความ
สำคัญอันดับต้นๆ
เช่น ข้อมูลที่
เกี่ยวข้องกับการ
เงิน ยอดขาย ต้นทุ
นการปลิต ผล
กำไรขาดทุน
ความแตกต่างระหว่างคลังข้อมูลกับดาต้า
มาร์ท
คลังข้อมูล ดาต้ามาร์ท
 จัดเก็บข้อมูลทรี่คลอบคลุมทั้งองค์กร
 เชื่อมโยงจากดาต้ามาร์ทต่างๆ
 เชื่อมโยงกับพื้นที่พักข้อมูล
 การคิวรีข้อมูลผ่าน OLAP
 ประมวลผลผ่านเครื่องมือธรกิจ
อัจฉริยะ
 โครงสร้างสถาปัตยกรรมรองรับการ
ขยายตัวในอนาคต
 ข้อมูลระดับแผนกหรือฝ่าย
 มีการเชื่อโยงข้อมูลจาก 2-3 แหล่ง
 การจัดเก็บข้อมูลย้อนหลังน้อยกว่า 3
ปี
 ประมวลผลโดยตรง หรือคิวรีผ่าน
OLAP
 มีเครื่องมือนำเสนอสารสนเทศเฉพาะ
เจาะจงในแต่ละด้าน
2.9 แนวทางการพัฒนาคลังข้อมูลสำหรับ
องค์กร
◦ แบบบนลงล่าง Top-Down Approach
2.9 แนวทางการพัฒนาคลังข้อมูลสำหรับองค์กร
◦ แบบบนลงล่าง Bottom-Up Approach
องค์ประกอบของแหล่งข้อมูล
◦ Product Data
◦ เป็นข้อมูลที่มาจากการปฏิบัติงานของบุคลากรและเจ้าหน้าที่ในแต่ละแผนก/ ฝ่าย
งาน ผ่านซอฟต์แวร์ที่ออกแบบมาเพื่องานนั้นๆ เช่น ซอฟต์แวร์บริหารงานบุคคล
ซอฟต์แวร์ซื้อขายสินค้าออนไลน์ เป็นต้น มักเป็นระบบฐานข้อมูลเชิงสัมพันธ์
◦ Internal Data
◦ ข้อมูลภายในองค์กร ที่ถูกจัดเก็บในรูปแบบที่หลากหลาย เช่น Excel, Text File,
AutoCAD, Music, Video เป็นต้น
◦ External Data
◦ ข้อมูลภายนอกองค์กร สำคัญต่อกานตัดสินใจของผู้บริหาร เช่น ราคาตลาด ราคา
น้ำมัน ข้อมูลเศรษฐกิจ หุ้น เป็นต้น
◦ Archive Data
◦
องค์ประกอบพื้นที่จัดเก็บข้อมูล
◦ พื้นที่จัดเก็บข้อมูลจะต้องมีความสามารถในการ รองรับปริมาณข้อมูลขนาด
ใหญ่ พื้นที่จัดเก็บข้อมีความยืดหยุ่น รองรับการขยายตัว มีประสิทธิภาพใน
การนำข้อมูลไปใช้ประโยชน์
แหล่งข้อมูล การโหลดข้อมูล
Weekly, Monthly, Quarterly, Yearly
คลังข้อมูล
E T L
2.10 การใช้ประโยชน์จากคลังข้อมูลใน
เชิงสารสนเทศ
◦ ลักษณะการใช้ประโยชน์จากคลัง
ข้อมูลขึ้นอยู่กับความต้องการของผู้ใช้
งาน เป้าหมายจะถูกกำหนดไวตั้งแต่
เริ่มออกแบบโครงสร้างคลังข้อมูล ซึ่ง
จะต้องกำหนดให้ชัดว่า ผู้ใดคือผู้ใช้
ประโยชน์จากคลังข้อมูล แนวทางใน
การนำไปวิเคราะห์และใช้ประโยชน์
รูปแบบที่เหมาะสมในการนำไปใช้
ประโยชน์เป็นอย่างไร
◦ แสดงผลในเชิงสารสนเทศสรุป
ตาราง แผนภูมิเปรียบเทียบ เป็นต้น
◦ หรือการพยากรณ์ในอนาคตจาก
บทที่ 2 คุณลักษณะสำคัญของคลังข้อมูล.pptx

บทที่ 2 คุณลักษณะสำคัญของคลังข้อมูล.pptx

  • 1.
  • 2.
    บทนำ ◦ คุณลักษณะของคลังข้อมูลแบบออกแบบ 2อย่าง คือ ◦ แบบเพียงบางส่วน ◦ แบบทั้งหมด
  • 3.
    คลังข้อมูล ◦ หมายถึง ข้อมูลขนาดใหญ่ที่มีการรวบรวมจากแหล่งต่างๆข้อมูลที่ จัดเก็บในคลังนั้นเป็นข้อมูลที่เกิดขึ้นในอดีต โดยมาจากแหล่ง เดียวกัน หรือหลายแหล่ง ◦ ถูกนำมาใช้ในการประมวลผลสารสนเทศเชิงบริหาร ◦ เช่น เปรียบเทียบยอดขายสินค้าทั้งหมดระหว่างปี 2010-2014 ◦ เปรียบเทียบกำไรและยอดขายในแต่ละสาขา ในช่วงเดียวกัน 3 ปี ย้อน หลัง ◦ ….. ◦ ….
  • 4.
    คลังข้อมูล (ต่อ) ◦ ประวัติคลังข้อมูล ◦เริ่มแนวคิดการพัฒนาคลังข้อมูลตั้งแต่ปี 1980 ◦ องค์กรเริ่มตระหนักถึงความสำคัญของการจัดเก็บและการพัฒนา ใน ช่วงที่มีการใช้ฐานข้อมูลเชิงสัมพันธ์มีบทบาท ◦ แนวคิดการพัฒนาคลังข้อมูล ◦ ข้อมูลที่จัดเก็บในคลังข้อมูลจะเป็นข้อมูลทุติยภูมิ เนื่องจากต้องมีการ เชื่อมโยงข้อมูลจากแหล่งต่างๆ โดยจะต้องผ่านการสกัด แปลง และการ โหลดข้อมูล
  • 5.
    Relational Database Data Warehouse Insert/ Update/ Delete/Read Read Only Operational Database Decision Support System การพัฒนาคลังข้อมูลมีความซับซ้อน ซึ่งต้องมีการ วิเคราะห์และออกแบบโครงสร้างสถาปัตยกรรมให้เหมาะ สมกับรูปแบบและวัตถุประสงค์ของการนำไปใช้ ประโยชน์
  • 6.
    โครงสร้างพื้นฐานของเครือข่ายและระบบ เครือข่าย ◦ สถาปัตยกรรม Hardware ◦เครื่องแม่ข่ายสำหรับคลังข้อมูล ◦ เป็นเครื่องคอมพิวเตอร์ที่มีหน่วยประมวลผลสูง ทั้งหน่วยประมวลผล ความจำ และพื้นที่จัดเก็บข้อมูล ◦ อาจประมวลผลเป็นแบบคู่ขนาน ◦ ต้องออกแบบวางแผนรองรับการขยายตัวของข้อมูลในอนาคต
  • 7.
    คุณสมบัติของคลังข้อมูล ◦ Subject Oriented ◦ข้อมูลจะถูกจัดเก็บแยกตามหมวดหมู่ที่สัมพันธ์กันอย่างชัดเจน เช่น ข้อมูล ฝ่ายขายก็เก็บเอาไว้ในข้อมูลฝ่ายขาย ข้อมูลการซื้อ ข้อมูลสินค้า ข้อมูล ลูกค้า เป็นต้น ซึ่งการเก็บข้อมูลอย่างมีระเบียบ นอกจากจะช่วยให้ผู้ บริหารธุรกิจ หรือผู้เรียกใช้ข้อมูลสามารถติดตามผลการดำเนินการงานได้ รวดเร็วแล้ว ยังทำให้ธุรกิจรู้ด้วยว่า สาเหตุที่ได้ผลการดำเนินงานเช่นนี้ เกิด จากอะไร ความแตกต่างระหว่าง “คลังข้อมูล” กับ “ฐานข้อมูล” ข้อมูลในฐานข้อมูลธรรมดา (Operational database) มีการจัดเก็บข้อมูล แบบ Product Orientation คือข้อมูลที่เป็น transaction ข้อมูลที่เป็นการ เก็บรายวัน ต่อวัน ไม่มีข้อมูลในอดีต
  • 8.
    คุณสมบัติของคลังข้อมูล ◦ Integrate Data ◦ข้อมูลในคลังข้อมูลมาจากหลายๆแหล่ง แต่ การนำข้อมูลมาเก็บไว้ในที่เดียว ต้องมีกระบร วนการทำให้มันอยู่ในรูปแบบเดียวกันก่อน เช่น กรุงเทพมหานคร บางฐานข้อมูลอาจเก็บ ข้อมูลเป็น กทม. บางฐานข้อมูลเก็บเป็น กรุงเทพ หน้าที่ของคลังข้อมูล คือต้อง integrate คือต้องบูรณาการ และแก้ไขรูป แบบของข้อมูลให้เป็นคำเดียวกันหมด
  • 9.
    คุณสมบัติของคลังข้อมูล ◦ ขั้นตอน IntegrateData มีการเชื่อมโยงข้อมูลจากแหล่งต่างๆ มี ดังต่อไปนี้ ◦ Data Source Identification ◦ Data Source Analysis ◦ Data Integration
  • 10.
    ส่วนประกอบของ Data warehouseแบบไม่ละเอียด (คร่าวๆ)
  • 11.
    ส่วนประกอบของ Data warehouseแบบละเอียด (1/2) Operational data (ระบบขาย) Historical data (ระบบขาย) Operational data (ระบบการผลิต) Historical data (ระบบการผลิต) External data External data Internal Data Sources External Data Sources Extract Transform Load ETL Extract การสกัดข้อมูล เป็นเลือกข้อมูลที่ดี และข้อมูลตาม ต้องการ Transform การแปลงรูปแบบข้อมูล ให้อยู่รูปแบบที่ต้องการ เช่น แปลงข้อมูลเงินจาก 50 เป็น 50.00 Staging Databse Extract Transform Load ETL Data Warehouse Cleansing and Filtering Load การนำข้อมูลที่แปลงรูปแบบ แล้วนำไปเก็บยัง DW, P10, P56, P156, Data Acquisition
  • 12.
    ส่วนประกอบของ Data warehouseแบบละเอียด (2/2) (ต่อ) Data Warehouse Data Mart Data Mart Extract Transform Load (ETL) Data Mart เลือกใช้แบบจำลอง (Model) ต่างๆ DW, P10, P56, P156, MIS P 254 Business Intelligence (BI) End User
  • 13.
    Operational data Historical data Operationaldata Historical data External data External data Internal Data Sources External Data Sources Extract Transform Load ETL Staging Databse Extract Transform Load ETL Data Warehouse Cleansing and Filtering Data Acquisition Data Mart Data Mart Extract Transform Load (ETL) Data Mart Á̈º ° Äo  Πµ ¨ ° „    ‹ Š (M o d e l) n µÇ ˜ Š Business Intelligence (BI) End User
  • 14.
    คุณสมบัติของคลังข้อมูล ◦ Time- VariantData ◦ ข้อมูลในฐานข้อมูลเชิงปฏิบัติการมุ่งเน้นความเป็นปัจจุบัน และจะต้อง ปรับปรุงให้ทันสมัยอยู่ตลอดเวลา แต่ข้อมูลในคลังข้อมูล จะเป็นข้อมูลที่มีช่วง อายุในระยะเวลาใด เวลาหนึ่ง ซึ่งอาจจะเป็นตั้งแต่ 5 ถึง 10 ปี แต่ทั้งนี้ก็ขึ้น อยู่กับความเหมาะสมเป็นหลักด้วย การนำข้อมูลย้อนหลังที่เก็บรวบรวมไว้ ก็ เพื่อนำมาวิเคราะห์เปรียบเทียบหาแนวโน้มและใช้พยากรณ์ทางธุรกิจ ◦ Non-Volatile data ◦ หลังจากข้อมูลถูกบันทึกเข้าสู่คลังข้อมูลแล้ว ผู้ใช้จะไม่สามารถเปลี่ยนแปลง หรือแก้ไขข้อมูลได้ เพราะวัตถุประสงค์ของคลังข้อมูล คือ เพื่อการอ่านข้อมูล หรือการเรียกดูข้อมูล และใช้ในการวิเคราะห์ ประกอบการตัดสินใจเท่านั้น
  • 15.
    คลังข้อมูล (Data Warehouse): สถาปัตยกรรมของคลังข้อมูล (1/2) Data Source Data Staging Area Data Warehouse Database Data Analysis and Report Data Metadata Repository Metdata Data Data Metadata Metadata Metadata Data Terminal
  • 16.
    ◦ Data Source: ทำหน้าที่รับข้อมูลจากภายใน/นอกองค์กรมีการตรวจสอบ ความถูกต้อง ◦ Data Staging Area : ทำหน้าที่ Cleansing & Filtering เลือกเฉพาะข้อมูลที่เป็น ประโยชน์ ( Filtering), แปลงข้อมูล และ ตรวจสอบความถูกต้องใน เบื้องต้น ก่อนจะโหลดเข้าสู่ Data Warehouse Database ◦ Data Warehouse Database : บันทึกข้อมูลต่าง ๆ ที่จำเป็นสำหรับการวิเคราะห์ข้อมูลของ องค์กร ◦ Data Analysis and Report: เหมือน Data Warehouse Database แต่ขอบเขตเนื้อหา ข้อมูลจะแคบกว่า คือ เพื่อกลุ่มงานใดกลุ่มงานหนึ่ง หรืออาจเป็น โครงสร้างข้อมูลที่เหมาะสมที่จะนำไปใช้งาน (Report, Cube) ◦ End Users Terminal : นำเสนอผลลัพธ์ออกจากหน้าจอ โดยจะใช้เครื่องมือหรือ ระบบที่ทำหน้าที่ออกรายงาน เช่น Simple Reporting Tools, Multi-Dimensional Tools หรือ Data Mining Tools ก็ได้ ◦ Metadata Repository :
  • 17.
    2.7 ความละเอียดของข้อมูล (Data Granularity) ◦1. Highly summarized data ◦ ข้อมูลสรุประดับสูง รอบเวลาของการสรุปมีระยะเวลานาน เช่นข้อมูลยอดขายรายเดือน หรือ ราย 6 เดือน หรือ ข้อมูลการลงทะเบียนของนักศึกษาในรอบปี เป๋นต้น ◦ 2. Light summarized dataฃ ◦ ข้อมูลที่มีการสรุปในระดับปานกลาง คือมีรอบเวลาในการสรุปข้อมูลมีความถี่ขึ้น เช่น ข้อมูล สรุปรายวัน รายสัปดาห์หรือรายเดือน เป็นข้อมูลที่มีความเคลื่อนไหวตลอดเวลา จำเป็น ต้องใช้ข้อมูลสรุปเป็นตัวเลขสรุป เช่น ความเคลื่อนไหวของคลังสินค้า หรือ ข้อมูลการขนส่ง สินค้า เป็นต้น ◦ 3. Detail summarized data ◦ ข้อมูลสรุปในระดับที่น้อย หรือไม่มีการสรุปเลย นั่นคือ เป็นรายละเอียดข้อมูลในระดับเร คอร์ด คล้ายฐานข้อมูลเชิงปฏิบัติการ เช่น ข้อมูลความเคลื่อนไหวรายหารหุ้น เป็นต้น
  • 18.
    Detail Data Highly Summarized Data Lightly Summarized Data InFlow OutFlow DownFlow ภาพประกอบหน้า 40 2.7ความละเอียดของข้อมูล (Data Granularity) ข้อมูลเข้า ข้อมูลออก ข้อมูลจัดเก็บ UpFlow MeatFlow
  • 19.
    5 ขั้นตอนประกอบด้วย ◦ Inflow ◦การสกัด ตตรวจสอบความถูกต้อง และการโหลดข้อมูลเข้าสู่คลังข้อมูล (ETL) ◦ UpFlow ◦ การเพิ่มมูลค่าของข้อมูลโดยนำเสนอข้อมุลเชิงสรุป และขัดเก็บข้อมูลในรูปแบบแพ็คเกจ ◦ DownFlow ◦ การสร้างและสำรองข้อมูลออกจากคลังข้อมูล ◦ OutFlow ◦ การเตรียมตวามพร้อมของข้อมูลที่จัดเก็บภายในคลังข้อมูลเพื่อให้ผู้ใช้งานนำไปใช้ ประโยชน์ ◦ MetaFlow ◦ การจัดการกับโครงสร้างข้อมูลระดับเมตาดาต้า
  • 20.
  • 21.
    ความแตกต่างระหว่างคลังข้อมูลกับดาต้า มาร์ท คลังข้อมูล ดาต้ามาร์ท  จัดเก็บข้อมูลทรี่คลอบคลุมทั้งองค์กร เชื่อมโยงจากดาต้ามาร์ทต่างๆ  เชื่อมโยงกับพื้นที่พักข้อมูล  การคิวรีข้อมูลผ่าน OLAP  ประมวลผลผ่านเครื่องมือธรกิจ อัจฉริยะ  โครงสร้างสถาปัตยกรรมรองรับการ ขยายตัวในอนาคต  ข้อมูลระดับแผนกหรือฝ่าย  มีการเชื่อโยงข้อมูลจาก 2-3 แหล่ง  การจัดเก็บข้อมูลย้อนหลังน้อยกว่า 3 ปี  ประมวลผลโดยตรง หรือคิวรีผ่าน OLAP  มีเครื่องมือนำเสนอสารสนเทศเฉพาะ เจาะจงในแต่ละด้าน
  • 22.
  • 23.
  • 24.
    องค์ประกอบของแหล่งข้อมูล ◦ Product Data ◦เป็นข้อมูลที่มาจากการปฏิบัติงานของบุคลากรและเจ้าหน้าที่ในแต่ละแผนก/ ฝ่าย งาน ผ่านซอฟต์แวร์ที่ออกแบบมาเพื่องานนั้นๆ เช่น ซอฟต์แวร์บริหารงานบุคคล ซอฟต์แวร์ซื้อขายสินค้าออนไลน์ เป็นต้น มักเป็นระบบฐานข้อมูลเชิงสัมพันธ์ ◦ Internal Data ◦ ข้อมูลภายในองค์กร ที่ถูกจัดเก็บในรูปแบบที่หลากหลาย เช่น Excel, Text File, AutoCAD, Music, Video เป็นต้น ◦ External Data ◦ ข้อมูลภายนอกองค์กร สำคัญต่อกานตัดสินใจของผู้บริหาร เช่น ราคาตลาด ราคา น้ำมัน ข้อมูลเศรษฐกิจ หุ้น เป็นต้น ◦ Archive Data ◦
  • 25.
    องค์ประกอบพื้นที่จัดเก็บข้อมูล ◦ พื้นที่จัดเก็บข้อมูลจะต้องมีความสามารถในการ รองรับปริมาณข้อมูลขนาด ใหญ่พื้นที่จัดเก็บข้อมีความยืดหยุ่น รองรับการขยายตัว มีประสิทธิภาพใน การนำข้อมูลไปใช้ประโยชน์ แหล่งข้อมูล การโหลดข้อมูล Weekly, Monthly, Quarterly, Yearly คลังข้อมูล E T L
  • 26.
    2.10 การใช้ประโยชน์จากคลังข้อมูลใน เชิงสารสนเทศ ◦ ลักษณะการใช้ประโยชน์จากคลัง ข้อมูลขึ้นอยู่กับความต้องการของผู้ใช้ งานเป้าหมายจะถูกกำหนดไวตั้งแต่ เริ่มออกแบบโครงสร้างคลังข้อมูล ซึ่ง จะต้องกำหนดให้ชัดว่า ผู้ใดคือผู้ใช้ ประโยชน์จากคลังข้อมูล แนวทางใน การนำไปวิเคราะห์และใช้ประโยชน์ รูปแบบที่เหมาะสมในการนำไปใช้ ประโยชน์เป็นอย่างไร ◦ แสดงผลในเชิงสารสนเทศสรุป ตาราง แผนภูมิเปรียบเทียบ เป็นต้น ◦ หรือการพยากรณ์ในอนาคตจาก