6. Data Elements (องค์ประกอบของข้อมูล)
Character
› A single alphabetic, numeric, or other symbol
Field or data item
› Represents an attribute (characteristic or quality)
of some entity (object, person, place, event)
Example: salary, job title
Record
› Grouping of all the fields used to describe the attributes of
an entity
Example: payroll record with name, SSN, pay rate
File or table
› A group of related records
Database
› An integrated collection of logically related
data elements
Big data 101 : Chapter2 Data
Management
7. L O V E
01001100 01001111 01010110 01001110
Bits
Characters
Data Elements
Big data 101 : Chapter2 Data
Management
8. Field (เขตข้อมูล)
รหัสนักศึกษา 60234561
ชื่อนักศึกษา กาญจนา
นามสกุล สุดสวย
เพศ หญิง
คือ รายละเอียดที่เกิดจากกลุ่มอักขระที่รวมกันแล้วก่อให้เกิด
ความหมาย เช่น ชื่อคน สัตว์สิ่งของ อายุที่อยู่ เพศ
Data Elements
Big data 101 : Chapter2 Data
Management
10. คือ กลุ่มข้อมูลที่เก็บรายการที่เกี่ยวข้องกัน อ้างอิงเรื่องเดียวกันนารวมกัน อาทิเช่น
ตารางข้อมูลนักศึกษา, ตารางข้อมูลอาจารย์/เจ้าหน้าที่, ตารางข้อมูลอาคาร/
สถานที่, ตารางข้อมูลการจัดตารางการสอน, ฯลฯ
Data Elements
Big data 101 : Chapter2 Data
Management
11. รหัส ชื่อ สกุล เพศ หมู่เรียน
6040121 นายการัน รักษาเทพ ชาย BA2124
6040221 น.สหนึ่งทิพย์ ศิริเยี่ยม หญิง BA2124
6002256 นายศิริทรัพย์ เชื้อสะอาด ชาย BA2124
6003890 นายไกรศร
โรจน์
สุวรรณ
ชาย BA2124
Fields
Records
File
Big data 101 : Chapter2 Data
Management
12. ฐานข้อมูล Database (ฐานข้อมูล)
คือ แหล่งจัดเก็บและรวบรวมกลุ่มข้อมูลที่เกี่ยวข้องกัน สัมพันธ์กัน เป็น
ส่วนของข้อมูลที่อยู่ในองค์กรในระบบเดียวกัน
คุณสมบัติของฐานข้อมูล
•แหล่งเก็บข้อมูลขนาดใหญ่โดยปกติมักจะมีกลุ่มเดียว
•มักกาหนดเพียงครั้งเดียวเท่านั้น
•ข้อมูลจะถูกรวบรวมไว้ด้วยกันเพื่อให้เกิดความซ้าซ้อนน้อยที่สุด
•ข้อมูลทรัพยากรสามารถร่วมกันได้หลายหน่วยงานภายใต้องค์กรเดียวกันไม่เป็นของ
หน่วยงานใดหน่วยงานหนึ่ง
Data Elements
Big data 101 : Chapter2 Data
Management
32. Stores static data that has been extracted
from other databases in an organization
เก็บข้อมูลที่นิ่งแล้วที่ดึงข้อมูลจากฐานข้อมูลขององค์กรออกมา
› Central source of data that has been
cleaned, transformed, and cataloged
› เก็บข้อมูลไว้ที่ศูนย์กลาง ซึ่งเป็นข้อมูลที่ ทาความสะอาดแล้ว เปลี่ยนรูปแบบ และเก็บไว้
› Data is used for data mining, analytical
processing, analysis, research, decision
support
› เป็นข้อมูล เพื่อการค้นหาสารสนเทศที่ไม่เคยมี , ข้อมูลเพื่อการวิเคราะห์ , ทาวิจัย
เพื่อการตัดสินใจ
Big data 101 : Chapter2 Data
Management
33. Data warehouses may be divided into Data
marts
› Subsets of data that focus on specific aspects
of a company (department or business
process)
คลังข้อมูล สามารถ ตัดออกมาเป็น ดาต้ามารต (คือ ส่วนย่อยของข้อมูลเฉพาะเรื่องที่เราสนใจ
จะศึกษา )
Data Mart คือ คือคลังข้อมูลขนาดเล็กที่ภายในจะมีการเก็บข้อมูลที่เฉพาะเจาะจงไป
ตามแผนกที่ใช้งาน เช่น แผนกบัญชี แผนกการตลาดเป็นต้น จุดเด่นของมันก็คือ ใช้เวลาใน
การพัฒนาคลังข้อมูลน้อย และนาไปใช้งานได้สะดวกกว่า คลังข้อมูลรวมขององค์กร
Big data 101 : Chapter2 Data
Management
34. Applications and Data Marts ดาต้ามารต
การเงิน
การตลาด
การขาย
บัญชี
รายงานสาหรับผู้บริหาร
คลังข้อมูล
Big data 101 : Chapter2 Data
Management
35. Data in data warehouses are analyzed to reveal
hidden patterns and trends
ข้อมูลใน คลังข้อมูล สามารถนามาวิเคราะห์เพื่อหาข้อมูลที่ซ่อนอยู่ได้ เช่นหา แพทเทิ้น หรือ แนวโน้ม
› Market-basket analysis to identify new
product bundles เพื่อหาการขายสินค้าเป็นชุด
› Find root cause of qualify or manufacturing
problems หาต้นเหตุของปัญหา
› Prevent customer attrition ป้องกันการลดลงของลูกค้า
› Acquire new customers ค้นหาลูกค้าใหม่
› Cross-sell to existing customers
การขายแบบข้ามผลิตภัณฑ์สาหรับลูกค้าเก่า เช่น ระบบแนะนาสินค้า
› Profile customers with more accuracy
เพื่อเข้าใจลูกค้าได้อย่างถูกต้องแม่นยาขึ้น
Big data 101 : Chapter2 Data
Management
37. Data Lake คือ พื้นที่เก็บข้อมูลส่วนกลางจากทุกแหล่งข้อมูล ทุกรูปแบบ ข้อมูล
สามารถอยู่ทั้งในรูปแบบของ Structured และ Unstructured
ข้อมูลที่จะใช้หรือไม่คิดว่าจะได้ใช้ก็เก็บได้หมด ไม่ต้องมีการแปลงข้อมูลใดๆก่อนเก็บ
สามารถใช้เครื่องมือหลายๆอย่างเพื่อให้รวดเร็วในการดึงข้อมูลมาใช้ตัดสินใจในองค์กร
เป็นวิธีการที่เกิดขึ้นใหม่และมีประสิทธิภาพในการแก้ไขปัญหาเกี่ยวกับการรวมข้อมูลใน
EDW แบบเดิม เพราะ EDW แบบเดิมนั้นจะต้องผ่านขั้นตอนที่ทาให้เกิดการเก็บ
ข้อมูลในโครงสร้างแบบเดียวกัน ในขณะที่ Data Lake จะเก็บข้อมูลแบบดิบๆ
หรือ Raw Data
Note : EDW Enterprise Data Warehouse คลังข้อมูลขององค์กร
Big data 101 : Chapter2 Data
Management