โดย ครูภูชิดา เซี่ยงฉิน
ข้อมูลและธรรมชาติของข้อมูล
“ข้อมูล” คือ ข้อเท็จจริงที่ทาให้ทราบถึงเหตุการณ์
ต่างๆ ที่เกิดขึ้นภายในองค์กร บอกสภาพและปรากฏการณ์ที่
เกิดขึ้นกับสิ่งแวดล้อม โดยอธิบายถึงสิ่งใดสิ่งหนึ่ง ซึ่ง
ข้อมูลอาจจะเป็นตัวอักษร ตัวเลข ภาพและเสียง ที่สามารถ
นามาประมวลผลด้วยคอมพิวเตอร์ได้
ชนิดของข้อมูล
มีลักษณะเป็นตัวอักษร ตัวเลข และสัญลักษณ์ โดยข้อมูล
ที่เป็นตัวเลขจะไม่สามารถนาไปคานวณได้ แต่สามารถนาไป
จัดเรียงตามลาดับตัวอักขระ เปลี่ยนแปลงแก้ไขได้ และ
เปรียบเทียบได้ว่าเหมือนกับข้อมูลอื่นหรือไม่
1. ข้อมูลที่เป็นตัวอักขระหรือข้อความ (character
data หรือ text)
มีลักษณะเป็นตัวเลขซึ่งคอมพิวเตอร์สามารถนาไป
คานวณได้ ตัวอย่างเช่น
2. ข้อมูลเชิงจานวน (numerical data)
3. ข้อมูลรหัส (code data)
อาจเป็นตัวอักขระหรือข้อมูลเชิงจานวนก็ได้ ซึ่งมักจะมี
การกาหนดขนาดความยาวไว้จากัด
ข้อมูลที่เป็นตัวเลขไม่ได้นาไปใช้เพื่อการคานวณ แต่ใช้
เพื่อการเปรียบเทียบ นับหรือจัดกลุ่มข้อมูล ที่มีรหัสตรงกับที่
กาหนด
รหัสที่ใช้ระบุเพศอาจเป็นตัวเลขหนึ่งตัวหรือ
ตัวอักขระหนึ่งตัว ได้แก่
1 แทนด้วยเพศชาย
2 แทนด้วยเพศหญิง
รหัสที่ใช้ Yes/No อาจเป็นตัวเลขหนึ่งตัวหรือ
ตัวอักขระหนึ่งตัว ได้แก่
1 หรือ Y แทน Yes
0 หรือ N แทน No
4. ข้อมูลวันที่ (date data)
เป็นข้อมูลซึ่งกาหนดขึ้นเป็นพิเศษ เพื่อให้
สามารถแสดง วัน เดือน ปี ที่กาหนดไว้เป็ น
มาตรฐานได้
ข้อมูลวันที่จะมีประโยชน์มาก
ในเรื่องใด ?
5. ข้อมูลภาพลักษณ์ (image data)
เช่น ภาพถ่าย หรือภาพที่จัดเก็บไว้ใน
ระบบคอมพิวเตอร์ด้วยเครื่องสแกนเนอร์
ไฟล์รูปภาพนามสกุลอะไรบ้าง ?
.bmp
.tiff
.jpg
ไฟล์แบบไหนใช้เนื้อที่
ในการจัดเก็บน้อยที่สุด?
6. ข้อมูลภาพเคลื่อนไหว (moving data)
เช่น ไฟล์ Flash, VDO, Animation
.swf และ .flv
WMV, FLV, MPEG-4, MPG, RM, RMVB, AVI
7. ข้อมูลเสียง (voice data)
นิยมนามาใช้ในงานประมวลผลภาษาธรรมชาติ
(Natural Language Processing: NLP) ซึ่งช่วยให้
คอมพิวเตอร์สามารถแยกเสียงที่ได้รับออกว่ามี
ความหมายอะไร เพื่อให้คอมพิวเตอร์สามารถทางาน
ตามที่มนุษย์บอกหรือออกคาสั่งได้
แบบฝึกหัด
1. ไฟล์รูปภาพนามสกุลอะไรบ้าง ? ไฟล์แบบไหนใช้เนื้อที่ใน
การจัดเก็บน้อยที่สุด และมากที่สุด
2. ไฟล์ภาพเคลื่อนไหวมีนามสกุลอะไรบ้าง ? ไฟล์แบบไหนใช้
เนื้อที่ในการจัดเก็บน้อยที่สุด และมากที่สุด
3. จงยกตัวอย่างของรหัสข้อมูล ( code data ) ว่ามีอะไรบ้าง
ประเภทของข้อมูล
1.ข้อมูลที่เกี่ยวกับทรัพยากรมนุษย์
ได้แก่
 ข้อมูลพนักงาน เช่น อะไรบ้าง ?
-ชื่อ นามสกุล - ที่อยู่
- เลขที่บัตรประจาตัวประชาชน - เลขที่บัตรประกันสังคม
- สถานภาพสมรส - ตาแหน่งงาน
- วันที่เข้าทางาน - แผนก เงินเดือน
- จานวนชั่วโมงในการทางาน และสวัสดิการ เป็นต้น
 ข้อมูลนักศึกษา เช่น อะไรบ้าง ?
รหัสนักศึกษา ชื่อ นามสกุล ที่อยู่ เบอร์
โทรศัพท์ E-mail Address โปรแกรมวิชา
คณะ ตอนเรียน ชั้นปี เป็นต้น
ข้อมูลอาจารย์ เช่น อะไรบ้าง ?
ชื่อ นามสกุล ที่อยู่ เบอร์โทรศัพท์ E-mail
Address โปรแกรมวิชา คณะ ระดับการศึกษา
เป็นต้น
2. ข้อมูลที่เกี่ยวกับการดาเนินธุรกิจ
ได้แก่
 ข้อมูลบริษัทที่ขายสินค้า
 ข้อมูลเกี่ยวกับสินค้าที่มีไว้ขาย
 ข้อมูลลูกค้าที่ซื้อสินค้า
3. ข้อมูลที่เกี่ยวกับสาธารณสุข
ได้แก่
 ข้อมูลแพทย์
 ข้อมูลผู้ป่ วย
 ข้อมูลยา
4. ข้อมูลที่เกี่ยวกับการเกษตร
ได้แก่
 ข้อมูลดิน
 ข้อมูลพันธุ์พืช
 ข้อมูลปุ๋ ย
5. ข้อมูลที่เกี่ยวกับสิ่งแวดล้อม
ได้แก่
 ข้อมูลคุณภาพอากาศ
 ข้อมูลคุณภาพน้า
 ข้อมูลป่ าไม้
6. ข้อมูลที่เกี่ยวกับการเดินทาง
ได้แก่
ข้อมูลสายการบิน
ข้อมูลสถานีขนส่ง
ข้อมูลแหล่งท่องเที่ยว
7. ข้อมูลที่เกี่ยวกับหนังสือ
ได้แก่
ข้อมูลสานักพิมพ์
ข้อมูลร้านขายหนังสือ
ข้อมูลตัวแทนจาหน่าย
8. ข้อมูลที่เกี่ยวกับอุตสาหกรรม
ได้แก่
 ข้อมูลโรงงาน
 ข้อมูลเครื่องจักร
 ข้อมูลวัตถุดิบ
9. ข้อมูลที่เกี่ยวกับศิลปวัฒนธรรม
ได้แก่
 ข้อมูลโบราณสถาน
 ข้อมูลประเพณีไทย
 ข้อมูลพิพิธภัณฑ์
10. ข้อมูลที่เกี่ยวกับการกีฬา
ได้แก่
 ข้อมูลนักกีฬา
 ข้อมูลอุปกรณ์กีฬา
 ข้อมูลสนามกีฬา
การจัดการข้อมูลด้วยแฟ้มข้อมูล
การจัดการข้อมูล
แฟ้มข้อมูล
คือ การประกอบกันของข้อมูลในรูปของ
เลขฐานสอง ซึ่งเก็บไว้ในหน่วยเก็บข้อมูลสารอง
ของคอมพิวเตอร์ อาจจะเป็ นโปรแกรม ข้อมูล
หรือภาพ ก็ได้
“โครงสร้างแฟ้มข้อมูล” (data structure)
หมายถึง รูปแบบของการจัดระเบียบของข้อมูล
ซึ่งมีอยู่หลายรูปแบบ ประกอบด้วย
โครงสร้างพื้นฐานที่ลาดับจากหน่วย
ที่เล็กที่สุดไปยังหน่วยที่ใหญ่ขึ้น
ตามลาดับต่อไปนี้
โครงสร้างข้อมูล
(Data Structure)
Bit
Byte
Field
Record
File
Database
บิต (Bit : Binary Digit)
คือ หน่วยของข้อมูลที่เล็กที่สุดที่เก็บอยู่ใน
หน่วยความจาภายในคอมพิวเตอร์ ซึ่ง Bit จะ
แทนด้วยตัวเลขหนึ่งตัว คือ 0 หรือ 1
ไบท์ (Byte) หรือ ตัวอักขระ (Character)
คือ หน่วยของข้อมูลที่นาบิตหลายๆบิต
มารวมกัน แทนตัวอักษรแต่ละตัว โดยตัวอักษร 1 ตัว
จะแทนด้วยบิต 8 บิต ซึ่งตัวอักษรแต่ละตัวจะเรียกว่า
ไบท์ (Byte)
เขตข้อมูล (Field) หรือคา (Word)
คือ หน่วยของข้อมูลที่เกิดจากการนาตัว
อักขระหลายๆตัวมารวมกันเป็ นคาที่มี
ความหมาย
ระเบียน (Record)
คือ หน่วยของข้อมูลที่มีการ
นาเขตข้อมูลหลายๆ เขตข้อมูล
ที่มีความสัมพันธ์กันมารวมกัน
หรือค่าของข้อมูลในแต่ละเขตข้อมูล
แฟ้มข้อมูล (File)
คือ หน่วยของข้อมูลที่มีการนา
ระเบียนหลายๆ ระเบียนที่มี
ความสัมพันธ์กันมารวมกัน
ฐานข้อมูล (Database)
คือ หน่วยของข้อมูลที่มีการนา
แฟ้มข้อมูลหลายๆ แฟ้มข้อมูล
ที่มีความสัมพันธ์กันมารวมกัน
คาถาม ถามว่า.......
จากตารางข้างต้น มี
กี่ Field
กี่ Record
กี่ File
1. แฟ้มข้อมูลรายการหลัก (Master File)
ทาหน้าที่จัดเก็บข้อมูลที่ไม่มีการ
เปลี่ยนแปลงหรือมีสภาพค่อนข้างคงที่
เช่น
- แฟ้มข้อมูลประวัตินักศึกษา
- ข้อมูลของลูกค้าธนาคาร
การปรับปรุงแก้ไขข้อมูลใน Master File
ให้ทันสมัยสามารถทาได้ 3 รูปแบบคือ
1) การเพิ่ม (add)
2)การลบออก (delete)
3) การแก้ไข (modify)
เช่น
- การเพิ่มระเบียนของนักศึกษาในกรณีที่
เป็นนักศึกษาใหม่
- การลบระเบียนของนักศึกษาในกรณีที่
นักศึกษาลาออก
- การเปลี่ยนแปลงที่อยู่ของนักศึกษา
2. แฟ้มข้อมูลรายการเปลี่ยนแปลง
(Transaction File)
ทาหน้าที่จัดเก็บข้อมูลที่มักมีการ
เคลื่อนไหวหรือมีการเปลี่ยนแปลงอยู่เสมอ
เช่น
- แฟ้มข้อมูลการลงทะเบียนเรียนของ
นักศึกษาที่จะต้องมีการลงทะเบียนเรียนใน
ทุกๆ ภาคการศึกษา
- แฟ้มข้อมูลรายการฝาก-ถอนเงินในบัญชี
ลูกค้าธนาคาร
- แฟ้มข้อมูลการขายสินค้าประจาวัน
3. แฟ้มข้อมูลรายงาน (Report File)
ทาหน้าที่เก็บรายงานที่ได้จาก
คอมพิวเตอร์ไว้
คาถาม ถามว่า.......
แฟ้มข้อมูลที่เป็นรายงาน
นามสกุลอะไร?????
4. แฟ้มข้อมูลเก็บผลลัพธ์
(Output File)
เช่น เวลาที่เราใช้โปรแกรมสาหรับ
คานวณ ได้แก่
5. แฟ้มข้อมูลสารอง (Backup File)
ใช้เก็บสารองข้อมูลในแฟ้มข้อมูลที่มี
ความสาคัญสูง
มีอุปกรณ์ใด
ใช้สารองแฟ้มข้อมูลได้บ้าง
แบบฝึกหัด
จงหาประเภทของ แผ่น CD และ
ประเภทของแผ่น DVD
ข้อดีของการจัดการข้อมูลด้วยแฟ้มข้อมูล
1. การประมวลผลข้อมูลได้รวดเร็ว
2. ลงทุนต่าในเบื้องต้น
3. สามารถออกแบบแฟ้มข้อมูลและทาการ
พัฒนาได้ง่าย
ข้อเสียของการจัดการข้อมูลด้วยแฟ้มข้อมูล
1. เกิดความซ้าซ้อนของข้อมูล(data redundancy)
2. ลาบากต่อการแก้ไข (updating difficulties)
3. เกิดความขัดแย้งของข้อมูล (data inconsistency)
4. เกิดการผูกติดกับข้อมูล (data dependence)
5. การกระจัดกระจายของข้อมูล (data dispersion)
6. การใช้ประโยชน์จากข้อมูลลดลง (underutilization of data)
จากข้อเสียดังกล่าวของการจัดการข้อมูลด้วย
แฟ้มข้อมูล จึงเป็ นที่มาของการพัฒนาระบบ การ
จัดการข้อมูลอีกรูปแบบหนึ่ง เพื่อแก้ปัญหาที่
เกิดขึ้นของการจัดการข้อมูลในระบบแฟ้มข้อมูล ซึ่ง
เรียกว่า “ระบบการจัดการฐานข้อมูล”
การจัดการข้อมูลด้วย
ระบบการจัดการฐานข้อมูล
“ฐานข้อมูล” คือ การรวบรวมข้อมูล
ที่เราต้องการจะจัดเก็บ ซึ่งต้องมี
ความสัมพันธ์กันหรือเป็นเรื่องเดียวกัน
ไว้ด้วยกัน เพื่อสะดวกในใช้งาน
“ระบบการจัดการฐานข้อมูล
(Data Base Management System: DBMS) ”
คือ โปรแกรมที่ทาหน้าที่ในการกาหนดลักษณะ
ข้อมูลที่จะเก็บไว้ในฐานข้อมูล อานวยความสะดวก
ในการบันทึกข้อมูลค้นหาข้อมูล และการแก้ไข
ปรั บปรุ งข้ อมูลกาหนดผู้ ที่ได้ รั บอนุ ญาต
ให้ใช้ฐานข้อมูลได้
คาถาม ถามว่า.......
มีโปรแกรมใดเป็น DBMS บ้าง????
โปรแกรมที่เป็นการทางานแบบ DBMS
1. MS SQL Server 2. IBM DB2
3. Oracle 4. MySQL
5. Microsoft Access 6. MSSQL
7. PostgreSQL คือ คือ ระบบจัดการฐานข้อมูลเชิงวัตถุ-
สัมพันธ์ (Object-Relational Database Management System หรือ
ORDBMS)
•
องค์ประกอบของ
ระบบการจัดการฐานข้อมูล
หน้าที่ของระบบการจัดการฐานข้อมูล
1.การจัดการพจนานุกรมข้อมูล
2. การจัดเก็บข้อมูล
3. การแปลงและนาเสนอข้อมูล
4. การจัดการระบบความปลอดภัย
ของข้อมูล
5. การควบคุมการเข้าถึงข้อมูลของ
ผู้ใช้หลายคน
6. การเก็บสารองและกู้คืนข้อมูล
7. การควบคุมความถูกต้องของข้อมูล
8. ภาษาที่ใช้ในการเข้าถึงฐานข้อมูลและ
การเชื่อมต่อกับโปรแกรมประยุกต์
9. การติดต่อสื่อสารกับฐานข้อมูล
ข้อดีของการใช้ฐานข้อมูล
1.ลดความจาเจของงานดูแลเอกสาร
2. ข้อมูลที่จัดเก็บมีความทันสมัย
3. ลดความซ้าซ้อนในการจัดเก็บข้อมูล
4. หลีกเลี่ยงความขัดแย้งของข้อมูลได้
5. ใช้ข้อมูลร่วมกันได้
6. ควบคุมมาตรฐานของข้อมูลได้
7. จัดทาระบบการรักษาความ
ปลอดภัยของข้อมูลได้
8. ควบคุมความถูกต้องของข้อมูลได้
ข้อเสียของการใช้ฐานข้อมูล
1.เสียค่าใช้จ่ายสูง
2. เกิดการสูญเสียข้อมูลได้
กิจกรรมค้นคว้า
ให้นักเรียนค้นหาโปรแกรมการจัดการ
ฐานข้อมูล มีอะไรบ้าง พร้อมอธิบายลักษณะ
ของโปรแกรมมาพอสังเขป หามาคนละ 5
โปรแกรม
คาศัพท์ต่าง ๆ ที่เกี่ยวข้อง
ในระบบฐานข้อมูล
1. เอนทิตี้ (Entity) หมายถึง ชื่อของสิ่งใดสิ่งหนึ่ง ได้แก่ คน
สถานที่ สิ่งของ การกระทา ซึ่งต้องการจัดเก็บข้อมูลไว้ เช่น เอนทิตี้ลูกค้า
เอนทิตี้พนักงาน
2. แอททริบิวต์ (Attribute) หมายถึง รายละเอียดข้อมูลที่แสดง
ลักษณะและคุณสมบัติของเอนทิตี้หนึ่ง ๆ เช่น เอนทิตี้นักศึกษา
ประกอบด้วย
- แอทริบิวต์รหัสนักศึกษา
- แอททริบิวต์ชื่อนักศึกษา
- แอททริบิวต์ที่อยู่นักศึกษา
ความสัมพันธ์ (Relationships) หมายถึง ความสัมพันธ์ระหว่าง
เอนทิตี้ เช่น ความสัมพันธ์ระหว่างเอนทิตี้นักศึกษาและเอนทิตี้คณะวิชา
เป็นลักษณะว่า นักศึกษาแต่ละคนเรียนอยู่คณะวิชาใดคณะวิชาหนึ่งใน
การแสดงความสัมพันธ์ระหว่างเอนทิตี้
ตัวอย่าง
เอนทิตี้ใบสั่งซื้อแต่ละใบจะสามารถสั่งสินค้าได้มากกว่าหนึ่ง
ชนิด ความสัมพันธ์ของข้อมูลจากเอนทิตี้ใบสั่งซื้อไปยังเอนทิตี้สินค้า
จึงเป็นแบบหนึ่งต่อกลุ่ม (1:m) ในขณะที่สินค้าแต่ละชนิด จะถูกสั่งอยู่ใน
ใบสั่งซื้อหลายใบ ความสัมพันธ์ของข้อมูลจากเอนทิตี้สินค้าไปยังอินทิตี้
ใบสั่งซื้อ จึงเป็นแบบหนึ่งต่อกลุ่ม (1:n) ดังนั้นความสัมพันธ์ของเอนทิตี้
ทั้งสอง จึงเป็นแบบกลุ่มต่อกลุ่ม (m:n)
รูปแบบของระบบฐานข้อมูล
รูปแบบของระบบฐานข้อมูล แบ่งเป็น 3 ประเภท คือ
1. ฐานข้อมูลเชิงสัมพันธ์ (Relational Database)
2. ฐานข้อมูลแบบเครือข่าย (Network Database)
3. ฐานข้อมูลแบบลาดับชั้น (Hierarchical Database)
1. ฐานข้อมูลเชิงสัมพันธ์
(RELATIONAL DATABASE)
เป็นการเก็บข้อมูลในรูปแบบที่เป็นตาราง (Table) หรือ
เรียกว่า รีเลชั่น (Relation) มีลักษณะเป็น 2 มิติ คือเป็นแถว (row)
และเป็นคอลัมน์ (column) การเชื่อมโยงข้อมูลระหว่างตาราง
จะเชื่อมโยงโดยใช้แอททริบิวต์ (attribute) หรือคอลัมน์ที่
เหมือนกันทั้งสองตารางเป็นตัวเชื่อมโยงข้อมูล ฐานข้อมูลเชิง
สัมพันธ์นี้ จะเป็นรูปแบบของฐานข้อมูลที่นิยมใช้ในปัจจุบัน
ดังตัวอย่าง พนักงาน
พนักงาน
รหัสพนักงาน ชื่อพนักงาน ที่อยู่ เงินเดือน รหัสแผนก
12501535
12534568
12503452
12356892
15689730
นายสมพงศ์
นายมนตรี
นายเอก
นายบรรทัด
นายราชัน
กรุงเทพ
นครปฐม
กรุงเทพ
นนทบุรี
สมุทรปราการ
12000
12500
13500
11500
12000
VO
VN
VO
VD
VA
2. ฐานข้อมูลแบบเครือข่าย
(NETWORK DATABASE)
ฐานข้อมูลแบบเครือข่ายจะเป็นการรวมระเบียนต่าง
ๆ และความสัมพันธ์ระหว่างระเบียนแต่จะต่างกับ
ฐานข้อมูลเชิงสัมพันธ์ คือ ในฐานข้อมูลเชิงสัมพันธ์จะแฝง
ความสัมพันธ์เอาไว้ โดยระเบียนที่มีความสัมพันธ์กัน
จะต้องมีค่าของข้อมูลในแอททริบิวต์ใดแอททริบิวต์หนึ่ง
เหมือนกัน แต่ฐานข้อมูลแบบเครือข่าย จะแสดง
ความสัมพันธ์อย่างชัดเจน
3. ฐานข้อมูลแบบลาดับชั้น
(HIERARCHICAL DATABASE)
ฐานข้อมูลแบบลาดับชั้น เป็นโครงสร้างที่จัดเก็บข้อมูลใน
ลักษณะความสัมพันธ์แบบพ่อ-ลูก (Parent-Child Relationship Type
: PCR Type) หรือเป็นโครงสร้างรูปแบบต้นไม้ (Tree) ข้อมูลที่
จัดเก็บในที่นี้ คือ ระเบียน (Record) ซึ่งประกอบด้วยค่าของเขตข้อมูล
(Field) ของเอนทิตี้หนึ่ง ๆ
ฐานข้อมูลแบบลาดับชั้นนี้คล้ายคลึงกับฐานข้อมูลแบบ
เครือข่าย แต่ต่างกันที่ฐานข้อมูลแบบลาดับชั้น มีกฎเพิ่มขึ้นมาอีก
หนึ่งประการ คือ ในแต่ละกรอบจะมีลูกศรวิ่งเข้าหาได้ไม่เกิน 1
หัวลูกศร

ความรู้เบื้องต้นเกี่ยวกับฐานข้อมูล