ขอมูลและการจัดการขอมูลทางคอมพิวเตอรขอมูลและการจัดการขอมูลทางคอมพิวเตอร
Data and Data ManagementData and Data Management
ภาควิชาวิทยาการคอมพิวเตอร
คณะวิทยาศาสตร มหาวิทยาลัยนเรศวร
วัตถุประสงควัตถุประสงค
• นิสิตทราบถึงลักษณะของขอมูลทางคอมพิวเตอร
• นิสิตทราบถึงโครงสรางขอมูลทางคอมพิวเตอร
• นิสิตทราบถึงการเขารหัสขอมูลและการแทนขอมูล
• นิสิตทราบถึงขั้นตอนการจัดการขอมูล
• นิสิตรูจักซอฟตแวรที่ใชในการจัดการขอมูล
หัวขอบรรยายหัวขอบรรยาย
• ขอมูลทางคอมพิวเตอร
• โครงสรางระดับชั้นของขอมูลทางคอมพิวเตอร
• การจัดการขอมูล
• การจัดการแฟมขอมูล
• ระบบจัดการฐานขอมูล
ขอมูลทางคอมพิวเตอรขอมูลทางคอมพิวเตอร
• ขอมูล (Data) หมายถึง ขอเท็จจริง หรือเหตุการณตาง ๆ ที่เกิดขึ้น
อาจจะเปน จํานวน ตัวอักษร สัญลักษณ ภาพ หรือ เวลา เปนตน และ
ตองเปนสิ่งที่เราใหความสนใจ
• ขอมูลที่สามารถจัดการดวยคอมพิวเตอรจะตองถูกนําเสนอในรูปแบบที่
เครื่องคอมพิวเตอรสามารถนํามาใชได คือ รหัสดิจิตอล (1/0)
• การแทนขอมูล (Data representation) คือ วิธีการในการสราง
รหัสแบบดิจิตอลเพื่อแทนขอมูลในหนวยความจําหรือสื่อบันทึกขอมูล
ของคอมพิวเตอร
– เชน A แทนดวย 01000001 เปนตน
ประเภทของขอมูลประเภทของขอมูล (Data type)(Data type)
• ขอมูลเชิงตรรกะ (Logical Data)
– ใชแสดงสถานะทางตรรกะไดวาเปน จริง หรือ เท็จ
• ขอมูลประเภทจํานวน (Number)
– สามารถคํานวณและเปรียบเทียบในเชิงปริมาณได
– เชน จํานวนเต็ม จํานวนจริง วันที่ หรือ เวลา เปนตน
• ขอมูลประเภทขอความ (Text)
– ใชแสดงขอความเพื่อบอกถึงความหมายของสิ่งใดสิ่งหนึ่ง
• ขอมูลอื่นๆ
– เชน รูปภาพ เสียง วีดีโอ เปนตน ซึ่งจะตองสามารถแทนดวยรหัสดิจิตอลได
ตัวอยางขอมูลเชิงตรรกะตัวอยางขอมูลเชิงตรรกะ (Logical Data)(Logical Data)
• ถากําหนดให
– 1 แทนวันที่ ฝนตก
– 0 แทนวันที่ ฝนไมตก
• ดังนั้น เราสามารถแทนขอมูลของฝนตกภายในหนึ่งสัปดาหไดดวย
ขอมูลดิจิตอลขนาด 7 bits ดังนี้
– ขอมูลฝน ฝนตก ฝนตก ฝนไมตก ฝนตก ฝนไมตก ฝนไมตก
ฝนตก
– แทนดวย 1101001
ขอมูลประเภทจํานวนขอมูลประเภทจํานวน (Number)(Number)
• ขอมูลประเภทจํานวน (ปกติจะอยูบนฐาน 10) จะถูกแทนดวยระบบจํานวนที่อยู
บนฐานสอง
• เชน 25 สามารถแทนไดดวย 110012 ซึ่งหมายถึงเราจะตองเตรียมพื้นที่ของ
หนวยความจําไวอยางนอย 5 bits สําหรับเก็บจํานวนนี้
เตรียมหนวยความจําไว 5 bits
1 1 0 0 125 = 11001
55 = 110111
ขนาดของหนวยความจําที่เตรียมไวไมพอ
ขนาดหนวยความจํา 5 bits สามารถแทนเลขจํานวนเต็มไดกี่จํานวน?ขนาดหนวยความจํา 5 bits สามารถแทนเลขจํานวนเต็มไดกี่จํานวน?
ขอมูลประเภทจํานวนขอมูลประเภทจํานวน (Number)(Number)
ขอมูล 5 bits สามารถสรางรหัสไดดังนี้
00000 = 0
00001 = 1
00010 = 2
00011 = 3
00100 = 4
.
.
.
.
.
11111 = 31
00000 = 0
00001 = 1
00010 = 2
00011 = 3
00100 = 4
.
.
.
.
.
11111 = 31
32 จํานวน หรือ 25 = 32
ถาตองการแทนจํานวนเต็มซึ่งมีคาเทากับ 200
ควรจะใหมีหนวยความจําขนาดอยางนอยที่สุดเทาใด?
ถาตองการแทนจํานวนเต็มซึ่งมีคาเทากับ 200
ควรจะใหมีหนวยความจําขนาดอยางนอยที่สุดเทาใด?
ขอมูลประเภทขอความขอมูลประเภทขอความ ((TextText))
• ขอความประกอบดวยตัวอักษร (character) อยางนอย 1 ตัวอักษร
ขึ้นไป
• ดังนั้นการแทนขอมูลประเภทขอความดวยรหัสดิจิตอลนั้นจะตองเริ่มตน
จากการแทนตัวอักษรดวยรหัสดิจิตอลกอน
• เรามีวิธีการเขารหัสเพื่อแทนตัวอักษรหลายวิธี ดังตัวอยางตอไปนี้
– BCD Code
– ASCII Code
– Unicode
โครงสรางระดับชั้นของขอมูลทางคอมพิวเตอรโครงสรางระดับชั้นของขอมูลทางคอมพิวเตอร
• บิต (Bit)
• ไบท (Byte)
• เขตขอมูล (Field)
• ระเบียน (Record)
• แฟมขอมูล (File)
บิตบิต (Bit)(Bit) และไบทและไบท (Byte)(Byte)
• ขอมูลระดับ บิต เปนหนวยขอมูลที่เล็กที่สุดของคอมพิวเตอร ซึ่งแทน
สถานะของขอมูลเปนไดเพียงสองสถานะ คือ 0 หรือ 1
• ขอมูลระดับ ไบท เปนหนวยขอมูลที่ประกอบดวย 8 บิต
1 0 0 1 0 1 1 0
1 Byte
เขตขอมูลเขตขอมูล (Field)(Field)
• เขตขอมูล คือขอบเขตพื้นที่หนวยความจําที่กําหนดใหขอมูล 1 หนวย ซึ่ง
แตละหนวยของขอมูลอาจใชพื้นที่หนวยความจําไมเทากัน ขึ้นอยูกับ
ประเภทของขอมูล และการกําหนดคุณสมบัติของเขตขอมูล
• เชน
– เขตขอมูลของตัวอักขระ 1 ตัว ใชพื้นที่ 1 Byte สําหรับรหัส ASCII
– เขตขอมูลของตัวอักขระ 1 ตัว ใชพื้นที่ 4 Byte สําหรับรหัส Unicode
– เขตขอมูลสําหรับขอความ (Text) ถากําหนดไวสําหรับตัวอักขระ 10 ตัว ก็จะ
ใชพื้นที่ 10 Byte (ถาใชการเขารหัสแบบ ASCII)
– เขตขอมูลขนาด 1 byte สํามารถครอบคลุมจํานวนบวกที่อยูในชวง 0 – 255
– เขตขอมูลขนาด 2 byte สํามารถครอบคลุมจํานวนบวกที่อยูในชวง 0 – 65535
ตัวอยางการกําหนดเขตขอมูลตัวอยางการกําหนดเขตขอมูล
เขตขอมูล ชนิดขอมูล ขนาด
รหัสพนักงาน Text 10 ตัวอักษร
ชื่อพนักงาน Text 30 ตัวอักษร
สถานะภาพสมรส Logic (Boolean) 1 Byte
จํานวนชั่วโมงทํางาน Integer Number 2 Byte
เงินเดือน Floating Number 4 Byte
ระเบียนระเบียน (Record)(Record)
• ระเบียน คือโครงสรางขอมูลที่แสดงถึงคุณลักษณะของสิ่งที่สนใจ ซึ่ง
ประกอบไปดวยเขตขอมูลตั้งแต 1 เขตขอมูลขึ้นไป เชน ระเบียนของ
พนักงาน 1 คน ดังตอไปนี้
แฟมขอมูลแฟมขอมูล
• แฟมขอมูล คือโครงสรางขอมูลที่ถูกจัดเก็บไวบนสื่อบันทึกขอมูล ซึ่ง
แฟมขอมูลหนึ่งอาจประกอบไปดวยขอมูลของสิ่งที่สนใจจํานวนหลาย
ระเบียน
4 records
แฟมขอมูลพนักงาน
การจัดการแฟมขอมูลการจัดการแฟมขอมูล
• การสรางแฟมขอมูล (File Creation) คือการระบุตําแหนงและพื้นที่ของแฟมขอมูล
บนสื่อบันทึกขอมูล
• การลบไฟล (File Delete) คือการลบแฟมขอมูลออกจากสื่อบันทึกขอมูล
• การปรับเปลี่ยนขอมูลบนแฟมขอมูล (File Modification/Writing)
– การเพิ่มขอมูล (Data Insertion)
– การลบขอมูล (Data Deleting)
– การแกไขขอมูล (Data Editing)
– การเรียงลําดับขอมูล (Sorting)
• การอานแฟมขอมูล (File Reading)
– แสดงรายการทั้งหมด (List)
– คนหาบางรายการ (Search)
วิธีการจัดการแฟมขอมูลวิธีการจัดการแฟมขอมูล
• แฟมที่เขาถึงแบบลําดับ (Sequential Access File)
– การเพิ่มขอมูลจะเปนการเพิ่มแบบตอทายตามลําดับที่เพิ่มเขาไป
– การอานหรือการคนหาขอมูลจะทําตามลําดับ จากระเบียนแรกไปยังระเบียน
ถัดไปเรื่อยๆ จนกระทั่งถึงระเบียนสุดทาย
• แฟมที่เขาถึงแบบสุม (Random Access File)
– เปาหมายของการจัดการขอมูลแบบนี้ คือ ตองการเขาถึงขอมูลที่ตองการได
ทันที โดยไมตองดําเนินการตามลําดับ
– ตองการเพิ่มประสิทธิภาพของการคนหาขอมูลในแฟมขอมูล
ประเภทของแฟมขอมูลประเภทของแฟมขอมูล
• Transaction File
– คือไฟลที่มีความถี่ในการเปลี่ยนแปลงขอมูลสูง การเปลี่ยนแปลงนั้นอาจจะเปน การเพิ่ม
ลบ หรือ แกไข ขอมูลภายในแฟมขอมูล
– ตัวอยางเชน ไฟลสําหรับเก็บรายการขายสินคาประจําวัน ซึ่งจะตองเก็บรายละเอียดของการ
ขายวาไดขายอะไร จํานวนเทาใด ราคาเทาใด ในทุกๆครั้งที่มีการขายสินคา
• Master File
– คือไฟลที่มีความถี่ในการเปลี่ยนแปลงขอมูลต่ํา
– ปกติขอมูลที่เก็บใน Master file จะเปนขอมูลที่ถูกสรุปหรือสังเคราะหมาเปนที่
เรียบรอยแลวจะไมคอยมีการแกไขเปลี่ยนแปลงใดๆ
– ตัวอยางเชน ไฟลสําหรับเก็บขอมูลสรุปยอดขายประจําป ซึ่งจะตองทําขอมูลรายละเอียด
การขายในทุกๆวัน มาสังเคราะหเพื่อเปนขอมูลสรุปแลวจัดเก็บไวเปนประวัติ
ลักษณะการประมวลผลแฟมขอมูลลักษณะการประมวลผลแฟมขอมูล
• Batch Processing
– การประมวลผลทําโดยการรวบรวมขอมูลมาสะสมไว จนกระทั้งถึงระยะเวลาที่กําหนดแลว
จึงทําการประมวลผลขอมูลนั้น
– เชน การประมวลผลเพื่อ สรุปจํานวนวันทํางานของพนักงาน ถาใชวิธีการแบบ Batch
processing จะตองทําการเก็บรวบรวมขอมูลการเขางานและออกงานของพนักงาน
แตละคน พอถึงสิ้นเดือนก็จะนําขอมูลนั้นมาประมวลผลเพื่อสรุปวาพนักงานแตละคนมี
จํานวนวันที่ทํางานกี่วัน เปนตน
• Online Processing
– เปนการประมวลผลแตละรายการขอมูลและใหผลลัพธทันที เมื่อมีการปอนขอมูลเขาสู
ระบบ
– เชนการฝากถอนเงินกับธนาคาร จะสามารถปรับยอดคงเหลือไดทันที
ปญหาในการจัดการแฟมขอมูลปญหาในการจัดการแฟมขอมูล
• ความซ้ําซอนกันของขอมูล
– สิ้นเปลืองเนื้อที่จัดเก็บ
• ความขัดแยงกันของขอมูล
– ทําใหเกิดความสับสน
• โครงสรางขอมูลแตกตางกัน (ไมมีมาตรฐาน)
– ไมสามารถประมวลผลดวยวิธีการเดียวกันได
• ขอมูลแยกกันอยูคนละที่
– จัดการยาก เชนตองตามแกไข หรือปรับปรุงหลายๆที่ ทําใหเสียเวลา
ระบบฐานขอมูลระบบฐานขอมูล (Database Systems)(Database Systems)
ประกอบดวยสวนสําคัญหลักๆ 5 สวน คือ
1. ฮารดแวร (Hardware) อาจเปนเครื่องไมโครคอมพิวเตอรเพียงเครื่องเดียว หรือ ไมโครคอมพิวเตอร
หลายตัวมาเชื่อมตอกันในลักษณะของระบบเครือขายแบบลูกขาย / แมขาย (client / server network)
2. ระบบจัดการฐานขอมูล (DBMS) คือ โปรแกรมที่ใชเปนเครื่องมือในการจัดการฐานขอมูล สามารถ
สราง ลบ เปลี่ยนแปลง และเรียกดูขอมูล นอกจากนี้ ยังมีหนาที่ในการรักษาความมั่นคงปลอดภัยของ
ขอมูล การสํารองขอมูล และการเรียกคืนขอมูลในกรณีที่ขอมูลเกิดความเสียหาย
3. ฐานขอมูล (Database) คือ กลุมของขอมูลที่ถูกนํามาจัดเก็บไวในที่เดียวกันอยางมีโครงสราง มีการ
สรางความสัมพันธระหวางขอมูลไว เพื่อประสิทธิภาพในการจัดการขอมูล
4. กระบวนการทํางาน (Procedures) หมายถึง ขั้นตอนการทํางานเพื่อใหไดผลลัพธตามที่ตองการ
5. บุคลากร (People) ไดแก ผูบริหารขอมูล (data administrators) ผูบริหารฐานขอมูล (database
administrators) นักวิเคราะหระบบ (systems analysts) นักออกแบบฐานขอมูล (database
designers) นักเขียนโปรแกรม (programmers) และผูใชงาน (end-users)
องคประกอบของระบบฐานขอมูลองคประกอบของระบบฐานขอมูล
หนาที่ของระบบจัดการฐานขอมูลหนาที่ของระบบจัดการฐานขอมูล
• การจัดการพจนานุกรมขอมูล
• การจัดเก็บขอมูล
• การแปลงและนําเสนอขอมูล
• การจัดการระบบความปลอดภัยของขอมูล
• การควบคุมการเขาถึงขอมูลของผูใชหลายคน
• การเก็บสํารองและกูคืนขอมูล
• การควบคุมความถูกตองของขอมูล
• การติดตอสื่อสารกับฐานขอมูล
ขอดีของการใชระบบฐานขอมูลขอดีของการใชระบบฐานขอมูล
• การใชขอมูลรวมกัน
• ลดความซ้ําซอนของขอมูล
• ขจัดความขัดแยงของขอมูล
• ขอมูลมีความทันสมัย ถูกตองตรงกัน
• มีระบบรักษาความปลอดภัยของขอมูล
ขอเสียของการใชระบบฐานขอมูลขอเสียของการใชระบบฐานขอมูล
• การลงทุนเริ่มตนทางดานฮารดแวรสูง
• คาใชจายในการจัดซื้อซอฟตแวรสูง
• ไมจําเปนเมื่อลักษณะของงานไมซับซอน
• ไมจําเปนเมื่อไมตองการใหผูใชเขาถึงขอมูลไดหลายๆคน
โปรแกรมระบบจัดการฐานขอมูลโปรแกรมระบบจัดการฐานขอมูล
• Microsoft Access
• SQL Server
• Oracle
• Informix
• DB2
• MySQL
ตัวอยางตารางพนักงานในฐานขอมูลตัวอยางตารางพนักงานในฐานขอมูล
ตัวอยางการเชื่อมขอมูลสองตารางในฐานขอมูลเชิงสัมพันธตัวอยางการเชื่อมขอมูลสองตารางในฐานขอมูลเชิงสัมพันธ
เอกสารอางอิงเอกสารอางอิง
กิตติ ภักดีวัฒนะกุล และ จําลอง ครูอุสาหะ, คัมภีรระบบฐานขอมูล,
บริษัท เคทีพี คอมพ แอนด คอนซัลท จํากัด, 2542.
โอภาส เอี่ยมสิริวงศ, ระบบฐานขอมูล (DATABASE SYSTEMS)
กรุงเทพฯ :บริษัทซีเอ็ดยูเคชั่น, 2551.
Joseph J. Adamski, Kathy Finnegan, “New Perspectives on Microsoft
Office Access,” 2005.
Rob, P. and Coronel, C. “Database Systems: Design, Implementation,
and Management,” 7th ed., Course Technology, 2007.

09 การจัดการข้อมูล