More Related Content
Similar to "บทที่6 1 17_36_ห้อง62
Similar to "บทที่6 1 17_36_ห้อง62 (20)
"บทที่6 1 17_36_ห้อง62
- 1. ข้อมูล ( Data) คือ ข้อเท็จจริงที่เกิดขึ้น ข้อมูลอาจจะอยู่ในรูปของข้อความหรือตัวเลข ซึ่งข้อความหรือ
ตัวเลขเหล่านี้อาจเป็นเรื่องที่เกี่ยวข้องกับ คน พืช สัตว์และสิ่งของ เช่น ปริมาณข้าวที่ประเทศไทยผลิตได้
ในในปี 2545 เป็นข้อมูลที่เป็นตัวเลข หรือความคิดเห็นของประชาชนเกี่ยวกับการเลือกตั้ง เป็นข้อมูลที่อยู่
ในรูปข้อความ เป็นต้น
ตัวแปร ( Variable) คือ ข้อมูลที่ได้จากสังเกต วัด สอบถามจากหน่วยที่ศึกษา โดยที่หน่วยที่ศึกษาอาจเป็น
คน สัตว์พืช และสิ่งของ เมื่อหน่วยศึกษาแตกต่างกัน ข้อมูลที่ได้จึงแตกต่างกัน จึงเรียกข้อมูลที่แตกต่าง
กันนั้นว่า ตัวแปร เช่น รายได้ของคนในจังหวัดสงขลา ในที่นี่หน่วยที่ศึกษา คือ คนในจังหวัดสงขลา แต่
ละคนจะแตกต่างกันออกไป ดังนั้นตัวแปร คือ รายได้ของคนในจังหวัดสงขลา ซึ่งมีค่าที่แตกต่างกัน ค่า
ของตัวแปร คือ ข้อมูลนั่นเอง
แต่ละคน ปริมาณน้าฝนที่วัดได้ข้อมูลที่ได้จะมีลักษณะเป็นเศษส่วน หรือจุดทศนิยม บางครั้ง เรียกว่า
ข้อมูลแบบต่อเนื่อง
นาข้อมูลดิบมารวบรวมเป็นกลุ่มเป็นหมวดหมู่
- 2. แหล่งข้อมูล หมายถึง สถานที่หรือแหล่งที่เกิดข้อมูล แหล่งข้อมูลจะแตกต่างกันไปตามข้อมูลที่
ต้องการ เช่น บ้านเป็นแหล่งข้อมูลที่เกี่ยวกับนักเรียน โดยบันทึก ข้อมูลไว้ในทะเบียนบ้าน
ห้องสมุด เป็นแหล่งข้อมูลเกี่ยวกับความรู้ต่าง ๆ ข้อมูลบางอย่างเราอาจจะนามาจากแหล่งข้อมูล
หลายแหล่งได้เช่นราคาของเล่นชนิดเดียวกัน เราอาจจะหาข้อมูลจากแหล่งข้อมูลซึ่งได้แก่ร้านค้า
หลายร้านได้และข้อมูลหรือราคาที่ได้อาจจะแตกต่างกันไป หนังสือพิมพ์เป็นแหล่งข้อมูลที่มีทั้ง
ข้อความ ตัวเลข รูปภาพ
โดยปกติแล้ว ข้อมูลสาหรับการนามาประมวลผลด้วยคอมพิวเตอร์นั้นจะได้มาจากแหล่งที่มา 2 ประเภท
ด้วยกัน คือ
1. แหล่งข้อมูลภายใน เป็นแหล่งข้อมูลที่อยู่ภายในองค์กรทั่วไป ข้อมูลที่ได้นั้นอาจมาจากพนักงานหรือมี
อยู่แล้วในองค์กร เช่น ยอดขายประจาปี ข้อมูลผู้ถือหุ้น รายงานกาไรขาดทุน ข้อมูลเหล่านี้จะให้ข้อมูลที่
เกี่ยวข้องกับข้อเท็จจริงต่างๆภายในองค์กรแต่เพียงอย่างเดียว อาจเป็นข้อมูลที่เปิดเผยให้กับบุคคลภายนอก
ทราบหรือไม่ก็ได้หากข้อมูลนั้นเป็นข้อมูลที่เกี่ยวข้องกับการดาเนินงานหลักขององค์กรและมีความสาคัญมาก
เช่น ข้อมูลผลิตภัณฑ์ที่จะออกสู่ตลาดใหม่ ข้อมูลการทดลองการแปรรูปสินค้า หน่วยงานนั้นอาจมีการปกปิด
ไว้เพื่อป้องกันการรั่วไหลของข้อมูลได้
2. แหล่งข้อมูลภายนอก เป็นแหล่งข้อมูลที่อยู่ภายนอกองค์กร โดยทั่วไปแล้วสามารถนาข้อมูลต่างๆ
เหล่านั้นมาใช้ประโยชน์ในองค์กรหรือนามาใช้กับการประมวลผลด้วยคอมพิวเตอร์ เพื่อให้ได้ระบบงานที่
สมบูรณ์ขึ้นได้เช่น ข้อมูลลูกค้า เจ้าหนี้ อัตราดอกเบี้ยสถาบันการเงิน กฎหมายและอัตราภาษีของรัฐบาล หรือ
อาจรวมถึงข้อมูลบริษัทคู่แข่งด้วย สามารถหาข้อมูลจากแหล่งภายนอกได้จากบริษัทผู้ให้บริการข้อมูลหรือจาก
หนังสือพิมพ์วิทยุโทรทัศน์ หรือสื่ออื่นๆได้
- 3. ข้อมูลที่ดีจะต้องประกอบด้วยคุณสมบัติที่สาคัญๆ ดังนี้คือ
1. ความถูกต้องแม่นยา (accuracy) ข้อมูลที่ดีควรจะมีความถูกต้องแม่นยาสูง หรือถ้ามีความคลาดเคลื่อน
(errors) ปนอยู่บ้าง ก็ควรที่จะสามารถควบคุมขนาดของความคลาดเคลื่อนที่ปนมาให้มีความคลาดเคลื่อน
น้อยที่สุด
2. ความทันเวลา (timeliness) เป็นข้อมูลที่ทันสมัย (up to date) และทันต่อความต้องการของ ผู้ใช้ถ้าผลิต
ข้อมูลออกมาช้า ก็ไม่มีคุณค่าถึงแม้จะเป็นข้อมูลที่ถูกต้องแม่นยาก็ตาม
3. ความสมบูรณ์ครบถ้วน (completeness) ข้อมูลที่เก็บรวบรวมมาต้องเป็นข้อมูลที่ให้ข้อเท็จจริง (facts)
หรือข่าวสาร (information) ที่ครบถ้วนทุกด้านทุกประการ มิใช่ขาดส่วนหนึ่งส่วนใดไปทาให้นาไปใช้
การไม่ได้
4. ความกระทัดรัด (conciseness) ข้อมูลที่ได้รับส่วนใหญ่จะกระจัดกระจาย ควรจัดข้อมูลให้อยู่ใน
รูปแบบที่กระทัดรัดไม่เยิ่นเย้อ สะดวกต่อการใช้และค้นหา ผู้ใช้มีความเข้าใจได้ทันที
5. ความตรงกับความต้องการของผู้ใช้ (relevance) ข้อมูลที่จัดทาขึ้นมาควรเป็นข้อมูลที่ผู้ใช้ข้อมูล
ต้องการใช้ และจาเป็นต้องรู้ / ทราบ หรือเป็นประโยชน์ต่อการจัดทาแผน กาหนดนโยบายหรือตัดสิน
ปัญหาในเรื่องนั้นๆ ไม่ใช่เป็นข้อมูลที่จัดทาขึ้นมาอย่างมากมาย แต่ไม่มีใครต้องการใช้หรือไม่ตรงกับ
ความต้องการของผู้ใช้ข้อมูล
6. ความต่อเนื่อง (continuity) การเก็บรวบรวมข้อมูล ควรอย่างยิ่งที่จะต้องดาเนินการอย่างสม่าเสมอและ
ต่อเนื่องในลักษณะของอนุกรมเวลา (time-series) เพื่อจะได้นาไปใช้ประโยชน์ในด้านการวิเคราะห์วิจัย
หรือหาแนวโน้มในอนาคต
- 4. ในการจัดการข้อมูลจะมีการแบ่งข้อมูลออกเป็นลาดับชั้นเพื่อง่ายต่อการเรียกใช้และประมวลผล
ลาดับชั้นข้อมูลพื้นฐานที่ควรทราบมีดังต่อไปนี้
บิต (Bit = Binary Digit)
เป็นลาดับชั้นของหน่วยข้อมูลที่เล็กที่สุด ดังที่ทราบกันดีแล้วว่าข้อมูลที่จะทางานร่วมกับคอมพิวเตอร์
ได้นั้น จะต้องเอามาแปลงให้อยู่ในรูปของเลขฐานสองเสียก่อนคอมพิวเตอร์จึงจะเข้าใจและทางานตามที่
ต้องการได้เมื่อแปลงแล้วจะได้ตัวเลขแทนสถานะเปิดและปิด ของสัญญาณไฟฟ้าที่เรียกว่า บิต เพียง 2 ค่า
เท่านั้นคือ บิต 0 และบิต 1
ไบต์ (Byte)
เมื่อนาบิตมารวมกันหลายๆบิต จะได้หน่วยข้อมูลกลุ่มใหม่ที่เรียกว่า ไบต์(Byte) ซึ่งจานวนของบิตที่
ได้นั้นแต่ละกลุ่มอาจมีมากหรือน้อยบ้าง ทั้งนี้ขึ้นอยู่กับชนิดของรหัสที่ใช้เก็บ แต่โดยปกติกับการใช้งาน
ในรหัสแอสกีทั่วไปจะได้กลุ่มของบิต 8 บิตด้วยกัน ซึ่งนิยมมาแทนเป็นรหัสของตัวอักษร บางครั้งจึงนิยม
เรียกข้อมูล 1 ไบต์ว่าเป็น 1 ตัวอักษร
ฟีลด์ หรือเขตของข้อมูล (Field)
ประกอบด้วยกลุ่มของตัวอักษรหรือไบต์ตั้งแต่ 1 ตัวขึ้นไปมาประกอบกันเป็นหน่วยข้อมูลที่ใหญ่ขึ้น
แล้วแสดงลักษณะหรือความหมายอย่างใดอย่างหนึ่ง ยกตัวอย่างเขตข้อมูลเกี่ยวกับพนักงาน เช่น รหัส
พนักงาน ชื่อ นามสกุล เงินเดือน ตาแหน่ง
- 5. Database (ฐานข้อมูล) เป็นกลุ่มของข้อมูล ที่มีการจัดการเพื่อทาให้เข้าถึง จัดการและ
ปรับปรุงได้ง่าย ประเภทของฐานข้อมูล ที่เด่นมาก คือ relational database ซึ่งฐานข้อมูลเก็บข้อมูลใน
แบบของตาราง ทาให้สามารถจัดการและเข้าถึงได้หลายวิธี distributed database เป็นฐานข้อมูลที่สามารถ
กระจายและ replicate ระหว่างจุดต่าง ๆ บนเครือข่าย object-oriented programming database หมายถึง
ข้อมูลที่กาหนดในอ๊อบเจค class และ subclass
Database เป็นที่เก็บรวบของเรคคอร์ดข้อมูล หรือไฟล์ เช่น รายการการขาย รายการ
ผลิตภัณฑ์คลังสินค้า หรือรายละเอียดของลูกค้า โดยปกติผู้จัดการฐานข้อมูลให้ผู้ใช้ สามารถควบคุมการ
อ่าน เขียน เข้าถึง ระบุการ การสร้างรายงาน และวิเคราะห์การใช้ ฐานข้อมูล และผู้จัดการฐานข้อมูล มี
บทบาทเด่นในระบบเมนเฟรม ระบบเวิร์กสเตชัน ระบบขนาดกลาง เช่น AS 400 และคอมพิวเตอร์ส่วน
บุคคล ภาษา Structured Query Language เป็นภาษามาตรฐาน สาหรับการสร้าง คิวรี่ ในปรับปรุง
ฐานข้อมูล เช่น IBM's DB2, Microsoft Access , Sybase และ Computer Associates
เป็นวิธีการจัดเก็บข้อมูลในคอมพิวเตอร์เพื่อให้สามารถใช้งานได้อย่างมีประสิทธิภาพการเลือก
โครงสร้างข้อมูลนั้นโดยส่วนใหญ่แล้วจะเริ่มต้นจากการเลือกประเภทข้อมูลอย่างย่อโครงสร้างข้อมูลที่
ออกแบบเป็นอย่างดีจะสามารถรองรับการประมวลผลที่หนักหน่วงโดยใช้ทรัพยากรที่น้อยที่สุดเท่าที่จะ
เป็นไปได้ทั้งในแง่ของเวลาและหน่วยความจา
โครงสร้างข้อมูลแต่ละแบบจะเหมาะสมกับงานที่แตกต่างกัน และโครงสร้างข้อมูลบางแบบก็
ออกแบบมาสาหรับบางงานโดยเฉพาะ
แนวความคิดในเรื่องโครงสร้างข้อมูลนี้ส่งผลกับการพัฒนาวิธีการมาตรฐานต่างๆในการ
ออกแบบและเขียนโปรแกรมหลายภาษาโปรแกรมนั้นได้พัฒนารวมเอาโครงสร้างข้อมูลนี้ไว้เป็นส่วน
หนึ่งของระบบโปรแกรม เพื่อประโยชน์ในการใช้ซ้า
แฟ้มข้อมูล” (file) หมายถึงข้อมูลสารสนเทศหรือข้อมูลทั้งหมดที่เก็บไว้ในสื่อที่มีคุณสมบัติ
เป็นแม่เหล็กไม่ว่าจะเป็นจานบันทึกธรรมดาหรือจานแข็ง (hard disk) ก็ตามข้อสนเทศที่นาไปเก็บนั้นจะ
ถูกนาไปเก็บไว้เป็นเรื่องๆ ไป อาจจะเป็นโปรแกรมข้อมูล หรือภาพ (graphics) ก็ได้แต่ละเรื่องต่างก็ต้อง
มีชื่อเป็นของตนเองที่ต้องไม่ซ้ากัน
- 6. โดยปกติแฟ้มข้อมูลจะถูกเก็บไว้ในหน่วยความจาสารอง (secondary storage) เช่น ฮาร์ดดิสก์
เนื่องจากมีความจุข้อมูลสูงและสามารถเก็บได้ถาวรแม้จะปิดเครื่องไปซึ่งการจัดเก็บนี้จะต้องมีวิธีกาหนด
โครงสร้างโดยมีวัตถุประสงค์เพื่อให้การจัดเก็บและเข้าถึงข้อมูลมีความรวดเร็ว ถูกต้องและเหมาะสมกับ
ความต้องการการเข้าถึงและค้นคืนข้อมูลจะอาศัยคีย์ฟิลด์ในการเรียกค้นด้วยเสมอการจัดโครงสร้างของ
แฟ้มข้อมูลอาจจะแบ่งได้เป็นลักษณะดังนี้
การจัดการโครงสร้างแฟ้มข้อมูลมีปัจจัยที่ต้องพิจารณาในการเลือกโครงสร้าง ได้แก่ ปริมาณ
ข้อมูล ความถี่ในการดึงข้อมูล ความถี่ในการปรับปรุงข้อมูล จานวนครั้งที่อ่านข้อมูลจากหน่วยความจา
สากรองต่อการดึงข้อมูล
การจัดโครงสร้างข้อมูลแบบต่างๆ
1. แฟ้มลาดับ (sequential file)
2. แฟ้มสุ่ม ( direct file หรือ hash file)
3. แฟ้มลาดับดรรชนี (indexed sequential file)
เป็นโครงสร้างของแฟ้มข้อมูลชนิดพื้นฐานที่สามารถใช้งานได้ง่ายที่สุดเนื่องจากมีลักษณะการ
จัดเก็บข้อมูลแบบเรียงลาดับเรคคอร์ดต่อเนื่องกันไปเรื่อยๆการอ่านหรือค้นคืนข้อมูลจะข้ามลาดับไปอ่าน
ตรงตาแหน่งใดๆที่ต้องการโดยตรงไม่ได้เมื่อต้องการอ่านข้อมูลที่เรคคอร์ดใดๆโปรแกรมจะเริ่มอ่าน
ตั้งแต่เรคคอร์ดแรกไปเรื่อยๆจนกว่าจะพบเรคคอร์ดที่ต้องการ ก็จะเรียกค้นคืนเรคคอร์ดนั้นขึ้นมา
การใช้ข้อมูลเรียงลาดับนี้จึงเหมาะสมกับงานประมวลผลที่มีการอ่านข้อมูลต่อเนื่องกันไปเรื่อยๆ
ตามลาดับและปริมาณครั้งละมากๆ
แฟ้มข้อมูลแบบนี้ถ้าเป็นเครื่องคอมพิวเตอร์ระดับเมนเฟรมขนาดใหญ่ก็จะจัดเก็บอยู่ในอุปกรณ์
ประเภทเทปแม่เหล็ก (magnetic tape) ซึ่งมีการเข้าถึงแบบลาดับ (Sequential access) เวลาอ่านข้อมูลก็
ต้องเป็นไปตามลาดับด้วยคล้ายกับการเก็บข้อมูลเพลงลงบนเทปคาสเซ็ต
- 8. โครงสร้างแฟ้ ม ข้อดี ข้อเสีย สื่อที่ใช้เก็บ
1. แบบเรียงลาดับ - เสียค่าใช้จ่ายน้อยและใช้
งานได้ง่ายกว่าวิธีอื่นๆ
- เหมาะกับงานประมวลผล
ที่มีการอ่านข้อมูลแบบ
เรียงลาดับและในปริมาณ
มาก
- สื่อที่ใช้เก็บเป็นเทปซึ่งมี
ราคาถูก
- การทางานเพื่อค้นหา
ข้อมูลจะต้องเริ่มทาตั้งแต่
ต้นไฟล์เรียงลาดับไป
เรื่อย จนกว่าจะหาข้อมูล
นั้นเจอ ทาให้เสียเวลา
ค่อนข้างมาก
- ข้อมูลที่ใช้ต้องมีการจัด
เรียงลาดับก่อนเสมอ
- ไม่เหมาะกับงานที่ต้อง
แก้ไข เพิ่ม ลบข้อมูลเป็น
ประจา เช่นงานธุรกรรม
ออนไลน์
เทปแม่เหล็กเช่น เทปคาส
เซ็ต
2. แบบสุ่ม - สามารถทางานได้
เร็ว เพราะมีการเข้าถึง
ข้อมูลเรคคอร์ดแบบเร็ว
มาก เพราะไม่ต้อง
เรียงลาดับข้อมูลก่อนเก็บ
ลงไฟล์
- เหมาะสมกับการใช้งาน
ธุรกรรมออนไลน์ หรืองาน
ที่ต้องการแก้ไข เพิ่ม ลบ
รากการเป็นประจา
- ไม่เหมาะกับงาน
ประมวลผลที่อ่านข้อมูลใน
ปริมาณมาก
- การเขียนโปรแกรมเพื่อ
ค้นหาข้อมูลจะซับซ้อน
- ไม่สามารถเข้าถึงข้อมูล
แบบเรียงลาดับได้
จานแม่เหล็กเช่นดิสเก็ตต์
, ฮาร์ดดิสก์หรือ CD-
ROM
3. แบบลาดับเชิง
ดรรชนี
- สามารถรองรับการ
ประมวลผลได้ทั้ง2 แบบ
คือ แบบลาดับและแบบสุ่ม
- เหมาะกับงานธุรกรรม
ออนไลน์ ด้วยเช่นเดียวกัน
- สิ้นเปลืองเนื้อที่ในการ
จัดเก็บดรรชนีที่ใช้อ้างอิง
ถึงตาแหน่งของข้อมูล
- การเขียนโปรแกรมเพื่อ
ค้นหาข้อมูลจะซับซ้อน
- การทางานช้ากว่าแบบ
สุ่ม และมีค่าใช้จ่ายสูง
จานแม่เหล็ก เช่น
ดิสเก็ตต์, ฮาร์ดดิสก์
หรือ CD-ROM
- 9. สามารถจาแนกแฟ้มข้อมูลออกตามลักษณะของข้อมูลที่เก็บบันทึกไว้2 ประเภท คือ
1. แฟ้ มข้อมูลหลัก (Master File) เป็นแฟ้มข้อมูลซึ่งเก็บข้อมูลที่สาคัญ เช่น แฟ้มข้อมูลประวัติ ลูกค้า
(Customer master file) ตามที่กล่าวไว้ข้างต้น แฟ้มข้อมูลประวัติผู้จัดส่งสินค้า (Supplier master file)
แฟ้มข้อมูลสินค้าคงเหลือ (Inventory master file) แฟ้มข้อมูลบัญชี (Account master file) เป็นต้น ซึ่ง
แฟ้มข้อมูลหลักเหล่านี้เป็นส่วนประกอบของระบบงานบัญชี (Account system)
2. แฟ้ มรายการเปลี่ยนแปลง(Transaction file) เป็นแฟ้มที่บันทึกข้อมูลเกี่ยวกับแฟ้มข้อมูลหลักที่มีการ
เปลี่ยนแปลงในแต่ละวัน รายการที่เกิดขึ้นต้องนาไปปรับปรุงกับแฟ้มข้อมูลหลักเพื่อให้แฟ้มข้อมูลหลักมี
ข้อมูลที่ทันสมัยอยู่ตลอดเวลา
- 10. ในสมัยก่อนนั้น การเก็บรวบรวมข ้อมูล เพื่อการนากลับมาใช ้บนระบบคอมพิวเตอร์ จะอยู่ในรูป
ของแฟ้มข ้อมูลทั้งสิ้น แต่เมื่อโลกมีการ พัฒนามากขึ้น ข ้อมูลที่ต ้องจัดเก็บมีอยู่มากมาย การใช ้
แต่เพียงแฟ้มข ้อมูลเท่านั้น ไม่เพียงพอ ที่จะสนับสนุนให ้ทางานได ้อย่างมีประสิทธิภาพอีกต่อไป
จึงทาให ้มีการนาเสนอแนวความคิดระบบฐานข ้อมูลขึ้น เพื่อจัดการงานที่เกี่ยวข ้องกับข ้อมูล ให ้มี
ประสิทธิภาพสูงสุดเท่าที่จะทาได ้ข ้อแตกต่าง ระหว่างแฟ้มข ้อมูลกับฐานข ้อมูลคือ
๑. ฐานข้อมูลมีส่วนการบรรยายโครงสร้างข้อมูลแยกจากฐานข้อมูล
กล่าวคือ ในระบบฐานข ้อมูลนั้น มีส่วนที่เรียกว่า แค็ตตาล็อก (catalog) หรือพจนานุกรมข ้อมูล
(Data Dictionary) ซึ่งเก็บรายละเอียดทั้งหมด ที่เกี่ยวข ้องกับโครงสร ้างของข ้อมูลใน
ฐานข ้อมูลไว ้เช่น ชนิดและรูปแบบของข ้อมูล ในฐานข ้อมูล และข ้อจากัดต่างๆ ที่มีต่อข ้อมูลแต่
ละส่วน เป็ นต ้น ในขณะที่แฟ้มข ้อมูล จะเก็บรายละเอียดเหล่านี้ไว ้ในส่วนของโปรแกรม
คอมพิวเตอร์ที่ใช ้งานด ้วยกันเลย ซึ่งอาจกระจัดกระจายไปอยู่ตามส่วนต่างๆ จึงทาให ้ไม่สะดวก
ต่อการใช ้และปรับปรุงงาน
- 11. ๒. โปรแกรมคอมพิวเตอร์และข้อมูลแยกกันโดยเด็ดขาดในระบบฐานข้อมูล
นั่นคือ ส่วนของโปรแกรมคอมพิวเตอร์ที่ใช ้จัดการข ้อมูล จะถูกพัฒนาออกมา ซึ่งเรียกกันว่า
ระบบจัดการฐานข ้อมูล ส่วนข ้อมูล ก็จะแยกอยู่ในส่วนของฐานข ้อมูล ซึ่งการแยกนี้ เป็นการซ่อน
รายละเอียดของการจัดการข ้อมูลไว ้จากตัวข ้อมูล เพื่อผู้ใช ้จะได ้ไม่ต ้องยุ่งยากกับรายละเอียด
ของการจัดเก็บข ้อมูล โดยให ้ซอฟต์แวร์จัดการฐานข ้อมูล เป็นเครื่องมือจัดการให ้แทน ซึ่ง
แตกต่างจากระบบแฟ้มข ้อมูล ที่จะรวมส่วนของโปรแกรม และข ้อมูลไว ้ด ้วยกัน ผลเสียก็คือ เมื่อ
มีการเปลี่ยนแปลงโครงสร ้างของข ้อมูล ส่วนของโปรแกรม ก็จะต ้องปรับตามไปด ้วย มิฉะนั้น
แฟ้มข ้อมูลดังกล่าว ก็จะไม่สามารถนามาใช ้งานได ้อีก
๓. ฐานข้อมูลสนับสนุนการใช้งานของข้อมูลในหลายๆ รูปแบบ
ผู้ใช ้คนหนึ่งอาจจะต ้องการรายงาน หรือข ้อสรุปของข ้อมูลชุดหนึ่ง ในหลายๆ รูปแบบ ทั้งแบบ
ตาราง แบบกราฟ และแบบบทความ ซึ่งในส่วนนี้ ระบบจัดการฐานข ้อมูล จะเป็นผู้ดูแลให ้แก่
ผู้ใช ้ส่วนในแนวคิดแบบแฟ้มข ้อมูลนั้น เมื่อผู้ใช ้ต ้องการรายงานแบบใหม่ ผู้ใช ้จะต ้องเขียน
โปรแกรมขึ้นมาใหม่ เพื่อ ให ้ได ้งานอย่างที่ต ้องการ ซึ่งค่อนข ้างยุ่งยาก และเสียเวลาในการใช ้
งานอย่างมาก
๔. การใช้ข้อมูลร่วมกัน และการประมวลผลการเปลี่ยนแปลงรายการ แบบหลายผู้ใช้
(multiuser transaction processing)
ระบบจัดการฐานข ้อมูล สาหรับผู้ใช ้หลายๆ คนพร ้อมกัน ต ้องมีการอนุญาตให ้ผู้ใช ้เข ้าถึงข ้อมูล
ในเวลาเดียวกันได ้โดยที่ระบบจะต ้องจัดการข ้อมูลให ้แก่ผู้ใช ้แต่ละคนอย่างถูกต ้องด ้วย
ถึงแม ้ว่าผู้ใช ้เหล่านั้น จะเรียกใช ้ข ้อมูลเดียวกัน ณ เวลาเดียวกัน ในระบบจัดการฐานข ้อมูล
จะต ้องมีส่วนควบคุมการทางานแบบพร ้อมกัน (Concurrency Control) ซึ่งในการทางานแบบ
แฟ้มข ้อมูล จะไม่มีส่วนจัดการในเรื่องนี้
- 12. นิยามและแนวความคิดเบื้องต้น
ปัจจุบันความต ้องการข ้อมูล สารถสนเทศมีมากขึ้น รวมทั้งโครงสร ้าง
ข ้อมูล/สารสนเทศมีความซับซ ้อนมากขึ้นด ้วย จึงจาเป็นต ้องนาระบบ
คอมพิวเตอร์เข ้ามาช่วยในการจัดการ สมองของมนุษย์ไม่อาจจดจาทุก
สิ่งทุกอย่างที่สนใจได ้ทั้งหมด จึงมักบันทึกไว ้ในสมุดหรือกระดาษ ฯลฯ
รวบรวมเป็น “แฟ้มข ้อมูล” การใช ้แฟ้มข ้อมูลให ้มีประสิทธิภาพสูงสุด
จาเป็นต ้องศึกษาถึง วิธีการจัดระเบียบแฟ้มข ้อมูล (File Organization)
และปฏิบัติการแฟ้มข ้อมูล (File Operation) นักออกแบบที่ดีควรเลือก
ระเบียบแฟ้มข ้อมูลให ้เหมาะสมกับงาน เพื่อลดจานวนครั้งในการเข ้าถึง
ข ้อมูลที่เก็บในอุปกรณ์บันทึกข ้อมูล
ลักษณะของระบบสารสนเทศ
1. เป็นปัจจุบัน (Current)
2. ทันเวลา (Timely)
3. มีค่าเที่ยงตรง
4. มีความคงที่ (Relevant)
5. นาเสนอรูปแบบที่มีประโยชน์ (Presented in Usable Form)
- 13. แนวความคิดพื้นฐานเกี่ยวกับการประมวลข้อมูล
1. โครงสร ้างแฟ้มข ้อมูล
1.1 ข ้อมูลในมุมมองของผู ้ใช ้เป็นหน่วยที่เล็กที่สุดของ
ข ้อมูลที่มีความหมายต่อผู ้ใช ้คือ เขตข ้อมูล(Field) ถือว่าเป็นหน่วย
พื้นฐานของข ้อมูล ประกอบด ้วยตัวอักขระตั้งแต่ 1 ตัวขึ้นไปมารวมกันให ้
เกิดความหมายขึ้นมาใช ้แทนข ้อมูลต่างๆ เมื่อรวมเขตข ้อมูลต่างๆ ที่
สัมพันธ์กัน จะเรียกชุดของเขตข ้อมูลที่ถูกรวมนั้นว่า
“ระเบียน” (Record) การนาระเบียนต่างๆ ข ้างต ้นมารวมกัน จะเรียกกลุ่ม
ของระเบียนนั้นว่า “แฟ้มข ้อมูล (File)”เมื่อนาแฟ้มข ้อมูลตั้งแต่ 2 แฟ้ม
ขึ้นไป ที่มีความหมายสัมพันธ์เชิงตรรกะระหว่างแฟ้มข ้อมูลมารวมกัน จะ
เรียกกลุ่มของแฟ้มข ้อมูลนั้นว่า “ฐานข ้อมูล (Database)”
1.2 การจัดการข ้อมูลโดยคอมพิวเตอร์
1.3 ข ้อมูลในระบบคอมพิวเตอร์ หน่วยที่เล็กที่สุดของข ้อมูล
คือ บิต (Bit) ย่อมาจาก Binary Digitเนื่องด ้วยเลขฐานสองไม่เพียงพอ
กับการแทนข ้อมูลจานวนมากได ้จึงรวมหลายๆ บิตเข ้าเป็นกลุ่มเพื่อใช ้
แทนอักขระ 1 ตัว
- 14. 2. ระเบียนข ้อมูล (Record)
2.1 ระเบียนเชิงตรรกะ (Logical Record) คือ ระเบียนใน
ทัศนะของผู ้ใช ้ทั่วไป ประกอบด ้วยเขตข ้อมูลที่สัมพันธ์กันเชิงตรรกะซึ่ง
กันและกัน โดยไม่คานึงว่าจะจัดเก็บไว ้ที่ใดในอุปกรณ์บันทึกข ้อมูล
2.2 ระเบียนเชิงกายภาพ (Physical Record) คือ ระเบียนใน
ทัศนะของคอมพิวเตอร์ โดยพิจารณาจากการอ่านบันทึกข ้อมูลลงสื่อ
บันทึกแต่ละครั้ง ซึ่งการอ่านหรือบันทึกแต่ละครั้งถือว่าเป็น 1 หน่วยของ
สื่อบันทึกข ้อมูล ในการนาระเบียนข ้อมูลเชิงตรระมาจัดเก็บลงสื่อบันทึก
ข ้อมูล ซึ่งระเบียนดังกล่าวจะต ้องถูกจัดให ้อยู่ในระเบียนเชิงกายภาพ
ดังนั้นจะทาให ้เกิดระเบียนแบบต่าง คือ ระเบียนแบบ Unblock ระบียน
แบบ Blockและระบียนแบบ Spanned Record
3. การแบ่งประเภทระเบียนเชิงตรรกะในแฟ้มข ้อมูลตามความยาว
ของระเบียน สามารถแบ่งประเภทความยาวได ้ดังนี้
3.1 ระเบียนยาวคงที่ เป็นระเบียนที่ประกอบด ้วยเขตข ้อมูลแบบ
เดียวกันตลอดแฟ้ม
3.2 ระเบียนยาวแปรผัน ขนาดความยาวของระเบียนไม่คงที่
4. เขตข ้อมูล (Fields) ในระเบียนหนึ่งมักประกอบด ้วยเขตข ้อมูล 2
ประเภท คือ
4.1 เขตข ้อมูลหลัก คือ เขตข ้อมูลที่ใช ้สาหรับอ ้างอิง จาแนก หรือ
บอกตาแหน่งที่เก็บระเบียนข ้อมูล
4.2 เขตข ้อมูลทั่วไป คือ เขตข ้อมูลที่ไม่ใช ้ทั้ง PK และ SK ไม่ได ้
ใช ้ในการอ ้างอิงหรือค ้นหาข ้อมูล
5. การแยกประเภทแฟ้มข ้อมูล
5.1 แยกตามประเภทแฟ้มข ้อมูลตามเนื้อหา
5.2 แยกประเภทแฟ้มข ้อมูลตามวิธีการประมวลผล
6. การปฏิบัติการแฟ้มข ้อมูล หลักสาคัญในการปฏิบัติการแฟ้มข ้อมูล/
ประมวลผลข ้อมูล คือ จะต ้องมีการอ่านค่าของข ้อมูลในแต่ละเขตข ้อมูล
ที่ต ้องการมาใช ้ประโยชน์เข ้ามาแล ้วปรับเปลี่ยน คานวณ นาเสนอใน
รูปแบบที่ผู้ใช ้ต ้องการ
- 15. 7. การจัดระเบียบแฟ้มข ้อมูล การจัดระเบียบแฟ้มข ้อมูล คือ การ
ตระเตรียมเส ้นทางเข ้าถึงระเบียนระหว่างปฏิบัติการเรียกใช ้ และปรับปรุง
ข ้อมูล ทั้งนี้ ระเบียบแฟ้มข ้อมูลที่ต่างชนิดกัน ก็จะให ้เส ้นทางเข ้าถึง
ข ้อมูลที่แตกต่างกัน
ปัญหาการใช้ข้อมูล/ฐานข้อมูลภายในองค์กร
1. มีความซ้าซ ้อนกันในการเก็บข ้อมูล
2. มีการให ้คาจากัดความของข ้อมูลแต่ละตัวไม่ตรงกัน
3. มีการจัดการ หรือใช ้วิธีการประมวลผลของข ้อมูลแตกต่างกัน
ออกไป
4. มีการพัฒนาการใช ้ข ้อมูลไม่เป็นระบบ แต่ละหน่วยงาน
จัดทาหรือใช ้กันอย่างไม่มีกฎเกณฑ์
ระบบฐานข้อมูล
คือ ระบบจัดเก็บข้อมูลด้วยคอมพิวเตอร์โดยมีวัตถุประสงค์เพื่อบารุงรักษาข้อสนเทศ (Maintain
information) และสามารถนาข้อสนเทศเหล่านั้นมาใช้ได้ทุกเมื่อที่ต้องการ
ระบบฐานข้อมูลประกอบส่วนประกอบหลัก4 ส่วนได้แก่
1. ข้อมูล (Data) ข้อมูลในฐานข้อมูลจะต้องมีคุณสมบัติ 2 ประการ คือ
เบ็ดเสร็จ (Integrate) ฐานข้อมูลเป็นแหล่งรวบรวมข้อมูลจากแฟ้มต่าง ๆ ไว้ครบถ้วนสมบูรณ์
เพื่อลดข้อมูลซ้าซ้อนระหว่างแฟ้ม
ใช้ร่วมกันได้ (Share) ข้อมูลแต่ละชิ้นในฐานข้อมูลสามารถนามาแบ่งใช้กันได้ระหว่างผู้ใช้ต่าง
ๆ ในระบบ
2. ฮาร์ดแวร์ (Hardware) ประกอบด้วย อุปกรณ์บันทึกข้อมูลเช่น จานแม่เหล็ก , I/O device ,
Device controller , I/O channels , หน่วย
- 16. 3. ซอฟต์แวร์ (Software) ตัวกลางเชื่อมระหว่างฐานข้อมูลและผู้ใช้คือ DBMS เป็น
ซอฟต์แวร์ที่สาคัญที่สุดของระบบฐานข้อมูล นอกจากนี้ยังมี Utility , Application
Development tool , Design aids , Report writers , etc.
ประมวลผล และหน่วยความจาหลัก
4. ผู้ใช้ (Users) มี 3 กลุ่มใหญ่ ๆ คือ
Application Programmer เขียนโปรแกรมประยุกต์
End Users ผู้ใช้ที่อยู่กับ Online terminal เข้าถึงข้อมูลโดยผ่านโปรแกรม
ประยุกต์ หรือผ่านภาษาเรียกค้น (Query Language)
Data Administrator & Database Administrator
DA ผู้บริหารอาวุโส เป็นผู้ตัดสินใจว่าจะเก็บข้อมูลใดในฐานข้อมูลก่อน และกาหนดนโยบาย
การรักษาความปลอดภัยของข้อมูล
DBA ผู้เชี่ยวชาญระดับมืออาชีพ เป็นผู้สร้างฐานข้อมูลและนามาใช้งานจริง โดยควบคุม
ทางด้านเทคนิคที่จาเป็นในการดาเนินนโยบายที่กาหนดโดย DA
ข้อดีของการใช้ฐานข้อมูล
ความกระทัดรัด (Compactness) ไม่ต้องมีที่ซ้าซ้อนจานวนมาก
ความเร็ว (Speed) เรียกใช้ข้อมูลได้รวดเร็วขึ้น
ความน่าเบื่อหน่ายลดลง (Less drudgery) ความยุ่งยากลดลง และความน่าเบื่อหน่ายลดลง
- 17. ความสามารถโดยทั่วไปของระบบการจัดการฐานข ้อมูล
1.แปลงคาสั่งที่ใช้จัดการกับข้อมูลภายในฐานข้อมูล ให้อยู่ในรูปแบบที่ฐานข้อมูลเข้าใจ
2.นาคาสั่งต่าง ๆ ซึ่งได้รับการแปลแล้ว ไปสั่งให้ฐานข้อมูลทางาน เช่น การเรียกใช้(Retrieve)
จัดเก็บ (Update) ลบ (Delete) เพิ่มข้อมูล (Add) เป็นต้น
3.ป้องกันความเสียหายที่จะเกิดขึ้นกับข้อมูลภายในฐานข้อมูล โดยจะคอยตรวจสอบว่าคาสั่งใดที่
สามารถทางานได้และคาสั่งใดที่ไม่สามารถทางานได้
4.รักษาความสัมพันธ์ของข้อมูลภายในฐานข้อมูลให้มีความถูกต้องอยู่เสมอ
5.เก็บรายละเอียดต่างๆ ที่เกี่ยวข้องกับข้อมูลภายในฐานข้อมูลไว้ในพจนานุกรมข้อมูล (Data
Dictionary) ซึ่งรายละเอียดเหล่านี้มักจะถูกเรียกว่า เมทาเดตา (MetaData) ซึ่งหมายถึง
"ข้อมูลของข้อมูล"
6.ควบคุมให้ฐานข้อมูลทางานได้อย่างถูกต้องและมีประสิทธิภาพ
7.ควบคุมสถานะภาพของคอมพิวเตอร์ในการแปลสถาพฐานข้อมูล ส.ท