SlideShare a Scribd company logo
1 of 17
Download to read offline
ข้อมูล ( Data) คือ ข้อเท็จจริงที่เกิดขึ้น ข้อมูลอาจจะอยู่ในรูปของข้อความหรือตัวเลข ซึ่งข้อความหรือ
ตัวเลขเหล่านี้อาจเป็นเรื่องที่เกี่ยวข้องกับ คน พืช สัตว์และสิ่งของ เช่น ปริมาณข้าวที่ประเทศไทยผลิตได้
ในในปี 2545 เป็นข้อมูลที่เป็นตัวเลข หรือความคิดเห็นของประชาชนเกี่ยวกับการเลือกตั้ง เป็นข้อมูลที่อยู่
ในรูปข้อความ เป็นต้น
ตัวแปร ( Variable) คือ ข้อมูลที่ได้จากสังเกต วัด สอบถามจากหน่วยที่ศึกษา โดยที่หน่วยที่ศึกษาอาจเป็น
คน สัตว์พืช และสิ่งของ เมื่อหน่วยศึกษาแตกต่างกัน ข้อมูลที่ได้จึงแตกต่างกัน จึงเรียกข้อมูลที่แตกต่าง
กันนั้นว่า ตัวแปร เช่น รายได้ของคนในจังหวัดสงขลา ในที่นี่หน่วยที่ศึกษา คือ คนในจังหวัดสงขลา แต่
ละคนจะแตกต่างกันออกไป ดังนั้นตัวแปร คือ รายได้ของคนในจังหวัดสงขลา ซึ่งมีค่าที่แตกต่างกัน ค่า
ของตัวแปร คือ ข้อมูลนั่นเอง
แต่ละคน ปริมาณน้าฝนที่วัดได้ข้อมูลที่ได้จะมีลักษณะเป็นเศษส่วน หรือจุดทศนิยม บางครั้ง เรียกว่า
ข้อมูลแบบต่อเนื่อง
นาข้อมูลดิบมารวบรวมเป็นกลุ่มเป็นหมวดหมู่
แหล่งข้อมูล หมายถึง สถานที่หรือแหล่งที่เกิดข้อมูล แหล่งข้อมูลจะแตกต่างกันไปตามข้อมูลที่
ต้องการ เช่น บ้านเป็นแหล่งข้อมูลที่เกี่ยวกับนักเรียน โดยบันทึก ข้อมูลไว้ในทะเบียนบ้าน
ห้องสมุด เป็นแหล่งข้อมูลเกี่ยวกับความรู้ต่าง ๆ ข้อมูลบางอย่างเราอาจจะนามาจากแหล่งข้อมูล
หลายแหล่งได้เช่นราคาของเล่นชนิดเดียวกัน เราอาจจะหาข้อมูลจากแหล่งข้อมูลซึ่งได้แก่ร้านค้า
หลายร้านได้และข้อมูลหรือราคาที่ได้อาจจะแตกต่างกันไป หนังสือพิมพ์เป็นแหล่งข้อมูลที่มีทั้ง
ข้อความ ตัวเลข รูปภาพ
โดยปกติแล้ว ข้อมูลสาหรับการนามาประมวลผลด้วยคอมพิวเตอร์นั้นจะได้มาจากแหล่งที่มา 2 ประเภท
ด้วยกัน คือ
1. แหล่งข้อมูลภายใน เป็นแหล่งข้อมูลที่อยู่ภายในองค์กรทั่วไป ข้อมูลที่ได้นั้นอาจมาจากพนักงานหรือมี
อยู่แล้วในองค์กร เช่น ยอดขายประจาปี ข้อมูลผู้ถือหุ้น รายงานกาไรขาดทุน ข้อมูลเหล่านี้จะให้ข้อมูลที่
เกี่ยวข้องกับข้อเท็จจริงต่างๆภายในองค์กรแต่เพียงอย่างเดียว อาจเป็นข้อมูลที่เปิดเผยให้กับบุคคลภายนอก
ทราบหรือไม่ก็ได้หากข้อมูลนั้นเป็นข้อมูลที่เกี่ยวข้องกับการดาเนินงานหลักขององค์กรและมีความสาคัญมาก
เช่น ข้อมูลผลิตภัณฑ์ที่จะออกสู่ตลาดใหม่ ข้อมูลการทดลองการแปรรูปสินค้า หน่วยงานนั้นอาจมีการปกปิด
ไว้เพื่อป้องกันการรั่วไหลของข้อมูลได้
2. แหล่งข้อมูลภายนอก เป็นแหล่งข้อมูลที่อยู่ภายนอกองค์กร โดยทั่วไปแล้วสามารถนาข้อมูลต่างๆ
เหล่านั้นมาใช้ประโยชน์ในองค์กรหรือนามาใช้กับการประมวลผลด้วยคอมพิวเตอร์ เพื่อให้ได้ระบบงานที่
สมบูรณ์ขึ้นได้เช่น ข้อมูลลูกค้า เจ้าหนี้ อัตราดอกเบี้ยสถาบันการเงิน กฎหมายและอัตราภาษีของรัฐบาล หรือ
อาจรวมถึงข้อมูลบริษัทคู่แข่งด้วย สามารถหาข้อมูลจากแหล่งภายนอกได้จากบริษัทผู้ให้บริการข้อมูลหรือจาก
หนังสือพิมพ์วิทยุโทรทัศน์ หรือสื่ออื่นๆได้
ข้อมูลที่ดีจะต้องประกอบด้วยคุณสมบัติที่สาคัญๆ ดังนี้คือ
1. ความถูกต้องแม่นยา (accuracy) ข้อมูลที่ดีควรจะมีความถูกต้องแม่นยาสูง หรือถ้ามีความคลาดเคลื่อน
(errors) ปนอยู่บ้าง ก็ควรที่จะสามารถควบคุมขนาดของความคลาดเคลื่อนที่ปนมาให้มีความคลาดเคลื่อน
น้อยที่สุด
2. ความทันเวลา (timeliness) เป็นข้อมูลที่ทันสมัย (up to date) และทันต่อความต้องการของ ผู้ใช้ถ้าผลิต
ข้อมูลออกมาช้า ก็ไม่มีคุณค่าถึงแม้จะเป็นข้อมูลที่ถูกต้องแม่นยาก็ตาม
3. ความสมบูรณ์ครบถ้วน (completeness) ข้อมูลที่เก็บรวบรวมมาต้องเป็นข้อมูลที่ให้ข้อเท็จจริง (facts)
หรือข่าวสาร (information) ที่ครบถ้วนทุกด้านทุกประการ มิใช่ขาดส่วนหนึ่งส่วนใดไปทาให้นาไปใช้
การไม่ได้
4. ความกระทัดรัด (conciseness) ข้อมูลที่ได้รับส่วนใหญ่จะกระจัดกระจาย ควรจัดข้อมูลให้อยู่ใน
รูปแบบที่กระทัดรัดไม่เยิ่นเย้อ สะดวกต่อการใช้และค้นหา ผู้ใช้มีความเข้าใจได้ทันที
5. ความตรงกับความต้องการของผู้ใช้ (relevance) ข้อมูลที่จัดทาขึ้นมาควรเป็นข้อมูลที่ผู้ใช้ข้อมูล
ต้องการใช้ และจาเป็นต้องรู้ / ทราบ หรือเป็นประโยชน์ต่อการจัดทาแผน กาหนดนโยบายหรือตัดสิน
ปัญหาในเรื่องนั้นๆ ไม่ใช่เป็นข้อมูลที่จัดทาขึ้นมาอย่างมากมาย แต่ไม่มีใครต้องการใช้หรือไม่ตรงกับ
ความต้องการของผู้ใช้ข้อมูล
6. ความต่อเนื่อง (continuity) การเก็บรวบรวมข้อมูล ควรอย่างยิ่งที่จะต้องดาเนินการอย่างสม่าเสมอและ
ต่อเนื่องในลักษณะของอนุกรมเวลา (time-series) เพื่อจะได้นาไปใช้ประโยชน์ในด้านการวิเคราะห์วิจัย
หรือหาแนวโน้มในอนาคต
ในการจัดการข้อมูลจะมีการแบ่งข้อมูลออกเป็นลาดับชั้นเพื่อง่ายต่อการเรียกใช้และประมวลผล
ลาดับชั้นข้อมูลพื้นฐานที่ควรทราบมีดังต่อไปนี้
บิต (Bit = Binary Digit)
เป็นลาดับชั้นของหน่วยข้อมูลที่เล็กที่สุด ดังที่ทราบกันดีแล้วว่าข้อมูลที่จะทางานร่วมกับคอมพิวเตอร์
ได้นั้น จะต้องเอามาแปลงให้อยู่ในรูปของเลขฐานสองเสียก่อนคอมพิวเตอร์จึงจะเข้าใจและทางานตามที่
ต้องการได้เมื่อแปลงแล้วจะได้ตัวเลขแทนสถานะเปิดและปิด ของสัญญาณไฟฟ้าที่เรียกว่า บิต เพียง 2 ค่า
เท่านั้นคือ บิต 0 และบิต 1
ไบต์ (Byte)
เมื่อนาบิตมารวมกันหลายๆบิต จะได้หน่วยข้อมูลกลุ่มใหม่ที่เรียกว่า ไบต์(Byte) ซึ่งจานวนของบิตที่
ได้นั้นแต่ละกลุ่มอาจมีมากหรือน้อยบ้าง ทั้งนี้ขึ้นอยู่กับชนิดของรหัสที่ใช้เก็บ แต่โดยปกติกับการใช้งาน
ในรหัสแอสกีทั่วไปจะได้กลุ่มของบิต 8 บิตด้วยกัน ซึ่งนิยมมาแทนเป็นรหัสของตัวอักษร บางครั้งจึงนิยม
เรียกข้อมูล 1 ไบต์ว่าเป็น 1 ตัวอักษร
ฟีลด์ หรือเขตของข้อมูล (Field)
ประกอบด้วยกลุ่มของตัวอักษรหรือไบต์ตั้งแต่ 1 ตัวขึ้นไปมาประกอบกันเป็นหน่วยข้อมูลที่ใหญ่ขึ้น
แล้วแสดงลักษณะหรือความหมายอย่างใดอย่างหนึ่ง ยกตัวอย่างเขตข้อมูลเกี่ยวกับพนักงาน เช่น รหัส
พนักงาน ชื่อ นามสกุล เงินเดือน ตาแหน่ง
Database (ฐานข้อมูล) เป็นกลุ่มของข้อมูล ที่มีการจัดการเพื่อทาให้เข้าถึง จัดการและ
ปรับปรุงได้ง่าย ประเภทของฐานข้อมูล ที่เด่นมาก คือ relational database ซึ่งฐานข้อมูลเก็บข้อมูลใน
แบบของตาราง ทาให้สามารถจัดการและเข้าถึงได้หลายวิธี distributed database เป็นฐานข้อมูลที่สามารถ
กระจายและ replicate ระหว่างจุดต่าง ๆ บนเครือข่าย object-oriented programming database หมายถึง
ข้อมูลที่กาหนดในอ๊อบเจค class และ subclass
Database เป็นที่เก็บรวบของเรคคอร์ดข้อมูล หรือไฟล์ เช่น รายการการขาย รายการ
ผลิตภัณฑ์คลังสินค้า หรือรายละเอียดของลูกค้า โดยปกติผู้จัดการฐานข้อมูลให้ผู้ใช้ สามารถควบคุมการ
อ่าน เขียน เข้าถึง ระบุการ การสร้างรายงาน และวิเคราะห์การใช้ ฐานข้อมูล และผู้จัดการฐานข้อมูล มี
บทบาทเด่นในระบบเมนเฟรม ระบบเวิร์กสเตชัน ระบบขนาดกลาง เช่น AS 400 และคอมพิวเตอร์ส่วน
บุคคล ภาษา Structured Query Language เป็นภาษามาตรฐาน สาหรับการสร้าง คิวรี่ ในปรับปรุง
ฐานข้อมูล เช่น IBM's DB2, Microsoft Access , Sybase และ Computer Associates
เป็นวิธีการจัดเก็บข้อมูลในคอมพิวเตอร์เพื่อให้สามารถใช้งานได้อย่างมีประสิทธิภาพการเลือก
โครงสร้างข้อมูลนั้นโดยส่วนใหญ่แล้วจะเริ่มต้นจากการเลือกประเภทข้อมูลอย่างย่อโครงสร้างข้อมูลที่
ออกแบบเป็นอย่างดีจะสามารถรองรับการประมวลผลที่หนักหน่วงโดยใช้ทรัพยากรที่น้อยที่สุดเท่าที่จะ
เป็นไปได้ทั้งในแง่ของเวลาและหน่วยความจา
โครงสร้างข้อมูลแต่ละแบบจะเหมาะสมกับงานที่แตกต่างกัน และโครงสร้างข้อมูลบางแบบก็
ออกแบบมาสาหรับบางงานโดยเฉพาะ
แนวความคิดในเรื่องโครงสร้างข้อมูลนี้ส่งผลกับการพัฒนาวิธีการมาตรฐานต่างๆในการ
ออกแบบและเขียนโปรแกรมหลายภาษาโปรแกรมนั้นได้พัฒนารวมเอาโครงสร้างข้อมูลนี้ไว้เป็นส่วน
หนึ่งของระบบโปรแกรม เพื่อประโยชน์ในการใช้ซ้า
แฟ้มข้อมูล” (file) หมายถึงข้อมูลสารสนเทศหรือข้อมูลทั้งหมดที่เก็บไว้ในสื่อที่มีคุณสมบัติ
เป็นแม่เหล็กไม่ว่าจะเป็นจานบันทึกธรรมดาหรือจานแข็ง (hard disk) ก็ตามข้อสนเทศที่นาไปเก็บนั้นจะ
ถูกนาไปเก็บไว้เป็นเรื่องๆ ไป อาจจะเป็นโปรแกรมข้อมูล หรือภาพ (graphics) ก็ได้แต่ละเรื่องต่างก็ต้อง
มีชื่อเป็นของตนเองที่ต้องไม่ซ้ากัน
โดยปกติแฟ้มข้อมูลจะถูกเก็บไว้ในหน่วยความจาสารอง (secondary storage) เช่น ฮาร์ดดิสก์
เนื่องจากมีความจุข้อมูลสูงและสามารถเก็บได้ถาวรแม้จะปิดเครื่องไปซึ่งการจัดเก็บนี้จะต้องมีวิธีกาหนด
โครงสร้างโดยมีวัตถุประสงค์เพื่อให้การจัดเก็บและเข้าถึงข้อมูลมีความรวดเร็ว ถูกต้องและเหมาะสมกับ
ความต้องการการเข้าถึงและค้นคืนข้อมูลจะอาศัยคีย์ฟิลด์ในการเรียกค้นด้วยเสมอการจัดโครงสร้างของ
แฟ้มข้อมูลอาจจะแบ่งได้เป็นลักษณะดังนี้
การจัดการโครงสร้างแฟ้มข้อมูลมีปัจจัยที่ต้องพิจารณาในการเลือกโครงสร้าง ได้แก่ ปริมาณ
ข้อมูล ความถี่ในการดึงข้อมูล ความถี่ในการปรับปรุงข้อมูล จานวนครั้งที่อ่านข้อมูลจากหน่วยความจา
สากรองต่อการดึงข้อมูล
การจัดโครงสร้างข้อมูลแบบต่างๆ
1. แฟ้มลาดับ (sequential file)
2. แฟ้มสุ่ม ( direct file หรือ hash file)
3. แฟ้มลาดับดรรชนี (indexed sequential file)
เป็นโครงสร้างของแฟ้มข้อมูลชนิดพื้นฐานที่สามารถใช้งานได้ง่ายที่สุดเนื่องจากมีลักษณะการ
จัดเก็บข้อมูลแบบเรียงลาดับเรคคอร์ดต่อเนื่องกันไปเรื่อยๆการอ่านหรือค้นคืนข้อมูลจะข้ามลาดับไปอ่าน
ตรงตาแหน่งใดๆที่ต้องการโดยตรงไม่ได้เมื่อต้องการอ่านข้อมูลที่เรคคอร์ดใดๆโปรแกรมจะเริ่มอ่าน
ตั้งแต่เรคคอร์ดแรกไปเรื่อยๆจนกว่าจะพบเรคคอร์ดที่ต้องการ ก็จะเรียกค้นคืนเรคคอร์ดนั้นขึ้นมา
การใช้ข้อมูลเรียงลาดับนี้จึงเหมาะสมกับงานประมวลผลที่มีการอ่านข้อมูลต่อเนื่องกันไปเรื่อยๆ
ตามลาดับและปริมาณครั้งละมากๆ
แฟ้มข้อมูลแบบนี้ถ้าเป็นเครื่องคอมพิวเตอร์ระดับเมนเฟรมขนาดใหญ่ก็จะจัดเก็บอยู่ในอุปกรณ์
ประเภทเทปแม่เหล็ก (magnetic tape) ซึ่งมีการเข้าถึงแบบลาดับ (Sequential access) เวลาอ่านข้อมูลก็
ต้องเป็นไปตามลาดับด้วยคล้ายกับการเก็บข้อมูลเพลงลงบนเทปคาสเซ็ต
เป็นลักษณะของโครงสร้างแฟ้มข้อมูลที่เข้าถึงได้โดยตรงเมื่อต้องการอ่านค่าเรคคอร์ดใดๆ
สามารถทาการเลือกหรืออ่านค่านั้นได้ทาให้การเข้าถึงข้อมูลได้รวดเร็วกว่าปกติแล้วจะมีการจัดเก็บในสื่อ
ที่มีลักษณะการเข้าถึงได้โดยตรงประเภทจานแม่เหล็ก เช่น ดิสเก็ต,ฮาร์ดดิสก์หรือ CD-ROM เป็นต้น
เป็นลักษณะของโครงสร้างแฟ้มข้อมูลที่อาศัยกระบวนการที่เรียกว่า ISAM (Index Sequential Access
Method ) ซึ่งรวมเอาความสามารถในการเข้าถึงข้อมูลแบบสุ่มและแบบเรียงตามลาดับเข้าไว้ด้วยกัน การจัด
โครงสร้างแฟ้มข้อมูลวิธีนี้ข้อมูลจะถูกจัดเก็บเรียงกันตามลาดับไว้บนสื่อแบบสุ่ม เช่น ฮาร์ดดิสก์และการ
เข้าถึงข้อมูลจะทาผ่านแฟ้มข้อมูลลาดับเชิงดรรชนี (Index Sequential File) ซึ่งทาหน้าที่ช่วยชี้และค้นหา
ข้อมูลที่ต้องการได้สามารถทางานได้ยืดหยุ่นกว่าวิธีอื่นๆโดยเฉพาะกับกรณีที่ข้อมูลในการประมวลผลมี
จานวนมากๆ โครงสร้างแฟ้มข้อมูลแบบนี้จะมีหลักการทางานคล้ายกับรูปแบบดรรชนีท้ายเล่ม ซึ่งทาให้ง่าย
และสะดวกมากยิ่งขึ้น
โครงสร้างแฟ้ ม ข้อดี ข้อเสีย สื่อที่ใช้เก็บ
1. แบบเรียงลาดับ - เสียค่าใช้จ่ายน้อยและใช้
งานได้ง่ายกว่าวิธีอื่นๆ
- เหมาะกับงานประมวลผล
ที่มีการอ่านข้อมูลแบบ
เรียงลาดับและในปริมาณ
มาก
- สื่อที่ใช้เก็บเป็นเทปซึ่งมี
ราคาถูก
- การทางานเพื่อค้นหา
ข้อมูลจะต้องเริ่มทาตั้งแต่
ต้นไฟล์เรียงลาดับไป
เรื่อย จนกว่าจะหาข้อมูล
นั้นเจอ ทาให้เสียเวลา
ค่อนข้างมาก
- ข้อมูลที่ใช้ต้องมีการจัด
เรียงลาดับก่อนเสมอ
- ไม่เหมาะกับงานที่ต้อง
แก้ไข เพิ่ม ลบข้อมูลเป็น
ประจา เช่นงานธุรกรรม
ออนไลน์
เทปแม่เหล็กเช่น เทปคาส
เซ็ต
2. แบบสุ่ม - สามารถทางานได้
เร็ว เพราะมีการเข้าถึง
ข้อมูลเรคคอร์ดแบบเร็ว
มาก เพราะไม่ต้อง
เรียงลาดับข้อมูลก่อนเก็บ
ลงไฟล์
- เหมาะสมกับการใช้งาน
ธุรกรรมออนไลน์ หรืองาน
ที่ต้องการแก้ไข เพิ่ม ลบ
รากการเป็นประจา
- ไม่เหมาะกับงาน
ประมวลผลที่อ่านข้อมูลใน
ปริมาณมาก
- การเขียนโปรแกรมเพื่อ
ค้นหาข้อมูลจะซับซ้อน
- ไม่สามารถเข้าถึงข้อมูล
แบบเรียงลาดับได้
จานแม่เหล็กเช่นดิสเก็ตต์
, ฮาร์ดดิสก์หรือ CD-
ROM
3. แบบลาดับเชิง
ดรรชนี
- สามารถรองรับการ
ประมวลผลได้ทั้ง2 แบบ
คือ แบบลาดับและแบบสุ่ม
- เหมาะกับงานธุรกรรม
ออนไลน์ ด้วยเช่นเดียวกัน
- สิ้นเปลืองเนื้อที่ในการ
จัดเก็บดรรชนีที่ใช้อ้างอิง
ถึงตาแหน่งของข้อมูล
- การเขียนโปรแกรมเพื่อ
ค้นหาข้อมูลจะซับซ้อน
- การทางานช้ากว่าแบบ
สุ่ม และมีค่าใช้จ่ายสูง
จานแม่เหล็ก เช่น
ดิสเก็ตต์, ฮาร์ดดิสก์
หรือ CD-ROM
สามารถจาแนกแฟ้มข้อมูลออกตามลักษณะของข้อมูลที่เก็บบันทึกไว้2 ประเภท คือ
1. แฟ้ มข้อมูลหลัก (Master File) เป็นแฟ้มข้อมูลซึ่งเก็บข้อมูลที่สาคัญ เช่น แฟ้มข้อมูลประวัติ ลูกค้า
(Customer master file) ตามที่กล่าวไว้ข้างต้น แฟ้มข้อมูลประวัติผู้จัดส่งสินค้า (Supplier master file)
แฟ้มข้อมูลสินค้าคงเหลือ (Inventory master file) แฟ้มข้อมูลบัญชี (Account master file) เป็นต้น ซึ่ง
แฟ้มข้อมูลหลักเหล่านี้เป็นส่วนประกอบของระบบงานบัญชี (Account system)
2. แฟ้ มรายการเปลี่ยนแปลง(Transaction file) เป็นแฟ้มที่บันทึกข้อมูลเกี่ยวกับแฟ้มข้อมูลหลักที่มีการ
เปลี่ยนแปลงในแต่ละวัน รายการที่เกิดขึ้นต้องนาไปปรับปรุงกับแฟ้มข้อมูลหลักเพื่อให้แฟ้มข้อมูลหลักมี
ข้อมูลที่ทันสมัยอยู่ตลอดเวลา
ในสมัยก่อนนั้น การเก็บรวบรวมข ้อมูล เพื่อการนากลับมาใช ้บนระบบคอมพิวเตอร์ จะอยู่ในรูป
ของแฟ้มข ้อมูลทั้งสิ้น แต่เมื่อโลกมีการ พัฒนามากขึ้น ข ้อมูลที่ต ้องจัดเก็บมีอยู่มากมาย การใช ้
แต่เพียงแฟ้มข ้อมูลเท่านั้น ไม่เพียงพอ ที่จะสนับสนุนให ้ทางานได ้อย่างมีประสิทธิภาพอีกต่อไป
จึงทาให ้มีการนาเสนอแนวความคิดระบบฐานข ้อมูลขึ้น เพื่อจัดการงานที่เกี่ยวข ้องกับข ้อมูล ให ้มี
ประสิทธิภาพสูงสุดเท่าที่จะทาได ้ข ้อแตกต่าง ระหว่างแฟ้มข ้อมูลกับฐานข ้อมูลคือ
๑. ฐานข้อมูลมีส่วนการบรรยายโครงสร้างข้อมูลแยกจากฐานข้อมูล
กล่าวคือ ในระบบฐานข ้อมูลนั้น มีส่วนที่เรียกว่า แค็ตตาล็อก (catalog) หรือพจนานุกรมข ้อมูล
(Data Dictionary) ซึ่งเก็บรายละเอียดทั้งหมด ที่เกี่ยวข ้องกับโครงสร ้างของข ้อมูลใน
ฐานข ้อมูลไว ้เช่น ชนิดและรูปแบบของข ้อมูล ในฐานข ้อมูล และข ้อจากัดต่างๆ ที่มีต่อข ้อมูลแต่
ละส่วน เป็ นต ้น ในขณะที่แฟ้มข ้อมูล จะเก็บรายละเอียดเหล่านี้ไว ้ในส่วนของโปรแกรม
คอมพิวเตอร์ที่ใช ้งานด ้วยกันเลย ซึ่งอาจกระจัดกระจายไปอยู่ตามส่วนต่างๆ จึงทาให ้ไม่สะดวก
ต่อการใช ้และปรับปรุงงาน
๒. โปรแกรมคอมพิวเตอร์และข้อมูลแยกกันโดยเด็ดขาดในระบบฐานข้อมูล
นั่นคือ ส่วนของโปรแกรมคอมพิวเตอร์ที่ใช ้จัดการข ้อมูล จะถูกพัฒนาออกมา ซึ่งเรียกกันว่า
ระบบจัดการฐานข ้อมูล ส่วนข ้อมูล ก็จะแยกอยู่ในส่วนของฐานข ้อมูล ซึ่งการแยกนี้ เป็นการซ่อน
รายละเอียดของการจัดการข ้อมูลไว ้จากตัวข ้อมูล เพื่อผู้ใช ้จะได ้ไม่ต ้องยุ่งยากกับรายละเอียด
ของการจัดเก็บข ้อมูล โดยให ้ซอฟต์แวร์จัดการฐานข ้อมูล เป็นเครื่องมือจัดการให ้แทน ซึ่ง
แตกต่างจากระบบแฟ้มข ้อมูล ที่จะรวมส่วนของโปรแกรม และข ้อมูลไว ้ด ้วยกัน ผลเสียก็คือ เมื่อ
มีการเปลี่ยนแปลงโครงสร ้างของข ้อมูล ส่วนของโปรแกรม ก็จะต ้องปรับตามไปด ้วย มิฉะนั้น
แฟ้มข ้อมูลดังกล่าว ก็จะไม่สามารถนามาใช ้งานได ้อีก
๓. ฐานข้อมูลสนับสนุนการใช้งานของข้อมูลในหลายๆ รูปแบบ
ผู้ใช ้คนหนึ่งอาจจะต ้องการรายงาน หรือข ้อสรุปของข ้อมูลชุดหนึ่ง ในหลายๆ รูปแบบ ทั้งแบบ
ตาราง แบบกราฟ และแบบบทความ ซึ่งในส่วนนี้ ระบบจัดการฐานข ้อมูล จะเป็นผู้ดูแลให ้แก่
ผู้ใช ้ส่วนในแนวคิดแบบแฟ้มข ้อมูลนั้น เมื่อผู้ใช ้ต ้องการรายงานแบบใหม่ ผู้ใช ้จะต ้องเขียน
โปรแกรมขึ้นมาใหม่ เพื่อ ให ้ได ้งานอย่างที่ต ้องการ ซึ่งค่อนข ้างยุ่งยาก และเสียเวลาในการใช ้
งานอย่างมาก
๔. การใช้ข้อมูลร่วมกัน และการประมวลผลการเปลี่ยนแปลงรายการ แบบหลายผู้ใช้
(multiuser transaction processing)
ระบบจัดการฐานข ้อมูล สาหรับผู้ใช ้หลายๆ คนพร ้อมกัน ต ้องมีการอนุญาตให ้ผู้ใช ้เข ้าถึงข ้อมูล
ในเวลาเดียวกันได ้โดยที่ระบบจะต ้องจัดการข ้อมูลให ้แก่ผู้ใช ้แต่ละคนอย่างถูกต ้องด ้วย
ถึงแม ้ว่าผู้ใช ้เหล่านั้น จะเรียกใช ้ข ้อมูลเดียวกัน ณ เวลาเดียวกัน ในระบบจัดการฐานข ้อมูล
จะต ้องมีส่วนควบคุมการทางานแบบพร ้อมกัน (Concurrency Control) ซึ่งในการทางานแบบ
แฟ้มข ้อมูล จะไม่มีส่วนจัดการในเรื่องนี้
นิยามและแนวความคิดเบื้องต้น
ปัจจุบันความต ้องการข ้อมูล สารถสนเทศมีมากขึ้น รวมทั้งโครงสร ้าง
ข ้อมูล/สารสนเทศมีความซับซ ้อนมากขึ้นด ้วย จึงจาเป็นต ้องนาระบบ
คอมพิวเตอร์เข ้ามาช่วยในการจัดการ สมองของมนุษย์ไม่อาจจดจาทุก
สิ่งทุกอย่างที่สนใจได ้ทั้งหมด จึงมักบันทึกไว ้ในสมุดหรือกระดาษ ฯลฯ
รวบรวมเป็น “แฟ้มข ้อมูล” การใช ้แฟ้มข ้อมูลให ้มีประสิทธิภาพสูงสุด
จาเป็นต ้องศึกษาถึง วิธีการจัดระเบียบแฟ้มข ้อมูล (File Organization)
และปฏิบัติการแฟ้มข ้อมูล (File Operation) นักออกแบบที่ดีควรเลือก
ระเบียบแฟ้มข ้อมูลให ้เหมาะสมกับงาน เพื่อลดจานวนครั้งในการเข ้าถึง
ข ้อมูลที่เก็บในอุปกรณ์บันทึกข ้อมูล
ลักษณะของระบบสารสนเทศ
1. เป็นปัจจุบัน (Current)
2. ทันเวลา (Timely)
3. มีค่าเที่ยงตรง
4. มีความคงที่ (Relevant)
5. นาเสนอรูปแบบที่มีประโยชน์ (Presented in Usable Form)
แนวความคิดพื้นฐานเกี่ยวกับการประมวลข้อมูล
1. โครงสร ้างแฟ้มข ้อมูล
1.1 ข ้อมูลในมุมมองของผู ้ใช ้เป็นหน่วยที่เล็กที่สุดของ
ข ้อมูลที่มีความหมายต่อผู ้ใช ้คือ เขตข ้อมูล(Field) ถือว่าเป็นหน่วย
พื้นฐานของข ้อมูล ประกอบด ้วยตัวอักขระตั้งแต่ 1 ตัวขึ้นไปมารวมกันให ้
เกิดความหมายขึ้นมาใช ้แทนข ้อมูลต่างๆ เมื่อรวมเขตข ้อมูลต่างๆ ที่
สัมพันธ์กัน จะเรียกชุดของเขตข ้อมูลที่ถูกรวมนั้นว่า
“ระเบียน” (Record) การนาระเบียนต่างๆ ข ้างต ้นมารวมกัน จะเรียกกลุ่ม
ของระเบียนนั้นว่า “แฟ้มข ้อมูล (File)”เมื่อนาแฟ้มข ้อมูลตั้งแต่ 2 แฟ้ม
ขึ้นไป ที่มีความหมายสัมพันธ์เชิงตรรกะระหว่างแฟ้มข ้อมูลมารวมกัน จะ
เรียกกลุ่มของแฟ้มข ้อมูลนั้นว่า “ฐานข ้อมูล (Database)”
1.2 การจัดการข ้อมูลโดยคอมพิวเตอร์
1.3 ข ้อมูลในระบบคอมพิวเตอร์ หน่วยที่เล็กที่สุดของข ้อมูล
คือ บิต (Bit) ย่อมาจาก Binary Digitเนื่องด ้วยเลขฐานสองไม่เพียงพอ
กับการแทนข ้อมูลจานวนมากได ้จึงรวมหลายๆ บิตเข ้าเป็นกลุ่มเพื่อใช ้
แทนอักขระ 1 ตัว
2. ระเบียนข ้อมูล (Record)
2.1 ระเบียนเชิงตรรกะ (Logical Record) คือ ระเบียนใน
ทัศนะของผู ้ใช ้ทั่วไป ประกอบด ้วยเขตข ้อมูลที่สัมพันธ์กันเชิงตรรกะซึ่ง
กันและกัน โดยไม่คานึงว่าจะจัดเก็บไว ้ที่ใดในอุปกรณ์บันทึกข ้อมูล
2.2 ระเบียนเชิงกายภาพ (Physical Record) คือ ระเบียนใน
ทัศนะของคอมพิวเตอร์ โดยพิจารณาจากการอ่านบันทึกข ้อมูลลงสื่อ
บันทึกแต่ละครั้ง ซึ่งการอ่านหรือบันทึกแต่ละครั้งถือว่าเป็น 1 หน่วยของ
สื่อบันทึกข ้อมูล ในการนาระเบียนข ้อมูลเชิงตรระมาจัดเก็บลงสื่อบันทึก
ข ้อมูล ซึ่งระเบียนดังกล่าวจะต ้องถูกจัดให ้อยู่ในระเบียนเชิงกายภาพ
ดังนั้นจะทาให ้เกิดระเบียนแบบต่าง คือ ระเบียนแบบ Unblock ระบียน
แบบ Blockและระบียนแบบ Spanned Record
3. การแบ่งประเภทระเบียนเชิงตรรกะในแฟ้มข ้อมูลตามความยาว
ของระเบียน สามารถแบ่งประเภทความยาวได ้ดังนี้
3.1 ระเบียนยาวคงที่ เป็นระเบียนที่ประกอบด ้วยเขตข ้อมูลแบบ
เดียวกันตลอดแฟ้ม
3.2 ระเบียนยาวแปรผัน ขนาดความยาวของระเบียนไม่คงที่
4. เขตข ้อมูล (Fields) ในระเบียนหนึ่งมักประกอบด ้วยเขตข ้อมูล 2
ประเภท คือ
4.1 เขตข ้อมูลหลัก คือ เขตข ้อมูลที่ใช ้สาหรับอ ้างอิง จาแนก หรือ
บอกตาแหน่งที่เก็บระเบียนข ้อมูล
4.2 เขตข ้อมูลทั่วไป คือ เขตข ้อมูลที่ไม่ใช ้ทั้ง PK และ SK ไม่ได ้
ใช ้ในการอ ้างอิงหรือค ้นหาข ้อมูล
5. การแยกประเภทแฟ้มข ้อมูล
5.1 แยกตามประเภทแฟ้มข ้อมูลตามเนื้อหา
5.2 แยกประเภทแฟ้มข ้อมูลตามวิธีการประมวลผล
6. การปฏิบัติการแฟ้มข ้อมูล หลักสาคัญในการปฏิบัติการแฟ้มข ้อมูล/
ประมวลผลข ้อมูล คือ จะต ้องมีการอ่านค่าของข ้อมูลในแต่ละเขตข ้อมูล
ที่ต ้องการมาใช ้ประโยชน์เข ้ามาแล ้วปรับเปลี่ยน คานวณ นาเสนอใน
รูปแบบที่ผู้ใช ้ต ้องการ
7. การจัดระเบียบแฟ้มข ้อมูล การจัดระเบียบแฟ้มข ้อมูล คือ การ
ตระเตรียมเส ้นทางเข ้าถึงระเบียนระหว่างปฏิบัติการเรียกใช ้ และปรับปรุง
ข ้อมูล ทั้งนี้ ระเบียบแฟ้มข ้อมูลที่ต่างชนิดกัน ก็จะให ้เส ้นทางเข ้าถึง
ข ้อมูลที่แตกต่างกัน
ปัญหาการใช้ข้อมูล/ฐานข้อมูลภายในองค์กร
1. มีความซ้าซ ้อนกันในการเก็บข ้อมูล
2. มีการให ้คาจากัดความของข ้อมูลแต่ละตัวไม่ตรงกัน
3. มีการจัดการ หรือใช ้วิธีการประมวลผลของข ้อมูลแตกต่างกัน
ออกไป
4. มีการพัฒนาการใช ้ข ้อมูลไม่เป็นระบบ แต่ละหน่วยงาน
จัดทาหรือใช ้กันอย่างไม่มีกฎเกณฑ์
ระบบฐานข้อมูล
คือ ระบบจัดเก็บข้อมูลด้วยคอมพิวเตอร์โดยมีวัตถุประสงค์เพื่อบารุงรักษาข้อสนเทศ (Maintain
information) และสามารถนาข้อสนเทศเหล่านั้นมาใช้ได้ทุกเมื่อที่ต้องการ
ระบบฐานข้อมูลประกอบส่วนประกอบหลัก4 ส่วนได้แก่
1. ข้อมูล (Data) ข้อมูลในฐานข้อมูลจะต้องมีคุณสมบัติ 2 ประการ คือ
 เบ็ดเสร็จ (Integrate) ฐานข้อมูลเป็นแหล่งรวบรวมข้อมูลจากแฟ้มต่าง ๆ ไว้ครบถ้วนสมบูรณ์
เพื่อลดข้อมูลซ้าซ้อนระหว่างแฟ้ม
 ใช้ร่วมกันได้ (Share) ข้อมูลแต่ละชิ้นในฐานข้อมูลสามารถนามาแบ่งใช้กันได้ระหว่างผู้ใช้ต่าง
ๆ ในระบบ
2. ฮาร์ดแวร์ (Hardware) ประกอบด้วย อุปกรณ์บันทึกข้อมูลเช่น จานแม่เหล็ก , I/O device ,
Device controller , I/O channels , หน่วย
3. ซอฟต์แวร์ (Software) ตัวกลางเชื่อมระหว่างฐานข้อมูลและผู้ใช้คือ DBMS เป็น
ซอฟต์แวร์ที่สาคัญที่สุดของระบบฐานข้อมูล นอกจากนี้ยังมี Utility , Application
Development tool , Design aids , Report writers , etc.
ประมวลผล และหน่วยความจาหลัก
4. ผู้ใช้ (Users) มี 3 กลุ่มใหญ่ ๆ คือ
 Application Programmer เขียนโปรแกรมประยุกต์
 End Users ผู้ใช้ที่อยู่กับ Online terminal เข้าถึงข้อมูลโดยผ่านโปรแกรม
ประยุกต์ หรือผ่านภาษาเรียกค้น (Query Language)
 Data Administrator & Database Administrator
DA ผู้บริหารอาวุโส เป็นผู้ตัดสินใจว่าจะเก็บข้อมูลใดในฐานข้อมูลก่อน และกาหนดนโยบาย
การรักษาความปลอดภัยของข้อมูล
DBA ผู้เชี่ยวชาญระดับมืออาชีพ เป็นผู้สร้างฐานข้อมูลและนามาใช้งานจริง โดยควบคุม
ทางด้านเทคนิคที่จาเป็นในการดาเนินนโยบายที่กาหนดโดย DA
ข้อดีของการใช้ฐานข้อมูล
ความกระทัดรัด (Compactness) ไม่ต้องมีที่ซ้าซ้อนจานวนมาก
ความเร็ว (Speed) เรียกใช้ข้อมูลได้รวดเร็วขึ้น
ความน่าเบื่อหน่ายลดลง (Less drudgery) ความยุ่งยากลดลง และความน่าเบื่อหน่ายลดลง
ความสามารถโดยทั่วไปของระบบการจัดการฐานข ้อมูล
1.แปลงคาสั่งที่ใช้จัดการกับข้อมูลภายในฐานข้อมูล ให้อยู่ในรูปแบบที่ฐานข้อมูลเข้าใจ
2.นาคาสั่งต่าง ๆ ซึ่งได้รับการแปลแล้ว ไปสั่งให้ฐานข้อมูลทางาน เช่น การเรียกใช้(Retrieve)
จัดเก็บ (Update) ลบ (Delete) เพิ่มข้อมูล (Add) เป็นต้น
3.ป้องกันความเสียหายที่จะเกิดขึ้นกับข้อมูลภายในฐานข้อมูล โดยจะคอยตรวจสอบว่าคาสั่งใดที่
สามารถทางานได้และคาสั่งใดที่ไม่สามารถทางานได้
4.รักษาความสัมพันธ์ของข้อมูลภายในฐานข้อมูลให้มีความถูกต้องอยู่เสมอ
5.เก็บรายละเอียดต่างๆ ที่เกี่ยวข้องกับข้อมูลภายในฐานข้อมูลไว้ในพจนานุกรมข้อมูล (Data
Dictionary) ซึ่งรายละเอียดเหล่านี้มักจะถูกเรียกว่า เมทาเดตา (MetaData) ซึ่งหมายถึง
"ข้อมูลของข้อมูล"
6.ควบคุมให้ฐานข้อมูลทางานได้อย่างถูกต้องและมีประสิทธิภาพ
7.ควบคุมสถานะภาพของคอมพิวเตอร์ในการแปลสถาพฐานข้อมูล ส.ท

More Related Content

What's hot (12)

บท1
บท1บท1
บท1
 
Data Mining
Data MiningData Mining
Data Mining
 
การจัดการฐานข้อมูล
การจัดการฐานข้อมูลการจัดการฐานข้อมูล
การจัดการฐานข้อมูล
 
01 introduction to data mining
01 introduction to data mining01 introduction to data mining
01 introduction to data mining
 
03 data preprocessing
03 data preprocessing03 data preprocessing
03 data preprocessing
 
การจัดการฐานข้อมูล
การจัดการฐานข้อมูลการจัดการฐานข้อมูล
การจัดการฐานข้อมูล
 
Database
DatabaseDatabase
Database
 
1 weka introducing
1 weka introducing1 weka introducing
1 weka introducing
 
Introduction to Database
Introduction to DatabaseIntroduction to Database
Introduction to Database
 
Weka introducing
Weka introducingWeka introducing
Weka introducing
 
Introduction to Database
Introduction to DatabaseIntroduction to Database
Introduction to Database
 
01 introduction to data mining
01 introduction to data mining01 introduction to data mining
01 introduction to data mining
 

Similar to บทที่6

ความรู้พื้นฐานเกี่ยวกับฐานข้อมูล
ความรู้พื้นฐานเกี่ยวกับฐานข้อมูลความรู้พื้นฐานเกี่ยวกับฐานข้อมูล
ความรู้พื้นฐานเกี่ยวกับฐานข้อมูลIsareeya Keatwuttikan
 
บทที่1ความรู้พื้นฐานเกี่ยวกับฐานข้อมูล และหลักการออกแบบฐานข้อมูล
บทที่1ความรู้พื้นฐานเกี่ยวกับฐานข้อมูล และหลักการออกแบบฐานข้อมูลบทที่1ความรู้พื้นฐานเกี่ยวกับฐานข้อมูล และหลักการออกแบบฐานข้อมูล
บทที่1ความรู้พื้นฐานเกี่ยวกับฐานข้อมูล และหลักการออกแบบฐานข้อมูลniwat50
 
ความหมายของข้อมูล
ความหมายของข้อมูลความหมายของข้อมูล
ความหมายของข้อมูลNumber Utopie
 
หน่วยที่1 เรื่อง เทคโนโลยีการสื่อสาร นางสาว สิรินยา ปาโจด ม.5
หน่วยที่1 เรื่อง เทคโนโลยีการสื่อสาร นางสาว สิรินยา  ปาโจด ม.5หน่วยที่1 เรื่อง เทคโนโลยีการสื่อสาร นางสาว สิรินยา  ปาโจด ม.5
หน่วยที่1 เรื่อง เทคโนโลยีการสื่อสาร นางสาว สิรินยา ปาโจด ม.5สิรินยา ปาโจด
 
การจัดการฐานข้อมูล
การจัดการฐานข้อมูลการจัดการฐานข้อมูล
การจัดการฐานข้อมูลYongyut Nintakan
 
6 1-ความรู้เกี่ยวกับข้อมูล
6 1-ความรู้เกี่ยวกับข้อมูล6 1-ความรู้เกี่ยวกับข้อมูล
6 1-ความรู้เกี่ยวกับข้อมูลpatmalya
 
ข้อมูลสานสนเทศ
ข้อมูลสานสนเทศข้อมูลสานสนเทศ
ข้อมูลสานสนเทศnattapas33130
 
Myun dao22
Myun dao22Myun dao22
Myun dao22MyunDao
 
Myun dao22
Myun dao22Myun dao22
Myun dao22MyunDao
 
Bacic MySql & script Sql for jhcis
Bacic MySql & script Sql for jhcisBacic MySql & script Sql for jhcis
Bacic MySql & script Sql for jhcisSakarin Habusaya
 
บทที่ 2 การจัดการข้อมูล
บทที่ 2 การจัดการข้อมูลบทที่ 2 การจัดการข้อมูล
บทที่ 2 การจัดการข้อมูลWanphen Wirojcharoenwong
 
บทที่ 1 ความรู้พื้นฐานเกี่ยวกับสารสนเทศ
บทที่ 1 ความรู้พื้นฐานเกี่ยวกับสารสนเทศบทที่ 1 ความรู้พื้นฐานเกี่ยวกับสารสนเทศ
บทที่ 1 ความรู้พื้นฐานเกี่ยวกับสารสนเทศchushi1991
 
บทที่ 2 ทฤษฎีพื้นฐานเกี่ยวกับการจัดเก็บและค้นคืนสารสนเทศ
บทที่ 2 ทฤษฎีพื้นฐานเกี่ยวกับการจัดเก็บและค้นคืนสารสนเทศบทที่ 2 ทฤษฎีพื้นฐานเกี่ยวกับการจัดเก็บและค้นคืนสารสนเทศ
บทที่ 2 ทฤษฎีพื้นฐานเกี่ยวกับการจัดเก็บและค้นคืนสารสนเทศSrion Janeprapapong
 
บทที่ 3
บทที่ 3บทที่ 3
บทที่ 3nunzaza
 

Similar to บทที่6 (20)

ข้อมูลและสารสนเทศ
ข้อมูลและสารสนเทศข้อมูลและสารสนเทศ
ข้อมูลและสารสนเทศ
 
ความรู้พื้นฐานเกี่ยวกับฐานข้อมูล
ความรู้พื้นฐานเกี่ยวกับฐานข้อมูลความรู้พื้นฐานเกี่ยวกับฐานข้อมูล
ความรู้พื้นฐานเกี่ยวกับฐานข้อมูล
 
บท1
บท1บท1
บท1
 
บทที่1ความรู้พื้นฐานเกี่ยวกับฐานข้อมูล และหลักการออกแบบฐานข้อมูล
บทที่1ความรู้พื้นฐานเกี่ยวกับฐานข้อมูล และหลักการออกแบบฐานข้อมูลบทที่1ความรู้พื้นฐานเกี่ยวกับฐานข้อมูล และหลักการออกแบบฐานข้อมูล
บทที่1ความรู้พื้นฐานเกี่ยวกับฐานข้อมูล และหลักการออกแบบฐานข้อมูล
 
บทที่1
บทที่1บทที่1
บทที่1
 
ความหมายของข้อมูล
ความหมายของข้อมูลความหมายของข้อมูล
ความหมายของข้อมูล
 
Db1
Db1Db1
Db1
 
หน่วยที่1 เรื่อง เทคโนโลยีการสื่อสาร นางสาว สิรินยา ปาโจด ม.5
หน่วยที่1 เรื่อง เทคโนโลยีการสื่อสาร นางสาว สิรินยา  ปาโจด ม.5หน่วยที่1 เรื่อง เทคโนโลยีการสื่อสาร นางสาว สิรินยา  ปาโจด ม.5
หน่วยที่1 เรื่อง เทคโนโลยีการสื่อสาร นางสาว สิรินยา ปาโจด ม.5
 
การจัดการฐานข้อมูล
การจัดการฐานข้อมูลการจัดการฐานข้อมูล
การจัดการฐานข้อมูล
 
6 1-ความรู้เกี่ยวกับข้อมูล
6 1-ความรู้เกี่ยวกับข้อมูล6 1-ความรู้เกี่ยวกับข้อมูล
6 1-ความรู้เกี่ยวกับข้อมูล
 
ข้อมูลสานสนเทศ
ข้อมูลสานสนเทศข้อมูลสานสนเทศ
ข้อมูลสานสนเทศ
 
Myun dao22
Myun dao22Myun dao22
Myun dao22
 
Myun dao22
Myun dao22Myun dao22
Myun dao22
 
งาน Ppt 6401
งาน Ppt 6401 งาน Ppt 6401
งาน Ppt 6401
 
Bacic MySql & script Sql for jhcis
Bacic MySql & script Sql for jhcisBacic MySql & script Sql for jhcis
Bacic MySql & script Sql for jhcis
 
บทที่ 2 การจัดการข้อมูล
บทที่ 2 การจัดการข้อมูลบทที่ 2 การจัดการข้อมูล
บทที่ 2 การจัดการข้อมูล
 
บทที่ 1 ความรู้พื้นฐานเกี่ยวกับสารสนเทศ
บทที่ 1 ความรู้พื้นฐานเกี่ยวกับสารสนเทศบทที่ 1 ความรู้พื้นฐานเกี่ยวกับสารสนเทศ
บทที่ 1 ความรู้พื้นฐานเกี่ยวกับสารสนเทศ
 
บทที่ 2 ทฤษฎีพื้นฐานเกี่ยวกับการจัดเก็บและค้นคืนสารสนเทศ
บทที่ 2 ทฤษฎีพื้นฐานเกี่ยวกับการจัดเก็บและค้นคืนสารสนเทศบทที่ 2 ทฤษฎีพื้นฐานเกี่ยวกับการจัดเก็บและค้นคืนสารสนเทศ
บทที่ 2 ทฤษฎีพื้นฐานเกี่ยวกับการจัดเก็บและค้นคืนสารสนเทศ
 
แนวการสอบ ม.4
แนวการสอบ ม.4แนวการสอบ ม.4
แนวการสอบ ม.4
 
บทที่ 3
บทที่ 3บทที่ 3
บทที่ 3
 

More from Jaohjaaee

สิ่งประดิษฐ์สร้างสรรค์จากกล่องนม
สิ่งประดิษฐ์สร้างสรรค์จากกล่องนมสิ่งประดิษฐ์สร้างสรรค์จากกล่องนม
สิ่งประดิษฐ์สร้างสรรค์จากกล่องนมJaohjaaee
 
บทที่ 10
บทที่ 10บทที่ 10
บทที่ 10Jaohjaaee
 
บทที่9
บทที่9บทที่9
บทที่9Jaohjaaee
 
บทที่1
บทที่1บทที่1
บทที่1Jaohjaaee
 
บทที่3
บทที่3บทที่3
บทที่3Jaohjaaee
 
บทที่ 11
บทที่ 11บทที่ 11
บทที่ 11Jaohjaaee
 

More from Jaohjaaee (6)

สิ่งประดิษฐ์สร้างสรรค์จากกล่องนม
สิ่งประดิษฐ์สร้างสรรค์จากกล่องนมสิ่งประดิษฐ์สร้างสรรค์จากกล่องนม
สิ่งประดิษฐ์สร้างสรรค์จากกล่องนม
 
บทที่ 10
บทที่ 10บทที่ 10
บทที่ 10
 
บทที่9
บทที่9บทที่9
บทที่9
 
บทที่1
บทที่1บทที่1
บทที่1
 
บทที่3
บทที่3บทที่3
บทที่3
 
บทที่ 11
บทที่ 11บทที่ 11
บทที่ 11
 

บทที่6

  • 1. ข้อมูล ( Data) คือ ข้อเท็จจริงที่เกิดขึ้น ข้อมูลอาจจะอยู่ในรูปของข้อความหรือตัวเลข ซึ่งข้อความหรือ ตัวเลขเหล่านี้อาจเป็นเรื่องที่เกี่ยวข้องกับ คน พืช สัตว์และสิ่งของ เช่น ปริมาณข้าวที่ประเทศไทยผลิตได้ ในในปี 2545 เป็นข้อมูลที่เป็นตัวเลข หรือความคิดเห็นของประชาชนเกี่ยวกับการเลือกตั้ง เป็นข้อมูลที่อยู่ ในรูปข้อความ เป็นต้น ตัวแปร ( Variable) คือ ข้อมูลที่ได้จากสังเกต วัด สอบถามจากหน่วยที่ศึกษา โดยที่หน่วยที่ศึกษาอาจเป็น คน สัตว์พืช และสิ่งของ เมื่อหน่วยศึกษาแตกต่างกัน ข้อมูลที่ได้จึงแตกต่างกัน จึงเรียกข้อมูลที่แตกต่าง กันนั้นว่า ตัวแปร เช่น รายได้ของคนในจังหวัดสงขลา ในที่นี่หน่วยที่ศึกษา คือ คนในจังหวัดสงขลา แต่ ละคนจะแตกต่างกันออกไป ดังนั้นตัวแปร คือ รายได้ของคนในจังหวัดสงขลา ซึ่งมีค่าที่แตกต่างกัน ค่า ของตัวแปร คือ ข้อมูลนั่นเอง แต่ละคน ปริมาณน้าฝนที่วัดได้ข้อมูลที่ได้จะมีลักษณะเป็นเศษส่วน หรือจุดทศนิยม บางครั้ง เรียกว่า ข้อมูลแบบต่อเนื่อง นาข้อมูลดิบมารวบรวมเป็นกลุ่มเป็นหมวดหมู่
  • 2. แหล่งข้อมูล หมายถึง สถานที่หรือแหล่งที่เกิดข้อมูล แหล่งข้อมูลจะแตกต่างกันไปตามข้อมูลที่ ต้องการ เช่น บ้านเป็นแหล่งข้อมูลที่เกี่ยวกับนักเรียน โดยบันทึก ข้อมูลไว้ในทะเบียนบ้าน ห้องสมุด เป็นแหล่งข้อมูลเกี่ยวกับความรู้ต่าง ๆ ข้อมูลบางอย่างเราอาจจะนามาจากแหล่งข้อมูล หลายแหล่งได้เช่นราคาของเล่นชนิดเดียวกัน เราอาจจะหาข้อมูลจากแหล่งข้อมูลซึ่งได้แก่ร้านค้า หลายร้านได้และข้อมูลหรือราคาที่ได้อาจจะแตกต่างกันไป หนังสือพิมพ์เป็นแหล่งข้อมูลที่มีทั้ง ข้อความ ตัวเลข รูปภาพ โดยปกติแล้ว ข้อมูลสาหรับการนามาประมวลผลด้วยคอมพิวเตอร์นั้นจะได้มาจากแหล่งที่มา 2 ประเภท ด้วยกัน คือ 1. แหล่งข้อมูลภายใน เป็นแหล่งข้อมูลที่อยู่ภายในองค์กรทั่วไป ข้อมูลที่ได้นั้นอาจมาจากพนักงานหรือมี อยู่แล้วในองค์กร เช่น ยอดขายประจาปี ข้อมูลผู้ถือหุ้น รายงานกาไรขาดทุน ข้อมูลเหล่านี้จะให้ข้อมูลที่ เกี่ยวข้องกับข้อเท็จจริงต่างๆภายในองค์กรแต่เพียงอย่างเดียว อาจเป็นข้อมูลที่เปิดเผยให้กับบุคคลภายนอก ทราบหรือไม่ก็ได้หากข้อมูลนั้นเป็นข้อมูลที่เกี่ยวข้องกับการดาเนินงานหลักขององค์กรและมีความสาคัญมาก เช่น ข้อมูลผลิตภัณฑ์ที่จะออกสู่ตลาดใหม่ ข้อมูลการทดลองการแปรรูปสินค้า หน่วยงานนั้นอาจมีการปกปิด ไว้เพื่อป้องกันการรั่วไหลของข้อมูลได้ 2. แหล่งข้อมูลภายนอก เป็นแหล่งข้อมูลที่อยู่ภายนอกองค์กร โดยทั่วไปแล้วสามารถนาข้อมูลต่างๆ เหล่านั้นมาใช้ประโยชน์ในองค์กรหรือนามาใช้กับการประมวลผลด้วยคอมพิวเตอร์ เพื่อให้ได้ระบบงานที่ สมบูรณ์ขึ้นได้เช่น ข้อมูลลูกค้า เจ้าหนี้ อัตราดอกเบี้ยสถาบันการเงิน กฎหมายและอัตราภาษีของรัฐบาล หรือ อาจรวมถึงข้อมูลบริษัทคู่แข่งด้วย สามารถหาข้อมูลจากแหล่งภายนอกได้จากบริษัทผู้ให้บริการข้อมูลหรือจาก หนังสือพิมพ์วิทยุโทรทัศน์ หรือสื่ออื่นๆได้
  • 3. ข้อมูลที่ดีจะต้องประกอบด้วยคุณสมบัติที่สาคัญๆ ดังนี้คือ 1. ความถูกต้องแม่นยา (accuracy) ข้อมูลที่ดีควรจะมีความถูกต้องแม่นยาสูง หรือถ้ามีความคลาดเคลื่อน (errors) ปนอยู่บ้าง ก็ควรที่จะสามารถควบคุมขนาดของความคลาดเคลื่อนที่ปนมาให้มีความคลาดเคลื่อน น้อยที่สุด 2. ความทันเวลา (timeliness) เป็นข้อมูลที่ทันสมัย (up to date) และทันต่อความต้องการของ ผู้ใช้ถ้าผลิต ข้อมูลออกมาช้า ก็ไม่มีคุณค่าถึงแม้จะเป็นข้อมูลที่ถูกต้องแม่นยาก็ตาม 3. ความสมบูรณ์ครบถ้วน (completeness) ข้อมูลที่เก็บรวบรวมมาต้องเป็นข้อมูลที่ให้ข้อเท็จจริง (facts) หรือข่าวสาร (information) ที่ครบถ้วนทุกด้านทุกประการ มิใช่ขาดส่วนหนึ่งส่วนใดไปทาให้นาไปใช้ การไม่ได้ 4. ความกระทัดรัด (conciseness) ข้อมูลที่ได้รับส่วนใหญ่จะกระจัดกระจาย ควรจัดข้อมูลให้อยู่ใน รูปแบบที่กระทัดรัดไม่เยิ่นเย้อ สะดวกต่อการใช้และค้นหา ผู้ใช้มีความเข้าใจได้ทันที 5. ความตรงกับความต้องการของผู้ใช้ (relevance) ข้อมูลที่จัดทาขึ้นมาควรเป็นข้อมูลที่ผู้ใช้ข้อมูล ต้องการใช้ และจาเป็นต้องรู้ / ทราบ หรือเป็นประโยชน์ต่อการจัดทาแผน กาหนดนโยบายหรือตัดสิน ปัญหาในเรื่องนั้นๆ ไม่ใช่เป็นข้อมูลที่จัดทาขึ้นมาอย่างมากมาย แต่ไม่มีใครต้องการใช้หรือไม่ตรงกับ ความต้องการของผู้ใช้ข้อมูล 6. ความต่อเนื่อง (continuity) การเก็บรวบรวมข้อมูล ควรอย่างยิ่งที่จะต้องดาเนินการอย่างสม่าเสมอและ ต่อเนื่องในลักษณะของอนุกรมเวลา (time-series) เพื่อจะได้นาไปใช้ประโยชน์ในด้านการวิเคราะห์วิจัย หรือหาแนวโน้มในอนาคต
  • 4. ในการจัดการข้อมูลจะมีการแบ่งข้อมูลออกเป็นลาดับชั้นเพื่อง่ายต่อการเรียกใช้และประมวลผล ลาดับชั้นข้อมูลพื้นฐานที่ควรทราบมีดังต่อไปนี้ บิต (Bit = Binary Digit) เป็นลาดับชั้นของหน่วยข้อมูลที่เล็กที่สุด ดังที่ทราบกันดีแล้วว่าข้อมูลที่จะทางานร่วมกับคอมพิวเตอร์ ได้นั้น จะต้องเอามาแปลงให้อยู่ในรูปของเลขฐานสองเสียก่อนคอมพิวเตอร์จึงจะเข้าใจและทางานตามที่ ต้องการได้เมื่อแปลงแล้วจะได้ตัวเลขแทนสถานะเปิดและปิด ของสัญญาณไฟฟ้าที่เรียกว่า บิต เพียง 2 ค่า เท่านั้นคือ บิต 0 และบิต 1 ไบต์ (Byte) เมื่อนาบิตมารวมกันหลายๆบิต จะได้หน่วยข้อมูลกลุ่มใหม่ที่เรียกว่า ไบต์(Byte) ซึ่งจานวนของบิตที่ ได้นั้นแต่ละกลุ่มอาจมีมากหรือน้อยบ้าง ทั้งนี้ขึ้นอยู่กับชนิดของรหัสที่ใช้เก็บ แต่โดยปกติกับการใช้งาน ในรหัสแอสกีทั่วไปจะได้กลุ่มของบิต 8 บิตด้วยกัน ซึ่งนิยมมาแทนเป็นรหัสของตัวอักษร บางครั้งจึงนิยม เรียกข้อมูล 1 ไบต์ว่าเป็น 1 ตัวอักษร ฟีลด์ หรือเขตของข้อมูล (Field) ประกอบด้วยกลุ่มของตัวอักษรหรือไบต์ตั้งแต่ 1 ตัวขึ้นไปมาประกอบกันเป็นหน่วยข้อมูลที่ใหญ่ขึ้น แล้วแสดงลักษณะหรือความหมายอย่างใดอย่างหนึ่ง ยกตัวอย่างเขตข้อมูลเกี่ยวกับพนักงาน เช่น รหัส พนักงาน ชื่อ นามสกุล เงินเดือน ตาแหน่ง
  • 5. Database (ฐานข้อมูล) เป็นกลุ่มของข้อมูล ที่มีการจัดการเพื่อทาให้เข้าถึง จัดการและ ปรับปรุงได้ง่าย ประเภทของฐานข้อมูล ที่เด่นมาก คือ relational database ซึ่งฐานข้อมูลเก็บข้อมูลใน แบบของตาราง ทาให้สามารถจัดการและเข้าถึงได้หลายวิธี distributed database เป็นฐานข้อมูลที่สามารถ กระจายและ replicate ระหว่างจุดต่าง ๆ บนเครือข่าย object-oriented programming database หมายถึง ข้อมูลที่กาหนดในอ๊อบเจค class และ subclass Database เป็นที่เก็บรวบของเรคคอร์ดข้อมูล หรือไฟล์ เช่น รายการการขาย รายการ ผลิตภัณฑ์คลังสินค้า หรือรายละเอียดของลูกค้า โดยปกติผู้จัดการฐานข้อมูลให้ผู้ใช้ สามารถควบคุมการ อ่าน เขียน เข้าถึง ระบุการ การสร้างรายงาน และวิเคราะห์การใช้ ฐานข้อมูล และผู้จัดการฐานข้อมูล มี บทบาทเด่นในระบบเมนเฟรม ระบบเวิร์กสเตชัน ระบบขนาดกลาง เช่น AS 400 และคอมพิวเตอร์ส่วน บุคคล ภาษา Structured Query Language เป็นภาษามาตรฐาน สาหรับการสร้าง คิวรี่ ในปรับปรุง ฐานข้อมูล เช่น IBM's DB2, Microsoft Access , Sybase และ Computer Associates เป็นวิธีการจัดเก็บข้อมูลในคอมพิวเตอร์เพื่อให้สามารถใช้งานได้อย่างมีประสิทธิภาพการเลือก โครงสร้างข้อมูลนั้นโดยส่วนใหญ่แล้วจะเริ่มต้นจากการเลือกประเภทข้อมูลอย่างย่อโครงสร้างข้อมูลที่ ออกแบบเป็นอย่างดีจะสามารถรองรับการประมวลผลที่หนักหน่วงโดยใช้ทรัพยากรที่น้อยที่สุดเท่าที่จะ เป็นไปได้ทั้งในแง่ของเวลาและหน่วยความจา โครงสร้างข้อมูลแต่ละแบบจะเหมาะสมกับงานที่แตกต่างกัน และโครงสร้างข้อมูลบางแบบก็ ออกแบบมาสาหรับบางงานโดยเฉพาะ แนวความคิดในเรื่องโครงสร้างข้อมูลนี้ส่งผลกับการพัฒนาวิธีการมาตรฐานต่างๆในการ ออกแบบและเขียนโปรแกรมหลายภาษาโปรแกรมนั้นได้พัฒนารวมเอาโครงสร้างข้อมูลนี้ไว้เป็นส่วน หนึ่งของระบบโปรแกรม เพื่อประโยชน์ในการใช้ซ้า แฟ้มข้อมูล” (file) หมายถึงข้อมูลสารสนเทศหรือข้อมูลทั้งหมดที่เก็บไว้ในสื่อที่มีคุณสมบัติ เป็นแม่เหล็กไม่ว่าจะเป็นจานบันทึกธรรมดาหรือจานแข็ง (hard disk) ก็ตามข้อสนเทศที่นาไปเก็บนั้นจะ ถูกนาไปเก็บไว้เป็นเรื่องๆ ไป อาจจะเป็นโปรแกรมข้อมูล หรือภาพ (graphics) ก็ได้แต่ละเรื่องต่างก็ต้อง มีชื่อเป็นของตนเองที่ต้องไม่ซ้ากัน
  • 6. โดยปกติแฟ้มข้อมูลจะถูกเก็บไว้ในหน่วยความจาสารอง (secondary storage) เช่น ฮาร์ดดิสก์ เนื่องจากมีความจุข้อมูลสูงและสามารถเก็บได้ถาวรแม้จะปิดเครื่องไปซึ่งการจัดเก็บนี้จะต้องมีวิธีกาหนด โครงสร้างโดยมีวัตถุประสงค์เพื่อให้การจัดเก็บและเข้าถึงข้อมูลมีความรวดเร็ว ถูกต้องและเหมาะสมกับ ความต้องการการเข้าถึงและค้นคืนข้อมูลจะอาศัยคีย์ฟิลด์ในการเรียกค้นด้วยเสมอการจัดโครงสร้างของ แฟ้มข้อมูลอาจจะแบ่งได้เป็นลักษณะดังนี้ การจัดการโครงสร้างแฟ้มข้อมูลมีปัจจัยที่ต้องพิจารณาในการเลือกโครงสร้าง ได้แก่ ปริมาณ ข้อมูล ความถี่ในการดึงข้อมูล ความถี่ในการปรับปรุงข้อมูล จานวนครั้งที่อ่านข้อมูลจากหน่วยความจา สากรองต่อการดึงข้อมูล การจัดโครงสร้างข้อมูลแบบต่างๆ 1. แฟ้มลาดับ (sequential file) 2. แฟ้มสุ่ม ( direct file หรือ hash file) 3. แฟ้มลาดับดรรชนี (indexed sequential file) เป็นโครงสร้างของแฟ้มข้อมูลชนิดพื้นฐานที่สามารถใช้งานได้ง่ายที่สุดเนื่องจากมีลักษณะการ จัดเก็บข้อมูลแบบเรียงลาดับเรคคอร์ดต่อเนื่องกันไปเรื่อยๆการอ่านหรือค้นคืนข้อมูลจะข้ามลาดับไปอ่าน ตรงตาแหน่งใดๆที่ต้องการโดยตรงไม่ได้เมื่อต้องการอ่านข้อมูลที่เรคคอร์ดใดๆโปรแกรมจะเริ่มอ่าน ตั้งแต่เรคคอร์ดแรกไปเรื่อยๆจนกว่าจะพบเรคคอร์ดที่ต้องการ ก็จะเรียกค้นคืนเรคคอร์ดนั้นขึ้นมา การใช้ข้อมูลเรียงลาดับนี้จึงเหมาะสมกับงานประมวลผลที่มีการอ่านข้อมูลต่อเนื่องกันไปเรื่อยๆ ตามลาดับและปริมาณครั้งละมากๆ แฟ้มข้อมูลแบบนี้ถ้าเป็นเครื่องคอมพิวเตอร์ระดับเมนเฟรมขนาดใหญ่ก็จะจัดเก็บอยู่ในอุปกรณ์ ประเภทเทปแม่เหล็ก (magnetic tape) ซึ่งมีการเข้าถึงแบบลาดับ (Sequential access) เวลาอ่านข้อมูลก็ ต้องเป็นไปตามลาดับด้วยคล้ายกับการเก็บข้อมูลเพลงลงบนเทปคาสเซ็ต
  • 7. เป็นลักษณะของโครงสร้างแฟ้มข้อมูลที่เข้าถึงได้โดยตรงเมื่อต้องการอ่านค่าเรคคอร์ดใดๆ สามารถทาการเลือกหรืออ่านค่านั้นได้ทาให้การเข้าถึงข้อมูลได้รวดเร็วกว่าปกติแล้วจะมีการจัดเก็บในสื่อ ที่มีลักษณะการเข้าถึงได้โดยตรงประเภทจานแม่เหล็ก เช่น ดิสเก็ต,ฮาร์ดดิสก์หรือ CD-ROM เป็นต้น เป็นลักษณะของโครงสร้างแฟ้มข้อมูลที่อาศัยกระบวนการที่เรียกว่า ISAM (Index Sequential Access Method ) ซึ่งรวมเอาความสามารถในการเข้าถึงข้อมูลแบบสุ่มและแบบเรียงตามลาดับเข้าไว้ด้วยกัน การจัด โครงสร้างแฟ้มข้อมูลวิธีนี้ข้อมูลจะถูกจัดเก็บเรียงกันตามลาดับไว้บนสื่อแบบสุ่ม เช่น ฮาร์ดดิสก์และการ เข้าถึงข้อมูลจะทาผ่านแฟ้มข้อมูลลาดับเชิงดรรชนี (Index Sequential File) ซึ่งทาหน้าที่ช่วยชี้และค้นหา ข้อมูลที่ต้องการได้สามารถทางานได้ยืดหยุ่นกว่าวิธีอื่นๆโดยเฉพาะกับกรณีที่ข้อมูลในการประมวลผลมี จานวนมากๆ โครงสร้างแฟ้มข้อมูลแบบนี้จะมีหลักการทางานคล้ายกับรูปแบบดรรชนีท้ายเล่ม ซึ่งทาให้ง่าย และสะดวกมากยิ่งขึ้น
  • 8. โครงสร้างแฟ้ ม ข้อดี ข้อเสีย สื่อที่ใช้เก็บ 1. แบบเรียงลาดับ - เสียค่าใช้จ่ายน้อยและใช้ งานได้ง่ายกว่าวิธีอื่นๆ - เหมาะกับงานประมวลผล ที่มีการอ่านข้อมูลแบบ เรียงลาดับและในปริมาณ มาก - สื่อที่ใช้เก็บเป็นเทปซึ่งมี ราคาถูก - การทางานเพื่อค้นหา ข้อมูลจะต้องเริ่มทาตั้งแต่ ต้นไฟล์เรียงลาดับไป เรื่อย จนกว่าจะหาข้อมูล นั้นเจอ ทาให้เสียเวลา ค่อนข้างมาก - ข้อมูลที่ใช้ต้องมีการจัด เรียงลาดับก่อนเสมอ - ไม่เหมาะกับงานที่ต้อง แก้ไข เพิ่ม ลบข้อมูลเป็น ประจา เช่นงานธุรกรรม ออนไลน์ เทปแม่เหล็กเช่น เทปคาส เซ็ต 2. แบบสุ่ม - สามารถทางานได้ เร็ว เพราะมีการเข้าถึง ข้อมูลเรคคอร์ดแบบเร็ว มาก เพราะไม่ต้อง เรียงลาดับข้อมูลก่อนเก็บ ลงไฟล์ - เหมาะสมกับการใช้งาน ธุรกรรมออนไลน์ หรืองาน ที่ต้องการแก้ไข เพิ่ม ลบ รากการเป็นประจา - ไม่เหมาะกับงาน ประมวลผลที่อ่านข้อมูลใน ปริมาณมาก - การเขียนโปรแกรมเพื่อ ค้นหาข้อมูลจะซับซ้อน - ไม่สามารถเข้าถึงข้อมูล แบบเรียงลาดับได้ จานแม่เหล็กเช่นดิสเก็ตต์ , ฮาร์ดดิสก์หรือ CD- ROM 3. แบบลาดับเชิง ดรรชนี - สามารถรองรับการ ประมวลผลได้ทั้ง2 แบบ คือ แบบลาดับและแบบสุ่ม - เหมาะกับงานธุรกรรม ออนไลน์ ด้วยเช่นเดียวกัน - สิ้นเปลืองเนื้อที่ในการ จัดเก็บดรรชนีที่ใช้อ้างอิง ถึงตาแหน่งของข้อมูล - การเขียนโปรแกรมเพื่อ ค้นหาข้อมูลจะซับซ้อน - การทางานช้ากว่าแบบ สุ่ม และมีค่าใช้จ่ายสูง จานแม่เหล็ก เช่น ดิสเก็ตต์, ฮาร์ดดิสก์ หรือ CD-ROM
  • 9. สามารถจาแนกแฟ้มข้อมูลออกตามลักษณะของข้อมูลที่เก็บบันทึกไว้2 ประเภท คือ 1. แฟ้ มข้อมูลหลัก (Master File) เป็นแฟ้มข้อมูลซึ่งเก็บข้อมูลที่สาคัญ เช่น แฟ้มข้อมูลประวัติ ลูกค้า (Customer master file) ตามที่กล่าวไว้ข้างต้น แฟ้มข้อมูลประวัติผู้จัดส่งสินค้า (Supplier master file) แฟ้มข้อมูลสินค้าคงเหลือ (Inventory master file) แฟ้มข้อมูลบัญชี (Account master file) เป็นต้น ซึ่ง แฟ้มข้อมูลหลักเหล่านี้เป็นส่วนประกอบของระบบงานบัญชี (Account system) 2. แฟ้ มรายการเปลี่ยนแปลง(Transaction file) เป็นแฟ้มที่บันทึกข้อมูลเกี่ยวกับแฟ้มข้อมูลหลักที่มีการ เปลี่ยนแปลงในแต่ละวัน รายการที่เกิดขึ้นต้องนาไปปรับปรุงกับแฟ้มข้อมูลหลักเพื่อให้แฟ้มข้อมูลหลักมี ข้อมูลที่ทันสมัยอยู่ตลอดเวลา
  • 10. ในสมัยก่อนนั้น การเก็บรวบรวมข ้อมูล เพื่อการนากลับมาใช ้บนระบบคอมพิวเตอร์ จะอยู่ในรูป ของแฟ้มข ้อมูลทั้งสิ้น แต่เมื่อโลกมีการ พัฒนามากขึ้น ข ้อมูลที่ต ้องจัดเก็บมีอยู่มากมาย การใช ้ แต่เพียงแฟ้มข ้อมูลเท่านั้น ไม่เพียงพอ ที่จะสนับสนุนให ้ทางานได ้อย่างมีประสิทธิภาพอีกต่อไป จึงทาให ้มีการนาเสนอแนวความคิดระบบฐานข ้อมูลขึ้น เพื่อจัดการงานที่เกี่ยวข ้องกับข ้อมูล ให ้มี ประสิทธิภาพสูงสุดเท่าที่จะทาได ้ข ้อแตกต่าง ระหว่างแฟ้มข ้อมูลกับฐานข ้อมูลคือ ๑. ฐานข้อมูลมีส่วนการบรรยายโครงสร้างข้อมูลแยกจากฐานข้อมูล กล่าวคือ ในระบบฐานข ้อมูลนั้น มีส่วนที่เรียกว่า แค็ตตาล็อก (catalog) หรือพจนานุกรมข ้อมูล (Data Dictionary) ซึ่งเก็บรายละเอียดทั้งหมด ที่เกี่ยวข ้องกับโครงสร ้างของข ้อมูลใน ฐานข ้อมูลไว ้เช่น ชนิดและรูปแบบของข ้อมูล ในฐานข ้อมูล และข ้อจากัดต่างๆ ที่มีต่อข ้อมูลแต่ ละส่วน เป็ นต ้น ในขณะที่แฟ้มข ้อมูล จะเก็บรายละเอียดเหล่านี้ไว ้ในส่วนของโปรแกรม คอมพิวเตอร์ที่ใช ้งานด ้วยกันเลย ซึ่งอาจกระจัดกระจายไปอยู่ตามส่วนต่างๆ จึงทาให ้ไม่สะดวก ต่อการใช ้และปรับปรุงงาน
  • 11. ๒. โปรแกรมคอมพิวเตอร์และข้อมูลแยกกันโดยเด็ดขาดในระบบฐานข้อมูล นั่นคือ ส่วนของโปรแกรมคอมพิวเตอร์ที่ใช ้จัดการข ้อมูล จะถูกพัฒนาออกมา ซึ่งเรียกกันว่า ระบบจัดการฐานข ้อมูล ส่วนข ้อมูล ก็จะแยกอยู่ในส่วนของฐานข ้อมูล ซึ่งการแยกนี้ เป็นการซ่อน รายละเอียดของการจัดการข ้อมูลไว ้จากตัวข ้อมูล เพื่อผู้ใช ้จะได ้ไม่ต ้องยุ่งยากกับรายละเอียด ของการจัดเก็บข ้อมูล โดยให ้ซอฟต์แวร์จัดการฐานข ้อมูล เป็นเครื่องมือจัดการให ้แทน ซึ่ง แตกต่างจากระบบแฟ้มข ้อมูล ที่จะรวมส่วนของโปรแกรม และข ้อมูลไว ้ด ้วยกัน ผลเสียก็คือ เมื่อ มีการเปลี่ยนแปลงโครงสร ้างของข ้อมูล ส่วนของโปรแกรม ก็จะต ้องปรับตามไปด ้วย มิฉะนั้น แฟ้มข ้อมูลดังกล่าว ก็จะไม่สามารถนามาใช ้งานได ้อีก ๓. ฐานข้อมูลสนับสนุนการใช้งานของข้อมูลในหลายๆ รูปแบบ ผู้ใช ้คนหนึ่งอาจจะต ้องการรายงาน หรือข ้อสรุปของข ้อมูลชุดหนึ่ง ในหลายๆ รูปแบบ ทั้งแบบ ตาราง แบบกราฟ และแบบบทความ ซึ่งในส่วนนี้ ระบบจัดการฐานข ้อมูล จะเป็นผู้ดูแลให ้แก่ ผู้ใช ้ส่วนในแนวคิดแบบแฟ้มข ้อมูลนั้น เมื่อผู้ใช ้ต ้องการรายงานแบบใหม่ ผู้ใช ้จะต ้องเขียน โปรแกรมขึ้นมาใหม่ เพื่อ ให ้ได ้งานอย่างที่ต ้องการ ซึ่งค่อนข ้างยุ่งยาก และเสียเวลาในการใช ้ งานอย่างมาก ๔. การใช้ข้อมูลร่วมกัน และการประมวลผลการเปลี่ยนแปลงรายการ แบบหลายผู้ใช้ (multiuser transaction processing) ระบบจัดการฐานข ้อมูล สาหรับผู้ใช ้หลายๆ คนพร ้อมกัน ต ้องมีการอนุญาตให ้ผู้ใช ้เข ้าถึงข ้อมูล ในเวลาเดียวกันได ้โดยที่ระบบจะต ้องจัดการข ้อมูลให ้แก่ผู้ใช ้แต่ละคนอย่างถูกต ้องด ้วย ถึงแม ้ว่าผู้ใช ้เหล่านั้น จะเรียกใช ้ข ้อมูลเดียวกัน ณ เวลาเดียวกัน ในระบบจัดการฐานข ้อมูล จะต ้องมีส่วนควบคุมการทางานแบบพร ้อมกัน (Concurrency Control) ซึ่งในการทางานแบบ แฟ้มข ้อมูล จะไม่มีส่วนจัดการในเรื่องนี้
  • 12. นิยามและแนวความคิดเบื้องต้น ปัจจุบันความต ้องการข ้อมูล สารถสนเทศมีมากขึ้น รวมทั้งโครงสร ้าง ข ้อมูล/สารสนเทศมีความซับซ ้อนมากขึ้นด ้วย จึงจาเป็นต ้องนาระบบ คอมพิวเตอร์เข ้ามาช่วยในการจัดการ สมองของมนุษย์ไม่อาจจดจาทุก สิ่งทุกอย่างที่สนใจได ้ทั้งหมด จึงมักบันทึกไว ้ในสมุดหรือกระดาษ ฯลฯ รวบรวมเป็น “แฟ้มข ้อมูล” การใช ้แฟ้มข ้อมูลให ้มีประสิทธิภาพสูงสุด จาเป็นต ้องศึกษาถึง วิธีการจัดระเบียบแฟ้มข ้อมูล (File Organization) และปฏิบัติการแฟ้มข ้อมูล (File Operation) นักออกแบบที่ดีควรเลือก ระเบียบแฟ้มข ้อมูลให ้เหมาะสมกับงาน เพื่อลดจานวนครั้งในการเข ้าถึง ข ้อมูลที่เก็บในอุปกรณ์บันทึกข ้อมูล ลักษณะของระบบสารสนเทศ 1. เป็นปัจจุบัน (Current) 2. ทันเวลา (Timely) 3. มีค่าเที่ยงตรง 4. มีความคงที่ (Relevant) 5. นาเสนอรูปแบบที่มีประโยชน์ (Presented in Usable Form)
  • 13. แนวความคิดพื้นฐานเกี่ยวกับการประมวลข้อมูล 1. โครงสร ้างแฟ้มข ้อมูล 1.1 ข ้อมูลในมุมมองของผู ้ใช ้เป็นหน่วยที่เล็กที่สุดของ ข ้อมูลที่มีความหมายต่อผู ้ใช ้คือ เขตข ้อมูล(Field) ถือว่าเป็นหน่วย พื้นฐานของข ้อมูล ประกอบด ้วยตัวอักขระตั้งแต่ 1 ตัวขึ้นไปมารวมกันให ้ เกิดความหมายขึ้นมาใช ้แทนข ้อมูลต่างๆ เมื่อรวมเขตข ้อมูลต่างๆ ที่ สัมพันธ์กัน จะเรียกชุดของเขตข ้อมูลที่ถูกรวมนั้นว่า “ระเบียน” (Record) การนาระเบียนต่างๆ ข ้างต ้นมารวมกัน จะเรียกกลุ่ม ของระเบียนนั้นว่า “แฟ้มข ้อมูล (File)”เมื่อนาแฟ้มข ้อมูลตั้งแต่ 2 แฟ้ม ขึ้นไป ที่มีความหมายสัมพันธ์เชิงตรรกะระหว่างแฟ้มข ้อมูลมารวมกัน จะ เรียกกลุ่มของแฟ้มข ้อมูลนั้นว่า “ฐานข ้อมูล (Database)” 1.2 การจัดการข ้อมูลโดยคอมพิวเตอร์ 1.3 ข ้อมูลในระบบคอมพิวเตอร์ หน่วยที่เล็กที่สุดของข ้อมูล คือ บิต (Bit) ย่อมาจาก Binary Digitเนื่องด ้วยเลขฐานสองไม่เพียงพอ กับการแทนข ้อมูลจานวนมากได ้จึงรวมหลายๆ บิตเข ้าเป็นกลุ่มเพื่อใช ้ แทนอักขระ 1 ตัว
  • 14. 2. ระเบียนข ้อมูล (Record) 2.1 ระเบียนเชิงตรรกะ (Logical Record) คือ ระเบียนใน ทัศนะของผู ้ใช ้ทั่วไป ประกอบด ้วยเขตข ้อมูลที่สัมพันธ์กันเชิงตรรกะซึ่ง กันและกัน โดยไม่คานึงว่าจะจัดเก็บไว ้ที่ใดในอุปกรณ์บันทึกข ้อมูล 2.2 ระเบียนเชิงกายภาพ (Physical Record) คือ ระเบียนใน ทัศนะของคอมพิวเตอร์ โดยพิจารณาจากการอ่านบันทึกข ้อมูลลงสื่อ บันทึกแต่ละครั้ง ซึ่งการอ่านหรือบันทึกแต่ละครั้งถือว่าเป็น 1 หน่วยของ สื่อบันทึกข ้อมูล ในการนาระเบียนข ้อมูลเชิงตรระมาจัดเก็บลงสื่อบันทึก ข ้อมูล ซึ่งระเบียนดังกล่าวจะต ้องถูกจัดให ้อยู่ในระเบียนเชิงกายภาพ ดังนั้นจะทาให ้เกิดระเบียนแบบต่าง คือ ระเบียนแบบ Unblock ระบียน แบบ Blockและระบียนแบบ Spanned Record 3. การแบ่งประเภทระเบียนเชิงตรรกะในแฟ้มข ้อมูลตามความยาว ของระเบียน สามารถแบ่งประเภทความยาวได ้ดังนี้ 3.1 ระเบียนยาวคงที่ เป็นระเบียนที่ประกอบด ้วยเขตข ้อมูลแบบ เดียวกันตลอดแฟ้ม 3.2 ระเบียนยาวแปรผัน ขนาดความยาวของระเบียนไม่คงที่ 4. เขตข ้อมูล (Fields) ในระเบียนหนึ่งมักประกอบด ้วยเขตข ้อมูล 2 ประเภท คือ 4.1 เขตข ้อมูลหลัก คือ เขตข ้อมูลที่ใช ้สาหรับอ ้างอิง จาแนก หรือ บอกตาแหน่งที่เก็บระเบียนข ้อมูล 4.2 เขตข ้อมูลทั่วไป คือ เขตข ้อมูลที่ไม่ใช ้ทั้ง PK และ SK ไม่ได ้ ใช ้ในการอ ้างอิงหรือค ้นหาข ้อมูล 5. การแยกประเภทแฟ้มข ้อมูล 5.1 แยกตามประเภทแฟ้มข ้อมูลตามเนื้อหา 5.2 แยกประเภทแฟ้มข ้อมูลตามวิธีการประมวลผล 6. การปฏิบัติการแฟ้มข ้อมูล หลักสาคัญในการปฏิบัติการแฟ้มข ้อมูล/ ประมวลผลข ้อมูล คือ จะต ้องมีการอ่านค่าของข ้อมูลในแต่ละเขตข ้อมูล ที่ต ้องการมาใช ้ประโยชน์เข ้ามาแล ้วปรับเปลี่ยน คานวณ นาเสนอใน รูปแบบที่ผู้ใช ้ต ้องการ
  • 15. 7. การจัดระเบียบแฟ้มข ้อมูล การจัดระเบียบแฟ้มข ้อมูล คือ การ ตระเตรียมเส ้นทางเข ้าถึงระเบียนระหว่างปฏิบัติการเรียกใช ้ และปรับปรุง ข ้อมูล ทั้งนี้ ระเบียบแฟ้มข ้อมูลที่ต่างชนิดกัน ก็จะให ้เส ้นทางเข ้าถึง ข ้อมูลที่แตกต่างกัน ปัญหาการใช้ข้อมูล/ฐานข้อมูลภายในองค์กร 1. มีความซ้าซ ้อนกันในการเก็บข ้อมูล 2. มีการให ้คาจากัดความของข ้อมูลแต่ละตัวไม่ตรงกัน 3. มีการจัดการ หรือใช ้วิธีการประมวลผลของข ้อมูลแตกต่างกัน ออกไป 4. มีการพัฒนาการใช ้ข ้อมูลไม่เป็นระบบ แต่ละหน่วยงาน จัดทาหรือใช ้กันอย่างไม่มีกฎเกณฑ์ ระบบฐานข้อมูล คือ ระบบจัดเก็บข้อมูลด้วยคอมพิวเตอร์โดยมีวัตถุประสงค์เพื่อบารุงรักษาข้อสนเทศ (Maintain information) และสามารถนาข้อสนเทศเหล่านั้นมาใช้ได้ทุกเมื่อที่ต้องการ ระบบฐานข้อมูลประกอบส่วนประกอบหลัก4 ส่วนได้แก่ 1. ข้อมูล (Data) ข้อมูลในฐานข้อมูลจะต้องมีคุณสมบัติ 2 ประการ คือ  เบ็ดเสร็จ (Integrate) ฐานข้อมูลเป็นแหล่งรวบรวมข้อมูลจากแฟ้มต่าง ๆ ไว้ครบถ้วนสมบูรณ์ เพื่อลดข้อมูลซ้าซ้อนระหว่างแฟ้ม  ใช้ร่วมกันได้ (Share) ข้อมูลแต่ละชิ้นในฐานข้อมูลสามารถนามาแบ่งใช้กันได้ระหว่างผู้ใช้ต่าง ๆ ในระบบ 2. ฮาร์ดแวร์ (Hardware) ประกอบด้วย อุปกรณ์บันทึกข้อมูลเช่น จานแม่เหล็ก , I/O device , Device controller , I/O channels , หน่วย
  • 16. 3. ซอฟต์แวร์ (Software) ตัวกลางเชื่อมระหว่างฐานข้อมูลและผู้ใช้คือ DBMS เป็น ซอฟต์แวร์ที่สาคัญที่สุดของระบบฐานข้อมูล นอกจากนี้ยังมี Utility , Application Development tool , Design aids , Report writers , etc. ประมวลผล และหน่วยความจาหลัก 4. ผู้ใช้ (Users) มี 3 กลุ่มใหญ่ ๆ คือ  Application Programmer เขียนโปรแกรมประยุกต์  End Users ผู้ใช้ที่อยู่กับ Online terminal เข้าถึงข้อมูลโดยผ่านโปรแกรม ประยุกต์ หรือผ่านภาษาเรียกค้น (Query Language)  Data Administrator & Database Administrator DA ผู้บริหารอาวุโส เป็นผู้ตัดสินใจว่าจะเก็บข้อมูลใดในฐานข้อมูลก่อน และกาหนดนโยบาย การรักษาความปลอดภัยของข้อมูล DBA ผู้เชี่ยวชาญระดับมืออาชีพ เป็นผู้สร้างฐานข้อมูลและนามาใช้งานจริง โดยควบคุม ทางด้านเทคนิคที่จาเป็นในการดาเนินนโยบายที่กาหนดโดย DA ข้อดีของการใช้ฐานข้อมูล ความกระทัดรัด (Compactness) ไม่ต้องมีที่ซ้าซ้อนจานวนมาก ความเร็ว (Speed) เรียกใช้ข้อมูลได้รวดเร็วขึ้น ความน่าเบื่อหน่ายลดลง (Less drudgery) ความยุ่งยากลดลง และความน่าเบื่อหน่ายลดลง
  • 17. ความสามารถโดยทั่วไปของระบบการจัดการฐานข ้อมูล 1.แปลงคาสั่งที่ใช้จัดการกับข้อมูลภายในฐานข้อมูล ให้อยู่ในรูปแบบที่ฐานข้อมูลเข้าใจ 2.นาคาสั่งต่าง ๆ ซึ่งได้รับการแปลแล้ว ไปสั่งให้ฐานข้อมูลทางาน เช่น การเรียกใช้(Retrieve) จัดเก็บ (Update) ลบ (Delete) เพิ่มข้อมูล (Add) เป็นต้น 3.ป้องกันความเสียหายที่จะเกิดขึ้นกับข้อมูลภายในฐานข้อมูล โดยจะคอยตรวจสอบว่าคาสั่งใดที่ สามารถทางานได้และคาสั่งใดที่ไม่สามารถทางานได้ 4.รักษาความสัมพันธ์ของข้อมูลภายในฐานข้อมูลให้มีความถูกต้องอยู่เสมอ 5.เก็บรายละเอียดต่างๆ ที่เกี่ยวข้องกับข้อมูลภายในฐานข้อมูลไว้ในพจนานุกรมข้อมูล (Data Dictionary) ซึ่งรายละเอียดเหล่านี้มักจะถูกเรียกว่า เมทาเดตา (MetaData) ซึ่งหมายถึง "ข้อมูลของข้อมูล" 6.ควบคุมให้ฐานข้อมูลทางานได้อย่างถูกต้องและมีประสิทธิภาพ 7.ควบคุมสถานะภาพของคอมพิวเตอร์ในการแปลสถาพฐานข้อมูล ส.ท