SlideShare a Scribd company logo
1 of 51
CHƯƠNG 1: GIỚI THIỆU
Lê Thị Minh Châu
chaultm@hcmute.edu.vn
Nội dung
• Các khái niệm cơ bản.
• Hệ thống xử lý tập tin.
• Cách tiếp cận cơ sở dữ liệu.
• Hệ quản trị cơ sở dữ liệu.
• Chu kỳ phát triển hệ thống
• Quá trình phát triển cơ sở dữ liệu
• Kiến trúc ba lược đồ
2
Nội dung
• Các khái niệm cơ bản.
• Hệ thống xử lý tập tin.
• Cách tiếp cận cơ sở dữ liệu.
• Hệ quản trị cơ sở dữ liệu.
• Chu kỳ phát triển hệ thống
• Quá trình phát triển cơ sở dữ liệu
• Kiến trúc ba lược đồ
3
Các khái niệm cơ bản
• Dữ liệu (data)
• Sự biểu diễn của các đối tượng và sự kiện được ghi nhận và được
lưu trữ trên các phương tiện của máy tính.
• Dữ liệu có cấu trúc: số, ngày, chuỗi ký tự, …
• Dữ liệu không có cấu trúc: hình ảnh, âm thanh, đoạn phim, …
• Thông tin (Information)
• Dữ liệu đã được xử lý để làm tăng sự hiểu biết của người sử dụng.
• Dữ liệu trong ngữ cảnh.
• Dữ liệu được tổng hợp / xử lý.
4
Các khái niệm cơ bản
• Dữ liệu
• Thông tin: dữ liệu trong ngữ cảnh Bảng SinhVien
5
S01 Nguyễn Trung Tiến MT00 20
S02 Lê Việt Hùng MT01 19
S03 Trần Hùng Việt MT99 21
S04 Hồ Xuân Hương MT02 18
S05 Bùi Đức Duy MT00 20
MaSV HoVaTen Lop Tuoi
S01 Nguyễn Trung Tiến MT00 20
S02 Lê Việt Hùng MT01 19
S03 Trần Hùng Việt MT99 21
S04 Hồ Xuân Hương MT02 18
S05 Bùi Đức Duy MT00 20
Các khái niệm cơ bản
• Thông tin: dữ liệu được tổng hợp / xử lý
6
MT00
40%
MT01
20%
MT02
20%
MT99
20%
Các khái niệm cơ bản
• Siêu dữ liệu (metadata)
• Dữ liệu dùng để mô tả các tính chất / đặc tính của dữ liệu khác (dữ
liệu về dữ liệu).
• Các đặc tính: định nghĩa dữ liệu, cấu trúc dữ liệu, quy tắc / ràng buộc.
• Siêu dữ liệu của bảng SinhVien
7
Data Item Value
Name Type Length Min Max Description
MaSV Character 8 Ma Sinh vien
HoTen Character 30 Ho ten Sinh vien
Lop Character 4 Lop
Tuoi Number 2 17 25 Tuoi
Nội dung
• Các khái niệm cơ bản.
• Hệ thống xử lý tập tin.
• Cách tiếp cận cơ sở dữ liệu.
• Hệ quản trị cơ sở dữ liệu.
• Chu kỳ phát triển hệ thống
• Quá trình phát triển cơ sở dữ liệu
• Kiến trúc ba lược đồ
8
Hệ thống xử lý tập tin
• Hệ thống xử lý tập tin (File Processing System) là tập hợp
các chương trình dùng để lưu trữ thao tác và truy xuất
các tập tin dữ liệu có kích thước lớn.
• Các tập tin dữ liệu được lưu trữ trong các thư mục (Folder).
9
Hệ thống xử lý tập tin
10
File Processing Systems at Pine Valley Furniture Company
Hệ thống xử lý tập tin
• Các thành phần của hệ thống xử lý tập tin
• Phần cứng: các máy tính.
• Phần mềm:
• Hệ điều hành.
• Các tiện ích.
• Các tập tin.
• Các chương trình quản lý tập tin.
• Các chương trình ứng dụng tạo các báo cáo từ các dữ liệu được lưu
trữ trong các tập tin.
• Con người: người quản lý, chuyên gia, người lập trình, người sử
dụng cuối cùng.
• Các thủ tục: các lệnh và các quy tắc chi phối việc thiết kế và sử
dụng các thành phần của phần mềm.
• Dữ liệu: tập hợp các sự kiện.
11
Hệ thống xử lý tập tin
• Các chương trình xử lý tập tin
• Tạo cấu trúc tập tin.
• Thêm dữ liệu vào tập tin.
• Xóa dữ liệu của tập tin.
• Sửa dữ liệu của tập tin.
• Tìm kiếm dữ liệu trong tập tin.
• Liệt kê dữ liệu của tập tin.
12
Hệ thống xử lý tập tin
• Nhược điểm
• Phụ thuộc dữ liệu – chương trình (Program – Data Dependence)
• Còn được gọi là Phụ thuộc dữ liệu (Data Dependence).
• Mỗi người lập trình phải duy trì dữ liệu riêng biệt.
• Mỗi chương trình ứng dụng phải duy trì siêu dữ liệu của các tập tin mà
chúng sử dụng  khi các cấu trúc dữ liệu bị thay đổi thì chương trình
ứng dụng cũng phải bị thay đổi theo.
• Mỗi chương trình ứng dụng phải có các chương trình con xử lý để đọc,
thêm, sửa và xóa dữ liệu.
• Không có điều khiển chung phối hợp.
• Các dạng thức tập tin không có cùng chuẩn.
13
Hệ thống xử lý tập tin
• Nhược điểm
• Dư thừa dữ liệu / Trùng lặp dữ liệu (Data Redundancy / Duplication
of Data)
• Tốn vùng nhớ để lưu trữ dữ liệu dư thừa.
• Các hệ thống / chương trình khác nhau có các bản dữ liệu riêng biệt
của cùng dữ liệu.
• Khó bảo trì dữ liệu
• Việc cập nhật dữ liệu của một tập tin có thể dẫn đến các mâu thuẫn dữ liệu.
• Vi phạm tính toàn vẹn dữ liệu (Data Integrity).
14
Hệ thống xử lý tập tin
15
Duplicate Data
Hệ thống xử lý tập tin
• Nhược điểm
• Hạn chế việc dung chung dữ liệu
• Mỗi ứng dụng có các tập tin riêng biệt, ít sử dụng chung dữ liệu với các
ứng dụng khác.
• Thời gian phát triển lâu
• Người lập trình phải thiết kế các dạng tập tin dữ liệu riêng và viết cách
truy xuất tập tin cho mỗi ứng dụng mới.
• Chi phí bảo trì chương trình cao
• Các nhược điểm nêu trên làm cho việc bảo trì chương trình gặp nhiều
khó khăn, thường chiếm khoảng 80% ngân sách phát triển HTTT.
16
Nội dung
• Các khái niệm cơ bản.
• Hệ thống xử lý tập tin.
• Cách tiếp cận cơ sở dữ liệu.
• Hệ quản trị cơ sở dữ liệu.
• Chu kỳ phát triển hệ thống
• Quá trình phát triển cơ sở dữ liệu
• Kiến trúc ba lược đồ
17
Cách tiếp cận cơ sở dữ liệu
• Kho dữ liệu trung tâm chứa các dữ liệu dùng chung.
• Dữ liệu được quản lý bởi một hệ quản trị cơ sở dữ liệu
(Database Management System - DBMS).
• Dữ liệu được lưu trữ theo một dạng thức chuẩn và thích
hợp.
18
Cách tiếp cận cơ sở dữ liệu
• Cơ sở dữ liệu (Database - DB)
• Sự tập hợp có tổ chức các dữ liệu có liên quan luận lý với nhau và
phải được dùng chung.
• Có tổ chức (organized): người sử dụng có thể dễ dàng lưu trữ, thao tác
và truy xuất dữ liệu.
• Có liên quan luận lý (logically related): dữ liệu mô tả một lãnh vực mà
nhóm người sử dụng quan tâm và được dùng để trả lời các câu hỏi liên
quan đến lãnh vực này.
19
Cách tiếp cận cơ sở dữ liệu
20
• Cơ sở dữ liệu
Cách tiếp cận cơ sở dữ liệu
• Ưu điểm
• Trừu tượng hóa dữ liệu (Data Abstraction): DBMS cung cấp sự
biểu diễn ý niệm của dữ liệu (mô hình dữ liệu), che giấu cách lưu
trữ và truy xuất dữ liệu ở mức vật lý.
• Độc lập dữ liệu – chương trình (Program – Data Independence): các
chương trình ứng dụng không chứa mô tả cấu trúc dữ liệu.
• Độc lập tác vụ - chương trình (Program – Operation independence):
DBMS quản lý các truy xuất và cập nhật dữ liệu, ứng dụng không cần
biết cách thức truy xuất và cập nhật dữ liệu.
• Giảm tối thiểu sự dư thừa dữ liệu.
• Nâng cao tính nhất quán dữ liệu (Data Consistency) / toàn vẹn dữ
liệu (Data Integrity).
21
Cách tiếp cận cơ sở dữ liệu
• Ưu điểm
• Khung nhìn (View) chứa dữ liệu ảo (virtual data) dẫn xuất từ cơ sở
dữ liệu.
• Mỗi nhóm người sử dụng có khung nhìn riêng.
• Dùng chung dữ liệu (sharing of data): nhiều chương trình ứng dụng
hoặc giao tác (transaction) dùng chung dữ liệu.
• Điều khiển tương tranh (concurrency control): DBMS đảm bảo việc truy
xuất dữ liệu dùng chung của các giao tác là đúng đắn.
• Nâng cao chất lượng dữ liệu
• Các ràng buộc (constraint), quy tắc hợp lệ của dữ liệu (data validation
rule).
• Tăng hiệu suất phát triển ứng dụng.
22
Cách tiếp cận cơ sở dữ liệu
• Nhược điểm
• Phức tạp.
• Chi phí ban đầu
• Chi phí phần cứng.
• Chi phí cài đặt và quản lý.
• Chi phí chuyển đổi.
• Chi phí vận hành
• Cần nhân viên mới có chuyên môn.
• Cần phải chép lưu và phục hồi.
• Bị ảnh hưởng nhiều do hư hỏng.
• Mâu thuẫn về mặt tổ chức
• Rất khó thay đổi các thói quen cũ.
23
Các loại cơ sở dữ liệu
• CSDL cá nhân (Personal Database)
• CSDL riêng
• CSDL nhóm làm việc (Workgroup Database)
• Mạng cục bộ (ít hơn 25 người sử dụng)
• CSDL phòng ban (Department Database)
• Mạng cục bộ (từ 25 đến 100 người sử dụng)
• CSDL xí nghiệp (Enterprise Database)
• Mạng diện rộng (hàng trăm hoặc hàng ngàn người sử dụng)
24
Các loại cơ sở dữ liệu
25
Nội dung
• Các khái niệm cơ bản.
• Hệ thống xử lý tập tin.
• Cách tiếp cận cơ sở dữ liệu.
• Hệ quản trị cơ sở dữ liệu.
• Chu kỳ phát triển hệ thống
• Quá trình phát triển cơ sở dữ liệu
• Kiến trúc ba lược đồ
26
Hệ quản trị cơ sở dữ liệu
• Hệ quản trị cơ sở dữ liệu (Database Management System
– DBMS): hệ thống các chương trình dùng để quản lý cấu
trúc và dữ liệu của CSDL và điều khiển truy xuất dữ liệu
trong CSDL.
27
Hệ quản trị cơ sở dữ liệu
• Lưu trữ, truy xuất và cập nhật dữ liệu
• Ngôn ngữ định nghĩa dữ liệu (Data Definition Language - DDL)
• Ngôn ngữ thao tác dữ liệu (Data Manipulation Language - DML)
• Quản lý giao tác (Transaction Management).
• Điều khiển tương tranh (Concurrency Control)
• Chép lưu và phục hồi dữ liệu
• Bảo mật dữ liệu
• Ngôn ngữ điều khiển dữ liệu (Data Control Languge – DCL)
• Duy trì tính toàn vẹn / nhất quán dữ liệu.
• Cung cấp các tiện ích.
28
Hệ quản trị cơ sở dữ liệu
• Ngôn ngữ định nghĩa dữ liệu: tạo cấu trúc Bảng Customer
CREATE TABLE CUSTOMER
(CUST_ID NUMBER(11,0) NOT NULL,
NAME VARCHAR(25) NOT NULL,
ADDRESS VARCHAR(30),
CITY VARCHAR(20),
CONSTRAINT PK_CUSTOMER PRIMARY KEY (CUST_ID));
• Ngôn ngữ thao tác dữ liệu: liệt kê mã, tên và địa chỉ của
các khách hàng thuộc Thành phố ‘HCM’
SELECT CUST_ID, NAME, ADDRESS
FROM CUSTOMER
WHERE CITY = ‘HCM’;
• Ngôn ngữ điều khiển dữ liệu: cho phép người sử dụng
Chau và Truc được phép xem và thêm dữ liệu vào bảng
Customer.
GRANT SELECT, INSERT ON CUSTOMER
TO CHAU, TRUC;
29
Các thành phần của môi trường hệ quản
trị cơ sở dữ liệu
• Phần cứng
• Máy tính cá nhân, máy tính lớn, …
• Dữ liệu
• Phần mềm
• Hệ quản trị CSDL
• Chương trình ứng dụng
• Hệ điều hành.
• Các thủ tục (Procedure)
• Chỉ thị (Instruction)
• Quy tắc (Rule)
30
Các thành phần của môi trường hệ quản
trị cơ sở dữ liệu
• Con người
• Người quản trị dữ liệu (Data Administrator - DA).
• Người quản trị cơ sở dữ liệu (Database Administrator – DBA).
• Người thiết kế CSDL
• Người thiết kế CSDL luận lý (Logical Database Designer).
• Người thiết kế CSDL vật lý (Physical Database Designer).
• Người phát triển ứng dụng.
• Người sử dụng cuối cùng.
31
Hệ cơ sở dữ liệu
• Hệ cơ sở dữ liệu – Database System
• DS = DBMS + DB
32
Sự phát triển các hệ cơ sở dữ liệu
• Hệ thống tập tin (flat file): 1960 – 1980.
• Hệ CSDL phân cấp (hierachical): 1970 – 1990.
• Hệ CSDL mạng (network): 1970 – 1990.
• Hệ CSDL quan hệ (relational): 1980 – nay.
• Hệ CSDL hướng đối tượng (Object – Oriented): 1990 –
nay.
• Hệ CSDL đối tượng – quan hệ (object – relational): 1990
– nay.
• Kho dữ liệu (Data warehouse): 1980 – nay.
• Web-enalbled: 1990 – nay.
33
Nội dung
• Các khái niệm cơ bản.
• Hệ thống xử lý tập tin.
• Cách tiếp cận cơ sở dữ liệu.
• Hệ quản trị cơ sở dữ liệu.
• Chu kỳ phát triển hệ thống
• Quá trình phát triển cơ sở dữ liệu
• Kiến trúc ba lược đồ
34
Chu kỳ phát triển hệ thống
• Chu kỳ phát triển hệ thống
(Systems Development Life
Cycle - SDLC)
35
Chu kỳ phát triển hệ thống
• Xác định và chọn dự án
• Nghiên cứu sơ bộ về tình hình nghiệp vụ.
• Bản yêu cầu về phát triển hệ thống thông tin.
• Bắt đầu và lập kế hoạch dự án
• Phát biểu tình hình nghiệp vụ và hệ thống thông tin hỗ trợ như thế
nào để giải quyết các vấn đề nghiệp vụ.
• Bản yêu cầu nghiên cứu các thay đổi của hệ thống hiện tại hoặc
xây dựng hệ thống mới.
• Phân tích
• Phân tích hoàn toàn tình hình nghiệp vụ, xác định và phân tích các
yêu cầu.
• Các mô tả chức năng của hệ thống.
36
Chu kỳ phát triển hệ thống
• Thiết kế luận lý
• Nêu ra và cấu trúc hóa tất cả các yêu cầu thông tin.
• Các mô tả chi tiết chức năng của form, report, … và các quy tắc xử
lý.
• Thiết kế vật lý
• Cấu trúc của các chương trình, cấu trúc vật lý của CSDL.
• Thực hiện
• Viết các chương trình, tạo các tập tin dữ liệu, kiểm tra, cài đặt hệ
thống mới, đào tạo những người sử dụng, lập tài liệu cuối cùng.
• Bảo trì
• Giám sát vận hành hệ thống, sửa lỗi, nâng cấp hệ thống.
37
Nội dung
• Các khái niệm cơ bản.
• Hệ thống xử lý tập tin.
• Cách tiếp cận cơ sở dữ liệu.
• Hệ quản trị cơ sở dữ liệu.
• Chu kỳ phát triển hệ thống
• Quá trình phát triển cơ sở dữ liệu
• Kiến trúc ba lược đồ
38
Quá trình phát triển cơ sở dữ liệu
• Mô hình hóa xí nghiệp (Enterprise Modeling)
• Thực hiện trong giai đoạn xác định và chọn dự án.
• Phân tích việc xử lý dữ liệu hiện tại.
• Phân tích các chức năng nghiệp vụ chung.
• Phân tích các yêu cầu về dữ liệu và các CSDL để hỗ trợ nghiệp vụ.
39
Quá trình phát triển cơ sở dữ liệu
• Mô hình hóa dữ liệu ý niệm (Conceptual Data Modeling)
• Giai đoạn bắt đầu và lập kế hoạch dự án
• Xây dựng sơ đồ liên kết thực thể.
• Lập tài liệu phác thảo về phạm vi của các dữ liệu liên quan đến dự án.
• Giai đoạn phân tích
• Xây dựng mô hình dữ liệu chi tiết trong mô hình dữ liệu ý niệm
(conceptual data model) còn gọi là lược đồ ý niệm (conceptual
schema).
• Định nghĩa tất cả các thuộc tính của dữ liệu.
• Liệt kê tất cả các loại dữ liệu.
• Biễu diễn tất cả các mối liên kết giữa các loại dữ liệu.
• Xác định tất cả các ràng buộc toàn vẹn dữ liệu.
40
Quá trình phát triển cơ sở dữ liệu
• Thiết kế CSDL luận lý (Logical Database Design)
• Thực hiện trong giai đoạn thiết kế luận lý. Xây dựng CSDL từ hai
hướng:
1. Chuyển mô hình dữ liệu ý niệm thành các quan hệ, dựa vào lý thuyết
CSDL quan hệ.
2. Thiết kế mỗi chương trình trong hệ thống thông tin:
a) Dạng thức nhập, xuất của chương trình.
b) Thực hiện chi tiết các giao tác, các bản báo cáo, các mẫu nhập và các truy
vấn trên CSDL.
c) Phân tích các bản báo cáo, giao tác để xác định khung nhìn (user view) còn
gọi là lược đồ ngoài (external schema) cần thiết trong CSDL.
41
Quá trình phát triển cơ sở dữ liệu
• Thiết kế và định nghĩa CSDL vật lý
• Thực hiện trong giai đoạn thiết kế vật lý.
• Xác định tổ chức của dữ liệu trong vùng lưu trữ của máy tính.
• Xác định cấu trúc vật lý của CSDL trong hệ quản trị CSDL, được gọi là
lược đồ vật lý (physical schema) hoặc lược đồ trong (internal schema).
• Thiết kế các chương trình xử lý CSDL.
42
Quá trình phát triển cơ sở dữ liệu
• Thực hiện CSDL
• Thực hiện trong giai đoạn thực hiện của chu kỳ phát triển hệ thống.
• Viết và chạy kiểm tra các chương trình xử lý CSDL.
• Hoàn thành tài liệu về CSDL và các tài liệu đào tạo.
• Cài đặt CSDL và chuyển đổi dữ liệu từ các hệ thống kế thừa.
• Bảo trì CSDL
• Thực hiện trong giai đoạn bảo trì.
• Phân tích CSDL và các chương trình ứng dụng CSDL để đáp ứng
các yêu cầu thông tin phát sinh.
• Điều chỉnh CSDL để nâng cao hiệu suất của ứng dụng.
• Xác định và sửa chữa lỗi sai trong CSDL và các chương trình ứng
dụng CSDL.
• Phục hồi CSDL khi hư hỏng.
43
Kiến trúc ba lược đồ
• Kiến trúc CSDL ba lược đồ (three – schema database
architecture) còn được gọi là kiến trúc ba mức ANSI –
SPARC (ANSI – SPARC three – level architecture).
• Mục tiêu của kiến trúc ba lược đồ là tách biệt các chương
trình ứng dụng với CSDL vật lý.
• Kiến trúc ba lược đồ là một kiến trúc mà lược đồ CSDL
được định nghĩa ở ba mức.
• Mức trong
• Mức ý niệm
• Mức ngoài
44
Kiến trúc ba lược đồ
• Mức trong (Internal Level)
• Lược đồ trong (Internal Schema) sử dụng mô hình dữ liệu vật lý và
mô tả đầy đủ chi tiết việc lưu trữ dữ liệu và cách thức truy xuất
CSDL.
• Mức ý niệm (Conceptual Level)
• Che giấu chi tiết của các cấu trúc lưu trữ vật lý.
• Lược đồ ý niệm (Conceptual Schema) mô tả các thực thể, các kiểu
dữ liệu, các mối liên kết giữa các thực thể, các tác vụ của người sử
dụng và các ràng buộc.
• Mức ngoài (External Level) hoặc mức khung nhìn (View
Level)
• Mỗi lược đồ ngoài (External Schema) hoặc khung nhìn (View) mô
tả luận lý một phần của CSDL được dùng cho một nhóm người sử
dụng.
45
Kiến trúc ba lược đồ
46
Ánh xạ ngoài – ý niệm
Ánh xạ ý niệm – trong
SV (MaSV, HoTen, Lop)
SV (MaSV, HoTen, Lop)
Lop (MaLop, TenLop)
Kiến trúc ba lược đồ
• Độc lập dữ liệu – Chương trình (Program – Data
Independence) là một đặc tính mà cấu trúc của các tập tin
dữ liệu (siêu dữ liệu) được lưu trữ ở ngoài chương trình
truy xuất dữ liệu.
• Độc lập dữ liệu – chương trình còn được gọi là độc lập dữ liệu
(Data Independence).
47
Kiến trúc ba lược đồ
• Hai mức độc lập dữ liệu
• Độc lập dữ liệu luận lý (Logical Data Independence) là đặc tính
thay đổi lược đồ ý niệm mà không thay đổi các lược đồ ngoài và
các chương trình ứng dụng.
• Thay đổi ánh xạ ngoài – ý niệm (External – Conceptual Mapping).
• Độc lập dữ liệu vật lý (Physical Data Independence) là đặc tính
thay đổi lược đồ trong mà không thay đổi lược đồ ý niệm.
• Thay đổi ánh xạ ý niệm – trong (Conceptual – Internal Mapping).
48
Kiến trúc ba lược đồ
49
Độc lập dữ liệu luận lý
Độc lập dữ liệu vật lý
SV (MaSV, HoTen, Lop)
SV (MaSV, HoTen, Lop)
Lop (MaLop, TenLop)
Kiến trúc ba lược đồ
• Trong suốt dữ liệu (Data Transparency) là một đặc tính
truy xuất dữ liệu mà không biết dữ liệu này có được như
thế nào (dữ liệu này ở đâu, cách thức tạo ra dữ liệu này).
• Mỗi mức trong kiến trúc ba lược đồ là một mức trong suốt
dữ liệu.
• Trong suốt dữ liệu mức trong (Internal Data Transparency).
• Trong suốt dữ liệu mức ý niệm (Conceptual Data Transparancy).
• Trong suốt dữ liệu mức ngoài (External Data Transparency).
50
Q&A
51

More Related Content

Similar to Chuong 1 - Gioi Thieu.pptx

Hệ quản trị cơ sở dữ liệu phạm gia tiến[bookbooming.com]
Hệ quản trị cơ sở dữ liệu   phạm gia tiến[bookbooming.com]Hệ quản trị cơ sở dữ liệu   phạm gia tiến[bookbooming.com]
Hệ quản trị cơ sở dữ liệu phạm gia tiến[bookbooming.com]bookbooming1
 
Bài Giảng Môn Học Cơ Sở Dữ Liệu Nâng Cao
Bài Giảng Môn Học Cơ Sở Dữ Liệu Nâng Cao Bài Giảng Môn Học Cơ Sở Dữ Liệu Nâng Cao
Bài Giảng Môn Học Cơ Sở Dữ Liệu Nâng Cao nataliej4
 
bai giang mon sql- buoi 1.ppt
bai giang mon sql- buoi 1.pptbai giang mon sql- buoi 1.ppt
bai giang mon sql- buoi 1.pptHungHuyNguyen3
 
Cơ sở dữ liệu ts.phạm thế quế[bookbooming.com]
Cơ sở dữ liệu   ts.phạm thế quế[bookbooming.com]Cơ sở dữ liệu   ts.phạm thế quế[bookbooming.com]
Cơ sở dữ liệu ts.phạm thế quế[bookbooming.com]bookbooming1
 
Cơ sở dữ liệu
Cơ sở dữ liệuCơ sở dữ liệu
Cơ sở dữ liệuThành Luân
 
Tổng quan về cơ sở dữ liệu
Tổng quan về cơ sở dữ liệuTổng quan về cơ sở dữ liệu
Tổng quan về cơ sở dữ liệuTonhaco Bestco
 
Co so du lieu phan tan
Co so du lieu phan tanCo so du lieu phan tan
Co so du lieu phan tanThao Vu
 
Bài 1: Tổng quan về cơ sở dữ liệu - Giáo trình FPT
Bài 1: Tổng quan về cơ sở dữ liệu - Giáo trình FPTBài 1: Tổng quan về cơ sở dữ liệu - Giáo trình FPT
Bài 1: Tổng quan về cơ sở dữ liệu - Giáo trình FPTMasterCode.vn
 
Chương 1 . Khái niệm chung về CSDL.pdf
Chương 1 . Khái   niệm chung về CSDL.pdfChương 1 . Khái   niệm chung về CSDL.pdf
Chương 1 . Khái niệm chung về CSDL.pdfBiNgh4
 
Hadoop trong triển khai Big Data
Hadoop trong triển khai Big DataHadoop trong triển khai Big Data
Hadoop trong triển khai Big DataNguyễn Duy Nhân
 

Similar to Chuong 1 - Gioi Thieu.pptx (20)

Hệ quản trị cơ sở dữ liệu phạm gia tiến[bookbooming.com]
Hệ quản trị cơ sở dữ liệu   phạm gia tiến[bookbooming.com]Hệ quản trị cơ sở dữ liệu   phạm gia tiến[bookbooming.com]
Hệ quản trị cơ sở dữ liệu phạm gia tiến[bookbooming.com]
 
Bài Giảng Môn Học Cơ Sở Dữ Liệu Nâng Cao
Bài Giảng Môn Học Cơ Sở Dữ Liệu Nâng Cao Bài Giảng Môn Học Cơ Sở Dữ Liệu Nâng Cao
Bài Giảng Môn Học Cơ Sở Dữ Liệu Nâng Cao
 
bai giang mon sql- buoi 1.ppt
bai giang mon sql- buoi 1.pptbai giang mon sql- buoi 1.ppt
bai giang mon sql- buoi 1.ppt
 
C1
C1C1
C1
 
Cosodulieu
CosodulieuCosodulieu
Cosodulieu
 
Cơ sở dữ liệu ts.phạm thế quế[bookbooming.com]
Cơ sở dữ liệu   ts.phạm thế quế[bookbooming.com]Cơ sở dữ liệu   ts.phạm thế quế[bookbooming.com]
Cơ sở dữ liệu ts.phạm thế quế[bookbooming.com]
 
CSDL_In ngay
CSDL_In ngayCSDL_In ngay
CSDL_In ngay
 
Cơ sở dữ liệu
Cơ sở dữ liệuCơ sở dữ liệu
Cơ sở dữ liệu
 
Tổng quan về cơ sở dữ liệu
Tổng quan về cơ sở dữ liệuTổng quan về cơ sở dữ liệu
Tổng quan về cơ sở dữ liệu
 
Co so du lieu phan tan
Co so du lieu phan tanCo so du lieu phan tan
Co so du lieu phan tan
 
Cosodulieu
CosodulieuCosodulieu
Cosodulieu
 
Bài 1: Tổng quan về cơ sở dữ liệu - Giáo trình FPT
Bài 1: Tổng quan về cơ sở dữ liệu - Giáo trình FPTBài 1: Tổng quan về cơ sở dữ liệu - Giáo trình FPT
Bài 1: Tổng quan về cơ sở dữ liệu - Giáo trình FPT
 
Com201 slide 1
Com201   slide 1Com201   slide 1
Com201 slide 1
 
Bai 11
Bai 11Bai 11
Bai 11
 
Chuong 1
Chuong 1Chuong 1
Chuong 1
 
Chương 1 . Khái niệm chung về CSDL.pdf
Chương 1 . Khái   niệm chung về CSDL.pdfChương 1 . Khái   niệm chung về CSDL.pdf
Chương 1 . Khái niệm chung về CSDL.pdf
 
Csdl
CsdlCsdl
Csdl
 
Thiet ke csdl pt
Thiet ke csdl ptThiet ke csdl pt
Thiet ke csdl pt
 
Hadoop
HadoopHadoop
Hadoop
 
Hadoop trong triển khai Big Data
Hadoop trong triển khai Big DataHadoop trong triển khai Big Data
Hadoop trong triển khai Big Data
 

Chuong 1 - Gioi Thieu.pptx

  • 1. CHƯƠNG 1: GIỚI THIỆU Lê Thị Minh Châu chaultm@hcmute.edu.vn
  • 2. Nội dung • Các khái niệm cơ bản. • Hệ thống xử lý tập tin. • Cách tiếp cận cơ sở dữ liệu. • Hệ quản trị cơ sở dữ liệu. • Chu kỳ phát triển hệ thống • Quá trình phát triển cơ sở dữ liệu • Kiến trúc ba lược đồ 2
  • 3. Nội dung • Các khái niệm cơ bản. • Hệ thống xử lý tập tin. • Cách tiếp cận cơ sở dữ liệu. • Hệ quản trị cơ sở dữ liệu. • Chu kỳ phát triển hệ thống • Quá trình phát triển cơ sở dữ liệu • Kiến trúc ba lược đồ 3
  • 4. Các khái niệm cơ bản • Dữ liệu (data) • Sự biểu diễn của các đối tượng và sự kiện được ghi nhận và được lưu trữ trên các phương tiện của máy tính. • Dữ liệu có cấu trúc: số, ngày, chuỗi ký tự, … • Dữ liệu không có cấu trúc: hình ảnh, âm thanh, đoạn phim, … • Thông tin (Information) • Dữ liệu đã được xử lý để làm tăng sự hiểu biết của người sử dụng. • Dữ liệu trong ngữ cảnh. • Dữ liệu được tổng hợp / xử lý. 4
  • 5. Các khái niệm cơ bản • Dữ liệu • Thông tin: dữ liệu trong ngữ cảnh Bảng SinhVien 5 S01 Nguyễn Trung Tiến MT00 20 S02 Lê Việt Hùng MT01 19 S03 Trần Hùng Việt MT99 21 S04 Hồ Xuân Hương MT02 18 S05 Bùi Đức Duy MT00 20 MaSV HoVaTen Lop Tuoi S01 Nguyễn Trung Tiến MT00 20 S02 Lê Việt Hùng MT01 19 S03 Trần Hùng Việt MT99 21 S04 Hồ Xuân Hương MT02 18 S05 Bùi Đức Duy MT00 20
  • 6. Các khái niệm cơ bản • Thông tin: dữ liệu được tổng hợp / xử lý 6 MT00 40% MT01 20% MT02 20% MT99 20%
  • 7. Các khái niệm cơ bản • Siêu dữ liệu (metadata) • Dữ liệu dùng để mô tả các tính chất / đặc tính của dữ liệu khác (dữ liệu về dữ liệu). • Các đặc tính: định nghĩa dữ liệu, cấu trúc dữ liệu, quy tắc / ràng buộc. • Siêu dữ liệu của bảng SinhVien 7 Data Item Value Name Type Length Min Max Description MaSV Character 8 Ma Sinh vien HoTen Character 30 Ho ten Sinh vien Lop Character 4 Lop Tuoi Number 2 17 25 Tuoi
  • 8. Nội dung • Các khái niệm cơ bản. • Hệ thống xử lý tập tin. • Cách tiếp cận cơ sở dữ liệu. • Hệ quản trị cơ sở dữ liệu. • Chu kỳ phát triển hệ thống • Quá trình phát triển cơ sở dữ liệu • Kiến trúc ba lược đồ 8
  • 9. Hệ thống xử lý tập tin • Hệ thống xử lý tập tin (File Processing System) là tập hợp các chương trình dùng để lưu trữ thao tác và truy xuất các tập tin dữ liệu có kích thước lớn. • Các tập tin dữ liệu được lưu trữ trong các thư mục (Folder). 9
  • 10. Hệ thống xử lý tập tin 10 File Processing Systems at Pine Valley Furniture Company
  • 11. Hệ thống xử lý tập tin • Các thành phần của hệ thống xử lý tập tin • Phần cứng: các máy tính. • Phần mềm: • Hệ điều hành. • Các tiện ích. • Các tập tin. • Các chương trình quản lý tập tin. • Các chương trình ứng dụng tạo các báo cáo từ các dữ liệu được lưu trữ trong các tập tin. • Con người: người quản lý, chuyên gia, người lập trình, người sử dụng cuối cùng. • Các thủ tục: các lệnh và các quy tắc chi phối việc thiết kế và sử dụng các thành phần của phần mềm. • Dữ liệu: tập hợp các sự kiện. 11
  • 12. Hệ thống xử lý tập tin • Các chương trình xử lý tập tin • Tạo cấu trúc tập tin. • Thêm dữ liệu vào tập tin. • Xóa dữ liệu của tập tin. • Sửa dữ liệu của tập tin. • Tìm kiếm dữ liệu trong tập tin. • Liệt kê dữ liệu của tập tin. 12
  • 13. Hệ thống xử lý tập tin • Nhược điểm • Phụ thuộc dữ liệu – chương trình (Program – Data Dependence) • Còn được gọi là Phụ thuộc dữ liệu (Data Dependence). • Mỗi người lập trình phải duy trì dữ liệu riêng biệt. • Mỗi chương trình ứng dụng phải duy trì siêu dữ liệu của các tập tin mà chúng sử dụng  khi các cấu trúc dữ liệu bị thay đổi thì chương trình ứng dụng cũng phải bị thay đổi theo. • Mỗi chương trình ứng dụng phải có các chương trình con xử lý để đọc, thêm, sửa và xóa dữ liệu. • Không có điều khiển chung phối hợp. • Các dạng thức tập tin không có cùng chuẩn. 13
  • 14. Hệ thống xử lý tập tin • Nhược điểm • Dư thừa dữ liệu / Trùng lặp dữ liệu (Data Redundancy / Duplication of Data) • Tốn vùng nhớ để lưu trữ dữ liệu dư thừa. • Các hệ thống / chương trình khác nhau có các bản dữ liệu riêng biệt của cùng dữ liệu. • Khó bảo trì dữ liệu • Việc cập nhật dữ liệu của một tập tin có thể dẫn đến các mâu thuẫn dữ liệu. • Vi phạm tính toàn vẹn dữ liệu (Data Integrity). 14
  • 15. Hệ thống xử lý tập tin 15 Duplicate Data
  • 16. Hệ thống xử lý tập tin • Nhược điểm • Hạn chế việc dung chung dữ liệu • Mỗi ứng dụng có các tập tin riêng biệt, ít sử dụng chung dữ liệu với các ứng dụng khác. • Thời gian phát triển lâu • Người lập trình phải thiết kế các dạng tập tin dữ liệu riêng và viết cách truy xuất tập tin cho mỗi ứng dụng mới. • Chi phí bảo trì chương trình cao • Các nhược điểm nêu trên làm cho việc bảo trì chương trình gặp nhiều khó khăn, thường chiếm khoảng 80% ngân sách phát triển HTTT. 16
  • 17. Nội dung • Các khái niệm cơ bản. • Hệ thống xử lý tập tin. • Cách tiếp cận cơ sở dữ liệu. • Hệ quản trị cơ sở dữ liệu. • Chu kỳ phát triển hệ thống • Quá trình phát triển cơ sở dữ liệu • Kiến trúc ba lược đồ 17
  • 18. Cách tiếp cận cơ sở dữ liệu • Kho dữ liệu trung tâm chứa các dữ liệu dùng chung. • Dữ liệu được quản lý bởi một hệ quản trị cơ sở dữ liệu (Database Management System - DBMS). • Dữ liệu được lưu trữ theo một dạng thức chuẩn và thích hợp. 18
  • 19. Cách tiếp cận cơ sở dữ liệu • Cơ sở dữ liệu (Database - DB) • Sự tập hợp có tổ chức các dữ liệu có liên quan luận lý với nhau và phải được dùng chung. • Có tổ chức (organized): người sử dụng có thể dễ dàng lưu trữ, thao tác và truy xuất dữ liệu. • Có liên quan luận lý (logically related): dữ liệu mô tả một lãnh vực mà nhóm người sử dụng quan tâm và được dùng để trả lời các câu hỏi liên quan đến lãnh vực này. 19
  • 20. Cách tiếp cận cơ sở dữ liệu 20 • Cơ sở dữ liệu
  • 21. Cách tiếp cận cơ sở dữ liệu • Ưu điểm • Trừu tượng hóa dữ liệu (Data Abstraction): DBMS cung cấp sự biểu diễn ý niệm của dữ liệu (mô hình dữ liệu), che giấu cách lưu trữ và truy xuất dữ liệu ở mức vật lý. • Độc lập dữ liệu – chương trình (Program – Data Independence): các chương trình ứng dụng không chứa mô tả cấu trúc dữ liệu. • Độc lập tác vụ - chương trình (Program – Operation independence): DBMS quản lý các truy xuất và cập nhật dữ liệu, ứng dụng không cần biết cách thức truy xuất và cập nhật dữ liệu. • Giảm tối thiểu sự dư thừa dữ liệu. • Nâng cao tính nhất quán dữ liệu (Data Consistency) / toàn vẹn dữ liệu (Data Integrity). 21
  • 22. Cách tiếp cận cơ sở dữ liệu • Ưu điểm • Khung nhìn (View) chứa dữ liệu ảo (virtual data) dẫn xuất từ cơ sở dữ liệu. • Mỗi nhóm người sử dụng có khung nhìn riêng. • Dùng chung dữ liệu (sharing of data): nhiều chương trình ứng dụng hoặc giao tác (transaction) dùng chung dữ liệu. • Điều khiển tương tranh (concurrency control): DBMS đảm bảo việc truy xuất dữ liệu dùng chung của các giao tác là đúng đắn. • Nâng cao chất lượng dữ liệu • Các ràng buộc (constraint), quy tắc hợp lệ của dữ liệu (data validation rule). • Tăng hiệu suất phát triển ứng dụng. 22
  • 23. Cách tiếp cận cơ sở dữ liệu • Nhược điểm • Phức tạp. • Chi phí ban đầu • Chi phí phần cứng. • Chi phí cài đặt và quản lý. • Chi phí chuyển đổi. • Chi phí vận hành • Cần nhân viên mới có chuyên môn. • Cần phải chép lưu và phục hồi. • Bị ảnh hưởng nhiều do hư hỏng. • Mâu thuẫn về mặt tổ chức • Rất khó thay đổi các thói quen cũ. 23
  • 24. Các loại cơ sở dữ liệu • CSDL cá nhân (Personal Database) • CSDL riêng • CSDL nhóm làm việc (Workgroup Database) • Mạng cục bộ (ít hơn 25 người sử dụng) • CSDL phòng ban (Department Database) • Mạng cục bộ (từ 25 đến 100 người sử dụng) • CSDL xí nghiệp (Enterprise Database) • Mạng diện rộng (hàng trăm hoặc hàng ngàn người sử dụng) 24
  • 25. Các loại cơ sở dữ liệu 25
  • 26. Nội dung • Các khái niệm cơ bản. • Hệ thống xử lý tập tin. • Cách tiếp cận cơ sở dữ liệu. • Hệ quản trị cơ sở dữ liệu. • Chu kỳ phát triển hệ thống • Quá trình phát triển cơ sở dữ liệu • Kiến trúc ba lược đồ 26
  • 27. Hệ quản trị cơ sở dữ liệu • Hệ quản trị cơ sở dữ liệu (Database Management System – DBMS): hệ thống các chương trình dùng để quản lý cấu trúc và dữ liệu của CSDL và điều khiển truy xuất dữ liệu trong CSDL. 27
  • 28. Hệ quản trị cơ sở dữ liệu • Lưu trữ, truy xuất và cập nhật dữ liệu • Ngôn ngữ định nghĩa dữ liệu (Data Definition Language - DDL) • Ngôn ngữ thao tác dữ liệu (Data Manipulation Language - DML) • Quản lý giao tác (Transaction Management). • Điều khiển tương tranh (Concurrency Control) • Chép lưu và phục hồi dữ liệu • Bảo mật dữ liệu • Ngôn ngữ điều khiển dữ liệu (Data Control Languge – DCL) • Duy trì tính toàn vẹn / nhất quán dữ liệu. • Cung cấp các tiện ích. 28
  • 29. Hệ quản trị cơ sở dữ liệu • Ngôn ngữ định nghĩa dữ liệu: tạo cấu trúc Bảng Customer CREATE TABLE CUSTOMER (CUST_ID NUMBER(11,0) NOT NULL, NAME VARCHAR(25) NOT NULL, ADDRESS VARCHAR(30), CITY VARCHAR(20), CONSTRAINT PK_CUSTOMER PRIMARY KEY (CUST_ID)); • Ngôn ngữ thao tác dữ liệu: liệt kê mã, tên và địa chỉ của các khách hàng thuộc Thành phố ‘HCM’ SELECT CUST_ID, NAME, ADDRESS FROM CUSTOMER WHERE CITY = ‘HCM’; • Ngôn ngữ điều khiển dữ liệu: cho phép người sử dụng Chau và Truc được phép xem và thêm dữ liệu vào bảng Customer. GRANT SELECT, INSERT ON CUSTOMER TO CHAU, TRUC; 29
  • 30. Các thành phần của môi trường hệ quản trị cơ sở dữ liệu • Phần cứng • Máy tính cá nhân, máy tính lớn, … • Dữ liệu • Phần mềm • Hệ quản trị CSDL • Chương trình ứng dụng • Hệ điều hành. • Các thủ tục (Procedure) • Chỉ thị (Instruction) • Quy tắc (Rule) 30
  • 31. Các thành phần của môi trường hệ quản trị cơ sở dữ liệu • Con người • Người quản trị dữ liệu (Data Administrator - DA). • Người quản trị cơ sở dữ liệu (Database Administrator – DBA). • Người thiết kế CSDL • Người thiết kế CSDL luận lý (Logical Database Designer). • Người thiết kế CSDL vật lý (Physical Database Designer). • Người phát triển ứng dụng. • Người sử dụng cuối cùng. 31
  • 32. Hệ cơ sở dữ liệu • Hệ cơ sở dữ liệu – Database System • DS = DBMS + DB 32
  • 33. Sự phát triển các hệ cơ sở dữ liệu • Hệ thống tập tin (flat file): 1960 – 1980. • Hệ CSDL phân cấp (hierachical): 1970 – 1990. • Hệ CSDL mạng (network): 1970 – 1990. • Hệ CSDL quan hệ (relational): 1980 – nay. • Hệ CSDL hướng đối tượng (Object – Oriented): 1990 – nay. • Hệ CSDL đối tượng – quan hệ (object – relational): 1990 – nay. • Kho dữ liệu (Data warehouse): 1980 – nay. • Web-enalbled: 1990 – nay. 33
  • 34. Nội dung • Các khái niệm cơ bản. • Hệ thống xử lý tập tin. • Cách tiếp cận cơ sở dữ liệu. • Hệ quản trị cơ sở dữ liệu. • Chu kỳ phát triển hệ thống • Quá trình phát triển cơ sở dữ liệu • Kiến trúc ba lược đồ 34
  • 35. Chu kỳ phát triển hệ thống • Chu kỳ phát triển hệ thống (Systems Development Life Cycle - SDLC) 35
  • 36. Chu kỳ phát triển hệ thống • Xác định và chọn dự án • Nghiên cứu sơ bộ về tình hình nghiệp vụ. • Bản yêu cầu về phát triển hệ thống thông tin. • Bắt đầu và lập kế hoạch dự án • Phát biểu tình hình nghiệp vụ và hệ thống thông tin hỗ trợ như thế nào để giải quyết các vấn đề nghiệp vụ. • Bản yêu cầu nghiên cứu các thay đổi của hệ thống hiện tại hoặc xây dựng hệ thống mới. • Phân tích • Phân tích hoàn toàn tình hình nghiệp vụ, xác định và phân tích các yêu cầu. • Các mô tả chức năng của hệ thống. 36
  • 37. Chu kỳ phát triển hệ thống • Thiết kế luận lý • Nêu ra và cấu trúc hóa tất cả các yêu cầu thông tin. • Các mô tả chi tiết chức năng của form, report, … và các quy tắc xử lý. • Thiết kế vật lý • Cấu trúc của các chương trình, cấu trúc vật lý của CSDL. • Thực hiện • Viết các chương trình, tạo các tập tin dữ liệu, kiểm tra, cài đặt hệ thống mới, đào tạo những người sử dụng, lập tài liệu cuối cùng. • Bảo trì • Giám sát vận hành hệ thống, sửa lỗi, nâng cấp hệ thống. 37
  • 38. Nội dung • Các khái niệm cơ bản. • Hệ thống xử lý tập tin. • Cách tiếp cận cơ sở dữ liệu. • Hệ quản trị cơ sở dữ liệu. • Chu kỳ phát triển hệ thống • Quá trình phát triển cơ sở dữ liệu • Kiến trúc ba lược đồ 38
  • 39. Quá trình phát triển cơ sở dữ liệu • Mô hình hóa xí nghiệp (Enterprise Modeling) • Thực hiện trong giai đoạn xác định và chọn dự án. • Phân tích việc xử lý dữ liệu hiện tại. • Phân tích các chức năng nghiệp vụ chung. • Phân tích các yêu cầu về dữ liệu và các CSDL để hỗ trợ nghiệp vụ. 39
  • 40. Quá trình phát triển cơ sở dữ liệu • Mô hình hóa dữ liệu ý niệm (Conceptual Data Modeling) • Giai đoạn bắt đầu và lập kế hoạch dự án • Xây dựng sơ đồ liên kết thực thể. • Lập tài liệu phác thảo về phạm vi của các dữ liệu liên quan đến dự án. • Giai đoạn phân tích • Xây dựng mô hình dữ liệu chi tiết trong mô hình dữ liệu ý niệm (conceptual data model) còn gọi là lược đồ ý niệm (conceptual schema). • Định nghĩa tất cả các thuộc tính của dữ liệu. • Liệt kê tất cả các loại dữ liệu. • Biễu diễn tất cả các mối liên kết giữa các loại dữ liệu. • Xác định tất cả các ràng buộc toàn vẹn dữ liệu. 40
  • 41. Quá trình phát triển cơ sở dữ liệu • Thiết kế CSDL luận lý (Logical Database Design) • Thực hiện trong giai đoạn thiết kế luận lý. Xây dựng CSDL từ hai hướng: 1. Chuyển mô hình dữ liệu ý niệm thành các quan hệ, dựa vào lý thuyết CSDL quan hệ. 2. Thiết kế mỗi chương trình trong hệ thống thông tin: a) Dạng thức nhập, xuất của chương trình. b) Thực hiện chi tiết các giao tác, các bản báo cáo, các mẫu nhập và các truy vấn trên CSDL. c) Phân tích các bản báo cáo, giao tác để xác định khung nhìn (user view) còn gọi là lược đồ ngoài (external schema) cần thiết trong CSDL. 41
  • 42. Quá trình phát triển cơ sở dữ liệu • Thiết kế và định nghĩa CSDL vật lý • Thực hiện trong giai đoạn thiết kế vật lý. • Xác định tổ chức của dữ liệu trong vùng lưu trữ của máy tính. • Xác định cấu trúc vật lý của CSDL trong hệ quản trị CSDL, được gọi là lược đồ vật lý (physical schema) hoặc lược đồ trong (internal schema). • Thiết kế các chương trình xử lý CSDL. 42
  • 43. Quá trình phát triển cơ sở dữ liệu • Thực hiện CSDL • Thực hiện trong giai đoạn thực hiện của chu kỳ phát triển hệ thống. • Viết và chạy kiểm tra các chương trình xử lý CSDL. • Hoàn thành tài liệu về CSDL và các tài liệu đào tạo. • Cài đặt CSDL và chuyển đổi dữ liệu từ các hệ thống kế thừa. • Bảo trì CSDL • Thực hiện trong giai đoạn bảo trì. • Phân tích CSDL và các chương trình ứng dụng CSDL để đáp ứng các yêu cầu thông tin phát sinh. • Điều chỉnh CSDL để nâng cao hiệu suất của ứng dụng. • Xác định và sửa chữa lỗi sai trong CSDL và các chương trình ứng dụng CSDL. • Phục hồi CSDL khi hư hỏng. 43
  • 44. Kiến trúc ba lược đồ • Kiến trúc CSDL ba lược đồ (three – schema database architecture) còn được gọi là kiến trúc ba mức ANSI – SPARC (ANSI – SPARC three – level architecture). • Mục tiêu của kiến trúc ba lược đồ là tách biệt các chương trình ứng dụng với CSDL vật lý. • Kiến trúc ba lược đồ là một kiến trúc mà lược đồ CSDL được định nghĩa ở ba mức. • Mức trong • Mức ý niệm • Mức ngoài 44
  • 45. Kiến trúc ba lược đồ • Mức trong (Internal Level) • Lược đồ trong (Internal Schema) sử dụng mô hình dữ liệu vật lý và mô tả đầy đủ chi tiết việc lưu trữ dữ liệu và cách thức truy xuất CSDL. • Mức ý niệm (Conceptual Level) • Che giấu chi tiết của các cấu trúc lưu trữ vật lý. • Lược đồ ý niệm (Conceptual Schema) mô tả các thực thể, các kiểu dữ liệu, các mối liên kết giữa các thực thể, các tác vụ của người sử dụng và các ràng buộc. • Mức ngoài (External Level) hoặc mức khung nhìn (View Level) • Mỗi lược đồ ngoài (External Schema) hoặc khung nhìn (View) mô tả luận lý một phần của CSDL được dùng cho một nhóm người sử dụng. 45
  • 46. Kiến trúc ba lược đồ 46 Ánh xạ ngoài – ý niệm Ánh xạ ý niệm – trong SV (MaSV, HoTen, Lop) SV (MaSV, HoTen, Lop) Lop (MaLop, TenLop)
  • 47. Kiến trúc ba lược đồ • Độc lập dữ liệu – Chương trình (Program – Data Independence) là một đặc tính mà cấu trúc của các tập tin dữ liệu (siêu dữ liệu) được lưu trữ ở ngoài chương trình truy xuất dữ liệu. • Độc lập dữ liệu – chương trình còn được gọi là độc lập dữ liệu (Data Independence). 47
  • 48. Kiến trúc ba lược đồ • Hai mức độc lập dữ liệu • Độc lập dữ liệu luận lý (Logical Data Independence) là đặc tính thay đổi lược đồ ý niệm mà không thay đổi các lược đồ ngoài và các chương trình ứng dụng. • Thay đổi ánh xạ ngoài – ý niệm (External – Conceptual Mapping). • Độc lập dữ liệu vật lý (Physical Data Independence) là đặc tính thay đổi lược đồ trong mà không thay đổi lược đồ ý niệm. • Thay đổi ánh xạ ý niệm – trong (Conceptual – Internal Mapping). 48
  • 49. Kiến trúc ba lược đồ 49 Độc lập dữ liệu luận lý Độc lập dữ liệu vật lý SV (MaSV, HoTen, Lop) SV (MaSV, HoTen, Lop) Lop (MaLop, TenLop)
  • 50. Kiến trúc ba lược đồ • Trong suốt dữ liệu (Data Transparency) là một đặc tính truy xuất dữ liệu mà không biết dữ liệu này có được như thế nào (dữ liệu này ở đâu, cách thức tạo ra dữ liệu này). • Mỗi mức trong kiến trúc ba lược đồ là một mức trong suốt dữ liệu. • Trong suốt dữ liệu mức trong (Internal Data Transparency). • Trong suốt dữ liệu mức ý niệm (Conceptual Data Transparancy). • Trong suốt dữ liệu mức ngoài (External Data Transparency). 50

Editor's Notes

  1. Raw Data: 10, Lan Pie chart Số có cấu trúc: hàng trăm, chục, đơn vị Dữ liệu trong ngữ cảnh: số 123 là mã của một nhân viên
  2. Trong tập tin C++, đầu tiên là khai báo CTDL (gọi là siêu dữ liệu) rồi mới đến các hàm xử lý  phụ thuộc dữ liệu. Metadata duoc luu trong DBMS, khong luu trong chuong trinh ung dung
  3. File: tập hợp các mẫu tin có liên quan
  4. Ràng buộc là một quy tắc phải được thỏa mãn dựa vào các yêu cầu của người sử dụng. Các ràng buộc thường gặp là các quy tắc nghiệp vụ (business rule)
  5. Cấu trúc của CSDL được gọi là lược đồ CSDL
  6. Tính toàn vẹn CSDL = tính đúng đắn và tính nhất quán của dữ liệu được lưu trữ, thường được thể hiện thông qua các ràng buộc. SQL (Structured Query Language): DDL, DML, DCL
  7. Figure 1-8 Modern Database Management
  8. Mô hình hóa xí nghiệp