Chuẩn Hóa
Dữ Liệu
Cơ sở dữ liệu nâng cao
TEAM 1
1
Nội Dung Thuyết Trình
01
Tổng quan về chuẩn hóa dữ
liệu 02
03 04
Dạng chuẩn 3 và BC
Dạng chuẩn 1 và 2
Ví dụ về chuẩn hóa
2
Thành Viên
1. Nguyễn Văn An - 2011068793
2. Phạm Hiếu Liêm - 2011068383
3. Đặng Tuấn Kiệt - 2011068856
4. Huỳnh Mai Văn Sỹ - 2011065315
3
Tổng quan về
Chuẩn hóa
01
4
Tổng quan Chuẩn hóa dữ liệu
1. Khái niệm
Chuẩn hóa là quá trình thiết kế cơ sở dữ liệu để giảm thiểu redundancy và
nguy cơ mất mát dữ liệu thông qua việc phân rã bảng thành các bảng con
nhỏ hơn, không chứa dữ liệu trùng lặp.
5
Tổng quan Chuẩn hóa dữ liệu
6
Tổng quan Chuẩn hóa dữ liệu
2. Ý nghĩa
Chuẩn hóa giúp tối ưu hóa cơ sở dữ liệu, giảm thiểu sự lặp lại và mất mát
dữ liệu, cũng như cải thiện hiệu suất truy xuất.
7
Tổng quan Chuẩn hóa dữ liệu
3. Lợi ích
● Giảm kích thước cơ sở dữ liệu
● Đơn giản hóa truy vấn
● Dễ dàng bảo trì
● Cải thiện hiệu suất
8
Trắc nghiệm
Nhanh
9
Đáp án A
A. Structure Query Language
B. Query Structure Language
C. Structure Question Language
D. Structure Query Locator
Câu 1: SQL là tên viết tắt của?
10
Câu 2:Thực thể là?
A. Các đối tượng dữ liệu
B. Các quan hệ
C. Các mối liên kết giữa các đối tượng
D. Các đối tượng và mối liên kết giữa các đối tượng
Đáp án A
11
Đáp án A
A. Giảm dư thừa, nhất quán và toàn vẹn của dữ liệu
B. Các thuộc tính được mô tả trong nhiều tệp dữ liệu
khác nhau
C. Khả năng xuất hiện mâu thuẫn và không nhất
quán dữ liệu
D. Xuất hiện dị thường thông tin
Câu 3: Ưu điểm của cơ sở dữ liệu là?
12
Câu 4: Phương pháp nào sau đây thường
được sử dụng để chuẩn hóa cơ sở dữ liệu?
A. SQL Server
B. NoSQL
C. Normalization
D. MongoDB
Đáp án C
13
Đáp án A
A. Sự lặp lại không cần thiết của dữ liệu
B. Tính đồng nhất của dữ liệu
C. Sự phức tạp của cơ sở dữ liệu
D. Sự linh hoạt của dữ liệu
Câu 5: Khái niệm "Redundancy" trong chuẩn
hóa dữ liệu là gì?
14
Dạng chuẩn 1,2
02
15
Dạng Chuẩn 1
Khái niệm
Thuộc tính đơn là thuộc tính khi nó chứa chỉ
một thông tin mà không phải chứa nhiều
thông tin với những ý nghĩa khác nhau.
Một lược đồ quan hệ đạt dạng chuẩn 1 nếu
lược đồ chỉ chứa thuộc tính đơn và không
chứa thuộc tính có nhiều ý nghĩa.
16
Dạng Chuẩn 1
17
Dạng Chuẩn 1
18
Dạng Chuẩn 2
Khái niệm phụ thuộc đầy đủ
Một phụ thuộc hàm X->Y là một phụ thuộc hàm đầy đủ
nếu loại bỏ bất kỳ thuộc tính A nào đó ra khỏi X thì phụ
thuộc hàm đó không còn đúng nữa.
Định nghĩa dạng chuẩn 2
Một lược đồ quan hệ Q đạt dạng chuẩn 2 nếu:
- Q ở dạng chuẩn 1,
- Mọi thuộc tính không khóa đều phụ thuộc đầy đủ vào
các khóa của Q.
Ví dụ: MsSV, MsMH -> Ten là phụ thuộc hàm không
đầy đủ vì chỉ cần MsSV là đã có thể xác định được Ten.
MsSV -> Ten.
19
Dạng Chuẩn 2
Thuật toán kiểm tra dạng chuẩn 2:
Bước 1: Tìm mọi khóa của Q
Bước 2: Với mỗi khóa K, tìm bao đóng của tập
tất cả các tập con thực sự Si của K
Bước 3: Nếu tồn tại bao đóng Si + chứa thuộc
tính không khóa thì Q không đạt dạng chuẩn 2,
ngược lại Q đạt dạng chuẩn 2.
20
Dạng Chuẩn 2
21
Dạng Chuẩn 2
22
Dạng Chuẩn 2
Nhận xét
Một quan hệ đạt dạng chuẩn 2 nếu thỏa
mãn 1 trong các điều kiện sau:
- Nếu mỗi khóa của quan hệ Q chỉ có 1 thuộc
tính thì Q đạt dạng chuẩn 2.
- Khóa chính chỉ gồm 1 thuộc tính.
- Quan hệ Q không có thuộc tính không
khóa.
23
Dạng chuẩn 3,BC
03
24
Thuộc tính bắc cầu của PTH
25
Khái niệm
Tính bắc cầu của phụ thuộc hàm là khi thay đổi một cột không phải là
khóa có thể dẫn đến việc các cột không phải khóa khác cũng sẽ phải
thay đổi.
Ví dụ: phụ thuộc hàm X→ Z là phụ thuộc hàm bắc cầu
Nếu tồn tại 2 phụ thuộc hàm: X → Y và Y → Z.
Dạng chuẩn 3
26
Định nghĩa
Một lược quan hệ R được coi đạt dạng chuẩn 3 (3NF) nếu:
- Quan hệ đó thỏa mãn 2NF
- Không có chứa các phụ thuộc hàm phụ thuộc bắc cầu vào khóa.
Biểu diễn bằng sơ đồ sau
Dạng chuẩn 3
Bước 2: Các thuộc tính còn lại lập thành một quan hệ có khóa chính là khóa ban đầu.
Bước 1: Loại bỏ các thuộc tính phụ thuộc bắc cầu ra khỏi quan hệ và tách chúng thành
quan hệ riêng có khóa chính là thuộc tính bắc cầu.
Quy tắc chuẩn hóa từ 2NF thành 3NF:
27
Dạng chuẩn 3
Bước 2: Các thuộc tính còn lại lập thành một quan hệ có khóa chính là khóa ban đầu.
Bước 1: Loại bỏ các thuộc tính phụ thuộc bắc cầu ra khỏi quan hệ và tách chúng thành
quan hệ riêng có khóa chính là thuộc tính bắc cầu.
Quy tắc chuẩn hóa từ 2NF thành 3NF:
28
Dạng chuẩn 3
Quy tắc chuẩn hóa từ 2NF thành 3NF:
29
Dạng chuẩn 3
Quy tắc chuẩn hóa từ 2NF thành 3NF:
30
Dạng chuẩn 3
- Tuy nhiên, dữ liệu vẫn có khả năng dư thừa khi quan hệ có hai tập khóa dự
tuyển (Candidate key) gối lẫn nhau, hoặc quan hệ có thuộc tính không khóa xác
định một thuộc tính khóa
- Trong một cơ sở dữ liệu tốt, các quan hệ nên được chuyển về dạng chuẩn 3.
Nhận xét:
31
Dạng chuẩn BC
Quan hệ R ở dạng chuẩn BCNF
khi tất cả các phụ thuộc hàm X → A trong R đều phải có X là khóa của R
32
Khái niệm
Dạng chuẩn BC
Ví dụ 2: cho R (A1,A2,A3,A4,A5) Với các phụ thuộc hàm:
F1 : A1,A2 → A3,A4,A5
F2: A4 → A2
=> R vi phạm dạng chuẩn BCNF
33
Từ ví dụ này thấy rằng một lược đồ quan hệ có thể có 3NF nhưng không phải BCNF.
Do đó mỗi lược đồ quan hệ ở BCNF là 3NF
Định lý : Nếu một lược đồ quan hệ R với tập phụ thuộc hàm F là ở BCNF thì nó là ở
3NF.
Dạng chuẩn BC
Kiểm tra dạng chuẩn BCNF
Bước 1: Tìm mọi khóa của Q
Bước 2: Phân rã vế phải của mọi phụ thuộc hàm trong F để tập F trở thành tậ
phụ thuộc hàm có vế phải một thuộc tính
Bước 3: Nếu mọi phụ thuộc hàm X → A ∈ F, mà A ∉ X đều thỏa X là siêu khó
(vế trái chứa một khóa), thì Q đạt dạng chuẩn BCNF, ngược lại Q không đạt
dạng chuẩn BCNF.
34
Bài tập về NF
04
35
Thank You!
36

Data Normalization - How to normalize database from 1nf to bcnf

  • 1.
    Chuẩn Hóa Dữ Liệu Cơsở dữ liệu nâng cao TEAM 1 1
  • 2.
    Nội Dung ThuyếtTrình 01 Tổng quan về chuẩn hóa dữ liệu 02 03 04 Dạng chuẩn 3 và BC Dạng chuẩn 1 và 2 Ví dụ về chuẩn hóa 2
  • 3.
    Thành Viên 1. NguyễnVăn An - 2011068793 2. Phạm Hiếu Liêm - 2011068383 3. Đặng Tuấn Kiệt - 2011068856 4. Huỳnh Mai Văn Sỹ - 2011065315 3
  • 4.
  • 5.
    Tổng quan Chuẩnhóa dữ liệu 1. Khái niệm Chuẩn hóa là quá trình thiết kế cơ sở dữ liệu để giảm thiểu redundancy và nguy cơ mất mát dữ liệu thông qua việc phân rã bảng thành các bảng con nhỏ hơn, không chứa dữ liệu trùng lặp. 5
  • 6.
    Tổng quan Chuẩnhóa dữ liệu 6
  • 7.
    Tổng quan Chuẩnhóa dữ liệu 2. Ý nghĩa Chuẩn hóa giúp tối ưu hóa cơ sở dữ liệu, giảm thiểu sự lặp lại và mất mát dữ liệu, cũng như cải thiện hiệu suất truy xuất. 7
  • 8.
    Tổng quan Chuẩnhóa dữ liệu 3. Lợi ích ● Giảm kích thước cơ sở dữ liệu ● Đơn giản hóa truy vấn ● Dễ dàng bảo trì ● Cải thiện hiệu suất 8
  • 9.
  • 10.
    Đáp án A A.Structure Query Language B. Query Structure Language C. Structure Question Language D. Structure Query Locator Câu 1: SQL là tên viết tắt của? 10
  • 11.
    Câu 2:Thực thểlà? A. Các đối tượng dữ liệu B. Các quan hệ C. Các mối liên kết giữa các đối tượng D. Các đối tượng và mối liên kết giữa các đối tượng Đáp án A 11
  • 12.
    Đáp án A A.Giảm dư thừa, nhất quán và toàn vẹn của dữ liệu B. Các thuộc tính được mô tả trong nhiều tệp dữ liệu khác nhau C. Khả năng xuất hiện mâu thuẫn và không nhất quán dữ liệu D. Xuất hiện dị thường thông tin Câu 3: Ưu điểm của cơ sở dữ liệu là? 12
  • 13.
    Câu 4: Phươngpháp nào sau đây thường được sử dụng để chuẩn hóa cơ sở dữ liệu? A. SQL Server B. NoSQL C. Normalization D. MongoDB Đáp án C 13
  • 14.
    Đáp án A A.Sự lặp lại không cần thiết của dữ liệu B. Tính đồng nhất của dữ liệu C. Sự phức tạp của cơ sở dữ liệu D. Sự linh hoạt của dữ liệu Câu 5: Khái niệm "Redundancy" trong chuẩn hóa dữ liệu là gì? 14
  • 15.
  • 16.
    Dạng Chuẩn 1 Kháiniệm Thuộc tính đơn là thuộc tính khi nó chứa chỉ một thông tin mà không phải chứa nhiều thông tin với những ý nghĩa khác nhau. Một lược đồ quan hệ đạt dạng chuẩn 1 nếu lược đồ chỉ chứa thuộc tính đơn và không chứa thuộc tính có nhiều ý nghĩa. 16
  • 17.
  • 18.
  • 19.
    Dạng Chuẩn 2 Kháiniệm phụ thuộc đầy đủ Một phụ thuộc hàm X->Y là một phụ thuộc hàm đầy đủ nếu loại bỏ bất kỳ thuộc tính A nào đó ra khỏi X thì phụ thuộc hàm đó không còn đúng nữa. Định nghĩa dạng chuẩn 2 Một lược đồ quan hệ Q đạt dạng chuẩn 2 nếu: - Q ở dạng chuẩn 1, - Mọi thuộc tính không khóa đều phụ thuộc đầy đủ vào các khóa của Q. Ví dụ: MsSV, MsMH -> Ten là phụ thuộc hàm không đầy đủ vì chỉ cần MsSV là đã có thể xác định được Ten. MsSV -> Ten. 19
  • 20.
    Dạng Chuẩn 2 Thuậttoán kiểm tra dạng chuẩn 2: Bước 1: Tìm mọi khóa của Q Bước 2: Với mỗi khóa K, tìm bao đóng của tập tất cả các tập con thực sự Si của K Bước 3: Nếu tồn tại bao đóng Si + chứa thuộc tính không khóa thì Q không đạt dạng chuẩn 2, ngược lại Q đạt dạng chuẩn 2. 20
  • 21.
  • 22.
  • 23.
    Dạng Chuẩn 2 Nhậnxét Một quan hệ đạt dạng chuẩn 2 nếu thỏa mãn 1 trong các điều kiện sau: - Nếu mỗi khóa của quan hệ Q chỉ có 1 thuộc tính thì Q đạt dạng chuẩn 2. - Khóa chính chỉ gồm 1 thuộc tính. - Quan hệ Q không có thuộc tính không khóa. 23
  • 24.
  • 25.
    Thuộc tính bắccầu của PTH 25 Khái niệm Tính bắc cầu của phụ thuộc hàm là khi thay đổi một cột không phải là khóa có thể dẫn đến việc các cột không phải khóa khác cũng sẽ phải thay đổi. Ví dụ: phụ thuộc hàm X→ Z là phụ thuộc hàm bắc cầu Nếu tồn tại 2 phụ thuộc hàm: X → Y và Y → Z.
  • 26.
    Dạng chuẩn 3 26 Địnhnghĩa Một lược quan hệ R được coi đạt dạng chuẩn 3 (3NF) nếu: - Quan hệ đó thỏa mãn 2NF - Không có chứa các phụ thuộc hàm phụ thuộc bắc cầu vào khóa. Biểu diễn bằng sơ đồ sau
  • 27.
    Dạng chuẩn 3 Bước2: Các thuộc tính còn lại lập thành một quan hệ có khóa chính là khóa ban đầu. Bước 1: Loại bỏ các thuộc tính phụ thuộc bắc cầu ra khỏi quan hệ và tách chúng thành quan hệ riêng có khóa chính là thuộc tính bắc cầu. Quy tắc chuẩn hóa từ 2NF thành 3NF: 27
  • 28.
    Dạng chuẩn 3 Bước2: Các thuộc tính còn lại lập thành một quan hệ có khóa chính là khóa ban đầu. Bước 1: Loại bỏ các thuộc tính phụ thuộc bắc cầu ra khỏi quan hệ và tách chúng thành quan hệ riêng có khóa chính là thuộc tính bắc cầu. Quy tắc chuẩn hóa từ 2NF thành 3NF: 28
  • 29.
    Dạng chuẩn 3 Quytắc chuẩn hóa từ 2NF thành 3NF: 29
  • 30.
    Dạng chuẩn 3 Quytắc chuẩn hóa từ 2NF thành 3NF: 30
  • 31.
    Dạng chuẩn 3 -Tuy nhiên, dữ liệu vẫn có khả năng dư thừa khi quan hệ có hai tập khóa dự tuyển (Candidate key) gối lẫn nhau, hoặc quan hệ có thuộc tính không khóa xác định một thuộc tính khóa - Trong một cơ sở dữ liệu tốt, các quan hệ nên được chuyển về dạng chuẩn 3. Nhận xét: 31
  • 32.
    Dạng chuẩn BC Quanhệ R ở dạng chuẩn BCNF khi tất cả các phụ thuộc hàm X → A trong R đều phải có X là khóa của R 32 Khái niệm
  • 33.
    Dạng chuẩn BC Vídụ 2: cho R (A1,A2,A3,A4,A5) Với các phụ thuộc hàm: F1 : A1,A2 → A3,A4,A5 F2: A4 → A2 => R vi phạm dạng chuẩn BCNF 33 Từ ví dụ này thấy rằng một lược đồ quan hệ có thể có 3NF nhưng không phải BCNF. Do đó mỗi lược đồ quan hệ ở BCNF là 3NF Định lý : Nếu một lược đồ quan hệ R với tập phụ thuộc hàm F là ở BCNF thì nó là ở 3NF.
  • 34.
    Dạng chuẩn BC Kiểmtra dạng chuẩn BCNF Bước 1: Tìm mọi khóa của Q Bước 2: Phân rã vế phải của mọi phụ thuộc hàm trong F để tập F trở thành tậ phụ thuộc hàm có vế phải một thuộc tính Bước 3: Nếu mọi phụ thuộc hàm X → A ∈ F, mà A ∉ X đều thỏa X là siêu khó (vế trái chứa một khóa), thì Q đạt dạng chuẩn BCNF, ngược lại Q không đạt dạng chuẩn BCNF. 34
  • 35.
  • 36.