2013 9 dang chuan

385 views
286 views

Published on

Xác định dạng chuẩn trong CSDL

Published in: Education
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
385
On SlideShare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
7
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

2013 9 dang chuan

  1. 1. THIẾT KẾ CƠ SỞ DỮ LIỆU QUAN HỆ 1
  2. 2. Tập PTH tối thiểu • Tập PTH F là tối thiểu nếu thỏa các điều kiện sau – Mọi PTH của F chỉ có một thuộc tính ở vế phải. – Không thể thay X  A thuộc F bằng Y  A với Y  X mà tập mới tương đương với F. – Nếu bỏ đi một PTH bất kỳ trong F thì tập PTH còn lại không tương đương với F. • Phủ tối thiểu (Minimal Covers) của tập PTH E là tập PTH tối thiểu F tương đương với E. • Nhận xét – Mọi tập PTH có ít nhất một phủ tối thiểu. 2
  3. 3. Thuật toán tìm phủ tối thiểu (Bernstein, 1976) Thuật toán 3.3: Nhập: tập PTH E. Xuất: phủ tối thiểu F của E. Phương pháp : – B1: F := . – B2: (Tách các PTH để có vế phải là 1 thuộc tính) Với mọi X  Y  E, Y = {A1, …, Ak}, Ai  U F := F  {X  {Ai}}. – B3: (Loại bỏ các thuộc tính dư thừa vế trái) Với mỗi X  {A}  F, X = {B1, …, Bl}, Bi  U Với mỗi Bi, nếu A  (X - {Bi})F+ thì F := (F - {X  {A}})  {(X - {B})  {A}}. – B4: (Loại bỏ các PTH dư thừa) Với mỗi X  {A}  F G := F - {X  {A}} Nếu A  XG+ thì F := F - {X  {A}}. 3
  4. 4. Ví dụ tìm phủ tối thiểu Tìm phủ tối thiểu của E = {A  BC, A  B, B  C, AB  C} – B1: F = . – B2: F = {A  B, A  C, B  C, AB  C}. – B3: Xét AB  C (B)F+ = C F = {A  B, A  C, B  C}. – B4: A  C thừa. F = {A  B, B  C}. 4
  5. 5. Chuẩn hóa lược đồ CSDL Các dạng chuẩn – Dạng 1 (1 Normal Form - 1NF). – Dạng 2 (2 Normal Form - 2NF). – Dạng 3 (3 Normal Form - 3NF). – Dạng Boyce - Codd (Boyce - Codd Normal Form - BCNF). 5
  6. 6. Dạng chuẩn 1 Định nghĩa 3.5: Quan hệ r(U) được gọi thuộc dạng chuẩn 1 nếu và chỉ nếu mọi thuộc tính của r là thuộc tính đơn. PHONG TenP MaP TrPhg CacTruso Kinh doanh 5 333445555 Go Vap, Thu Duc Hanh chinh 4 987654321 Go Vap Không thuộc dạng chuẩn 1 PHONG TenP MaP TrPhg Truso Kinh doanh 5 333445555 Go Vap Kinh doanh 5 333445555 Thu Duc Hanh chinh 4 987654321 Go Vap Thuộc dạng chuẩn 1 Nhận xét: Dạng chuẩn 1 có thể dẫn đến sự trùng lặp dữ liệu. Do đó gây ra các dị thường về cập nhật dữ liệu 6
  7. 7. Dạng chuẩn 2 theo khóa chính (1) Định nghĩa 3.6: Quan hệ r(U) được gọi là thuộc dạng chuẩn 2 nếu mọi thuộc tính không khóa của r phụ thuộc đầy đủ vào khóa chính của r. r(U), K  U là khóa chính của r – A  U là thuộc tính không khóa nếu A K. – X  Y là PTH đầy đủ nếu A  X thì (X - {A})  Y không đúng trên r. Ngược lại X  Y là PTH bộ phận. Ví dụ Thuộc tính không khóa PTH đầy đủ NVIEN_DUAN MaNV MaDA SoGio TenNV TenDA Diadiem FD1 PTH bộ phận FD2 FD3 7
  8. 8. Dạng chuẩn 2 theo khóa chính (2) NVIEN_DUAN MaNV MaDA SoGio TenNV TenDA Diadiem FD1 FD2 FD3 NV_DA1 NV_DA2 MaNV MaDA FD1 SoGio MaNV FD2 NV_DA3 TenNV MaDA TenDA Diadiem FD3 3 lược đồ NV_DA1, NV_DA2, NV_DA3 thuộc dạng chuẩn 2 8
  9. 9. Dạng chuẩn 2 theo khóa chính (3) NHANVIEN_PHONGBAN TenNV MaNV NgSinh DChi MaPB TenPB TrPhong FD1 FD2 Thuộc dạng chuẩn 2 Nhận xét – Mọi lược đồ quan hệ thuộc dạng chuẩn 2 cũng thuộc dạng chuẩn 1. – Còn xuất hiện sự trùng lặp dữ liệu. Do đó gây ra các dị thường về cập nhật dữ liệu. 9
  10. 10. Dạng chuẩn 3 theo khóa chính (1) Định nghĩa 3.7: Quan hệ r(U) được gọi là thuộc dạng chuẩn 3 nếu – r thuộc dạng chuẩn 2. – Mọi thuộc tính không khóa của r không phụ thuộc bắc cầu vào khóa chính của r. Cho r(U) – X  Y là PTH bắt cầu nếu Z  U, Z không là khóa và cũng không là tập con của khóa của r mà X  Z và Z  Y đúng trên r. Ví dụ NHANVIEN_PHONGBAN PTH bắt cầu TenNV MaNV NgSinh DChi MaPB TenPB TrPhong FD1 FD2 FD3 10
  11. 11. Dạng chuẩn 3 theo khóa chính (2) Thuộc dạng chuẩn 3 NV_PB1 TenNV MaNV NV_PB2 NgSinh Diachi MaPB MaPB TenPB TrPhg Nhận xét – Mọi lược đồ quan hệ thuộc dạng chuẩn 3 cũng thuộc dạng chuẩn 2. – PTH bắt cầu là nguyên nhân dẫn đến trùng lặp dữ liệu. – Dạng chuẩn 3 là dạng chuẩn tối thiểu trong thiết kế CSDL. 11
  12. 12. Dạng chuẩn 2 tổng quát Định nghĩa 3.8: Lược đồ quan hệ R được gọi là thuộc dạng chuẩn 2 nếu mọi thuộc tính không khóa của R phụ thuộc đầy đủ vào các khóa của R. Cho R(ABCDEF) có 2 khóa là A và BC. R A B C D E F FD1 FD2 FD3 FD4 FD5 Lược đồ R không thuộc dạng chuẩn 2 12
  13. 13. Dạng chuẩn 3 tổng quát Định nghĩa 3.9: Lược đồ quan hệ R được gọi là thuộc dạng chuẩn 3 nếu PTH X  A đúng trên R thì – X là siêu khóa của R, hoặc – A là thuộc tính khóa của R. R1(ABCDE) có 2 khóa là A và BC. R1 A FD1 FD2 FD4 FD5 B C D E Lược đồ bên thuộc dạng chuẩn 2, nhưng không thuộc dạng chuẩn 3 13
  14. 14. 3.4 Phân rã lược đồ quan hệ Lược đồ quan hệ R(A1, …, An) – Tập hợp tất cả các thuộc tính của các thực thể. Xác định tập PTH F trên R. Phân rã – Sử dụng các thuật toán chuẩn hóa để tách R thành tập các lược đồ D = {R1, …, Rm}. Yêu cầu – Bảo toàn thuộc tính. – Các lược đồ Ri phải ở dạng chuẩn 3 hoặc BoyceCodd. 14
  15. 15. Phân rã bảo toàn PTH Tính chất bảo toàn PTH – Xét lược đồ R và tập PTH F. Giả sử R được phân rã thành D = {R1, …, Rm}. • Đặt Ri(F) = {X  Y  F+ : X  Y  Ri}. • D được gọi là phân rã bảo toàn phụ thuộc hàm đối với F nếu (R1(F)  …  Rm(F))+ = F+. R11 Ví dụ A R111 A B C D C D FD1 FD1 FD2 R112 FD5 B D FD5 15
  16. 16. Thuật toán phân rã lược đồ DC3 và bảo toàn PTH (Berstein 1976) Thuật toán 3.6 Nhập: R(U), U = {A1, …, An} và tập PTH F. Xuất: D = {R1, …, Rm}, Ri ở dạng chuẩn 3. – B1: Tìm phủ tối thiểu G của F. – B2: Với mỗi X  Aj  G, xây dựng lược đồ Ri(Ui), Ui = X  {Aj}. Khóa chính của Ri là X. – B3: Giả sử xong B2 ta có các lược đồ R1, …, Rm. Nếu U1  …  Um  U thì xây dựng thêm lược đồ Rm+1(Um+1), Um+1 = U - (U1  …  Um). Khóa của Rm+1 là Um+1. – B4: Xuất các lược đồ Ri. 16
  17. 17. Ví dụ phân rã bảo toàn PTH (1) Cho – R(ABCDEFG) – F = {B  A, D  C, D  EB, DF  G} Tách về dạng chuẩn 3, bảo toàn PTH – B1: • Phủ tối thiểu G = {B  A, D  C, D  B, D  E, DF  G}. – B2: R(ABCDEFG) R1(BA) R(DC) R(DB) R(DE) R3(DFG) R2(DBCE) – B3: • Xuất D = {R1, R2, R3}. 17
  18. 18. Ví dụ phân rã bảo toàn PTH (2) Cho – R(ABCDEFGHI) – F = {B  A, D  C, D  EB, DF  G} Tách về dạng chuẩn 3, bảo toàn PTH – B1: • Phủ tối thiểu G = {B  A, D  C, D  B, D  E, DF  G}. – B2: R(ABCDEFG) R1(BA) R2(DBCE) R3(DFG) – B3: • Vì U1  U2  U3 = {ABCDEFG} nên đặt R4(HI). – B4: • D = {R1, R2, R3, R4}. 18
  19. 19. Bài tập 1: Cho lược đồ quan hệ R(ABCDE) và tập phụ thuộc hàm: F = {A -> B; CD -> E; B -> C} 1. Tìm một khóa của lược đồ. 2. Tìm tất cả các khóa của lược đồ. 3. Cho biết dạng chuẩn cao nhất của lược đồ trên? Nếu chưa đạt dạng chuẩn 3 hãy tìm một phép phân rã thành các lược đồ con đạt dạng chuẩn 3 và bảo toàn thông tin. 19
  20. 20. Tìm một khóa Áp dụng các bước tìm bao đóng của tập các thuộc tính: • • • • • Lặp 1: (BCDE)F+ = BCDE  K = ABCDE. Lặp 2: (ACDE)F+ = ABCDE  K = ACDE. Lặp 3: (ADE)F+ = ADEBC  K = ADE. Lặp 4: (AE)F+ = AEBC  K = ADE. Lặp 5: (AD)F+ = ADBCE  K = AD. AD là khoá. 20
  21. 21. - Khóa là AD, R không đạt 2NF vì A  B - Tìm một phép phân rã tách lược đồ trên thành các lược đồ con đạt dạng chuẩn 3. Cho lược đồ quan hệ R(ABCDE) và tập phụ thuộc hàm: F=Ftt = {A -> B; CD -> E; B -> C} R(ABCDE) R1(BC) R2(ADEB) {A -> B} R21(AB) R22(ADE) 21
  22. 22. - Khóa là AD, R không đạt 2NF vì A  B - Tìm một phép phân rã tách lược đồ trên thành các lược đồ con đạt dạng chuẩn 3. Cho lược đồ quan hệ R(ABCDE) và tập phụ thuộc hàm: F=Ftt = {A -> B; CD -> E; B -> C} 22
  23. 23. Bài tập 2 Cho lược đồ quan hệ R(A,B,C,D,E,G,H,I,J,K) và tập các phụ thuộc hàm: F = {A -> B ; C -> D,H,I ; I,J -> K ; B,C -> A ; H,C -> E} 1. Tìm một khóa của lược đồ. 2. Tìm tất cả các khóa của lược đồ. 3. Cho biết dạng chuẩn cao nhất của lược đồ trên? Nếu chưa đạt dạng chuẩn 3 hãy tìm một phép phân rã thành các lược đồ con đạt dạng chuẩn 3 và bảo toàn thông tin. 23
  24. 24. 1. Tìm một khóa của lược đồ Áp dụng các bước tìm bao đóng của tập các thuộc tính: • • • • • • • • • • Lặp 1: (ABCDEGHIJK)F+ = R  K = BCDEGHIJK Lặp 2: (BCDEGHIJK) F+  R  K = BCDEGHIJK Lặp 3: (BDEGHIJK) F+  R  K = BCDEGHIJK Lặp 4: (BCEGHIJK) F+ = R  K = BCEGHIJK. Lặp 5: (BCGHIJK ) F+ = R  K = BCGHIJK Lặp 6: (BCGHIJK ) F+  R  K = BCGHIJK Lặp 7: (BCGIJK ) F+= R  K = BCGIJK Lặp 8: (BCGJK ) F+ = R  K = BCGJK Lặp 9: (BCGK ) F+  R  K = BCGJK Lặp 10: (BCGJ ) F+ = R  K = BCGJ 24
  25. 25. 2. Tìm tất cả các khóa của lược đồ Có 2 khóa: K1=(BCGJ) K2=(ACGJ) 25
  26. 26. Cho biết dạng chuẩn cao nhất R không đạt 2NF vì C  D 26
  27. 27. Bài tập Cho lược đồ quan hệ R(A,B,C,D,E,G) và tập các phụ thuộc hàm: F = {A -> D ; E->B ;A,E->G ; B->C} 1. Tìm một khóa của lược đồ. 2. Tìm tất cả các khóa của lược đồ. 3. Cho biết dạng chuẩn cao nhất của lược đồ trên? Nếu chưa đạt dạng chuẩn 3 hãy tìm một phép phân rã thành các lược đồ con đạt dạng chuẩn 3 và bảo toàn thông tin. 27
  28. 28. a.,b. AE là khóa c. Phân rã: F = {A -> D ; E->B ;A,E->G ; B->C} - R không đạt 2NF vì có PTH A->D, D không phụ thuộc đầy đủ vào khóa. R(ABCDEG) R1(BC) R2(ABDEG) {A -> D ; E->B ;A,E->G} R21(EB) R22(ADEG) {A -> D ; A,E->G} R221(AD) R222(AEG) 28
  29. 29. Bài tập ví dụ: Cho lược đồ quan hệ R(A,B,C,D,E) và tập các phụ thuộc hàm: F = {AB -> C ; AB->D ;D->A ; BC-D,BC->E} Cho biết dạng chuẩn cao nhất của lược đồ trên? Nếu chưa đạt dạng chuẩn 3 hãy tìm một phép phân rã thành các lược đồ con đạt dạng chuẩn 3, bảo toàn thông tin, bảo toàn PTH. 29
  30. 30. Cho lược đồ quan hệ R(A,B,C,D,E) và tập các phụ thuộc hàm: F = {AB -> C ; AB->D ;D->A ; BC-D,BC->E} - Q.hệ R không đạng dạng chuần 2 vì tồn tại PTH D->A trong đó thuộc tính A không phụ thuộc đầy đủ vào khóa BD 30
  31. 31. - Tìm phủ tối thiểu của F B2: (Tách các PTH để có vế phải là 1 thuộc tính) PTH ={AB->C, AB->D, D->A, BC->D, BC->E} f1 f2 f3 f4 f5 B3: (Loại bỏ các thuộc tính dư thừa vế trái) - Xét: AB->C: - Bỏ A: (B)PTH+=B không xác định được C - Bỏ B: (A)PTH+=A không xác định được C  Không loại bỏ được PTH AB -> C - Xét: AB->D: - Bỏ A: (B)PTH+=B không xác định được D - Bỏ B: (A)PTH+=A không xác định được D  Không loại bỏ được PTH AB -> D Xét tương tự cho các phụ thuộc hàm còn lại 31
  32. 32. Tập PTH tìm được sau bước 3: PTH ={AB->C, AB->D, D->A, BC->D, BC->E} f1 f2 f3 f4 f5 B4: (Loại bỏ các PTH dư thừa) - Với f1= AB->C F1= PTH {f1} - (AB)F1+=ABD không xác định được C  Không loại bỏ được f1 - Với f2= AB->D F2= PTH {f2} - (AB)F2+=ABCDE xác định được D  Loại bỏ được f2 PTH ={AB->C, D->A, BC->D, BC->E} f1 f3 f4 f5 - Với f3= D->A F3= PTH {f3} - (D)F3+=D không xác định được A  Không loại bỏ được f3 - Tương tự với f3,f4,f5 32
  33. 33. Phủ tối thiểu tìm được: PTT ={AB->C, D->A, BC->D, BC->E} f1 f3 f4 f5 Lược đồ R phân rã thành 3 lược đồ con: –- R1(ABC) Khóa AB (AB->C) –- R2(AD) Khóa D (D->A) –- R3(BCDE) Khóa BC (BC->DE) 33

×