8 ds 17024 phuong phap xu ly gia tri khoang theo cach tiep can dsgt da sua
1. Tạp chí BCVT & CNTT kỳ 3 10/2007
Một phương pháp xử lý giá trị khoảng trong cơ sở dữ liệu mờ
A Method for Procesing Interval Values In Fuzzy Databases
Nguyễn Công Hào
Abstract: In this paper, we provide a method for Chúng ta xét miền ngôn ngữ của biến chân lý
processing interval values in fuzzy databases with TRUTH gồm các từ sau: Dom(TRUTH) = {true,
quantitatively semantics based hedge algebras. This false, very true, very false, more-or-less true, more-
interval values are converted into sub interval in [0,1]
or-less false, possibly true, possibly false,
respectively. Thus, the interval values become to process
approximately true, approximately false, little true,
sub intervals in [0,1]. Finally, an algorithms is proposed
to application that for searching data in fuzzy databases
little false, very possibly true, very possibly false.....},
with interval valued deductive attributes. trong đó true, false là các từ nguyên thuỷ, các từ nhấn
(mordifier hay intensifier) very, more-or-less,
I. ĐẶT VẤN ĐỀ possibly, approximately, little gọi là các gia tử
Khi thao tác dữ liệu trong cơ sở dữ liệu mờ, vấn đề (hedges).
quan trọng nhất là làm thế nào tìm ra một phương Khi đó, miền ngôn ngữ T = dom(TRUTH) có thể
pháp xử lý các giá trị mờ để từ đó xây dựng các quan biểu thị như một đại số X = (X, G, H, ≤ ), trong đó G
hệ đối sánh giữa chúng. Các giá trị trong cơ sở dữ liệu là tập các từ nguyên thuỷ được xem là các phần tử
mờ rất phức tạp, bao gồm các giá trị ngôn ngữ, giá trị sinh. H là tập các gia tử được xem như là các phép
số, giá trị khoảng….Có nhiều cách tiếp cận để xử lý toán một ngôi, quan hệ ≤ trên các từ (các khái niệm
các giá trị mờ được các tác giả trong và ngoài nước mờ) là quan hệ sắp thứ tự tuyến tính trên X cảm sinh
quan tâm nghiên cứu trong những năm gần đây, chẳng từ ngữ nghĩa của ngôn ngữ. Ví dụ dựa trên ngữ nghĩa,
hạn như: lý thuyết tập mờ [9][10][11][12], lý thuyết các quan hệ thứ tự sau là đúng: false ≤ true, more true
khả năng [13], quan hệ tương tự [14]…..Mỗi cách tiếp ≤ very true nhưng very false ≤ more false, possibly
cận có những ưu và nhược điểm riêng và cùng chung true ≤ true nhưng false ≤ possibly false ... . Tập X
mục đích đó là làm thế nào xử lý thật tốt và thật chính được sinh ra từ G bởi các phép toán trong H. Như vậy
xác những giá trị mờ, xem giá trị rõ là trường hợp mỗi phần tử của X sẽ có dạng biểu diễn x = hnhn-
riêng của giá trị mờ. Các giá trị khoảng hầu như x∈G. Tập tất cả các phần tử được sinh ra từ
1.......h1x,
chuyển về dạng các số mờ tam giác để xử lý. Tuy một phần tử x được ký hiệu là H(x). Nếu G có đúng
nhiên, nếu chúng ta xem miền trị của thuộc tính mờ là hai từ nguyên thuỷ mờ, thì một được gọi là phần tử
đại số gia tử, và việc biến đổi các giá trị khoảng về sinh dương ký hiệu là c+, một gọi là phần tử sinh âm
một đoạn con của [0,1] thì việc xử lý và thao tác trên ký hiệu là c- và ta có c- < c+. Trong ví dụ trên true là
dữ liệu mờ đơn giản và hiệu quả. phần tử sinh dương còn false là phần tử sinh âm.
Như vậy, cho X = ( X, G, H, ≤ ) với G = {c-, W, c+
II. MỘT SỐ KHÁI NIỆM
}, H = H- ∪ H+ với giả thiết H− = {h1,h2,.., hp}, H+ =
Trong phần này, chúng tôi trình bày một số khái {h-1, ..., h-q}, h1 > h2 > ... > hp và h-1 <...< h-q là dãy
niệm liên quan đến đại số gia tử làm cơ sở cho việc các gia tử, ta có các định nghĩa liên quan như sau :
xây dựng phương pháp xử lý dữ liệu mờ trong những
Định nghĩa 2.1. [2] f : X → [0,1] gọi là hàm định
phần tiếp theo.
- 67 -
2. Tạp chí BCVT & CNTT kỳ 3 10/2007
lượng ngữ nghĩa của X nếu ∀ h, k∈H+ hoặc ∀ h, k∈H- Định nghĩa 2.4. [2] Cho fm là độ đo tính mờ trên X,
và ∀ x, y ∈ X, ta có : hàm định lượng ngữ nghĩa ν trên X được định nghĩa
f (hx) − f ( x) f (hy ) − f ( y ) như sau :
=
f (kx ) − f ( x ) f (ky ) − f ( y ) (1) ν(W) = θ = fm(c-), ν(c−) = θ - α.fm(c-) và
Với đại số gia tử và hàm định lượng ngữ nghĩa ta có ν(c+) = θ + α.fm(c+).
thể định nghĩa tính mờ của một khái niệm mờ. Cho (2) Nếu 1≤ j≤ p thì:
trước hàm định lượng ngữ nghĩa f của X, xét bất kỳ j
ν ( h j x ) = ν ( x) + Sign( h j x) ∑ fm( hi x ) − ω( h j x ) fm( h j x )
x∈X. Tính mờ của x khi đó được đo bằng đường kính i =1
của tập f(H(x)) ⊆ [0,1]. Nếu –q ≤ j ≤ -1 thì:
Định nghĩa 2.2. [2] Hàm fm: X→[0,1] được gọi là −1
ν ( h j x ) = ν ( x) + Sign( h j x) ∑ fm( hi x ) − ω( h j x ) fm( h j x )
độ đo tính mờ trên X nếu thoả mãn các điều kiện sau:
i= j
(1) fm là độ đo mờ đầy đủ trên X, tức là
trong đó:
∑ fm(h u ) = fm(u ) với mọi u ∈ X. ω(h j x) =
1
1 + Sign( h j x ) Sign(hq h j x )( β − α ) ∈{α,β} .
2
i
− q ≤ i ≤ p ,i ≠ 0
(2) Nếu x là khái niệm rõ, tức là H(x) = {x} thì Định nghĩa 2.5. [1] Gọi fm là độ đo tính mờ trên
fm(x) = 0. Do đó fm(0) = fm(W) = fm(1) = 0. ĐSGT X. Với mỗi x∈X, ta ký hiệu I(x) ⊆ [0,1] và |I(x)|
(3) Với mọi x, y ∈ X và h∈H ta có là độ dài của I(x).
fm(hx) fm(hy ) Một họ các J = {I(x): x∈X } được gọi là phân hoạch
= , nghĩa là tỉ số này không phụ
fm( x) fm( y ) của [0,1] gắn với x nếu:
thuộc vào x và y, được kí hiệu là µ(h) gọi là độ đo (1) {I(c+), I(c-)} là phân hoạch của [0,1] sao cho
tính mờ (fuzziness measure) của gia tử h. |I(c)| = fm(c), với c∈{c+, c-}.
Trong đại số gia tử, mỗi phần tử x ∈ X đều mang (2) Nếu đoạn I(x) đã được định nghĩa và |I(x)| =
dấu âm hay dương, được gọi là PN-dấu và được định fm(x) thì {I(hix): -q ≤ i ≤ p, i≠0} được định nghĩa là
nghĩa đệ quy như sau: phân hoạch của I(x) sao cho thoả mãn điều kiện:
Định nghĩa 2.3. [2] Hàm Sign: X → {-1, 0, 1} là |I(hix)| = fm(hix) và |I(hix)| là tập sắp thứ tự tuyến
một ánh xạ được định nghĩa một cách đệ qui như sau, tính, tức là : hoặc I(h-q x) < I(h-q+1 x) < I(h-q+2 x)
với ∀ h, h' ∈ H : <.......< I(hpx) ; hoặc I(h-q x) > I(h-q+1 x) > I(h-q+2 x)
>.......> I(hpx) .
(1) Sign(c−) = -1 và Sign(hc−) = +Sign(c−) nếu
Tập {I(hix)} được gọi là phân hoạch gắn với phần tử
hc− < c−
Sign(hc−) = -Sign(c−) nếu hc− > c−
+ + + + +
x. Ta có ∑ I (h x) =| I ( x) |= fm( x) .
−q ≤i ≤ p ,i ≠ 0
i
Sign(c ) = +1 và Sign(hc ) = +Sign(c ) nếu hc > c
Sign(hc+) = -Sign(c+) nếu hc+ < c+ Định nghĩa 2.6. [1] Cho Xk = {x∈X: |x| = k}, xét
k
(2) Sign(h’hx) = -Sign(hx) nếu h' là negative đối P = {I(x): x∈Xk } là một phân hoạch của [0,1]. Ta nói
với h và h'hx ≠ hx . rằng u bằng v theo mức k, được ký hiệu u =k v, khi và
chỉ khi I(u) và I(v) cùng bao hàm trong một khoảng mờ
(3) Sign(h’hx) = +Sign(hx) nếu h' là positive đối
mức k. Có nghĩa là ∀u, v∈X, u =k v ⇔ ∃∆k ∈ Pk : I(u)
với h và h'hx ≠ hx.
⊆ ∆k và I(v) ⊆ ∆k.
(4) Sign(h’hx) = 0 nếu h'hx = hx.
Bổ đề 2.1. [1] Quan hệ =k là một quan hệ tương
- 68 -
3. Tạp chí BCVT & CNTT kỳ 3 10/2007
đương trên Pk. TUOI, THUNHAP ) được xác định như sau:
Bổ đề 2.2. [1] Cho u = hn…h1x và v = h’m…h’1x là Bảng 1. Quan hệ Thunhapcanhan
biểu diễn chính tắc của u và v đối với x. TT TEN TUOI THUNHAP
(1) Nếu u = v, thì u =k v với mọi k. 1 An 30 2.500.000
(2) Nếu h1 ≠ h’1 thì u =|x| v. 2 Hải khoảng 25 1.500.000
3 Hằng [25,40] khoảng 3.500.000
Định lý 2.1. [1] Cho Xk ={x∈X: |x| = k}, xét Pk
4 Phương [45,50] [1.500.00,1.800.000]
={I(x): x∈Xk} là một phân hoạch của [0,1], u =
5 Thúy 45 khoảng 1.000.000
hn….h1x và v = h’m….h’1x là biểu diễn chính tắc của u
Chúng ta thấy rằng, các giá trị trên thuộc tính TUOI
và v đối với x.
và THUNHAP rất đa dạng. Tuy nhiên, trong bài bào
(1) Nếu u =k v thì u =k’ v, ∀ 0 < k’< k.
này, chúng tôi chỉ quan tâm đến việc xử lý các giá trị
(2) Nếu tồn tại một chỉ số j ≤ min(m,n) lớn nhất sao khoảng. Vì vậy, tất cả các giá trị trên quan hệ
cho với mọi s = 1..j ta có hs= h’s thì u = j+|x| v. Thunhapcanhan có thể chuyển về các giá trị khoảng
Định nghĩa 2.7. Cho x = ( x1, x2, ….xn) và y = ( y1, tương ứng.
y2, ….yn). Ta nói x ≤ y khi và chỉ khi xi ≤ yi với mọi 1≤ Một cách tổng quát, nếu là giá trị a ta chuyển thành
i≤ n. [a,a], nếu là giá trị khoảng a ta chuyển thành
Định nghĩa 2.8. Cho n đại số gia tử X1, X2, X3 …, [a-ε, a+ε], với ε được xem là bán kính với tâm a. Nếu
Xn. Khi đó ta gọi hàm tích hợp các đại số gia tử X1, X2, từ a đến b thì ta chuyển thành [a,b]. Do đó quan hệ
X3 …, Xn là hàm có dạng F: X1 × X2 × X3…× Xn → Thunhapcanhan có thể chuyển thành quan hệ sau:
[0,1] thoả mãn các tính chất sau: Bảng 2. Quan hệ Thunhapcanhan (sau khi chuyển đổi) với
εTUOI = 2 và εTHUNHAP = 100.000
(1) 0 ≤ F( x ) ≤ 1 ∀ x∈ X1 × X2 × X3……× Xn .
TT TEN TUOI THUNHAP
(2) Nếu x ≤ y thì F( x ) ≤ F( y ) ∀ x, y ∈ X1 × X2 1 An [30,30] [2.500.000,2.500.000]
× X3……× Xn. 2 Hải [23,27] [1.500.000,1.500.000]
3 Hằng [25,40] [3.400.000,3.600.000]
III. XÂY DỰNG PHƯƠNG PHÁP XỬ LÝ GIÁ
4 Phương [45,50] [1.500.00,1.800.000]
TRỊ KHOẢNG
5 Thúy [45,45] [9.00.00,1.100.000]
Trong cơ sở dữ liệu mờ, có nhiều quan hệ mà miền 1. Chuyển các giá trị khoảng về đoạn con [0,1]
trị của các thuộc tính không phải là giá trị ngôn ngữ, tương ứng
không phải giá trị số mà là giá trị khoảng, chẳng hạn
Gọi Dom(Ai) = [min, max] là miền trị kinh điển của
như quan hệ lưu trữ nhiệt độ sốt một căn bệnh của các
thuộc tính mờ Ai trong một quan hệ, trong đó min, max
bệnh nhân trong một bệnh viện nào đó, quan hệ thu
tương ứng là giá trị nhỏ nhất và giá trị lớn nhất của
nhập cá nhân trong một cơ quan.... Đối với loại dữ liệu
Dom(Ai). Trước hết, ta xây dựng một hàm f để
này, việc lưu trữ phức tạp nên việc xử lý dữ liệu loại
chuyển đổi giá trị thuộc Dom(Ai) thành giá trị thuộc
này càng phức tạp hơn. Vì vậy, nếu xem miền trị của
[0,1]. Tiếp theo khoảng [a,b] được biến đổi thành đoạn
thuộc tính mờ là một đại số gia tử thì trong phần này,
con [0,1] tương ứng khi sử dụng hàm f , hay [f (a),f
chúng tôi giới thiệu một phương pháp mới để xử lý giá
(b)] ⊆[0,1].
trị khoảng giúp cho việc thao tác dữ liệu dễ dàng.
Trước hết, một ví dụ được xem xét để từ đó phân tích Định nghĩa 3.1. f : Dom(Ai) → [0,1] và được xác
a − min
ngữ nghĩa của các giá trị khoảng trong một quan hệ. định f(a) = , ∀a∈Dom(Ai).
max − min
Ví dụ 3.1. Cho quan hệ Thunhapcanhan(STT, TEN,
- 69 -
4. Tạp chí BCVT & CNTT kỳ 3 10/2007
Ví dụ 3.2. Sử dụng quan hệ Thunhapcanhan (sau Với mỗi [Ia,Ib] nếu tồn tại x∈X sao cho
khi chuyển đổi) ([Ia,Ib]∩I(x)) = ∅ thì:
Nếu chúng ta chọn Dom(TUOI) = [0,100] và Nếu tồn tại z∈X sao cho [Ia,Ib] ⊆I(z) và I(x) ⊆I(z),
Dom(THUNHAP) = [500.000,6.000.000]. Khi đó ta thì [a,b] =|z| x.
có các kết quả chuyển giá trị khoảng tương ứng về Ia Ib
đoạn con của [0,1] như sau:
Bảng 3. Quan hệ Thunhapcanhan sau khi sử dụng hàm f I(x)
TT TEN TUOI THUNHAP I(z)
1 An [0.3,0.3] [0.36,0.36] Ví dụ 3.3. Gọi XTUOI = ( XTUOI, GTUOI, HTUOI, ≤ ) là
2 Hải [0.23,0.27] [0.18,0.18] đại số gia tử, với GTUOI = {già, trẻ}, H+TUOI = {rất,
3 Hằng [0.25,0.4] [0.52,0.56]
hơn}, H-TUOI = {khả năng, ít}, rất > hơn và ít > khả
4 Phương [0.45,0.50] [0.18,0.23]
5 Thúy [0.45,0.45] [0.07,0.11] năng, WTUOI = 0.6, fm(trẻ) = 0.6, fm(già) = 0.4,
fm(rất) = 0.25, fm(hơn) = 0.25, fm(khả năng) = 0.25,
2. So sánh các giá trị khoảng theo cách tiếp cận đại
fm(ít) = 0.25, chọn Dom(TUOI) = [0,100] .
số gia tử
Ta có fm(rất trẻ) = 0.15, fm(hơn trẻ) = 0.15, fm(ít
Cho đại số gia tử X = ( X, G, H, ≤ ) và một giá trị
trẻ) = 0.15, fm(khả năng trẻ) = 0.15.
khoảng [a,b]. Để so sánh một giá trị x ∈X với [a,b],
Vì rất trẻ < hơn trẻ < trẻ < khả năng trẻ < ít trẻ nên
trước tiên ta phải chuyển [a,b] về đoạn con của [0,1].
I(rất trẻ) = [0,0.15], I(hơn trẻ) = [0.15,0.3], I(khả
Vì tính mờ của x là một đoạn con của [0,1], do đó để
năng trẻ) = [0.3,0.45], I(ít trẻ) = [0.45,0.6].
so sánh x∈X và đoạn con [0,1] chúng ta chỉ cần dựa
Ta có fm(rất già) = 0.1, fm(hơn già) = 0.1, fm(ít
vào phần giao hai đoạn con của [0,1] tương ứng. Với
già) = 0.1, fm(Khả năng già) = 0.1.
x∈ X, ký hiệu I(x)⊆[0,1] và |I(x)| = fm(x), [Ia,Ib] =
Vì ít già < khả năng già < già < hơn già < rất già
[f(a),f(b)]⊆[0,1] tương ứng với việc chuyển đổi giá
nên I(ít già) = [0.6,0.7], I(khả năng già) = [0.7,0.8],
trị khoảng [a,b] về đoạn con của [0,1]. Khi đó ta có:
I(hơn già) = [0.8,0.9], I(rất già) = [0.9,1].
Với mỗi [Ia,Ib] nếu tồn tại x∈X sao cho [Ia,Ib]⊆I(x),
Vì [0.23,0.27] ⊆ I(hơn trẻ) mà [f(23),f(27)] =
thì [a,b] =|x| x.
Ia Ib [0.23,0.27] nên [23,27] =2 hơn trẻ. Hay khoảng 25 =2
hơn trẻ. Tương tự, ta có [0.25,0.4] ∩ I(hơn trẻ) =
I(x) [0.25,0.3] và [0.25,0.4] ∩ I(khả năng trẻ) = [0.3,0.4].
Với mỗi [Ia,Ib] sao cho [Ia,Ib]⊄ I(x) ∀x, x1∈X thì: Mặt khác ta có |[0.25,0.3]| = 0.05, |[0.3,0.4]| = 0.1,
Khi đó với x và x1, giả sử x < x1, nếu |[Ia,Ib]∩I(x)| ≥ |[0.25,0.4]|/2 = 0.075. Vì [f(25),f(40)] = [0.25,0.4]
|[Ia,Ib]|/£, thì [a,b] =|x| x. và |[0.25,0.4] ∩ I(khả năng trẻ)| ≥ |[0.25,0.4]|/2, nên
Ia Ib [25,40] =2 khả năng trẻ.
IV. TÌM KIẾM DỮ LIỆU
I(x) I(x1)
1. Đặt vấn đề
ngược lại, nếu |[Ia,Ib]∩I(x1)| ≥ |[Ia,Ib]|/£, thì [a,b] =|x1| x1 Khi thiết kế một cơ sở dữ liệu, nếu một thuộc tính
Ia Ib nhận được từ việc tính toán hay kết hợp của hai hay
nhiều thuộc tính khác thì thông thường thuộc tính này
I(x) I(x1) sẽ không cần đưa vào cơ sở dữ liệu để tinh giản trong
với £ là số đoạn I(xi)⊆[0,1], sao cho ([Ia,Ib]∩I(xi)) ≠ ∅ thiết kế. Chẳng hạn như trong một cơ sở dữ liệu có
- 70 -
5. Tạp chí BCVT & CNTT kỳ 3 10/2007
thuộc tính SOLUONG 0 0.15 0.3 0.45 W 0.7 0.8 0.9 1
và DONGIA, khi đó
THANHTIEN = I(rất trẻ) I(hơn trẻ) I(ít trẻ) I(ít già) I(hơn già)
SOLUONG*DONGIA, I(khả năng trẻ) I(khả năng già) I(rất già)
do vậy thuộc tính I(trẻ) I(già)
THANHTIEN sẽ không
Hình minh họa ví dụ 3.3
cần thiết đưa vào cơ sở
2. Thuật toán xác định giá trị chân lý của điều kiện
dữ liệu nếu không muốn lưu trữ giá trị THANHTIEN
mờ
mà chỉ muốn giá trị THANHTIEN phục vụ cho việc
thao tác hay truy vấn dữ liệu. Trong phần này, chúng tôi trình bày một thuật toán
để xác định giá trị chân lý của điều kiện mờ làm cơ sở
Trong cơ sở dữ liệu mờ, khi cho một quan hệ, nếu
cho việc tìm kiếm dữ liệu.
một thuộc tính nào đó không có trong quan hệ nhưng
nhận được từ việc kết hợp hai hay nhiều thuộc tính đã Thuật toán 4.1. Xác định giá trị chân lý của điều
cho trong quan hệ bằng một phương pháp nào đó kiện (t[Ai] =k x).
chúng ta gọi là thuộc tính suy dẫn. Trong phạm vi bài
Input : Cho lược đồ U = {A1, A2,...An} và quan hệ
báo này, chúng tôi xét miền trị của các thuộc tính mờ
r xác định trên U.
là giá trị khoảng, do đó miền trị của thuộc tính suy dẫn
cũng nhận giá trị khoảng. Output : Với mọi t∈r sao cho (t[Ai] =k x) = true.
Ví dụ 4.1. Cho quan hệ Suckhoe_svien(MASV, Method :
HOTEN, GIOITINH, CHIEUCAO, TRONGLUONG)
(1) Đặt Dom(Ai) = [min,max]
như bảng 4.
Bảng 4. Quan hệ Suckhoe_svien (2) For mỗi t∈r do
MASV HOTEN GIOI CHIEU TRONG (3) if t[Ai] không phải giá trị khoảng then chuyển t[Ai]
TINH CAO LUONG thành khoảng [a,b] tương ứng.
SV001 Nguyễn Lan Nữ [1.65,1.7] 55 (4) For mỗi t∈r do
SV002 Trần Thanh Nam 1.67 [57,65]
(5) t[Ai] = [f(a),f(b)] // Sử dụng hàm f để chuyển
SV003 Cao Kỳ Nam 1.72 [60,70]
các giá trị [a,b] thành đoạn con [0,1]
SV004 Lý Thanh Nhàn Nữ [1.7,1.8] 50
SV005 Hoàng Hoá Nữ [1.63,1.8] [65,75] (6) For mỗi t∈r do
Giả sử rằng chúng ta muốn tìm những sinh viên nữ (7) if t[Ai] ⊆I(x) và |x| ≥ k thì (t[Ai] =k x) = true
có sức khỏe khả năng yếu. Ở đây, thuộc tính (8) elseif (t[Ai]∩I(x)) = ∅ then
SUCKHOE không có trong quan hệ nhưng ta có thể
kết hợp hai thuộc tính CHIEUCAO và (9) if tồn tại x1∈X sao cho t[Ai]⊆I(x1) và I(x)⊆I(x1)
TRONGLUONG trong quan hệ Suckhoe_svien, như và |x1| ≥ k then (t[Ai] =k x) = true.
vậy thuộc tính SUCKHOE gọi là thuộc tính suy dẫn. (10) if t[Ai] ⊄ I(x) then
Vậy, để xác định giá trị của thuộc tính SUCKHOE
(11) if tồn tại x1∈X and x < x1 sao cho |t[Ai]∩I(x)| ≥
chúng ta có thể sử dụng các hàm kết nhập của hai đại
số gia tử Dom(CHIEUCAO) và Dom(TRONG |t[Ai]|/£ và |x| ≥ k then (t[Ai] =k x) = true (với £ là số
LUONG). đoạn I(xi) ⊆[0,1] sao cho (t[Ai]∩I(xi)) ≠ ∅ ).
- 71 -
6. Tạp chí BCVT & CNTT kỳ 3 10/2007
(12) if tồn tại x1∈X and x < x1 sao cho |t[Ai]∩I(x1)| ≥ suy dẫn SUCKHOE
|t[Ai]|/£ và |x1| ≥ k then (t[Ai] =k x) = true. Gọi XSUCKHOE = (XSUCKHOE, GSUCKHOE, HSUCKHOE, ≤ )
3. Phương pháp tìm kiếm dữ liệu là một đại số gia tử với GSUCKHOE = {yếu, tốt},
H+SUCKHOE = {rất, hơn}, H-SUCKHOE = {khả năng, ít},
Để trả lời câu truy vấn trong truy vấn 4.1, trước tiên
rất > hơn và ít > khả năng, WSUCKHOE = 0.6. Khi đó,
chúng ta áp dụng hàm f chuyển quan hệ sinhvien
fm(yếu) = 0.6, fm(tốt) = 0.4, fm(rất) = 0.2, fm(hơn) =
thành một quan hệ tương ứng với miền trị của
0.2, fm(khả năng) = 0.25, fm(ít) = 0.35.
CHIEUCAO và TRONGLUONG là các đoạn con của
[0,1]. Tiếp theo, ta sử dụng hàm kết nhập đại số gia tử Ta có fm(rất yếu) = 0.12, fm(hơn yếu) = 0.12,
để tính miền trị tương ứng cho thuộc tính suy dẫn fm(khả năng yếu) = 0.15, fm(ít yếu) = 0.21.
SUCKHOE. Cuối cùng, áp dụng thuật toán 4.1 để xác Vì rất yếu < hơn yếu < yếu < khả năng yếu < ít yếu
định giá trị chân lý của điều kiện trong truy vấn và tìm nên I(rất yếu) = [0,0.12], I(hơn yếu) = [0.12,0.24],
những bộ dữ liệu thoả mãn điều kiện. I(khả năng yếu) = [0.24,0.39], I(ít yếu) = [0.39,0.6].
Như vậy, một cách tổng quát ta gọi Pa là thuộc tính Bảng 6. Quan hệ Suckhoe_svien (sau khi chuyển đổi và
thêm thuộc tính suy dẫn SUCKHOE)
suy dẫn từ các thuộc tính mờ A1, A2, …Aq, với miền trị
tương ứng Dom(Ai), i =1..q, F: Dom(A1) × Dom(A2) MA HOTEN GIOI CHIEU TRONG SUC
SV TINH CAO LUONG KHOE
×… × Dom(Aq)→ [0,1] là hàm kết nhập các đại số gia
SV Nguyễn Nữ [0.281, [0.18, [0.23,
tử Dom(A1), Dom(A2), …, Dom(Aq), ψ là một giá trị
001 Lan 0.5] 0.18] 0.34]
thuộc đại số gia tử X. Khi đó, điều kiện mờ Pa =k ψ
SV Trần Nam [0.361, [0.231, [0.296,
trong câu truy vấn được xác định như sau: Pa =k ψ ⇔
002 Thanh 0.361] 0.5] 0.43]
[F( x ),F( y )] =k I(ψ), với x = (x1 × x2 ×….× xq), y =
SV Cao Kỳ Nam [0.595, [0.32, [0.457,
(y1 × y2 ×….× yq) và |I(ψ)| = fm(ψ).
003 0.595] 0.68] 0.637]
Ví dụ 4.2. Trong quan hệ Suckhoe_svien ở ví dụ 4.1
SV Lý Thanh Nữ [0.5, [0.08, [0.29,
hãy tìm những sinh viên nữ có sức khỏe khả năng yếu.
004 Nhàn 0.875] 0.08] 0.477]
Ta chọn Dom(CHIEUCAO) = [1.5,1.9] và
SV Hoàng Nữ [0.211, [0.5, [0.355,
Dom(TRONGLUONG) = [40,90] thì khi đó áp dụng
005 Hoá 0.875] 0.82] 0.847]
hàm chuyển đổi f cho kết quả :
Áp dụng thuật toán 4.1 ta có hai sinh viên nữ có
Bảng 5. Quan hệ Suckhoe_svien (sau khi chuyển đổi)
SUCKHOE =2 khả năng yếu là Nguyễn Lan và Lý
MA HOTEN GIOI CHIEUCAO TRONG
Thanh Nhàn..
SV TINH LUONG
SV001 Nguyễn Nữ [0.281,0.5] [0.18,0.18] V. KẾT LUẬN
Lan
Trong bài báo này, chúng tôi đã đưa ra một phương
SV002 Trần Thanh Nam [0.361,0.361] [0.231,0.5]
pháp mới để xử lý dữ liệu dạng khoảng trong cơ sở dữ
SV003 Cao Kỳ Nam [0.595,0.595] [0.32,0.68]
liệu mờ đó là phương pháp tiếp cận ngữ nghĩa định
SV004 Lý Thanh Nữ [0.5,0.875] [0.08,0.08]
lượng đại số gia tử. Cách tiếp cận này làm cho việc xử
Nhàn
lý dữ liệu đơn giản và thuần nhất kiểu dữ liệu. Các giá
SV005 Hoàng Hoá Nữ [0.211,0.875] [0.5,0.82]
trị khoảng được chuyển thành các đoạn con của [0,1]
n
Chọn hàm kết nhập đại số gia tử F = ∑δ ν
. i i ( xi ) , tương ứng. Vì tính mờ của các phần tử trong đại số gia
i =1 tử cũng là một đoạn con của [0,1], do đó việc so sánh
với δ1 = δ2 = 0.5, khi đó ta có miền trị của thuộc tính các giá trị khoảng với một giá trị trong một đại số gia
- 72 -
7. Tạp chí BCVT & CNTT kỳ 3 10/2007
tử trở thành so sánh hai đoạn con của [0,1]. Từ việc so Information Processing (FIP) 2003, Beijing, pp 105-
sánh các giá trị khoảng, bài báo đã đề xuất cách xây 111.
dựng các thuộc tính suy dẫn bằng cách sử dụng các [7] NGUYỄN CÁT HỒ, TRẦN THÁI SƠN, “Logic mờ và
hàm kết nhập các đại số gia tử. Cuối cùng, chúng tôi quyết định mờ dựa trên cấu trúc thứ tự của giá trị ngôn
xây dựng thuật toán đánh giá giá trị chân lý của điều ngữ”, Tạp chí Tin học và Điều khiển học, Tập 9, số 4
(1993), trang 1-9.
kiện mờ để từ đó áp dụng truy vấn dữ liệu với thuộc
[8] TRẦN ĐÌNH KHANG, “Xây dựng hàm đo trên đại số
tính suy dẫn có miền trị là giá trị khoảng trong cơ sở
gia tử và ứng dụng trong lập luận ngôn ngữ”, Tạp chí
dữ liệu mờ theo mô hình [1].
Tin học và Điều khiển học, Tập 13 số 1 (1997), trang
TÀI LIỆU THAM KHẢO 16-30.
[9] TRƯƠNG ĐỨC HÙNG, “Một phương pháp xử lý dữ
[1] NGUYỄN CÔNG HÀO, “Mô hình cơ sở dữ liệu mờ liệu trong CSDL mờ”, Kỷ yếu Hội nghị khoa học
theo cách tiếp cận đại số gia tử”. Kỷ yếu Hội thảo trường Đại học Bách Khoa Hà Nội 10/1996.
quốc gia về các vấn đề chọn lọc Công nghệ Thông tin
[10] PATRICK BOSC, “Subqueries in SQLf, a Fuzzy
và Truyền thông, Hải Phòng 2005, trang 285-293.
Database Query Language”, IEEE International
[2] NGUYỄN CÁT HỒ, Lý thuyết tập mờ và công nghệ Conference on Intelligent Systems for the 21st
tính toán mềm, Hệ mờ, mạng nơron và ứng dụng, NXB Centuryapos,
Khoa học kỹ thuật 2001, trang 37-74. Vol. 4, Issue , 22-25 Oct 1995 pp 3636 - 3641.
[3] NGUYỄN CÁT HỒ, TRẦN THÁI SƠN, “Về khoảng [11] YOSHIKANE TAKAHASHI, “Fuzzy Database Query
cách giữa các giá trị của biến ngôn ngữ trong đại số Language and Their Relational Completeness
gia tử”, Tạp chí Tin học và Điều khiển học, Tập 11 số theorem”, IEEE Transactions on Knowledge and Data
1 năm 1995, trang 10-20. Engineering, Vol 5, No. 1, 1993, 122-125.
[4] NGUYEN CAT HO, “W.Wechler, “Extended hedge [12] SHYUE-LIANG WANG, YU-JANE TSAI, “Null
algebras ans their application to fuzzy logic”, Fuzzy queries with Interval-Valued Ambiguous Attributes”,
Set and Systems 52 (1992), pp 259-282. IEEE International Conference on Systems Man and
[5] NGUYEN CAT HO, W.WECHLER, “Hedge algebras: Cybernetics,, 1998, pp 2150-2153.
an algebraic approach to structure of sets of linguistic [13] DUBOIS D, PRADE H, Possibility theory: An
domains of linguistic truth variable”, Fuzzy Set and approach to computerized processing of uncertainty,
Systems 35 (1990), pp 281-293. SIAM Review, Vol. 34, No. 1, Mar., 1992, pp. 147-148.
[6] NGUYEN CAT HO, “Quantifying hedge algebras and Ngày nhận bài : 5/9/06
interpolation methods in approximate reasoning”,
Proceeding of the Inter Workshop on Fuzzy
SƠ LƯỢC TÁC GIẢ
NGUYỄN CÔNG HÀO
Nơi công tác hiện nay: Khoa Công nghệ thông tin,
Sinh năm 1976.
Đại học Khoa học Huế
Tốt nghiệp Đại học Sư phạm
Hướng nghiên cứu: Cơ sở dữ liệu mờ, Đại số gia tử.
Huế năm 1997, nhận bằng Thạc
sỹ năm 2002 tại Đại học Bách Email: nchao_hueit@yahoo.com
khoa Hà Nội, hiện đang là
Nghiên cứu sinh tại Viện Công
nghệ thông tin - Viện Khoa học
và Công nghệ Việt Nam.
- 73 -