SlideShare a Scribd company logo
1 of 7
Download to read offline
Tạp chí BCVT & CNTT kỳ 3 10/2007


  Một phương pháp xử lý giá trị khoảng trong cơ sở dữ liệu mờ
             A Method for Procesing Interval Values In Fuzzy Databases
                                                                                               Nguyễn Công Hào


   Abstract: In this paper, we provide a method for             Chúng ta xét miền ngôn ngữ của biến chân lý
processing interval values in fuzzy databases with           TRUTH gồm các từ sau: Dom(TRUTH) = {true,
quantitatively semantics based hedge algebras. This          false, very true, very false, more-or-less true, more-
interval values are converted into sub interval in [0,1]
                                                             or-less false, possibly true, possibly false,
respectively. Thus, the interval values become to process
                                                             approximately true, approximately false, little true,
sub intervals in [0,1]. Finally, an algorithms is proposed
to application that for searching data in fuzzy databases
                                                             little false, very possibly true, very possibly false.....},
with interval valued deductive attributes.                   trong đó true, false là các từ nguyên thuỷ, các từ nhấn
                                                             (mordifier hay intensifier) very, more-or-less,
I. ĐẶT VẤN ĐỀ                                                possibly, approximately, little gọi là các gia tử
   Khi thao tác dữ liệu trong cơ sở dữ liệu mờ, vấn đề       (hedges).
quan trọng nhất là làm thế nào tìm ra một phương                Khi đó, miền ngôn ngữ T = dom(TRUTH) có thể
pháp xử lý các giá trị mờ để từ đó xây dựng các quan         biểu thị như một đại số X = (X, G, H, ≤ ), trong đó G
hệ đối sánh giữa chúng. Các giá trị trong cơ sở dữ liệu      là tập các từ nguyên thuỷ được xem là các phần tử
mờ rất phức tạp, bao gồm các giá trị ngôn ngữ, giá trị       sinh. H là tập các gia tử được xem như là các phép
số, giá trị khoảng….Có nhiều cách tiếp cận để xử lý          toán một ngôi, quan hệ ≤ trên các từ (các khái niệm
các giá trị mờ được các tác giả trong và ngoài nước          mờ) là quan hệ sắp thứ tự tuyến tính trên X cảm sinh
quan tâm nghiên cứu trong những năm gần đây, chẳng           từ ngữ nghĩa của ngôn ngữ. Ví dụ dựa trên ngữ nghĩa,
hạn như: lý thuyết tập mờ [9][10][11][12], lý thuyết         các quan hệ thứ tự sau là đúng: false ≤ true, more true
khả năng [13], quan hệ tương tự [14]…..Mỗi cách tiếp         ≤ very true nhưng very false ≤ more false, possibly
cận có những ưu và nhược điểm riêng và cùng chung            true ≤ true nhưng false ≤ possibly false ... . Tập X
mục đích đó là làm thế nào xử lý thật tốt và thật chính      được sinh ra từ G bởi các phép toán trong H. Như vậy
xác những giá trị mờ, xem giá trị rõ là trường hợp           mỗi phần tử của X sẽ có dạng biểu diễn x = hnhn-
riêng của giá trị mờ. Các giá trị khoảng hầu như                       x∈G. Tập tất cả các phần tử được sinh ra từ
                                                             1.......h1x,
chuyển về dạng các số mờ tam giác để xử lý. Tuy              một phần tử x được ký hiệu là H(x). Nếu G có đúng
nhiên, nếu chúng ta xem miền trị của thuộc tính mờ là        hai từ nguyên thuỷ mờ, thì một được gọi là phần tử
đại số gia tử, và việc biến đổi các giá trị khoảng về        sinh dương ký hiệu là c+, một gọi là phần tử sinh âm
một đoạn con của [0,1] thì việc xử lý và thao tác trên       ký hiệu là c- và ta có c- < c+. Trong ví dụ trên true là
dữ liệu mờ đơn giản và hiệu quả.                             phần tử sinh dương còn false là phần tử sinh âm.
                                                                Như vậy, cho X = ( X, G, H, ≤ ) với G = {c-, W, c+
II. MỘT SỐ KHÁI NIỆM
                                                             }, H = H- ∪ H+ với giả thiết H− = {h1,h2,.., hp}, H+ =
  Trong phần này, chúng tôi trình bày một số khái            {h-1, ..., h-q}, h1 > h2 > ... > hp và h-1 <...< h-q là dãy
niệm liên quan đến đại số gia tử làm cơ sở cho việc          các gia tử, ta có các định nghĩa liên quan như sau :
xây dựng phương pháp xử lý dữ liệu mờ trong những
                                                                 Định nghĩa 2.1. [2] f : X → [0,1] gọi là hàm định
phần tiếp theo.
                                                        - 67 -
Tạp chí BCVT & CNTT kỳ 3 10/2007


lượng ngữ nghĩa của X nếu ∀ h, k∈H+ hoặc ∀ h, k∈H-                       Định nghĩa 2.4. [2] Cho fm là độ đo tính mờ trên X,
và ∀ x, y ∈ X, ta có :                                                 hàm định lượng ngữ nghĩa ν trên X được định nghĩa
                       f (hx) − f ( x)     f (hy ) − f ( y )           như sau :
                                         =
                       f (kx ) − f ( x )   f (ky ) − f ( y )             (1) ν(W) = θ = fm(c-), ν(c−) = θ - α.fm(c-) và
   Với đại số gia tử và hàm định lượng ngữ nghĩa ta có                 ν(c+) = θ + α.fm(c+).
thể định nghĩa tính mờ của một khái niệm mờ. Cho                                (2) Nếu 1≤ j≤ p thì:
trước hàm định lượng ngữ nghĩa f của X, xét bất kỳ                                                           j                                    
                                                                        ν ( h j x ) = ν ( x) + Sign( h j x) ∑ fm( hi x ) − ω( h j x ) fm( h j x ) 
x∈X. Tính mờ của x khi đó được đo bằng đường kính                                                            i =1                                 
của tập f(H(x)) ⊆ [0,1].                                                        Nếu –q ≤ j ≤ -1 thì:
  Định nghĩa 2.2. [2] Hàm fm: X→[0,1] được gọi là                                                            −1                                   
                                                                        ν ( h j x ) = ν ( x) + Sign( h j x) ∑ fm( hi x ) − ω( h j x ) fm( h j x ) 
độ đo tính mờ trên X nếu thoả mãn các điều kiện sau:
                                                                                                             i= j                                 
  (1) fm là độ đo mờ đầy đủ trên X, tức là
                                                                       trong đó:
       ∑ fm(h u ) = fm(u ) với mọi u ∈ X.                               ω(h j x) =
                                                                                  1
                                                                                    1 + Sign( h j x ) Sign(hq h j x )( β − α )  ∈{α,β} .
                                                                                  2                                            
                         i
  − q ≤ i ≤ p ,i ≠ 0

  (2) Nếu x là khái niệm rõ, tức là H(x) = {x} thì                        Định nghĩa 2.5. [1] Gọi fm là độ đo tính mờ trên
fm(x) = 0. Do đó fm(0) = fm(W) = fm(1) = 0.                            ĐSGT X. Với mỗi x∈X, ta ký hiệu I(x) ⊆ [0,1] và |I(x)|
  (3) Với mọi x, y ∈ X và h∈H ta có                                    là độ dài của I(x).
 fm(hx) fm(hy )                                                          Một họ các J = {I(x): x∈X } được gọi là phân hoạch
         =         , nghĩa là tỉ số này không phụ
  fm( x)   fm( y )                                                     của [0,1] gắn với x nếu:
thuộc vào x và y, được kí hiệu là µ(h) gọi là độ đo                       (1) {I(c+), I(c-)} là phân hoạch của [0,1] sao cho
tính mờ (fuzziness measure) của gia tử h.                              |I(c)| = fm(c), với c∈{c+, c-}.
  Trong đại số gia tử, mỗi phần tử x ∈ X đều mang                         (2) Nếu đoạn I(x) đã được định nghĩa và |I(x)| =
dấu âm hay dương, được gọi là PN-dấu và được định                      fm(x) thì {I(hix): -q ≤ i ≤ p, i≠0} được định nghĩa là
nghĩa đệ quy như sau:                                                  phân hoạch của I(x) sao cho thoả mãn điều kiện:
  Định nghĩa 2.3. [2] Hàm Sign: X → {-1, 0, 1} là                      |I(hix)| = fm(hix) và |I(hix)| là tập sắp thứ tự tuyến
một ánh xạ được định nghĩa một cách đệ qui như sau,                    tính, tức là : hoặc I(h-q x) < I(h-q+1 x) < I(h-q+2 x)
với ∀ h, h' ∈ H :                                                      <.......< I(hpx) ; hoặc I(h-q x) > I(h-q+1 x) > I(h-q+2 x)
                                                                       >.......> I(hpx) .
 (1) Sign(c−) = -1 và Sign(hc−) = +Sign(c−) nếu
                                                                                Tập {I(hix)} được gọi là phân hoạch gắn với phần tử
hc− < c−
   Sign(hc−) = -Sign(c−) nếu hc− > c−
                 +                       +             +       +   +
                                                                       x. Ta có            ∑ I (h x) =| I ( x) |= fm( x) .
                                                                                      −q ≤i ≤ p ,i ≠ 0
                                                                                                         i
   Sign(c ) = +1 và Sign(hc ) = +Sign(c ) nếu hc > c
   Sign(hc+) = -Sign(c+) nếu hc+ < c+                                           Định nghĩa 2.6. [1] Cho Xk = {x∈X: |x| = k}, xét
                                                                            k
  (2) Sign(h’hx) = -Sign(hx) nếu h' là negative đối                    P = {I(x): x∈Xk } là một phân hoạch của [0,1]. Ta nói
với h và h'hx ≠ hx .                                                   rằng u bằng v theo mức k, được ký hiệu u =k v, khi và
                                                                       chỉ khi I(u) và I(v) cùng bao hàm trong một khoảng mờ
  (3) Sign(h’hx) = +Sign(hx) nếu h' là positive đối
                                                                       mức k. Có nghĩa là ∀u, v∈X, u =k v ⇔ ∃∆k ∈ Pk : I(u)
với h và h'hx ≠ hx.
                                                                       ⊆ ∆k và I(v) ⊆ ∆k.
  (4) Sign(h’hx) = 0 nếu h'hx = hx.
                                                                                Bổ đề 2.1. [1] Quan hệ =k là một quan hệ tương

                                                                   - 68 -
Tạp chí BCVT & CNTT kỳ 3 10/2007


đương trên Pk.                                              TUOI, THUNHAP ) được xác định như sau:
  Bổ đề 2.2. [1] Cho u = hn…h1x và v = h’m…h’1x là                       Bảng 1. Quan hệ Thunhapcanhan
biểu diễn chính tắc của u và v đối với x.                        TT   TEN      TUOI           THUNHAP
  (1) Nếu u = v, thì u =k v với mọi k.                           1    An       30             2.500.000
  (2) Nếu h1 ≠ h’1 thì u =|x| v.                                 2    Hải      khoảng 25      1.500.000
                                                                 3    Hằng     [25,40]        khoảng 3.500.000
  Định lý 2.1. [1] Cho Xk ={x∈X: |x| = k}, xét Pk
                                                                 4    Phương   [45,50]       [1.500.00,1.800.000]
={I(x): x∈Xk} là một phân hoạch của [0,1], u =
                                                                 5    Thúy     45             khoảng 1.000.000
hn….h1x và v = h’m….h’1x là biểu diễn chính tắc của u
                                                              Chúng ta thấy rằng, các giá trị trên thuộc tính TUOI
và v đối với x.
                                                            và THUNHAP rất đa dạng. Tuy nhiên, trong bài bào
  (1) Nếu u =k v thì u =k’ v, ∀ 0 < k’< k.
                                                            này, chúng tôi chỉ quan tâm đến việc xử lý các giá trị
  (2) Nếu tồn tại một chỉ số j ≤ min(m,n) lớn nhất sao      khoảng. Vì vậy, tất cả các giá trị trên quan hệ
cho với mọi s = 1..j ta có hs= h’s thì u = j+|x| v.         Thunhapcanhan có thể chuyển về các giá trị khoảng
   Định nghĩa 2.7. Cho x = ( x1, x2, ….xn) và y = ( y1,     tương ứng.
y2, ….yn). Ta nói x ≤ y khi và chỉ khi xi ≤ yi với mọi 1≤      Một cách tổng quát, nếu là giá trị a ta chuyển thành
i≤ n.                                                       [a,a], nếu là giá trị khoảng a ta chuyển thành
  Định nghĩa 2.8. Cho n đại số gia tử X1, X2, X3 …,         [a-ε, a+ε], với ε được xem là bán kính với tâm a. Nếu
Xn. Khi đó ta gọi hàm tích hợp các đại số gia tử X1, X2,    từ a đến b thì ta chuyển thành [a,b]. Do đó quan hệ
X3 …, Xn là hàm có dạng F: X1 × X2 × X3…× Xn →              Thunhapcanhan có thể chuyển thành quan hệ sau:
[0,1] thoả mãn các tính chất sau:                            Bảng 2. Quan hệ Thunhapcanhan (sau khi chuyển đổi) với
                                                                        εTUOI = 2 và εTHUNHAP = 100.000
  (1) 0 ≤ F( x ) ≤ 1        ∀ x∈ X1 × X2 × X3……× Xn .
                                                                 TT   TEN      TUOI      THUNHAP
  (2) Nếu x ≤ y thì F( x ) ≤ F( y )      ∀ x, y ∈ X1 × X2        1    An       [30,30]   [2.500.000,2.500.000]
× X3……× Xn.                                                      2    Hải      [23,27]   [1.500.000,1.500.000]
                                                                 3    Hằng     [25,40]   [3.400.000,3.600.000]
III. XÂY DỰNG PHƯƠNG PHÁP XỬ LÝ GIÁ
                                                                 4    Phương   [45,50]   [1.500.00,1.800.000]
TRỊ KHOẢNG
                                                                 5    Thúy     [45,45]   [9.00.00,1.100.000]
   Trong cơ sở dữ liệu mờ, có nhiều quan hệ mà miền         1. Chuyển các giá trị khoảng về đoạn con [0,1]
trị của các thuộc tính không phải là giá trị ngôn ngữ,      tương ứng
không phải giá trị số mà là giá trị khoảng, chẳng hạn
                                                              Gọi Dom(Ai) = [min, max] là miền trị kinh điển của
như quan hệ lưu trữ nhiệt độ sốt một căn bệnh của các
                                                            thuộc tính mờ Ai trong một quan hệ, trong đó min, max
bệnh nhân trong một bệnh viện nào đó, quan hệ thu
                                                            tương ứng là giá trị nhỏ nhất và giá trị lớn nhất của
nhập cá nhân trong một cơ quan.... Đối với loại dữ liệu
                                                            Dom(Ai). Trước hết, ta xây dựng một hàm f để
này, việc lưu trữ phức tạp nên việc xử lý dữ liệu loại
                                                            chuyển đổi giá trị thuộc Dom(Ai) thành giá trị thuộc
này càng phức tạp hơn. Vì vậy, nếu xem miền trị của
                                                            [0,1]. Tiếp theo khoảng [a,b] được biến đổi thành đoạn
thuộc tính mờ là một đại số gia tử thì trong phần này,
                                                            con [0,1] tương ứng khi sử dụng hàm f , hay [f (a),f
chúng tôi giới thiệu một phương pháp mới để xử lý giá
                                                            (b)] ⊆[0,1].
trị khoảng giúp cho việc thao tác dữ liệu dễ dàng.
Trước hết, một ví dụ được xem xét để từ đó phân tích             Định nghĩa 3.1. f : Dom(Ai) → [0,1] và được xác
                                                                           a − min
ngữ nghĩa của các giá trị khoảng trong một quan hệ.         định f(a) =             , ∀a∈Dom(Ai).
                                                                          max − min
  Ví dụ 3.1. Cho quan hệ Thunhapcanhan(STT, TEN,

                                                        - 69 -
Tạp chí BCVT & CNTT kỳ 3 10/2007


  Ví dụ 3.2. Sử dụng quan hệ Thunhapcanhan (sau                       Với mỗi [Ia,Ib] nếu tồn tại x∈X sao cho
khi chuyển đổi)                                                    ([Ia,Ib]∩I(x)) = ∅ thì:
  Nếu chúng ta chọn Dom(TUOI) = [0,100] và                            Nếu tồn tại z∈X sao cho [Ia,Ib] ⊆I(z) và I(x) ⊆I(z),
Dom(THUNHAP) = [500.000,6.000.000]. Khi đó ta                      thì [a,b] =|z| x.
có các kết quả chuyển giá trị khoảng tương ứng về                                                 Ia          Ib
đoạn con của [0,1] như sau:
Bảng 3. Quan hệ Thunhapcanhan sau khi sử dụng hàm f                                I(x)
      TT      TEN            TUOI           THUNHAP                                         I(z)
       1       An           [0.3,0.3]       [0.36,0.36]              Ví dụ 3.3. Gọi XTUOI = ( XTUOI, GTUOI, HTUOI, ≤ ) là
       2       Hải        [0.23,0.27]       [0.18,0.18]            đại số gia tử, với GTUOI = {già, trẻ}, H+TUOI = {rất,
       3      Hằng         [0.25,0.4]       [0.52,0.56]
                                                                   hơn}, H-TUOI = {khả năng, ít}, rất > hơn và ít > khả
       4     Phương       [0.45,0.50]       [0.18,0.23]
       5      Thúy        [0.45,0.45]       [0.07,0.11]            năng, WTUOI = 0.6, fm(trẻ) = 0.6, fm(già) = 0.4,
                                                                   fm(rất) = 0.25, fm(hơn) = 0.25, fm(khả năng) = 0.25,
2. So sánh các giá trị khoảng theo cách tiếp cận đại
                                                                   fm(ít) = 0.25, chọn Dom(TUOI) = [0,100] .
số gia tử
                                                                      Ta có fm(rất trẻ) = 0.15, fm(hơn trẻ) = 0.15, fm(ít
   Cho đại số gia tử X = ( X, G, H, ≤ ) và một giá trị
                                                                   trẻ) = 0.15, fm(khả năng trẻ) = 0.15.
khoảng [a,b]. Để so sánh một giá trị x ∈X với [a,b],
                                                                      Vì rất trẻ < hơn trẻ < trẻ < khả năng trẻ < ít trẻ nên
trước tiên ta phải chuyển [a,b] về đoạn con của [0,1].
                                                                   I(rất trẻ) = [0,0.15], I(hơn trẻ) = [0.15,0.3], I(khả
Vì tính mờ của x là một đoạn con của [0,1], do đó để
                                                                   năng trẻ) = [0.3,0.45], I(ít trẻ) = [0.45,0.6].
so sánh x∈X và đoạn con [0,1] chúng ta chỉ cần dựa
                                                                     Ta có fm(rất già) = 0.1, fm(hơn già) = 0.1, fm(ít
vào phần giao hai đoạn con của [0,1] tương ứng. Với
                                                                   già) = 0.1, fm(Khả năng già) = 0.1.
x∈ X, ký hiệu I(x)⊆[0,1] và |I(x)| = fm(x), [Ia,Ib] =
                                                                      Vì ít già < khả năng già < già < hơn già < rất già
[f(a),f(b)]⊆[0,1] tương ứng với việc chuyển đổi giá
                                                                   nên I(ít già) = [0.6,0.7], I(khả năng già) = [0.7,0.8],
trị khoảng [a,b] về đoạn con của [0,1]. Khi đó ta có:
                                                                   I(hơn già) = [0.8,0.9], I(rất già) = [0.9,1].
   Với mỗi [Ia,Ib] nếu tồn tại x∈X sao cho [Ia,Ib]⊆I(x),
                                                                     Vì [0.23,0.27] ⊆ I(hơn trẻ) mà [f(23),f(27)] =
thì [a,b] =|x| x.
                           Ia          Ib                          [0.23,0.27] nên [23,27] =2 hơn trẻ. Hay khoảng 25 =2
                                                                   hơn trẻ. Tương tự, ta có [0.25,0.4] ∩ I(hơn trẻ) =
                                I(x)                               [0.25,0.3] và [0.25,0.4] ∩ I(khả năng trẻ) = [0.3,0.4].
  Với mỗi [Ia,Ib] sao cho [Ia,Ib]⊄ I(x) ∀x, x1∈X thì:                 Mặt khác ta có |[0.25,0.3]| = 0.05, |[0.3,0.4]| = 0.1,
   Khi đó với x và x1, giả sử x < x1, nếu |[Ia,Ib]∩I(x)| ≥         |[0.25,0.4]|/2 = 0.075. Vì [f(25),f(40)] = [0.25,0.4]
|[Ia,Ib]|/£, thì [a,b] =|x| x.                                     và |[0.25,0.4] ∩ I(khả năng trẻ)| ≥ |[0.25,0.4]|/2, nên
                       Ia             Ib                           [25,40] =2 khả năng trẻ.

                                                                   IV. TÌM KIẾM DỮ LIỆU
                   I(x)                        I(x1)
                                                                   1. Đặt vấn đề
ngược lại, nếu |[Ia,Ib]∩I(x1)| ≥ |[Ia,Ib]|/£, thì [a,b] =|x1| x1      Khi thiết kế một cơ sở dữ liệu, nếu một thuộc tính
                            Ia                      Ib             nhận được từ việc tính toán hay kết hợp của hai hay
                                                                   nhiều thuộc tính khác thì thông thường thuộc tính này
                I(x)                       I(x1)                   sẽ không cần đưa vào cơ sở dữ liệu để tinh giản trong
với £ là số đoạn I(xi)⊆[0,1], sao cho ([Ia,Ib]∩I(xi)) ≠ ∅          thiết kế. Chẳng hạn như trong một cơ sở dữ liệu có

                                                               - 70 -
Tạp chí BCVT & CNTT kỳ 3 10/2007


thuộc tính SOLUONG 0                  0.15           0.3            0.45          W           0.7     0.8         0.9         1
và DONGIA, khi đó
THANHTIEN              = I(rất trẻ)       I(hơn trẻ)                    I(ít trẻ)   I(ít già)            I(hơn già)
SOLUONG*DONGIA,                                       I(khả năng trẻ)                      I(khả năng già)           I(rất già)

do vậy thuộc tính                                      I(trẻ)                                       I(già)
THANHTIEN sẽ không
                                                              Hình minh họa ví dụ 3.3
cần thiết đưa vào cơ sở
                                                              2. Thuật toán xác định giá trị chân lý của điều kiện
dữ liệu nếu không muốn lưu trữ giá trị THANHTIEN
                                                              mờ
mà chỉ muốn giá trị THANHTIEN phục vụ cho việc
thao tác hay truy vấn dữ liệu.                                   Trong phần này, chúng tôi trình bày một thuật toán
                                                              để xác định giá trị chân lý của điều kiện mờ làm cơ sở
   Trong cơ sở dữ liệu mờ, khi cho một quan hệ, nếu
                                                              cho việc tìm kiếm dữ liệu.
một thuộc tính nào đó không có trong quan hệ nhưng
nhận được từ việc kết hợp hai hay nhiều thuộc tính đã            Thuật toán 4.1. Xác định giá trị chân lý của điều
cho trong quan hệ bằng một phương pháp nào đó kiện (t[Ai] =k x).
chúng ta gọi là thuộc tính suy dẫn. Trong phạm vi bài
                                                                 Input : Cho lược đồ U = {A1, A2,...An} và quan hệ
báo này, chúng tôi xét miền trị của các thuộc tính mờ
                                                              r xác định trên U.
là giá trị khoảng, do đó miền trị của thuộc tính suy dẫn
cũng nhận giá trị khoảng.                                        Output : Với mọi t∈r sao cho (t[Ai] =k x) = true.
  Ví dụ 4.1. Cho quan hệ Suckhoe_svien(MASV,                         Method :
HOTEN, GIOITINH, CHIEUCAO, TRONGLUONG)
                                                                 (1) Đặt Dom(Ai) = [min,max]
như bảng 4.
             Bảng 4. Quan hệ Suckhoe_svien                       (2) For mỗi t∈r do

MASV HOTEN                  GIOI CHIEU            TRONG          (3) if t[Ai] không phải giá trị khoảng then chuyển t[Ai]
                            TINH CAO              LUONG          thành khoảng [a,b] tương ứng.
SV001 Nguyễn Lan            Nữ        [1.65,1.7] 55              (4) For mỗi t∈r do
SV002 Trần Thanh            Nam       1.67        [57,65]
                                                                 (5) t[Ai] = [f(a),f(b)] // Sử dụng hàm f để chuyển
SV003 Cao Kỳ                Nam       1.72        [60,70]
                                                                 các giá trị [a,b] thành đoạn con [0,1]
SV004 Lý Thanh Nhàn Nữ                [1.7,1.8]   50
SV005 Hoàng Hoá             Nữ        [1.63,1.8] [65,75]         (6) For mỗi t∈r do

  Giả sử rằng chúng ta muốn tìm những sinh viên nữ               (7) if t[Ai] ⊆I(x) và |x| ≥ k thì (t[Ai] =k x) = true
có sức khỏe khả năng yếu. Ở đây, thuộc tính                      (8) elseif (t[Ai]∩I(x)) = ∅ then
SUCKHOE không có trong quan hệ nhưng ta có thể
kết hợp hai thuộc tính CHIEUCAO và                               (9) if tồn tại x1∈X sao cho t[Ai]⊆I(x1) và I(x)⊆I(x1)
TRONGLUONG trong quan hệ Suckhoe_svien, như                      và |x1| ≥ k then (t[Ai] =k x) = true.
vậy thuộc tính SUCKHOE gọi là thuộc tính suy dẫn.                (10) if t[Ai] ⊄ I(x) then
Vậy, để xác định giá trị của thuộc tính SUCKHOE
                                                                 (11) if tồn tại x1∈X and x < x1 sao cho |t[Ai]∩I(x)| ≥
chúng ta có thể sử dụng các hàm kết nhập của hai đại
số gia tử Dom(CHIEUCAO) và Dom(TRONG                             |t[Ai]|/£ và |x| ≥ k then (t[Ai] =k x) = true (với £ là số
LUONG).                                                          đoạn I(xi) ⊆[0,1] sao cho (t[Ai]∩I(xi)) ≠ ∅ ).

                                                            - 71 -
Tạp chí BCVT & CNTT kỳ 3 10/2007


(12) if tồn tại x1∈X and x < x1 sao cho |t[Ai]∩I(x1)| ≥              suy dẫn SUCKHOE
|t[Ai]|/£ và |x1| ≥ k then (t[Ai] =k x) = true.                        Gọi XSUCKHOE = (XSUCKHOE, GSUCKHOE, HSUCKHOE, ≤ )
3. Phương pháp tìm kiếm dữ liệu                                      là một đại số gia tử với GSUCKHOE = {yếu, tốt},
                                                                     H+SUCKHOE = {rất, hơn}, H-SUCKHOE = {khả năng, ít},
  Để trả lời câu truy vấn trong truy vấn 4.1, trước tiên
                                                                     rất > hơn và ít > khả năng, WSUCKHOE = 0.6. Khi đó,
chúng ta áp dụng hàm f chuyển quan hệ sinhvien
                                                                     fm(yếu) = 0.6, fm(tốt) = 0.4, fm(rất) = 0.2, fm(hơn) =
thành một quan hệ tương ứng với miền trị của
                                                                     0.2, fm(khả năng) = 0.25, fm(ít) = 0.35.
CHIEUCAO và TRONGLUONG là các đoạn con của
[0,1]. Tiếp theo, ta sử dụng hàm kết nhập đại số gia tử                Ta có fm(rất yếu) = 0.12, fm(hơn yếu) = 0.12,
để tính miền trị tương ứng cho thuộc tính suy dẫn                    fm(khả năng yếu) = 0.15, fm(ít yếu) = 0.21.
SUCKHOE. Cuối cùng, áp dụng thuật toán 4.1 để xác                       Vì rất yếu < hơn yếu < yếu < khả năng yếu < ít yếu
định giá trị chân lý của điều kiện trong truy vấn và tìm             nên I(rất yếu) = [0,0.12], I(hơn yếu) = [0.12,0.24],
những bộ dữ liệu thoả mãn điều kiện.                                 I(khả năng yếu) = [0.24,0.39], I(ít yếu) = [0.39,0.6].
   Như vậy, một cách tổng quát ta gọi Pa là thuộc tính                   Bảng 6. Quan hệ Suckhoe_svien (sau khi chuyển đổi và
                                                                                  thêm thuộc tính suy dẫn SUCKHOE)
suy dẫn từ các thuộc tính mờ A1, A2, …Aq, với miền trị
tương ứng Dom(Ai), i =1..q, F: Dom(A1) × Dom(A2)                     MA      HOTEN      GIOI CHIEU TRONG               SUC
                                                                     SV                 TINH CAO LUONG                KHOE
×… × Dom(Aq)→ [0,1] là hàm kết nhập các đại số gia
                                                                     SV Nguyễn            Nữ     [0.281,    [0.18,    [0.23,
tử Dom(A1), Dom(A2), …, Dom(Aq), ψ là một giá trị
                                                                     001 Lan                       0.5]     0.18]     0.34]
thuộc đại số gia tử X. Khi đó, điều kiện mờ Pa =k ψ
                                                                     SV Trần             Nam     [0.361,   [0.231,    [0.296,
trong câu truy vấn được xác định như sau: Pa =k ψ ⇔
                                                                     002 Thanh                   0.361]      0.5]      0.43]
[F( x ),F( y )] =k I(ψ), với x = (x1 × x2 ×….× xq), y =
                                                                     SV Cao Kỳ           Nam     [0.595,    [0.32,    [0.457,
(y1 × y2 ×….× yq) và |I(ψ)| = fm(ψ).
                                                                     003                         0.595]     0.68]     0.637]
  Ví dụ 4.2. Trong quan hệ Suckhoe_svien ở ví dụ 4.1
                                                                     SV     Lý Thanh      Nữ      [0.5,     [0.08,     [0.29,
hãy tìm những sinh viên nữ có sức khỏe khả năng yếu.
                                                                     004    Nhàn                 0.875]     0.08]     0.477]
Ta chọn Dom(CHIEUCAO) = [1.5,1.9] và
                                                                     SV     Hoàng         Nữ     [0.211,     [0.5,    [0.355,
Dom(TRONGLUONG) = [40,90] thì khi đó áp dụng
                                                                     005    Hoá                  0.875]     0.82]     0.847]
hàm chuyển đổi f cho kết quả :
                                                                       Áp dụng thuật toán 4.1 ta có hai sinh viên nữ có
  Bảng 5. Quan hệ Suckhoe_svien (sau khi chuyển đổi)
                                                                     SUCKHOE =2 khả năng yếu là Nguyễn Lan và Lý
MA     HOTEN        GIOI CHIEUCAO TRONG
                                                                     Thanh Nhàn..
SV                  TINH          LUONG
SV001 Nguyễn        Nữ      [0.281,0.5]     [0.18,0.18]              V. KẾT LUẬN
       Lan
                                                                        Trong bài báo này, chúng tôi đã đưa ra một phương
SV002 Trần Thanh Nam [0.361,0.361] [0.231,0.5]
                                                                     pháp mới để xử lý dữ liệu dạng khoảng trong cơ sở dữ
SV003 Cao Kỳ        Nam [0.595,0.595] [0.32,0.68]
                                                                     liệu mờ đó là phương pháp tiếp cận ngữ nghĩa định
SV004 Lý Thanh      Nữ      [0.5,0.875]     [0.08,0.08]
                                                                     lượng đại số gia tử. Cách tiếp cận này làm cho việc xử
       Nhàn
                                                                     lý dữ liệu đơn giản và thuần nhất kiểu dữ liệu. Các giá
SV005 Hoàng Hoá Nữ          [0.211,0.875] [0.5,0.82]
                                                                     trị khoảng được chuyển thành các đoạn con của [0,1]
                                            n
  Chọn hàm kết nhập đại số gia tử F =      ∑δ ν
                                              .   i   i   ( xi ) ,   tương ứng. Vì tính mờ của các phần tử trong đại số gia
                                           i =1                      tử cũng là một đoạn con của [0,1], do đó việc so sánh
với δ1 = δ2 = 0.5, khi đó ta có miền trị của thuộc tính              các giá trị khoảng với một giá trị trong một đại số gia

                                                                - 72 -
Tạp chí BCVT & CNTT kỳ 3 10/2007


tử trở thành so sánh hai đoạn con của [0,1]. Từ việc so            Information Processing (FIP) 2003, Beijing, pp 105-
sánh các giá trị khoảng, bài báo đã đề xuất cách xây               111.
dựng các thuộc tính suy dẫn bằng cách sử dụng các              [7] NGUYỄN CÁT HỒ, TRẦN THÁI SƠN, “Logic mờ và
hàm kết nhập các đại số gia tử. Cuối cùng, chúng tôi               quyết định mờ dựa trên cấu trúc thứ tự của giá trị ngôn
xây dựng thuật toán đánh giá giá trị chân lý của điều              ngữ”, Tạp chí Tin học và Điều khiển học, Tập 9, số 4
                                                                   (1993), trang 1-9.
kiện mờ để từ đó áp dụng truy vấn dữ liệu với thuộc
                                                               [8] TRẦN ĐÌNH KHANG, “Xây dựng hàm đo trên đại số
tính suy dẫn có miền trị là giá trị khoảng trong cơ sở
                                                                   gia tử và ứng dụng trong lập luận ngôn ngữ”, Tạp chí
dữ liệu mờ theo mô hình [1].
                                                                   Tin học và Điều khiển học, Tập 13 số 1 (1997), trang
TÀI LIỆU THAM KHẢO                                                 16-30.
                                                               [9] TRƯƠNG ĐỨC HÙNG, “Một phương pháp xử lý dữ
[1] NGUYỄN CÔNG HÀO, “Mô hình cơ sở dữ liệu mờ                     liệu trong CSDL mờ”, Kỷ yếu Hội nghị khoa học
    theo cách tiếp cận đại số gia tử”. Kỷ yếu Hội thảo             trường Đại học Bách Khoa Hà Nội 10/1996.
    quốc gia về các vấn đề chọn lọc Công nghệ Thông tin
                                                               [10] PATRICK BOSC, “Subqueries in SQLf, a Fuzzy
    và Truyền thông, Hải Phòng 2005, trang 285-293.
                                                                  Database Query Language”, IEEE International
[2] NGUYỄN CÁT HỒ, Lý thuyết tập mờ và công nghệ                  Conference on Intelligent Systems for the 21st
    tính toán mềm, Hệ mờ, mạng nơron và ứng dụng, NXB             Centuryapos,
    Khoa học kỹ thuật 2001, trang 37-74.                          Vol. 4, Issue , 22-25 Oct 1995 pp 3636 - 3641.
[3] NGUYỄN CÁT HỒ, TRẦN THÁI SƠN, “Về khoảng                   [11] YOSHIKANE TAKAHASHI, “Fuzzy Database Query
    cách giữa các giá trị của biến ngôn ngữ trong đại số          Language and Their Relational Completeness
    gia tử”, Tạp chí Tin học và Điều khiển học, Tập 11 số         theorem”, IEEE Transactions on Knowledge and Data
    1 năm 1995, trang 10-20.                                      Engineering, Vol 5, No. 1, 1993, 122-125.
[4] NGUYEN CAT HO, “W.Wechler, “Extended hedge                 [12] SHYUE-LIANG WANG, YU-JANE TSAI, “Null
    algebras ans their application to fuzzy logic”, Fuzzy         queries with Interval-Valued Ambiguous Attributes”,
    Set and Systems 52 (1992), pp 259-282.                        IEEE International Conference on Systems Man and
[5] NGUYEN CAT HO, W.WECHLER, “Hedge algebras:                    Cybernetics,, 1998, pp 2150-2153.
    an algebraic approach to structure of sets of linguistic   [13] DUBOIS D, PRADE H, Possibility theory: An
    domains of linguistic truth variable”, Fuzzy Set and          approach to computerized processing of uncertainty,
    Systems 35 (1990), pp 281-293.                                SIAM Review, Vol. 34, No. 1, Mar., 1992, pp. 147-148.
[6] NGUYEN CAT HO, “Quantifying hedge algebras and             Ngày nhận bài : 5/9/06
    interpolation methods in approximate reasoning”,
    Proceeding of the Inter Workshop on Fuzzy
SƠ LƯỢC TÁC GIẢ
NGUYỄN CÔNG HÀO
                                                                Nơi công tác hiện nay: Khoa Công nghệ thông tin,
                          Sinh năm 1976.
                                                               Đại học Khoa học Huế
                          Tốt nghiệp Đại học Sư phạm
                                                                   Hướng nghiên cứu: Cơ sở dữ liệu mờ, Đại số gia tử.
                        Huế năm 1997, nhận bằng Thạc
                        sỹ năm 2002 tại Đại học Bách               Email: nchao_hueit@yahoo.com
                        khoa Hà Nội, hiện đang là
                        Nghiên cứu sinh tại Viện Công
                        nghệ thông tin - Viện Khoa học
                        và Công nghệ Việt Nam.

                                                          - 73 -

More Related Content

What's hot

Phuong trinh dao_ham_rieng_8948 (1)
Phuong trinh dao_ham_rieng_8948 (1)Phuong trinh dao_ham_rieng_8948 (1)
Phuong trinh dao_ham_rieng_8948 (1)sondauto10
 
Công thức truyền tin
Công thức truyền tinCông thức truyền tin
Công thức truyền tinakprovip
 
Ltdh ptluong gia cmoi soanco giai
Ltdh ptluong gia cmoi soanco giaiLtdh ptluong gia cmoi soanco giai
Ltdh ptluong gia cmoi soanco giaiAnh Pham
 
Tichphan mathvn.com-transitung
Tichphan mathvn.com-transitungTichphan mathvn.com-transitung
Tichphan mathvn.com-transitungQuyen Le
 
Chuong[1] bai[2] - cuc tri ham so
Chuong[1] bai[2] - cuc tri ham soChuong[1] bai[2] - cuc tri ham so
Chuong[1] bai[2] - cuc tri ham sohotchicken
 
đạO hàm và vi phân
đạO hàm và vi phânđạO hàm và vi phân
đạO hàm và vi phânchuateonline
 
Notes for Optimization Chapter 1 and 2
Notes for Optimization Chapter 1 and 2Notes for Optimization Chapter 1 and 2
Notes for Optimization Chapter 1 and 2Vu Pham
 
Bài tập sử dụng công thức nguyên hàm, tích phân
Bài tập sử dụng công thức nguyên hàm, tích phânBài tập sử dụng công thức nguyên hàm, tích phân
Bài tập sử dụng công thức nguyên hàm, tích phânThế Giới Tinh Hoa
 
7007643 baitap xu_li_tin_hieu_so_6201
7007643 baitap xu_li_tin_hieu_so_62017007643 baitap xu_li_tin_hieu_so_6201
7007643 baitap xu_li_tin_hieu_so_6201mvminhdhbk
 
Ctdl 08-string matching-01
Ctdl 08-string matching-01Ctdl 08-string matching-01
Ctdl 08-string matching-01Bích Anna
 
Chde giai tich12-hki
Chde giai tich12-hkiChde giai tich12-hki
Chde giai tich12-hkinhuannghiem
 
Giáo trình Phân tích và thiết kế giải thuật - CHAP 4
Giáo trình Phân tích và thiết kế giải thuật - CHAP 4Giáo trình Phân tích và thiết kế giải thuật - CHAP 4
Giáo trình Phân tích và thiết kế giải thuật - CHAP 4Nguyễn Công Hoàng
 
Giáo trình Phân tích và thiết kế giải thuật - CHAP 3
Giáo trình Phân tích và thiết kế giải thuật - CHAP 3Giáo trình Phân tích và thiết kế giải thuật - CHAP 3
Giáo trình Phân tích và thiết kế giải thuật - CHAP 3Nguyễn Công Hoàng
 
xử lý số tín hiệu -Chuong 3
xử lý số tín hiệu -Chuong 3xử lý số tín hiệu -Chuong 3
xử lý số tín hiệu -Chuong 3Ngai Hoang Van
 
Bai giang xlths
Bai giang xlthsBai giang xlths
Bai giang xlthsthuydt1
 
xử lý số tín hiệu -Chuong 2
xử lý số tín hiệu -Chuong 2xử lý số tín hiệu -Chuong 2
xử lý số tín hiệu -Chuong 2Ngai Hoang Van
 

What's hot (20)

Bbt
BbtBbt
Bbt
 
Phuong trinh dao_ham_rieng_8948 (1)
Phuong trinh dao_ham_rieng_8948 (1)Phuong trinh dao_ham_rieng_8948 (1)
Phuong trinh dao_ham_rieng_8948 (1)
 
Pt04 de qui
Pt04 de quiPt04 de qui
Pt04 de qui
 
Công thức truyền tin
Công thức truyền tinCông thức truyền tin
Công thức truyền tin
 
Ltdh ptluong gia cmoi soanco giai
Ltdh ptluong gia cmoi soanco giaiLtdh ptluong gia cmoi soanco giai
Ltdh ptluong gia cmoi soanco giai
 
Tichphan mathvn.com-transitung
Tichphan mathvn.com-transitungTichphan mathvn.com-transitung
Tichphan mathvn.com-transitung
 
Chuong[1] bai[2] - cuc tri ham so
Chuong[1] bai[2] - cuc tri ham soChuong[1] bai[2] - cuc tri ham so
Chuong[1] bai[2] - cuc tri ham so
 
đạO hàm và vi phân
đạO hàm và vi phânđạO hàm và vi phân
đạO hàm và vi phân
 
Notes for Optimization Chapter 1 and 2
Notes for Optimization Chapter 1 and 2Notes for Optimization Chapter 1 and 2
Notes for Optimization Chapter 1 and 2
 
Slide6
Slide6Slide6
Slide6
 
Bài tập sử dụng công thức nguyên hàm, tích phân
Bài tập sử dụng công thức nguyên hàm, tích phânBài tập sử dụng công thức nguyên hàm, tích phân
Bài tập sử dụng công thức nguyên hàm, tích phân
 
7007643 baitap xu_li_tin_hieu_so_6201
7007643 baitap xu_li_tin_hieu_so_62017007643 baitap xu_li_tin_hieu_so_6201
7007643 baitap xu_li_tin_hieu_so_6201
 
Ctdl 08-string matching-01
Ctdl 08-string matching-01Ctdl 08-string matching-01
Ctdl 08-string matching-01
 
Chde giai tich12-hki
Chde giai tich12-hkiChde giai tich12-hki
Chde giai tich12-hki
 
Giáo trình Phân tích và thiết kế giải thuật - CHAP 4
Giáo trình Phân tích và thiết kế giải thuật - CHAP 4Giáo trình Phân tích và thiết kế giải thuật - CHAP 4
Giáo trình Phân tích và thiết kế giải thuật - CHAP 4
 
Giáo trình Phân tích và thiết kế giải thuật - CHAP 3
Giáo trình Phân tích và thiết kế giải thuật - CHAP 3Giáo trình Phân tích và thiết kế giải thuật - CHAP 3
Giáo trình Phân tích và thiết kế giải thuật - CHAP 3
 
3 1
3 13 1
3 1
 
xử lý số tín hiệu -Chuong 3
xử lý số tín hiệu -Chuong 3xử lý số tín hiệu -Chuong 3
xử lý số tín hiệu -Chuong 3
 
Bai giang xlths
Bai giang xlthsBai giang xlths
Bai giang xlths
 
xử lý số tín hiệu -Chuong 2
xử lý số tín hiệu -Chuong 2xử lý số tín hiệu -Chuong 2
xử lý số tín hiệu -Chuong 2
 

Viewers also liked

4 ds07 10 15 bai anh huy da sua
4 ds07 10 15 bai anh huy  da sua4 ds07 10 15 bai anh huy  da sua
4 ds07 10 15 bai anh huy da suagaquaysieugion
 
Scala in 10 minutes
Scala in 10 minutesScala in 10 minutes
Scala in 10 minutesAnton Chikin
 
5 ds07 10 14 bai da sua a control theoretic approach v8-
5 ds07 10 14 bai da sua a control theoretic approach v8-5 ds07 10 14 bai da sua a control theoretic approach v8-
5 ds07 10 14 bai da sua a control theoretic approach v8-gaquaysieugion
 
7 cs18007 paper protein classify-vie-bcvt
7 cs18007 paper protein classify-vie-bcvt7 cs18007 paper protein classify-vie-bcvt
7 cs18007 paper protein classify-vie-bcvtgaquaysieugion
 
6 ds1728 bcvt cntt bac-vu
6 ds1728 bcvt cntt bac-vu6 ds1728 bcvt cntt bac-vu
6 ds1728 bcvt cntt bac-vugaquaysieugion
 
Abap query
Abap queryAbap query
Abap querybrtkow
 
05102015 Ημέρα Αθλητισμού
05102015 Ημέρα Αθλητισμού05102015 Ημέρα Αθλητισμού
05102015 Ημέρα ΑθλητισμούHara Bouta
 
Leyenda “un sueño hecho realidad”
Leyenda “un sueño hecho realidad”Leyenda “un sueño hecho realidad”
Leyenda “un sueño hecho realidad”Patricia Bernal
 
Ppt comentario de imagen
Ppt comentario de imagenPpt comentario de imagen
Ppt comentario de imagenPatricia Bernal
 
Audience feedback and swot analysis
Audience feedback and swot analysisAudience feedback and swot analysis
Audience feedback and swot analysisDemiLowe
 
Solutions for Sleep
Solutions for SleepSolutions for Sleep
Solutions for Sleepjcarvin
 
Welcome to International Journal of Engineering Research and Development (IJERD)
Welcome to International Journal of Engineering Research and Development (IJERD)Welcome to International Journal of Engineering Research and Development (IJERD)
Welcome to International Journal of Engineering Research and Development (IJERD)IJERD Editor
 
Giaotrinh activispre loi_anh
Giaotrinh activispre loi_anhGiaotrinh activispre loi_anh
Giaotrinh activispre loi_anhtoanluc16
 

Viewers also liked (19)

4 ds07 10 15 bai anh huy da sua
4 ds07 10 15 bai anh huy  da sua4 ds07 10 15 bai anh huy  da sua
4 ds07 10 15 bai anh huy da sua
 
Scala in 10 minutes
Scala in 10 minutesScala in 10 minutes
Scala in 10 minutes
 
5 ds07 10 14 bai da sua a control theoretic approach v8-
5 ds07 10 14 bai da sua a control theoretic approach v8-5 ds07 10 14 bai da sua a control theoretic approach v8-
5 ds07 10 14 bai da sua a control theoretic approach v8-
 
7 cs18007 paper protein classify-vie-bcvt
7 cs18007 paper protein classify-vie-bcvt7 cs18007 paper protein classify-vie-bcvt
7 cs18007 paper protein classify-vie-bcvt
 
6 ds1728 bcvt cntt bac-vu
6 ds1728 bcvt cntt bac-vu6 ds1728 bcvt cntt bac-vu
6 ds1728 bcvt cntt bac-vu
 
Abap query
Abap queryAbap query
Abap query
 
Fiqh cours
Fiqh coursFiqh cours
Fiqh cours
 
05102015 Ημέρα Αθλητισμού
05102015 Ημέρα Αθλητισμού05102015 Ημέρα Αθλητισμού
05102015 Ημέρα Αθλητισμού
 
Leyenda “un sueño hecho realidad”
Leyenda “un sueño hecho realidad”Leyenda “un sueño hecho realidad”
Leyenda “un sueño hecho realidad”
 
Ppt comentario de imagen
Ppt comentario de imagenPpt comentario de imagen
Ppt comentario de imagen
 
Book comics
Book comicsBook comics
Book comics
 
Retórica visual.
Retórica visual.Retórica visual.
Retórica visual.
 
русь языческая
русь языческаярусь языческая
русь языческая
 
Audience feedback and swot analysis
Audience feedback and swot analysisAudience feedback and swot analysis
Audience feedback and swot analysis
 
Solutions for Sleep
Solutions for SleepSolutions for Sleep
Solutions for Sleep
 
Welcome to International Journal of Engineering Research and Development (IJERD)
Welcome to International Journal of Engineering Research and Development (IJERD)Welcome to International Journal of Engineering Research and Development (IJERD)
Welcome to International Journal of Engineering Research and Development (IJERD)
 
Thrill
ThrillThrill
Thrill
 
Eula.1028
Eula.1028Eula.1028
Eula.1028
 
Giaotrinh activispre loi_anh
Giaotrinh activispre loi_anhGiaotrinh activispre loi_anh
Giaotrinh activispre loi_anh
 

Similar to 8 ds 17024 phuong phap xu ly gia tri khoang theo cach tiep can dsgt da sua

Toan caocapa1 giaitich
Toan caocapa1 giaitichToan caocapa1 giaitich
Toan caocapa1 giaitichQuoc Nguyen
 
Giaitichcoso(PGS.TS.NguyenBichHuy).pdf
Giaitichcoso(PGS.TS.NguyenBichHuy).pdfGiaitichcoso(PGS.TS.NguyenBichHuy).pdf
Giaitichcoso(PGS.TS.NguyenBichHuy).pdfBui Loi
 
Toan cao cap a1
Toan cao cap a1Toan cao cap a1
Toan cao cap a1Phong Tân
 
[Math educare] giao trinh toan cao cap a1-giai tich ham mot bien_chuoi so
[Math educare] giao trinh toan cao cap a1-giai tich ham mot bien_chuoi so[Math educare] giao trinh toan cao cap a1-giai tich ham mot bien_chuoi so
[Math educare] giao trinh toan cao cap a1-giai tich ham mot bien_chuoi soNguyen Vietnam
 
06 mat101 bai2_v2.3013101225
06 mat101 bai2_v2.301310122506 mat101 bai2_v2.3013101225
06 mat101 bai2_v2.3013101225Yen Dang
 
Tính toán khoa học - Chương 5: Tính gần đúng đạo hàm và tích phân
Tính toán khoa học - Chương 5: Tính gần đúng đạo hàm và tích phânTính toán khoa học - Chương 5: Tính gần đúng đạo hàm và tích phân
Tính toán khoa học - Chương 5: Tính gần đúng đạo hàm và tích phânChien Dang
 
08 mat101 bai4_v2.3013101225
08 mat101 bai4_v2.301310122508 mat101 bai4_v2.3013101225
08 mat101 bai4_v2.3013101225Yen Dang
 
05 mat101 bai1_v2.3013101225
 05 mat101 bai1_v2.3013101225 05 mat101 bai1_v2.3013101225
05 mat101 bai1_v2.3013101225Yen Dang
 
Toán cao cấp a2
Toán cao cấp a2Toán cao cấp a2
Toán cao cấp a2bookbooming
 
Chuyên đề xác suất : đo độ thực và khoảng cách trong xá suất
Chuyên đề xác suất : đo độ thực và khoảng cách trong xá suấtChuyên đề xác suất : đo độ thực và khoảng cách trong xá suất
Chuyên đề xác suất : đo độ thực và khoảng cách trong xá suấtThế Giới Tinh Hoa
 
Class_Group _Presentation_VNKHMT_TLU_GOu
Class_Group _Presentation_VNKHMT_TLU_GOuClass_Group _Presentation_VNKHMT_TLU_GOu
Class_Group _Presentation_VNKHMT_TLU_GOuVietToQuang12H4
 
Hamsolientuc
HamsolientucHamsolientuc
HamsolientucQuoc Thai
 

Similar to 8 ds 17024 phuong phap xu ly gia tri khoang theo cach tiep can dsgt da sua (20)

Toan caocapa1 giaitich
Toan caocapa1 giaitichToan caocapa1 giaitich
Toan caocapa1 giaitich
 
Toan cao cap a1
Toan cao cap a1Toan cao cap a1
Toan cao cap a1
 
Giaitichcoso(PGS.TS.NguyenBichHuy).pdf
Giaitichcoso(PGS.TS.NguyenBichHuy).pdfGiaitichcoso(PGS.TS.NguyenBichHuy).pdf
Giaitichcoso(PGS.TS.NguyenBichHuy).pdf
 
Toan cao cap a1
Toan cao cap a1Toan cao cap a1
Toan cao cap a1
 
Toan Cao Cap A1
Toan Cao Cap A1Toan Cao Cap A1
Toan Cao Cap A1
 
[Math educare] giao trinh toan cao cap a1-giai tich ham mot bien_chuoi so
[Math educare] giao trinh toan cao cap a1-giai tich ham mot bien_chuoi so[Math educare] giao trinh toan cao cap a1-giai tich ham mot bien_chuoi so
[Math educare] giao trinh toan cao cap a1-giai tich ham mot bien_chuoi so
 
06 mat101 bai2_v2.3013101225
06 mat101 bai2_v2.301310122506 mat101 bai2_v2.3013101225
06 mat101 bai2_v2.3013101225
 
Toan cao cap a1
Toan cao cap a1Toan cao cap a1
Toan cao cap a1
 
Dãy số namdung
Dãy số namdungDãy số namdung
Dãy số namdung
 
Tính toán khoa học - Chương 5: Tính gần đúng đạo hàm và tích phân
Tính toán khoa học - Chương 5: Tính gần đúng đạo hàm và tích phânTính toán khoa học - Chương 5: Tính gần đúng đạo hàm và tích phân
Tính toán khoa học - Chương 5: Tính gần đúng đạo hàm và tích phân
 
08 mat101 bai4_v2.3013101225
08 mat101 bai4_v2.301310122508 mat101 bai4_v2.3013101225
08 mat101 bai4_v2.3013101225
 
Luận văn: Phương trình sóng tuyến tính mô tả dao động của thanh đàn hồi nhớt
Luận văn: Phương trình sóng tuyến tính mô tả dao động của thanh đàn hồi nhớtLuận văn: Phương trình sóng tuyến tính mô tả dao động của thanh đàn hồi nhớt
Luận văn: Phương trình sóng tuyến tính mô tả dao động của thanh đàn hồi nhớt
 
Chuong04
Chuong04Chuong04
Chuong04
 
05 mat101 bai1_v2.3013101225
 05 mat101 bai1_v2.3013101225 05 mat101 bai1_v2.3013101225
05 mat101 bai1_v2.3013101225
 
Toán cao cấp a2
Toán cao cấp a2Toán cao cấp a2
Toán cao cấp a2
 
Chuyên đề xác suất : đo độ thực và khoảng cách trong xá suất
Chuyên đề xác suất : đo độ thực và khoảng cách trong xá suấtChuyên đề xác suất : đo độ thực và khoảng cách trong xá suất
Chuyên đề xác suất : đo độ thực và khoảng cách trong xá suất
 
Nguyen ham
Nguyen hamNguyen ham
Nguyen ham
 
Class_Group _Presentation_VNKHMT_TLU_GOu
Class_Group _Presentation_VNKHMT_TLU_GOuClass_Group _Presentation_VNKHMT_TLU_GOu
Class_Group _Presentation_VNKHMT_TLU_GOu
 
Hamsolientuc
HamsolientucHamsolientuc
Hamsolientuc
 
Hamsolientuc
HamsolientucHamsolientuc
Hamsolientuc
 

8 ds 17024 phuong phap xu ly gia tri khoang theo cach tiep can dsgt da sua

  • 1. Tạp chí BCVT & CNTT kỳ 3 10/2007 Một phương pháp xử lý giá trị khoảng trong cơ sở dữ liệu mờ A Method for Procesing Interval Values In Fuzzy Databases Nguyễn Công Hào Abstract: In this paper, we provide a method for Chúng ta xét miền ngôn ngữ của biến chân lý processing interval values in fuzzy databases with TRUTH gồm các từ sau: Dom(TRUTH) = {true, quantitatively semantics based hedge algebras. This false, very true, very false, more-or-less true, more- interval values are converted into sub interval in [0,1] or-less false, possibly true, possibly false, respectively. Thus, the interval values become to process approximately true, approximately false, little true, sub intervals in [0,1]. Finally, an algorithms is proposed to application that for searching data in fuzzy databases little false, very possibly true, very possibly false.....}, with interval valued deductive attributes. trong đó true, false là các từ nguyên thuỷ, các từ nhấn (mordifier hay intensifier) very, more-or-less, I. ĐẶT VẤN ĐỀ possibly, approximately, little gọi là các gia tử Khi thao tác dữ liệu trong cơ sở dữ liệu mờ, vấn đề (hedges). quan trọng nhất là làm thế nào tìm ra một phương Khi đó, miền ngôn ngữ T = dom(TRUTH) có thể pháp xử lý các giá trị mờ để từ đó xây dựng các quan biểu thị như một đại số X = (X, G, H, ≤ ), trong đó G hệ đối sánh giữa chúng. Các giá trị trong cơ sở dữ liệu là tập các từ nguyên thuỷ được xem là các phần tử mờ rất phức tạp, bao gồm các giá trị ngôn ngữ, giá trị sinh. H là tập các gia tử được xem như là các phép số, giá trị khoảng….Có nhiều cách tiếp cận để xử lý toán một ngôi, quan hệ ≤ trên các từ (các khái niệm các giá trị mờ được các tác giả trong và ngoài nước mờ) là quan hệ sắp thứ tự tuyến tính trên X cảm sinh quan tâm nghiên cứu trong những năm gần đây, chẳng từ ngữ nghĩa của ngôn ngữ. Ví dụ dựa trên ngữ nghĩa, hạn như: lý thuyết tập mờ [9][10][11][12], lý thuyết các quan hệ thứ tự sau là đúng: false ≤ true, more true khả năng [13], quan hệ tương tự [14]…..Mỗi cách tiếp ≤ very true nhưng very false ≤ more false, possibly cận có những ưu và nhược điểm riêng và cùng chung true ≤ true nhưng false ≤ possibly false ... . Tập X mục đích đó là làm thế nào xử lý thật tốt và thật chính được sinh ra từ G bởi các phép toán trong H. Như vậy xác những giá trị mờ, xem giá trị rõ là trường hợp mỗi phần tử của X sẽ có dạng biểu diễn x = hnhn- riêng của giá trị mờ. Các giá trị khoảng hầu như x∈G. Tập tất cả các phần tử được sinh ra từ 1.......h1x, chuyển về dạng các số mờ tam giác để xử lý. Tuy một phần tử x được ký hiệu là H(x). Nếu G có đúng nhiên, nếu chúng ta xem miền trị của thuộc tính mờ là hai từ nguyên thuỷ mờ, thì một được gọi là phần tử đại số gia tử, và việc biến đổi các giá trị khoảng về sinh dương ký hiệu là c+, một gọi là phần tử sinh âm một đoạn con của [0,1] thì việc xử lý và thao tác trên ký hiệu là c- và ta có c- < c+. Trong ví dụ trên true là dữ liệu mờ đơn giản và hiệu quả. phần tử sinh dương còn false là phần tử sinh âm. Như vậy, cho X = ( X, G, H, ≤ ) với G = {c-, W, c+ II. MỘT SỐ KHÁI NIỆM }, H = H- ∪ H+ với giả thiết H− = {h1,h2,.., hp}, H+ = Trong phần này, chúng tôi trình bày một số khái {h-1, ..., h-q}, h1 > h2 > ... > hp và h-1 <...< h-q là dãy niệm liên quan đến đại số gia tử làm cơ sở cho việc các gia tử, ta có các định nghĩa liên quan như sau : xây dựng phương pháp xử lý dữ liệu mờ trong những Định nghĩa 2.1. [2] f : X → [0,1] gọi là hàm định phần tiếp theo. - 67 -
  • 2. Tạp chí BCVT & CNTT kỳ 3 10/2007 lượng ngữ nghĩa của X nếu ∀ h, k∈H+ hoặc ∀ h, k∈H- Định nghĩa 2.4. [2] Cho fm là độ đo tính mờ trên X, và ∀ x, y ∈ X, ta có : hàm định lượng ngữ nghĩa ν trên X được định nghĩa f (hx) − f ( x) f (hy ) − f ( y ) như sau : = f (kx ) − f ( x ) f (ky ) − f ( y ) (1) ν(W) = θ = fm(c-), ν(c−) = θ - α.fm(c-) và Với đại số gia tử và hàm định lượng ngữ nghĩa ta có ν(c+) = θ + α.fm(c+). thể định nghĩa tính mờ của một khái niệm mờ. Cho (2) Nếu 1≤ j≤ p thì: trước hàm định lượng ngữ nghĩa f của X, xét bất kỳ  j  ν ( h j x ) = ν ( x) + Sign( h j x) ∑ fm( hi x ) − ω( h j x ) fm( h j x )  x∈X. Tính mờ của x khi đó được đo bằng đường kính  i =1  của tập f(H(x)) ⊆ [0,1]. Nếu –q ≤ j ≤ -1 thì: Định nghĩa 2.2. [2] Hàm fm: X→[0,1] được gọi là  −1  ν ( h j x ) = ν ( x) + Sign( h j x) ∑ fm( hi x ) − ω( h j x ) fm( h j x )  độ đo tính mờ trên X nếu thoả mãn các điều kiện sau:  i= j  (1) fm là độ đo mờ đầy đủ trên X, tức là trong đó: ∑ fm(h u ) = fm(u ) với mọi u ∈ X. ω(h j x) = 1 1 + Sign( h j x ) Sign(hq h j x )( β − α )  ∈{α,β} . 2  i − q ≤ i ≤ p ,i ≠ 0 (2) Nếu x là khái niệm rõ, tức là H(x) = {x} thì Định nghĩa 2.5. [1] Gọi fm là độ đo tính mờ trên fm(x) = 0. Do đó fm(0) = fm(W) = fm(1) = 0. ĐSGT X. Với mỗi x∈X, ta ký hiệu I(x) ⊆ [0,1] và |I(x)| (3) Với mọi x, y ∈ X và h∈H ta có là độ dài của I(x). fm(hx) fm(hy ) Một họ các J = {I(x): x∈X } được gọi là phân hoạch = , nghĩa là tỉ số này không phụ fm( x) fm( y ) của [0,1] gắn với x nếu: thuộc vào x và y, được kí hiệu là µ(h) gọi là độ đo (1) {I(c+), I(c-)} là phân hoạch của [0,1] sao cho tính mờ (fuzziness measure) của gia tử h. |I(c)| = fm(c), với c∈{c+, c-}. Trong đại số gia tử, mỗi phần tử x ∈ X đều mang (2) Nếu đoạn I(x) đã được định nghĩa và |I(x)| = dấu âm hay dương, được gọi là PN-dấu và được định fm(x) thì {I(hix): -q ≤ i ≤ p, i≠0} được định nghĩa là nghĩa đệ quy như sau: phân hoạch của I(x) sao cho thoả mãn điều kiện: Định nghĩa 2.3. [2] Hàm Sign: X → {-1, 0, 1} là |I(hix)| = fm(hix) và |I(hix)| là tập sắp thứ tự tuyến một ánh xạ được định nghĩa một cách đệ qui như sau, tính, tức là : hoặc I(h-q x) < I(h-q+1 x) < I(h-q+2 x) với ∀ h, h' ∈ H : <.......< I(hpx) ; hoặc I(h-q x) > I(h-q+1 x) > I(h-q+2 x) >.......> I(hpx) . (1) Sign(c−) = -1 và Sign(hc−) = +Sign(c−) nếu Tập {I(hix)} được gọi là phân hoạch gắn với phần tử hc− < c− Sign(hc−) = -Sign(c−) nếu hc− > c− + + + + + x. Ta có ∑ I (h x) =| I ( x) |= fm( x) . −q ≤i ≤ p ,i ≠ 0 i Sign(c ) = +1 và Sign(hc ) = +Sign(c ) nếu hc > c Sign(hc+) = -Sign(c+) nếu hc+ < c+ Định nghĩa 2.6. [1] Cho Xk = {x∈X: |x| = k}, xét k (2) Sign(h’hx) = -Sign(hx) nếu h' là negative đối P = {I(x): x∈Xk } là một phân hoạch của [0,1]. Ta nói với h và h'hx ≠ hx . rằng u bằng v theo mức k, được ký hiệu u =k v, khi và chỉ khi I(u) và I(v) cùng bao hàm trong một khoảng mờ (3) Sign(h’hx) = +Sign(hx) nếu h' là positive đối mức k. Có nghĩa là ∀u, v∈X, u =k v ⇔ ∃∆k ∈ Pk : I(u) với h và h'hx ≠ hx. ⊆ ∆k và I(v) ⊆ ∆k. (4) Sign(h’hx) = 0 nếu h'hx = hx. Bổ đề 2.1. [1] Quan hệ =k là một quan hệ tương - 68 -
  • 3. Tạp chí BCVT & CNTT kỳ 3 10/2007 đương trên Pk. TUOI, THUNHAP ) được xác định như sau: Bổ đề 2.2. [1] Cho u = hn…h1x và v = h’m…h’1x là Bảng 1. Quan hệ Thunhapcanhan biểu diễn chính tắc của u và v đối với x. TT TEN TUOI THUNHAP (1) Nếu u = v, thì u =k v với mọi k. 1 An 30 2.500.000 (2) Nếu h1 ≠ h’1 thì u =|x| v. 2 Hải khoảng 25 1.500.000 3 Hằng [25,40] khoảng 3.500.000 Định lý 2.1. [1] Cho Xk ={x∈X: |x| = k}, xét Pk 4 Phương [45,50] [1.500.00,1.800.000] ={I(x): x∈Xk} là một phân hoạch của [0,1], u = 5 Thúy 45 khoảng 1.000.000 hn….h1x và v = h’m….h’1x là biểu diễn chính tắc của u Chúng ta thấy rằng, các giá trị trên thuộc tính TUOI và v đối với x. và THUNHAP rất đa dạng. Tuy nhiên, trong bài bào (1) Nếu u =k v thì u =k’ v, ∀ 0 < k’< k. này, chúng tôi chỉ quan tâm đến việc xử lý các giá trị (2) Nếu tồn tại một chỉ số j ≤ min(m,n) lớn nhất sao khoảng. Vì vậy, tất cả các giá trị trên quan hệ cho với mọi s = 1..j ta có hs= h’s thì u = j+|x| v. Thunhapcanhan có thể chuyển về các giá trị khoảng Định nghĩa 2.7. Cho x = ( x1, x2, ….xn) và y = ( y1, tương ứng. y2, ….yn). Ta nói x ≤ y khi và chỉ khi xi ≤ yi với mọi 1≤ Một cách tổng quát, nếu là giá trị a ta chuyển thành i≤ n. [a,a], nếu là giá trị khoảng a ta chuyển thành Định nghĩa 2.8. Cho n đại số gia tử X1, X2, X3 …, [a-ε, a+ε], với ε được xem là bán kính với tâm a. Nếu Xn. Khi đó ta gọi hàm tích hợp các đại số gia tử X1, X2, từ a đến b thì ta chuyển thành [a,b]. Do đó quan hệ X3 …, Xn là hàm có dạng F: X1 × X2 × X3…× Xn → Thunhapcanhan có thể chuyển thành quan hệ sau: [0,1] thoả mãn các tính chất sau: Bảng 2. Quan hệ Thunhapcanhan (sau khi chuyển đổi) với εTUOI = 2 và εTHUNHAP = 100.000 (1) 0 ≤ F( x ) ≤ 1 ∀ x∈ X1 × X2 × X3……× Xn . TT TEN TUOI THUNHAP (2) Nếu x ≤ y thì F( x ) ≤ F( y ) ∀ x, y ∈ X1 × X2 1 An [30,30] [2.500.000,2.500.000] × X3……× Xn. 2 Hải [23,27] [1.500.000,1.500.000] 3 Hằng [25,40] [3.400.000,3.600.000] III. XÂY DỰNG PHƯƠNG PHÁP XỬ LÝ GIÁ 4 Phương [45,50] [1.500.00,1.800.000] TRỊ KHOẢNG 5 Thúy [45,45] [9.00.00,1.100.000] Trong cơ sở dữ liệu mờ, có nhiều quan hệ mà miền 1. Chuyển các giá trị khoảng về đoạn con [0,1] trị của các thuộc tính không phải là giá trị ngôn ngữ, tương ứng không phải giá trị số mà là giá trị khoảng, chẳng hạn Gọi Dom(Ai) = [min, max] là miền trị kinh điển của như quan hệ lưu trữ nhiệt độ sốt một căn bệnh của các thuộc tính mờ Ai trong một quan hệ, trong đó min, max bệnh nhân trong một bệnh viện nào đó, quan hệ thu tương ứng là giá trị nhỏ nhất và giá trị lớn nhất của nhập cá nhân trong một cơ quan.... Đối với loại dữ liệu Dom(Ai). Trước hết, ta xây dựng một hàm f để này, việc lưu trữ phức tạp nên việc xử lý dữ liệu loại chuyển đổi giá trị thuộc Dom(Ai) thành giá trị thuộc này càng phức tạp hơn. Vì vậy, nếu xem miền trị của [0,1]. Tiếp theo khoảng [a,b] được biến đổi thành đoạn thuộc tính mờ là một đại số gia tử thì trong phần này, con [0,1] tương ứng khi sử dụng hàm f , hay [f (a),f chúng tôi giới thiệu một phương pháp mới để xử lý giá (b)] ⊆[0,1]. trị khoảng giúp cho việc thao tác dữ liệu dễ dàng. Trước hết, một ví dụ được xem xét để từ đó phân tích Định nghĩa 3.1. f : Dom(Ai) → [0,1] và được xác a − min ngữ nghĩa của các giá trị khoảng trong một quan hệ. định f(a) = , ∀a∈Dom(Ai). max − min Ví dụ 3.1. Cho quan hệ Thunhapcanhan(STT, TEN, - 69 -
  • 4. Tạp chí BCVT & CNTT kỳ 3 10/2007 Ví dụ 3.2. Sử dụng quan hệ Thunhapcanhan (sau Với mỗi [Ia,Ib] nếu tồn tại x∈X sao cho khi chuyển đổi) ([Ia,Ib]∩I(x)) = ∅ thì: Nếu chúng ta chọn Dom(TUOI) = [0,100] và Nếu tồn tại z∈X sao cho [Ia,Ib] ⊆I(z) và I(x) ⊆I(z), Dom(THUNHAP) = [500.000,6.000.000]. Khi đó ta thì [a,b] =|z| x. có các kết quả chuyển giá trị khoảng tương ứng về Ia Ib đoạn con của [0,1] như sau: Bảng 3. Quan hệ Thunhapcanhan sau khi sử dụng hàm f I(x) TT TEN TUOI THUNHAP I(z) 1 An [0.3,0.3] [0.36,0.36] Ví dụ 3.3. Gọi XTUOI = ( XTUOI, GTUOI, HTUOI, ≤ ) là 2 Hải [0.23,0.27] [0.18,0.18] đại số gia tử, với GTUOI = {già, trẻ}, H+TUOI = {rất, 3 Hằng [0.25,0.4] [0.52,0.56] hơn}, H-TUOI = {khả năng, ít}, rất > hơn và ít > khả 4 Phương [0.45,0.50] [0.18,0.23] 5 Thúy [0.45,0.45] [0.07,0.11] năng, WTUOI = 0.6, fm(trẻ) = 0.6, fm(già) = 0.4, fm(rất) = 0.25, fm(hơn) = 0.25, fm(khả năng) = 0.25, 2. So sánh các giá trị khoảng theo cách tiếp cận đại fm(ít) = 0.25, chọn Dom(TUOI) = [0,100] . số gia tử Ta có fm(rất trẻ) = 0.15, fm(hơn trẻ) = 0.15, fm(ít Cho đại số gia tử X = ( X, G, H, ≤ ) và một giá trị trẻ) = 0.15, fm(khả năng trẻ) = 0.15. khoảng [a,b]. Để so sánh một giá trị x ∈X với [a,b], Vì rất trẻ < hơn trẻ < trẻ < khả năng trẻ < ít trẻ nên trước tiên ta phải chuyển [a,b] về đoạn con của [0,1]. I(rất trẻ) = [0,0.15], I(hơn trẻ) = [0.15,0.3], I(khả Vì tính mờ của x là một đoạn con của [0,1], do đó để năng trẻ) = [0.3,0.45], I(ít trẻ) = [0.45,0.6]. so sánh x∈X và đoạn con [0,1] chúng ta chỉ cần dựa Ta có fm(rất già) = 0.1, fm(hơn già) = 0.1, fm(ít vào phần giao hai đoạn con của [0,1] tương ứng. Với già) = 0.1, fm(Khả năng già) = 0.1. x∈ X, ký hiệu I(x)⊆[0,1] và |I(x)| = fm(x), [Ia,Ib] = Vì ít già < khả năng già < già < hơn già < rất già [f(a),f(b)]⊆[0,1] tương ứng với việc chuyển đổi giá nên I(ít già) = [0.6,0.7], I(khả năng già) = [0.7,0.8], trị khoảng [a,b] về đoạn con của [0,1]. Khi đó ta có: I(hơn già) = [0.8,0.9], I(rất già) = [0.9,1]. Với mỗi [Ia,Ib] nếu tồn tại x∈X sao cho [Ia,Ib]⊆I(x), Vì [0.23,0.27] ⊆ I(hơn trẻ) mà [f(23),f(27)] = thì [a,b] =|x| x. Ia Ib [0.23,0.27] nên [23,27] =2 hơn trẻ. Hay khoảng 25 =2 hơn trẻ. Tương tự, ta có [0.25,0.4] ∩ I(hơn trẻ) = I(x) [0.25,0.3] và [0.25,0.4] ∩ I(khả năng trẻ) = [0.3,0.4]. Với mỗi [Ia,Ib] sao cho [Ia,Ib]⊄ I(x) ∀x, x1∈X thì: Mặt khác ta có |[0.25,0.3]| = 0.05, |[0.3,0.4]| = 0.1, Khi đó với x và x1, giả sử x < x1, nếu |[Ia,Ib]∩I(x)| ≥ |[0.25,0.4]|/2 = 0.075. Vì [f(25),f(40)] = [0.25,0.4] |[Ia,Ib]|/£, thì [a,b] =|x| x. và |[0.25,0.4] ∩ I(khả năng trẻ)| ≥ |[0.25,0.4]|/2, nên Ia Ib [25,40] =2 khả năng trẻ. IV. TÌM KIẾM DỮ LIỆU I(x) I(x1) 1. Đặt vấn đề ngược lại, nếu |[Ia,Ib]∩I(x1)| ≥ |[Ia,Ib]|/£, thì [a,b] =|x1| x1 Khi thiết kế một cơ sở dữ liệu, nếu một thuộc tính Ia Ib nhận được từ việc tính toán hay kết hợp của hai hay nhiều thuộc tính khác thì thông thường thuộc tính này I(x) I(x1) sẽ không cần đưa vào cơ sở dữ liệu để tinh giản trong với £ là số đoạn I(xi)⊆[0,1], sao cho ([Ia,Ib]∩I(xi)) ≠ ∅ thiết kế. Chẳng hạn như trong một cơ sở dữ liệu có - 70 -
  • 5. Tạp chí BCVT & CNTT kỳ 3 10/2007 thuộc tính SOLUONG 0 0.15 0.3 0.45 W 0.7 0.8 0.9 1 và DONGIA, khi đó THANHTIEN = I(rất trẻ) I(hơn trẻ) I(ít trẻ) I(ít già) I(hơn già) SOLUONG*DONGIA, I(khả năng trẻ) I(khả năng già) I(rất già) do vậy thuộc tính I(trẻ) I(già) THANHTIEN sẽ không Hình minh họa ví dụ 3.3 cần thiết đưa vào cơ sở 2. Thuật toán xác định giá trị chân lý của điều kiện dữ liệu nếu không muốn lưu trữ giá trị THANHTIEN mờ mà chỉ muốn giá trị THANHTIEN phục vụ cho việc thao tác hay truy vấn dữ liệu. Trong phần này, chúng tôi trình bày một thuật toán để xác định giá trị chân lý của điều kiện mờ làm cơ sở Trong cơ sở dữ liệu mờ, khi cho một quan hệ, nếu cho việc tìm kiếm dữ liệu. một thuộc tính nào đó không có trong quan hệ nhưng nhận được từ việc kết hợp hai hay nhiều thuộc tính đã Thuật toán 4.1. Xác định giá trị chân lý của điều cho trong quan hệ bằng một phương pháp nào đó kiện (t[Ai] =k x). chúng ta gọi là thuộc tính suy dẫn. Trong phạm vi bài Input : Cho lược đồ U = {A1, A2,...An} và quan hệ báo này, chúng tôi xét miền trị của các thuộc tính mờ r xác định trên U. là giá trị khoảng, do đó miền trị của thuộc tính suy dẫn cũng nhận giá trị khoảng. Output : Với mọi t∈r sao cho (t[Ai] =k x) = true. Ví dụ 4.1. Cho quan hệ Suckhoe_svien(MASV, Method : HOTEN, GIOITINH, CHIEUCAO, TRONGLUONG) (1) Đặt Dom(Ai) = [min,max] như bảng 4. Bảng 4. Quan hệ Suckhoe_svien (2) For mỗi t∈r do MASV HOTEN GIOI CHIEU TRONG (3) if t[Ai] không phải giá trị khoảng then chuyển t[Ai] TINH CAO LUONG thành khoảng [a,b] tương ứng. SV001 Nguyễn Lan Nữ [1.65,1.7] 55 (4) For mỗi t∈r do SV002 Trần Thanh Nam 1.67 [57,65] (5) t[Ai] = [f(a),f(b)] // Sử dụng hàm f để chuyển SV003 Cao Kỳ Nam 1.72 [60,70] các giá trị [a,b] thành đoạn con [0,1] SV004 Lý Thanh Nhàn Nữ [1.7,1.8] 50 SV005 Hoàng Hoá Nữ [1.63,1.8] [65,75] (6) For mỗi t∈r do Giả sử rằng chúng ta muốn tìm những sinh viên nữ (7) if t[Ai] ⊆I(x) và |x| ≥ k thì (t[Ai] =k x) = true có sức khỏe khả năng yếu. Ở đây, thuộc tính (8) elseif (t[Ai]∩I(x)) = ∅ then SUCKHOE không có trong quan hệ nhưng ta có thể kết hợp hai thuộc tính CHIEUCAO và (9) if tồn tại x1∈X sao cho t[Ai]⊆I(x1) và I(x)⊆I(x1) TRONGLUONG trong quan hệ Suckhoe_svien, như và |x1| ≥ k then (t[Ai] =k x) = true. vậy thuộc tính SUCKHOE gọi là thuộc tính suy dẫn. (10) if t[Ai] ⊄ I(x) then Vậy, để xác định giá trị của thuộc tính SUCKHOE (11) if tồn tại x1∈X and x < x1 sao cho |t[Ai]∩I(x)| ≥ chúng ta có thể sử dụng các hàm kết nhập của hai đại số gia tử Dom(CHIEUCAO) và Dom(TRONG |t[Ai]|/£ và |x| ≥ k then (t[Ai] =k x) = true (với £ là số LUONG). đoạn I(xi) ⊆[0,1] sao cho (t[Ai]∩I(xi)) ≠ ∅ ). - 71 -
  • 6. Tạp chí BCVT & CNTT kỳ 3 10/2007 (12) if tồn tại x1∈X and x < x1 sao cho |t[Ai]∩I(x1)| ≥ suy dẫn SUCKHOE |t[Ai]|/£ và |x1| ≥ k then (t[Ai] =k x) = true. Gọi XSUCKHOE = (XSUCKHOE, GSUCKHOE, HSUCKHOE, ≤ ) 3. Phương pháp tìm kiếm dữ liệu là một đại số gia tử với GSUCKHOE = {yếu, tốt}, H+SUCKHOE = {rất, hơn}, H-SUCKHOE = {khả năng, ít}, Để trả lời câu truy vấn trong truy vấn 4.1, trước tiên rất > hơn và ít > khả năng, WSUCKHOE = 0.6. Khi đó, chúng ta áp dụng hàm f chuyển quan hệ sinhvien fm(yếu) = 0.6, fm(tốt) = 0.4, fm(rất) = 0.2, fm(hơn) = thành một quan hệ tương ứng với miền trị của 0.2, fm(khả năng) = 0.25, fm(ít) = 0.35. CHIEUCAO và TRONGLUONG là các đoạn con của [0,1]. Tiếp theo, ta sử dụng hàm kết nhập đại số gia tử Ta có fm(rất yếu) = 0.12, fm(hơn yếu) = 0.12, để tính miền trị tương ứng cho thuộc tính suy dẫn fm(khả năng yếu) = 0.15, fm(ít yếu) = 0.21. SUCKHOE. Cuối cùng, áp dụng thuật toán 4.1 để xác Vì rất yếu < hơn yếu < yếu < khả năng yếu < ít yếu định giá trị chân lý của điều kiện trong truy vấn và tìm nên I(rất yếu) = [0,0.12], I(hơn yếu) = [0.12,0.24], những bộ dữ liệu thoả mãn điều kiện. I(khả năng yếu) = [0.24,0.39], I(ít yếu) = [0.39,0.6]. Như vậy, một cách tổng quát ta gọi Pa là thuộc tính Bảng 6. Quan hệ Suckhoe_svien (sau khi chuyển đổi và thêm thuộc tính suy dẫn SUCKHOE) suy dẫn từ các thuộc tính mờ A1, A2, …Aq, với miền trị tương ứng Dom(Ai), i =1..q, F: Dom(A1) × Dom(A2) MA HOTEN GIOI CHIEU TRONG SUC SV TINH CAO LUONG KHOE ×… × Dom(Aq)→ [0,1] là hàm kết nhập các đại số gia SV Nguyễn Nữ [0.281, [0.18, [0.23, tử Dom(A1), Dom(A2), …, Dom(Aq), ψ là một giá trị 001 Lan 0.5] 0.18] 0.34] thuộc đại số gia tử X. Khi đó, điều kiện mờ Pa =k ψ SV Trần Nam [0.361, [0.231, [0.296, trong câu truy vấn được xác định như sau: Pa =k ψ ⇔ 002 Thanh 0.361] 0.5] 0.43] [F( x ),F( y )] =k I(ψ), với x = (x1 × x2 ×….× xq), y = SV Cao Kỳ Nam [0.595, [0.32, [0.457, (y1 × y2 ×….× yq) và |I(ψ)| = fm(ψ). 003 0.595] 0.68] 0.637] Ví dụ 4.2. Trong quan hệ Suckhoe_svien ở ví dụ 4.1 SV Lý Thanh Nữ [0.5, [0.08, [0.29, hãy tìm những sinh viên nữ có sức khỏe khả năng yếu. 004 Nhàn 0.875] 0.08] 0.477] Ta chọn Dom(CHIEUCAO) = [1.5,1.9] và SV Hoàng Nữ [0.211, [0.5, [0.355, Dom(TRONGLUONG) = [40,90] thì khi đó áp dụng 005 Hoá 0.875] 0.82] 0.847] hàm chuyển đổi f cho kết quả : Áp dụng thuật toán 4.1 ta có hai sinh viên nữ có Bảng 5. Quan hệ Suckhoe_svien (sau khi chuyển đổi) SUCKHOE =2 khả năng yếu là Nguyễn Lan và Lý MA HOTEN GIOI CHIEUCAO TRONG Thanh Nhàn.. SV TINH LUONG SV001 Nguyễn Nữ [0.281,0.5] [0.18,0.18] V. KẾT LUẬN Lan Trong bài báo này, chúng tôi đã đưa ra một phương SV002 Trần Thanh Nam [0.361,0.361] [0.231,0.5] pháp mới để xử lý dữ liệu dạng khoảng trong cơ sở dữ SV003 Cao Kỳ Nam [0.595,0.595] [0.32,0.68] liệu mờ đó là phương pháp tiếp cận ngữ nghĩa định SV004 Lý Thanh Nữ [0.5,0.875] [0.08,0.08] lượng đại số gia tử. Cách tiếp cận này làm cho việc xử Nhàn lý dữ liệu đơn giản và thuần nhất kiểu dữ liệu. Các giá SV005 Hoàng Hoá Nữ [0.211,0.875] [0.5,0.82] trị khoảng được chuyển thành các đoạn con của [0,1] n Chọn hàm kết nhập đại số gia tử F = ∑δ ν . i i ( xi ) , tương ứng. Vì tính mờ của các phần tử trong đại số gia i =1 tử cũng là một đoạn con của [0,1], do đó việc so sánh với δ1 = δ2 = 0.5, khi đó ta có miền trị của thuộc tính các giá trị khoảng với một giá trị trong một đại số gia - 72 -
  • 7. Tạp chí BCVT & CNTT kỳ 3 10/2007 tử trở thành so sánh hai đoạn con của [0,1]. Từ việc so Information Processing (FIP) 2003, Beijing, pp 105- sánh các giá trị khoảng, bài báo đã đề xuất cách xây 111. dựng các thuộc tính suy dẫn bằng cách sử dụng các [7] NGUYỄN CÁT HỒ, TRẦN THÁI SƠN, “Logic mờ và hàm kết nhập các đại số gia tử. Cuối cùng, chúng tôi quyết định mờ dựa trên cấu trúc thứ tự của giá trị ngôn xây dựng thuật toán đánh giá giá trị chân lý của điều ngữ”, Tạp chí Tin học và Điều khiển học, Tập 9, số 4 (1993), trang 1-9. kiện mờ để từ đó áp dụng truy vấn dữ liệu với thuộc [8] TRẦN ĐÌNH KHANG, “Xây dựng hàm đo trên đại số tính suy dẫn có miền trị là giá trị khoảng trong cơ sở gia tử và ứng dụng trong lập luận ngôn ngữ”, Tạp chí dữ liệu mờ theo mô hình [1]. Tin học và Điều khiển học, Tập 13 số 1 (1997), trang TÀI LIỆU THAM KHẢO 16-30. [9] TRƯƠNG ĐỨC HÙNG, “Một phương pháp xử lý dữ [1] NGUYỄN CÔNG HÀO, “Mô hình cơ sở dữ liệu mờ liệu trong CSDL mờ”, Kỷ yếu Hội nghị khoa học theo cách tiếp cận đại số gia tử”. Kỷ yếu Hội thảo trường Đại học Bách Khoa Hà Nội 10/1996. quốc gia về các vấn đề chọn lọc Công nghệ Thông tin [10] PATRICK BOSC, “Subqueries in SQLf, a Fuzzy và Truyền thông, Hải Phòng 2005, trang 285-293. Database Query Language”, IEEE International [2] NGUYỄN CÁT HỒ, Lý thuyết tập mờ và công nghệ Conference on Intelligent Systems for the 21st tính toán mềm, Hệ mờ, mạng nơron và ứng dụng, NXB Centuryapos, Khoa học kỹ thuật 2001, trang 37-74. Vol. 4, Issue , 22-25 Oct 1995 pp 3636 - 3641. [3] NGUYỄN CÁT HỒ, TRẦN THÁI SƠN, “Về khoảng [11] YOSHIKANE TAKAHASHI, “Fuzzy Database Query cách giữa các giá trị của biến ngôn ngữ trong đại số Language and Their Relational Completeness gia tử”, Tạp chí Tin học và Điều khiển học, Tập 11 số theorem”, IEEE Transactions on Knowledge and Data 1 năm 1995, trang 10-20. Engineering, Vol 5, No. 1, 1993, 122-125. [4] NGUYEN CAT HO, “W.Wechler, “Extended hedge [12] SHYUE-LIANG WANG, YU-JANE TSAI, “Null algebras ans their application to fuzzy logic”, Fuzzy queries with Interval-Valued Ambiguous Attributes”, Set and Systems 52 (1992), pp 259-282. IEEE International Conference on Systems Man and [5] NGUYEN CAT HO, W.WECHLER, “Hedge algebras: Cybernetics,, 1998, pp 2150-2153. an algebraic approach to structure of sets of linguistic [13] DUBOIS D, PRADE H, Possibility theory: An domains of linguistic truth variable”, Fuzzy Set and approach to computerized processing of uncertainty, Systems 35 (1990), pp 281-293. SIAM Review, Vol. 34, No. 1, Mar., 1992, pp. 147-148. [6] NGUYEN CAT HO, “Quantifying hedge algebras and Ngày nhận bài : 5/9/06 interpolation methods in approximate reasoning”, Proceeding of the Inter Workshop on Fuzzy SƠ LƯỢC TÁC GIẢ NGUYỄN CÔNG HÀO Nơi công tác hiện nay: Khoa Công nghệ thông tin, Sinh năm 1976. Đại học Khoa học Huế Tốt nghiệp Đại học Sư phạm Hướng nghiên cứu: Cơ sở dữ liệu mờ, Đại số gia tử. Huế năm 1997, nhận bằng Thạc sỹ năm 2002 tại Đại học Bách Email: nchao_hueit@yahoo.com khoa Hà Nội, hiện đang là Nghiên cứu sinh tại Viện Công nghệ thông tin - Viện Khoa học và Công nghệ Việt Nam. - 73 -