SlideShare a Scribd company logo
1 of 139
BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC
VÀ CÔNG NGHỆ VIỆT NAM
HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ
-----------------------------
VŨ VĂN HIỆU
NGHIÊN CỨU MỘT SỐ KỸ THUẬT PHÂN HẠNG TRONG
TRA CỨU ẢNH DỰA VÀO NỘI DUNG
LUẬN ÁN TIẾN SỸ TOÁN HỌC
HÀ NỘI – 2017
BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC
VÀ CÔNG NGHỆ VIỆT NAM
HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ
-----------------------------
VŨ VĂN HIỆU
NGHIÊN CỨU MỘT SỐ KỸ THUẬT PHÂN HẠNG
TRONG TRA CỨU ẢNH DỰA VÀO NỘI DUNG
LUẬN ÁN TIẾN SỸ TOÁN HỌC
Chuyên ngành: Cơ sở Toán học cho Tin học
Mã số: 62 46 01 10
Người hướng dẫn khoa học:
1. PGS. TS. Ngô Quốc Tạo
2. PGS.TS. Nguyễn Hữu Quỳnh
Hà Nội – 2017
LÌi cam oan
Tôi xin cam oan lu™n án “Nghiên c˘u mÎt sË kˇ thu™t phân h§ng trong
tra c˘u £nh d¸a vào nÎi dung” là công trình nghiên c˘u cıa riêng tôi. Các sË
liªu, k∏t qu£ ˜Òc trình bày trong lu™n án là hoàn toàn trung th¸c và ch˜a t¯ng
˜Òc công bË trong bßt k˝ mÎt công trình nào khác.
⌅ Tôi ã trích d®n ¶y ı các tài liªu tham kh£o, công trình nghiên c˘u liên
quan  trong n˜Óc và quËc t∏. Ngo§i tr¯ các tài liªu tham kh£o này, lu™n
án hoàn toàn là công viªc cıa riêng tôi.
⌅ Trong các công trình khoa hÂc ˜Òc công bË trong lu™n án, tôi ã th∫ hiªn
rõ ràng và chính xác óng góp cıa các Áng tác gi£ và nh˙ng gì do tôi ã
óng góp.
⌅ Lu™n án ˜Òc hoàn thành trong thÌi gian tôi làm Nghiên c˘u sinh t§i Phòng
Nh™n d§ng và Công nghª tri th˘c, Viªn Công nghª thông tin, Viªn Hàn
lâm Khoa hÂc và Công nghª Viªt Nam.
Tác gi£ :
Hà NÎi :
i
LÌi c£m Ïn
Lu™n án ˜Òc th¸c hiªn d˜Ói s¸ h˜Óng d®n khoa hÂc cıa PGS.TS Ngô QuËc T§o
và PGS.TS Nguyπn H˙u Qu˝nh. Nghiên c˘u sinh xin bày t‰ lòng bi∏t Ïn sâu s≠c
∏n hai Th¶y v∑ ‡nh h˜Óng khoa hÂc, nh˙ng bài hÂc, nh˙ng góp ˛ qu˛ báu trong
nghiên c˘u. Các Th¶y ã t§o i∑u kiªn vô cùng thu™n lÒi trong suËt quá trình
nghiên c˘u cıa Nghiên c˘u sinh.
Tôi xin ˜Òc c£m Ïn các nhà khoa hÂc, tác gi£ cıa các công trình công bË ã ˜Òc
trích d®n trong lu™n án, ây là nh˙ng t˜ liªu qu˛, ki∏n th˘c liên quan quan trÂng
giúp Nghiên c˘u sinh hoàn thành lu™n án. Xin c£m Ïn ∏n các nhà khoa hÂc ã
ph£n biªn các công trình nghiên c˘u cıa Nghiên c˘u sinh.
Tôi trân trÂng c£m Ïn Phòng Nh™n d§ng và Công nghª tri th˘c, Phòng qu£n l˛
ào t§o, Viªn Công nghª thông tin, HÂc viªn Khoa hÂc và Công nghª, Viªn Hàn
lâm Khoa hÂc và Công nghª Viªt Nam ã t§o i∑u kiªn thu™n lÒi cho tôi trong
suËt quá trình nghiên c˘u th¸c hiªn lu™n án. Tôi cÙng xin c£m Ïn sâu s≠c ∏n HÎi
Áng Khoa hÂc Viªn Công nghª thông tin, các Th¶y trong HÎi Áng b£o vª cßp
cÏ s ã góp ˛ giúp Nghiên c˘u sinh hoàn thiªn công trình lu™n án này.
Tôi cÙng bày t‰ s¸ c£m Ïn sâu s≠c ∏n Khoa Công nghª thông tin, Tr˜Ìng §i
hÂc iªn L¸c, Hà NÎi ã t§o i∑u kiªn cho tôi ˜Òc hÂc t™p, trao Íi và nghiên
c˘u. Tôi xin c£m Ïn Tr˜Ìng §i hÂc H£i Phòng ã t§o i∑u kiªn v∑ thÌi gian và
tài chính cho tôi th¸c hiªn lu™n án này.
MÎt ph¶n cıa nghiên c˘u này ˜Òc th¸c hiªn trong khuôn khÍ ∑ tài nghiên c˘u
mã sË CS’15.03 cıa Viªn Công nghª Thông tin, Viªn Hàn lâm Khoa hÂc và Công
nghª Viªt Nam và ∑ tài nghiên mã sË VAST01.07/15-16 cıa Viªn Hàn lâm Khoa
hÂc và Công nghª Viªt Nam. Xin c£m Ïn các trao Íi và trÒ giúp cıa các thành
viên ∑ tài.
CuËi cùng, tôi xin bày t‰ lòng bi∏t Ïn vô h§n Ëi vÓi cha mµ, vÒ con và toàn th∫
anh em trong gia ình ã luôn ıng hÎ, giúp Ô tôi.
ii
Mˆc lˆc
LÌi cam oan i
LÌi c£m Ïn ii
T¯ vi∏t t≠t v
K˛ hiªu toán hÂc vi
Danh mˆc các hình v≥ vii
Danh mˆc các b£ng bi∫u xi
M ¶u 1
1 TÍng quan v∑ Tra c˘u £nh d¸a vào nÎi dung 8
1.1 MÎt sË ∞c tr˜ng £nh th˜Ìng s˚ dˆng trong tra c˘u £nh d¸a vào
nÎi dung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.1.1 Miêu t£ toàn cˆc . . . . . . . . . . . . . . . . . . . . . . . . 9
1.1.2 Miêu t£ cˆc bÎ . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.2 TÍ hÒp ∞c tr˜ng trong tra c˘u £nh d¸a vào nÎi dung . . . . . . . . 13
1.3 Chu©n hoá trong CBIR . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.3.1 Mˆc ích cıa chu©n hoá . . . . . . . . . . . . . . . . . . . . 14
1.3.2 Chu©n hóa min-max . . . . . . . . . . . . . . . . . . . . . . 16
1.3.3 Chu©n hóa Gauss . . . . . . . . . . . . . . . . . . . . . . . . 16
1.4 Kho£ng trËng ng˙ nghæa . . . . . . . . . . . . . . . . . . . . . . . . 19
1.5 Ph£n hÁi liên quan trong CBIR . . . . . . . . . . . . . . . . . . . . 21
1.6 Hiªu chønh trÂng sË và d‡ch chuy∫n truy vßn trong CBIR s˚ dˆng
ph£n hÁi liên quan . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.7 Tra c˘u £nh d¸a vào nÎi dung s˚ dˆng kˇ thu™t máy hÂc . . . . . . 27
1.7.1 Hußn luyªn và ki∫m tra . . . . . . . . . . . . . . . . . . . . 27
1.7.2 Nhãn d˙ liªu . . . . . . . . . . . . . . . . . . . . . . . . . . 28
1.7.3 Xây d¸ng mô hình hÂc . . . . . . . . . . . . . . . . . . . . . 29
1.8 MÎt sË ti∏p c™n d¸a theo ph˜Ïng pháp tËi ˜u Pareto . . . . . . . . 33
iii
1.9 Ph˜Ïng pháp ánh giá hiªu n´ng trong CBIR . . . . . . . . . . . . 34
2 ∑ xußt chu©n hoá ∞c tr˜ng và hiªu chønh trÂng sË trong tÍ hÒp
∞c tr˜ng 37
2.1 Chu©n hoá ∞c tr˜ng d¸a vào phân cˆm mÌ FCM . . . . . . . . . . 39
2.2 Chu©n hoá kho£ng cách d¸a vào phân cˆm FCM . . . . . . . . . . 45
2.3 Hiªu chønh trÂng sË, d‡ch chuy∫n truy vßn . . . . . . . . . . . . . . 46
2.3.1 Hiªu chønh trÂng sË . . . . . . . . . . . . . . . . . . . . . . . 51
2.3.2 D‡ch chuy∫n truy vßn . . . . . . . . . . . . . . . . . . . . . . 52
2.4 Th˚ nghiªm và ánh giá các k∏t qu£ . . . . . . . . . . . . . . . . . 54
2.4.1 CÏ s d˙ liªu £nh . . . . . . . . . . . . . . . . . . . . . . . . 54
2.4.2 Trích rút bÎ ∞c tr˜ng k∏t hÒp . . . . . . . . . . . . . . . . 55
2.4.3 Các k∏t qu£ th¸c nghiªm và lu™n gi£i . . . . . . . . . . . . . 55
2.5 K∏t lu™n Ch˜Ïng 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
3 ∑ xußt kˇ thu™t Pareto front a m˘c sâu nâng cao hiªu qu£
phân lÓp £nh 69
3.1 MÎt sË tính chßt hình th˘c d¸a trên kˇ thu™t Pareto front a m˘c
sâu trong không gian tÍ hÒp ∞c tr˜ng . . . . . . . . . . . . . . . . 73
3.2 Nâng cao hiªu qu£ phân lÓp £nh . . . . . . . . . . . . . . . . . . . . 81
3.3 Th˚ nghiªm và ánh giá các k∏t qu£ . . . . . . . . . . . . . . . . . 86
3.3.1 CÏ s d˙ liªu £nh . . . . . . . . . . . . . . . . . . . . . . . . 86
3.3.2 Các ph˜Ïng pháp cÏ s . . . . . . . . . . . . . . . . . . . . . 88
3.3.3 Ph˜Ïng pháp ánh giá . . . . . . . . . . . . . . . . . . . . . 88
3.3.4 Các k∏t qu£ th¸c nghiªm . . . . . . . . . . . . . . . . . . . . 89
3.4 K∏t lu™n Ch˜Ïng 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
K∏t lu™n và h˜Óng phát tri∫n 97
Danh mˆc công trình ã công bË 99
A MÎt sË cÏ s d˙ liªu £nh s˚ dˆng 111
A.1 Corel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
A.2 Wang . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
A.3 Caltech 101 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
A.4 Oxford Building . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
B Ph¶n m∑m tra c˘u theo các ∑ xußt cıa lu™n án 120
iv
T¯ vi∏t t≠t
D§ng vi∏t t≠t D§ng ¶y ı Diπn gi£i
CBIR Content based image retrie-
val
Tra c˘u £nh d¸a vào nÎi dung
FCM Fuzzy c-means Phân cˆm mÌ c-means
HI Histogram Interrsection L˜Òc Á giao
HSV hue, saturation, value màu s≠c, Î bão hoà màu, Î sáng
L2R Learning to Rank HÂc x∏p h§ng
MARS Multimedia Analysis and
Retrieval Systems
Các hª thËng phân tích a
ph˜Ïng tiªn và tra c˘u
Pr Precision Î chính xác
Re Recall Î hÁi t˜ng
RF Relevance feedback Ph£n hÁi liên quan
RGB red, green, blue ‰, xanh lá, xanh d˜Ïng
SIFT Scale-Invariant Feature
Transform
SVM Support vector machine Máy vector hÈ trÒ
v
K˛ hiªu toán hÂc
M Î dài cıa mÎt vector ∞c tr˜ng
N Kích th˜Óc cıa cÏ s d˙ liªu £nh
T SË bÎ ∞c tr˜ng
t Chø sË bÎ ∞c tr˜ng
Q, Ii Énh truy vßn và £nh th˘ i trong cÏ s d˙ liªu
˜Ii Vector ∞c tr˜ng chu©n hoá cıa £nh th˘ i
˜I t
i Vector ∞c tr˜ng chu©n hoá  bÎ t cıa £nh th˘ i
Qt
, I t
∞c tr˜ng bÎ t t˜Ïng ˘ng cıa £nh truy vßn Q và £nh I bßt k˝
˜Qt
i ∞c tr˜ng chu©n hoá  bÎ t cıa £nh truy vßn
Dt
Q (Ii ), Dt
(Q, Ii ) Kho£ng cách theo bÎ ∞c tr˜ng t cıa £nh Ii so vÓi £nh truy
vßn Q
DQ (Ii ), D(Q, Ii ) Kho£ng cách £nh Ii so vÓi £nh truy vßn Q trên bÎ ∞c tr˜ng
k∏t hÒp
top k T™p gÁm k £nh có th˘ h§ng t˜Ïng t¸ cao nhßt Ëi vÓi £nh truy vßn
NB T™p £nh có Î t˜Ïng t¸ cao nhßt theo ∞c tr˜ng toàn cˆc trong mÎt tra
c˘u
NB T™p £nh ˜Òc xác nh™n không liên quan  ph£n hÁi cıa ng˜Ìi dùng
NB+
T™p £nh ˜Òc xác nh™n liên quan  ph£n hÁi cıa ng˜Ìi dùng
NBt T™p £nh có Î t˜Ïng t¸ cao nhßt theo ∞c tr˜ng  bÎ t trong mÎt tra c˘u
NB⇠
T™p £nh có th˘ h§ng Î t˜Ïng t¸ cao và thuÎc t™p NB trong mÎt tra
c˘u
vi
NB⇤
T™p £nh ch˜a ˜Òc tra c˘u
V
(D)
t,c Tâm cˆm c t™p giá tr‡ kho£ng cách bÎ ∞c tr˜ng t theo FCM
Vt (D) T™p tâm cˆm theo bÎ ∞c tr˜ng t
Vt,c,j Tâm cˆm c cıa thành ph¶n ∞c tr˜ng j  bÎ ∞c tr˜ng t theo phân cˆm
mÌ FCM
wt TrÂng sË kho£ng cách cıa bÎ ∞c tr˜ng t
⌘p
t,c,i Giá tr‡ Î thuÎc cıa ph¶n t˚ th˘ i  bÎ ∞c tr˜ng t so vÓi cˆm c, p là
hª sË FCM
(l),NB+
t,kIt k Î lªch chu©n theo Î dài ∞c tr˜ng bÎ ∞c tr˜ng t trong l¶n l∞p th˘
l Ëi vÓi các £nh trong t™p NB+
(l),NB+
t,Dt
Q (Ii )
Î lªch chu©n kho£ng cách bÎ ∞c tr˜ng t trong l¶n l∞p th˘ l Ëi vÓi
các £nh trong t™p NB+
t,c,i Î lªch chu©n thành ph¶n j cıa bÎ ∞c tr˜ng t theo cˆm c
(D)
t,c Î lªch chu©n kho£ng cách bÎ ∞c tr˜ng t theo cˆm c
vii
Danh sách hình v≥
0.1 Hª thËng tra c˘u £nh d¸a vào nÎi dung. . . . . . . . . . . . . . . . 3
0.2 Hª thËng ∑ xußt . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.1 Thành ph¶n th˘ nhßt cıa ∞c tr˜ng mô men màu. . . . . . . . . . 15
1.2 Phân bË d˙ liªu thành ph¶n 1 cıa ∞c tr˜ng mô men màu (gËc) . . 18
1.3 (a) Phân bË d˙ liªu thành ph¶n 5 l˜Òc Á ∞c tr˜ng l˜Òc Á HSV
(gËc). (b) L˜Òc Á ∞c tr˜ng l˜Òc Á HSV chu©n hoá theo lu™t 3
thành ph¶n th˘ 5, 97.4555% d˙ liªu “rÏi vào” [-1,1] . . . . . . . . . 18
1.4 Énh truy vßn “mandolin image 0001.jpg”. . . . . . . . . . . . . . . 19
1.5 Hª thËng tra c˘u vÓi £nh truy vßn “mandolin image 0001.jpg”. . . . 19
1.6 K∏t qu£ top 20 các £nh t˜Ïng t¸ nhßt vÓi £nh truy vßn  l¶n tra
c˘u khi t§o. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.7 Hai £nh có ng˙ nghæa t˜Ïng Áng . . . . . . . . . . . . . . . . . . . 20
1.8 L˜Òc Á màu cıa £nh truy vßn và hai £nh trong k∏t qu£ top 20. . 21
1.9 Minh ho§ siêu phØng . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.1 Mô hình hª thËng ∑ xußt . . . . . . . . . . . . . . . . . . . . . . . 38
2.2 Minh ho§ chu©n hóa 3 FCM . . . . . . . . . . . . . . . . . . . . 42
2.3 Minh ho§ tính chßt b£o toàn th˘ t¸ cıa chu©n hoá 3 FCM . . . 43
2.4 Phân bË d˙ liªu gËc  thành ph¶n th˘ n´m cıa các ∞c tr˜ng (a)
L˜Òc Á màu HSV, (b) l˜Òc Á t¸ t˜Ïng quan màu, (c) mô men
màu, (d) k∏t cßu Gabor, (e) mô men Wavelet, (f) GIST . . . . . . . 56
2.5 (a) Phân bË d˙ liªu ∞c tr˜ng l˜Òc Á HSV (chu©n hoá 3 ) thành
ph¶n 5 gÁm 97.45% thuÎc [-1,1]. (b) Phân bË d˙ liªu ∞c tr˜ng l˜Òc
Á HSV (chu©n hoá 3 FCM ) thành ph¶n 5 gÁm 99.81% thuÎc
[-1,1] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
2.6 (a) Phân bË d˙ liªu ∞c tr˜ng autoCorrelogram (chu©n hoá 3 )
thành ph¶n 5 gÁm 98.02% thuÎc [-1,1]. (b) Phân bË d˙ liªu ∞c
tr˜ng autoCorrelogram (chu©n hoá 3 FCM ) thành ph¶n 5 gÁm
99.9955% thuÎc [-1,1] . . . . . . . . . . . . . . . . . . . . . . . . . . 57
2.7 (a) Phân bË d˙ liªu ∞c tr˜ng mô men màu (chu©n hoá 3 ) thành
ph¶n 5 gÁm 99.68% thuÎc [-1,1]. (b) Phân bË d˙ liªu ∞c tr˜ng mô
men màu (chu©n hoá 3 FCM ) thành ph¶n 5 gÁm 100% thuÎc
[-1,1] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
viii
2.8 (a) Phân bË d˙ liªu ∞c tr˜ng k∏t cßu Gabor(chu©n hoá 3 ) thành
ph¶n 5 gÁm 98.1% thuÎc [-1,1]. (b) Phân bË d˙ liªu ∞c tr˜ng k∏t
cßu Gabor (chu©n hoá 3 FCM ) thành ph¶n 5 gÁm 99.95% thuÎc
[-1,1] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
2.9 (a) Phân bË d˙ liªu ∞c tr˜ng bßt bi∏n Wavelet(chu©n hoá 3 )
thành ph¶n 5 gÁm 99.5% thuÎc [-1,1]. (b) Phân bË d˙ liªu ∞c
tr˜ng bßt bi∏n Wavelet (chu©n hoá 3 FCM ) thành ph¶n 5 gÁm
100% thuÎc [-1,1] . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
2.10 (a) Phân bË d˙ liªu ∞c tr˜ng hình d§ng GIST (chu©n hoá 3 )
thành ph¶n 5 gÁm 98.8% thuÎc [-1,1]. (b) Phân bË d˙ liªu ∞c
tr˜ng hình d§ng GIST (chu©n hoá 3 FCM ) thành ph¶n 5 gÁm
99.9985% thuÎc [-1,1] . . . . . . . . . . . . . . . . . . . . . . . . . . 59
2.11 So sánh chßt l˜Òng truy vßn. (a) Hiªu n´ng Precision/Recall. (b)
Hiªu n´ng Î chính xác. . . . . . . . . . . . . . . . . . . . . . . . . 60
2.12 Trung bình Î chính xác cıa kˇ thu™t ∑ xußt trên top k k∏t qu£
theo n´m vòng cıa ph£n hÁi liên quan . . . . . . . . . . . . . . . . 63
2.13 So sánh trung bình Î chính xác cıa kˇ thu™t ∑ xußt và PowerTool
trên các top k k∏t qu£. . . . . . . . . . . . . . . . . . . . . . . . . 64
2.14 So sánh trung bình Î chính xác cıa kˇ thu™t ∑ xußt và PowerTool
trên top 20 k∏t qu£ theo m˜Ìi vòng cıa ph£n hÁi liên quan . . . . 66
2.15 Bi∫u Á Precision và Recall cıa kˇ thu™t ∑ xußt và PowerTool . . 67
3.1 Hª thËng ∑ xußt . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
3.2 Minh ho§ không gian tìm ki∏m EQ . . . . . . . . . . . . . . . . . . 74
3.3 MÎt miêu t£ Pareto front . . . . . . . . . . . . . . . . . . . . . . . . 76
3.4 Minh ho§ hai m˘c Î sâu là PF1
và PF2
cıa không gian EQ . . . . 78
3.5 Trung bình Î chính xác (Precision) trên k∏t qu£ top k cıa ∑
xußt Pareto-AdaBoost trên ba t™p d˙ liªu theo n´m vòng ph£n hÁi
liên quan. (a) Db1. (b) Db2. (c) Db3. . . . . . . . . . . . . . . . . . 91
3.6 Trung bình Î chính xác (Precision) trên k∏t qu£ top k cıa ∑
xußt Pareto-SVM trên ba t™p d˙ liªu theo n´m vòng ph£n hÁi liên
quan. (a) Db1. (b) Db2. (c) Db3. . . . . . . . . . . . . . . . . . . . 92
3.7 So sánh Î chính xác trên các k∏t qu£ top k cıa kˇ thu™t ∑ xußt
Pareto-AdaBoost vÓi các kˇ thu™t cÏ s trên ba t™p d˙ liªu. (a) T™p
d˙ liªu Db1. (b) T™p d˙ liªu Db2. (c) T™p d˙ liªu Db3. . . . . . . . 94
3.8 So sánh Î chính xác trên các k∏t qu£ top k cıa kˇ thu™t ∑ xußt
Pareto-SVM vÓi các kˇ thu™t cÏ s trên ba t™p d˙ liªu. (a) T™p d˙
liªu Db1. (b) T™p d˙ liªu Db2. (c) T™p d˙ liªu Db3. . . . . . . . . . 94
3.9 Á th‡ Î chính xác (Precision) và hÁi t˜ng (Recall) cıa các ph˜Ïng
pháp Pareto-AdaBoost, SVM, AdaBoost và MARS trên t™p d˙ liªu.
(a) T™p d˙ liªu Db1. (b) T™p d˙ liªu Db2. (c) T™p d˙ liªu Db3. . . 95
3.10 Á th‡ Î chính xác (Precision) và hÁi t˜ng (Recall) cıa các ph˜Ïng
pháp Pareto-SVM, SVM, AdaBoost và MARS trên t™p d˙ liªu Db1,
Db2 và Db3. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
A.1 Các £nh ví dˆ t¯ cÏ s d˙ liªu Corel . . . . . . . . . . . . . . . . . 112
ix
A.2 MÎt £nh m®u t¯ mÈi lÓp cıa 10 lÓp cıa cÏ s d˙ liªu Wang . . . . 113
A.3 MÈi m®u cho mÎt chı ∑ trong sË 101 chı ∑ trong cÏ s d˙ liªu
£nh Caltech 101 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
A.4 Các m®u cıa cÏ s d˙ liªu Wang, các chı ∑ ng˙ nghæa : bi∫n, Châu
Phi, hoa hÁng, khıng long, ng¸a, núi, th˘c ´n, di tích, voi, xe bu˛t.
MÈi dòng mÎt chı ∑, ví dˆ mÈi chı ∑ 5 £nh t˜Ïng ˘ng t¯ trên
xuËng d˜Ói. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
A.5 Toàn bÎ 55 £nh truy vßn ˜Òc s˚ dˆng trong ánh giá ground truth.
MÈi dòng cho bi∏t các truy vßn khác nhau cho cùng c£nh ‡a danh.
L˜u ˛ s¸ thay Íi lÓn v∑ ph§m vi cıa các vùng truy vßn và thay
Íi v‡ trí, ánh sáng, v.v cıa chính các £nh. . . . . . . . . . . . . . . 119
B.1 ˜a mÎt £nh vào hª thËng tra c˘u ∑ xußt. . . . . . . . . . . . . . 120
B.2 K∏t qu£ tra c˘u khi t§o cıa top 20 . . . . . . . . . . . . . . . . 121
B.3 K∏t qu£ tra c˘u top 20 vòng ph£n hÁi th˘ nhßt . . . . . . . . . . 121
B.4 K∏t qu£ tra c˘u top 20 vòng ph£n hÁi th˘ hai . . . . . . . . . . . 122
B.5 K∏t qu£ tra c˘u top 20 vòng ph£n hÁi th˘ ba . . . . . . . . . . . 122
B.6 ˜a vào hª thËng mÎt truy vßn . . . . . . . . . . . . . . . . . . . . 123
B.7 K∏t qu£ tra c˘u khi t§o top 20. . . . . . . . . . . . . . . . . . . 123
B.8 K∏t qu£ tra c˘u top 20 vòng ph£n hÁi th˘ nhßt . . . . . . . . . . 124
B.9 K∏t qu£ tra c˘u top 20 vòng ph£n hÁi th˘ hai . . . . . . . . . . . 124
B.10 K∏t qu£ tra c˘u top 20 vòng ph£n hÁi th˘ ba . . . . . . . . . . . 124
B.11 K∏t qu£ tra c˘u top 20 vòng ph£n hÁi th˘ t˜ . . . . . . . . . . . 125
x
Danh sách b£ng
2.1 B£ng mÎt sË £nh theo nh™n ‡nh chı quan cıa ng˜Ìi dùng so sánh
v∑ t˜Ïng t¸ ng˙ nghæa vÓi truy vßn Q = 710.jpg. Các £nh n¨m trong
t™p Wang . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
2.2 Î o kho£ng cách cıa £nh truy vßn 710.jpg Ëi vÓi các £nh t™p
NB+
, NB và NB⇠
. K˛ hiªu các cÎt (d1), (d2), (d3), (d4), (d5),
(d6) là kho£ng cách t˜Ïng ˘ng cıa các bÎ ∞c tr˜ng l˜Òc Á màu
HSV, t¸ t˜Ïng quan màu, mô men màu, k∏t cßu Gabor, mô men
Wavelet và GIST theo các hàm kho£ng cách ; D là kho£ng cách
toàn bÎ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
2.3 Î o kho£ng cách L2 cıa £nh truy vßn 710.jpg Ëi vÓi các £nh
trong t™p NB+
, NB và NB⇠
. . . . . . . . . . . . . . . . . . . . . 50
2.4 Các miêu t£ £nh và hàm kho£ng cách s˚ dˆng trong th¸c nghiªm. . 50
2.5 Tham sË phân cˆm FCM . . . . . . . . . . . . . . . . . . . . . . . . 55
2.6 Các Ëi t˜Òng cıa t™p AGRt trên sáu l¶n l∞p ph£n hÁi Ëi vÓi £nh
truy vßn Q = 710.jpg . . . . . . . . . . . . . . . . . . . . . . . . . . 60
2.7 ThËng kê trÂng sË kho£ng cách t¯ng bÎ ∞c tr˜ng wt theo mÈi l¶n
l∞p Ëi vÓi mÎt sË £nh truy vßn . . . . . . . . . . . . . . . . . . . . 61
2.8 Trung bình Î chính xác (Precision) top k k∏t qu£ trên 10 vòng
ph£n hÁi liên quan Ëi vÓi t™p d˙ liªu Wang cıa kˇ thu™t ∑ xußt . 63
2.9 Trung bình Î hÁi t˜ng (Recall) top k k∏t qu£ trên 10 vòng ph£n
hÁi liên quan Ëi vÓi t™p d˙ liªu Wang cıa kˇ thu™t ∑ xußt . . . . 64
2.10 Trung bình Î chính xác (Precision) top k k∏t qu£ trên 10 vòng
ph£n hÁi liên quan Ëi vÓi t™p d˙ liªu Wang cıa PowerTool (MARS) 65
2.11 Trung bình Î hÁi t˜ng (Recall) top k k∏t qu£ trên 10 vòng ph£n
hÁi liên quan Ëi vÓi t™p d˙ liªu Wang cıa PowerTool (MARS) . . 65
3.1 Kho£ng cách gi˙a Q và o1, o2, o3 trong các ∞c tr˜ng màu s≠c và
k∏t cßu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
3.2 Các miêu t£ £nh và hàm kho£ng cách s˚ dˆng trong th¸c nghiªm. . 87
3.3 Các tham sË s˚ dˆng trong th¸c nghiªm. . . . . . . . . . . . . . . . 89
3.4 SË ˘ng viên Pareto theo top k Ëi vÓi Db1 . . . . . . . . . . . . . 90
3.5 SË ˘ng viên Pareto theo top k Ëi vÓi Db2 . . . . . . . . . . . . . 90
3.6 SË ˘ng viên Pareto theo top k Ëi vÓi Db3 . . . . . . . . . . . . . 91
3.7 Trung bình Î chính xác top k k∏t qu£ cıa ∑ xußt Pareto-
AdaBoost trên n´m vòng ph£n hÁi liên quan Ëi vÓi t™p d˙ liªu
Db1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
xi
3.8 Trung bình Î chính xác top k k∏t qu£ cıa ∑ xußt Pareto-
AdaBoost trên n´m vòng ph£n hÁi liên quan Ëi vÓi t™p d˙ liªu
Db2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
3.9 Trung bình Î chính xác top k k∏t qu£ cıa ∑ xußt Pareto-
AdaBoost trên n´m vòng ph£n hÁi liên quan Ëi vÓi t™p d˙ liªu
Db3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
3.10 Trung bình Î chính xác top k k∏t qu£ cıa ∑ xußt Pareto-SVM
trên n´m vòng ph£n hÁi liên quan Ëi vÓi t™p d˙ liªu Db1 . . . . . 93
3.11 Trung bình Î chính xác top k k∏t qu£ cıa ∑ xußt Pareto-SVM
trên n´m vòng ph£n hÁi liên quan Ëi vÓi t™p d˙ liªu Db2 . . . . . 93
3.12 Trung bình Î chính xác top k k∏t qu£ cıa ∑ xußt Pareto-SVM
trên n´m vòng ph£n hÁi liên quan Ëi vÓi t™p d˙ liªu Db3 . . . . . 93
A.1 Danh sách 10 chı ∑ cıa cÏ s d˙ liªu Wang . . . . . . . . . . . . . 114
A.2 Danh sách 101 chı ∑ cıa cÏ s d˙ liªu Caltech 101 . . . . . . . . . 115
A.3 Danh sách 17 chı ∑ cıa cÏ s d˙ liªu Oxford Buildings . . . . . . . 116
xii
M ¶u
Tính cßp thi∏t cıa ∑ tài
S¸ phát tri∫n m§nh m≥ cıa Internet cho phép dπ dàng xây d¸ng, l˜u tr˙ các
cÏ s d˙ liªu lÓn. MÎt trong sË ó là Flickr 1
, YouTube 2
, Facebook 3
, Twitter 4
và
toàn bÎ m§ng Internet. Yêu c¶u khai thác mÎt cách hiªu qu£ d˙ liªu a ph˜Ïng
tiªn trên thúc ©y s¸ quan tâm cıa cÎng Áng nghiên c˘u [21]. Nhi∑u hª thËng
tìm ki∏m thông tin v´n b£n và £nh nh˜ Google 5
, Bing 6
, Yahoo 7
ã ˜Òc phát
tri∫n m§nh m≥ trong nh˙ng n´m g¶n ây nh˜ng v®n ch˜a áp ˘ng ˜Òc nhu c¶u
ng˜Ìi dùng. S¸ phát tri∫n m§nh m≥ cıa d˙ liªu a ph˜Ïng tiªn ngày càng tr
thành mÎt thách th˘c lÓn. Khi kích th˜Óc cıa kho £nh rßt lÓn cách ti∏p c™n tra
c˘u b¨ng t¯ khóa tr nên không kh£ thi d®n tÓi các nghiên c˘u khai thác tra c˘u
d¸a trên nÎi dung d˙ liªu £nh.
Tra c˘u £nh d¸a vào nÎi dung (Content-based image retrieval) hay gÂi t≠t là
CBIR ˜Òc giÓi thiªu bi các nghiên c˘u t¯ nh˙ng n´m 1980. CBIR ã ˜Òc ã
˜Òc nghiên c˘u rÎng rãi, nhi∑u ph˜Ïng pháp và hª thËng ã ˜Òc phát tri∫n ∫
trích rút nÎi dung cıa £nh b¨ng cách s˚ dˆng các ∞c tr˜ng m˘c thßp . D˙ liªu
trong CBIR ˜Òc lßy trên cÏ s các nÎi dung mà nó trích rút b¨ng cách s˚ dˆng
1. https://www.flickr.com/
2. https://www.youtube.com
3. https://www.facebook.com/
4. https://twitter.com/
5. http://www.google.com
6. https://www.bing.com/
7. https://vn.yahoo.com/?p=us
1
2
các kˇ thu™t trích rút ∞c tr˜ng m˘c thßp bên trong cıa mÈi £nh (màu s≠c, hình
d§ng, k∏t cßu, vv).
Tuy CBIR có nhi∑u ti∏n bÎ song ng˜Ìi dùng v®n g∞p khó kh´n trong viªc
tìm ki∏m thông tin liên quan t¯ t™p d˙ liªu £nh lÓn không Áng nhßt v∑ m∞t nÎi
dung và ng˙ nghæa. i∑u này d®n ∏n k∏t qu£ tìm ki∏m ch˜a §t ˜Òc nh˜ mong
muËn. Thông tin mà máy tính hi∫u nÎi dung £nh th˜Ìng là các giá tr‡ i∫m £nh,
vector ∞c tr˜ng ˜Òc trích rút theo các thı tˆc,... còn con ng˜Ìi hi∫u v∑ nÎi dung
cıa £nh th˜Ìng là các khái niªm ng˙ nghæa. Do không có s¸ t˜Ïng quan mÎt cách
chính xác gi˙a nÎi dung mà máy tính có ˜Òc thông qua ∞c tr˜ng tr¸c quan m˘c
thßp vÓi nÎi dung mà con ng˜Ìi hi∫u thông qua các khái niªm ng˙ nghæa m˘c
cao d®n ∏n kho£ng trËng ng˙ nghæa. Kho£ng trËng ng˙ nghæa ‡nh nghæa theo
Smeulders và cÎng s¸ [94] nh˜ sau :
“Kho£ng trËng ng˙ nghæa là s¸ không t˜Ïng Áng gi˙a thông tin £nh, ˜Òc
trích rút t¯ d˙ liªu tr¸c quan so vÓi diπn gi£i v∑ d˙ liªu £nh ó bi ng˜Ìi dùng
trong tình huËng cˆ th∫ ”.
Kho£ng trËng ng˙ nghæa n¨m gi˙a các ∞c tr˜ng tr¸c quan m˘c thßp cıa các
£nh và các ng˙ nghæa m˘c cao mong muËn d¸ ‡nh suy ra t¯ các ∞c tr˜ng tr¸c
quan m˘c thßp. Nhi∑u nghiên c˘u trong lænh v¸c CBIR ∏n nay v®n ang cË g≠ng
thu hµp kho£ng trËng ng˙ nghæa này. Cˆ th∫, hÏn ba th™p kø qua nhi∑u hª thËng
CBIR ã ˜Òc phát tri∫n, bao gÁm QBIC [28], Photobook [80], MARS [79], [83],
[90], PicHunter [17], VisualSEEK [96], Blobworld [11], MindReader [46], SIMPLI-
city [110], FIRE [23], và các nghiên c˘u khác [12], [41], [60], [115], [124].
Mˆc tiêu, ph§m vi nghiên c˘u cıa lu™n án
Thông th˜Ìng mÎt hª thËng tra c˘u £nh d¸a vào nÎi dung ˜Òc miêu t£ nh˜
Hình 0.1 [62]. Các nÎi dung tr¸c quan cıa các £nh trong cÏ s d˙ liªu ˜Òc trích
rút và miêu t£ bi các vector ∞c tr˜ng nhi∑u chi∑u. Các vector ∞c tr˜ng cıa các
3
£nh trong cÏ s d˙ liªu t§o nên mÎt cÏ s d˙ liªu ∞c tr˜ng. ∫ tra c˘u các £nh,
thông tin truy vßn cıa ng˜Ìi dùng ˜a vào hª thËng tra c˘u có th∫ là các £nh
m®u ho∞c v≥ phác th£o. Hª thËng sau ó s≥ bi∏n Íi nh˙ng m®u này t˜Ïng ˘ng
vÓi bi∫u diπn cıa các vector ∞c tr˜ng. Các Î t˜Ïng t¸ ho∞c các kho£ng cách gi˙a
các vector ∞c tr˜ng cıa £nh truy vßn vÓi các £nh trong cÏ s d˙ liªu ˜Òc tính
và tra c˘u ˜Òc th¸c hiªn d¸a trên mÎt l˜Òc Á chø sË. L˜Òc Á chø sË ˜a ra mÎt
cách hiªu qu£ ∫ tìm ki∏m các £nh trong cÏ s d˙ liªu. Qua kh£o sát nhi∑u nhiên
Hình 0.1. Hª thËng tra c˘u £nh d¸a vào nÎi dung.
c˘u CBIR, s¸ k∏t hÒp a ∞c tr˜ng ch˜a ˜Òc xem xét mÎt cách ¶y ı d®n ∏n
viªc so sánh Î t˜Ïng t¸ §t hiªu qu£ ch˜a cao. Trong hª thËng này ánh chø sË
và tra c˘u s˚ dˆng k∏t hÒp a ∞c tr˜ng cÙng c¶n ˜Òc nghiên c˘u ∫ nâng cao
hiªu qu£ tra c˘u. ∫ nâng cao k∏t qu£ tra c˘u chính xác  ¶u ra, lu™n án ˜a ra
các mˆc tiêu và giÓi h§n ph§m vi nghiên c˘u nh˜ sau.
Mˆc tiêu cıa lu™n án
So sánh Î t˜Ïng t¸ : Nghiên c˘u và ∑ xußt chu©n hoá ∞c tr˜ng, chu©n hoá
kho£ng cách ∫ nâng cao hiªu qu£ so sánh Î t˜Ïng t¸.
Ph£n hÁi liên quan : Nghiên c˘u và ∑ xußt kˇ thu™t hiªu chønh trÂng sË và
d‡ch chuy∫n truy vßn.
4
ánh chø sË và tra c˘u : Tßt c£ các £nh trong cÏ s d˙ liªu vector ∞c tr˜ng
˜Òc tính toán tr˜Óc và l˜u tr˙ trong hª qu£n tr‡ cÏ s d˙ liªu. Rút gÂn không
gian tìm ki∏m s˚ dˆng ti∏p c™n tËi ˜u Pareto ∫ l¸a chÂn t™p ˘ng viên tËt nhßt
t¯ cÏ s d˙ liªu. Tra c˘u ˜a ra “top” k∏t qu£ các £nh có kho£ng cách cıa vector
∞c tr˜ng nh‰ nhßt ho∞c ˜Òc d¸ báo x∏p h§ng cao nhßt vÓi £nh truy vßn.
Ph§m vi nghiên c˘u cıa lu™n án
S˚ dˆng mÎt sË t™p £nh chu©n ˜Òc s˚ dˆng nhi∑u trong các nghiên c˘u v∑
CBIR. Xây d¸ng cÏ s d˙ liªu ∞c tr˜ng d¸a trên mÎt sË ph˜Ïng pháp trích rút
∞c tr˜ng tËt ã có. Cài ∞t th¸c nghiªm cho các ∑ xußt. So sánh và ánh giá
hiªu n´ng v∑ m∞t Î chính xác thông qua t™p k∏t qu£ tra c˘u.
Ph˜Ïng pháp và nÎi dung nghiên c˘u
Ph˜Ïng pháp nghiên c˘u là k∏t hÒp gi˙a nghiên c˘u l˛ thuy∏t và th¸c nghiªm.
CÏ s d˙ liªu và thông tin khoa hÂc ˜Òc thu th™p, tÍng hÒp t¯ các t§p chí khoa
hÂc chuyên ngành trong và ngoài n˜Óc, qua Xêmina ho∞c tham gia báo cáo t§i các
hÎi th£o khoa hÂc, qua trao Íi vÓi th¶y h˜Óng d®n và các Áng nghiªp cùng lænh
v¸c nghiên c˘u,...
Lu™n án tÍng hÒp các thông tin liên quan trong lænh v¸c CBIR, l¸a chÂn các
cách ti∏p c™n ã ˜Òc áp dˆng thành công, ti∏n hành th˚ nghiªm vÓi các t™p d˙
liªu £nh chu©n trong các bài báo khoa hÂc và ánh giá k∏t qu£.
NÎi dung nghiên c˘u trong lu™n án gÁm :
(1) Nghiên c˘u tÍng quan v∑ tra c˘u £nh d¸a vào nÎi dung.
(2) Nghiên c˘u cách k∏t hÒp nhi∑u ∞c tr˜ng trong hª thËng CBIR t¯ ó phát
hiªn các quy lu™t, ràng buÎc cÏ b£n cıa k∏t hÒp nhi∑u ∞c tr˜ng.
5
(3) Nghiên c˘u mÎt sË kˇ thu™t gi£m kho£ng trËng ng˙ nghæa trong CBIR.
K∏t qu£ §t ˜Òc cıa lu™n án
Lu™n án ã có nh˙ng óng góp chính nh˜ sau :
∑ xußt chu©n hoá c£i ti∏n phù hÒp vÓi d˙ liªu th¸c t∏ trong tra c˘u £nh d¸a
vào nÎi dung, cho phép nâng cao hiªu qu£ Ëi sánh Î t˜Ïng t¸ d¸a vào ∞c tr˜ng
m˘c thßp cıa các £nh trong hª thËng tra c˘u trong công trình [CT6].
∑ xußt kˇ thu™t hiªu chønh trÂng sË Î t˜Ïng t¸ và d‡ch chuy∫n truy vßn
d¸a vào thông tin ph£n hÁi cıa ng˜Ìi dùng trong công trình [CT6].
∑ xußt s˚ dˆng tËi ˜u Pareto xây d¸ng t™p ˘ng viên ∫ nâng cao Î chính
xác cıa hª thËng CBIR trên không gian k∏t hÒp a ∞c tr˜ng trong công trình
[CT7].
Mô hình tÍng quát cho các ∑ xußt cıa lu™n án trong Hình 0.2 ˜Òc mô t£
nh˜ sau :
(1) ∞c tr˜ng £nh cıa truy vßn và các ∞c tr˜ng £nh cıa các £nh cÏ s d˙
liªu ˜Òc chu©n hoá theo ∑ xußt chu©n hoá ∞c tr˜ng.
(2) Î t˜Ïng t¸ cıa các £nh trong cÏ s d˙ liªu vÓi £nh truy vßn ˜Òc tính
toán d¸a vào các vector ∞c tr˜ng ã ˜Òc chu©n hoá. Các £nh ˜Òc x∏p h§ng
theo Î t˜Ïng t¸ gi£m d¶n. T™p £nh k∏t qu£ hi∫n th‡ top k (t™p gÁm k £nh có
th˘ h§ng t˜Ïng t¸ cao nhßt Ëi vÓi £nh truy vßn). Trên k∏t qu£ top k ng˜Ìi
dùng ánh giá m˘c Î liên quan theo nh™n th˘c. ây là ¶u vào cıa ∑ xußt hiªu
chønh trÂng sË và d‡ch chuy∫n truy vßn, k∏t qu£ ¶u ra là t™p các trÂng sË cho
mÈi bÎ ∞c tr˜ng.
(3) Î t˜Ïng t¸ các £nh trong cÏ s d˙ liªu so vÓi £nh truy vßn ˜Òc tính l§i
d¸a vào hàm kho£ng cách k∏t hÒp bÎ trÂng sË v¯a thu ˜Òc.
6
Hình 0.2. Hª thËng ∑ xußt
(4) Xây d¸ng t™p ˘ng viên Pareto ∫ gi£m không gian tìm ki∏m.
(5) T™p hußn luyªn là các £nh ˜Òc ánh giá trong t™p k∏t qu£ top k. T™p
ki∫m tra là t™p ˘ng viên Pareto.
(6) Tìm hàm phân lÓp d¸a vào thông tin ¶u vào là t™p hußn luyªn và t™p
ki∫m tra b¨ng mÎt máy phân lÓp.
(7) S≠p x∏p các £nh trong t™p ki∫m tra theo giá tr‡ d¸ báo phân lÓp. T™p k∏t
qu£ hi∫n th‡ gÁm top k £nh có th˘ h§ng giá tr‡ d¸ báo phân lÓp cao nhßt.
(8) Ph£n hÁi liên quan : S˚ dˆng thông tin ánh giá cıa ng˜Ìi dùng liên quan
ho∞c không liên quan trên t™p k∏t qu£ top k. D¸a trên các £nh ˜Òc ánh giá,
7
hª thËng hiªu chønh trÂng sË, d‡ch chuy∫n truy vßn và Î t˜Ïng t¸ s≥ ˜Òc c™p
nh™t l§i. Quá trình ˜Òc l∞p l§i t¯ b˜Óc tìm t™p ˘ng viên Pareto.
Các nghiên c˘u cıa lu™n án ã ˜Òc công bË trong các công trình ˜a ra 
cuËi cıa lu™n án, óng góp cho các ∑ tài cßp cÏ s Viªn CNTT, mã sË CS’16.03,
CS’14.03 và ∑ tài cßp Viªn Hàn lâm Khoa hÂc và Công nghª Viªt Nam, mã sË
VAST01.07/15-16.
Cßu trúc cıa lu™n án
Ch˜Ïng 1 giÓi thiªu ki∏n th˘c tÍng quan bao gÁm : GiÓi thiªu mÎt sË ∞c
tr˜ng và s¸ k∏t hÒp a ∞c tr˜ng th˜Ìng ˜Òc s˚ dˆng trong mÎt sË nghiên c˘u
tiêu bi∫u v∑ CBIR. GiÓi thiªu và phân tích mÎt sË kˇ thu™t chu©n hoá ∞c tr˜ng,
chu©n hoá kho£ng cách. GiÓi thiªu và phân tích mÎt sË kˇ thu™t gi£i quy∏t bài
toán kho£ng trËng ng˙ nghæa nh˜ kˇ thu™t hiªu chønh trÂng sË, d‡ch chuy∫n truy
vßn s˚ dˆng thông tin ph£n hÁi liên quan, mÎt sË kˇ thu™t máy hÂc.
Ch˜Ïng 2 ∑ xußt chu©n hoá ∞c tr˜ng c£i ti∏n d¸a theo chu©n hoá Gauss.
∑ xußt kˇ thu™t hiªu chønh trÂng sË và d‡ch chuy∫n truy vßn d¸a vào thông tin
ph£n hÁi cıa ng˜Ìi dùng.
Ch˜Ïng 3 ∑ xußt rút gÂn t™p ˘ng viên nh¨m gi£m không gian tìm ki∏m d¸a
vào ti∏p c™n tËi ˜u Pareto vÓi các tiêu chí l¸a chÂn là không gian a ∞c tr˜ng.
T™p các £nh liên quan theo ph£n hÁi cıa ng˜Ìi dùng ˜Òc s˚ dˆng ∫ hiªu chønh
l§i t™p Pareto ∫ phù hÒp vÓi nhu c¶u tìm ki∏m cıa chính ng˜Ìi dùng, cho phép
nâng cao Î chính xác phân lÓp trong CBIR.
CuËi cùng là ph¶n K∏t lu™n và h˜Óng phát tri∫n, tÍng hÒp các k∏t qu£ chính
cıa lu™n án và mÎt sË khuy∏n ngh‡ nghiên c˘u t˜Ïng lai.
Ch˜Ïng 1
TÍng quan v∑ Tra c˘u £nh d¸a
vào nÎi dung
VÓi s¸ gia t´ng nhanh chóng sË l˜Òng d˙ liªu £nh sË, CBIR tr thành lænh v¸c
nghiên c˘u dành ˜Òc nhi∑u s¸ quan tâm trong nhi∑u n´m qua, gÁm rßt nhi∑u các
nghiên c˘u nh˜ [12], [46], [64], [80], [88], [90], [91], [115], [124]. Các hª thËng này
th˜Ìng trích rút các bi∫u diπn tr¸c quan cıa £nh và ‡nh nghæa các hàm tìm ki∏m,
Ëi sánh mËi liên quan khi tra c˘u áp ˘ng yêu c¶u ng˜Ìi dùng. ∫ c£i thiªn hiªu
n´ng tra c˘u, các kˇ thu™t hÂc máy hiªu qu£ ã ˜Òc s˚ dˆng trong phân lÓp
theo truy vßn [18], [22], [54], [112]. MÎt hª thËng CBIR gÁm các thành ph¶n cÏ
b£n mô t£ trong sÏ Á Hình 0.1. NÎi dung cıa ch˜Ïng s≥ nghiên c˘u mÎt sË thành
ph¶n cÏ b£n nh˜ trích rút ∞c tr˜ng, chu©n hoá, ph£n hÁi liên quan. Bên c§nh ó
ch˜Ïng s≥ phân tích mÎt sË nghiên c˘u liên quan, nh˙ng y∏u tË £nh h˜ng ∏n
hiªu qu£ hª thËng CBIR.
Mˆc 1.1 giÓi thiªu mÎt sË ∞c tr˜ng £nh s˚ dˆng trong hª thËng CBIR. ∫
s˚ dˆng hiªu qu£ các ∞c tr˜ng, trong Mˆc 1.2 giÓi thiªu mÎt sË hª thËng CBIR
s˚ dˆng k∏t hÒp a ∞c tr˜ng. Mˆc 1.3 giÓi thiªu và phân tích mÎt sË ph˜Ïng
pháp chu©n hoá th˜Ìng ˜Òc s˚ dˆng trong CBIR cho ∞c tr˜ng và giá tr‡ kho£ng
cách. Kho£ng trËng ng˙ nghæa ˜Òc trình bày trong Mˆc 1.4. MÎt sË kˇ thu™t
8
9
gi£m kho£ng trËng ng˙ nghæa ˜Òc trình bày trong các Mˆc 1.5, 1.6, 1.7 và 1.8.
Mˆc 1.9 trình bày ph˜Ïng pháp ánh giá hiªu n´ng cıa hª thËng CBIR s˚ dˆng
trong các ∑ xußt  Ch˜Ïng 2 và Ch˜Ïng 3.
1.1 MÎt sË ∞c tr˜ng £nh th˜Ìng s˚ dˆng trong
tra c˘u £nh d¸a vào nÎi dung
Trong CBIR, trích rút ∞c tr˜ng nh¨m chuy∫n Íi mÈi £nh ¶u vào thành
mÎt t™p các ∞c tr˜ng (thông th˜Ìng d˜Ói hình th˘c vector ∞c tr˜ng). Các ∞c
tr˜ng m˘c thßp ˜Òc trích rút mÎt cách t¸ Îng d¸a trên các thuÎc tính khác
nhau (màu s≠c, k∏t cßu, hình d§ng, v.v.) cıa chính £nh ó. Tr˜Óc khi trích rút
∞c tr˜ng, các £nh ˜Òc ti∑n x˚ l˛ (chuy∫n Íi không gian màu, gi£m nhiπu, l˜Òng
t˚ hoá, v.v.). Các ∞c tr˜ng s≥ mang ¶y ı thông tin v∑ £nh, viªc tìm các ∞c
tr˜ng liên quan bi∫u diπn nÎi dung tr¸c quan cıa các £nh trong mÎt cÏ s d˙ liªu
lÓn v®n ang là mÎt nhiªm vˆ thách th˘c. L¸a chÂn ∞c tr˜ng tu˝ thuÎc vào cÏ
s d˙ liªu £nh, tu˝ thuÎc ˘ng dˆng và cÙng nh˜ tu˝ thuÎc vào mong muËn cıa
ng˜Ìi dùng. Các ∞c tr˜ng có th∫ bi∫u diπn toàn cˆc (cho toàn bÎ £nh), cˆc bÎ
(cho mÎt vùng ∞c biªt cıa £nh) ho∞c các ti∏p c™n không gian.
1.1.1 Miêu t£ toàn cˆc
L˜Òc Á màu
∞c tr˜ng này ˜Òc s˚ dˆng trong nhi∑u hª thËng CBIR nh˜ QBIC [72],
MARS [79], [83], [90], PicHunter [17], VisualSEEK [96], v.v. L˜Òc Á màu th˜Ìng
˜Òc bi∏t d˜Ói d§ng mÎt vector n chi∑u [h1, ..., hn], trong ó hj là sË i∫m £nh có
màu j trong £nh và n là sË các giá tr‡ màu. Nh˜ v™y, l˜Òc Á màu bi∫u diπn phân
bË cıa các màu trong £nh.
10
Các mô men màu
Gi£ ‡nh màu trong mÎt £nh có th∫ theo mÎt phân phËi xác sußt nhßt ‡nh.
Khi ó, các mô men phân phËi màu s≥ ˜Òc s˚ dˆng nh˜ các ∞c tr˜ng màu cıa
£nh. Stricker và Orengo [97] ‡nh nghæa các mô men màu khác nhau cho mÈi kênh
màu trong £nh.
T˜Ïng quan màu
T˜Ïng quan màu nói ∏n t˜Ïng quan không gian cıa các c∞p màu trong £nh
[45]. Trong [74], [84] ã s˚ dˆng ∫ trích rút ∞c tr˜ng £nh s˚ dˆng cho CBIR.
T˜Ïng t¸ l˜Òc Á màu và các mô men màu, t˜Ïng quan màu có th∫ s˚ dˆng cho
các lo§i không gian màu khác nhau.
∞c tr˜ng k∏t cßu
∞c tr˜ng k∏t cßu ˜Òc s˚ dˆng rÎng rãi trong CBIR, ph£n ánh cßu trúc
không gian, b∑ m∞t,... Có th∫ ‡nh nghæa mÎt vùng k∏t cßu nh˜ mÎt vùng có
c˜Ìng Î không Áng nhßt. Các ∞c tr˜ng k∏t cßu cÙng là các ∞c tr˜ng tr¸c quan
quan trÂng cıa £nh. ChØng h§n, con hÍ và con báo không th∫ phân biªt n∏u chø
s˚ dˆng màu s≠c và hình d§ng. Các ∞c tr˜ng k∏t cßu là c¶n thi∏t trong tr˜Ìng
hÒp này.
Có th∫ chia bi∫u diπn k∏t cßu thành ph˜Ïng pháp cßu trúc và ph˜Ïng pháp
thËng kê. Các ph˜Ïng pháp cßu trúc miêu t£ k∏t cßu b¨ng cách xác ‡nh tính b£n
chßt ho∞c các m®u cÏ b£n (nh˜ là các ˜Ìng tròn, hình lˆc giác, hình ch˙ nh™t,...)
và quy t≠c ∫ t§o nên k∏t cßu. Các ph˜Ïng pháp này có hiªu qu£ khi miêu t£ các
k∏t cßu có cßu trúc, qua ∑ c™p trong bài báo [38], [66], [105], [109]. Ph˜Ïng pháp
thËng kê miêu t£ k∏t cßu thông qua t™p thËng kê các vector ∞c tr˜ng, d¸a trên
các tính chßt nh˜ Î t˜Ïng ph£n, entropy,... ˜a ra trong [38], [39].
11
Trong [34], [56] d¸a vào nguyên l˛ k∏t cßu là s¸ l∞p i l∞p l§i cıa các chßt
liªu vÓi mÎt t¶n sußt nhßt ‡nh, ˛ t˜ng cıa ph˜Ïng pháp này là s˚ dˆng mÎt t™p
các bÎ lÂc Gabor ∫ phân tích cßu trúc cıa k∏t cßu a tø lª (t¶n sË) và a h˜Óng.
Zhang và cÎng s¸ [121] s˚ dˆng bi∏n Íi Gabor wavelet s˚ dˆng cho CBIR.
∞c tr˜ng hình d§ng
Các ∞c tr˜ng hình d§ng ˜Òc s˚ dˆng rÎng rãi trong các hª thËng CBIR
[107]. ây là ki∫u ∞c tr˜ng miêu t£ Ëi t˜Òng và vùng. Các miêu t£ hình d§ng
˜Òc trích rút, sau khi phân o§n £nh theo các Ëi t˜Òng và các vùng. Các ∞c
tr˜ng hình d§ng không phong phú b¨ng các ∞c tr˜ng màu và k∏t cßu. ∞c tr˜ng
hình d§ng ˜Òc giÓi thiªu trong bài báo [117]. Có th∫ chia chúng vào hai nhóm :
(i) Các miêu t£ ˜Ìng Áng m˘c ; (ii) Các miêu t£ vùng. Các miêu t£ ˜Ìng Áng
m˘c ˜a ra trong mÎt sË bài báo [29], [119], [122]. Các miêu t£ vùng, có th∫ bi∫u
diπn các thuÎc tính cıa toàn bÎ vùng, ˜Òc ˜a ra trong các bài báo v∑ các mô
men Hu [44], các bßt bi∏n Zernike [51].
∞c tr˜ng GIST
Oliva và Torralba [75] mô hình hoá viªc nh™n d§ng c£nh th∏ giÓi th¸c b‰ qua
phân o§n, quá trình x˚ l˛ các vùng và các Ëi t˜Òng cˆ th∫ b¨ng ∑ xußt t™p
chi∑u tr¸c quan (tính t¸ nhiên, tính rõ ràng, tính nhám, giãn n, gÁ gh∑) bi∫u diπn
cßu trúc không gian cıa mÎt c£nh. Mô hình này t§o ra mÎt không gian a chi∑u,
trong ó các c£nh liên quan tÓi các chı ∑ ng˙ nghæa (ví dˆ nh˜ ˜Ìng phË, cao
tËc, bÌ bi∫n) ˜Òc xem nh˜ g¶n nhau. Tính hiªu qu£ cıa ∞c tr˜ng GIST ã ˜Òc
ch˘ng minh trong nh™n d§ng Ëi t˜Òng [76], [103].
12
Bi∏n Íi Haar Wavelet
Bi∏n Íi Haar Wavelet là bi∏n Íi cÏ b£n t¯ mi∑n không gian sang mi∑n t¶n
sË . Haar Wavelet ˜Òc ∑ xußt bi Alfred Haar [36]. ∞c tr˜ng này ˜Òc s˚ dˆng
trong công trình [CT4].
1.1.2 Miêu t£ cˆc bÎ
Các ∞c tr˜ng cˆc bÎ hiªn nay ˜Òc s˚ dˆng rÎng rãi trong CBIR. Thay vì
tính toán d˙ liªu ∞c tr˜ng trên toàn bÎ £nh, các ph˜Ïng pháp trích rút ∞c tr˜ng
d¸a trên cách ti∏p c™n này chø miêu t£ các thuÎc tính cˆc bÎ cıa các vùng £nh
ho∞c xác ‡nh các i∫m nÍi b™t. MÈi £nh ˜Òc miêu t£ b¨ng mÎt t™p các vector
∞c tr˜ng (mÈi vector cho mÈi i∫m).
Các kˇ thu™t phát hiªn các i∫m nÍi b™t ã ˜Òc ∑ xußt trong mÎt sË nghiên
c˘u nh˜ phát hiªn Harris [40], phát hiªn Harris-Laplace [67], phát hiªn Difference
of Gaussian (DoG) [59],v.v. MÎt sË ph˜Ïng pháp tiêu bi∫u nhßt nh˜ SIFT (Scale-
Invariant Feature Transform) [63] và SURF (Speed Up Robust Features) [3]. Trong
công trình [CT5] ã ˜a ra mÎt sË ánh giá v∑ hai ∞c tr˜ng SIFT và SURF trong
hª thËng SIMPLE.
Bên c§nh s˚ dˆng các i∫m nÍi b™t, trong £nh còn có rßt nhi∑u i∫m £nh n¨m
r£i rác không t§o thành vùng Áng nhßt (vùng Áng nhßt gÁm các i∫m £nh cùng
màu và li∑n k∑ nhau). Viªc s˚ dˆng tßt c£ các i∫m £nh trong £nh (c£ các i∫m
£nh n¨m r£i rác) vào quá trình tra c˘u, Î ph˘c t§p tính toán s≥ cao và nhi∑u khi
chßt l˜Òng tra c˘u không ˜Òc c£i thiªn. Trong công trình [CT2] ã s˚ dˆng kˇ
thu™t trích rút ∞c tr˜ng d¸a trên vùng thu¶n nhßt.
13
1.2 TÍ hÒp ∞c tr˜ng trong tra c˘u £nh d¸a vào
nÎi dung
Các ki∫u ∞c tr˜ng tr¸c quan th˜Ìng ˜Òc s˚ dˆng là màu s≠c, k∏t cßu và
hình d§ng. MÎt sË bi∫u diπn cho ki∫u ∞c tr˜ng màu gÁm bÎ ∞c tr˜ng l˜Òc Á
màu và mô men màu [98], bi∫u diπn ki∫u ∞c tr˜ng k∏t cßu gÁm mÎt sË bÎ ∞c
tr˜ng nh˜ Tamura [65], [99] và ma tr™n Áng m˘c [39] . Trong [89] s˚ dˆng mÎt
sË bÎ ∞c tr˜ng k∏t hÒp : l˜Òc Á màu, mô men màu, ma trân Áng m˘c, Tamura,
miêu t£ Fourier và miêu t£ hình d§ng.
Trong [35], [96] s˚ dˆng k∏t hÒp ki∫u ∞c tr˜ng màu, k∏t cßu, hình d§ng, gÁm
các bÎ ∞c tr˜ng l˜Òc Á màu, mô men màu [98], k∏t cßu Tamura [99] và ma tr™n
Áng m˘c [39].
Trong [73] s˚ dˆng k∏t hÒp mÎt sË bÎ ∞c tr˜ng : l˜Òc Á màu, bßt bi∏n màu
và ma tr™n Áng m˘c. Trong [48] s˚ dˆng k∏t hÒp mÎt sË bÎ ∞c tr˜ng l˜Òc Á
màu, t¸ t˜Ïng quan màu, bßt bi∏n màu, lÂc Gabor và bi∏n Íi wavelet. Kˇ thu™t
phân tích k∏t cßu th˜Ìng ˜Òc s˚ dˆng cho CBIR là Haar Wavelet [50], [108]. Sau
thu™t toán bi∏n Íi nhi∑u m˘c, ∞c tr˜ng thu ˜Òc t¯ ba kênh màu b¨ng chu©n
F-norm [106].
Trong [90] Ëi vÓi t™p d˙ liªu £nh th˘ nhßt s˚ dˆng k∏t hÒp bÎ ∞c tr˜ng mô
men màu [98] cho ki∫u ∞c tr˜ng màu, bÎ ∞c tr˜ng Tamura [99], ma tr™n Áng
m˘c [73], [87] cho ki∫u ∞c tr˜ng k∏t cßu, bÎ ∞c tr˜ng miêu t£ Fourier và miêu t£
hình d§ng chamfer [89] cho ki∫u ∞c tr˜ng hình d§ng. Trên t™p d˙ liªu th˘ hai s˚
dˆng k∏t hÒp mÎt sË bÎ ∞c tr˜ng gÁm l˜Òc Á màu, mô men màu [98], ma tr™n
Áng m˘c [39], [73]. T™p ki∫u ∞c tr˜ng và bÎ ∞c tr˜ng ˜Òc miêu t£ nh˜ sau :
(1) F = {fi } là t™p ki∫u ∞c tr˜ng tr¸c quan m˘c thßp gÁm : màu, k∏t cßu,
hình d§ng.
14
(2) T = {tij } là t™p bi∫u diπn nhi∑u bÎ ∞c tr˜ng tij , trong ó mÈi bÎ ∞c
tr˜ng thuÎc vào mÎt ki∫u ∞c tr˜ng fi và tij ⌘ [tij1, ..., tijk , ..., tijM ] là vector
gÁm nhi∑u thành ph¶n.
◊u i∫m viªc s˚ dˆng tÍ hÒp ∞c tr˜ng nh¨m k∏t hÒp th∏ m§nh cıa các bÎ
∞c tr˜ng trong miêu t£ nÎi dung tr¸c quan cıa £nh.
1.3 Chu©n hoá trong CBIR
1.3.1 Mˆc ích cıa chu©n hoá
Các hª thËng CBIR s˚ dˆng tÍ hÒp ∞c tr˜ng nh˜ [90], Î t˜Ïng t¸ cıa các
£nh vÓi £nh truy vßn ˜Òc phân bÍ theo các bÎ ∞c tr˜ng tij khác nhau. Î t˜Ïng
t¸ toàn bÎ theo ki∫u k∏t hÒp tuy∏n tính trong Ph˜Ïng trình (1.1).
S =
X
i
X
j
Wij S(tij ) (1.1)
trong ó Sij là Î t˜Ïng t¸ theo bÎ ∞c tr˜ng tij , Wij là trÂng sË t˜Ïng ˘ng.
Ta bi∏t r¨ng Î o t˜Ïng t¸ ˜Òc s˚ dˆng ∫ xác ‡nh t˜Ïng t¸ ho∞c không
t˜Ïng t¸ gi˙a hai £nh. Các Î o t˜Ïng t¸ khác nhau ˜Òc s˚ dˆng cho các bi∫u
diπn ∞c tr˜ng khác nhau. Bi mÎt sË hàm t˜Ïng t¸ tr£ l§i mÎt giá tr‡ trong ph§m
vi [0,1], nh˜ kho£ng cách L1 (“giao l˜Òc Á”) [64], [95] ˜Òc s˚ dˆng cho so sánh
các bi∫u diπn l˜Òc Á màu, trong khi các hàm khác thì không nh˜ v™y. Th¸c t∏,
kho£ng cách Ã-clit (L2) ˜Òc dùng rÎng rãi nhßt nh˜ trong [57], [72], [80], [95].
MÎt sË Î o phÍ bi∏n khác ã s˚ dˆng kho£ng cách Ã-clit trÂng sË nh˜ trong
[5], [90], kho£ng cách Minkowsky Lp tÍng quát [92] và kho£ng cách Mahalanobis
trong [80], [95].
Gi£ thi∏t r¨ng các giá tr‡ Î t˜Ïng t¸ cıa mÈi bÎ ∞c tr˜ng (S(tij )) trong
ph§m vi Îng t¯ 0 tÓi 1. Theo cách k∏t hÒp tuy∏n tính nh˜ Ph˜Ïng trình (1.1) s≥
15
tr nên ít ˛ nghæa. Bi vì mÎt S(tij ) nào ó có th∫ lßn át cái khác do giá tr‡ cıa nó
lÓn. Bi l˛ do nh˜ v™y, khi tính S(tij ) các thành ph¶n vector tijk ph£i ˜Òc chu©n
hoá tr˜Óc khi tính Î o t˜Ïng t¸. Chu©n hoá các thành ph¶n tijk ˜Òc xem nh˜
chu©n hoá ∞c tr˜ng và chu©n hoá S(tij ) ˜Òc xem nh˜ chu©n hoá kho£ng cách
ho∞c Î t˜Ïng t¸.
Hình 1.1. Thành ph¶n th˘ nhßt cıa ∞c tr˜ng mô men màu.
Cho cÏ s d˙ liªu I1, I2, ..., IN gÁm N £nh, tij = [tij1, ..., tijk , ..., tijM ] là bi∫u
diπn vector cıa bÎ ∞c tr˜ng tij trong ki∫u fi . Ta có th∫ hình thành mÎt ma tr™n
∞c tr˜ng N ⇥M trong ó tijk là thành ph¶n ∞c tr˜ng th˘ k. Trong Hình 1.1 mÈi
cÎt cıa ma tr™n là mÎt chuÈi {tijk }. Mˆc ích chu©n hoá giá tr‡ trong mÈi cÎt vào
mÎt ph§m vi, £m b£o mÈi thành ph¶n ∞c tr˜ng nh™n trÂng sË b¨ng nhau trong
viªc xác ‡nh Î t˜Ïng t¸ gi˙a hai vector. Trong CBIR th˜Ìng s˚ dˆng hai phép
chu©n hoá : chu©n hoá min-max và chu©n hoá Gauss.
16
1.3.2 Chu©n hóa min-max
Chu©n hóa min-max cho phép chuy∫n d˙ liªu v∑ ph§m vi [0, 1] nh˜ sau :
{tijk } 7! { ˜tijk }, 8 k, ˜tijk =
tijk min{tijk }
max{tijk } min{tijk }
, (1.2)
trong ó min{tijk } và max{tijk } là giá tr‡ nh‰ nhßt và lÓn nhßt cıa chuÈi  thành
ph¶n k theo bÎ ∞c tr˜ng tij cıa tßt c£ các £nh trong cÏ s d˙ liªu.
T˜Ïng t¸ giá tr‡ kho£ng cách theo mÈi bÎ ∞c tr˜ng ˜Òc chu©n hoá nh˜ sau :
˜Dtij
(Ii , Ij ) =
Dtij
(Ix , Iy) mintij
maxtij mintij
, (1.3)
trong ó Dtij
(Ix , Iy) là kho£ng cách theo bÎ ∞c tr˜ng tij cıa hai £nh Ix , Iy và
maxtij
, mintij
t˜Ïng ˘ng là kho£ng cách lÓn nhßt và kho£ng cách nh‰ nhßt theo
bÎ ∞c tr˜ng tij .
Cách ti∏p c™n này có th∫ thu hµp các giá tr‡ kho£ng cách theo bÎ ∞c tr˜ng
vào mÎt ph§m vi rßt nh‰ n∏u giá tr‡ max có lÓn bßt th˜Ìng. Bai và cÎng s¸ [2],
Jose và Joseph [48] s˚ dˆng phép chu©n hoá này.
H§n ch∏ : H¶u h∏t thông thông tin h˙u ích b‡ chuy∫n vào mÎt ph§m vi rßt
hµp trong [0, 1] n∏u giá tr‡ max lÓn.
1.3.3 Chu©n hóa Gauss
Chu©n hóa Gauss hay gÂi là 3 , phép chu©n hóa này khá hiªu qu£ ˜Òc s˚
dˆng nhi∑u trong CBIR nh˜ trong [14], [19], [61], [78], [88], [90], i∑u này ˜Òc
khØng ‡nh theo Lu™t 1.1.
Lu™t 1.1. 3 ([90]) x là §i l˜Òng ng®u nhiên có trung bình µ và Î lªch thì
xác sußt P
⇣
x µ
3
 1
⌘
0.99.
17
Chu©n hoá thành ph¶n th˘ k cıa bÎ ∞c tr˜ng tij nh˜ sau :
{tijk } 7! { ˜tijk }, 8 k, ˜tijk =
tijk µk
3 k
, (1.4)
trong ó µk
def
= mean({tijk }), k
def
= var({tijk }).
Trong [14], [78], [88], [90] s˚ dˆng phép chu©n hóa 3 cho các ∞c tr˜ng (màu,
k∏t cßu, và hình d§ng) và chu©n hóa giá tr‡ kho£ng cách :
˜Dtij
(Ix , Iy) =
Dtij
(Ix , Iy) µtij
K tij
, (1.5)
trong ó phân bË chu©n tij theo bÎ ∞c tr˜ng tij là
tij =
2
N (N 1)
N 1X
x=1
NX
y=x+1
h
Dtij
(Ix , Iy) µtij
i2
, (1.6)
và kho£ng cách trung bình µtij
gi˙a các c∞p £nh theo bÎ ∞c tr˜ng tij :
µtij
=
2
N (N 1)
N 1X
x=1
NX
y=x+1
Dtij
(Ix , Iy). (1.7)
Mood và cÎng s¸ [70] ã cho thßy xác sußt 68% các giá tr‡ kho£ng cách n¨m trong
kho£ng [ 1, 1] khi K = 1 và 99% khi K = 3.
H§n ch∏ : Phép chu©n hoá 3 “r£i ∑u” trong [ 1, 1] nh˜ng yêu c¶u d˙ liªu
là mÎt chuÈi Gauss.
Phép chu©n hoá 3 yêu c¶u d˙ liªu ∞c tr˜ng ph£i là mÎt chuÈi Gauss. Kh£o
sát trên mÎt sË cÏ s d˙ liªu £nh chu©n Wang 1
, Caltech 101 2
, Oxford Buildings 3
d˙ liªu ∞c tr˜ng sau khi ˜Òc trích rút ã cho thßy gi£ thi∏t yêu c¶u d˙ liªu phân
bË Gauss là quá ch∞t ch≥ vì h¶u h∏t ∑u không tho£ mãn theo gi£ thi∏t này. Hình
1. http://wang.ist.psu.edu
2. http://www.vision.caltech.edu/Image_Datasets/Caltech101/
3. www.robots.ox.ac.uk/~vgg/data/oxbuildings/
18
1.2 là ví dˆ v∑ thành ph¶n ∞c tr˜ng cıa mô men màu “r£i” trên mÎt mi∑n rÎng
và không theo phân bË Gauss.
−100 0 100 200 300
0
50
100
150
200
250
300
350
400
Value
Frequency
Thanh phan 1 dac trung Mo men mau (goc)
Hình 1.2. Phân bË d˙ liªu thành ph¶n 1 cıa ∞c tr˜ng mô men màu (gËc)
−2000 0 2000 4000 6000 8000 10000
0
1000
2000
3000
4000
5000
6000
7000
Value
Frequency
Du lieu thanh phan 5 luoc do HSV
(a)
−2 −1 0 1 2 3 4
0
1000
2000
3000
4000
5000
6000
7000
Value
Frequency
3sigma
(b)
Hình 1.3. (a) Phân bË d˙ liªu thành ph¶n 5 l˜Òc Á ∞c tr˜ng l˜Òc Á HSV
(gËc). (b) L˜Òc Á ∞c tr˜ng l˜Òc Á HSV chu©n hoá theo lu™t 3 thành ph¶n
th˘ 5, 97.4555% d˙ liªu “rÏi vào” [-1,1]
Trong l˜Òc Á d˙ liªu Hình 1.3(a) các thành ph¶n cıa chuÈi ∞c tr˜ng không
ph£i là mÎt phân bË Gauss, t˘c là gi£ ‡nh phân bË chu©n áp ∞t là không hÒp l˛.
Khi chu©n hóa theo 3 , d˙ liªu sau khi chu©n hóa có th∫ nhi∑u thành ph¶n n¨m
ngoài o§n [ 1, 1], nh˜ trong Hình 1.3(b). Vì v™y s˚ dˆng chu©n hoá cho d˙ liªu
∞c tr˜ng là ch˜a §t ˜Òc mˆc tiêu cıa b˜Óc chu©n hoá.
19
1.4 Kho£ng trËng ng˙ nghæa
Thu™t ng˙ “kho£ng trËng ng˙ nghæa” ˜Òc dùng ∫ miêu t£ s¸ khác nhau gi˙a
hai m˘c miêu t£ cıa mÎt £nh. M˘c miêu t£ ¶u trong CBIR s˚ dˆng các vector
∞c tr˜ng chø thu thông tin ∞c tr˜ng m˘c thßp cıa £nh (màu s≠c, k∏t cßu, hình
d§ng,...). M˘c miêu t£ th˘ hai th¸c hiªn bi con ng˜Ìi s˚ dˆng các khái niªm ng˙
nghæa m˘c cao khi tra c˘u £nh. Tra c˘u trong hª thËng CBIR truy∑n thËng nói
chung chø d¸a vào các Î o t˜Ïng t¸ gi˙a các ∞c tr˜ng m˘c thßp, do v™y các
£nh k∏t qu£ có th∫ không phù hÒp vÓi mËi quan tâm cıa ng˜Ìi dùng.
Hình 1.4. Énh truy vßn “mandolin image 0001.jpg”.
Hình 1.5. Hª thËng tra c˘u vÓi £nh truy vßn “mandolin image 0001.jpg”.
20
Hình 1.6. K∏t qu£ top 20 các £nh t˜Ïng t¸ nhßt vÓi £nh truy vßn  l¶n tra
c˘u khi t§o.
Cho £nh nh˜ Hình 1.4 là mÎt truy vßn khi t§o tra c˘u trên t™p d˙ liªu
Caltech 101 4
. Truy vßn ˜Òc ˜a vào hª thËng CBIR nh˜ Hình 1.5. K∏t qu£
top 20 các £nh liên quan nhßt vÓi £nh truy vßn  l¶n tra c˘u khi t§o ˜Òc máy
tính ˜a ra nh˜ Hình 1.6. K∏t qu£ này ˜Òc x∏p h§ng d¸a trên ∞c tr˜ng m˘c
thßp.
(a) Énh truy vßn (b) Énh 12
Hình 1.7. Hai £nh có ng˙ nghæa t˜Ïng Áng
K∏t qu£ tra c˘u ˜Òc x∏p h§ng trong k∏t qu£ top 20 nh˜ Hình 1.6 ch˜a
tho£ mãn nhu c¶u tìm ki∏m cıa ng˜Ìi dùng. Do con ng˜Ìi hi∫u £nh b¨ng các khái
niªm ng˙ nghæa m˘c cao nh˜ Hình 1.7 hai £nh ˜Òc xem nh˜ là liên quan. Trong
4. http://www.vision.caltech.edu/Image_Datasets/Caltech101/
21
Query image
0
2000
4000
6000
Histogram: Query image
0 50 100 150 200 250
Image 3
0
2000
4000
Histogram: Image 3
0 50 100 150 200 250
Image 12
0
500
1000
Histogram: Image 12
0 50 100 150 200 250
Hình 1.8. L˜Òc Á màu cıa £nh truy vßn và hai £nh trong k∏t qu£ top 20.
khi ó máy tính (hay hª thËng tính toán) hi∫u các £nh thông qua ∞c tr˜ng m˘c
thßp (nh˜ là l˜Òc Á màu) nh˜ Hình 1.8 nên “£nh truy vßn” và “£nh 3” (Image 3)
˜Òc xem là t˜Ïng Áng v∑ l˜Òc Á màu, do ó ˜Òc hª thËng x∏p th˘ h§ng cao
hÏn trong k∏t qu£ top 20.
∫ nâng cao Î chính xác k∏t qu£ tra c˘u trong các l¶n l∞p ti∏p sau c¶n thi∏t
thu hµp “kho£ng trËng ng˙ nghæa”. ó là k∏t hÒp thông tin nÎi dung tr¸c quan
(các vector ∞c tr˜ng m˘c thßp) vÓi thông tin ng˙ nghæa hÂc ˜Òc t¯ ph£n hÁi
trên t™p top k thông qua nhãn m˘c Î quan trÂng b¨ng kˇ thu™t hiªu chønh
trÂng sË [90] ho∞c máy phân lÓp trong suËt pha tra c˘u [101].
1.5 Ph£n hÁi liên quan trong CBIR
Kˇ thu™t ph£n hÁi liên quan ˜Òc s˚ dˆng rÎng rãi nh¨m thu hµp “kho£ng
trËng ng˙ nghæa” trong CBIR, c£i thiªn k∏t qu£ tra c˘u thông qua t˜Ïng tác gi˙a
22
ng˜Ìi dùng và máy. MÎt k‡ch b£n thông th˜Ìng cho ph£n hÁi liên quan trong
CBIR nh˜ sau :
B˜Óc 1 : Máy tính ˜a ra các k∏t qu£ tra c˘u khi t§o (top k) thông qua
£nh truy vßn.
B˜Óc 2 : Ng˜Ìi dùng cung cßp ánh giá trên k∏t qu£ top k, ánh giá theo
ki∫u nh˜ “liên quan” ho∞c “không liên quan” vÓi nh™n th˘c cıa chính ng˜Ìi
dùng ó.
B˜Óc 3 : Máy hÂc và th˚ l§i. L∞p l§i b˜Óc 2.
T¯ t™p k∏t qu£ top k ˜Òc ánh giá, mÎt sË ph˜Ïng pháp phÍ bi∏n s˚ dˆng kˇ
thu™t ph£n hÁi liên quan nh˜ hiªu chønh trÂng sË và d‡ch chuy∫n truy vßn ; m
rÎng truy vßn ; kˇ thu™t hÂc máy. MÈi ph˜Ïng pháp có cách hÂc khác nhau trong
viªc s˚ dˆng thông tin cıa ng˜Ìi dùng.
Hiªu chønh trÂng sË và d‡ch chuy∫n truy vßn nh˜ trong [46], [88], [90] s˚ dˆng
các £nh ˜Òc ánh giá trong k∏t qu£ top k cho phép xây d¸ng trÂng sË. TrÂng
sË ˜Òc gán mÎt hª sË cho mÈi chi∑u cıa i∫m truy vßn, các trÂng sË cao vÓi
các chi∑u quan trÂng hÏn và ng˜Òc l§i. Trong [88] s˚ dˆng trÂng sË kho£ng cách
Ã-clit, cho phép x˚ l˛ các m∞t elip vÓi trˆc chính ˜Òc gióng theo các trˆc to§ Î.
MindReader [46] s˚ dˆng kho£ng cách Ã-clit tÍng quát, cho phép quay các trˆc
∫ làm viªc tËt hÏn vÓi các h˜Óng tu˝ ˛ các m∞t elip. D‡ch chuy∫n truy vßn nh˜
trong [88] và MindReader [46] bi∫u diπn truy vßn nh˜ mÎt i∫m Ïn trong không
gian ∞c tr˜ng, di chuy∫n i∫m truy vßn v∑ phía các i∫m k∏t qu£ liên quan và di
chuy∫n ra xa các i∫m k∏t qu£ không liên quan. fi t˜ng này xußt phát t¯ ph˜Ïng
pháp cıa Rocchio [85]. Trong [88], Mindreader [46] òi h‰i “truy vßn khi t§o” ı
tËt và mÎt sË b˜Óc hiªu chønh c¶n thi∏t, tr˜Óc khi các trÂng sË hÎi tˆ tÓi các giá
tr‡ úng. MÎt cách tr¸c giác, cách ti∏p c™n này phù hÒp vÓi nh™n th˘c chı quan
cıa ng˜Ìi dùng. S¸ h§n ch∏ cıa nh˙ng ph˜Ïng pháp này là khó hÎi tˆ khi các
i∫m liên quan n¨m r£i rác trong không gian tr¸c quan.
M rÎng truy vßn nh˜ trong [52], [83] cho phép gi£i quy∏t vßn ∑ khó hÎi tˆ.
B¨ng cách s˚ dˆng nhi∑u i∫m truy vßn ∫ xây d¸ng cˆm cˆc bÎ cho các i∫m
23
liên quan, sau ó hÒp tßt c£ các k∏t qu£. Theo ti∏p c™n này, các cˆm cˆc bÎ ˜Òc
hÒp l§i, cho phép hình thành mÎt ˜Ìng Ïn bao phı tßt c£ các i∫m liên quan.
Tuy nhiên, ph˜Ïng pháp này có th∫ b‰ sót các £nh liên quan trong ó tÍng toàn
bÎ kho£ng cách cao cıa toàn bÎ các chi∑u, nh˜ng có th∫ nh˙ng £nh này t˜Ïng t¸
ng˙ nghæa vÓi nhu c¶u thông tin cıa ng˜Ìi dùng.
Nhiªm vˆ tra c˘u cıa hª thËng CBIR có th∫ ˜Òc xem xét nh˜ mÎt bài toán
hÂc máy [16]. Mˆc ích ∫ phân lÓp cÏ s d˙ liªu vào hai lÓp : lÓp liên quan ch˘a
các £nh t˜Ïng t¸ vÓi các £nh truy vßn và lÓp không liên quan bi∫u diπn lÓp các
£nh mà không liên quan vÓi £nh truy vßn nh˜ trong [100], [101], [123]. Các £nh
liên quan nhßt, theo phân lÓp ˜Òc tr£ v∑ cho ng˜Ìi dùng. Sau ó, ng˜Ìi dùng có
th∫ ánh giá các £nh k∏t qu£ này nh˜ là các £nh liên quan ho∞c không liên quan.
Các £nh ˜Òc ánh giá bi ng˜Ìi dùng sau ó có th∫ ˜Òc thêm vào t™p hußn
luyªn cho quá trình hÂc cho l¶n l∞p ti∏p theo.
Nói chung, các ti∏p c™n trên ch˜a £m b£o tìm ˜Òc £nh liên quan mong muËn
và ôi khi chúng có th∫ t≠c ngh≥n cˆc bÎ ho∞c tìm l§i quanh qu©n khi không tìm
thßy các £nh mÓi có liên quan. ∫ gi£i quy∏t nh˙ng bßt lÒi ã nêu trên, lu™n án
v®n ti∏p nghiên c˘u s¸ k∏t hÒp a ∞c tr˜ng trong hª thËng CBIR s˚ dˆng hiªu
chønh trÂng sË, d‡ch chuy∫n truy vßn và d¸a vào ti∏p c™n tËi ˜u Pareto.
1.6 Hiªu chønh trÂng sË và d‡ch chuy∫n truy vßn
trong CBIR s˚ dˆng ph£n hÁi liên quan
Trong [20], [46], [90], [114] s˚ dˆng kˇ thu™t hiªu chønh trÂng sË hÂc thông
tin cıa ng˜Ìi dùng b¨ng cách i∑u chønh trÂng sË mÈi ∞c tr˜ng cıa truy vßn và
trÂng sË cıa mÈi chi∑u trong cùng mÎt ∞c tr˜ng . Các trÂng sË này ˜Òc i∑u
chønh trong mÈi l¶n l∞p cıa ph£n hÁi liên quan. Các trÂng sË lÓn ˜Òc gán cho
nh˙ng ∞c tr˜ng có s¸ phân biªt tËt gi˙a các £nh liên quan và không liên quan
∫ t´ng c˜Ìng Î chính xác tra c˘u.
24
Das [20] l¸a chÂn trÂng sË d¸a vào tø sË cıa s¸ bi∏n thiên ∞c tr˜ng qua tßt
c£ các l¶n tra c˘u vÓi các £nh liên quan ã ˜Òc tra c˘u. Cho
(l)
j và
(l)
rel,j kí hiªu
t˜Ïng ˘ng cho Î lªch chu©n cıa bÎ ∞c tr˜ng t trên các t™p R(l)
[ N (l)
và R(l)
,
trong ó R(l)
và N (l)
bi∫u diπn t™p cıa các £nh liên quan và không liên quan  l¶n
l∞p th˘ l. MÎt l¸a chÂn rßt hi∫n nhiên cıa trÂng sË cho bÎ ∞c tr˜ng t  các l¶n
l∞p th˘ (l + 1) là
w
(l+1)
j =
(l)
j
(l)
rel,j
(1.8)
Khi không có £nh liên quan ˜Òc tra c˘u, m®u sË ˜Òc gán mÎt giá tr‡ d˜Ïng
nh‰ ✏ sao cho các trÂng sË không b‡ thay Íi áng k∫.
Wu và Zhang [114] s˚ dˆng c£ hai các m®u ph£n hÁi d˜Ïng và ph£n hÁi âm,
s˚ dˆng tø sË phân biªt, xác ‡nh kh£ n´ng cıa mÎt ∞c tr˜ng ∫ phân tách các
£nh liên quan t¯ các £nh không liên quan. Gi£ s˚ I
t,(l)
rel,j = {I t
, I 2 R(l)
}, Irel nghæa
là £nh liên quan thì vùng trÎi hÏn trong sË các £nh liên quan  l¶n l∞p th˘ l cho
thành ph¶n ∞c tr˜ng th˘ j ˜Òc xác ‡nh nh˜ sau :
D
(l)
j = [min(I
t,(l)
rel,j ), max(I
t,(l)
rel,j )] (1.9)
Tø sË phân biªt ˜Òc s˚ dˆng ∫ xác ‡nh kh£ n´ng mÎt thành ph¶n ∞c tr˜ng
trong viªc phân tách các £nh liên quan t¯ các £nh không liên quan là :
(l)
j = 1
SË £nh không liên quan bên trong D
(l)
j
|N(l)|
(1.10)
Giá tr‡ cıa j n¨m gi˙a 0 và 1, là 0 khi tßt c£ các £nh liên quan cùng n¨m
trong ph§m vi trÎi nên không ánh trÂng sË cho các thành ph¶n ∞c tr˜ng này.
Ng˜Òc l§i, khi không có mÎt £nh liên quan nào n¨m trong ph§m vi trÎi, trÂng sË
lÓn nhßt s≥ ˜Òc cho các thành ph¶n ∞c tr˜ng ó. Theo ó, th¸c nghiªm theo
25
hai cách hiªu chønh trÂng sË cho ∞c tr˜ng ˜Òc ˜a ra nh˜ sau :
w
(l+1)
j =
(l)
j
(l)
rel,j
, (1.11)
w
(l+1)
j =
(l)
j ⇤
(l)
j
(l)
rel,j
(1.12)
Trong [90] s˚ dˆng trÂng sË cho ki∫u ∞c tr˜ng và bÎ ∞c tr˜ng. Î t˜Ïng t¸
theo bÎ ∞c tr˜ng tij ˜Òc xác ‡nh :
S(tij ) = mij (tij , wijk ), wijk = 1/ ijk , (1.13)
trong ó mij là Î t˜Ïng t¸ t˜Ïng ˘ng theo bÎ ∞c tr˜ng tij và ijk là Î lªch
chu©n cıa chuÈi theo thành ph¶n tijk trong sË các £nh liên quan.
Î t˜Ïng t¸ theo ki∫u ∞c tr˜ng fi ˜Òc xác ‡nh :
S(fi ) =
X
j
wij S(tij ), w(l+1)
ij
= w(l)
ij
+ score(l)
, (1.14)
trong ó giá tr‡ score(l)
˜Òc ng˜Ìi dùng l¸a trong sË các giá tr‡ {3, 1, 0, 1, 3}
t˜Ïng ˘ng “liên quan cao”, “liên quan”, “không liên quan”, “không liên quan cao”.
Î t˜Ïng t¸ toàn bÎ :
S =
X
i
wi S(fi ) (1.15)
◊u i∫m cıa viªc nhóm này nh¨m mˆc ích nhßn m§nh óng góp theo ki∫u.
H§n ch∏ là không £m b£o tính công b¨ng gi˙a các bÎ ∞c tr˜ng trong cùng mÎt
ki∫u vì các bÎ ∞c tr˜ng có nh˙ng óng góp tích c¸c khác nhau.
MÎt sË nghiên c˘u trong nh˙ng n´m g¶n ây [12], [41], [115], [124] s˚ dˆng
hiªu chønh trÂng sË theo ti∏p c™n hÂc tr˜Óc t¯ d˙ liªu ∞c tr˜ng. Zhou và cÎng
s¸ [124] ∑ xußt hª thËng gÁm hai pha. Trong pha off-line xây d¸ng mÎt t™p mô
hình ∫ ánh x§ tßt c£ các £nh trong cÏ s d˙ liªu sang không gian ∞c tr˜ng liên
26
quan. Trong pha tra c˘u on-line, s≥ gán mÎt trÂng sË cho mÂi ∞c tr˜ng liên quan
d¸a vào £nh truy vßn, sau ó x∏p h§ng các £nh trong cÏ s d˙ liªu d¸a vào các
giá tr‡ ∞c tr˜ng trung bình trÂng sË cıa nó. MÈi ∞c tr˜ng ˜Òc s˚ dˆng ∫ xây
d¸ng mÎt cây nh˜ trong Isolation Forest [60]. MÈi £nh I trong cÏ s d˙ liªu ˜Òc
˜Óc l˜Òng giá tr‡ liên quan li (I ) theo ∞c tr˜ng i trên mÈi cây Ti (i 2 {1, ..., t})
và ánh x§ I sang không gian ∞c tr˜ng liên quan nh˜ :
I 0
= [l1(I ), ..., lt (I )]T
(1.16)
và truy vßn Q cÙng ˜Òc bi∫u diπn t˜Ïng t¸ nh˜ v™y. MÎt trÂng sË cho ∞c tr˜ng
i nh˜ sau :
wi (Q) =
li (Q)
c( )
1, (1.17)
trong ó c( ) = 2(ln( 1) ( 1)/ + E), E ⇡ 0.5772 ( theo [60]). X∏p h§ng
mÎt £nh I vÓi truy vßn Q theo giá tr‡ trÂng sË trung bình :
Score(I | Q) =
1
t
tX
i=1
(wi (Q) ⇥ li (I )). (1.18)
Xu và cÎng s¸ [115] ti∏n hành hÂc tr˜Óc (t˘c là s˚ dˆng ∞c tr˜ng cıa toàn
bÎ các £nh trong cÏ s d˙ liªu tính Î t˜Ïng t¸ tr˜Óc) t¯ d˙ liªu ∞c tr˜ng b¨ng
cách xây d¸ng mËi liên quan ng˙ nghæa gi˙a các £nh thông qua Á th‡ (ma tr™n
k∑). Nghiên c˘u này s˚ dˆng kˇ thu™t hÂc ánh x§ t¯ không gian ∞c tr˜ng m˘c
thßp sang không gian ng˙ nghæa m˘c cao nh˜ trong Manifold Ranking (MR) [41],
cho phép gi£m chi phí tính toán khi xây d¸ng ma tr™n li∑n k∑. D˙ liªu ∞c tr˜ng
cıa tßt c£ các £nh ˜Òc trích rút và s˚ dˆng nh˜ to§ Î cıa các i∫m trong Á
th‡. Ti∏p theo, l¸a chÂn bi∫u diπn cho các i∫m nh˜ các anchor và xây d¸ng ma
tr™n trÂng sË Z b¨ng kernel regression vÓi mÎt lân c™n nh‰ s. Các anchor ˜Òc
l¸a chÂn off-line và không £nh h˜ng trong quá trình x˚ l˛ on-line. Khi mÎt truy
vßn ˜Òc ˜a vào, sau khi trích rút ∞c tr˜ng m˘c thßp, sau ó c™p nh™t trÂng sË
cho ma tr™n Z, tính toán i∫m x∏p h§ng, chi ti∏t v∑ tính toán này có trong [115].
27
1.7 Tra c˘u £nh d¸a vào nÎi dung s˚ dˆng kˇ
thu™t máy hÂc
Các kˇ thu™t hÂc máy có hiªu n´ng t´ng áng k∫ Ëi vÓi các hª thËng CBIR
nh˜ các kˇ thu™t máy vector hÈ trÒ (SVM) , hÂc t´ng c˜Ìng (boosting),... MÎt
h§n ch∏ là không có d˙ liªu hußn luyªn t¯ tr˜Óc vÓi mÈi truy vßn cˆ th∫, d˙ liªu
hußn luyªn chø có ˜Òc sau khi ng˜Ìi dùng ph£n hÁi vÓi £nh truy vßn ˜Òc ˜a
vào bi mÎt ng˜Ìi dùng. Bên c§nh d˙ liªu hußn luyªn là t˜Ïng Ëi ít và d˙ liªu
ki∫m tra b‡ nhiπu do vßn ∑ kho£ng trËng ng˙ nghæa.
1.7.1 Hußn luyªn và ki∫m tra
Mˆc ích s˚ dˆng các kˇ thu™t hÂc máy ∫ th¸c hiªn nhiªm vˆ x∏p h§ng.
ây là nhiªm vˆ hÂc giám sát do có các pha hußn luyªn và ki∫m tra. D˙ liªu bao
gÁm truy vßn và các £nh, trong ó mÈi truy vßn liên quan ∏n mÎt sË các £nh. S¸
liên quan cıa các £nh Ëi vÓi truy vßn ˜Òc cho bi mÎt nhãn, k˛ hiªu mÎt lo§i
( ˜Òc ˜a ra trong pha hußn luyªn và d¸ báo trong pha ki∫m tra).
Gi£ s˚ Q là t™p truy vßn và D là t™p £nh (truy vßn và £nh có th∫ là ∞c tr˜ng
£nh). Gi£ s˚ Y = {1, 2, ..., l} là t™p nhãn, trong ó nhãn bi∫u diπn h§ng (lÓp ho∞c
i∫m sË). TÁn t§i th˘ t¸ toàn bÎ gi˙a các h§ng 1 ... l 1 l, trong ó
là quan hª th˘ t¸. Cho {Q1, Q2, ..., Qm} là t™p truy vßn cho hußn luyªn và Qi là
truy vßn th˘ i. Cho Di = {Ii,1, Ii,2, ..., Ii,ni } là t™p các £nh liên quan vÓi truy vßn
Qi và yi = {yi,1, yi,2, ..., yi,ni } là t™p các nhãn liên quan vÓi truy vßn Qi , trong ó
ni là cÔ cıa t™p £nh Di và yi ; Ii,j là £nh th˘ j cıa Di ; yi,j 2 Y là th˘ t¸ nhãn
th˘ j trong yi t˜Ïng ˘ng vÓi Î liên quan cıa £nh Ii,j Ëi vÓi qi . T™p hußn luyªn
gËc ˜Òc k˛ hiªu là S = {(Qi , Di ), yi }n
i=1.
Vector ∞c tr˜ng xi,j = (Qi , Ii,j ) ˜Òc t§o t¯ mÈi c∞p £nh - truy vßn
(Qi , Ii,j ), i = 1, 2, ..., m, j = 1, 2, ..., ni , trong ó k˛ hiªu là các hàm ∞c
28
tr˜ng. Các ∞c tr˜ng ˜Òc xác ‡nh nh˜ các hàm cıa c∞p £nh truy vßn. Cho
xi = {xi,1, xi,2, ..., xi,ni }, bi∫u diπn t™p hußn luyªn S0
= {(xi , yi )}m
i=1,  ây x 2 X
và X ✓ Rd
. Mˆc ích ∫ hußn luyªn mÎt mô hình x∏p h§ng (cˆc bÎ) f (Q, I ) = f (x)
có th∫ gán mÎt i∫m sË cho mÎt c∞p £nh-truy vßn Q và I ho∞c t˜Ïng ˜Ïng vÓi
vector ∞c tr˜ng x ã cho. TÍng quát hÏn, ta cÙng có th∫ xem hußn luyªn mÎt
mô hình x∏p h§ng toàn cˆc F(Q, D) = F((x)). Mô hình x∏p h§ng cˆc bÎ ˜a ra
mÎt i∫m sË duy nhßt, mô hình x∏p h§ng toàn cˆc ˜a ra danh sách i∫m sË.
D˙ liªu ki∫m tra gÁm mÎt truy vßn mÓi Qm+1 và các £nh liên quan Dm+1.
T = {(Qm+1), Dm+1)}, t§o ra vector ∞c tr˜ng xm+1, s˚ dˆng mô hình x∏p h§ng
hußn luyªn tr˜Óc ∫ gán các i∫m sË cho Dm+1 các £nh, s≠p x∏p các £nh này d¸a
vào các i∫m sË và ˜a ra danh sách các £nh  ¶u ra.
1.7.2 Nhãn d˙ liªu
Có hai cách t§o ra nhãn d˙ liªu. Th˘ nhßt, ˜Òc t§o ra bi ánh giá cıa con
ng˜Ìi và th˘ hai ˜Òc lßy ra t¯ d˙ liªu l‡ch s˚ tìm ki∏m (search log). Cách th˘ hai
˜Òc miêu t£ chi ti∏t trong [58]. Ti∏p c™n th˘ nhßt, mÎt t™p các truy vßn ˜Òc
l¸a chÂn ng®u nhiên t¯ l‡ch s˚ truy vßn cıa mÎt hª thËng tìm ki∏m. Gi£ s˚ r¨ng
có nhi∑u hª thËng tìm ki∏m (trong gi£ l™p chø có mÎt hª thËng). Ti∏p c™n th˘
hai, các truy vßn ˜Òc ˜a vào các hª thËng tìm ki∏m và các £nh x∏p h§ng cao
nhßt ˜Òc tr£ v∑ (top rank). Nh˜ v™y, mÈi truy vßn liên quan vÓi nhi∑u £nh. Con
ng˜Ìi ánh giá d¸a vào s¸ liên quan trên các c∞p £nh-truy vßn. S¸ ánh giá liên
quan th˜Ìng theo nhi∑u m˘c Î. Con ng˜Ìi ánh giá liên quan theo quan i∫m
cıa trung bình các ng˜Ìi dùng. Các nhãn bi∫u diπn s¸ liên quan sau ó ˜Òc gán
cho các c∞p £nh-truy vßn. ánh giá s¸ liên quan trên mÎt c∞p £nh-truy vßn có th∫
˜Òc th¸c hiªn bi nhi∑u ánh giá, sau ó ti∏n hành bi∫u quy∏t d¸a vào a sË.
29
1.7.3 Xây d¸ng mô hình hÂc
Gi£ ‡nh cho X là không gian vào (không gian ∞c tr˜ng) gÁm danh sách các
vector ∞c tr˜ng và Y là không gian ¶u ra gÁm danh sách các h§ng. Gi£ s˚ x
là mÎt ph¶n t˚ cıa X bi∫u diπn mÎt danh sách các vector ∞c tr˜ng và y là mÎt
ph¶n t˚ cıa Y bi∫u diπn mÎt danh sách các th˘ h§ng. Cho P(X , Y ) là phân phËi
xác sußt k∏t hÒp ch˜a bi∏t, trong ó bi∏n ng®u nhiên X lßy x là giá tr‡ cıa nó và
t˜Ïng t¸ Y lßy y là giá tr‡ cıa nó.
Gi£ s˚ F(·) là mÎt hàm ánh x§ t¯ danh sách các vector ∞c tr˜ng x tÓi mÎt
danh sách i∫m sË (score). Mˆc ích cıa nhiªm vˆ hÂc là t¸ Îng hÂc mÎt hàm
ˆF(x) cho d˙ liªu hußn luyªn (x1, y1), (x2, y2), ..., (xm, ym). MÈi m®u hußn luyªn
gÁm các vector ∞c tr˜ng xi và lÓp t˜Ïng ˘ng yi (i = 1, ..., m) trong ó m k˛ hiªu
là sË m®u hußn luyªn.
Bi∫u diπn cho F(x) và y là F(x) = (f (x1), f (x2), ..., f (xn)) và y = (y1, y2, ..., yn).
Các vector ∞c tr˜ng bi∫u diπn các Ëi t˜Òng ∫ x∏p h§ng. K˛ hiªu f (x) hàm x∏p
h§ng cˆc bÎ và n k˛ hiªu sË vector ∞c tr˜ng và các i∫m sË.
MÎt hàm lÈi L(·, ·) ˜Òc dùng ∫ ánh giá k∏t qu£ d¸ báo cıa F(·). Các vector
∞c tr˜ng x ˜Òc x∏p h§ng d¸a vào F(x), sau ó top k các k∏t qu£ cıa x∏p
h§ng ˜Òc ánh giá s˚ dˆng các i∫m sË y t˜Ïng ˘ng. N∏u các vector ∞c tr˜ng
vÓi các i∫m sË cao s≥ ˜Òc x∏p h§ng cao hÏn, khi ó lÈi là nh‰ hÏn. Ng˜Òc l§i, lÈi
s≥ là lÓn. Hàm lÈi ˜Òc bi∫u diπn mÎt cách cˆ th∫ nh˜ L(F(x), y). Chú ˛, hàm lÈi
cho x∏p h§ng là khác so vÓi hàm lÈi trong các nhiªm vˆ hÂc thËng kê khác, trong
tr˜Ìng hÒp này nó dùng ∫ s≠p x∏p.
Trong CBIR, các vector ∞c tr˜ng x có ˜Òc t¯ mÎt truy vßn và các £nh
liên quan cıa nó. Các i∫m sË y bi∫u diπn Î liên quan cıa các £nh Ëi vÓi truy
vßn. Hàm x∏p h§ng toàn cˆc F(·), trong th¸c t∏ có th∫ là mÎt hàm x∏p h§ng cˆc
bÎ f (·). SË vector ∞c tr˜ng trong x kh£ n´ng rßt lÓn, th™m chí không giÓi h§n.
S¸ ánh giá (hàm lÈi) chø t™p trung vào top k các k∏t qu£. ∫ c£i thiªn hiªu
30
n´ng tra c˘u, các kˇ thu™t hÂc máy hiªu qu£ ã ˜Òc s˚ dˆng trong [101], [112],
[123]. SVM-AL [101] là nghiên c˘u khá sÓm, óng góp trong cÎng Áng CBIR. Nói
chung, các kˇ thu™t phân lÓp d¸a trên ph˜Ïng pháp hÂc máy SVM th˜Ìng yêu
c¶u ph£i bi∏t ˜Òc các lÓp nhßt ‡nh và t™p lÓn d˙ liªu ã ˜Òc gán nhãn. i∑u
này d®n ∏n các khó kh´n trong các hª thËng CBIR, do các nguyên nhân : Trong
CBIR không có các m®u hußn luyªn tr˜Óc cho mÎt truy vßn cˆ th∫ và sË các £nh
liên quan trong mÎt l¶n ph£n hÁi th˜Ìng rßt ít (thông th˜Ìng các k∏t qu£ tr£ v∑
ng˜Ìi dùng trong mÎt l¶n kho£ng 20 m®u) ho∞c tr˜Ìng hÒp xßu không có £nh liên
quan nào.
Kˇ thu™t AdaBoost [31] ã ˜Òc áp dˆng trong mÎt sË hª thËng CBIR [54],
[100], [118] nh¨m mˆc ích t´ng c˜Ìng các thu™t toán hÂc y∏u, òi h‰i d˙ liªu
˜Òc ánh trÂng sË tr˜Óc khi th¸c hiªn thu™t toán hÂc y∏u  mÈi l¶n l∞p. Tieu và
cÎng s¸ [100] s˚ dˆng thu™t toán AdaBoost trong CBIR và s˚ dˆng ph£n hÁi liên
quan ∫ hÂc thông tin ng˜Ìi dùng. Tuy nhiên, các kˇ thu™t d¸a vào AdaBoost
th˜Ìng phân lÓp ch™m và c¶n nhi∑u l¶n l∞p ph£n hÁi.
Kˇ thu™t Adaboost
Boosting [31] là ph˜Ïng pháp cho phép c£i thiªn Î chính xác cıa bßt k˝
thu™t toán hÂc nào. ây là mÎt lo§i ph˜Ïng pháp tÍ hÒp, cho phép k∏t hÒp các
ph˜Ïng pháp phân lÓp y∏u thành mÎt phân lÓp m§nh hÏn.
F(x) =
LX
l=1
↵l fl (x). (1.19)
trong ó ↵l xác ‡nh trÂng sË cıa bÎ hÂc y∏u th˘ l. Kˇ thu™t boosting th¸c hiªn
l∞p i l∞p l§i, sao cho mÈi l¶n l∞p l, phân lÓp y∏u ˜a vào tÍ hÒp cho tÓi khi §t
tiêu chu©n d¯ng.
Kearns và Valiant [49] là nh˙ng ng˜Ìi ¶u tiên ∑ c™p ∏n ph˜Ïng pháp hÂc
y∏u, có th∫ ˜Òc t´ng c˜Ìng ∫ cho ra mÎt ph˜Ïng pháp hÂc m§nh hÏn. AdaBoost
31
˜Òc giÓi thiªu bi Freund và Schapire [30] d®n ∏n các bi∏n th∫ boosting phÍ bi∏n
hiªn nay và ã tr thành mÎt trong nh˙ng thu™t toán hÂc m§nh. Trong quá trình
hÂc, gi˙ phân bË trÂng sË Dl (i) trên các m®u hußn luyªn. Theo phân bË này, t§i
mÈi l¶n l∞p boosting s≥ l¸a chÂn bÎ hÂc y∏u và ˜a thêm vào mô hình. Sau mÈi
l¶n l∞p l, m®u ˜Òc ánh l§i trÂng sË, d¸a vào mÎt hàm lÈi (loss function), (thí dˆ
e yF(x)
trong tr˜Ìng hÒp AdaBoost). Nh¨m t™p trung vào các m®u khó, b‰ qua
các m®u dπ. Gi£i thu™t AdaBoost là thu™t toán hÂc hiªu qu£ và phÍ bi∏n, do khá
dπ dàng cài ∞t, h¶u nh˜ không c¶n thi∏t tÓi tham sË hiªu chønh. Trên th¸c t∏ chø
có mÎt tham sË là sË tËi a L l¶n l∞p. Viªc thi∏t l™p tham sË rßt quan trÂng bi
vì thu™t toán có th∫ có xu h˜Óng overfit (quá khÓp) n∏u thi∏t l™p L lÓn.
Kˇ thu™t máy vector hÈ trÒ (SVM)
Các kˇ thu™t hÂc máy và ph£n hÁi liên quan ˜Òc ∑ xußt nh¨m hiªu chønh
khái niªm truy vßn. H¶u h∏t các kˇ thu™t truy∑n thËng òi h‰i mÎt sË l˜Òng lÓn
m®u hußn luyªn [68], [125] và truy vßn khi t§o vÓi các m®u tËt [47], [83], [113].
Trong nhi∑u tình huËng ˘ng dˆng th¸c t∏, các thu™t toán hÂc có th∫ làm viªc ngay
c£ khi nghèo d˙ liªu hußn luyªn và h§n ch∏ thÌi gian hußn luyªn.
∫ gi£m sË l˜Òng m®u yêu c¶u, các nghiên c˘u quan tâm ∏n các kˇ thu™t
hÂc tích c¸c. MÎt trong nh˙ng ph˜Ïng pháp nh˜ v™y là SVM, d¸a vào ph£n hÁi
liên quan [15], [18], [33],[93], [101], [120] khi phân lÓp. HÂc tích c¸c có th∫ ˜Òc
mô hình hoá nh˜ sau : Cho mÎt cÏ s d˙ liªu E ch˘a mÎt t™p con các ch˜a gán
nhãn U và mÎt t™p con X ã gán nhãn. Ph˜Ïng pháp hÂc gÁm hai thành ph¶n
f và s. Thành ph¶n f là mÎt phân lÓp ˜Òc hußn luyªn trên t™p d˙ liªu ã gán
nhãn X . Thành ph¶n s là hàm lßy m®u ˜a ra mÎt t™p gán nhãn hiªn thÌi X ,
quy∏t ‡nh l¸a chÂn t™p con u 2 U chÂn cho truy vßn ng˜Ìi dùng. Cách hÂc tích
c¸c này ˜a ∏n mÎt f mÓi, sau mÈi l¶n l∞p cıa ph£n hÁi liên quan.
Kˇ thu™t này có th∫ mô t£ sau ây : T™p d˙ liªu ¶u vào/ ¶u ra X , Y , t™p
hußn luyªn (x1, y1), (x2, y2), . . . , (xm, ym). Mˆc ích muËn hÂc mÎt hàm phân lÓp
32
y = f (x, ) trong ó là các trÂng sË c¶n hußn luyªn, minh ho§ nh˜ vector 1.9.
Ví dˆ, chÂn mô hình t¯ t™p các siêu phØng, hàm phân lÓp s≥ có d§ng :
Hình 1.9. Minh ho§ siêu phØng
f (x, w, b) = sign(wx + b) (1.20)
Tiêu chí cıa SVM là chÂn siêu phØng sao cho l∑ là c¸c §i và tËi thi∫u hóa lÈi,
d®n tÓi ˜a v∑ viªc gi£i bài toán tËi ˜u b™c 2 (Quadratic). ¶u ra cıa bài toán
tËi ˜u là w và b, trong ó w có d§ng nh˜ sau :
w =
mX
i=1
↵i xi (1.21)
VÓi tiêu chí l∑ c¸c §i, các ↵ ˜Òc gi£i ra s≥ có rßt ít giá tr‡ khác 0. Các m®u
d˙ liªu trong t™p hußn luyªn X t˜Ïng ˘ng vÓi ↵i khác 0 ˜Òc gÂi là vector t¸a
(Support vector)
SVM ph‰ng oán k∏t qu£ tra c˘u theo các m®u hußn luyªn. D¸a vào k∏t qu£
tra c˘u, ng˜Ìi dùng l¸a chÂn các £nh liên quan và các £nh không liên quan. Các
£nh liên quan t§o thành t™p m®u d˜Ïng và các £nh không liên quan t§o thành
t™p m®u âm. Sau khi hÂc t™p m®u hußn luyªn, b¨ng cách s˚ dˆng SVM, bÎ phân
lÓp SVM f (x) s≥ d¶n i∑u chønh theo mˆc ích tra c˘u cıa ng˜Ìi dùng. MÈi £nh
Ii trong cÏ s d˙ liªu, i∫m sË ˜Òc tính toán theo score(Ii ) = f (xi ), ây chính
33
là kho£ng cách t¯ £nh tÓi siêu phØng phân tách. score(Ii ) lÓn hÏn ng˜Ông thì Ii
s≥ g¶n khÓp vÓi £nh truy vßn. S≠p x∏p các i∫m sË cıa tßt c£ các £nh theo th˘ t¸
gi£m d¶n. Sau ó, danh sách k £nh ¶u tiên tr£ v∑. Khi ó ta thu ˜Òc k∏t qu£
tËt hÏn và l¶n ph£n hÁi ti∏p theo l§i ˜Òc th¸c hiªn. L∞p l§i quá trình này ∏n
khi tho£ mãn yêu c¶u ng˜Ìi dùng.
Zhang và cÎng s¸ [123] miêu t£ quá trình trên b¨ng Thu™t toán 1.1. Tr˜Óc
tiên, mÎt ph˜Ïng pháp tra c˘u truy∑n thËng ˜Òc th¸c hiªn b¨ng cách Ëi sánh
các £nh theo cách thông th˜Ìng, s≠p x∏p các £nh theo Î o kho£ng cách t´ng
d¶n vÓi £nh truy vßn. K∏t qu£ tr£ v∑ ng˜Ìi dùng k £nh ¶u tiên cıa danh sách
ó, k˛ hiªu là NB.
Thu™t toán 1.1 SVM d¸a vào ph£n hÁi liên quan [123]
¶u vào: ánh dßu £nh trên t™p k∏t qu£ NB : t™p liên quan NB+
và t™p không liên
quan NB
¶u ra: T™p k∏t qu£ NB
1: Chu©n b‡ cho SVM d˙ liªu hußn luyªn (xi , yi ), yi =
⇢
+1 n∏u xi 2 NB+
1 n∏u xi 2 NB
2: Xây d¸ng hàm phân lÓp s˚ dˆng thu™t toán SVM : f (x) =
P
i ↵i yi K(xi , x)+b.
(Chú ˛ : theo ¶u ra kho£ng cách Î t˜Ïng t¸ vÓi truy vßn)
3: Tính toán i∫m sË cho mÈi £nh Ii trong cÏ s d˙ liªu. score(Ii ) = f (xi )
4: S≠p x∏p các £nh theo i∫m sË
1.8 MÎt sË ti∏p c™n d¸a theo ph˜Ïng pháp tËi
˜u Pareto
T™p Pareto ho∞c Pareto front là mÎt t™p con cıa t™p các i∫m kh£ thi các lÌi
gi£i ch˘a tßt c£ các i∫m có ít nhßt mÎt mˆc tiêu tËi ˜u trong khi £m b£o không
thay Íi các mˆc tiêu khác. Các i∫m nh˜ v™y ˜Òc gÂi là các i∫m tËi ˜u Pareto.
Pareto front ¶u tiên bao gÁm mÎt t™p các i∫m không b‡ trÎi, ôi khi ˜Òc gÂi
là skyline (chân trÌi) [10].
34
Ti∏p c™n Pareto có th∫ thßy trong nhi∑u nghiên c˘u liên quan tÓi cÏ s d˙
liªu [13], [82] ho∞c m§ng [24]. Trong [77] ∑ xußt mÎt kˇ thu™t s˚ dˆng tính tËi ˜u
Pareto ∫ th¸c hiªn mÎt quá trình sÏ lÂc, lo§i b‰ các Ëi t˜Òng ít §i diªn t¯ quá
trình l¸a chÂn k-láng ri∑ng trong khi v®n gi˙ l§i nh˙ng Ëi t˜Òng tri∫n vÂng nhßt.
Nghiên c˘u này lßy các k∏t qu£ cıa mÎt truy vßn gÁm tßt c£ các i∫m Pareto. T™p
Pareto bao phı không gian các Ëi t˜Òng liên quan vÓi truy vßn hÏn các ph˜Ïng
pháp s˚ dˆng k∏t hÒp Î o kho£ng cách. Trong [1] ánh giá theo cách khác nhau
∫ k∏t hÒp hai ph˜Ïng pháp ph£n hÁi liên quan ã có, nhßn m§nh s¸ bßt bình
Øng trong kh£o sát và s¸ khai thác trong tình huËng các ph˜Ïng pháp d¸a vào
kho£ng cách.
Nghiên c˘u g¶n ây s˚ dˆng ti∏p c™n Pareto trong CBIR cıa Hsiao và cÎng
s¸ [43]. Quá trình hÂc tr˜Óc t¯ cÏ s d˙ liªu ∞c tr˜ng (SIFT, l˜Òc Á h˜Óng
các gradient (HoG)) b¨ng thu™t toán EMR [115] ˜Òc th¸c hiªn. Ti∏p c™n Pareto
˜Òc s˚ dˆng nh˜ bài toán a mˆc tiêu ∫ so sánh lßy ra các k∏t qu£ cuËi cùng
t¯ k∏t hÒp các x∏p h§ng cıa nhi∑u truy vßn, l¸a chÂn lßy ra các i∫m Pareto l¶n
l˜Òt t¯ng front (không có thu™t toán lßy Pareto front a m˘c sâu).
Các ˜u i∫m cıa ti∏p c™n Pareto ch˜a ˜Òc nghiên c˘u rÎng rãi trong CBIR.
Ti∏p c™n tËi ˜u Pareto có th∫ thu gÂn t™p ˘ng viên trên không gian a ∞c tr˜ng,
nh˜ rút gÂn không gian tìm ki∏m ∫ c£i thiªn k∏t qu£ tra c˘u v∑ m∞t Î chính xác
cıa hª thËng CBIR s≥ ˜Òc ∑ xußt trong Ch˜Ïng 2. Quá trình t˜Ïng tác gi˙a hª
thËng và ng˜Ìi dùng giúp l¸a chÂn các i∫m liên quan trong khi ph˜Ïng pháp d¸a
vào Pareto lßy tßt c£ các Pareto front nh˙ng i∫m  nhi∑u m˘c sâu d®n tÓi kích
th˜Óc không gian tìm ki∏m lÓn. ∑ xußt trên thuÎc công trình nghiên c˘u [CT7].
1.9 Ph˜Ïng pháp ánh giá hiªu n´ng trong CBIR
ánh giá hiªu n´ng là công viªc rßt quan trÂng, cho phép ∫ ánh giá m˘c
Î hiªu qu£ §t ˜Òc cıa các kˇ thu™t ∫ có nh˙ng c£i ti∏n. M¨uller-Henning và
35
cÎng s¸ [71] ˜a ra mÎt sË ph˜Ïng pháp ánh giá hiªu n´ng CBIR. Î o th˜Ìng
xuyên s˚ dˆng là Î chính xác (precision (Pr)) và Î hÁi t˜ng (recall (Re)) và
bi∫u diπn bi∫u Á cıa chúng. Gi£ s˚ sË các £nh liên quan vÓi mÎt truy vßn cˆ th∫
là A, sË các £nh không liên quan cho mÎt truy vßn cˆ th∫ là B, tÍng sË các £nh
˜Òc tra c˘u là D và sË các £nh liên quan ˜Òc tra c˘u E.
Î chính xác là tø sË gi˙a sË các £nh liên quan ˜Òc tra c˘u vÓi tÍng sË các
£nh ˜Òc tra c˘u :
Pr =
E
D
(1.22)
Î hÁi t˜ng là tø sË gi˙a sË các £nh liên quan ˜Òc tra c˘u vÓi toàn bÎ sË
£nh liên quan có trong cÏ s d˙ liªu :
Re =
E
A
(1.23)
Khi giá tr‡ Re cao t˜Ïng ˘ng vÓi mÎt tr£ lÌi tËt cıa mÎt hª thËng Ëi vÓi mÎt
truy vßn. Tuy nhiên, chø mÎt Î o này là ch˜a ı ∫ ánh giá chßt l˜Òng cıa hª
thËng. K∏t qu£ tËt Ëi vÓi các giá tr‡ c£ Pr, Re ph£i cao. Nh˜ v™y, có th∫ thßy
r¨ng Pr và Re là các Î o không Îc l™p.
Pr
Re
=
A
D
(1.24)
Các giá tr‡ này phˆ thuÎc vào kích th˜Óc cıa t™p tra c˘u. N∏u D là nh‰ áng
k∫ kích hÏn th˜Óc cıa t™p liên quan A, các giá tr‡ cho Re không bao giÌ cao. T˜Ïng
t¸, n∏u D lÓn hÏn nhi∑u so vÓi A thì Pr không bao giÌ cao. NhÌ chu©n hoá t™p
tÍng các £nh ˜Òc tra c˘u vÓi tÍng các £nh liên quan, s≥ §t ˜Òc giÓi h§n t˜Ïng
˘ng vÓi ˜Ìng chéo trong bi∫u diπn bi∫u Á Pr và Re theo ó Pr = Re.phNF
36
K∏t lu™n Ch˜Ïng 1
Ch˜Ïng 1 giÓi thiªu mÎt sË ∞c tr˜ng th˜Ìng ˜Òc s˚ dˆng và s¸ k∏t hÒp a
bÎ ∞c tr˜ng. Trong ch˜Ïng ã phân tích nh˙ng khó kh´n khi áp dˆng chu©n hoá
Gauss và phân tích nh˙ng tÁn t§i cıa các kˇ thu™t nh¨m gi£m kho£ng trËng ng˙
nghæa trong CBIR. ∫ kh≠c phˆc nh˙ng h§n ch∏ ã ˜Òc phân tích trên, Ch˜Ïng
2 ∑ xußt chu©n hoá ∞c tr˜ng d¸a vào chu©n hoá Gauss trên mÎt sË t™p cÏ s
d˙ liªu £nh ∫ c£i thiªn chßt l˜Òng tính Î t˜Ïng t¸. Ti∏p theo, ∫ nâng cao hiªu
n´ng Î chính xác tra c˘u, phù hÒp nh™n th˘c cıa ng˜Ìi dùng, kˇ thu™t hiªu
chønh trÂng sË kho£ng cách và d‡ch chuy∫n truy vßn ˜Òc ∑ xußt.
Ch˜Ïng 2
∑ xußt chu©n hoá ∞c tr˜ng và
hiªu chønh trÂng sË trong tÍ hÒp
∞c tr˜ng
Trong Ch˜Ïng 1 ã giÓi thiªu và phân tích mÎt sË hª thËng CBIR s˚ dˆng
tÍ hÒp ∞c tr˜ng tr¸c quan m˘c thßp, mÎt sË kˇ thu™t thu hµp kho£ng trËng
ng˙ nghæa ∫ c£i thiªn hiªu qu£ tra c˘u. ∫ nâng cao Î chính xác tra c˘u, trong
Ch˜Ïng 2 ∑ xußt kˇ thu™t chu©n hoá ∞c tr˜ng, hiªu chønh trÂng sË kho£ng cách
và d‡ch chuy∫n truy vßn s˚ dˆng ph£n hÁi liên quan.
NÎi dung cıa ch˜Ïng gÁm các ∑ xußt chu©n hoá ∞c tr˜ng d¸a vào phân cˆm
mÌ (Fuzzy c-means (FCM)) trong Mˆc 2.1, chu©n hoá kho£ng cách trong Mˆc 2.2,
kˇ thu™t hiªu chønh trÂng sË kho£ng cách, d‡ch chuy∫n truy vßn s˚ dˆng ph£n hÁi
liên quan trong Mˆc 2.3. K∏t qu£ th¸c nghiªm cho các ∑ xußt trên ˜Òc trình
bày trong Mˆc 2.4. NÎi dung nh˙ng ∑ xußt này là các k∏t qu£ ã ˜Òc công bË
t§i công trình nghiên c˘u [CT6]. CuËi cùng, Mˆc 2.5 là mÎt sË k∏t lu™n ch˜Ïng.
Hình 2.1 là mô hình ki∏n trúc hª thËng ∑ xußt gÁm các b˜Óc nh˜ sau :
(1) Các £nh trong cÏ s d˙ liªu £nh ˜Òc trích rút ∞c tr˜ng trong màu s≠c,
k∏t cßu, hình d§ng b¨ng các thı tˆc trích rút ∞c tr˜ng. Sau ó các ∞c
37
38
tr˜ng £nh ˜Òc chu©n hoá. T˜Ïng t¸, ∞c tr˜ng £nh truy vßn cÙng ˜Òc
chu©n hoá. ∫ nâng cao k∏t qu£ tính Î t˜Ïng t¸ cıa mÈi £nh trong cÏ s
d˙ liªu so vÓi £nh truy vßn, lu™n án ∑ xußt chu©n hoá ∞c tr˜ng 3 FCM
t¯ chu©n hoá 3 . Chu©n hoá này phù hÒp vÓi cÏ s d˙ liªu £nh kh£o sát
trong lu™n án và kˇ thu™t trích rút ∞c tr˜ng ã s˚ dˆng.
(2) Sau khi tính toán Î t˜Ïng t¸, t™p k∏t qu£ top k ˜Òc hi∫n th‡ cho ng˜Ìi
dùng.
(3) T¯ t™p k∏t qu£ hi∫n th‡, thông tin ph£n hÁi cıa ng˜Ìi dùng thu ˜Òc thông
qua ánh giá m˘c Î liên quan cıa mÎt sË £nh trên t™p k∏t qu£ top k
này. Thông tin m˘c Î liên quan ˜Òc ánh giá bi ng˜Ìi dùng và thông
tin ( ∞c tr˜ng, Î o kho£ng cách so vÓi £nh truy vßn) cıa các £nh ˜Òc
ánh giá s˚ dˆng ∫ hiªu chønh theo nhu c¶u ng˜Ìi dùng. Lu™n án ã ∑
xußt hiªu chønh trÂng sË kho£ng cách và d‡ch chuy∫n truy vßn.
(4) Î o t˜Ïng t¸ ti∏p tˆc ˜Òc c™p nh™t l§i sau quá trình hiªu chønh, t™p
k∏t qu£ top k ˜Òc c£i thiªn.
(5) K∏t qu£ cuËi cùng là t™p £nh k∏t qu£ top k tho£ mãn ng˜Ìi dùng ho∞c
h∏t sË l¶n l∞p ‡nh tr˜Óc.
Hình 2.1. Mô hình hª thËng ∑ xußt
39
2.1 Chu©n hoá ∞c tr˜ng d¸a vào phân cˆm mÌ
FCM
Kh£o sát trên cÏ s d˙ liªu Wang 1
, Oxford Building 2
, Caltech 101 3
vÓi các
kˇ thu™t trích rút ∞c tr˜ng : l˜Òc Á HSV [98], mô men màu [97], l˜Òc Á t¸
t˜Ïng quan màu [45] lÂc Gabor [56], mô men Wavelet [42], Gist [75] h¶u h∏t d˙
liªu ∞c tr˜ng gËc phân bË không theo Gauss. N∏u ∞t trong gi£ thi∏t phân bË
Gauss, khi ˜Òc chu©n hoá theo lu™t 3 có nhi∑u giá tr‡ cıa thành ph¶n ∞c tr˜ng
“rÏi” ngoài o§n [ 1, 1]. Do v™y lu™n án ∑ xußt b‰ gi£ thi∏t d˙ liªu các thành
ph¶n ∞c tr˜ng theo phân bË Gauss. Th¸c hiªn phân cˆm d˙ liªu ∞c tr˜ng tr˜Óc
∫ t§o ra các vùng Áng nhßt, ti∏p theo chu©n hoá các thành ph¶n theo lu™t 3
trên mÈi cˆm. CuËi cùng, k∏t nh™p k∏t qu£ theo mÈi cˆm ∫ ˜Òc mÎt giá tr‡
chu©n hoá duy nhßt.
Trong phân cˆm, có rßt nhi∑u kˇ thu™t phân cˆm nh˜ K-mean, Fuzzy-cmean
(FCM), mô hình Gauss hÈn hÒp (GMM),... VÓi mÈi kˇ thu™t phân cˆm khác nhau,
cách k∏t nh™p k∏t qu£ cuËi cùng cÙng khác nhau. Vßn ∑ quan trÂng nhßt cıa
chu©n hoá trong CBIR là £m b£o thành ph¶n ph£i “rÏi” vào o§n [ 1, 1] nhi∑u
hÏn và chßt l˜Òng truy vßn t´ng lên (t˘c là c£i thiªn k∏t qu£ tính Î t˜Ïng t¸).
∫ gi£m tËi thi∫u hóa các sai khác do d˙ liªu ˜Òc xem nh˜ các §i l˜Òng
ng®u nhiên, có th∫ có nhi∑u ønh nên c¶n thi∏t ph£i phân cˆm ∫ t§o ra các vùng
Áng nhßt. Phân cˆm ˜Òc th¸c hiªn trên t¯ng bÎ ∞c tr˜ng riêng r≥ (lu™n án
s˚ dˆng 6 bÎ ∞c tr˜ng) Ëi vÓi toàn bÎ cÏ s d˙ liªu ∞c tr˜ng ã ˜Òc l˜u tr˙
tr˜Óc ó. H¶u h∏t các ph˜Ïng pháp phân cˆm nh˜ ã ∑ c™p có th∫ sinh ra các
phân ho§ch mÌ và các tâm cˆm vÓi mÎt t™p d˙ liªu ã cho. Phân cˆm d˙ liªu ∞c
tr˜ng chø là b˜Óc trung gian trong viªc t§o ra các vùng Áng nhßt cho nên viªc
l¸a chÂn thu™t toán phân cˆm không ˜Òc ánh giá và phân tích trong ∑ xußt
1. http://wang.ist.psu.edu/docs/related.shtml
2. http://www.robots.ox.ac.uk/~vgg/data/oxbuildings/
3. http://www.vision.caltech.edu/Image_Datasets/Caltech101/
40
này. Do ó lu™n án s˚ dˆng thu™t toán phân cˆm chu©n FCM bi phân cˆm mÌ
FCM ([8]) ã ˜Òc s˚ dˆng hiªu qu£ trong mÎt sË nghiên c˘u CBIR [9], [116].
Cho {I t
i }1iN , trong ó t là chø sË ∞c tr˜ng, N là kích cÔ cÏ s d˙ liªu và các
h¨ng sË p = p(t) > 1, (p(t) là hª sË FCM cho bÎ ∞c tr˜ng th˘ t), C = C(t) 2 N+
,
Mt = dim(I t
i ) là Î dài cıa ∞c tr˜ng bÎ t, 8 i, 1  i  N . Thu™t toán l∞p FCM
[8] c¸c ti∫u hóa hàm mˆc tiêu :
J(V , ⌘) = min
V ,⌘
NX
i=1
CX
c=1
⌘p
t,c,i I t
i Vt,c
2
, (2.1)
vÓi Î o kho£ng cách Ã-clit kI t
i Vt,ck
2
=
MtP
j=1
(I t
i [j] Vt,c[j])2
, và các ràng buÎc
bi∏n nh˜ sau :
(1) ⌘t,c,i 2 [0, 1], 8 1  i  N , i  c  C, t 1,
(2)
PC
c=1 ⌘t,c,i = 1, 8 1  i  N ,
(3)
PN
i=1 ⌘t,c,i < N , 8 1  c  C.
Sau khi c phân ho§ch mÌ {⌘1, ..., ⌘c} ˜Òc cho bi mÎt thu™t toán phân cˆm
nh˜ FCM, câu h‰i ∞t ra liªu r¨ng nó th∫ hiªn chính xác cßu trúc d˙ liªu hay
không. ây là bài toán phân cˆm hÒp l˛. Do các ph˜Ïng pháp phân cˆm mÌ c¶n
gi£ ‡nh tr˜Óc sË các cˆm c, tiêu chu©n hÒp lª cho viªc tìm sË cˆm tËi ˜u c mà có
th∫ miêu t£ úng cßu trúc d˙ liªu có trong nhi∑u nghiên c˘u v∑ tính hÒp l˛ phân
cˆm. ∫ xác ‡nh sË cˆm tËi ˜u lu™n án s˚ dˆng hai chø sË phÍ bi∏n nh˜ sau.
(a) Hª sË phân ho§ch trong [8], [104] ˜Òc xác ‡nh nh˜ sau
PC(c) =
1
N
cX
i=1
NX
j=1
⌘2
ij (2.2)
trong ó 1
c
 PC(c)  1. Tìm sË cˆm tËi ˜u c⇤
b¨ng cách tìm lÌi gi£i c¸c
§i max2cN 1PC(c) ∫ ˜a ra hiªu n´ng phân cˆm tËt nhßt cho t™p d˙
liªu.
41
(b) Entropy phân ho§ch trong [6], [7] ˜Òc xác ‡nh nh˜ sau
PE(c) =
1
N
cX
i=1
NX
j=1
⌘ij log2 ⌘ij (2.3)
trong ó 0  PE(c)  log2 c. Tìm sË cˆm tËi ˜u c⇤
b¨ng cách tìm lÌi gi£i
c¸c ti∫u min2cN 1PE(c) ∫ ˜a ra hiªu n´ng phân cˆm tËt nhßt cho t™p
d˙ liªu.
‡nh nghæa 2.1. [CT6] Cho t™p d˙ liªu {I t
i }1iN ˜Òc phân thành C cˆm s˚
dˆng FCM vÓi tham sË p > 1. Î lªch chu©n  cˆm c (1  c  C) ˜Òc tính nh˜
sau :
t,c,j
def
=
v
u
u
t
NX
i=1
⌘p
t,c,i (I t
i [j] Vt,c[j])2
/
NX
i=1
⌘p
t,c,i , 8 1  j  Mt , (2.4)
Mªnh ∑ 2.1. [CT6] Gi£ s˚ {Vc}C
c=1 là t™p C vector tâm M chi∑u ( ¶u ra cıa
thu™t toán phân cˆm s˚ dˆng FCM), 8 c = 1, .., C. Khi ó Î lªch chu©n cıa cˆm
c tho£ mãn công th˘c sau :
2
t,c,j =
PN
i=1 ⌘p
t,c,i (I t
i [j])2
PN
i=1 ⌘p
t,c,i
V 2
t,c[j]. (2.5)
Ch˘ng minh. Theo công th˘c tính tâm d¸a vào FCM [8] ta có :
Vt,c,j =
NP
i=1
⌘p
t,c,i I t
i [j]/
NP
i=1
⌘p
t,c,i , 8 1  j  Mt , 8 1  j  Mt ,
2
t,c,j =
NX
i=1
⌘p
c,i I t
i [j] Vt,c[j]
2
/
NX
i=1
⌘p
c,i =
NX
i=1
⌘p
c,i I t
i [j]
2
2Vt,c[j]
NX
i=1
⌘p
c,i I t
i [j]
!
/
NX
i=1
⌘p
c,i + V 2
t,c
) 2
t,c,j =
NX
i=1
⌘p
c,i I t
i [j]
2
/
NX
i=1
⌘p
c,i 2V 2
t,c + V 2
t,c
=
NX
i=1
⌘p
c,i I t
i [j]
2
/
NX
i=1
⌘p
c,i V 2
t,c⌅
42
Sau khi phân cˆm, viªc chu©n hoá ˜Òc th¸c hiªn xem nh˜ mÎt m rÎng cıa
chu©n hóa theo lu™t 3 . Chu©n hoá ˜Òc th¸c hiªn trên t¯ng cˆm, sau ó k∏t
nh™p các k∏t qu£ l§i theo ‡nh nghæa 2.2. Chu©n hoá c£i ti∏n ˜Òc th¸c hiªn cho
các thành ph¶n ∞c tr˜ng, gÂi t≠t là chu©n hoá 3 FCM .
‡nh nghæa 2.2. [CT6] Phép chu©n hóa 3 FCM .
Cho x = {x[j]}Mt
j=1 , ˜x = {˜x[j]}Mt
j=1 , 8 1  j  Mt , ˜Òc ‡nh nghæa nh˜ sau
˜x[j]
def
=
min
1cC
n
x[j] Vt,c[j]
3 t,c,j
o
+ max
1cC
n
x[j] Vt,c[j]
3 t,c,j
o
C + 1
(2.6)
Ví dˆ 2.1 gi£i thích cách tìm ra Công th˘c (2.6) trong ó dùng phân tích ‡nh
tính, k∏t hÒp phân tích sË liªu th¸c nghiªm, ∞c biªt hóa ˜a ra công th˘c k∏t
hÒp và ki∫m tra trên d˙ liªu th¸c t∏.
Hình 2.2. Minh ho§ chu©n hóa 3 FCM
Ví dˆ 2.1. Gi£ s˚ x là mÎt thành ph¶n nh˜ Hình 2.2, xét tr˜Ìng hÒp ∞c biªt.
— Tr˜Ìng hÒp ∞c biªt hoá d˙ liªu phân 1 cˆm C = 1 : Chu©n hoá x nh˜
tr˜Ìng hÒp K .
43
— Tr˜Ìng hÒp ∞c biªt hoá d˙ liªu phân 2 cˆm, C = 2, 1 ⇡ 2 = , V2 V1 ⇡
3 , µ
def
= V1+V2
2
= 4.5 , thành ph¶n x có µ 4.5  x  µ +4.5 . Chu©n
hoá 3 cho x vÓi t¯ng cˆm nh˜ sau :
— Chu©n hoá x theo cˆm 1 ta có : ˜x = x V1
3
— Chu©n hoá x theo cˆm 2 ta có : ˜x = x V2
3
— K∏t nh™p k∏t qu£ theo Công th˘c (2.6) :
˜x[j]
def
=
min
1cC
⇢
x[j] Vc[j]
3 c,j
+ max
1cC
⇢
x[j] Vc[j]
3 c,j
C+1
,
nh˜ v™y ta có :
˜x =
min{x V1
3
,
x V2
3 }+max{x V1
3
,
x V2
3 }
C+1
(*), trong ó
min x V1
3
, x V2
3
= x V2
3
và max x V1
3
, x V2
3
= x V1
3
(**).
Thay (**) vào (*), ta có :
˜x =
x V2
3
+
x V1
3
C+1
=
2(x µ)
3
C+1
= x µ
3⇤
(C+1)
2
= x µ
K
, vÓi K = 4.5 = 3 ⇤ C+1
2
T˜Ïng t¸ khi C tùy ˛ và C > 1. Tr˜Ìng hÒp ∞c biªt hoá : 3 FCM tr thành
K , vÓi K = 3 ⇤ C+1
2
. VÓi d˙ liªu có nhi∑u cˆm mà dùng chu©n hoá theo phân
bË Gauss chu©n hoá K , ∫ £m b£o xác sußt “rÏi nhi∑u vào” o§n [-1 ;1] thì K
ph£i lÓn hÏn 3, khi ó d˙ liªu s≥ b‡ “co hµp l§i”.
Mªnh ∑ 2.2. [CT6] Phép chu©n hóa 3 FCM b£o toàn th˘ t¸, nghæa là :
x[j] y[j] ) ˜x[j] ˜y[j].
Hình 2.3. Minh ho§ tính chßt b£o toàn th˘ t¸ cıa chu©n hoá 3 FCM
Ch˘ng minh. Gi£ s˚ x và y là hai i∫m d˙ liªu n¨m trên cùng mÎt thành ph¶n
∞c tr˜ng ˜Òc minh ho§ nh˜ trong Hình 2.3.
44
8 1  c  C,
x[j] Vc[j]
3 c,j
y[j] Vc[j]
3 c,j
)
x[j] Vc[j]
3 c,j
min
1cC
⇢
x[j] Vc[j]
3 c,j
) min
1cC
⇢
x[j] Vc[j]
3 c,j
min
1cC
⇢
x[j] Vc[j]
3 c,j
8 1  c  C,
y[j] Vc[j]
3 c,j

x[j] Vc[j]
3 c,j
)
y[j] Vc[j]
3 c,j
 max
1cC
⇢
x[j] Vc[j]
3 c,j
) max
1cC
⇢
x[j] Vc[j]
3 c,j
max
1cC
⇢
y[j] Vc[j]
3 c,j
Nh˜ v™y 3 FCM có th∫ xem là m rÎng cıa phép chu©n hoá 3 (khi không
phân cˆm, C=1). Ngoài ra các Ph£n ví dˆ 2.1, 2.2 và 2.3 cho các phép bi∏n Íi
m rÎng 3 s˚ dˆng FCM không b£o toàn th˘ t¸ cÙng ˜Òc cho ∫ so sánh.
Ph£n ví dˆ 2.1. Fx[j] =
x[j] Vc0 [j]
3 c0,j
, vÓi c0 = arg min
1cC
x[j] Vc[j]
3 c,j
Ph£n ví dˆ 2.2. Fx[j] =
x[j] Vc0 [j]
3 c0,j
, vÓi c0 = arg min
1cC
mtP
j=1
(x[j] Vc[j])2
Ph£n ví dˆ 2.3. Fx[j] =
CP
c=1
⌘c,x
x[j] Vc[j]
3 c,j
, vÓi ⌘c,x =
mtP
j=1
(x[j] Vc[j])
2
! 1
p 1
CP
c0=1
mtP
j=1
(x[j] Vc0 [j])
2
! 1
p 1
Thu™t toán 2.1 th¸c hiªn chu©n hoá các ∞c tr˜ng cˆ th∫ theo ∑ xußt chu©n
hoá 3 FCM .
Trong Thu™t toán 2.1, tâm Vt,c cıa các cˆm n¨m trong ¶u ra cıa k∏t
qu£ thu™t toán phân cˆm FCM 4
[8]. Dπ thßy Thu™t toán 2.1 có Î ph˘c t§p
O (NCt Mt ). Trong ó các h¨ng sË : N là sË £nh có trong cÏ s d˙ liªu, Ct là sË
phân cˆm cho bÎ ∞c tr˜ng th˘ t và Mt là Î dài (sË thành ph¶n) cıa bÎ ∞c
tr˜ng t.
◊u i∫m cıa chu©n hoá ∑ xußt có tính linh ho§t khi ánh chø sË ∞c tr˜ng,
khi m rÎng thêm các ∞c tr˜ng khác không c¶n thay Íi thu™t toán.
4. https://www.mathworks.com/help/fuzzy/fcm.html
45
Thu™t toán 2.1 Chu©n hoá ∞c tr˜ng 3 FCM [CT6]
¶u vào: {I t
i }1iN ,1tT
h¨ng sË p = p(t) > 1, C = Ct 2 N+
,
C 2, Mt = dim(I t
i ), 8 i = 1, N
¶u ra: {˜I t
i }1iN . /* d˙ liªu ã ˜Òc chu©n hoá */
{Vt,c}1cCt . /* các tâm */
{ t,c,j }1cCt ,1jMt . /* Î lªch chu©n */
1: Tính FCM (Ct , pt , {I t
i }1iN ,1tT ) theo công th˘c (2.1), ta ˜Òc {Vt,c}1cCt
và { t,c,j }1cCt ,1jMt .
2: Tính { t,c,j }1cCt ,1jMt theo công th˘c (2.5).
3: for each I t
i : 8 j = 1, Mt do
4: Tính ˜I t
i [j] theo công th˘c 3 FCM (2.6) .
5: end for
6: Return
n
{˜I t
i }1iN , {Vt,c}1cCt , { t,c,j }1cCt ,1jMt
o
2.2 Chu©n hoá kho£ng cách d¸a vào phân cˆm
FCM
Gi£ ‡nh ban ¶u T là sË bÎ ∞c tr˜ng, Î dài ∞c tr˜ng gÁm M chi∑u. Giá
tr‡ kho£ng cách £nh truy vßn vÓi mÈi £nh cÏ s d˙ liªu ˜Òc chu©n hoá theo Thu™t
toán 2.2.
Trong Thu™t toán 2.2, tâm V
(D)
t,c cıa các cˆm n¨m trong ¶u ra cıa k∏t qu£
thu™t toán phân cˆm FCM [8].
Dπ thßy Thu™t toán 2.2 có Î ph˘c t§p O
⇣
m ⇤ C
(D)
t
⌘
. K∏t qu£ ¶u ra xác
‡nh ˜Òc các giá tr‡ tâm cıa các cˆm theo t¯ng ∞c tr˜ng
n
V
(D)
t,c
o
1cC,1tT
và Î lªch chu©n
n
(D)
t,c
o
1cC,1tT
, các giá tr‡ này ˜Òc l˜u trong cÏ s d˙ liªu
∫ s˚ dˆng trong chu©n hoá l¶n sau.
Viªc chu©n hoá chø là mÎt khâu trong CBIR £m b£o k∏t qu£ tính Î t˜Ïng
mÎt cách chính xác hÏn, c£i thiªn t™p k∏t qu£ có Î t˜Ïng t¸ cao nhßt hi∫n th‡ cho
ng˜Ìi dùng, t¯ ó nâng cao hiªu qu£ truy vßn. ∫ gi£m kho£ng trËng ng˙ nghæa,
nâng cao hiªu n´ng Î chính xác tho£ mãn nh™n th˘c ng˜Ìi dùng, kˇ thu™t hiªu
chønh trÂng sË và d‡ch chuy∫n truy vßn s≥ ˜Òc trình bày trong Mˆc 2.3.
46
Thu™t toán 2.2 Chu©n hoá kho£ng cách 3 FCM theo bÎ ∞c tr˜ng [CT6]
¶u vào: {˜I t
i }1iN . /* T™p các vector ∞c tr˜ng ã chu©n hoá 3 FCM */
{Vt,c}1cCt . /* T™p các tâm theo t¯ng bÎ ∞c tr˜ng */
{ t,c,j }1cCt ,1jMt . /* Î lªch chu©n */
h¨ng sË p = p(t) > 1, C = C(t) 2 N+
, C 2
¶u ra: {V
(D)
t,c }1cC
(D)
t
. /* T™p tâm */
{
(D)
t,c }1cC
(D)
t
. /* Î lªch chu©n */
1: B˜Óc 1 :
(1) Sinh ra hai t™p gÁm K giá tr‡ chø sË ng®u nhiên RD1 = {RD1,i }1iK , và
RD2 = {RD2,i }1iK tho£ mãn :
(1.1) RD1  RD2 = ?, RD1,i < RD1,j , RD2,i < RD2,j , 8 1  i  j  K.
(1.2) 1  RD1,i , RD2,i  N , 8 1  i  N (chÂn K = [N /10], m = K2
.
(2) Xác ‡nh t™p giá tr‡ D(˜I t
RD1,i
, ˜I t
RD1,i
) ˜Òc t™p giá tr‡ sË d˜Ïng {dk }1km
2: B˜Óc 2 : FCM (C
(D)
t , pt ) {dk }1km ta ˜Òc t™p tâm
n
V
(D)
t,c
oC
(D)
t
c=1
và
n
⌘
(D)
t,c,i
o
1cC
(D)
t ,1im
theo Công th˘c (2.1)
3: B˜Óc 3 : Tính
n
(D)
t,c
o
1cC
(D)
t
theo Công th˘c (2.5)
(B˜Óc 2 và 3, s˚ dˆng Công th˘c (2.1), (2.5), (2.6) thay th∏ d˙ liªu ∞c tr˜ng
b¨ng giá tr‡ kho£ng cách là các sË th¸c d˜Ïng vô h˜Óng.)
4: Return
(
n
V
(D)
t,c
oC
(D)
t
c=1
,
n
(D)
t,c
o
1cC
(D)
t
)
2.3 Hiªu chønh trÂng sË, d‡ch chuy∫n truy vßn
Trong CBIR có nhi∑u kˇ thu™t nh¨m gi£m kho£ng trËng ng˙ nghæa. Hiªu
chønh trÂng sË là mÎt trong sË các kˇ thu™t hÂc thông tin ánh giá cıa ng˜Ìi
dùng. Trong tra c˘u, thông th˜Ìng chø hi∫n th‡ k∏t qu£ tra c˘u trên màn hình là
t™p k∏t qu£ top k. Î t˜Ïng t¸ cıa các £nh trong cÏ s d˙ liªu vÓi £nh truy
vßn th˜Ìng s˚ dˆng Î o kho£ng cách gi˙a các vector ∞c tr˜ng. ∫ i∑u chønh
l§i Î t˜Ïng t¸ th˜Ìng thông qua tính l§i hàm kho£ng cách k∏t hÒp vÓi trÂng sË.
Sau cùng ta có t™p k∏t qu£ top k mÓi có Î chính xác tËt hÏn.
∫ nâng cao hiªu qu£ Î chính xác tra c˘u và g¶n vÓi nh™n th˘c ng˜Ìi dùng,
kˇ thu™t hiªu chønh trÂng sË, d‡ch chuy∫n truy vßn ˜Òc ∑ xußt. Trong ∑ xußt
này, mÈi bÎ ∞c tr˜ng có t¶m óng góp quan trÂng nh˜ nhau, không phân biªt
theo mÈi ki∫u ∞c tr˜ng nh˜ trong [90] (nghiên c˘u này phân biªt theo ki∫u ∞c
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620

More Related Content

What's hot

5 cuong-toan van-luan_an_130107144049
5 cuong-toan van-luan_an_1301071440495 cuong-toan van-luan_an_130107144049
5 cuong-toan van-luan_an_130107144049
Phong Tân
 
Giai tich 1
Giai tich 1Giai tich 1
Giai tich 1
Vcoi Vit
 
Giáo trình kỹ thuật thủy khí pgs.ts.hoàng đức liên, 276 trang
Giáo trình kỹ thuật thủy khí   pgs.ts.hoàng đức liên, 276 trangGiáo trình kỹ thuật thủy khí   pgs.ts.hoàng đức liên, 276 trang
Giáo trình kỹ thuật thủy khí pgs.ts.hoàng đức liên, 276 trang
loneny_0110
 
BUI CONG DUNG_CHIEN LUOC PHAT TRIEN KD.pdf
BUI CONG DUNG_CHIEN LUOC PHAT TRIEN KD.pdfBUI CONG DUNG_CHIEN LUOC PHAT TRIEN KD.pdf
BUI CONG DUNG_CHIEN LUOC PHAT TRIEN KD.pdf
thanhechip99
 

What's hot (20)

Cac ham so so hoc
Cac ham so so hocCac ham so so hoc
Cac ham so so hoc
 
5 cuong-toan van-luan_an_130107144049
5 cuong-toan van-luan_an_1301071440495 cuong-toan van-luan_an_130107144049
5 cuong-toan van-luan_an_130107144049
 
31 đề thi Nền móng - Đại học Xây dựng
31 đề thi Nền móng - Đại học Xây dựng31 đề thi Nền móng - Đại học Xây dựng
31 đề thi Nền móng - Đại học Xây dựng
 
Giải pháp mở rộng XK rau quả vào thị trường Hoa Kỳ 2
Giải pháp mở rộng XK rau quả vào thị trường Hoa Kỳ 2Giải pháp mở rộng XK rau quả vào thị trường Hoa Kỳ 2
Giải pháp mở rộng XK rau quả vào thị trường Hoa Kỳ 2
 
Luận văn: Hoàn thiện hệ thống kiểm soát nội bộ đối với nghiệp vụ tín dụng tro...
Luận văn: Hoàn thiện hệ thống kiểm soát nội bộ đối với nghiệp vụ tín dụng tro...Luận văn: Hoàn thiện hệ thống kiểm soát nội bộ đối với nghiệp vụ tín dụng tro...
Luận văn: Hoàn thiện hệ thống kiểm soát nội bộ đối với nghiệp vụ tín dụng tro...
 
KẾT CẤU GẠCH ĐÁ GHỖ : CHƯƠNG 3
KẾT CẤU GẠCH ĐÁ GHỖ : CHƯƠNG 3KẾT CẤU GẠCH ĐÁ GHỖ : CHƯƠNG 3
KẾT CẤU GẠCH ĐÁ GHỖ : CHƯƠNG 3
 
Luận văn: Một số giải pháp năng cao lợi thế cạnh tranh của VNPT mảng viễn thông
Luận văn: Một số giải pháp năng cao lợi thế cạnh tranh của VNPT mảng viễn thôngLuận văn: Một số giải pháp năng cao lợi thế cạnh tranh của VNPT mảng viễn thông
Luận văn: Một số giải pháp năng cao lợi thế cạnh tranh của VNPT mảng viễn thông
 
Luận án: Hoàn thiện kiểm tra phân tích báo cáo tài chính với việc tăng cường ...
Luận án: Hoàn thiện kiểm tra phân tích báo cáo tài chính với việc tăng cường ...Luận án: Hoàn thiện kiểm tra phân tích báo cáo tài chính với việc tăng cường ...
Luận án: Hoàn thiện kiểm tra phân tích báo cáo tài chính với việc tăng cường ...
 
Luận văn: Các yếu tố ảnh hưởng đến sự thỏa mãn và sự gắn kết của nhân viên Hợ...
Luận văn: Các yếu tố ảnh hưởng đến sự thỏa mãn và sự gắn kết của nhân viên Hợ...Luận văn: Các yếu tố ảnh hưởng đến sự thỏa mãn và sự gắn kết của nhân viên Hợ...
Luận văn: Các yếu tố ảnh hưởng đến sự thỏa mãn và sự gắn kết của nhân viên Hợ...
 
Bảo trợ xã hội_10523212092019
Bảo trợ xã hội_10523212092019Bảo trợ xã hội_10523212092019
Bảo trợ xã hội_10523212092019
 
Tcvn iso 9004 2000
Tcvn iso 9004 2000Tcvn iso 9004 2000
Tcvn iso 9004 2000
 
Luận án: Nâng cao sức cạnh tranh một số mặt hàng nông sản xuất khẩu chủ yếu c...
Luận án: Nâng cao sức cạnh tranh một số mặt hàng nông sản xuất khẩu chủ yếu c...Luận án: Nâng cao sức cạnh tranh một số mặt hàng nông sản xuất khẩu chủ yếu c...
Luận án: Nâng cao sức cạnh tranh một số mặt hàng nông sản xuất khẩu chủ yếu c...
 
Luận án: Giải pháp phát triển dịch vụ thẻ tại các ngân hàng thương mại nhà nư...
Luận án: Giải pháp phát triển dịch vụ thẻ tại các ngân hàng thương mại nhà nư...Luận án: Giải pháp phát triển dịch vụ thẻ tại các ngân hàng thương mại nhà nư...
Luận án: Giải pháp phát triển dịch vụ thẻ tại các ngân hàng thương mại nhà nư...
 
Luận Văn Thiết Kế Hệ SCADA Dùng WinCC (Kèm Step7+ WinCC)
Luận Văn Thiết Kế Hệ SCADA Dùng WinCC (Kèm Step7+ WinCC) Luận Văn Thiết Kế Hệ SCADA Dùng WinCC (Kèm Step7+ WinCC)
Luận Văn Thiết Kế Hệ SCADA Dùng WinCC (Kèm Step7+ WinCC)
 
Luận văn: Xây dựng chiến lược phát triển Công ty TNHH một thành viên Thuốc Th...
Luận văn: Xây dựng chiến lược phát triển Công ty TNHH một thành viên Thuốc Th...Luận văn: Xây dựng chiến lược phát triển Công ty TNHH một thành viên Thuốc Th...
Luận văn: Xây dựng chiến lược phát triển Công ty TNHH một thành viên Thuốc Th...
 
KẾT CẤU GẠCH ĐÁ GHỖ : CHƯƠNG 4
KẾT CẤU GẠCH ĐÁ GHỖ : CHƯƠNG 4KẾT CẤU GẠCH ĐÁ GHỖ : CHƯƠNG 4
KẾT CẤU GẠCH ĐÁ GHỖ : CHƯƠNG 4
 
Giai tich 1
Giai tich 1Giai tich 1
Giai tich 1
 
Giáo trình kỹ thuật thủy khí pgs.ts.hoàng đức liên, 276 trang
Giáo trình kỹ thuật thủy khí   pgs.ts.hoàng đức liên, 276 trangGiáo trình kỹ thuật thủy khí   pgs.ts.hoàng đức liên, 276 trang
Giáo trình kỹ thuật thủy khí pgs.ts.hoàng đức liên, 276 trang
 
BUI CONG DUNG_CHIEN LUOC PHAT TRIEN KD.pdf
BUI CONG DUNG_CHIEN LUOC PHAT TRIEN KD.pdfBUI CONG DUNG_CHIEN LUOC PHAT TRIEN KD.pdf
BUI CONG DUNG_CHIEN LUOC PHAT TRIEN KD.pdf
 
Luận văn: Ngân hàng Đông Á chi nhánh tại tỉnh Thái Bình, HOT
Luận văn: Ngân hàng Đông Á chi nhánh tại tỉnh Thái Bình, HOTLuận văn: Ngân hàng Đông Á chi nhánh tại tỉnh Thái Bình, HOT
Luận văn: Ngân hàng Đông Á chi nhánh tại tỉnh Thái Bình, HOT
 

Similar to Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620

Phân tích và đánh giá hiệu quả công nghệ truyền tải điện cao áp một chiều tro...
Phân tích và đánh giá hiệu quả công nghệ truyền tải điện cao áp một chiều tro...Phân tích và đánh giá hiệu quả công nghệ truyền tải điện cao áp một chiều tro...
Phân tích và đánh giá hiệu quả công nghệ truyền tải điện cao áp một chiều tro...
Man_Ebook
 
Luan van tien si kinh te quoc dan neu (14)
Luan van tien si kinh te quoc dan neu (14)Luan van tien si kinh te quoc dan neu (14)
Luan van tien si kinh te quoc dan neu (14)
Nguyễn Công Huy
 
Thử nghiệm trạm biến áp cách điện khí SF6.pdf
Thử nghiệm trạm biến áp cách điện khí SF6.pdfThử nghiệm trạm biến áp cách điện khí SF6.pdf
Thử nghiệm trạm biến áp cách điện khí SF6.pdf
Man_Ebook
 
Phân tích, đánh giá hiện tượng cộng hưởng tần số thấp trong hệ thống điện.pdf
Phân tích, đánh giá hiện tượng cộng hưởng tần số thấp trong hệ thống điện.pdfPhân tích, đánh giá hiện tượng cộng hưởng tần số thấp trong hệ thống điện.pdf
Phân tích, đánh giá hiện tượng cộng hưởng tần số thấp trong hệ thống điện.pdf
Man_Ebook
 

Similar to Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620 (20)

Luận án: Các yếu tố ảnh hưởng đến mức độ chấp nhận mô hình thẻ điểm cân bằng ...
Luận án: Các yếu tố ảnh hưởng đến mức độ chấp nhận mô hình thẻ điểm cân bằng ...Luận án: Các yếu tố ảnh hưởng đến mức độ chấp nhận mô hình thẻ điểm cân bằng ...
Luận án: Các yếu tố ảnh hưởng đến mức độ chấp nhận mô hình thẻ điểm cân bằng ...
 
La01.028 tiếp cận và phân tích động thái giá cả lạm phát của việt nam trong...
La01.028 tiếp cận và phân tích động thái giá cả   lạm phát của việt nam trong...La01.028 tiếp cận và phân tích động thái giá cả   lạm phát của việt nam trong...
La01.028 tiếp cận và phân tích động thái giá cả lạm phát của việt nam trong...
 
LA01.028_Tiếp cận và phân tích động thái giá cả - lạm phát của Việt Nam trong...
LA01.028_Tiếp cận và phân tích động thái giá cả - lạm phát của Việt Nam trong...LA01.028_Tiếp cận và phân tích động thái giá cả - lạm phát của Việt Nam trong...
LA01.028_Tiếp cận và phân tích động thái giá cả - lạm phát của Việt Nam trong...
 
Luận văn: Tổ chức công tác kế toán quản trị chi phí, giá thành tại Tổng công ...
Luận văn: Tổ chức công tác kế toán quản trị chi phí, giá thành tại Tổng công ...Luận văn: Tổ chức công tác kế toán quản trị chi phí, giá thành tại Tổng công ...
Luận văn: Tổ chức công tác kế toán quản trị chi phí, giá thành tại Tổng công ...
 
Phân tích và đánh giá hiệu quả công nghệ truyền tải điện cao áp một chiều tro...
Phân tích và đánh giá hiệu quả công nghệ truyền tải điện cao áp một chiều tro...Phân tích và đánh giá hiệu quả công nghệ truyền tải điện cao áp một chiều tro...
Phân tích và đánh giá hiệu quả công nghệ truyền tải điện cao áp một chiều tro...
 
Luận văn: Một số giải pháp gia tăng giá trị dành cho khách hàng được cảm nhận...
Luận văn: Một số giải pháp gia tăng giá trị dành cho khách hàng được cảm nhận...Luận văn: Một số giải pháp gia tăng giá trị dành cho khách hàng được cảm nhận...
Luận văn: Một số giải pháp gia tăng giá trị dành cho khách hàng được cảm nhận...
 
Luan van tien si kinh te quoc dan neu (14)
Luan van tien si kinh te quoc dan neu (14)Luan van tien si kinh te quoc dan neu (14)
Luan van tien si kinh te quoc dan neu (14)
 
Luận án: Nghiên cứu đề xuất các giải pháp nâng cao chất lượng kiểm định xe cơ...
Luận án: Nghiên cứu đề xuất các giải pháp nâng cao chất lượng kiểm định xe cơ...Luận án: Nghiên cứu đề xuất các giải pháp nâng cao chất lượng kiểm định xe cơ...
Luận án: Nghiên cứu đề xuất các giải pháp nâng cao chất lượng kiểm định xe cơ...
 
Luận án: Nghiên cứu các hình thức tổ chức lãnh thổ sản xuất chè ở vùng Đông ...
Luận án: Nghiên cứu các hình thức tổ chức lãnh thổ sản xuất chè ở vùng Đông  ...Luận án: Nghiên cứu các hình thức tổ chức lãnh thổ sản xuất chè ở vùng Đông  ...
Luận án: Nghiên cứu các hình thức tổ chức lãnh thổ sản xuất chè ở vùng Đông ...
 
Thử nghiệm trạm biến áp cách điện khí SF6.pdf
Thử nghiệm trạm biến áp cách điện khí SF6.pdfThử nghiệm trạm biến áp cách điện khí SF6.pdf
Thử nghiệm trạm biến áp cách điện khí SF6.pdf
 
Phân tích, đánh giá hiện tượng cộng hưởng tần số thấp trong hệ thống điện.pdf
Phân tích, đánh giá hiện tượng cộng hưởng tần số thấp trong hệ thống điện.pdfPhân tích, đánh giá hiện tượng cộng hưởng tần số thấp trong hệ thống điện.pdf
Phân tích, đánh giá hiện tượng cộng hưởng tần số thấp trong hệ thống điện.pdf
 
Đề tài: Học bán giám sát trên đồ thị với ứng dụng tra cứu ảnh, HOT
Đề tài: Học bán giám sát trên đồ thị với ứng dụng tra cứu ảnh, HOTĐề tài: Học bán giám sát trên đồ thị với ứng dụng tra cứu ảnh, HOT
Đề tài: Học bán giám sát trên đồ thị với ứng dụng tra cứu ảnh, HOT
 
Luận văn: Học bán giám sát trên đồ thị với ứng dụng tra cứu ảnh
Luận văn: Học bán giám sát trên đồ thị với ứng dụng tra cứu ảnhLuận văn: Học bán giám sát trên đồ thị với ứng dụng tra cứu ảnh
Luận văn: Học bán giám sát trên đồ thị với ứng dụng tra cứu ảnh
 
Điều khiển nghịch lưu nguồn Z ứng dụng cho hệ phát điện phân tán
Điều khiển nghịch lưu nguồn Z ứng dụng cho hệ phát điện phân tánĐiều khiển nghịch lưu nguồn Z ứng dụng cho hệ phát điện phân tán
Điều khiển nghịch lưu nguồn Z ứng dụng cho hệ phát điện phân tán
 
Luận án: Phát triển nguồn nhân lực của Tập đoàn điện lực Việt Nam đến năm 2015
Luận án: Phát triển nguồn nhân lực của Tập đoàn điện lực Việt Nam đến năm 2015Luận án: Phát triển nguồn nhân lực của Tập đoàn điện lực Việt Nam đến năm 2015
Luận án: Phát triển nguồn nhân lực của Tập đoàn điện lực Việt Nam đến năm 2015
 
Phương pháp tối ưu trong giai đoạn phát triển phần mềm nhũng
Phương pháp tối ưu trong giai đoạn phát triển phần mềm nhũngPhương pháp tối ưu trong giai đoạn phát triển phần mềm nhũng
Phương pháp tối ưu trong giai đoạn phát triển phần mềm nhũng
 
Luận án: Cầu tiền và hệ quả đối với chính sách tiền tệ ở Việt Nam, HAY
Luận án: Cầu tiền và hệ quả đối với chính sách tiền tệ ở Việt Nam, HAYLuận án: Cầu tiền và hệ quả đối với chính sách tiền tệ ở Việt Nam, HAY
Luận án: Cầu tiền và hệ quả đối với chính sách tiền tệ ở Việt Nam, HAY
 
Luận văn: Nghiên cứu các nhân tố tác động đến ý định sử dụng ví điện tử tại V...
Luận văn: Nghiên cứu các nhân tố tác động đến ý định sử dụng ví điện tử tại V...Luận văn: Nghiên cứu các nhân tố tác động đến ý định sử dụng ví điện tử tại V...
Luận văn: Nghiên cứu các nhân tố tác động đến ý định sử dụng ví điện tử tại V...
 
đồ áN ngành may triển khai sản xuất mã hàng áo jacket 2 lớp nửa bó sát 2 túi ...
đồ áN ngành may triển khai sản xuất mã hàng áo jacket 2 lớp nửa bó sát 2 túi ...đồ áN ngành may triển khai sản xuất mã hàng áo jacket 2 lớp nửa bó sát 2 túi ...
đồ áN ngành may triển khai sản xuất mã hàng áo jacket 2 lớp nửa bó sát 2 túi ...
 
Luận án: Phân tích chuỗi giá trị và tổ chức quan hệ liên kết của các doanh ng...
Luận án: Phân tích chuỗi giá trị và tổ chức quan hệ liên kết của các doanh ng...Luận án: Phân tích chuỗi giá trị và tổ chức quan hệ liên kết của các doanh ng...
Luận án: Phân tích chuỗi giá trị và tổ chức quan hệ liên kết của các doanh ng...
 

More from Dịch vụ viết bài trọn gói ZALO: 0909232620

More from Dịch vụ viết bài trọn gói ZALO: 0909232620 (20)

Danh Sách 200 Đề Tài Tiểu Luận Chuyên Viên Chính Về Bảo Hiểm Xã Hội Mới Nhất
Danh Sách 200 Đề Tài Tiểu Luận Chuyên Viên Chính Về Bảo Hiểm Xã Hội Mới NhấtDanh Sách 200 Đề Tài Tiểu Luận Chuyên Viên Chính Về Bảo Hiểm Xã Hội Mới Nhất
Danh Sách 200 Đề Tài Tiểu Luận Chuyên Viên Chính Về Bảo Hiểm Xã Hội Mới Nhất
 
Danh Sách 200 Đề Tài Luận Văn Thạc Sĩ Quản Trị Nguồn Nhân Lực, 9 Điểm
Danh Sách 200 Đề Tài Luận Văn Thạc Sĩ Quản Trị Nguồn Nhân Lực, 9 ĐiểmDanh Sách 200 Đề Tài Luận Văn Thạc Sĩ Quản Trị Nguồn Nhân Lực, 9 Điểm
Danh Sách 200 Đề Tài Luận Văn Thạc Sĩ Quản Trị Nguồn Nhân Lực, 9 Điểm
 
Danh Sách 200 Đề Tài Luận Văn Thạc Sĩ Quản Lý Văn Hóa Giúp Bạn Thêm Ý Tưởng
Danh Sách 200 Đề Tài Luận Văn Thạc Sĩ Quản Lý Văn Hóa Giúp Bạn Thêm Ý TưởngDanh Sách 200 Đề Tài Luận Văn Thạc Sĩ Quản Lý Văn Hóa Giúp Bạn Thêm Ý Tưởng
Danh Sách 200 Đề Tài Luận Văn Thạc Sĩ Quản Lý Văn Hóa Giúp Bạn Thêm Ý Tưởng
 
Danh Sách 200 Đề Tài Báo Cáo Thực Tập Quản Lý Giáo Dục Dễ Làm Điểm Cao
Danh Sách 200 Đề Tài Báo Cáo Thực Tập Quản Lý Giáo Dục Dễ Làm Điểm CaoDanh Sách 200 Đề Tài Báo Cáo Thực Tập Quản Lý Giáo Dục Dễ Làm Điểm Cao
Danh Sách 200 Đề Tài Báo Cáo Thực Tập Quản Lý Giáo Dục Dễ Làm Điểm Cao
 
Danh Sách 200 Đề Tài Báo Cáo Thực Tập Quan Hệ Lao Động Từ Sinh Viên Giỏi
Danh Sách 200 Đề Tài Báo Cáo Thực Tập Quan Hệ Lao Động Từ Sinh Viên GiỏiDanh Sách 200 Đề Tài Báo Cáo Thực Tập Quan Hệ Lao Động Từ Sinh Viên Giỏi
Danh Sách 200 Đề Tài Báo Cáo Thực Tập Quan Hệ Lao Động Từ Sinh Viên Giỏi
 
Danh Sách 200 Đề Tài Báo Cáo Thực Tập Nuôi Trồng Thủy Sản Dễ Làm Nhất
Danh Sách 200 Đề Tài Báo Cáo Thực Tập Nuôi Trồng Thủy Sản Dễ Làm NhấtDanh Sách 200 Đề Tài Báo Cáo Thực Tập Nuôi Trồng Thủy Sản Dễ Làm Nhất
Danh Sách 200 Đề Tài Báo Cáo Thực Tập Nuôi Trồng Thủy Sản Dễ Làm Nhất
 
Danh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Sư, Mới Nhất, Điểm Cao
Danh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Sư, Mới Nhất, Điểm CaoDanh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Sư, Mới Nhất, Điểm Cao
Danh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Sư, Mới Nhất, Điểm Cao
 
Danh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Phòng, Chống Hiv, Mới Nhất, Điểm Cao
Danh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Phòng, Chống Hiv, Mới Nhất, Điểm CaoDanh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Phòng, Chống Hiv, Mới Nhất, Điểm Cao
Danh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Phòng, Chống Hiv, Mới Nhất, Điểm Cao
 
Danh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Phá Sản, Mới Nhất
Danh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Phá Sản, Mới NhấtDanh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Phá Sản, Mới Nhất
Danh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Phá Sản, Mới Nhất
 
Danh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Nhà Ở, Điểm Cao
Danh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Nhà Ở, Điểm CaoDanh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Nhà Ở, Điểm Cao
Danh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Nhà Ở, Điểm Cao
 
Danh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Ngân Hàng, Mới Nhất
Danh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Ngân Hàng, Mới NhấtDanh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Ngân Hàng, Mới Nhất
Danh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Ngân Hàng, Mới Nhất
 
Danh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Môi Trường, Mới Nhất
Danh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Môi Trường, Mới NhấtDanh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Môi Trường, Mới Nhất
Danh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Môi Trường, Mới Nhất
 
Danh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Hộ Tịch, Điểm Cao
Danh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Hộ Tịch, Điểm CaoDanh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Hộ Tịch, Điểm Cao
Danh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Hộ Tịch, Điểm Cao
 
Danh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Hình Sự , Dễ Làm Điểm Cao
Danh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Hình Sự , Dễ Làm Điểm CaoDanh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Hình Sự , Dễ Làm Điểm Cao
Danh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Hình Sự , Dễ Làm Điểm Cao
 
Danh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Hành Chính, Dễ Làm Điểm Cao
Danh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Hành Chính, Dễ Làm Điểm CaoDanh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Hành Chính, Dễ Làm Điểm Cao
Danh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Hành Chính, Dễ Làm Điểm Cao
 
Danh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Giáo Dục, Điểm Cao
Danh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Giáo Dục, Điểm CaoDanh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Giáo Dục, Điểm Cao
Danh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Giáo Dục, Điểm Cao
 
Danh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Đấu Thầu, Từ Sinh Viên Khá Giỏi
Danh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Đấu Thầu, Từ Sinh Viên Khá GiỏiDanh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Đấu Thầu, Từ Sinh Viên Khá Giỏi
Danh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Đấu Thầu, Từ Sinh Viên Khá Giỏi
 
Danh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Đầu Tư, Dễ Làm Điểm Cao
Danh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Đầu Tư, Dễ Làm Điểm CaoDanh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Đầu Tư, Dễ Làm Điểm Cao
Danh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Đầu Tư, Dễ Làm Điểm Cao
 
Danh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Đầu Tư Công, Dễ Làm Điểm Cao
Danh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Đầu Tư Công, Dễ Làm Điểm CaoDanh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Đầu Tư Công, Dễ Làm Điểm Cao
Danh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Đầu Tư Công, Dễ Làm Điểm Cao
 
Danh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Đất Đai, Từ Sinh Viên Khá Giỏi
Danh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Đất Đai, Từ Sinh Viên Khá GiỏiDanh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Đất Đai, Từ Sinh Viên Khá Giỏi
Danh Sách 200 Đề Tài Báo Cáo Thực Tập Luật Đất Đai, Từ Sinh Viên Khá Giỏi
 

Recently uploaded

SLIDE - Tu van, huong dan cong tac tuyen sinh-2024 (đầy đủ chi tiết).pdf
SLIDE - Tu van, huong dan cong tac tuyen sinh-2024 (đầy đủ chi tiết).pdfSLIDE - Tu van, huong dan cong tac tuyen sinh-2024 (đầy đủ chi tiết).pdf
SLIDE - Tu van, huong dan cong tac tuyen sinh-2024 (đầy đủ chi tiết).pdf
hoangtuansinh1
 

Recently uploaded (20)

sách sinh học đại cương - Textbook.pdf
sách sinh học đại cương   -   Textbook.pdfsách sinh học đại cương   -   Textbook.pdf
sách sinh học đại cương - Textbook.pdf
 
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 7 GLOBAL SUCCESS (2 CỘ...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 7 GLOBAL SUCCESS (2 CỘ...GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 7 GLOBAL SUCCESS (2 CỘ...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 7 GLOBAL SUCCESS (2 CỘ...
 
Kiểm tra cuối học kì 1 sinh học 12 đề tham khảo
Kiểm tra cuối học kì 1 sinh học 12 đề tham khảoKiểm tra cuối học kì 1 sinh học 12 đề tham khảo
Kiểm tra cuối học kì 1 sinh học 12 đề tham khảo
 
SÁNG KIẾN ÁP DỤNG CLT (COMMUNICATIVE LANGUAGE TEACHING) VÀO QUÁ TRÌNH DẠY - H...
SÁNG KIẾN ÁP DỤNG CLT (COMMUNICATIVE LANGUAGE TEACHING) VÀO QUÁ TRÌNH DẠY - H...SÁNG KIẾN ÁP DỤNG CLT (COMMUNICATIVE LANGUAGE TEACHING) VÀO QUÁ TRÌNH DẠY - H...
SÁNG KIẾN ÁP DỤNG CLT (COMMUNICATIVE LANGUAGE TEACHING) VÀO QUÁ TRÌNH DẠY - H...
 
Giới thiệu Dự án Sản Phụ Khoa - Y Học Cộng Đồng
Giới thiệu Dự án Sản Phụ Khoa - Y Học Cộng ĐồngGiới thiệu Dự án Sản Phụ Khoa - Y Học Cộng Đồng
Giới thiệu Dự án Sản Phụ Khoa - Y Học Cộng Đồng
 
powerpoint mẫu họp phụ huynh cuối kì 2 học sinh lớp 7 bgs
powerpoint mẫu họp phụ huynh cuối kì 2 học sinh lớp 7 bgspowerpoint mẫu họp phụ huynh cuối kì 2 học sinh lớp 7 bgs
powerpoint mẫu họp phụ huynh cuối kì 2 học sinh lớp 7 bgs
 
cac-cau-noi-tthcm.pdf-cac-cau-noi-tthcm-
cac-cau-noi-tthcm.pdf-cac-cau-noi-tthcm-cac-cau-noi-tthcm.pdf-cac-cau-noi-tthcm-
cac-cau-noi-tthcm.pdf-cac-cau-noi-tthcm-
 
kinh tế chính trị mác lênin chương hai và hàng hoá và sxxhh
kinh tế chính trị mác lênin chương hai và hàng hoá và sxxhhkinh tế chính trị mác lênin chương hai và hàng hoá và sxxhh
kinh tế chính trị mác lênin chương hai và hàng hoá và sxxhh
 
SLIDE - Tu van, huong dan cong tac tuyen sinh-2024 (đầy đủ chi tiết).pdf
SLIDE - Tu van, huong dan cong tac tuyen sinh-2024 (đầy đủ chi tiết).pdfSLIDE - Tu van, huong dan cong tac tuyen sinh-2024 (đầy đủ chi tiết).pdf
SLIDE - Tu van, huong dan cong tac tuyen sinh-2024 (đầy đủ chi tiết).pdf
 
BỘ LUYỆN NGHE VÀO 10 TIẾNG ANH DẠNG TRẮC NGHIỆM 4 CÂU TRẢ LỜI - CÓ FILE NGHE.pdf
BỘ LUYỆN NGHE VÀO 10 TIẾNG ANH DẠNG TRẮC NGHIỆM 4 CÂU TRẢ LỜI - CÓ FILE NGHE.pdfBỘ LUYỆN NGHE VÀO 10 TIẾNG ANH DẠNG TRẮC NGHIỆM 4 CÂU TRẢ LỜI - CÓ FILE NGHE.pdf
BỘ LUYỆN NGHE VÀO 10 TIẾNG ANH DẠNG TRẮC NGHIỆM 4 CÂU TRẢ LỜI - CÓ FILE NGHE.pdf
 
GIÁO TRÌNH KHỐI NGUỒN CÁC LOẠI - ĐIỆN LẠNH BÁCH KHOA HÀ NỘI
GIÁO TRÌNH  KHỐI NGUỒN CÁC LOẠI - ĐIỆN LẠNH BÁCH KHOA HÀ NỘIGIÁO TRÌNH  KHỐI NGUỒN CÁC LOẠI - ĐIỆN LẠNH BÁCH KHOA HÀ NỘI
GIÁO TRÌNH KHỐI NGUỒN CÁC LOẠI - ĐIỆN LẠNH BÁCH KHOA HÀ NỘI
 
1.DOANNGOCPHUONGTHAO-APDUNGSTEMTHIETKEBTHHHGIUPHSHOCHIEUQUA (1).docx
1.DOANNGOCPHUONGTHAO-APDUNGSTEMTHIETKEBTHHHGIUPHSHOCHIEUQUA (1).docx1.DOANNGOCPHUONGTHAO-APDUNGSTEMTHIETKEBTHHHGIUPHSHOCHIEUQUA (1).docx
1.DOANNGOCPHUONGTHAO-APDUNGSTEMTHIETKEBTHHHGIUPHSHOCHIEUQUA (1).docx
 
PHƯƠNG THỨC VẬN TẢI ĐƯỜNG SẮT TRONG VẬN TẢI
PHƯƠNG THỨC VẬN TẢI ĐƯỜNG SẮT TRONG VẬN TẢIPHƯƠNG THỨC VẬN TẢI ĐƯỜNG SẮT TRONG VẬN TẢI
PHƯƠNG THỨC VẬN TẢI ĐƯỜNG SẮT TRONG VẬN TẢI
 
Các điều kiện bảo hiểm trong bảo hiểm hàng hoá
Các điều kiện bảo hiểm trong bảo hiểm hàng hoáCác điều kiện bảo hiểm trong bảo hiểm hàng hoá
Các điều kiện bảo hiểm trong bảo hiểm hàng hoá
 
TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI LÝ LUẬN VĂN HỌC NĂM HỌC 2023-2024 - MÔN NGỮ ...
TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI LÝ LUẬN VĂN HỌC NĂM HỌC 2023-2024 - MÔN NGỮ ...TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI LÝ LUẬN VĂN HỌC NĂM HỌC 2023-2024 - MÔN NGỮ ...
TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI LÝ LUẬN VĂN HỌC NĂM HỌC 2023-2024 - MÔN NGỮ ...
 
Danh sách sinh viên tốt nghiệp Đại học - Cao đẳng Trường Đại học Phú Yên năm ...
Danh sách sinh viên tốt nghiệp Đại học - Cao đẳng Trường Đại học Phú Yên năm ...Danh sách sinh viên tốt nghiệp Đại học - Cao đẳng Trường Đại học Phú Yên năm ...
Danh sách sinh viên tốt nghiệp Đại học - Cao đẳng Trường Đại học Phú Yên năm ...
 
ĐỀ CHÍNH THỨC KỲ THI TUYỂN SINH VÀO LỚP 10 THPT CÁC TỈNH THÀNH NĂM HỌC 2020 –...
ĐỀ CHÍNH THỨC KỲ THI TUYỂN SINH VÀO LỚP 10 THPT CÁC TỈNH THÀNH NĂM HỌC 2020 –...ĐỀ CHÍNH THỨC KỲ THI TUYỂN SINH VÀO LỚP 10 THPT CÁC TỈNH THÀNH NĂM HỌC 2020 –...
ĐỀ CHÍNH THỨC KỲ THI TUYỂN SINH VÀO LỚP 10 THPT CÁC TỈNH THÀNH NĂM HỌC 2020 –...
 
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
 
Campbell _2011_ - Sinh học - Tế bào - Ref.pdf
Campbell _2011_ - Sinh học - Tế bào - Ref.pdfCampbell _2011_ - Sinh học - Tế bào - Ref.pdf
Campbell _2011_ - Sinh học - Tế bào - Ref.pdf
 
TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI KỸ NĂNG VIẾT ĐOẠN VĂN NGHỊ LUẬN XÃ HỘI 200 C...
TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI KỸ NĂNG VIẾT ĐOẠN VĂN NGHỊ LUẬN XÃ HỘI 200 C...TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI KỸ NĂNG VIẾT ĐOẠN VĂN NGHỊ LUẬN XÃ HỘI 200 C...
TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI KỸ NĂNG VIẾT ĐOẠN VĂN NGHỊ LUẬN XÃ HỘI 200 C...
 

Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620

  • 1. BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ ----------------------------- VŨ VĂN HIỆU NGHIÊN CỨU MỘT SỐ KỸ THUẬT PHÂN HẠNG TRONG TRA CỨU ẢNH DỰA VÀO NỘI DUNG LUẬN ÁN TIẾN SỸ TOÁN HỌC HÀ NỘI – 2017
  • 2. BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ ----------------------------- VŨ VĂN HIỆU NGHIÊN CỨU MỘT SỐ KỸ THUẬT PHÂN HẠNG TRONG TRA CỨU ẢNH DỰA VÀO NỘI DUNG LUẬN ÁN TIẾN SỸ TOÁN HỌC Chuyên ngành: Cơ sở Toán học cho Tin học Mã số: 62 46 01 10 Người hướng dẫn khoa học: 1. PGS. TS. Ngô Quốc Tạo 2. PGS.TS. Nguyễn Hữu Quỳnh Hà Nội – 2017
  • 3. LÌi cam oan Tôi xin cam oan lu™n án “Nghiên c˘u mÎt sË kˇ thu™t phân h§ng trong tra c˘u £nh d¸a vào nÎi dung” là công trình nghiên c˘u cıa riêng tôi. Các sË liªu, k∏t qu£ ˜Òc trình bày trong lu™n án là hoàn toàn trung th¸c và ch˜a t¯ng ˜Òc công bË trong bßt k˝ mÎt công trình nào khác. ⌅ Tôi ã trích d®n ¶y ı các tài liªu tham kh£o, công trình nghiên c˘u liên quan  trong n˜Óc và quËc t∏. Ngo§i tr¯ các tài liªu tham kh£o này, lu™n án hoàn toàn là công viªc cıa riêng tôi. ⌅ Trong các công trình khoa hÂc ˜Òc công bË trong lu™n án, tôi ã th∫ hiªn rõ ràng và chính xác óng góp cıa các Áng tác gi£ và nh˙ng gì do tôi ã óng góp. ⌅ Lu™n án ˜Òc hoàn thành trong thÌi gian tôi làm Nghiên c˘u sinh t§i Phòng Nh™n d§ng và Công nghª tri th˘c, Viªn Công nghª thông tin, Viªn Hàn lâm Khoa hÂc và Công nghª Viªt Nam. Tác gi£ : Hà NÎi : i
  • 4. LÌi c£m Ïn Lu™n án ˜Òc th¸c hiªn d˜Ói s¸ h˜Óng d®n khoa hÂc cıa PGS.TS Ngô QuËc T§o và PGS.TS Nguyπn H˙u Qu˝nh. Nghiên c˘u sinh xin bày t‰ lòng bi∏t Ïn sâu s≠c ∏n hai Th¶y v∑ ‡nh h˜Óng khoa hÂc, nh˙ng bài hÂc, nh˙ng góp ˛ qu˛ báu trong nghiên c˘u. Các Th¶y ã t§o i∑u kiªn vô cùng thu™n lÒi trong suËt quá trình nghiên c˘u cıa Nghiên c˘u sinh. Tôi xin ˜Òc c£m Ïn các nhà khoa hÂc, tác gi£ cıa các công trình công bË ã ˜Òc trích d®n trong lu™n án, ây là nh˙ng t˜ liªu qu˛, ki∏n th˘c liên quan quan trÂng giúp Nghiên c˘u sinh hoàn thành lu™n án. Xin c£m Ïn ∏n các nhà khoa hÂc ã ph£n biªn các công trình nghiên c˘u cıa Nghiên c˘u sinh. Tôi trân trÂng c£m Ïn Phòng Nh™n d§ng và Công nghª tri th˘c, Phòng qu£n l˛ ào t§o, Viªn Công nghª thông tin, HÂc viªn Khoa hÂc và Công nghª, Viªn Hàn lâm Khoa hÂc và Công nghª Viªt Nam ã t§o i∑u kiªn thu™n lÒi cho tôi trong suËt quá trình nghiên c˘u th¸c hiªn lu™n án. Tôi cÙng xin c£m Ïn sâu s≠c ∏n HÎi Áng Khoa hÂc Viªn Công nghª thông tin, các Th¶y trong HÎi Áng b£o vª cßp cÏ s ã góp ˛ giúp Nghiên c˘u sinh hoàn thiªn công trình lu™n án này. Tôi cÙng bày t‰ s¸ c£m Ïn sâu s≠c ∏n Khoa Công nghª thông tin, Tr˜Ìng §i hÂc iªn L¸c, Hà NÎi ã t§o i∑u kiªn cho tôi ˜Òc hÂc t™p, trao Íi và nghiên c˘u. Tôi xin c£m Ïn Tr˜Ìng §i hÂc H£i Phòng ã t§o i∑u kiªn v∑ thÌi gian và tài chính cho tôi th¸c hiªn lu™n án này. MÎt ph¶n cıa nghiên c˘u này ˜Òc th¸c hiªn trong khuôn khÍ ∑ tài nghiên c˘u mã sË CS’15.03 cıa Viªn Công nghª Thông tin, Viªn Hàn lâm Khoa hÂc và Công nghª Viªt Nam và ∑ tài nghiên mã sË VAST01.07/15-16 cıa Viªn Hàn lâm Khoa hÂc và Công nghª Viªt Nam. Xin c£m Ïn các trao Íi và trÒ giúp cıa các thành viên ∑ tài. CuËi cùng, tôi xin bày t‰ lòng bi∏t Ïn vô h§n Ëi vÓi cha mµ, vÒ con và toàn th∫ anh em trong gia ình ã luôn ıng hÎ, giúp Ô tôi. ii
  • 5. Mˆc lˆc LÌi cam oan i LÌi c£m Ïn ii T¯ vi∏t t≠t v K˛ hiªu toán hÂc vi Danh mˆc các hình v≥ vii Danh mˆc các b£ng bi∫u xi M ¶u 1 1 TÍng quan v∑ Tra c˘u £nh d¸a vào nÎi dung 8 1.1 MÎt sË ∞c tr˜ng £nh th˜Ìng s˚ dˆng trong tra c˘u £nh d¸a vào nÎi dung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 1.1.1 Miêu t£ toàn cˆc . . . . . . . . . . . . . . . . . . . . . . . . 9 1.1.2 Miêu t£ cˆc bÎ . . . . . . . . . . . . . . . . . . . . . . . . . 12 1.2 TÍ hÒp ∞c tr˜ng trong tra c˘u £nh d¸a vào nÎi dung . . . . . . . . 13 1.3 Chu©n hoá trong CBIR . . . . . . . . . . . . . . . . . . . . . . . . . 14 1.3.1 Mˆc ích cıa chu©n hoá . . . . . . . . . . . . . . . . . . . . 14 1.3.2 Chu©n hóa min-max . . . . . . . . . . . . . . . . . . . . . . 16 1.3.3 Chu©n hóa Gauss . . . . . . . . . . . . . . . . . . . . . . . . 16 1.4 Kho£ng trËng ng˙ nghæa . . . . . . . . . . . . . . . . . . . . . . . . 19 1.5 Ph£n hÁi liên quan trong CBIR . . . . . . . . . . . . . . . . . . . . 21 1.6 Hiªu chønh trÂng sË và d‡ch chuy∫n truy vßn trong CBIR s˚ dˆng ph£n hÁi liên quan . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 1.7 Tra c˘u £nh d¸a vào nÎi dung s˚ dˆng kˇ thu™t máy hÂc . . . . . . 27 1.7.1 Hußn luyªn và ki∫m tra . . . . . . . . . . . . . . . . . . . . 27 1.7.2 Nhãn d˙ liªu . . . . . . . . . . . . . . . . . . . . . . . . . . 28 1.7.3 Xây d¸ng mô hình hÂc . . . . . . . . . . . . . . . . . . . . . 29 1.8 MÎt sË ti∏p c™n d¸a theo ph˜Ïng pháp tËi ˜u Pareto . . . . . . . . 33 iii
  • 6. 1.9 Ph˜Ïng pháp ánh giá hiªu n´ng trong CBIR . . . . . . . . . . . . 34 2 ∑ xußt chu©n hoá ∞c tr˜ng và hiªu chønh trÂng sË trong tÍ hÒp ∞c tr˜ng 37 2.1 Chu©n hoá ∞c tr˜ng d¸a vào phân cˆm mÌ FCM . . . . . . . . . . 39 2.2 Chu©n hoá kho£ng cách d¸a vào phân cˆm FCM . . . . . . . . . . 45 2.3 Hiªu chønh trÂng sË, d‡ch chuy∫n truy vßn . . . . . . . . . . . . . . 46 2.3.1 Hiªu chønh trÂng sË . . . . . . . . . . . . . . . . . . . . . . . 51 2.3.2 D‡ch chuy∫n truy vßn . . . . . . . . . . . . . . . . . . . . . . 52 2.4 Th˚ nghiªm và ánh giá các k∏t qu£ . . . . . . . . . . . . . . . . . 54 2.4.1 CÏ s d˙ liªu £nh . . . . . . . . . . . . . . . . . . . . . . . . 54 2.4.2 Trích rút bÎ ∞c tr˜ng k∏t hÒp . . . . . . . . . . . . . . . . 55 2.4.3 Các k∏t qu£ th¸c nghiªm và lu™n gi£i . . . . . . . . . . . . . 55 2.5 K∏t lu™n Ch˜Ïng 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 3 ∑ xußt kˇ thu™t Pareto front a m˘c sâu nâng cao hiªu qu£ phân lÓp £nh 69 3.1 MÎt sË tính chßt hình th˘c d¸a trên kˇ thu™t Pareto front a m˘c sâu trong không gian tÍ hÒp ∞c tr˜ng . . . . . . . . . . . . . . . . 73 3.2 Nâng cao hiªu qu£ phân lÓp £nh . . . . . . . . . . . . . . . . . . . . 81 3.3 Th˚ nghiªm và ánh giá các k∏t qu£ . . . . . . . . . . . . . . . . . 86 3.3.1 CÏ s d˙ liªu £nh . . . . . . . . . . . . . . . . . . . . . . . . 86 3.3.2 Các ph˜Ïng pháp cÏ s . . . . . . . . . . . . . . . . . . . . . 88 3.3.3 Ph˜Ïng pháp ánh giá . . . . . . . . . . . . . . . . . . . . . 88 3.3.4 Các k∏t qu£ th¸c nghiªm . . . . . . . . . . . . . . . . . . . . 89 3.4 K∏t lu™n Ch˜Ïng 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 K∏t lu™n và h˜Óng phát tri∫n 97 Danh mˆc công trình ã công bË 99 A MÎt sË cÏ s d˙ liªu £nh s˚ dˆng 111 A.1 Corel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 A.2 Wang . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112 A.3 Caltech 101 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 A.4 Oxford Building . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114 B Ph¶n m∑m tra c˘u theo các ∑ xußt cıa lu™n án 120 iv
  • 7. T¯ vi∏t t≠t D§ng vi∏t t≠t D§ng ¶y ı Diπn gi£i CBIR Content based image retrie- val Tra c˘u £nh d¸a vào nÎi dung FCM Fuzzy c-means Phân cˆm mÌ c-means HI Histogram Interrsection L˜Òc Á giao HSV hue, saturation, value màu s≠c, Î bão hoà màu, Î sáng L2R Learning to Rank HÂc x∏p h§ng MARS Multimedia Analysis and Retrieval Systems Các hª thËng phân tích a ph˜Ïng tiªn và tra c˘u Pr Precision Î chính xác Re Recall Î hÁi t˜ng RF Relevance feedback Ph£n hÁi liên quan RGB red, green, blue ‰, xanh lá, xanh d˜Ïng SIFT Scale-Invariant Feature Transform SVM Support vector machine Máy vector hÈ trÒ v
  • 8. K˛ hiªu toán hÂc M Î dài cıa mÎt vector ∞c tr˜ng N Kích th˜Óc cıa cÏ s d˙ liªu £nh T SË bÎ ∞c tr˜ng t Chø sË bÎ ∞c tr˜ng Q, Ii Énh truy vßn và £nh th˘ i trong cÏ s d˙ liªu ˜Ii Vector ∞c tr˜ng chu©n hoá cıa £nh th˘ i ˜I t i Vector ∞c tr˜ng chu©n hoá  bÎ t cıa £nh th˘ i Qt , I t ∞c tr˜ng bÎ t t˜Ïng ˘ng cıa £nh truy vßn Q và £nh I bßt k˝ ˜Qt i ∞c tr˜ng chu©n hoá  bÎ t cıa £nh truy vßn Dt Q (Ii ), Dt (Q, Ii ) Kho£ng cách theo bÎ ∞c tr˜ng t cıa £nh Ii so vÓi £nh truy vßn Q DQ (Ii ), D(Q, Ii ) Kho£ng cách £nh Ii so vÓi £nh truy vßn Q trên bÎ ∞c tr˜ng k∏t hÒp top k T™p gÁm k £nh có th˘ h§ng t˜Ïng t¸ cao nhßt Ëi vÓi £nh truy vßn NB T™p £nh có Î t˜Ïng t¸ cao nhßt theo ∞c tr˜ng toàn cˆc trong mÎt tra c˘u NB T™p £nh ˜Òc xác nh™n không liên quan  ph£n hÁi cıa ng˜Ìi dùng NB+ T™p £nh ˜Òc xác nh™n liên quan  ph£n hÁi cıa ng˜Ìi dùng NBt T™p £nh có Î t˜Ïng t¸ cao nhßt theo ∞c tr˜ng  bÎ t trong mÎt tra c˘u NB⇠ T™p £nh có th˘ h§ng Î t˜Ïng t¸ cao và thuÎc t™p NB trong mÎt tra c˘u vi
  • 9. NB⇤ T™p £nh ch˜a ˜Òc tra c˘u V (D) t,c Tâm cˆm c t™p giá tr‡ kho£ng cách bÎ ∞c tr˜ng t theo FCM Vt (D) T™p tâm cˆm theo bÎ ∞c tr˜ng t Vt,c,j Tâm cˆm c cıa thành ph¶n ∞c tr˜ng j  bÎ ∞c tr˜ng t theo phân cˆm mÌ FCM wt TrÂng sË kho£ng cách cıa bÎ ∞c tr˜ng t ⌘p t,c,i Giá tr‡ Î thuÎc cıa ph¶n t˚ th˘ i  bÎ ∞c tr˜ng t so vÓi cˆm c, p là hª sË FCM (l),NB+ t,kIt k Î lªch chu©n theo Î dài ∞c tr˜ng bÎ ∞c tr˜ng t trong l¶n l∞p th˘ l Ëi vÓi các £nh trong t™p NB+ (l),NB+ t,Dt Q (Ii ) Î lªch chu©n kho£ng cách bÎ ∞c tr˜ng t trong l¶n l∞p th˘ l Ëi vÓi các £nh trong t™p NB+ t,c,i Î lªch chu©n thành ph¶n j cıa bÎ ∞c tr˜ng t theo cˆm c (D) t,c Î lªch chu©n kho£ng cách bÎ ∞c tr˜ng t theo cˆm c vii
  • 10. Danh sách hình v≥ 0.1 Hª thËng tra c˘u £nh d¸a vào nÎi dung. . . . . . . . . . . . . . . . 3 0.2 Hª thËng ∑ xußt . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 1.1 Thành ph¶n th˘ nhßt cıa ∞c tr˜ng mô men màu. . . . . . . . . . 15 1.2 Phân bË d˙ liªu thành ph¶n 1 cıa ∞c tr˜ng mô men màu (gËc) . . 18 1.3 (a) Phân bË d˙ liªu thành ph¶n 5 l˜Òc Á ∞c tr˜ng l˜Òc Á HSV (gËc). (b) L˜Òc Á ∞c tr˜ng l˜Òc Á HSV chu©n hoá theo lu™t 3 thành ph¶n th˘ 5, 97.4555% d˙ liªu “rÏi vào” [-1,1] . . . . . . . . . 18 1.4 Énh truy vßn “mandolin image 0001.jpg”. . . . . . . . . . . . . . . 19 1.5 Hª thËng tra c˘u vÓi £nh truy vßn “mandolin image 0001.jpg”. . . . 19 1.6 K∏t qu£ top 20 các £nh t˜Ïng t¸ nhßt vÓi £nh truy vßn  l¶n tra c˘u khi t§o. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 1.7 Hai £nh có ng˙ nghæa t˜Ïng Áng . . . . . . . . . . . . . . . . . . . 20 1.8 L˜Òc Á màu cıa £nh truy vßn và hai £nh trong k∏t qu£ top 20. . 21 1.9 Minh ho§ siêu phØng . . . . . . . . . . . . . . . . . . . . . . . . . . 32 2.1 Mô hình hª thËng ∑ xußt . . . . . . . . . . . . . . . . . . . . . . . 38 2.2 Minh ho§ chu©n hóa 3 FCM . . . . . . . . . . . . . . . . . . . . 42 2.3 Minh ho§ tính chßt b£o toàn th˘ t¸ cıa chu©n hoá 3 FCM . . . 43 2.4 Phân bË d˙ liªu gËc  thành ph¶n th˘ n´m cıa các ∞c tr˜ng (a) L˜Òc Á màu HSV, (b) l˜Òc Á t¸ t˜Ïng quan màu, (c) mô men màu, (d) k∏t cßu Gabor, (e) mô men Wavelet, (f) GIST . . . . . . . 56 2.5 (a) Phân bË d˙ liªu ∞c tr˜ng l˜Òc Á HSV (chu©n hoá 3 ) thành ph¶n 5 gÁm 97.45% thuÎc [-1,1]. (b) Phân bË d˙ liªu ∞c tr˜ng l˜Òc Á HSV (chu©n hoá 3 FCM ) thành ph¶n 5 gÁm 99.81% thuÎc [-1,1] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 2.6 (a) Phân bË d˙ liªu ∞c tr˜ng autoCorrelogram (chu©n hoá 3 ) thành ph¶n 5 gÁm 98.02% thuÎc [-1,1]. (b) Phân bË d˙ liªu ∞c tr˜ng autoCorrelogram (chu©n hoá 3 FCM ) thành ph¶n 5 gÁm 99.9955% thuÎc [-1,1] . . . . . . . . . . . . . . . . . . . . . . . . . . 57 2.7 (a) Phân bË d˙ liªu ∞c tr˜ng mô men màu (chu©n hoá 3 ) thành ph¶n 5 gÁm 99.68% thuÎc [-1,1]. (b) Phân bË d˙ liªu ∞c tr˜ng mô men màu (chu©n hoá 3 FCM ) thành ph¶n 5 gÁm 100% thuÎc [-1,1] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 viii
  • 11. 2.8 (a) Phân bË d˙ liªu ∞c tr˜ng k∏t cßu Gabor(chu©n hoá 3 ) thành ph¶n 5 gÁm 98.1% thuÎc [-1,1]. (b) Phân bË d˙ liªu ∞c tr˜ng k∏t cßu Gabor (chu©n hoá 3 FCM ) thành ph¶n 5 gÁm 99.95% thuÎc [-1,1] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 2.9 (a) Phân bË d˙ liªu ∞c tr˜ng bßt bi∏n Wavelet(chu©n hoá 3 ) thành ph¶n 5 gÁm 99.5% thuÎc [-1,1]. (b) Phân bË d˙ liªu ∞c tr˜ng bßt bi∏n Wavelet (chu©n hoá 3 FCM ) thành ph¶n 5 gÁm 100% thuÎc [-1,1] . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 2.10 (a) Phân bË d˙ liªu ∞c tr˜ng hình d§ng GIST (chu©n hoá 3 ) thành ph¶n 5 gÁm 98.8% thuÎc [-1,1]. (b) Phân bË d˙ liªu ∞c tr˜ng hình d§ng GIST (chu©n hoá 3 FCM ) thành ph¶n 5 gÁm 99.9985% thuÎc [-1,1] . . . . . . . . . . . . . . . . . . . . . . . . . . 59 2.11 So sánh chßt l˜Òng truy vßn. (a) Hiªu n´ng Precision/Recall. (b) Hiªu n´ng Î chính xác. . . . . . . . . . . . . . . . . . . . . . . . . 60 2.12 Trung bình Î chính xác cıa kˇ thu™t ∑ xußt trên top k k∏t qu£ theo n´m vòng cıa ph£n hÁi liên quan . . . . . . . . . . . . . . . . 63 2.13 So sánh trung bình Î chính xác cıa kˇ thu™t ∑ xußt và PowerTool trên các top k k∏t qu£. . . . . . . . . . . . . . . . . . . . . . . . . 64 2.14 So sánh trung bình Î chính xác cıa kˇ thu™t ∑ xußt và PowerTool trên top 20 k∏t qu£ theo m˜Ìi vòng cıa ph£n hÁi liên quan . . . . 66 2.15 Bi∫u Á Precision và Recall cıa kˇ thu™t ∑ xußt và PowerTool . . 67 3.1 Hª thËng ∑ xußt . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 3.2 Minh ho§ không gian tìm ki∏m EQ . . . . . . . . . . . . . . . . . . 74 3.3 MÎt miêu t£ Pareto front . . . . . . . . . . . . . . . . . . . . . . . . 76 3.4 Minh ho§ hai m˘c Î sâu là PF1 và PF2 cıa không gian EQ . . . . 78 3.5 Trung bình Î chính xác (Precision) trên k∏t qu£ top k cıa ∑ xußt Pareto-AdaBoost trên ba t™p d˙ liªu theo n´m vòng ph£n hÁi liên quan. (a) Db1. (b) Db2. (c) Db3. . . . . . . . . . . . . . . . . . 91 3.6 Trung bình Î chính xác (Precision) trên k∏t qu£ top k cıa ∑ xußt Pareto-SVM trên ba t™p d˙ liªu theo n´m vòng ph£n hÁi liên quan. (a) Db1. (b) Db2. (c) Db3. . . . . . . . . . . . . . . . . . . . 92 3.7 So sánh Î chính xác trên các k∏t qu£ top k cıa kˇ thu™t ∑ xußt Pareto-AdaBoost vÓi các kˇ thu™t cÏ s trên ba t™p d˙ liªu. (a) T™p d˙ liªu Db1. (b) T™p d˙ liªu Db2. (c) T™p d˙ liªu Db3. . . . . . . . 94 3.8 So sánh Î chính xác trên các k∏t qu£ top k cıa kˇ thu™t ∑ xußt Pareto-SVM vÓi các kˇ thu™t cÏ s trên ba t™p d˙ liªu. (a) T™p d˙ liªu Db1. (b) T™p d˙ liªu Db2. (c) T™p d˙ liªu Db3. . . . . . . . . . 94 3.9 Á th‡ Î chính xác (Precision) và hÁi t˜ng (Recall) cıa các ph˜Ïng pháp Pareto-AdaBoost, SVM, AdaBoost và MARS trên t™p d˙ liªu. (a) T™p d˙ liªu Db1. (b) T™p d˙ liªu Db2. (c) T™p d˙ liªu Db3. . . 95 3.10 Á th‡ Î chính xác (Precision) và hÁi t˜ng (Recall) cıa các ph˜Ïng pháp Pareto-SVM, SVM, AdaBoost và MARS trên t™p d˙ liªu Db1, Db2 và Db3. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 A.1 Các £nh ví dˆ t¯ cÏ s d˙ liªu Corel . . . . . . . . . . . . . . . . . 112 ix
  • 12. A.2 MÎt £nh m®u t¯ mÈi lÓp cıa 10 lÓp cıa cÏ s d˙ liªu Wang . . . . 113 A.3 MÈi m®u cho mÎt chı ∑ trong sË 101 chı ∑ trong cÏ s d˙ liªu £nh Caltech 101 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 A.4 Các m®u cıa cÏ s d˙ liªu Wang, các chı ∑ ng˙ nghæa : bi∫n, Châu Phi, hoa hÁng, khıng long, ng¸a, núi, th˘c ´n, di tích, voi, xe bu˛t. MÈi dòng mÎt chı ∑, ví dˆ mÈi chı ∑ 5 £nh t˜Ïng ˘ng t¯ trên xuËng d˜Ói. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118 A.5 Toàn bÎ 55 £nh truy vßn ˜Òc s˚ dˆng trong ánh giá ground truth. MÈi dòng cho bi∏t các truy vßn khác nhau cho cùng c£nh ‡a danh. L˜u ˛ s¸ thay Íi lÓn v∑ ph§m vi cıa các vùng truy vßn và thay Íi v‡ trí, ánh sáng, v.v cıa chính các £nh. . . . . . . . . . . . . . . 119 B.1 ˜a mÎt £nh vào hª thËng tra c˘u ∑ xußt. . . . . . . . . . . . . . 120 B.2 K∏t qu£ tra c˘u khi t§o cıa top 20 . . . . . . . . . . . . . . . . 121 B.3 K∏t qu£ tra c˘u top 20 vòng ph£n hÁi th˘ nhßt . . . . . . . . . . 121 B.4 K∏t qu£ tra c˘u top 20 vòng ph£n hÁi th˘ hai . . . . . . . . . . . 122 B.5 K∏t qu£ tra c˘u top 20 vòng ph£n hÁi th˘ ba . . . . . . . . . . . 122 B.6 ˜a vào hª thËng mÎt truy vßn . . . . . . . . . . . . . . . . . . . . 123 B.7 K∏t qu£ tra c˘u khi t§o top 20. . . . . . . . . . . . . . . . . . . 123 B.8 K∏t qu£ tra c˘u top 20 vòng ph£n hÁi th˘ nhßt . . . . . . . . . . 124 B.9 K∏t qu£ tra c˘u top 20 vòng ph£n hÁi th˘ hai . . . . . . . . . . . 124 B.10 K∏t qu£ tra c˘u top 20 vòng ph£n hÁi th˘ ba . . . . . . . . . . . 124 B.11 K∏t qu£ tra c˘u top 20 vòng ph£n hÁi th˘ t˜ . . . . . . . . . . . 125 x
  • 13. Danh sách b£ng 2.1 B£ng mÎt sË £nh theo nh™n ‡nh chı quan cıa ng˜Ìi dùng so sánh v∑ t˜Ïng t¸ ng˙ nghæa vÓi truy vßn Q = 710.jpg. Các £nh n¨m trong t™p Wang . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 2.2 Î o kho£ng cách cıa £nh truy vßn 710.jpg Ëi vÓi các £nh t™p NB+ , NB và NB⇠ . K˛ hiªu các cÎt (d1), (d2), (d3), (d4), (d5), (d6) là kho£ng cách t˜Ïng ˘ng cıa các bÎ ∞c tr˜ng l˜Òc Á màu HSV, t¸ t˜Ïng quan màu, mô men màu, k∏t cßu Gabor, mô men Wavelet và GIST theo các hàm kho£ng cách ; D là kho£ng cách toàn bÎ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 2.3 Î o kho£ng cách L2 cıa £nh truy vßn 710.jpg Ëi vÓi các £nh trong t™p NB+ , NB và NB⇠ . . . . . . . . . . . . . . . . . . . . . 50 2.4 Các miêu t£ £nh và hàm kho£ng cách s˚ dˆng trong th¸c nghiªm. . 50 2.5 Tham sË phân cˆm FCM . . . . . . . . . . . . . . . . . . . . . . . . 55 2.6 Các Ëi t˜Òng cıa t™p AGRt trên sáu l¶n l∞p ph£n hÁi Ëi vÓi £nh truy vßn Q = 710.jpg . . . . . . . . . . . . . . . . . . . . . . . . . . 60 2.7 ThËng kê trÂng sË kho£ng cách t¯ng bÎ ∞c tr˜ng wt theo mÈi l¶n l∞p Ëi vÓi mÎt sË £nh truy vßn . . . . . . . . . . . . . . . . . . . . 61 2.8 Trung bình Î chính xác (Precision) top k k∏t qu£ trên 10 vòng ph£n hÁi liên quan Ëi vÓi t™p d˙ liªu Wang cıa kˇ thu™t ∑ xußt . 63 2.9 Trung bình Î hÁi t˜ng (Recall) top k k∏t qu£ trên 10 vòng ph£n hÁi liên quan Ëi vÓi t™p d˙ liªu Wang cıa kˇ thu™t ∑ xußt . . . . 64 2.10 Trung bình Î chính xác (Precision) top k k∏t qu£ trên 10 vòng ph£n hÁi liên quan Ëi vÓi t™p d˙ liªu Wang cıa PowerTool (MARS) 65 2.11 Trung bình Î hÁi t˜ng (Recall) top k k∏t qu£ trên 10 vòng ph£n hÁi liên quan Ëi vÓi t™p d˙ liªu Wang cıa PowerTool (MARS) . . 65 3.1 Kho£ng cách gi˙a Q và o1, o2, o3 trong các ∞c tr˜ng màu s≠c và k∏t cßu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 3.2 Các miêu t£ £nh và hàm kho£ng cách s˚ dˆng trong th¸c nghiªm. . 87 3.3 Các tham sË s˚ dˆng trong th¸c nghiªm. . . . . . . . . . . . . . . . 89 3.4 SË ˘ng viên Pareto theo top k Ëi vÓi Db1 . . . . . . . . . . . . . 90 3.5 SË ˘ng viên Pareto theo top k Ëi vÓi Db2 . . . . . . . . . . . . . 90 3.6 SË ˘ng viên Pareto theo top k Ëi vÓi Db3 . . . . . . . . . . . . . 91 3.7 Trung bình Î chính xác top k k∏t qu£ cıa ∑ xußt Pareto- AdaBoost trên n´m vòng ph£n hÁi liên quan Ëi vÓi t™p d˙ liªu Db1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 xi
  • 14. 3.8 Trung bình Î chính xác top k k∏t qu£ cıa ∑ xußt Pareto- AdaBoost trên n´m vòng ph£n hÁi liên quan Ëi vÓi t™p d˙ liªu Db2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92 3.9 Trung bình Î chính xác top k k∏t qu£ cıa ∑ xußt Pareto- AdaBoost trên n´m vòng ph£n hÁi liên quan Ëi vÓi t™p d˙ liªu Db3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92 3.10 Trung bình Î chính xác top k k∏t qu£ cıa ∑ xußt Pareto-SVM trên n´m vòng ph£n hÁi liên quan Ëi vÓi t™p d˙ liªu Db1 . . . . . 93 3.11 Trung bình Î chính xác top k k∏t qu£ cıa ∑ xußt Pareto-SVM trên n´m vòng ph£n hÁi liên quan Ëi vÓi t™p d˙ liªu Db2 . . . . . 93 3.12 Trung bình Î chính xác top k k∏t qu£ cıa ∑ xußt Pareto-SVM trên n´m vòng ph£n hÁi liên quan Ëi vÓi t™p d˙ liªu Db3 . . . . . 93 A.1 Danh sách 10 chı ∑ cıa cÏ s d˙ liªu Wang . . . . . . . . . . . . . 114 A.2 Danh sách 101 chı ∑ cıa cÏ s d˙ liªu Caltech 101 . . . . . . . . . 115 A.3 Danh sách 17 chı ∑ cıa cÏ s d˙ liªu Oxford Buildings . . . . . . . 116 xii
  • 15. M ¶u Tính cßp thi∏t cıa ∑ tài S¸ phát tri∫n m§nh m≥ cıa Internet cho phép dπ dàng xây d¸ng, l˜u tr˙ các cÏ s d˙ liªu lÓn. MÎt trong sË ó là Flickr 1 , YouTube 2 , Facebook 3 , Twitter 4 và toàn bÎ m§ng Internet. Yêu c¶u khai thác mÎt cách hiªu qu£ d˙ liªu a ph˜Ïng tiªn trên thúc ©y s¸ quan tâm cıa cÎng Áng nghiên c˘u [21]. Nhi∑u hª thËng tìm ki∏m thông tin v´n b£n và £nh nh˜ Google 5 , Bing 6 , Yahoo 7 ã ˜Òc phát tri∫n m§nh m≥ trong nh˙ng n´m g¶n ây nh˜ng v®n ch˜a áp ˘ng ˜Òc nhu c¶u ng˜Ìi dùng. S¸ phát tri∫n m§nh m≥ cıa d˙ liªu a ph˜Ïng tiªn ngày càng tr thành mÎt thách th˘c lÓn. Khi kích th˜Óc cıa kho £nh rßt lÓn cách ti∏p c™n tra c˘u b¨ng t¯ khóa tr nên không kh£ thi d®n tÓi các nghiên c˘u khai thác tra c˘u d¸a trên nÎi dung d˙ liªu £nh. Tra c˘u £nh d¸a vào nÎi dung (Content-based image retrieval) hay gÂi t≠t là CBIR ˜Òc giÓi thiªu bi các nghiên c˘u t¯ nh˙ng n´m 1980. CBIR ã ˜Òc ã ˜Òc nghiên c˘u rÎng rãi, nhi∑u ph˜Ïng pháp và hª thËng ã ˜Òc phát tri∫n ∫ trích rút nÎi dung cıa £nh b¨ng cách s˚ dˆng các ∞c tr˜ng m˘c thßp . D˙ liªu trong CBIR ˜Òc lßy trên cÏ s các nÎi dung mà nó trích rút b¨ng cách s˚ dˆng 1. https://www.flickr.com/ 2. https://www.youtube.com 3. https://www.facebook.com/ 4. https://twitter.com/ 5. http://www.google.com 6. https://www.bing.com/ 7. https://vn.yahoo.com/?p=us 1
  • 16. 2 các kˇ thu™t trích rút ∞c tr˜ng m˘c thßp bên trong cıa mÈi £nh (màu s≠c, hình d§ng, k∏t cßu, vv). Tuy CBIR có nhi∑u ti∏n bÎ song ng˜Ìi dùng v®n g∞p khó kh´n trong viªc tìm ki∏m thông tin liên quan t¯ t™p d˙ liªu £nh lÓn không Áng nhßt v∑ m∞t nÎi dung và ng˙ nghæa. i∑u này d®n ∏n k∏t qu£ tìm ki∏m ch˜a §t ˜Òc nh˜ mong muËn. Thông tin mà máy tính hi∫u nÎi dung £nh th˜Ìng là các giá tr‡ i∫m £nh, vector ∞c tr˜ng ˜Òc trích rút theo các thı tˆc,... còn con ng˜Ìi hi∫u v∑ nÎi dung cıa £nh th˜Ìng là các khái niªm ng˙ nghæa. Do không có s¸ t˜Ïng quan mÎt cách chính xác gi˙a nÎi dung mà máy tính có ˜Òc thông qua ∞c tr˜ng tr¸c quan m˘c thßp vÓi nÎi dung mà con ng˜Ìi hi∫u thông qua các khái niªm ng˙ nghæa m˘c cao d®n ∏n kho£ng trËng ng˙ nghæa. Kho£ng trËng ng˙ nghæa ‡nh nghæa theo Smeulders và cÎng s¸ [94] nh˜ sau : “Kho£ng trËng ng˙ nghæa là s¸ không t˜Ïng Áng gi˙a thông tin £nh, ˜Òc trích rút t¯ d˙ liªu tr¸c quan so vÓi diπn gi£i v∑ d˙ liªu £nh ó bi ng˜Ìi dùng trong tình huËng cˆ th∫ ”. Kho£ng trËng ng˙ nghæa n¨m gi˙a các ∞c tr˜ng tr¸c quan m˘c thßp cıa các £nh và các ng˙ nghæa m˘c cao mong muËn d¸ ‡nh suy ra t¯ các ∞c tr˜ng tr¸c quan m˘c thßp. Nhi∑u nghiên c˘u trong lænh v¸c CBIR ∏n nay v®n ang cË g≠ng thu hµp kho£ng trËng ng˙ nghæa này. Cˆ th∫, hÏn ba th™p kø qua nhi∑u hª thËng CBIR ã ˜Òc phát tri∫n, bao gÁm QBIC [28], Photobook [80], MARS [79], [83], [90], PicHunter [17], VisualSEEK [96], Blobworld [11], MindReader [46], SIMPLI- city [110], FIRE [23], và các nghiên c˘u khác [12], [41], [60], [115], [124]. Mˆc tiêu, ph§m vi nghiên c˘u cıa lu™n án Thông th˜Ìng mÎt hª thËng tra c˘u £nh d¸a vào nÎi dung ˜Òc miêu t£ nh˜ Hình 0.1 [62]. Các nÎi dung tr¸c quan cıa các £nh trong cÏ s d˙ liªu ˜Òc trích rút và miêu t£ bi các vector ∞c tr˜ng nhi∑u chi∑u. Các vector ∞c tr˜ng cıa các
  • 17. 3 £nh trong cÏ s d˙ liªu t§o nên mÎt cÏ s d˙ liªu ∞c tr˜ng. ∫ tra c˘u các £nh, thông tin truy vßn cıa ng˜Ìi dùng ˜a vào hª thËng tra c˘u có th∫ là các £nh m®u ho∞c v≥ phác th£o. Hª thËng sau ó s≥ bi∏n Íi nh˙ng m®u này t˜Ïng ˘ng vÓi bi∫u diπn cıa các vector ∞c tr˜ng. Các Î t˜Ïng t¸ ho∞c các kho£ng cách gi˙a các vector ∞c tr˜ng cıa £nh truy vßn vÓi các £nh trong cÏ s d˙ liªu ˜Òc tính và tra c˘u ˜Òc th¸c hiªn d¸a trên mÎt l˜Òc Á chø sË. L˜Òc Á chø sË ˜a ra mÎt cách hiªu qu£ ∫ tìm ki∏m các £nh trong cÏ s d˙ liªu. Qua kh£o sát nhi∑u nhiên Hình 0.1. Hª thËng tra c˘u £nh d¸a vào nÎi dung. c˘u CBIR, s¸ k∏t hÒp a ∞c tr˜ng ch˜a ˜Òc xem xét mÎt cách ¶y ı d®n ∏n viªc so sánh Î t˜Ïng t¸ §t hiªu qu£ ch˜a cao. Trong hª thËng này ánh chø sË và tra c˘u s˚ dˆng k∏t hÒp a ∞c tr˜ng cÙng c¶n ˜Òc nghiên c˘u ∫ nâng cao hiªu qu£ tra c˘u. ∫ nâng cao k∏t qu£ tra c˘u chính xác  ¶u ra, lu™n án ˜a ra các mˆc tiêu và giÓi h§n ph§m vi nghiên c˘u nh˜ sau. Mˆc tiêu cıa lu™n án So sánh Î t˜Ïng t¸ : Nghiên c˘u và ∑ xußt chu©n hoá ∞c tr˜ng, chu©n hoá kho£ng cách ∫ nâng cao hiªu qu£ so sánh Î t˜Ïng t¸. Ph£n hÁi liên quan : Nghiên c˘u và ∑ xußt kˇ thu™t hiªu chønh trÂng sË và d‡ch chuy∫n truy vßn.
  • 18. 4 ánh chø sË và tra c˘u : Tßt c£ các £nh trong cÏ s d˙ liªu vector ∞c tr˜ng ˜Òc tính toán tr˜Óc và l˜u tr˙ trong hª qu£n tr‡ cÏ s d˙ liªu. Rút gÂn không gian tìm ki∏m s˚ dˆng ti∏p c™n tËi ˜u Pareto ∫ l¸a chÂn t™p ˘ng viên tËt nhßt t¯ cÏ s d˙ liªu. Tra c˘u ˜a ra “top” k∏t qu£ các £nh có kho£ng cách cıa vector ∞c tr˜ng nh‰ nhßt ho∞c ˜Òc d¸ báo x∏p h§ng cao nhßt vÓi £nh truy vßn. Ph§m vi nghiên c˘u cıa lu™n án S˚ dˆng mÎt sË t™p £nh chu©n ˜Òc s˚ dˆng nhi∑u trong các nghiên c˘u v∑ CBIR. Xây d¸ng cÏ s d˙ liªu ∞c tr˜ng d¸a trên mÎt sË ph˜Ïng pháp trích rút ∞c tr˜ng tËt ã có. Cài ∞t th¸c nghiªm cho các ∑ xußt. So sánh và ánh giá hiªu n´ng v∑ m∞t Î chính xác thông qua t™p k∏t qu£ tra c˘u. Ph˜Ïng pháp và nÎi dung nghiên c˘u Ph˜Ïng pháp nghiên c˘u là k∏t hÒp gi˙a nghiên c˘u l˛ thuy∏t và th¸c nghiªm. CÏ s d˙ liªu và thông tin khoa hÂc ˜Òc thu th™p, tÍng hÒp t¯ các t§p chí khoa hÂc chuyên ngành trong và ngoài n˜Óc, qua Xêmina ho∞c tham gia báo cáo t§i các hÎi th£o khoa hÂc, qua trao Íi vÓi th¶y h˜Óng d®n và các Áng nghiªp cùng lænh v¸c nghiên c˘u,... Lu™n án tÍng hÒp các thông tin liên quan trong lænh v¸c CBIR, l¸a chÂn các cách ti∏p c™n ã ˜Òc áp dˆng thành công, ti∏n hành th˚ nghiªm vÓi các t™p d˙ liªu £nh chu©n trong các bài báo khoa hÂc và ánh giá k∏t qu£. NÎi dung nghiên c˘u trong lu™n án gÁm : (1) Nghiên c˘u tÍng quan v∑ tra c˘u £nh d¸a vào nÎi dung. (2) Nghiên c˘u cách k∏t hÒp nhi∑u ∞c tr˜ng trong hª thËng CBIR t¯ ó phát hiªn các quy lu™t, ràng buÎc cÏ b£n cıa k∏t hÒp nhi∑u ∞c tr˜ng.
  • 19. 5 (3) Nghiên c˘u mÎt sË kˇ thu™t gi£m kho£ng trËng ng˙ nghæa trong CBIR. K∏t qu£ §t ˜Òc cıa lu™n án Lu™n án ã có nh˙ng óng góp chính nh˜ sau : ∑ xußt chu©n hoá c£i ti∏n phù hÒp vÓi d˙ liªu th¸c t∏ trong tra c˘u £nh d¸a vào nÎi dung, cho phép nâng cao hiªu qu£ Ëi sánh Î t˜Ïng t¸ d¸a vào ∞c tr˜ng m˘c thßp cıa các £nh trong hª thËng tra c˘u trong công trình [CT6]. ∑ xußt kˇ thu™t hiªu chønh trÂng sË Î t˜Ïng t¸ và d‡ch chuy∫n truy vßn d¸a vào thông tin ph£n hÁi cıa ng˜Ìi dùng trong công trình [CT6]. ∑ xußt s˚ dˆng tËi ˜u Pareto xây d¸ng t™p ˘ng viên ∫ nâng cao Î chính xác cıa hª thËng CBIR trên không gian k∏t hÒp a ∞c tr˜ng trong công trình [CT7]. Mô hình tÍng quát cho các ∑ xußt cıa lu™n án trong Hình 0.2 ˜Òc mô t£ nh˜ sau : (1) ∞c tr˜ng £nh cıa truy vßn và các ∞c tr˜ng £nh cıa các £nh cÏ s d˙ liªu ˜Òc chu©n hoá theo ∑ xußt chu©n hoá ∞c tr˜ng. (2) Î t˜Ïng t¸ cıa các £nh trong cÏ s d˙ liªu vÓi £nh truy vßn ˜Òc tính toán d¸a vào các vector ∞c tr˜ng ã ˜Òc chu©n hoá. Các £nh ˜Òc x∏p h§ng theo Î t˜Ïng t¸ gi£m d¶n. T™p £nh k∏t qu£ hi∫n th‡ top k (t™p gÁm k £nh có th˘ h§ng t˜Ïng t¸ cao nhßt Ëi vÓi £nh truy vßn). Trên k∏t qu£ top k ng˜Ìi dùng ánh giá m˘c Î liên quan theo nh™n th˘c. ây là ¶u vào cıa ∑ xußt hiªu chønh trÂng sË và d‡ch chuy∫n truy vßn, k∏t qu£ ¶u ra là t™p các trÂng sË cho mÈi bÎ ∞c tr˜ng. (3) Î t˜Ïng t¸ các £nh trong cÏ s d˙ liªu so vÓi £nh truy vßn ˜Òc tính l§i d¸a vào hàm kho£ng cách k∏t hÒp bÎ trÂng sË v¯a thu ˜Òc.
  • 20. 6 Hình 0.2. Hª thËng ∑ xußt (4) Xây d¸ng t™p ˘ng viên Pareto ∫ gi£m không gian tìm ki∏m. (5) T™p hußn luyªn là các £nh ˜Òc ánh giá trong t™p k∏t qu£ top k. T™p ki∫m tra là t™p ˘ng viên Pareto. (6) Tìm hàm phân lÓp d¸a vào thông tin ¶u vào là t™p hußn luyªn và t™p ki∫m tra b¨ng mÎt máy phân lÓp. (7) S≠p x∏p các £nh trong t™p ki∫m tra theo giá tr‡ d¸ báo phân lÓp. T™p k∏t qu£ hi∫n th‡ gÁm top k £nh có th˘ h§ng giá tr‡ d¸ báo phân lÓp cao nhßt. (8) Ph£n hÁi liên quan : S˚ dˆng thông tin ánh giá cıa ng˜Ìi dùng liên quan ho∞c không liên quan trên t™p k∏t qu£ top k. D¸a trên các £nh ˜Òc ánh giá,
  • 21. 7 hª thËng hiªu chønh trÂng sË, d‡ch chuy∫n truy vßn và Î t˜Ïng t¸ s≥ ˜Òc c™p nh™t l§i. Quá trình ˜Òc l∞p l§i t¯ b˜Óc tìm t™p ˘ng viên Pareto. Các nghiên c˘u cıa lu™n án ã ˜Òc công bË trong các công trình ˜a ra  cuËi cıa lu™n án, óng góp cho các ∑ tài cßp cÏ s Viªn CNTT, mã sË CS’16.03, CS’14.03 và ∑ tài cßp Viªn Hàn lâm Khoa hÂc và Công nghª Viªt Nam, mã sË VAST01.07/15-16. Cßu trúc cıa lu™n án Ch˜Ïng 1 giÓi thiªu ki∏n th˘c tÍng quan bao gÁm : GiÓi thiªu mÎt sË ∞c tr˜ng và s¸ k∏t hÒp a ∞c tr˜ng th˜Ìng ˜Òc s˚ dˆng trong mÎt sË nghiên c˘u tiêu bi∫u v∑ CBIR. GiÓi thiªu và phân tích mÎt sË kˇ thu™t chu©n hoá ∞c tr˜ng, chu©n hoá kho£ng cách. GiÓi thiªu và phân tích mÎt sË kˇ thu™t gi£i quy∏t bài toán kho£ng trËng ng˙ nghæa nh˜ kˇ thu™t hiªu chønh trÂng sË, d‡ch chuy∫n truy vßn s˚ dˆng thông tin ph£n hÁi liên quan, mÎt sË kˇ thu™t máy hÂc. Ch˜Ïng 2 ∑ xußt chu©n hoá ∞c tr˜ng c£i ti∏n d¸a theo chu©n hoá Gauss. ∑ xußt kˇ thu™t hiªu chønh trÂng sË và d‡ch chuy∫n truy vßn d¸a vào thông tin ph£n hÁi cıa ng˜Ìi dùng. Ch˜Ïng 3 ∑ xußt rút gÂn t™p ˘ng viên nh¨m gi£m không gian tìm ki∏m d¸a vào ti∏p c™n tËi ˜u Pareto vÓi các tiêu chí l¸a chÂn là không gian a ∞c tr˜ng. T™p các £nh liên quan theo ph£n hÁi cıa ng˜Ìi dùng ˜Òc s˚ dˆng ∫ hiªu chønh l§i t™p Pareto ∫ phù hÒp vÓi nhu c¶u tìm ki∏m cıa chính ng˜Ìi dùng, cho phép nâng cao Î chính xác phân lÓp trong CBIR. CuËi cùng là ph¶n K∏t lu™n và h˜Óng phát tri∫n, tÍng hÒp các k∏t qu£ chính cıa lu™n án và mÎt sË khuy∏n ngh‡ nghiên c˘u t˜Ïng lai.
  • 22. Ch˜Ïng 1 TÍng quan v∑ Tra c˘u £nh d¸a vào nÎi dung VÓi s¸ gia t´ng nhanh chóng sË l˜Òng d˙ liªu £nh sË, CBIR tr thành lænh v¸c nghiên c˘u dành ˜Òc nhi∑u s¸ quan tâm trong nhi∑u n´m qua, gÁm rßt nhi∑u các nghiên c˘u nh˜ [12], [46], [64], [80], [88], [90], [91], [115], [124]. Các hª thËng này th˜Ìng trích rút các bi∫u diπn tr¸c quan cıa £nh và ‡nh nghæa các hàm tìm ki∏m, Ëi sánh mËi liên quan khi tra c˘u áp ˘ng yêu c¶u ng˜Ìi dùng. ∫ c£i thiªn hiªu n´ng tra c˘u, các kˇ thu™t hÂc máy hiªu qu£ ã ˜Òc s˚ dˆng trong phân lÓp theo truy vßn [18], [22], [54], [112]. MÎt hª thËng CBIR gÁm các thành ph¶n cÏ b£n mô t£ trong sÏ Á Hình 0.1. NÎi dung cıa ch˜Ïng s≥ nghiên c˘u mÎt sË thành ph¶n cÏ b£n nh˜ trích rút ∞c tr˜ng, chu©n hoá, ph£n hÁi liên quan. Bên c§nh ó ch˜Ïng s≥ phân tích mÎt sË nghiên c˘u liên quan, nh˙ng y∏u tË £nh h˜ng ∏n hiªu qu£ hª thËng CBIR. Mˆc 1.1 giÓi thiªu mÎt sË ∞c tr˜ng £nh s˚ dˆng trong hª thËng CBIR. ∫ s˚ dˆng hiªu qu£ các ∞c tr˜ng, trong Mˆc 1.2 giÓi thiªu mÎt sË hª thËng CBIR s˚ dˆng k∏t hÒp a ∞c tr˜ng. Mˆc 1.3 giÓi thiªu và phân tích mÎt sË ph˜Ïng pháp chu©n hoá th˜Ìng ˜Òc s˚ dˆng trong CBIR cho ∞c tr˜ng và giá tr‡ kho£ng cách. Kho£ng trËng ng˙ nghæa ˜Òc trình bày trong Mˆc 1.4. MÎt sË kˇ thu™t 8
  • 23. 9 gi£m kho£ng trËng ng˙ nghæa ˜Òc trình bày trong các Mˆc 1.5, 1.6, 1.7 và 1.8. Mˆc 1.9 trình bày ph˜Ïng pháp ánh giá hiªu n´ng cıa hª thËng CBIR s˚ dˆng trong các ∑ xußt  Ch˜Ïng 2 và Ch˜Ïng 3. 1.1 MÎt sË ∞c tr˜ng £nh th˜Ìng s˚ dˆng trong tra c˘u £nh d¸a vào nÎi dung Trong CBIR, trích rút ∞c tr˜ng nh¨m chuy∫n Íi mÈi £nh ¶u vào thành mÎt t™p các ∞c tr˜ng (thông th˜Ìng d˜Ói hình th˘c vector ∞c tr˜ng). Các ∞c tr˜ng m˘c thßp ˜Òc trích rút mÎt cách t¸ Îng d¸a trên các thuÎc tính khác nhau (màu s≠c, k∏t cßu, hình d§ng, v.v.) cıa chính £nh ó. Tr˜Óc khi trích rút ∞c tr˜ng, các £nh ˜Òc ti∑n x˚ l˛ (chuy∫n Íi không gian màu, gi£m nhiπu, l˜Òng t˚ hoá, v.v.). Các ∞c tr˜ng s≥ mang ¶y ı thông tin v∑ £nh, viªc tìm các ∞c tr˜ng liên quan bi∫u diπn nÎi dung tr¸c quan cıa các £nh trong mÎt cÏ s d˙ liªu lÓn v®n ang là mÎt nhiªm vˆ thách th˘c. L¸a chÂn ∞c tr˜ng tu˝ thuÎc vào cÏ s d˙ liªu £nh, tu˝ thuÎc ˘ng dˆng và cÙng nh˜ tu˝ thuÎc vào mong muËn cıa ng˜Ìi dùng. Các ∞c tr˜ng có th∫ bi∫u diπn toàn cˆc (cho toàn bÎ £nh), cˆc bÎ (cho mÎt vùng ∞c biªt cıa £nh) ho∞c các ti∏p c™n không gian. 1.1.1 Miêu t£ toàn cˆc L˜Òc Á màu ∞c tr˜ng này ˜Òc s˚ dˆng trong nhi∑u hª thËng CBIR nh˜ QBIC [72], MARS [79], [83], [90], PicHunter [17], VisualSEEK [96], v.v. L˜Òc Á màu th˜Ìng ˜Òc bi∏t d˜Ói d§ng mÎt vector n chi∑u [h1, ..., hn], trong ó hj là sË i∫m £nh có màu j trong £nh và n là sË các giá tr‡ màu. Nh˜ v™y, l˜Òc Á màu bi∫u diπn phân bË cıa các màu trong £nh.
  • 24. 10 Các mô men màu Gi£ ‡nh màu trong mÎt £nh có th∫ theo mÎt phân phËi xác sußt nhßt ‡nh. Khi ó, các mô men phân phËi màu s≥ ˜Òc s˚ dˆng nh˜ các ∞c tr˜ng màu cıa £nh. Stricker và Orengo [97] ‡nh nghæa các mô men màu khác nhau cho mÈi kênh màu trong £nh. T˜Ïng quan màu T˜Ïng quan màu nói ∏n t˜Ïng quan không gian cıa các c∞p màu trong £nh [45]. Trong [74], [84] ã s˚ dˆng ∫ trích rút ∞c tr˜ng £nh s˚ dˆng cho CBIR. T˜Ïng t¸ l˜Òc Á màu và các mô men màu, t˜Ïng quan màu có th∫ s˚ dˆng cho các lo§i không gian màu khác nhau. ∞c tr˜ng k∏t cßu ∞c tr˜ng k∏t cßu ˜Òc s˚ dˆng rÎng rãi trong CBIR, ph£n ánh cßu trúc không gian, b∑ m∞t,... Có th∫ ‡nh nghæa mÎt vùng k∏t cßu nh˜ mÎt vùng có c˜Ìng Î không Áng nhßt. Các ∞c tr˜ng k∏t cßu cÙng là các ∞c tr˜ng tr¸c quan quan trÂng cıa £nh. ChØng h§n, con hÍ và con báo không th∫ phân biªt n∏u chø s˚ dˆng màu s≠c và hình d§ng. Các ∞c tr˜ng k∏t cßu là c¶n thi∏t trong tr˜Ìng hÒp này. Có th∫ chia bi∫u diπn k∏t cßu thành ph˜Ïng pháp cßu trúc và ph˜Ïng pháp thËng kê. Các ph˜Ïng pháp cßu trúc miêu t£ k∏t cßu b¨ng cách xác ‡nh tính b£n chßt ho∞c các m®u cÏ b£n (nh˜ là các ˜Ìng tròn, hình lˆc giác, hình ch˙ nh™t,...) và quy t≠c ∫ t§o nên k∏t cßu. Các ph˜Ïng pháp này có hiªu qu£ khi miêu t£ các k∏t cßu có cßu trúc, qua ∑ c™p trong bài báo [38], [66], [105], [109]. Ph˜Ïng pháp thËng kê miêu t£ k∏t cßu thông qua t™p thËng kê các vector ∞c tr˜ng, d¸a trên các tính chßt nh˜ Î t˜Ïng ph£n, entropy,... ˜a ra trong [38], [39].
  • 25. 11 Trong [34], [56] d¸a vào nguyên l˛ k∏t cßu là s¸ l∞p i l∞p l§i cıa các chßt liªu vÓi mÎt t¶n sußt nhßt ‡nh, ˛ t˜ng cıa ph˜Ïng pháp này là s˚ dˆng mÎt t™p các bÎ lÂc Gabor ∫ phân tích cßu trúc cıa k∏t cßu a tø lª (t¶n sË) và a h˜Óng. Zhang và cÎng s¸ [121] s˚ dˆng bi∏n Íi Gabor wavelet s˚ dˆng cho CBIR. ∞c tr˜ng hình d§ng Các ∞c tr˜ng hình d§ng ˜Òc s˚ dˆng rÎng rãi trong các hª thËng CBIR [107]. ây là ki∫u ∞c tr˜ng miêu t£ Ëi t˜Òng và vùng. Các miêu t£ hình d§ng ˜Òc trích rút, sau khi phân o§n £nh theo các Ëi t˜Òng và các vùng. Các ∞c tr˜ng hình d§ng không phong phú b¨ng các ∞c tr˜ng màu và k∏t cßu. ∞c tr˜ng hình d§ng ˜Òc giÓi thiªu trong bài báo [117]. Có th∫ chia chúng vào hai nhóm : (i) Các miêu t£ ˜Ìng Áng m˘c ; (ii) Các miêu t£ vùng. Các miêu t£ ˜Ìng Áng m˘c ˜a ra trong mÎt sË bài báo [29], [119], [122]. Các miêu t£ vùng, có th∫ bi∫u diπn các thuÎc tính cıa toàn bÎ vùng, ˜Òc ˜a ra trong các bài báo v∑ các mô men Hu [44], các bßt bi∏n Zernike [51]. ∞c tr˜ng GIST Oliva và Torralba [75] mô hình hoá viªc nh™n d§ng c£nh th∏ giÓi th¸c b‰ qua phân o§n, quá trình x˚ l˛ các vùng và các Ëi t˜Òng cˆ th∫ b¨ng ∑ xußt t™p chi∑u tr¸c quan (tính t¸ nhiên, tính rõ ràng, tính nhám, giãn n, gÁ gh∑) bi∫u diπn cßu trúc không gian cıa mÎt c£nh. Mô hình này t§o ra mÎt không gian a chi∑u, trong ó các c£nh liên quan tÓi các chı ∑ ng˙ nghæa (ví dˆ nh˜ ˜Ìng phË, cao tËc, bÌ bi∫n) ˜Òc xem nh˜ g¶n nhau. Tính hiªu qu£ cıa ∞c tr˜ng GIST ã ˜Òc ch˘ng minh trong nh™n d§ng Ëi t˜Òng [76], [103].
  • 26. 12 Bi∏n Íi Haar Wavelet Bi∏n Íi Haar Wavelet là bi∏n Íi cÏ b£n t¯ mi∑n không gian sang mi∑n t¶n sË . Haar Wavelet ˜Òc ∑ xußt bi Alfred Haar [36]. ∞c tr˜ng này ˜Òc s˚ dˆng trong công trình [CT4]. 1.1.2 Miêu t£ cˆc bÎ Các ∞c tr˜ng cˆc bÎ hiªn nay ˜Òc s˚ dˆng rÎng rãi trong CBIR. Thay vì tính toán d˙ liªu ∞c tr˜ng trên toàn bÎ £nh, các ph˜Ïng pháp trích rút ∞c tr˜ng d¸a trên cách ti∏p c™n này chø miêu t£ các thuÎc tính cˆc bÎ cıa các vùng £nh ho∞c xác ‡nh các i∫m nÍi b™t. MÈi £nh ˜Òc miêu t£ b¨ng mÎt t™p các vector ∞c tr˜ng (mÈi vector cho mÈi i∫m). Các kˇ thu™t phát hiªn các i∫m nÍi b™t ã ˜Òc ∑ xußt trong mÎt sË nghiên c˘u nh˜ phát hiªn Harris [40], phát hiªn Harris-Laplace [67], phát hiªn Difference of Gaussian (DoG) [59],v.v. MÎt sË ph˜Ïng pháp tiêu bi∫u nhßt nh˜ SIFT (Scale- Invariant Feature Transform) [63] và SURF (Speed Up Robust Features) [3]. Trong công trình [CT5] ã ˜a ra mÎt sË ánh giá v∑ hai ∞c tr˜ng SIFT và SURF trong hª thËng SIMPLE. Bên c§nh s˚ dˆng các i∫m nÍi b™t, trong £nh còn có rßt nhi∑u i∫m £nh n¨m r£i rác không t§o thành vùng Áng nhßt (vùng Áng nhßt gÁm các i∫m £nh cùng màu và li∑n k∑ nhau). Viªc s˚ dˆng tßt c£ các i∫m £nh trong £nh (c£ các i∫m £nh n¨m r£i rác) vào quá trình tra c˘u, Î ph˘c t§p tính toán s≥ cao và nhi∑u khi chßt l˜Òng tra c˘u không ˜Òc c£i thiªn. Trong công trình [CT2] ã s˚ dˆng kˇ thu™t trích rút ∞c tr˜ng d¸a trên vùng thu¶n nhßt.
  • 27. 13 1.2 TÍ hÒp ∞c tr˜ng trong tra c˘u £nh d¸a vào nÎi dung Các ki∫u ∞c tr˜ng tr¸c quan th˜Ìng ˜Òc s˚ dˆng là màu s≠c, k∏t cßu và hình d§ng. MÎt sË bi∫u diπn cho ki∫u ∞c tr˜ng màu gÁm bÎ ∞c tr˜ng l˜Òc Á màu và mô men màu [98], bi∫u diπn ki∫u ∞c tr˜ng k∏t cßu gÁm mÎt sË bÎ ∞c tr˜ng nh˜ Tamura [65], [99] và ma tr™n Áng m˘c [39] . Trong [89] s˚ dˆng mÎt sË bÎ ∞c tr˜ng k∏t hÒp : l˜Òc Á màu, mô men màu, ma trân Áng m˘c, Tamura, miêu t£ Fourier và miêu t£ hình d§ng. Trong [35], [96] s˚ dˆng k∏t hÒp ki∫u ∞c tr˜ng màu, k∏t cßu, hình d§ng, gÁm các bÎ ∞c tr˜ng l˜Òc Á màu, mô men màu [98], k∏t cßu Tamura [99] và ma tr™n Áng m˘c [39]. Trong [73] s˚ dˆng k∏t hÒp mÎt sË bÎ ∞c tr˜ng : l˜Òc Á màu, bßt bi∏n màu và ma tr™n Áng m˘c. Trong [48] s˚ dˆng k∏t hÒp mÎt sË bÎ ∞c tr˜ng l˜Òc Á màu, t¸ t˜Ïng quan màu, bßt bi∏n màu, lÂc Gabor và bi∏n Íi wavelet. Kˇ thu™t phân tích k∏t cßu th˜Ìng ˜Òc s˚ dˆng cho CBIR là Haar Wavelet [50], [108]. Sau thu™t toán bi∏n Íi nhi∑u m˘c, ∞c tr˜ng thu ˜Òc t¯ ba kênh màu b¨ng chu©n F-norm [106]. Trong [90] Ëi vÓi t™p d˙ liªu £nh th˘ nhßt s˚ dˆng k∏t hÒp bÎ ∞c tr˜ng mô men màu [98] cho ki∫u ∞c tr˜ng màu, bÎ ∞c tr˜ng Tamura [99], ma tr™n Áng m˘c [73], [87] cho ki∫u ∞c tr˜ng k∏t cßu, bÎ ∞c tr˜ng miêu t£ Fourier và miêu t£ hình d§ng chamfer [89] cho ki∫u ∞c tr˜ng hình d§ng. Trên t™p d˙ liªu th˘ hai s˚ dˆng k∏t hÒp mÎt sË bÎ ∞c tr˜ng gÁm l˜Òc Á màu, mô men màu [98], ma tr™n Áng m˘c [39], [73]. T™p ki∫u ∞c tr˜ng và bÎ ∞c tr˜ng ˜Òc miêu t£ nh˜ sau : (1) F = {fi } là t™p ki∫u ∞c tr˜ng tr¸c quan m˘c thßp gÁm : màu, k∏t cßu, hình d§ng.
  • 28. 14 (2) T = {tij } là t™p bi∫u diπn nhi∑u bÎ ∞c tr˜ng tij , trong ó mÈi bÎ ∞c tr˜ng thuÎc vào mÎt ki∫u ∞c tr˜ng fi và tij ⌘ [tij1, ..., tijk , ..., tijM ] là vector gÁm nhi∑u thành ph¶n. ◊u i∫m viªc s˚ dˆng tÍ hÒp ∞c tr˜ng nh¨m k∏t hÒp th∏ m§nh cıa các bÎ ∞c tr˜ng trong miêu t£ nÎi dung tr¸c quan cıa £nh. 1.3 Chu©n hoá trong CBIR 1.3.1 Mˆc ích cıa chu©n hoá Các hª thËng CBIR s˚ dˆng tÍ hÒp ∞c tr˜ng nh˜ [90], Î t˜Ïng t¸ cıa các £nh vÓi £nh truy vßn ˜Òc phân bÍ theo các bÎ ∞c tr˜ng tij khác nhau. Î t˜Ïng t¸ toàn bÎ theo ki∫u k∏t hÒp tuy∏n tính trong Ph˜Ïng trình (1.1). S = X i X j Wij S(tij ) (1.1) trong ó Sij là Î t˜Ïng t¸ theo bÎ ∞c tr˜ng tij , Wij là trÂng sË t˜Ïng ˘ng. Ta bi∏t r¨ng Î o t˜Ïng t¸ ˜Òc s˚ dˆng ∫ xác ‡nh t˜Ïng t¸ ho∞c không t˜Ïng t¸ gi˙a hai £nh. Các Î o t˜Ïng t¸ khác nhau ˜Òc s˚ dˆng cho các bi∫u diπn ∞c tr˜ng khác nhau. Bi mÎt sË hàm t˜Ïng t¸ tr£ l§i mÎt giá tr‡ trong ph§m vi [0,1], nh˜ kho£ng cách L1 (“giao l˜Òc Á”) [64], [95] ˜Òc s˚ dˆng cho so sánh các bi∫u diπn l˜Òc Á màu, trong khi các hàm khác thì không nh˜ v™y. Th¸c t∏, kho£ng cách Ã-clit (L2) ˜Òc dùng rÎng rãi nhßt nh˜ trong [57], [72], [80], [95]. MÎt sË Î o phÍ bi∏n khác ã s˚ dˆng kho£ng cách Ã-clit trÂng sË nh˜ trong [5], [90], kho£ng cách Minkowsky Lp tÍng quát [92] và kho£ng cách Mahalanobis trong [80], [95]. Gi£ thi∏t r¨ng các giá tr‡ Î t˜Ïng t¸ cıa mÈi bÎ ∞c tr˜ng (S(tij )) trong ph§m vi Îng t¯ 0 tÓi 1. Theo cách k∏t hÒp tuy∏n tính nh˜ Ph˜Ïng trình (1.1) s≥
  • 29. 15 tr nên ít ˛ nghæa. Bi vì mÎt S(tij ) nào ó có th∫ lßn át cái khác do giá tr‡ cıa nó lÓn. Bi l˛ do nh˜ v™y, khi tính S(tij ) các thành ph¶n vector tijk ph£i ˜Òc chu©n hoá tr˜Óc khi tính Î o t˜Ïng t¸. Chu©n hoá các thành ph¶n tijk ˜Òc xem nh˜ chu©n hoá ∞c tr˜ng và chu©n hoá S(tij ) ˜Òc xem nh˜ chu©n hoá kho£ng cách ho∞c Î t˜Ïng t¸. Hình 1.1. Thành ph¶n th˘ nhßt cıa ∞c tr˜ng mô men màu. Cho cÏ s d˙ liªu I1, I2, ..., IN gÁm N £nh, tij = [tij1, ..., tijk , ..., tijM ] là bi∫u diπn vector cıa bÎ ∞c tr˜ng tij trong ki∫u fi . Ta có th∫ hình thành mÎt ma tr™n ∞c tr˜ng N ⇥M trong ó tijk là thành ph¶n ∞c tr˜ng th˘ k. Trong Hình 1.1 mÈi cÎt cıa ma tr™n là mÎt chuÈi {tijk }. Mˆc ích chu©n hoá giá tr‡ trong mÈi cÎt vào mÎt ph§m vi, £m b£o mÈi thành ph¶n ∞c tr˜ng nh™n trÂng sË b¨ng nhau trong viªc xác ‡nh Î t˜Ïng t¸ gi˙a hai vector. Trong CBIR th˜Ìng s˚ dˆng hai phép chu©n hoá : chu©n hoá min-max và chu©n hoá Gauss.
  • 30. 16 1.3.2 Chu©n hóa min-max Chu©n hóa min-max cho phép chuy∫n d˙ liªu v∑ ph§m vi [0, 1] nh˜ sau : {tijk } 7! { ˜tijk }, 8 k, ˜tijk = tijk min{tijk } max{tijk } min{tijk } , (1.2) trong ó min{tijk } và max{tijk } là giá tr‡ nh‰ nhßt và lÓn nhßt cıa chuÈi  thành ph¶n k theo bÎ ∞c tr˜ng tij cıa tßt c£ các £nh trong cÏ s d˙ liªu. T˜Ïng t¸ giá tr‡ kho£ng cách theo mÈi bÎ ∞c tr˜ng ˜Òc chu©n hoá nh˜ sau : ˜Dtij (Ii , Ij ) = Dtij (Ix , Iy) mintij maxtij mintij , (1.3) trong ó Dtij (Ix , Iy) là kho£ng cách theo bÎ ∞c tr˜ng tij cıa hai £nh Ix , Iy và maxtij , mintij t˜Ïng ˘ng là kho£ng cách lÓn nhßt và kho£ng cách nh‰ nhßt theo bÎ ∞c tr˜ng tij . Cách ti∏p c™n này có th∫ thu hµp các giá tr‡ kho£ng cách theo bÎ ∞c tr˜ng vào mÎt ph§m vi rßt nh‰ n∏u giá tr‡ max có lÓn bßt th˜Ìng. Bai và cÎng s¸ [2], Jose và Joseph [48] s˚ dˆng phép chu©n hoá này. H§n ch∏ : H¶u h∏t thông thông tin h˙u ích b‡ chuy∫n vào mÎt ph§m vi rßt hµp trong [0, 1] n∏u giá tr‡ max lÓn. 1.3.3 Chu©n hóa Gauss Chu©n hóa Gauss hay gÂi là 3 , phép chu©n hóa này khá hiªu qu£ ˜Òc s˚ dˆng nhi∑u trong CBIR nh˜ trong [14], [19], [61], [78], [88], [90], i∑u này ˜Òc khØng ‡nh theo Lu™t 1.1. Lu™t 1.1. 3 ([90]) x là §i l˜Òng ng®u nhiên có trung bình µ và Î lªch thì xác sußt P ⇣ x µ 3  1 ⌘ 0.99.
  • 31. 17 Chu©n hoá thành ph¶n th˘ k cıa bÎ ∞c tr˜ng tij nh˜ sau : {tijk } 7! { ˜tijk }, 8 k, ˜tijk = tijk µk 3 k , (1.4) trong ó µk def = mean({tijk }), k def = var({tijk }). Trong [14], [78], [88], [90] s˚ dˆng phép chu©n hóa 3 cho các ∞c tr˜ng (màu, k∏t cßu, và hình d§ng) và chu©n hóa giá tr‡ kho£ng cách : ˜Dtij (Ix , Iy) = Dtij (Ix , Iy) µtij K tij , (1.5) trong ó phân bË chu©n tij theo bÎ ∞c tr˜ng tij là tij = 2 N (N 1) N 1X x=1 NX y=x+1 h Dtij (Ix , Iy) µtij i2 , (1.6) và kho£ng cách trung bình µtij gi˙a các c∞p £nh theo bÎ ∞c tr˜ng tij : µtij = 2 N (N 1) N 1X x=1 NX y=x+1 Dtij (Ix , Iy). (1.7) Mood và cÎng s¸ [70] ã cho thßy xác sußt 68% các giá tr‡ kho£ng cách n¨m trong kho£ng [ 1, 1] khi K = 1 và 99% khi K = 3. H§n ch∏ : Phép chu©n hoá 3 “r£i ∑u” trong [ 1, 1] nh˜ng yêu c¶u d˙ liªu là mÎt chuÈi Gauss. Phép chu©n hoá 3 yêu c¶u d˙ liªu ∞c tr˜ng ph£i là mÎt chuÈi Gauss. Kh£o sát trên mÎt sË cÏ s d˙ liªu £nh chu©n Wang 1 , Caltech 101 2 , Oxford Buildings 3 d˙ liªu ∞c tr˜ng sau khi ˜Òc trích rút ã cho thßy gi£ thi∏t yêu c¶u d˙ liªu phân bË Gauss là quá ch∞t ch≥ vì h¶u h∏t ∑u không tho£ mãn theo gi£ thi∏t này. Hình 1. http://wang.ist.psu.edu 2. http://www.vision.caltech.edu/Image_Datasets/Caltech101/ 3. www.robots.ox.ac.uk/~vgg/data/oxbuildings/
  • 32. 18 1.2 là ví dˆ v∑ thành ph¶n ∞c tr˜ng cıa mô men màu “r£i” trên mÎt mi∑n rÎng và không theo phân bË Gauss. −100 0 100 200 300 0 50 100 150 200 250 300 350 400 Value Frequency Thanh phan 1 dac trung Mo men mau (goc) Hình 1.2. Phân bË d˙ liªu thành ph¶n 1 cıa ∞c tr˜ng mô men màu (gËc) −2000 0 2000 4000 6000 8000 10000 0 1000 2000 3000 4000 5000 6000 7000 Value Frequency Du lieu thanh phan 5 luoc do HSV (a) −2 −1 0 1 2 3 4 0 1000 2000 3000 4000 5000 6000 7000 Value Frequency 3sigma (b) Hình 1.3. (a) Phân bË d˙ liªu thành ph¶n 5 l˜Òc Á ∞c tr˜ng l˜Òc Á HSV (gËc). (b) L˜Òc Á ∞c tr˜ng l˜Òc Á HSV chu©n hoá theo lu™t 3 thành ph¶n th˘ 5, 97.4555% d˙ liªu “rÏi vào” [-1,1] Trong l˜Òc Á d˙ liªu Hình 1.3(a) các thành ph¶n cıa chuÈi ∞c tr˜ng không ph£i là mÎt phân bË Gauss, t˘c là gi£ ‡nh phân bË chu©n áp ∞t là không hÒp l˛. Khi chu©n hóa theo 3 , d˙ liªu sau khi chu©n hóa có th∫ nhi∑u thành ph¶n n¨m ngoài o§n [ 1, 1], nh˜ trong Hình 1.3(b). Vì v™y s˚ dˆng chu©n hoá cho d˙ liªu ∞c tr˜ng là ch˜a §t ˜Òc mˆc tiêu cıa b˜Óc chu©n hoá.
  • 33. 19 1.4 Kho£ng trËng ng˙ nghæa Thu™t ng˙ “kho£ng trËng ng˙ nghæa” ˜Òc dùng ∫ miêu t£ s¸ khác nhau gi˙a hai m˘c miêu t£ cıa mÎt £nh. M˘c miêu t£ ¶u trong CBIR s˚ dˆng các vector ∞c tr˜ng chø thu thông tin ∞c tr˜ng m˘c thßp cıa £nh (màu s≠c, k∏t cßu, hình d§ng,...). M˘c miêu t£ th˘ hai th¸c hiªn bi con ng˜Ìi s˚ dˆng các khái niªm ng˙ nghæa m˘c cao khi tra c˘u £nh. Tra c˘u trong hª thËng CBIR truy∑n thËng nói chung chø d¸a vào các Î o t˜Ïng t¸ gi˙a các ∞c tr˜ng m˘c thßp, do v™y các £nh k∏t qu£ có th∫ không phù hÒp vÓi mËi quan tâm cıa ng˜Ìi dùng. Hình 1.4. Énh truy vßn “mandolin image 0001.jpg”. Hình 1.5. Hª thËng tra c˘u vÓi £nh truy vßn “mandolin image 0001.jpg”.
  • 34. 20 Hình 1.6. K∏t qu£ top 20 các £nh t˜Ïng t¸ nhßt vÓi £nh truy vßn  l¶n tra c˘u khi t§o. Cho £nh nh˜ Hình 1.4 là mÎt truy vßn khi t§o tra c˘u trên t™p d˙ liªu Caltech 101 4 . Truy vßn ˜Òc ˜a vào hª thËng CBIR nh˜ Hình 1.5. K∏t qu£ top 20 các £nh liên quan nhßt vÓi £nh truy vßn  l¶n tra c˘u khi t§o ˜Òc máy tính ˜a ra nh˜ Hình 1.6. K∏t qu£ này ˜Òc x∏p h§ng d¸a trên ∞c tr˜ng m˘c thßp. (a) Énh truy vßn (b) Énh 12 Hình 1.7. Hai £nh có ng˙ nghæa t˜Ïng Áng K∏t qu£ tra c˘u ˜Òc x∏p h§ng trong k∏t qu£ top 20 nh˜ Hình 1.6 ch˜a tho£ mãn nhu c¶u tìm ki∏m cıa ng˜Ìi dùng. Do con ng˜Ìi hi∫u £nh b¨ng các khái niªm ng˙ nghæa m˘c cao nh˜ Hình 1.7 hai £nh ˜Òc xem nh˜ là liên quan. Trong 4. http://www.vision.caltech.edu/Image_Datasets/Caltech101/
  • 35. 21 Query image 0 2000 4000 6000 Histogram: Query image 0 50 100 150 200 250 Image 3 0 2000 4000 Histogram: Image 3 0 50 100 150 200 250 Image 12 0 500 1000 Histogram: Image 12 0 50 100 150 200 250 Hình 1.8. L˜Òc Á màu cıa £nh truy vßn và hai £nh trong k∏t qu£ top 20. khi ó máy tính (hay hª thËng tính toán) hi∫u các £nh thông qua ∞c tr˜ng m˘c thßp (nh˜ là l˜Òc Á màu) nh˜ Hình 1.8 nên “£nh truy vßn” và “£nh 3” (Image 3) ˜Òc xem là t˜Ïng Áng v∑ l˜Òc Á màu, do ó ˜Òc hª thËng x∏p th˘ h§ng cao hÏn trong k∏t qu£ top 20. ∫ nâng cao Î chính xác k∏t qu£ tra c˘u trong các l¶n l∞p ti∏p sau c¶n thi∏t thu hµp “kho£ng trËng ng˙ nghæa”. ó là k∏t hÒp thông tin nÎi dung tr¸c quan (các vector ∞c tr˜ng m˘c thßp) vÓi thông tin ng˙ nghæa hÂc ˜Òc t¯ ph£n hÁi trên t™p top k thông qua nhãn m˘c Î quan trÂng b¨ng kˇ thu™t hiªu chønh trÂng sË [90] ho∞c máy phân lÓp trong suËt pha tra c˘u [101]. 1.5 Ph£n hÁi liên quan trong CBIR Kˇ thu™t ph£n hÁi liên quan ˜Òc s˚ dˆng rÎng rãi nh¨m thu hµp “kho£ng trËng ng˙ nghæa” trong CBIR, c£i thiªn k∏t qu£ tra c˘u thông qua t˜Ïng tác gi˙a
  • 36. 22 ng˜Ìi dùng và máy. MÎt k‡ch b£n thông th˜Ìng cho ph£n hÁi liên quan trong CBIR nh˜ sau : B˜Óc 1 : Máy tính ˜a ra các k∏t qu£ tra c˘u khi t§o (top k) thông qua £nh truy vßn. B˜Óc 2 : Ng˜Ìi dùng cung cßp ánh giá trên k∏t qu£ top k, ánh giá theo ki∫u nh˜ “liên quan” ho∞c “không liên quan” vÓi nh™n th˘c cıa chính ng˜Ìi dùng ó. B˜Óc 3 : Máy hÂc và th˚ l§i. L∞p l§i b˜Óc 2. T¯ t™p k∏t qu£ top k ˜Òc ánh giá, mÎt sË ph˜Ïng pháp phÍ bi∏n s˚ dˆng kˇ thu™t ph£n hÁi liên quan nh˜ hiªu chønh trÂng sË và d‡ch chuy∫n truy vßn ; m rÎng truy vßn ; kˇ thu™t hÂc máy. MÈi ph˜Ïng pháp có cách hÂc khác nhau trong viªc s˚ dˆng thông tin cıa ng˜Ìi dùng. Hiªu chønh trÂng sË và d‡ch chuy∫n truy vßn nh˜ trong [46], [88], [90] s˚ dˆng các £nh ˜Òc ánh giá trong k∏t qu£ top k cho phép xây d¸ng trÂng sË. TrÂng sË ˜Òc gán mÎt hª sË cho mÈi chi∑u cıa i∫m truy vßn, các trÂng sË cao vÓi các chi∑u quan trÂng hÏn và ng˜Òc l§i. Trong [88] s˚ dˆng trÂng sË kho£ng cách Ã-clit, cho phép x˚ l˛ các m∞t elip vÓi trˆc chính ˜Òc gióng theo các trˆc to§ Î. MindReader [46] s˚ dˆng kho£ng cách Ã-clit tÍng quát, cho phép quay các trˆc ∫ làm viªc tËt hÏn vÓi các h˜Óng tu˝ ˛ các m∞t elip. D‡ch chuy∫n truy vßn nh˜ trong [88] và MindReader [46] bi∫u diπn truy vßn nh˜ mÎt i∫m Ïn trong không gian ∞c tr˜ng, di chuy∫n i∫m truy vßn v∑ phía các i∫m k∏t qu£ liên quan và di chuy∫n ra xa các i∫m k∏t qu£ không liên quan. fi t˜ng này xußt phát t¯ ph˜Ïng pháp cıa Rocchio [85]. Trong [88], Mindreader [46] òi h‰i “truy vßn khi t§o” ı tËt và mÎt sË b˜Óc hiªu chønh c¶n thi∏t, tr˜Óc khi các trÂng sË hÎi tˆ tÓi các giá tr‡ úng. MÎt cách tr¸c giác, cách ti∏p c™n này phù hÒp vÓi nh™n th˘c chı quan cıa ng˜Ìi dùng. S¸ h§n ch∏ cıa nh˙ng ph˜Ïng pháp này là khó hÎi tˆ khi các i∫m liên quan n¨m r£i rác trong không gian tr¸c quan. M rÎng truy vßn nh˜ trong [52], [83] cho phép gi£i quy∏t vßn ∑ khó hÎi tˆ. B¨ng cách s˚ dˆng nhi∑u i∫m truy vßn ∫ xây d¸ng cˆm cˆc bÎ cho các i∫m
  • 37. 23 liên quan, sau ó hÒp tßt c£ các k∏t qu£. Theo ti∏p c™n này, các cˆm cˆc bÎ ˜Òc hÒp l§i, cho phép hình thành mÎt ˜Ìng Ïn bao phı tßt c£ các i∫m liên quan. Tuy nhiên, ph˜Ïng pháp này có th∫ b‰ sót các £nh liên quan trong ó tÍng toàn bÎ kho£ng cách cao cıa toàn bÎ các chi∑u, nh˜ng có th∫ nh˙ng £nh này t˜Ïng t¸ ng˙ nghæa vÓi nhu c¶u thông tin cıa ng˜Ìi dùng. Nhiªm vˆ tra c˘u cıa hª thËng CBIR có th∫ ˜Òc xem xét nh˜ mÎt bài toán hÂc máy [16]. Mˆc ích ∫ phân lÓp cÏ s d˙ liªu vào hai lÓp : lÓp liên quan ch˘a các £nh t˜Ïng t¸ vÓi các £nh truy vßn và lÓp không liên quan bi∫u diπn lÓp các £nh mà không liên quan vÓi £nh truy vßn nh˜ trong [100], [101], [123]. Các £nh liên quan nhßt, theo phân lÓp ˜Òc tr£ v∑ cho ng˜Ìi dùng. Sau ó, ng˜Ìi dùng có th∫ ánh giá các £nh k∏t qu£ này nh˜ là các £nh liên quan ho∞c không liên quan. Các £nh ˜Òc ánh giá bi ng˜Ìi dùng sau ó có th∫ ˜Òc thêm vào t™p hußn luyªn cho quá trình hÂc cho l¶n l∞p ti∏p theo. Nói chung, các ti∏p c™n trên ch˜a £m b£o tìm ˜Òc £nh liên quan mong muËn và ôi khi chúng có th∫ t≠c ngh≥n cˆc bÎ ho∞c tìm l§i quanh qu©n khi không tìm thßy các £nh mÓi có liên quan. ∫ gi£i quy∏t nh˙ng bßt lÒi ã nêu trên, lu™n án v®n ti∏p nghiên c˘u s¸ k∏t hÒp a ∞c tr˜ng trong hª thËng CBIR s˚ dˆng hiªu chønh trÂng sË, d‡ch chuy∫n truy vßn và d¸a vào ti∏p c™n tËi ˜u Pareto. 1.6 Hiªu chønh trÂng sË và d‡ch chuy∫n truy vßn trong CBIR s˚ dˆng ph£n hÁi liên quan Trong [20], [46], [90], [114] s˚ dˆng kˇ thu™t hiªu chønh trÂng sË hÂc thông tin cıa ng˜Ìi dùng b¨ng cách i∑u chønh trÂng sË mÈi ∞c tr˜ng cıa truy vßn và trÂng sË cıa mÈi chi∑u trong cùng mÎt ∞c tr˜ng . Các trÂng sË này ˜Òc i∑u chønh trong mÈi l¶n l∞p cıa ph£n hÁi liên quan. Các trÂng sË lÓn ˜Òc gán cho nh˙ng ∞c tr˜ng có s¸ phân biªt tËt gi˙a các £nh liên quan và không liên quan ∫ t´ng c˜Ìng Î chính xác tra c˘u.
  • 38. 24 Das [20] l¸a chÂn trÂng sË d¸a vào tø sË cıa s¸ bi∏n thiên ∞c tr˜ng qua tßt c£ các l¶n tra c˘u vÓi các £nh liên quan ã ˜Òc tra c˘u. Cho (l) j và (l) rel,j kí hiªu t˜Ïng ˘ng cho Î lªch chu©n cıa bÎ ∞c tr˜ng t trên các t™p R(l) [ N (l) và R(l) , trong ó R(l) và N (l) bi∫u diπn t™p cıa các £nh liên quan và không liên quan  l¶n l∞p th˘ l. MÎt l¸a chÂn rßt hi∫n nhiên cıa trÂng sË cho bÎ ∞c tr˜ng t  các l¶n l∞p th˘ (l + 1) là w (l+1) j = (l) j (l) rel,j (1.8) Khi không có £nh liên quan ˜Òc tra c˘u, m®u sË ˜Òc gán mÎt giá tr‡ d˜Ïng nh‰ ✏ sao cho các trÂng sË không b‡ thay Íi áng k∫. Wu và Zhang [114] s˚ dˆng c£ hai các m®u ph£n hÁi d˜Ïng và ph£n hÁi âm, s˚ dˆng tø sË phân biªt, xác ‡nh kh£ n´ng cıa mÎt ∞c tr˜ng ∫ phân tách các £nh liên quan t¯ các £nh không liên quan. Gi£ s˚ I t,(l) rel,j = {I t , I 2 R(l) }, Irel nghæa là £nh liên quan thì vùng trÎi hÏn trong sË các £nh liên quan  l¶n l∞p th˘ l cho thành ph¶n ∞c tr˜ng th˘ j ˜Òc xác ‡nh nh˜ sau : D (l) j = [min(I t,(l) rel,j ), max(I t,(l) rel,j )] (1.9) Tø sË phân biªt ˜Òc s˚ dˆng ∫ xác ‡nh kh£ n´ng mÎt thành ph¶n ∞c tr˜ng trong viªc phân tách các £nh liên quan t¯ các £nh không liên quan là : (l) j = 1 SË £nh không liên quan bên trong D (l) j |N(l)| (1.10) Giá tr‡ cıa j n¨m gi˙a 0 và 1, là 0 khi tßt c£ các £nh liên quan cùng n¨m trong ph§m vi trÎi nên không ánh trÂng sË cho các thành ph¶n ∞c tr˜ng này. Ng˜Òc l§i, khi không có mÎt £nh liên quan nào n¨m trong ph§m vi trÎi, trÂng sË lÓn nhßt s≥ ˜Òc cho các thành ph¶n ∞c tr˜ng ó. Theo ó, th¸c nghiªm theo
  • 39. 25 hai cách hiªu chønh trÂng sË cho ∞c tr˜ng ˜Òc ˜a ra nh˜ sau : w (l+1) j = (l) j (l) rel,j , (1.11) w (l+1) j = (l) j ⇤ (l) j (l) rel,j (1.12) Trong [90] s˚ dˆng trÂng sË cho ki∫u ∞c tr˜ng và bÎ ∞c tr˜ng. Î t˜Ïng t¸ theo bÎ ∞c tr˜ng tij ˜Òc xác ‡nh : S(tij ) = mij (tij , wijk ), wijk = 1/ ijk , (1.13) trong ó mij là Î t˜Ïng t¸ t˜Ïng ˘ng theo bÎ ∞c tr˜ng tij và ijk là Î lªch chu©n cıa chuÈi theo thành ph¶n tijk trong sË các £nh liên quan. Î t˜Ïng t¸ theo ki∫u ∞c tr˜ng fi ˜Òc xác ‡nh : S(fi ) = X j wij S(tij ), w(l+1) ij = w(l) ij + score(l) , (1.14) trong ó giá tr‡ score(l) ˜Òc ng˜Ìi dùng l¸a trong sË các giá tr‡ {3, 1, 0, 1, 3} t˜Ïng ˘ng “liên quan cao”, “liên quan”, “không liên quan”, “không liên quan cao”. Î t˜Ïng t¸ toàn bÎ : S = X i wi S(fi ) (1.15) ◊u i∫m cıa viªc nhóm này nh¨m mˆc ích nhßn m§nh óng góp theo ki∫u. H§n ch∏ là không £m b£o tính công b¨ng gi˙a các bÎ ∞c tr˜ng trong cùng mÎt ki∫u vì các bÎ ∞c tr˜ng có nh˙ng óng góp tích c¸c khác nhau. MÎt sË nghiên c˘u trong nh˙ng n´m g¶n ây [12], [41], [115], [124] s˚ dˆng hiªu chønh trÂng sË theo ti∏p c™n hÂc tr˜Óc t¯ d˙ liªu ∞c tr˜ng. Zhou và cÎng s¸ [124] ∑ xußt hª thËng gÁm hai pha. Trong pha off-line xây d¸ng mÎt t™p mô hình ∫ ánh x§ tßt c£ các £nh trong cÏ s d˙ liªu sang không gian ∞c tr˜ng liên
  • 40. 26 quan. Trong pha tra c˘u on-line, s≥ gán mÎt trÂng sË cho mÂi ∞c tr˜ng liên quan d¸a vào £nh truy vßn, sau ó x∏p h§ng các £nh trong cÏ s d˙ liªu d¸a vào các giá tr‡ ∞c tr˜ng trung bình trÂng sË cıa nó. MÈi ∞c tr˜ng ˜Òc s˚ dˆng ∫ xây d¸ng mÎt cây nh˜ trong Isolation Forest [60]. MÈi £nh I trong cÏ s d˙ liªu ˜Òc ˜Óc l˜Òng giá tr‡ liên quan li (I ) theo ∞c tr˜ng i trên mÈi cây Ti (i 2 {1, ..., t}) và ánh x§ I sang không gian ∞c tr˜ng liên quan nh˜ : I 0 = [l1(I ), ..., lt (I )]T (1.16) và truy vßn Q cÙng ˜Òc bi∫u diπn t˜Ïng t¸ nh˜ v™y. MÎt trÂng sË cho ∞c tr˜ng i nh˜ sau : wi (Q) = li (Q) c( ) 1, (1.17) trong ó c( ) = 2(ln( 1) ( 1)/ + E), E ⇡ 0.5772 ( theo [60]). X∏p h§ng mÎt £nh I vÓi truy vßn Q theo giá tr‡ trÂng sË trung bình : Score(I | Q) = 1 t tX i=1 (wi (Q) ⇥ li (I )). (1.18) Xu và cÎng s¸ [115] ti∏n hành hÂc tr˜Óc (t˘c là s˚ dˆng ∞c tr˜ng cıa toàn bÎ các £nh trong cÏ s d˙ liªu tính Î t˜Ïng t¸ tr˜Óc) t¯ d˙ liªu ∞c tr˜ng b¨ng cách xây d¸ng mËi liên quan ng˙ nghæa gi˙a các £nh thông qua Á th‡ (ma tr™n k∑). Nghiên c˘u này s˚ dˆng kˇ thu™t hÂc ánh x§ t¯ không gian ∞c tr˜ng m˘c thßp sang không gian ng˙ nghæa m˘c cao nh˜ trong Manifold Ranking (MR) [41], cho phép gi£m chi phí tính toán khi xây d¸ng ma tr™n li∑n k∑. D˙ liªu ∞c tr˜ng cıa tßt c£ các £nh ˜Òc trích rút và s˚ dˆng nh˜ to§ Î cıa các i∫m trong Á th‡. Ti∏p theo, l¸a chÂn bi∫u diπn cho các i∫m nh˜ các anchor và xây d¸ng ma tr™n trÂng sË Z b¨ng kernel regression vÓi mÎt lân c™n nh‰ s. Các anchor ˜Òc l¸a chÂn off-line và không £nh h˜ng trong quá trình x˚ l˛ on-line. Khi mÎt truy vßn ˜Òc ˜a vào, sau khi trích rút ∞c tr˜ng m˘c thßp, sau ó c™p nh™t trÂng sË cho ma tr™n Z, tính toán i∫m x∏p h§ng, chi ti∏t v∑ tính toán này có trong [115].
  • 41. 27 1.7 Tra c˘u £nh d¸a vào nÎi dung s˚ dˆng kˇ thu™t máy hÂc Các kˇ thu™t hÂc máy có hiªu n´ng t´ng áng k∫ Ëi vÓi các hª thËng CBIR nh˜ các kˇ thu™t máy vector hÈ trÒ (SVM) , hÂc t´ng c˜Ìng (boosting),... MÎt h§n ch∏ là không có d˙ liªu hußn luyªn t¯ tr˜Óc vÓi mÈi truy vßn cˆ th∫, d˙ liªu hußn luyªn chø có ˜Òc sau khi ng˜Ìi dùng ph£n hÁi vÓi £nh truy vßn ˜Òc ˜a vào bi mÎt ng˜Ìi dùng. Bên c§nh d˙ liªu hußn luyªn là t˜Ïng Ëi ít và d˙ liªu ki∫m tra b‡ nhiπu do vßn ∑ kho£ng trËng ng˙ nghæa. 1.7.1 Hußn luyªn và ki∫m tra Mˆc ích s˚ dˆng các kˇ thu™t hÂc máy ∫ th¸c hiªn nhiªm vˆ x∏p h§ng. ây là nhiªm vˆ hÂc giám sát do có các pha hußn luyªn và ki∫m tra. D˙ liªu bao gÁm truy vßn và các £nh, trong ó mÈi truy vßn liên quan ∏n mÎt sË các £nh. S¸ liên quan cıa các £nh Ëi vÓi truy vßn ˜Òc cho bi mÎt nhãn, k˛ hiªu mÎt lo§i ( ˜Òc ˜a ra trong pha hußn luyªn và d¸ báo trong pha ki∫m tra). Gi£ s˚ Q là t™p truy vßn và D là t™p £nh (truy vßn và £nh có th∫ là ∞c tr˜ng £nh). Gi£ s˚ Y = {1, 2, ..., l} là t™p nhãn, trong ó nhãn bi∫u diπn h§ng (lÓp ho∞c i∫m sË). TÁn t§i th˘ t¸ toàn bÎ gi˙a các h§ng 1 ... l 1 l, trong ó là quan hª th˘ t¸. Cho {Q1, Q2, ..., Qm} là t™p truy vßn cho hußn luyªn và Qi là truy vßn th˘ i. Cho Di = {Ii,1, Ii,2, ..., Ii,ni } là t™p các £nh liên quan vÓi truy vßn Qi và yi = {yi,1, yi,2, ..., yi,ni } là t™p các nhãn liên quan vÓi truy vßn Qi , trong ó ni là cÔ cıa t™p £nh Di và yi ; Ii,j là £nh th˘ j cıa Di ; yi,j 2 Y là th˘ t¸ nhãn th˘ j trong yi t˜Ïng ˘ng vÓi Î liên quan cıa £nh Ii,j Ëi vÓi qi . T™p hußn luyªn gËc ˜Òc k˛ hiªu là S = {(Qi , Di ), yi }n i=1. Vector ∞c tr˜ng xi,j = (Qi , Ii,j ) ˜Òc t§o t¯ mÈi c∞p £nh - truy vßn (Qi , Ii,j ), i = 1, 2, ..., m, j = 1, 2, ..., ni , trong ó k˛ hiªu là các hàm ∞c
  • 42. 28 tr˜ng. Các ∞c tr˜ng ˜Òc xác ‡nh nh˜ các hàm cıa c∞p £nh truy vßn. Cho xi = {xi,1, xi,2, ..., xi,ni }, bi∫u diπn t™p hußn luyªn S0 = {(xi , yi )}m i=1,  ây x 2 X và X ✓ Rd . Mˆc ích ∫ hußn luyªn mÎt mô hình x∏p h§ng (cˆc bÎ) f (Q, I ) = f (x) có th∫ gán mÎt i∫m sË cho mÎt c∞p £nh-truy vßn Q và I ho∞c t˜Ïng ˜Ïng vÓi vector ∞c tr˜ng x ã cho. TÍng quát hÏn, ta cÙng có th∫ xem hußn luyªn mÎt mô hình x∏p h§ng toàn cˆc F(Q, D) = F((x)). Mô hình x∏p h§ng cˆc bÎ ˜a ra mÎt i∫m sË duy nhßt, mô hình x∏p h§ng toàn cˆc ˜a ra danh sách i∫m sË. D˙ liªu ki∫m tra gÁm mÎt truy vßn mÓi Qm+1 và các £nh liên quan Dm+1. T = {(Qm+1), Dm+1)}, t§o ra vector ∞c tr˜ng xm+1, s˚ dˆng mô hình x∏p h§ng hußn luyªn tr˜Óc ∫ gán các i∫m sË cho Dm+1 các £nh, s≠p x∏p các £nh này d¸a vào các i∫m sË và ˜a ra danh sách các £nh  ¶u ra. 1.7.2 Nhãn d˙ liªu Có hai cách t§o ra nhãn d˙ liªu. Th˘ nhßt, ˜Òc t§o ra bi ánh giá cıa con ng˜Ìi và th˘ hai ˜Òc lßy ra t¯ d˙ liªu l‡ch s˚ tìm ki∏m (search log). Cách th˘ hai ˜Òc miêu t£ chi ti∏t trong [58]. Ti∏p c™n th˘ nhßt, mÎt t™p các truy vßn ˜Òc l¸a chÂn ng®u nhiên t¯ l‡ch s˚ truy vßn cıa mÎt hª thËng tìm ki∏m. Gi£ s˚ r¨ng có nhi∑u hª thËng tìm ki∏m (trong gi£ l™p chø có mÎt hª thËng). Ti∏p c™n th˘ hai, các truy vßn ˜Òc ˜a vào các hª thËng tìm ki∏m và các £nh x∏p h§ng cao nhßt ˜Òc tr£ v∑ (top rank). Nh˜ v™y, mÈi truy vßn liên quan vÓi nhi∑u £nh. Con ng˜Ìi ánh giá d¸a vào s¸ liên quan trên các c∞p £nh-truy vßn. S¸ ánh giá liên quan th˜Ìng theo nhi∑u m˘c Î. Con ng˜Ìi ánh giá liên quan theo quan i∫m cıa trung bình các ng˜Ìi dùng. Các nhãn bi∫u diπn s¸ liên quan sau ó ˜Òc gán cho các c∞p £nh-truy vßn. ánh giá s¸ liên quan trên mÎt c∞p £nh-truy vßn có th∫ ˜Òc th¸c hiªn bi nhi∑u ánh giá, sau ó ti∏n hành bi∫u quy∏t d¸a vào a sË.
  • 43. 29 1.7.3 Xây d¸ng mô hình hÂc Gi£ ‡nh cho X là không gian vào (không gian ∞c tr˜ng) gÁm danh sách các vector ∞c tr˜ng và Y là không gian ¶u ra gÁm danh sách các h§ng. Gi£ s˚ x là mÎt ph¶n t˚ cıa X bi∫u diπn mÎt danh sách các vector ∞c tr˜ng và y là mÎt ph¶n t˚ cıa Y bi∫u diπn mÎt danh sách các th˘ h§ng. Cho P(X , Y ) là phân phËi xác sußt k∏t hÒp ch˜a bi∏t, trong ó bi∏n ng®u nhiên X lßy x là giá tr‡ cıa nó và t˜Ïng t¸ Y lßy y là giá tr‡ cıa nó. Gi£ s˚ F(·) là mÎt hàm ánh x§ t¯ danh sách các vector ∞c tr˜ng x tÓi mÎt danh sách i∫m sË (score). Mˆc ích cıa nhiªm vˆ hÂc là t¸ Îng hÂc mÎt hàm ˆF(x) cho d˙ liªu hußn luyªn (x1, y1), (x2, y2), ..., (xm, ym). MÈi m®u hußn luyªn gÁm các vector ∞c tr˜ng xi và lÓp t˜Ïng ˘ng yi (i = 1, ..., m) trong ó m k˛ hiªu là sË m®u hußn luyªn. Bi∫u diπn cho F(x) và y là F(x) = (f (x1), f (x2), ..., f (xn)) và y = (y1, y2, ..., yn). Các vector ∞c tr˜ng bi∫u diπn các Ëi t˜Òng ∫ x∏p h§ng. K˛ hiªu f (x) hàm x∏p h§ng cˆc bÎ và n k˛ hiªu sË vector ∞c tr˜ng và các i∫m sË. MÎt hàm lÈi L(·, ·) ˜Òc dùng ∫ ánh giá k∏t qu£ d¸ báo cıa F(·). Các vector ∞c tr˜ng x ˜Òc x∏p h§ng d¸a vào F(x), sau ó top k các k∏t qu£ cıa x∏p h§ng ˜Òc ánh giá s˚ dˆng các i∫m sË y t˜Ïng ˘ng. N∏u các vector ∞c tr˜ng vÓi các i∫m sË cao s≥ ˜Òc x∏p h§ng cao hÏn, khi ó lÈi là nh‰ hÏn. Ng˜Òc l§i, lÈi s≥ là lÓn. Hàm lÈi ˜Òc bi∫u diπn mÎt cách cˆ th∫ nh˜ L(F(x), y). Chú ˛, hàm lÈi cho x∏p h§ng là khác so vÓi hàm lÈi trong các nhiªm vˆ hÂc thËng kê khác, trong tr˜Ìng hÒp này nó dùng ∫ s≠p x∏p. Trong CBIR, các vector ∞c tr˜ng x có ˜Òc t¯ mÎt truy vßn và các £nh liên quan cıa nó. Các i∫m sË y bi∫u diπn Î liên quan cıa các £nh Ëi vÓi truy vßn. Hàm x∏p h§ng toàn cˆc F(·), trong th¸c t∏ có th∫ là mÎt hàm x∏p h§ng cˆc bÎ f (·). SË vector ∞c tr˜ng trong x kh£ n´ng rßt lÓn, th™m chí không giÓi h§n. S¸ ánh giá (hàm lÈi) chø t™p trung vào top k các k∏t qu£. ∫ c£i thiªn hiªu
  • 44. 30 n´ng tra c˘u, các kˇ thu™t hÂc máy hiªu qu£ ã ˜Òc s˚ dˆng trong [101], [112], [123]. SVM-AL [101] là nghiên c˘u khá sÓm, óng góp trong cÎng Áng CBIR. Nói chung, các kˇ thu™t phân lÓp d¸a trên ph˜Ïng pháp hÂc máy SVM th˜Ìng yêu c¶u ph£i bi∏t ˜Òc các lÓp nhßt ‡nh và t™p lÓn d˙ liªu ã ˜Òc gán nhãn. i∑u này d®n ∏n các khó kh´n trong các hª thËng CBIR, do các nguyên nhân : Trong CBIR không có các m®u hußn luyªn tr˜Óc cho mÎt truy vßn cˆ th∫ và sË các £nh liên quan trong mÎt l¶n ph£n hÁi th˜Ìng rßt ít (thông th˜Ìng các k∏t qu£ tr£ v∑ ng˜Ìi dùng trong mÎt l¶n kho£ng 20 m®u) ho∞c tr˜Ìng hÒp xßu không có £nh liên quan nào. Kˇ thu™t AdaBoost [31] ã ˜Òc áp dˆng trong mÎt sË hª thËng CBIR [54], [100], [118] nh¨m mˆc ích t´ng c˜Ìng các thu™t toán hÂc y∏u, òi h‰i d˙ liªu ˜Òc ánh trÂng sË tr˜Óc khi th¸c hiªn thu™t toán hÂc y∏u  mÈi l¶n l∞p. Tieu và cÎng s¸ [100] s˚ dˆng thu™t toán AdaBoost trong CBIR và s˚ dˆng ph£n hÁi liên quan ∫ hÂc thông tin ng˜Ìi dùng. Tuy nhiên, các kˇ thu™t d¸a vào AdaBoost th˜Ìng phân lÓp ch™m và c¶n nhi∑u l¶n l∞p ph£n hÁi. Kˇ thu™t Adaboost Boosting [31] là ph˜Ïng pháp cho phép c£i thiªn Î chính xác cıa bßt k˝ thu™t toán hÂc nào. ây là mÎt lo§i ph˜Ïng pháp tÍ hÒp, cho phép k∏t hÒp các ph˜Ïng pháp phân lÓp y∏u thành mÎt phân lÓp m§nh hÏn. F(x) = LX l=1 ↵l fl (x). (1.19) trong ó ↵l xác ‡nh trÂng sË cıa bÎ hÂc y∏u th˘ l. Kˇ thu™t boosting th¸c hiªn l∞p i l∞p l§i, sao cho mÈi l¶n l∞p l, phân lÓp y∏u ˜a vào tÍ hÒp cho tÓi khi §t tiêu chu©n d¯ng. Kearns và Valiant [49] là nh˙ng ng˜Ìi ¶u tiên ∑ c™p ∏n ph˜Ïng pháp hÂc y∏u, có th∫ ˜Òc t´ng c˜Ìng ∫ cho ra mÎt ph˜Ïng pháp hÂc m§nh hÏn. AdaBoost
  • 45. 31 ˜Òc giÓi thiªu bi Freund và Schapire [30] d®n ∏n các bi∏n th∫ boosting phÍ bi∏n hiªn nay và ã tr thành mÎt trong nh˙ng thu™t toán hÂc m§nh. Trong quá trình hÂc, gi˙ phân bË trÂng sË Dl (i) trên các m®u hußn luyªn. Theo phân bË này, t§i mÈi l¶n l∞p boosting s≥ l¸a chÂn bÎ hÂc y∏u và ˜a thêm vào mô hình. Sau mÈi l¶n l∞p l, m®u ˜Òc ánh l§i trÂng sË, d¸a vào mÎt hàm lÈi (loss function), (thí dˆ e yF(x) trong tr˜Ìng hÒp AdaBoost). Nh¨m t™p trung vào các m®u khó, b‰ qua các m®u dπ. Gi£i thu™t AdaBoost là thu™t toán hÂc hiªu qu£ và phÍ bi∏n, do khá dπ dàng cài ∞t, h¶u nh˜ không c¶n thi∏t tÓi tham sË hiªu chønh. Trên th¸c t∏ chø có mÎt tham sË là sË tËi a L l¶n l∞p. Viªc thi∏t l™p tham sË rßt quan trÂng bi vì thu™t toán có th∫ có xu h˜Óng overfit (quá khÓp) n∏u thi∏t l™p L lÓn. Kˇ thu™t máy vector hÈ trÒ (SVM) Các kˇ thu™t hÂc máy và ph£n hÁi liên quan ˜Òc ∑ xußt nh¨m hiªu chønh khái niªm truy vßn. H¶u h∏t các kˇ thu™t truy∑n thËng òi h‰i mÎt sË l˜Òng lÓn m®u hußn luyªn [68], [125] và truy vßn khi t§o vÓi các m®u tËt [47], [83], [113]. Trong nhi∑u tình huËng ˘ng dˆng th¸c t∏, các thu™t toán hÂc có th∫ làm viªc ngay c£ khi nghèo d˙ liªu hußn luyªn và h§n ch∏ thÌi gian hußn luyªn. ∫ gi£m sË l˜Òng m®u yêu c¶u, các nghiên c˘u quan tâm ∏n các kˇ thu™t hÂc tích c¸c. MÎt trong nh˙ng ph˜Ïng pháp nh˜ v™y là SVM, d¸a vào ph£n hÁi liên quan [15], [18], [33],[93], [101], [120] khi phân lÓp. HÂc tích c¸c có th∫ ˜Òc mô hình hoá nh˜ sau : Cho mÎt cÏ s d˙ liªu E ch˘a mÎt t™p con các ch˜a gán nhãn U và mÎt t™p con X ã gán nhãn. Ph˜Ïng pháp hÂc gÁm hai thành ph¶n f và s. Thành ph¶n f là mÎt phân lÓp ˜Òc hußn luyªn trên t™p d˙ liªu ã gán nhãn X . Thành ph¶n s là hàm lßy m®u ˜a ra mÎt t™p gán nhãn hiªn thÌi X , quy∏t ‡nh l¸a chÂn t™p con u 2 U chÂn cho truy vßn ng˜Ìi dùng. Cách hÂc tích c¸c này ˜a ∏n mÎt f mÓi, sau mÈi l¶n l∞p cıa ph£n hÁi liên quan. Kˇ thu™t này có th∫ mô t£ sau ây : T™p d˙ liªu ¶u vào/ ¶u ra X , Y , t™p hußn luyªn (x1, y1), (x2, y2), . . . , (xm, ym). Mˆc ích muËn hÂc mÎt hàm phân lÓp
  • 46. 32 y = f (x, ) trong ó là các trÂng sË c¶n hußn luyªn, minh ho§ nh˜ vector 1.9. Ví dˆ, chÂn mô hình t¯ t™p các siêu phØng, hàm phân lÓp s≥ có d§ng : Hình 1.9. Minh ho§ siêu phØng f (x, w, b) = sign(wx + b) (1.20) Tiêu chí cıa SVM là chÂn siêu phØng sao cho l∑ là c¸c §i và tËi thi∫u hóa lÈi, d®n tÓi ˜a v∑ viªc gi£i bài toán tËi ˜u b™c 2 (Quadratic). ¶u ra cıa bài toán tËi ˜u là w và b, trong ó w có d§ng nh˜ sau : w = mX i=1 ↵i xi (1.21) VÓi tiêu chí l∑ c¸c §i, các ↵ ˜Òc gi£i ra s≥ có rßt ít giá tr‡ khác 0. Các m®u d˙ liªu trong t™p hußn luyªn X t˜Ïng ˘ng vÓi ↵i khác 0 ˜Òc gÂi là vector t¸a (Support vector) SVM ph‰ng oán k∏t qu£ tra c˘u theo các m®u hußn luyªn. D¸a vào k∏t qu£ tra c˘u, ng˜Ìi dùng l¸a chÂn các £nh liên quan và các £nh không liên quan. Các £nh liên quan t§o thành t™p m®u d˜Ïng và các £nh không liên quan t§o thành t™p m®u âm. Sau khi hÂc t™p m®u hußn luyªn, b¨ng cách s˚ dˆng SVM, bÎ phân lÓp SVM f (x) s≥ d¶n i∑u chønh theo mˆc ích tra c˘u cıa ng˜Ìi dùng. MÈi £nh Ii trong cÏ s d˙ liªu, i∫m sË ˜Òc tính toán theo score(Ii ) = f (xi ), ây chính
  • 47. 33 là kho£ng cách t¯ £nh tÓi siêu phØng phân tách. score(Ii ) lÓn hÏn ng˜Ông thì Ii s≥ g¶n khÓp vÓi £nh truy vßn. S≠p x∏p các i∫m sË cıa tßt c£ các £nh theo th˘ t¸ gi£m d¶n. Sau ó, danh sách k £nh ¶u tiên tr£ v∑. Khi ó ta thu ˜Òc k∏t qu£ tËt hÏn và l¶n ph£n hÁi ti∏p theo l§i ˜Òc th¸c hiªn. L∞p l§i quá trình này ∏n khi tho£ mãn yêu c¶u ng˜Ìi dùng. Zhang và cÎng s¸ [123] miêu t£ quá trình trên b¨ng Thu™t toán 1.1. Tr˜Óc tiên, mÎt ph˜Ïng pháp tra c˘u truy∑n thËng ˜Òc th¸c hiªn b¨ng cách Ëi sánh các £nh theo cách thông th˜Ìng, s≠p x∏p các £nh theo Î o kho£ng cách t´ng d¶n vÓi £nh truy vßn. K∏t qu£ tr£ v∑ ng˜Ìi dùng k £nh ¶u tiên cıa danh sách ó, k˛ hiªu là NB. Thu™t toán 1.1 SVM d¸a vào ph£n hÁi liên quan [123] ¶u vào: ánh dßu £nh trên t™p k∏t qu£ NB : t™p liên quan NB+ và t™p không liên quan NB ¶u ra: T™p k∏t qu£ NB 1: Chu©n b‡ cho SVM d˙ liªu hußn luyªn (xi , yi ), yi = ⇢ +1 n∏u xi 2 NB+ 1 n∏u xi 2 NB 2: Xây d¸ng hàm phân lÓp s˚ dˆng thu™t toán SVM : f (x) = P i ↵i yi K(xi , x)+b. (Chú ˛ : theo ¶u ra kho£ng cách Î t˜Ïng t¸ vÓi truy vßn) 3: Tính toán i∫m sË cho mÈi £nh Ii trong cÏ s d˙ liªu. score(Ii ) = f (xi ) 4: S≠p x∏p các £nh theo i∫m sË 1.8 MÎt sË ti∏p c™n d¸a theo ph˜Ïng pháp tËi ˜u Pareto T™p Pareto ho∞c Pareto front là mÎt t™p con cıa t™p các i∫m kh£ thi các lÌi gi£i ch˘a tßt c£ các i∫m có ít nhßt mÎt mˆc tiêu tËi ˜u trong khi £m b£o không thay Íi các mˆc tiêu khác. Các i∫m nh˜ v™y ˜Òc gÂi là các i∫m tËi ˜u Pareto. Pareto front ¶u tiên bao gÁm mÎt t™p các i∫m không b‡ trÎi, ôi khi ˜Òc gÂi là skyline (chân trÌi) [10].
  • 48. 34 Ti∏p c™n Pareto có th∫ thßy trong nhi∑u nghiên c˘u liên quan tÓi cÏ s d˙ liªu [13], [82] ho∞c m§ng [24]. Trong [77] ∑ xußt mÎt kˇ thu™t s˚ dˆng tính tËi ˜u Pareto ∫ th¸c hiªn mÎt quá trình sÏ lÂc, lo§i b‰ các Ëi t˜Òng ít §i diªn t¯ quá trình l¸a chÂn k-láng ri∑ng trong khi v®n gi˙ l§i nh˙ng Ëi t˜Òng tri∫n vÂng nhßt. Nghiên c˘u này lßy các k∏t qu£ cıa mÎt truy vßn gÁm tßt c£ các i∫m Pareto. T™p Pareto bao phı không gian các Ëi t˜Òng liên quan vÓi truy vßn hÏn các ph˜Ïng pháp s˚ dˆng k∏t hÒp Î o kho£ng cách. Trong [1] ánh giá theo cách khác nhau ∫ k∏t hÒp hai ph˜Ïng pháp ph£n hÁi liên quan ã có, nhßn m§nh s¸ bßt bình Øng trong kh£o sát và s¸ khai thác trong tình huËng các ph˜Ïng pháp d¸a vào kho£ng cách. Nghiên c˘u g¶n ây s˚ dˆng ti∏p c™n Pareto trong CBIR cıa Hsiao và cÎng s¸ [43]. Quá trình hÂc tr˜Óc t¯ cÏ s d˙ liªu ∞c tr˜ng (SIFT, l˜Òc Á h˜Óng các gradient (HoG)) b¨ng thu™t toán EMR [115] ˜Òc th¸c hiªn. Ti∏p c™n Pareto ˜Òc s˚ dˆng nh˜ bài toán a mˆc tiêu ∫ so sánh lßy ra các k∏t qu£ cuËi cùng t¯ k∏t hÒp các x∏p h§ng cıa nhi∑u truy vßn, l¸a chÂn lßy ra các i∫m Pareto l¶n l˜Òt t¯ng front (không có thu™t toán lßy Pareto front a m˘c sâu). Các ˜u i∫m cıa ti∏p c™n Pareto ch˜a ˜Òc nghiên c˘u rÎng rãi trong CBIR. Ti∏p c™n tËi ˜u Pareto có th∫ thu gÂn t™p ˘ng viên trên không gian a ∞c tr˜ng, nh˜ rút gÂn không gian tìm ki∏m ∫ c£i thiªn k∏t qu£ tra c˘u v∑ m∞t Î chính xác cıa hª thËng CBIR s≥ ˜Òc ∑ xußt trong Ch˜Ïng 2. Quá trình t˜Ïng tác gi˙a hª thËng và ng˜Ìi dùng giúp l¸a chÂn các i∫m liên quan trong khi ph˜Ïng pháp d¸a vào Pareto lßy tßt c£ các Pareto front nh˙ng i∫m  nhi∑u m˘c sâu d®n tÓi kích th˜Óc không gian tìm ki∏m lÓn. ∑ xußt trên thuÎc công trình nghiên c˘u [CT7]. 1.9 Ph˜Ïng pháp ánh giá hiªu n´ng trong CBIR ánh giá hiªu n´ng là công viªc rßt quan trÂng, cho phép ∫ ánh giá m˘c Î hiªu qu£ §t ˜Òc cıa các kˇ thu™t ∫ có nh˙ng c£i ti∏n. M¨uller-Henning và
  • 49. 35 cÎng s¸ [71] ˜a ra mÎt sË ph˜Ïng pháp ánh giá hiªu n´ng CBIR. Î o th˜Ìng xuyên s˚ dˆng là Î chính xác (precision (Pr)) và Î hÁi t˜ng (recall (Re)) và bi∫u diπn bi∫u Á cıa chúng. Gi£ s˚ sË các £nh liên quan vÓi mÎt truy vßn cˆ th∫ là A, sË các £nh không liên quan cho mÎt truy vßn cˆ th∫ là B, tÍng sË các £nh ˜Òc tra c˘u là D và sË các £nh liên quan ˜Òc tra c˘u E. Î chính xác là tø sË gi˙a sË các £nh liên quan ˜Òc tra c˘u vÓi tÍng sË các £nh ˜Òc tra c˘u : Pr = E D (1.22) Î hÁi t˜ng là tø sË gi˙a sË các £nh liên quan ˜Òc tra c˘u vÓi toàn bÎ sË £nh liên quan có trong cÏ s d˙ liªu : Re = E A (1.23) Khi giá tr‡ Re cao t˜Ïng ˘ng vÓi mÎt tr£ lÌi tËt cıa mÎt hª thËng Ëi vÓi mÎt truy vßn. Tuy nhiên, chø mÎt Î o này là ch˜a ı ∫ ánh giá chßt l˜Òng cıa hª thËng. K∏t qu£ tËt Ëi vÓi các giá tr‡ c£ Pr, Re ph£i cao. Nh˜ v™y, có th∫ thßy r¨ng Pr và Re là các Î o không Îc l™p. Pr Re = A D (1.24) Các giá tr‡ này phˆ thuÎc vào kích th˜Óc cıa t™p tra c˘u. N∏u D là nh‰ áng k∫ kích hÏn th˜Óc cıa t™p liên quan A, các giá tr‡ cho Re không bao giÌ cao. T˜Ïng t¸, n∏u D lÓn hÏn nhi∑u so vÓi A thì Pr không bao giÌ cao. NhÌ chu©n hoá t™p tÍng các £nh ˜Òc tra c˘u vÓi tÍng các £nh liên quan, s≥ §t ˜Òc giÓi h§n t˜Ïng ˘ng vÓi ˜Ìng chéo trong bi∫u diπn bi∫u Á Pr và Re theo ó Pr = Re.phNF
  • 50. 36 K∏t lu™n Ch˜Ïng 1 Ch˜Ïng 1 giÓi thiªu mÎt sË ∞c tr˜ng th˜Ìng ˜Òc s˚ dˆng và s¸ k∏t hÒp a bÎ ∞c tr˜ng. Trong ch˜Ïng ã phân tích nh˙ng khó kh´n khi áp dˆng chu©n hoá Gauss và phân tích nh˙ng tÁn t§i cıa các kˇ thu™t nh¨m gi£m kho£ng trËng ng˙ nghæa trong CBIR. ∫ kh≠c phˆc nh˙ng h§n ch∏ ã ˜Òc phân tích trên, Ch˜Ïng 2 ∑ xußt chu©n hoá ∞c tr˜ng d¸a vào chu©n hoá Gauss trên mÎt sË t™p cÏ s d˙ liªu £nh ∫ c£i thiªn chßt l˜Òng tính Î t˜Ïng t¸. Ti∏p theo, ∫ nâng cao hiªu n´ng Î chính xác tra c˘u, phù hÒp nh™n th˘c cıa ng˜Ìi dùng, kˇ thu™t hiªu chønh trÂng sË kho£ng cách và d‡ch chuy∫n truy vßn ˜Òc ∑ xußt.
  • 51. Ch˜Ïng 2 ∑ xußt chu©n hoá ∞c tr˜ng và hiªu chønh trÂng sË trong tÍ hÒp ∞c tr˜ng Trong Ch˜Ïng 1 ã giÓi thiªu và phân tích mÎt sË hª thËng CBIR s˚ dˆng tÍ hÒp ∞c tr˜ng tr¸c quan m˘c thßp, mÎt sË kˇ thu™t thu hµp kho£ng trËng ng˙ nghæa ∫ c£i thiªn hiªu qu£ tra c˘u. ∫ nâng cao Î chính xác tra c˘u, trong Ch˜Ïng 2 ∑ xußt kˇ thu™t chu©n hoá ∞c tr˜ng, hiªu chønh trÂng sË kho£ng cách và d‡ch chuy∫n truy vßn s˚ dˆng ph£n hÁi liên quan. NÎi dung cıa ch˜Ïng gÁm các ∑ xußt chu©n hoá ∞c tr˜ng d¸a vào phân cˆm mÌ (Fuzzy c-means (FCM)) trong Mˆc 2.1, chu©n hoá kho£ng cách trong Mˆc 2.2, kˇ thu™t hiªu chønh trÂng sË kho£ng cách, d‡ch chuy∫n truy vßn s˚ dˆng ph£n hÁi liên quan trong Mˆc 2.3. K∏t qu£ th¸c nghiªm cho các ∑ xußt trên ˜Òc trình bày trong Mˆc 2.4. NÎi dung nh˙ng ∑ xußt này là các k∏t qu£ ã ˜Òc công bË t§i công trình nghiên c˘u [CT6]. CuËi cùng, Mˆc 2.5 là mÎt sË k∏t lu™n ch˜Ïng. Hình 2.1 là mô hình ki∏n trúc hª thËng ∑ xußt gÁm các b˜Óc nh˜ sau : (1) Các £nh trong cÏ s d˙ liªu £nh ˜Òc trích rút ∞c tr˜ng trong màu s≠c, k∏t cßu, hình d§ng b¨ng các thı tˆc trích rút ∞c tr˜ng. Sau ó các ∞c 37
  • 52. 38 tr˜ng £nh ˜Òc chu©n hoá. T˜Ïng t¸, ∞c tr˜ng £nh truy vßn cÙng ˜Òc chu©n hoá. ∫ nâng cao k∏t qu£ tính Î t˜Ïng t¸ cıa mÈi £nh trong cÏ s d˙ liªu so vÓi £nh truy vßn, lu™n án ∑ xußt chu©n hoá ∞c tr˜ng 3 FCM t¯ chu©n hoá 3 . Chu©n hoá này phù hÒp vÓi cÏ s d˙ liªu £nh kh£o sát trong lu™n án và kˇ thu™t trích rút ∞c tr˜ng ã s˚ dˆng. (2) Sau khi tính toán Î t˜Ïng t¸, t™p k∏t qu£ top k ˜Òc hi∫n th‡ cho ng˜Ìi dùng. (3) T¯ t™p k∏t qu£ hi∫n th‡, thông tin ph£n hÁi cıa ng˜Ìi dùng thu ˜Òc thông qua ánh giá m˘c Î liên quan cıa mÎt sË £nh trên t™p k∏t qu£ top k này. Thông tin m˘c Î liên quan ˜Òc ánh giá bi ng˜Ìi dùng và thông tin ( ∞c tr˜ng, Î o kho£ng cách so vÓi £nh truy vßn) cıa các £nh ˜Òc ánh giá s˚ dˆng ∫ hiªu chønh theo nhu c¶u ng˜Ìi dùng. Lu™n án ã ∑ xußt hiªu chønh trÂng sË kho£ng cách và d‡ch chuy∫n truy vßn. (4) Î o t˜Ïng t¸ ti∏p tˆc ˜Òc c™p nh™t l§i sau quá trình hiªu chønh, t™p k∏t qu£ top k ˜Òc c£i thiªn. (5) K∏t qu£ cuËi cùng là t™p £nh k∏t qu£ top k tho£ mãn ng˜Ìi dùng ho∞c h∏t sË l¶n l∞p ‡nh tr˜Óc. Hình 2.1. Mô hình hª thËng ∑ xußt
  • 53. 39 2.1 Chu©n hoá ∞c tr˜ng d¸a vào phân cˆm mÌ FCM Kh£o sát trên cÏ s d˙ liªu Wang 1 , Oxford Building 2 , Caltech 101 3 vÓi các kˇ thu™t trích rút ∞c tr˜ng : l˜Òc Á HSV [98], mô men màu [97], l˜Òc Á t¸ t˜Ïng quan màu [45] lÂc Gabor [56], mô men Wavelet [42], Gist [75] h¶u h∏t d˙ liªu ∞c tr˜ng gËc phân bË không theo Gauss. N∏u ∞t trong gi£ thi∏t phân bË Gauss, khi ˜Òc chu©n hoá theo lu™t 3 có nhi∑u giá tr‡ cıa thành ph¶n ∞c tr˜ng “rÏi” ngoài o§n [ 1, 1]. Do v™y lu™n án ∑ xußt b‰ gi£ thi∏t d˙ liªu các thành ph¶n ∞c tr˜ng theo phân bË Gauss. Th¸c hiªn phân cˆm d˙ liªu ∞c tr˜ng tr˜Óc ∫ t§o ra các vùng Áng nhßt, ti∏p theo chu©n hoá các thành ph¶n theo lu™t 3 trên mÈi cˆm. CuËi cùng, k∏t nh™p k∏t qu£ theo mÈi cˆm ∫ ˜Òc mÎt giá tr‡ chu©n hoá duy nhßt. Trong phân cˆm, có rßt nhi∑u kˇ thu™t phân cˆm nh˜ K-mean, Fuzzy-cmean (FCM), mô hình Gauss hÈn hÒp (GMM),... VÓi mÈi kˇ thu™t phân cˆm khác nhau, cách k∏t nh™p k∏t qu£ cuËi cùng cÙng khác nhau. Vßn ∑ quan trÂng nhßt cıa chu©n hoá trong CBIR là £m b£o thành ph¶n ph£i “rÏi” vào o§n [ 1, 1] nhi∑u hÏn và chßt l˜Òng truy vßn t´ng lên (t˘c là c£i thiªn k∏t qu£ tính Î t˜Ïng t¸). ∫ gi£m tËi thi∫u hóa các sai khác do d˙ liªu ˜Òc xem nh˜ các §i l˜Òng ng®u nhiên, có th∫ có nhi∑u ønh nên c¶n thi∏t ph£i phân cˆm ∫ t§o ra các vùng Áng nhßt. Phân cˆm ˜Òc th¸c hiªn trên t¯ng bÎ ∞c tr˜ng riêng r≥ (lu™n án s˚ dˆng 6 bÎ ∞c tr˜ng) Ëi vÓi toàn bÎ cÏ s d˙ liªu ∞c tr˜ng ã ˜Òc l˜u tr˙ tr˜Óc ó. H¶u h∏t các ph˜Ïng pháp phân cˆm nh˜ ã ∑ c™p có th∫ sinh ra các phân ho§ch mÌ và các tâm cˆm vÓi mÎt t™p d˙ liªu ã cho. Phân cˆm d˙ liªu ∞c tr˜ng chø là b˜Óc trung gian trong viªc t§o ra các vùng Áng nhßt cho nên viªc l¸a chÂn thu™t toán phân cˆm không ˜Òc ánh giá và phân tích trong ∑ xußt 1. http://wang.ist.psu.edu/docs/related.shtml 2. http://www.robots.ox.ac.uk/~vgg/data/oxbuildings/ 3. http://www.vision.caltech.edu/Image_Datasets/Caltech101/
  • 54. 40 này. Do ó lu™n án s˚ dˆng thu™t toán phân cˆm chu©n FCM bi phân cˆm mÌ FCM ([8]) ã ˜Òc s˚ dˆng hiªu qu£ trong mÎt sË nghiên c˘u CBIR [9], [116]. Cho {I t i }1iN , trong ó t là chø sË ∞c tr˜ng, N là kích cÔ cÏ s d˙ liªu và các h¨ng sË p = p(t) > 1, (p(t) là hª sË FCM cho bÎ ∞c tr˜ng th˘ t), C = C(t) 2 N+ , Mt = dim(I t i ) là Î dài cıa ∞c tr˜ng bÎ t, 8 i, 1  i  N . Thu™t toán l∞p FCM [8] c¸c ti∫u hóa hàm mˆc tiêu : J(V , ⌘) = min V ,⌘ NX i=1 CX c=1 ⌘p t,c,i I t i Vt,c 2 , (2.1) vÓi Î o kho£ng cách Ã-clit kI t i Vt,ck 2 = MtP j=1 (I t i [j] Vt,c[j])2 , và các ràng buÎc bi∏n nh˜ sau : (1) ⌘t,c,i 2 [0, 1], 8 1  i  N , i  c  C, t 1, (2) PC c=1 ⌘t,c,i = 1, 8 1  i  N , (3) PN i=1 ⌘t,c,i < N , 8 1  c  C. Sau khi c phân ho§ch mÌ {⌘1, ..., ⌘c} ˜Òc cho bi mÎt thu™t toán phân cˆm nh˜ FCM, câu h‰i ∞t ra liªu r¨ng nó th∫ hiªn chính xác cßu trúc d˙ liªu hay không. ây là bài toán phân cˆm hÒp l˛. Do các ph˜Ïng pháp phân cˆm mÌ c¶n gi£ ‡nh tr˜Óc sË các cˆm c, tiêu chu©n hÒp lª cho viªc tìm sË cˆm tËi ˜u c mà có th∫ miêu t£ úng cßu trúc d˙ liªu có trong nhi∑u nghiên c˘u v∑ tính hÒp l˛ phân cˆm. ∫ xác ‡nh sË cˆm tËi ˜u lu™n án s˚ dˆng hai chø sË phÍ bi∏n nh˜ sau. (a) Hª sË phân ho§ch trong [8], [104] ˜Òc xác ‡nh nh˜ sau PC(c) = 1 N cX i=1 NX j=1 ⌘2 ij (2.2) trong ó 1 c  PC(c)  1. Tìm sË cˆm tËi ˜u c⇤ b¨ng cách tìm lÌi gi£i c¸c §i max2cN 1PC(c) ∫ ˜a ra hiªu n´ng phân cˆm tËt nhßt cho t™p d˙ liªu.
  • 55. 41 (b) Entropy phân ho§ch trong [6], [7] ˜Òc xác ‡nh nh˜ sau PE(c) = 1 N cX i=1 NX j=1 ⌘ij log2 ⌘ij (2.3) trong ó 0  PE(c)  log2 c. Tìm sË cˆm tËi ˜u c⇤ b¨ng cách tìm lÌi gi£i c¸c ti∫u min2cN 1PE(c) ∫ ˜a ra hiªu n´ng phân cˆm tËt nhßt cho t™p d˙ liªu. ‡nh nghæa 2.1. [CT6] Cho t™p d˙ liªu {I t i }1iN ˜Òc phân thành C cˆm s˚ dˆng FCM vÓi tham sË p > 1. Î lªch chu©n  cˆm c (1  c  C) ˜Òc tính nh˜ sau : t,c,j def = v u u t NX i=1 ⌘p t,c,i (I t i [j] Vt,c[j])2 / NX i=1 ⌘p t,c,i , 8 1  j  Mt , (2.4) Mªnh ∑ 2.1. [CT6] Gi£ s˚ {Vc}C c=1 là t™p C vector tâm M chi∑u ( ¶u ra cıa thu™t toán phân cˆm s˚ dˆng FCM), 8 c = 1, .., C. Khi ó Î lªch chu©n cıa cˆm c tho£ mãn công th˘c sau : 2 t,c,j = PN i=1 ⌘p t,c,i (I t i [j])2 PN i=1 ⌘p t,c,i V 2 t,c[j]. (2.5) Ch˘ng minh. Theo công th˘c tính tâm d¸a vào FCM [8] ta có : Vt,c,j = NP i=1 ⌘p t,c,i I t i [j]/ NP i=1 ⌘p t,c,i , 8 1  j  Mt , 8 1  j  Mt , 2 t,c,j = NX i=1 ⌘p c,i I t i [j] Vt,c[j] 2 / NX i=1 ⌘p c,i = NX i=1 ⌘p c,i I t i [j] 2 2Vt,c[j] NX i=1 ⌘p c,i I t i [j] ! / NX i=1 ⌘p c,i + V 2 t,c ) 2 t,c,j = NX i=1 ⌘p c,i I t i [j] 2 / NX i=1 ⌘p c,i 2V 2 t,c + V 2 t,c = NX i=1 ⌘p c,i I t i [j] 2 / NX i=1 ⌘p c,i V 2 t,c⌅
  • 56. 42 Sau khi phân cˆm, viªc chu©n hoá ˜Òc th¸c hiªn xem nh˜ mÎt m rÎng cıa chu©n hóa theo lu™t 3 . Chu©n hoá ˜Òc th¸c hiªn trên t¯ng cˆm, sau ó k∏t nh™p các k∏t qu£ l§i theo ‡nh nghæa 2.2. Chu©n hoá c£i ti∏n ˜Òc th¸c hiªn cho các thành ph¶n ∞c tr˜ng, gÂi t≠t là chu©n hoá 3 FCM . ‡nh nghæa 2.2. [CT6] Phép chu©n hóa 3 FCM . Cho x = {x[j]}Mt j=1 , ˜x = {˜x[j]}Mt j=1 , 8 1  j  Mt , ˜Òc ‡nh nghæa nh˜ sau ˜x[j] def = min 1cC n x[j] Vt,c[j] 3 t,c,j o + max 1cC n x[j] Vt,c[j] 3 t,c,j o C + 1 (2.6) Ví dˆ 2.1 gi£i thích cách tìm ra Công th˘c (2.6) trong ó dùng phân tích ‡nh tính, k∏t hÒp phân tích sË liªu th¸c nghiªm, ∞c biªt hóa ˜a ra công th˘c k∏t hÒp và ki∫m tra trên d˙ liªu th¸c t∏. Hình 2.2. Minh ho§ chu©n hóa 3 FCM Ví dˆ 2.1. Gi£ s˚ x là mÎt thành ph¶n nh˜ Hình 2.2, xét tr˜Ìng hÒp ∞c biªt. — Tr˜Ìng hÒp ∞c biªt hoá d˙ liªu phân 1 cˆm C = 1 : Chu©n hoá x nh˜ tr˜Ìng hÒp K .
  • 57. 43 — Tr˜Ìng hÒp ∞c biªt hoá d˙ liªu phân 2 cˆm, C = 2, 1 ⇡ 2 = , V2 V1 ⇡ 3 , µ def = V1+V2 2 = 4.5 , thành ph¶n x có µ 4.5  x  µ +4.5 . Chu©n hoá 3 cho x vÓi t¯ng cˆm nh˜ sau : — Chu©n hoá x theo cˆm 1 ta có : ˜x = x V1 3 — Chu©n hoá x theo cˆm 2 ta có : ˜x = x V2 3 — K∏t nh™p k∏t qu£ theo Công th˘c (2.6) : ˜x[j] def = min 1cC ⇢ x[j] Vc[j] 3 c,j + max 1cC ⇢ x[j] Vc[j] 3 c,j C+1 , nh˜ v™y ta có : ˜x = min{x V1 3 , x V2 3 }+max{x V1 3 , x V2 3 } C+1 (*), trong ó min x V1 3 , x V2 3 = x V2 3 và max x V1 3 , x V2 3 = x V1 3 (**). Thay (**) vào (*), ta có : ˜x = x V2 3 + x V1 3 C+1 = 2(x µ) 3 C+1 = x µ 3⇤ (C+1) 2 = x µ K , vÓi K = 4.5 = 3 ⇤ C+1 2 T˜Ïng t¸ khi C tùy ˛ và C > 1. Tr˜Ìng hÒp ∞c biªt hoá : 3 FCM tr thành K , vÓi K = 3 ⇤ C+1 2 . VÓi d˙ liªu có nhi∑u cˆm mà dùng chu©n hoá theo phân bË Gauss chu©n hoá K , ∫ £m b£o xác sußt “rÏi nhi∑u vào” o§n [-1 ;1] thì K ph£i lÓn hÏn 3, khi ó d˙ liªu s≥ b‡ “co hµp l§i”. Mªnh ∑ 2.2. [CT6] Phép chu©n hóa 3 FCM b£o toàn th˘ t¸, nghæa là : x[j] y[j] ) ˜x[j] ˜y[j]. Hình 2.3. Minh ho§ tính chßt b£o toàn th˘ t¸ cıa chu©n hoá 3 FCM Ch˘ng minh. Gi£ s˚ x và y là hai i∫m d˙ liªu n¨m trên cùng mÎt thành ph¶n ∞c tr˜ng ˜Òc minh ho§ nh˜ trong Hình 2.3.
  • 58. 44 8 1  c  C, x[j] Vc[j] 3 c,j y[j] Vc[j] 3 c,j ) x[j] Vc[j] 3 c,j min 1cC ⇢ x[j] Vc[j] 3 c,j ) min 1cC ⇢ x[j] Vc[j] 3 c,j min 1cC ⇢ x[j] Vc[j] 3 c,j 8 1  c  C, y[j] Vc[j] 3 c,j  x[j] Vc[j] 3 c,j ) y[j] Vc[j] 3 c,j  max 1cC ⇢ x[j] Vc[j] 3 c,j ) max 1cC ⇢ x[j] Vc[j] 3 c,j max 1cC ⇢ y[j] Vc[j] 3 c,j Nh˜ v™y 3 FCM có th∫ xem là m rÎng cıa phép chu©n hoá 3 (khi không phân cˆm, C=1). Ngoài ra các Ph£n ví dˆ 2.1, 2.2 và 2.3 cho các phép bi∏n Íi m rÎng 3 s˚ dˆng FCM không b£o toàn th˘ t¸ cÙng ˜Òc cho ∫ so sánh. Ph£n ví dˆ 2.1. Fx[j] = x[j] Vc0 [j] 3 c0,j , vÓi c0 = arg min 1cC x[j] Vc[j] 3 c,j Ph£n ví dˆ 2.2. Fx[j] = x[j] Vc0 [j] 3 c0,j , vÓi c0 = arg min 1cC mtP j=1 (x[j] Vc[j])2 Ph£n ví dˆ 2.3. Fx[j] = CP c=1 ⌘c,x x[j] Vc[j] 3 c,j , vÓi ⌘c,x = mtP j=1 (x[j] Vc[j]) 2 ! 1 p 1 CP c0=1 mtP j=1 (x[j] Vc0 [j]) 2 ! 1 p 1 Thu™t toán 2.1 th¸c hiªn chu©n hoá các ∞c tr˜ng cˆ th∫ theo ∑ xußt chu©n hoá 3 FCM . Trong Thu™t toán 2.1, tâm Vt,c cıa các cˆm n¨m trong ¶u ra cıa k∏t qu£ thu™t toán phân cˆm FCM 4 [8]. Dπ thßy Thu™t toán 2.1 có Î ph˘c t§p O (NCt Mt ). Trong ó các h¨ng sË : N là sË £nh có trong cÏ s d˙ liªu, Ct là sË phân cˆm cho bÎ ∞c tr˜ng th˘ t và Mt là Î dài (sË thành ph¶n) cıa bÎ ∞c tr˜ng t. ◊u i∫m cıa chu©n hoá ∑ xußt có tính linh ho§t khi ánh chø sË ∞c tr˜ng, khi m rÎng thêm các ∞c tr˜ng khác không c¶n thay Íi thu™t toán. 4. https://www.mathworks.com/help/fuzzy/fcm.html
  • 59. 45 Thu™t toán 2.1 Chu©n hoá ∞c tr˜ng 3 FCM [CT6] ¶u vào: {I t i }1iN ,1tT h¨ng sË p = p(t) > 1, C = Ct 2 N+ , C 2, Mt = dim(I t i ), 8 i = 1, N ¶u ra: {˜I t i }1iN . /* d˙ liªu ã ˜Òc chu©n hoá */ {Vt,c}1cCt . /* các tâm */ { t,c,j }1cCt ,1jMt . /* Î lªch chu©n */ 1: Tính FCM (Ct , pt , {I t i }1iN ,1tT ) theo công th˘c (2.1), ta ˜Òc {Vt,c}1cCt và { t,c,j }1cCt ,1jMt . 2: Tính { t,c,j }1cCt ,1jMt theo công th˘c (2.5). 3: for each I t i : 8 j = 1, Mt do 4: Tính ˜I t i [j] theo công th˘c 3 FCM (2.6) . 5: end for 6: Return n {˜I t i }1iN , {Vt,c}1cCt , { t,c,j }1cCt ,1jMt o 2.2 Chu©n hoá kho£ng cách d¸a vào phân cˆm FCM Gi£ ‡nh ban ¶u T là sË bÎ ∞c tr˜ng, Î dài ∞c tr˜ng gÁm M chi∑u. Giá tr‡ kho£ng cách £nh truy vßn vÓi mÈi £nh cÏ s d˙ liªu ˜Òc chu©n hoá theo Thu™t toán 2.2. Trong Thu™t toán 2.2, tâm V (D) t,c cıa các cˆm n¨m trong ¶u ra cıa k∏t qu£ thu™t toán phân cˆm FCM [8]. Dπ thßy Thu™t toán 2.2 có Î ph˘c t§p O ⇣ m ⇤ C (D) t ⌘ . K∏t qu£ ¶u ra xác ‡nh ˜Òc các giá tr‡ tâm cıa các cˆm theo t¯ng ∞c tr˜ng n V (D) t,c o 1cC,1tT và Î lªch chu©n n (D) t,c o 1cC,1tT , các giá tr‡ này ˜Òc l˜u trong cÏ s d˙ liªu ∫ s˚ dˆng trong chu©n hoá l¶n sau. Viªc chu©n hoá chø là mÎt khâu trong CBIR £m b£o k∏t qu£ tính Î t˜Ïng mÎt cách chính xác hÏn, c£i thiªn t™p k∏t qu£ có Î t˜Ïng t¸ cao nhßt hi∫n th‡ cho ng˜Ìi dùng, t¯ ó nâng cao hiªu qu£ truy vßn. ∫ gi£m kho£ng trËng ng˙ nghæa, nâng cao hiªu n´ng Î chính xác tho£ mãn nh™n th˘c ng˜Ìi dùng, kˇ thu™t hiªu chønh trÂng sË và d‡ch chuy∫n truy vßn s≥ ˜Òc trình bày trong Mˆc 2.3.
  • 60. 46 Thu™t toán 2.2 Chu©n hoá kho£ng cách 3 FCM theo bÎ ∞c tr˜ng [CT6] ¶u vào: {˜I t i }1iN . /* T™p các vector ∞c tr˜ng ã chu©n hoá 3 FCM */ {Vt,c}1cCt . /* T™p các tâm theo t¯ng bÎ ∞c tr˜ng */ { t,c,j }1cCt ,1jMt . /* Î lªch chu©n */ h¨ng sË p = p(t) > 1, C = C(t) 2 N+ , C 2 ¶u ra: {V (D) t,c }1cC (D) t . /* T™p tâm */ { (D) t,c }1cC (D) t . /* Î lªch chu©n */ 1: B˜Óc 1 : (1) Sinh ra hai t™p gÁm K giá tr‡ chø sË ng®u nhiên RD1 = {RD1,i }1iK , và RD2 = {RD2,i }1iK tho£ mãn : (1.1) RD1 RD2 = ?, RD1,i < RD1,j , RD2,i < RD2,j , 8 1  i  j  K. (1.2) 1  RD1,i , RD2,i  N , 8 1  i  N (chÂn K = [N /10], m = K2 . (2) Xác ‡nh t™p giá tr‡ D(˜I t RD1,i , ˜I t RD1,i ) ˜Òc t™p giá tr‡ sË d˜Ïng {dk }1km 2: B˜Óc 2 : FCM (C (D) t , pt ) {dk }1km ta ˜Òc t™p tâm n V (D) t,c oC (D) t c=1 và n ⌘ (D) t,c,i o 1cC (D) t ,1im theo Công th˘c (2.1) 3: B˜Óc 3 : Tính n (D) t,c o 1cC (D) t theo Công th˘c (2.5) (B˜Óc 2 và 3, s˚ dˆng Công th˘c (2.1), (2.5), (2.6) thay th∏ d˙ liªu ∞c tr˜ng b¨ng giá tr‡ kho£ng cách là các sË th¸c d˜Ïng vô h˜Óng.) 4: Return ( n V (D) t,c oC (D) t c=1 , n (D) t,c o 1cC (D) t ) 2.3 Hiªu chønh trÂng sË, d‡ch chuy∫n truy vßn Trong CBIR có nhi∑u kˇ thu™t nh¨m gi£m kho£ng trËng ng˙ nghæa. Hiªu chønh trÂng sË là mÎt trong sË các kˇ thu™t hÂc thông tin ánh giá cıa ng˜Ìi dùng. Trong tra c˘u, thông th˜Ìng chø hi∫n th‡ k∏t qu£ tra c˘u trên màn hình là t™p k∏t qu£ top k. Î t˜Ïng t¸ cıa các £nh trong cÏ s d˙ liªu vÓi £nh truy vßn th˜Ìng s˚ dˆng Î o kho£ng cách gi˙a các vector ∞c tr˜ng. ∫ i∑u chønh l§i Î t˜Ïng t¸ th˜Ìng thông qua tính l§i hàm kho£ng cách k∏t hÒp vÓi trÂng sË. Sau cùng ta có t™p k∏t qu£ top k mÓi có Î chính xác tËt hÏn. ∫ nâng cao hiªu qu£ Î chính xác tra c˘u và g¶n vÓi nh™n th˘c ng˜Ìi dùng, kˇ thu™t hiªu chønh trÂng sË, d‡ch chuy∫n truy vßn ˜Òc ∑ xußt. Trong ∑ xußt này, mÈi bÎ ∞c tr˜ng có t¶m óng góp quan trÂng nh˜ nhau, không phân biªt theo mÈi ki∫u ∞c tr˜ng nh˜ trong [90] (nghiên c˘u này phân biªt theo ki∫u ∞c