Download luận án tiến sĩ ngành toán học với đề tài: Nghiên cứu một số kỹ thuật phân hạng trong tra cứu ảnh dựa vào nội dung, cho các bạn làm luận văn tham khảo
Nhận viết luận văn đại học, thạc sĩ trọn gói, chất lượng, LH ZALO=>0909232620
Tham khảo dịch vụ, bảng giá tại: https://baocaothuctap.net
TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI KỸ NĂNG VIẾT ĐOẠN VĂN NGHỊ LUẬN XÃ HỘI 200 C...
Luận án: Nghiên cứu kỹ thuật phân hạng trong tra cứu ảnh, HAY - Gửi miễn phí qua zalo=> 0909232620
1. BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC
VÀ CÔNG NGHỆ VIỆT NAM
HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ
-----------------------------
VŨ VĂN HIỆU
NGHIÊN CỨU MỘT SỐ KỸ THUẬT PHÂN HẠNG TRONG
TRA CỨU ẢNH DỰA VÀO NỘI DUNG
LUẬN ÁN TIẾN SỸ TOÁN HỌC
HÀ NỘI – 2017
2. BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC
VÀ CÔNG NGHỆ VIỆT NAM
HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ
-----------------------------
VŨ VĂN HIỆU
NGHIÊN CỨU MỘT SỐ KỸ THUẬT PHÂN HẠNG
TRONG TRA CỨU ẢNH DỰA VÀO NỘI DUNG
LUẬN ÁN TIẾN SỸ TOÁN HỌC
Chuyên ngành: Cơ sở Toán học cho Tin học
Mã số: 62 46 01 10
Người hướng dẫn khoa học:
1. PGS. TS. Ngô Quốc Tạo
2. PGS.TS. Nguyễn Hữu Quỳnh
Hà Nội – 2017
3. LÌi cam oan
Tôi xin cam oan lu™n án “Nghiên c˘u mÎt sË kˇ thu™t phân h§ng trong
tra c˘u £nh d¸a vào nÎi dung” là công trình nghiên c˘u cıa riêng tôi. Các sË
liªu, k∏t qu£ ˜Òc trình bày trong lu™n án là hoàn toàn trung th¸c và ch˜a t¯ng
˜Òc công bË trong bßt k˝ mÎt công trình nào khác.
⌅ Tôi ã trích d®n ¶y ı các tài liªu tham kh£o, công trình nghiên c˘u liên
quan trong n˜Óc và quËc t∏. Ngo§i tr¯ các tài liªu tham kh£o này, lu™n
án hoàn toàn là công viªc cıa riêng tôi.
⌅ Trong các công trình khoa hÂc ˜Òc công bË trong lu™n án, tôi ã th∫ hiªn
rõ ràng và chính xác óng góp cıa các Áng tác gi£ và nh˙ng gì do tôi ã
óng góp.
⌅ Lu™n án ˜Òc hoàn thành trong thÌi gian tôi làm Nghiên c˘u sinh t§i Phòng
Nh™n d§ng và Công nghª tri th˘c, Viªn Công nghª thông tin, Viªn Hàn
lâm Khoa hÂc và Công nghª Viªt Nam.
Tác gi£ :
Hà NÎi :
i
4. LÌi c£m Ïn
Lu™n án ˜Òc th¸c hiªn d˜Ói s¸ h˜Óng d®n khoa hÂc cıa PGS.TS Ngô QuËc T§o
và PGS.TS Nguyπn H˙u Qu˝nh. Nghiên c˘u sinh xin bày t‰ lòng bi∏t Ïn sâu s≠c
∏n hai Th¶y v∑ ‡nh h˜Óng khoa hÂc, nh˙ng bài hÂc, nh˙ng góp ˛ qu˛ báu trong
nghiên c˘u. Các Th¶y ã t§o i∑u kiªn vô cùng thu™n lÒi trong suËt quá trình
nghiên c˘u cıa Nghiên c˘u sinh.
Tôi xin ˜Òc c£m Ïn các nhà khoa hÂc, tác gi£ cıa các công trình công bË ã ˜Òc
trích d®n trong lu™n án, ây là nh˙ng t˜ liªu qu˛, ki∏n th˘c liên quan quan trÂng
giúp Nghiên c˘u sinh hoàn thành lu™n án. Xin c£m Ïn ∏n các nhà khoa hÂc ã
ph£n biªn các công trình nghiên c˘u cıa Nghiên c˘u sinh.
Tôi trân trÂng c£m Ïn Phòng Nh™n d§ng và Công nghª tri th˘c, Phòng qu£n l˛
ào t§o, Viªn Công nghª thông tin, HÂc viªn Khoa hÂc và Công nghª, Viªn Hàn
lâm Khoa hÂc và Công nghª Viªt Nam ã t§o i∑u kiªn thu™n lÒi cho tôi trong
suËt quá trình nghiên c˘u th¸c hiªn lu™n án. Tôi cÙng xin c£m Ïn sâu s≠c ∏n HÎi
Áng Khoa hÂc Viªn Công nghª thông tin, các Th¶y trong HÎi Áng b£o vª cßp
cÏ s ã góp ˛ giúp Nghiên c˘u sinh hoàn thiªn công trình lu™n án này.
Tôi cÙng bày t‰ s¸ c£m Ïn sâu s≠c ∏n Khoa Công nghª thông tin, Tr˜Ìng §i
hÂc iªn L¸c, Hà NÎi ã t§o i∑u kiªn cho tôi ˜Òc hÂc t™p, trao Íi và nghiên
c˘u. Tôi xin c£m Ïn Tr˜Ìng §i hÂc H£i Phòng ã t§o i∑u kiªn v∑ thÌi gian và
tài chính cho tôi th¸c hiªn lu™n án này.
MÎt ph¶n cıa nghiên c˘u này ˜Òc th¸c hiªn trong khuôn khÍ ∑ tài nghiên c˘u
mã sË CS’15.03 cıa Viªn Công nghª Thông tin, Viªn Hàn lâm Khoa hÂc và Công
nghª Viªt Nam và ∑ tài nghiên mã sË VAST01.07/15-16 cıa Viªn Hàn lâm Khoa
hÂc và Công nghª Viªt Nam. Xin c£m Ïn các trao Íi và trÒ giúp cıa các thành
viên ∑ tài.
CuËi cùng, tôi xin bày t‰ lòng bi∏t Ïn vô h§n Ëi vÓi cha mµ, vÒ con và toàn th∫
anh em trong gia ình ã luôn ıng hÎ, giúp Ô tôi.
ii
7. T¯ vi∏t t≠t
D§ng vi∏t t≠t D§ng ¶y ı Diπn gi£i
CBIR Content based image retrie-
val
Tra c˘u £nh d¸a vào nÎi dung
FCM Fuzzy c-means Phân cˆm mÌ c-means
HI Histogram Interrsection L˜Òc Á giao
HSV hue, saturation, value màu s≠c, Î bão hoà màu, Î sáng
L2R Learning to Rank HÂc x∏p h§ng
MARS Multimedia Analysis and
Retrieval Systems
Các hª thËng phân tích a
ph˜Ïng tiªn và tra c˘u
Pr Precision Î chính xác
Re Recall Î hÁi t˜ng
RF Relevance feedback Ph£n hÁi liên quan
RGB red, green, blue ‰, xanh lá, xanh d˜Ïng
SIFT Scale-Invariant Feature
Transform
SVM Support vector machine Máy vector hÈ trÒ
v
16. 2
các kˇ thu™t trích rút ∞c tr˜ng m˘c thßp bên trong cıa mÈi £nh (màu s≠c, hình
d§ng, k∏t cßu, vv).
Tuy CBIR có nhi∑u ti∏n bÎ song ng˜Ìi dùng v®n g∞p khó kh´n trong viªc
tìm ki∏m thông tin liên quan t¯ t™p d˙ liªu £nh lÓn không Áng nhßt v∑ m∞t nÎi
dung và ng˙ nghæa. i∑u này d®n ∏n k∏t qu£ tìm ki∏m ch˜a §t ˜Òc nh˜ mong
muËn. Thông tin mà máy tính hi∫u nÎi dung £nh th˜Ìng là các giá tr‡ i∫m £nh,
vector ∞c tr˜ng ˜Òc trích rút theo các thı tˆc,... còn con ng˜Ìi hi∫u v∑ nÎi dung
cıa £nh th˜Ìng là các khái niªm ng˙ nghæa. Do không có s¸ t˜Ïng quan mÎt cách
chính xác gi˙a nÎi dung mà máy tính có ˜Òc thông qua ∞c tr˜ng tr¸c quan m˘c
thßp vÓi nÎi dung mà con ng˜Ìi hi∫u thông qua các khái niªm ng˙ nghæa m˘c
cao d®n ∏n kho£ng trËng ng˙ nghæa. Kho£ng trËng ng˙ nghæa ‡nh nghæa theo
Smeulders và cÎng s¸ [94] nh˜ sau :
“Kho£ng trËng ng˙ nghæa là s¸ không t˜Ïng Áng gi˙a thông tin £nh, ˜Òc
trích rút t¯ d˙ liªu tr¸c quan so vÓi diπn gi£i v∑ d˙ liªu £nh ó bi ng˜Ìi dùng
trong tình huËng cˆ th∫ ”.
Kho£ng trËng ng˙ nghæa n¨m gi˙a các ∞c tr˜ng tr¸c quan m˘c thßp cıa các
£nh và các ng˙ nghæa m˘c cao mong muËn d¸ ‡nh suy ra t¯ các ∞c tr˜ng tr¸c
quan m˘c thßp. Nhi∑u nghiên c˘u trong lænh v¸c CBIR ∏n nay v®n ang cË g≠ng
thu hµp kho£ng trËng ng˙ nghæa này. Cˆ th∫, hÏn ba th™p kø qua nhi∑u hª thËng
CBIR ã ˜Òc phát tri∫n, bao gÁm QBIC [28], Photobook [80], MARS [79], [83],
[90], PicHunter [17], VisualSEEK [96], Blobworld [11], MindReader [46], SIMPLI-
city [110], FIRE [23], và các nghiên c˘u khác [12], [41], [60], [115], [124].
Mˆc tiêu, ph§m vi nghiên c˘u cıa lu™n án
Thông th˜Ìng mÎt hª thËng tra c˘u £nh d¸a vào nÎi dung ˜Òc miêu t£ nh˜
Hình 0.1 [62]. Các nÎi dung tr¸c quan cıa các £nh trong cÏ s d˙ liªu ˜Òc trích
rút và miêu t£ bi các vector ∞c tr˜ng nhi∑u chi∑u. Các vector ∞c tr˜ng cıa các
20. 6
Hình 0.2. Hª thËng ∑ xußt
(4) Xây d¸ng t™p ˘ng viên Pareto ∫ gi£m không gian tìm ki∏m.
(5) T™p hußn luyªn là các £nh ˜Òc ánh giá trong t™p k∏t qu£ top k. T™p
ki∫m tra là t™p ˘ng viên Pareto.
(6) Tìm hàm phân lÓp d¸a vào thông tin ¶u vào là t™p hußn luyªn và t™p
ki∫m tra b¨ng mÎt máy phân lÓp.
(7) S≠p x∏p các £nh trong t™p ki∫m tra theo giá tr‡ d¸ báo phân lÓp. T™p k∏t
qu£ hi∫n th‡ gÁm top k £nh có th˘ h§ng giá tr‡ d¸ báo phân lÓp cao nhßt.
(8) Ph£n hÁi liên quan : S˚ dˆng thông tin ánh giá cıa ng˜Ìi dùng liên quan
ho∞c không liên quan trên t™p k∏t qu£ top k. D¸a trên các £nh ˜Òc ánh giá,
23. 9
gi£m kho£ng trËng ng˙ nghæa ˜Òc trình bày trong các Mˆc 1.5, 1.6, 1.7 và 1.8.
Mˆc 1.9 trình bày ph˜Ïng pháp ánh giá hiªu n´ng cıa hª thËng CBIR s˚ dˆng
trong các ∑ xußt Ch˜Ïng 2 và Ch˜Ïng 3.
1.1 MÎt sË ∞c tr˜ng £nh th˜Ìng s˚ dˆng trong
tra c˘u £nh d¸a vào nÎi dung
Trong CBIR, trích rút ∞c tr˜ng nh¨m chuy∫n Íi mÈi £nh ¶u vào thành
mÎt t™p các ∞c tr˜ng (thông th˜Ìng d˜Ói hình th˘c vector ∞c tr˜ng). Các ∞c
tr˜ng m˘c thßp ˜Òc trích rút mÎt cách t¸ Îng d¸a trên các thuÎc tính khác
nhau (màu s≠c, k∏t cßu, hình d§ng, v.v.) cıa chính £nh ó. Tr˜Óc khi trích rút
∞c tr˜ng, các £nh ˜Òc ti∑n x˚ l˛ (chuy∫n Íi không gian màu, gi£m nhiπu, l˜Òng
t˚ hoá, v.v.). Các ∞c tr˜ng s≥ mang ¶y ı thông tin v∑ £nh, viªc tìm các ∞c
tr˜ng liên quan bi∫u diπn nÎi dung tr¸c quan cıa các £nh trong mÎt cÏ s d˙ liªu
lÓn v®n ang là mÎt nhiªm vˆ thách th˘c. L¸a chÂn ∞c tr˜ng tu˝ thuÎc vào cÏ
s d˙ liªu £nh, tu˝ thuÎc ˘ng dˆng và cÙng nh˜ tu˝ thuÎc vào mong muËn cıa
ng˜Ìi dùng. Các ∞c tr˜ng có th∫ bi∫u diπn toàn cˆc (cho toàn bÎ £nh), cˆc bÎ
(cho mÎt vùng ∞c biªt cıa £nh) ho∞c các ti∏p c™n không gian.
1.1.1 Miêu t£ toàn cˆc
L˜Òc Á màu
∞c tr˜ng này ˜Òc s˚ dˆng trong nhi∑u hª thËng CBIR nh˜ QBIC [72],
MARS [79], [83], [90], PicHunter [17], VisualSEEK [96], v.v. L˜Òc Á màu th˜Ìng
˜Òc bi∏t d˜Ói d§ng mÎt vector n chi∑u [h1, ..., hn], trong ó hj là sË i∫m £nh có
màu j trong £nh và n là sË các giá tr‡ màu. Nh˜ v™y, l˜Òc Á màu bi∫u diπn phân
bË cıa các màu trong £nh.
24. 10
Các mô men màu
Gi£ ‡nh màu trong mÎt £nh có th∫ theo mÎt phân phËi xác sußt nhßt ‡nh.
Khi ó, các mô men phân phËi màu s≥ ˜Òc s˚ dˆng nh˜ các ∞c tr˜ng màu cıa
£nh. Stricker và Orengo [97] ‡nh nghæa các mô men màu khác nhau cho mÈi kênh
màu trong £nh.
T˜Ïng quan màu
T˜Ïng quan màu nói ∏n t˜Ïng quan không gian cıa các c∞p màu trong £nh
[45]. Trong [74], [84] ã s˚ dˆng ∫ trích rút ∞c tr˜ng £nh s˚ dˆng cho CBIR.
T˜Ïng t¸ l˜Òc Á màu và các mô men màu, t˜Ïng quan màu có th∫ s˚ dˆng cho
các lo§i không gian màu khác nhau.
∞c tr˜ng k∏t cßu
∞c tr˜ng k∏t cßu ˜Òc s˚ dˆng rÎng rãi trong CBIR, ph£n ánh cßu trúc
không gian, b∑ m∞t,... Có th∫ ‡nh nghæa mÎt vùng k∏t cßu nh˜ mÎt vùng có
c˜Ìng Î không Áng nhßt. Các ∞c tr˜ng k∏t cßu cÙng là các ∞c tr˜ng tr¸c quan
quan trÂng cıa £nh. ChØng h§n, con hÍ và con báo không th∫ phân biªt n∏u chø
s˚ dˆng màu s≠c và hình d§ng. Các ∞c tr˜ng k∏t cßu là c¶n thi∏t trong tr˜Ìng
hÒp này.
Có th∫ chia bi∫u diπn k∏t cßu thành ph˜Ïng pháp cßu trúc và ph˜Ïng pháp
thËng kê. Các ph˜Ïng pháp cßu trúc miêu t£ k∏t cßu b¨ng cách xác ‡nh tính b£n
chßt ho∞c các m®u cÏ b£n (nh˜ là các ˜Ìng tròn, hình lˆc giác, hình ch˙ nh™t,...)
và quy t≠c ∫ t§o nên k∏t cßu. Các ph˜Ïng pháp này có hiªu qu£ khi miêu t£ các
k∏t cßu có cßu trúc, qua ∑ c™p trong bài báo [38], [66], [105], [109]. Ph˜Ïng pháp
thËng kê miêu t£ k∏t cßu thông qua t™p thËng kê các vector ∞c tr˜ng, d¸a trên
các tính chßt nh˜ Î t˜Ïng ph£n, entropy,... ˜a ra trong [38], [39].
25. 11
Trong [34], [56] d¸a vào nguyên l˛ k∏t cßu là s¸ l∞p i l∞p l§i cıa các chßt
liªu vÓi mÎt t¶n sußt nhßt ‡nh, ˛ t˜ng cıa ph˜Ïng pháp này là s˚ dˆng mÎt t™p
các bÎ lÂc Gabor ∫ phân tích cßu trúc cıa k∏t cßu a tø lª (t¶n sË) và a h˜Óng.
Zhang và cÎng s¸ [121] s˚ dˆng bi∏n Íi Gabor wavelet s˚ dˆng cho CBIR.
∞c tr˜ng hình d§ng
Các ∞c tr˜ng hình d§ng ˜Òc s˚ dˆng rÎng rãi trong các hª thËng CBIR
[107]. ây là ki∫u ∞c tr˜ng miêu t£ Ëi t˜Òng và vùng. Các miêu t£ hình d§ng
˜Òc trích rút, sau khi phân o§n £nh theo các Ëi t˜Òng và các vùng. Các ∞c
tr˜ng hình d§ng không phong phú b¨ng các ∞c tr˜ng màu và k∏t cßu. ∞c tr˜ng
hình d§ng ˜Òc giÓi thiªu trong bài báo [117]. Có th∫ chia chúng vào hai nhóm :
(i) Các miêu t£ ˜Ìng Áng m˘c ; (ii) Các miêu t£ vùng. Các miêu t£ ˜Ìng Áng
m˘c ˜a ra trong mÎt sË bài báo [29], [119], [122]. Các miêu t£ vùng, có th∫ bi∫u
diπn các thuÎc tính cıa toàn bÎ vùng, ˜Òc ˜a ra trong các bài báo v∑ các mô
men Hu [44], các bßt bi∏n Zernike [51].
∞c tr˜ng GIST
Oliva và Torralba [75] mô hình hoá viªc nh™n d§ng c£nh th∏ giÓi th¸c b‰ qua
phân o§n, quá trình x˚ l˛ các vùng và các Ëi t˜Òng cˆ th∫ b¨ng ∑ xußt t™p
chi∑u tr¸c quan (tính t¸ nhiên, tính rõ ràng, tính nhám, giãn n, gÁ gh∑) bi∫u diπn
cßu trúc không gian cıa mÎt c£nh. Mô hình này t§o ra mÎt không gian a chi∑u,
trong ó các c£nh liên quan tÓi các chı ∑ ng˙ nghæa (ví dˆ nh˜ ˜Ìng phË, cao
tËc, bÌ bi∫n) ˜Òc xem nh˜ g¶n nhau. Tính hiªu qu£ cıa ∞c tr˜ng GIST ã ˜Òc
ch˘ng minh trong nh™n d§ng Ëi t˜Òng [76], [103].
26. 12
Bi∏n Íi Haar Wavelet
Bi∏n Íi Haar Wavelet là bi∏n Íi cÏ b£n t¯ mi∑n không gian sang mi∑n t¶n
sË . Haar Wavelet ˜Òc ∑ xußt bi Alfred Haar [36]. ∞c tr˜ng này ˜Òc s˚ dˆng
trong công trình [CT4].
1.1.2 Miêu t£ cˆc bÎ
Các ∞c tr˜ng cˆc bÎ hiªn nay ˜Òc s˚ dˆng rÎng rãi trong CBIR. Thay vì
tính toán d˙ liªu ∞c tr˜ng trên toàn bÎ £nh, các ph˜Ïng pháp trích rút ∞c tr˜ng
d¸a trên cách ti∏p c™n này chø miêu t£ các thuÎc tính cˆc bÎ cıa các vùng £nh
ho∞c xác ‡nh các i∫m nÍi b™t. MÈi £nh ˜Òc miêu t£ b¨ng mÎt t™p các vector
∞c tr˜ng (mÈi vector cho mÈi i∫m).
Các kˇ thu™t phát hiªn các i∫m nÍi b™t ã ˜Òc ∑ xußt trong mÎt sË nghiên
c˘u nh˜ phát hiªn Harris [40], phát hiªn Harris-Laplace [67], phát hiªn Difference
of Gaussian (DoG) [59],v.v. MÎt sË ph˜Ïng pháp tiêu bi∫u nhßt nh˜ SIFT (Scale-
Invariant Feature Transform) [63] và SURF (Speed Up Robust Features) [3]. Trong
công trình [CT5] ã ˜a ra mÎt sË ánh giá v∑ hai ∞c tr˜ng SIFT và SURF trong
hª thËng SIMPLE.
Bên c§nh s˚ dˆng các i∫m nÍi b™t, trong £nh còn có rßt nhi∑u i∫m £nh n¨m
r£i rác không t§o thành vùng Áng nhßt (vùng Áng nhßt gÁm các i∫m £nh cùng
màu và li∑n k∑ nhau). Viªc s˚ dˆng tßt c£ các i∫m £nh trong £nh (c£ các i∫m
£nh n¨m r£i rác) vào quá trình tra c˘u, Î ph˘c t§p tính toán s≥ cao và nhi∑u khi
chßt l˜Òng tra c˘u không ˜Òc c£i thiªn. Trong công trình [CT2] ã s˚ dˆng kˇ
thu™t trích rút ∞c tr˜ng d¸a trên vùng thu¶n nhßt.
33. 19
1.4 Kho£ng trËng ng˙ nghæa
Thu™t ng˙ “kho£ng trËng ng˙ nghæa” ˜Òc dùng ∫ miêu t£ s¸ khác nhau gi˙a
hai m˘c miêu t£ cıa mÎt £nh. M˘c miêu t£ ¶u trong CBIR s˚ dˆng các vector
∞c tr˜ng chø thu thông tin ∞c tr˜ng m˘c thßp cıa £nh (màu s≠c, k∏t cßu, hình
d§ng,...). M˘c miêu t£ th˘ hai th¸c hiªn bi con ng˜Ìi s˚ dˆng các khái niªm ng˙
nghæa m˘c cao khi tra c˘u £nh. Tra c˘u trong hª thËng CBIR truy∑n thËng nói
chung chø d¸a vào các Î o t˜Ïng t¸ gi˙a các ∞c tr˜ng m˘c thßp, do v™y các
£nh k∏t qu£ có th∫ không phù hÒp vÓi mËi quan tâm cıa ng˜Ìi dùng.
Hình 1.4. Énh truy vßn “mandolin image 0001.jpg”.
Hình 1.5. Hª thËng tra c˘u vÓi £nh truy vßn “mandolin image 0001.jpg”.
34. 20
Hình 1.6. K∏t qu£ top 20 các £nh t˜Ïng t¸ nhßt vÓi £nh truy vßn l¶n tra
c˘u khi t§o.
Cho £nh nh˜ Hình 1.4 là mÎt truy vßn khi t§o tra c˘u trên t™p d˙ liªu
Caltech 101 4
. Truy vßn ˜Òc ˜a vào hª thËng CBIR nh˜ Hình 1.5. K∏t qu£
top 20 các £nh liên quan nhßt vÓi £nh truy vßn l¶n tra c˘u khi t§o ˜Òc máy
tính ˜a ra nh˜ Hình 1.6. K∏t qu£ này ˜Òc x∏p h§ng d¸a trên ∞c tr˜ng m˘c
thßp.
(a) Énh truy vßn (b) Énh 12
Hình 1.7. Hai £nh có ng˙ nghæa t˜Ïng Áng
K∏t qu£ tra c˘u ˜Òc x∏p h§ng trong k∏t qu£ top 20 nh˜ Hình 1.6 ch˜a
tho£ mãn nhu c¶u tìm ki∏m cıa ng˜Ìi dùng. Do con ng˜Ìi hi∫u £nh b¨ng các khái
niªm ng˙ nghæa m˘c cao nh˜ Hình 1.7 hai £nh ˜Òc xem nh˜ là liên quan. Trong
4. http://www.vision.caltech.edu/Image_Datasets/Caltech101/
35. 21
Query image
0
2000
4000
6000
Histogram: Query image
0 50 100 150 200 250
Image 3
0
2000
4000
Histogram: Image 3
0 50 100 150 200 250
Image 12
0
500
1000
Histogram: Image 12
0 50 100 150 200 250
Hình 1.8. L˜Òc Á màu cıa £nh truy vßn và hai £nh trong k∏t qu£ top 20.
khi ó máy tính (hay hª thËng tính toán) hi∫u các £nh thông qua ∞c tr˜ng m˘c
thßp (nh˜ là l˜Òc Á màu) nh˜ Hình 1.8 nên “£nh truy vßn” và “£nh 3” (Image 3)
˜Òc xem là t˜Ïng Áng v∑ l˜Òc Á màu, do ó ˜Òc hª thËng x∏p th˘ h§ng cao
hÏn trong k∏t qu£ top 20.
∫ nâng cao Î chính xác k∏t qu£ tra c˘u trong các l¶n l∞p ti∏p sau c¶n thi∏t
thu hµp “kho£ng trËng ng˙ nghæa”. ó là k∏t hÒp thông tin nÎi dung tr¸c quan
(các vector ∞c tr˜ng m˘c thßp) vÓi thông tin ng˙ nghæa hÂc ˜Òc t¯ ph£n hÁi
trên t™p top k thông qua nhãn m˘c Î quan trÂng b¨ng kˇ thu™t hiªu chønh
trÂng sË [90] ho∞c máy phân lÓp trong suËt pha tra c˘u [101].
1.5 Ph£n hÁi liên quan trong CBIR
Kˇ thu™t ph£n hÁi liên quan ˜Òc s˚ dˆng rÎng rãi nh¨m thu hµp “kho£ng
trËng ng˙ nghæa” trong CBIR, c£i thiªn k∏t qu£ tra c˘u thông qua t˜Ïng tác gi˙a
36. 22
ng˜Ìi dùng và máy. MÎt k‡ch b£n thông th˜Ìng cho ph£n hÁi liên quan trong
CBIR nh˜ sau :
B˜Óc 1 : Máy tính ˜a ra các k∏t qu£ tra c˘u khi t§o (top k) thông qua
£nh truy vßn.
B˜Óc 2 : Ng˜Ìi dùng cung cßp ánh giá trên k∏t qu£ top k, ánh giá theo
ki∫u nh˜ “liên quan” ho∞c “không liên quan” vÓi nh™n th˘c cıa chính ng˜Ìi
dùng ó.
B˜Óc 3 : Máy hÂc và th˚ l§i. L∞p l§i b˜Óc 2.
T¯ t™p k∏t qu£ top k ˜Òc ánh giá, mÎt sË ph˜Ïng pháp phÍ bi∏n s˚ dˆng kˇ
thu™t ph£n hÁi liên quan nh˜ hiªu chønh trÂng sË và d‡ch chuy∫n truy vßn ; m
rÎng truy vßn ; kˇ thu™t hÂc máy. MÈi ph˜Ïng pháp có cách hÂc khác nhau trong
viªc s˚ dˆng thông tin cıa ng˜Ìi dùng.
Hiªu chønh trÂng sË và d‡ch chuy∫n truy vßn nh˜ trong [46], [88], [90] s˚ dˆng
các £nh ˜Òc ánh giá trong k∏t qu£ top k cho phép xây d¸ng trÂng sË. TrÂng
sË ˜Òc gán mÎt hª sË cho mÈi chi∑u cıa i∫m truy vßn, các trÂng sË cao vÓi
các chi∑u quan trÂng hÏn và ng˜Òc l§i. Trong [88] s˚ dˆng trÂng sË kho£ng cách
Ã-clit, cho phép x˚ l˛ các m∞t elip vÓi trˆc chính ˜Òc gióng theo các trˆc to§ Î.
MindReader [46] s˚ dˆng kho£ng cách Ã-clit tÍng quát, cho phép quay các trˆc
∫ làm viªc tËt hÏn vÓi các h˜Óng tu˝ ˛ các m∞t elip. D‡ch chuy∫n truy vßn nh˜
trong [88] và MindReader [46] bi∫u diπn truy vßn nh˜ mÎt i∫m Ïn trong không
gian ∞c tr˜ng, di chuy∫n i∫m truy vßn v∑ phía các i∫m k∏t qu£ liên quan và di
chuy∫n ra xa các i∫m k∏t qu£ không liên quan. fi t˜ng này xußt phát t¯ ph˜Ïng
pháp cıa Rocchio [85]. Trong [88], Mindreader [46] òi h‰i “truy vßn khi t§o” ı
tËt và mÎt sË b˜Óc hiªu chønh c¶n thi∏t, tr˜Óc khi các trÂng sË hÎi tˆ tÓi các giá
tr‡ úng. MÎt cách tr¸c giác, cách ti∏p c™n này phù hÒp vÓi nh™n th˘c chı quan
cıa ng˜Ìi dùng. S¸ h§n ch∏ cıa nh˙ng ph˜Ïng pháp này là khó hÎi tˆ khi các
i∫m liên quan n¨m r£i rác trong không gian tr¸c quan.
M rÎng truy vßn nh˜ trong [52], [83] cho phép gi£i quy∏t vßn ∑ khó hÎi tˆ.
B¨ng cách s˚ dˆng nhi∑u i∫m truy vßn ∫ xây d¸ng cˆm cˆc bÎ cho các i∫m
40. 26
quan. Trong pha tra c˘u on-line, s≥ gán mÎt trÂng sË cho mÂi ∞c tr˜ng liên quan
d¸a vào £nh truy vßn, sau ó x∏p h§ng các £nh trong cÏ s d˙ liªu d¸a vào các
giá tr‡ ∞c tr˜ng trung bình trÂng sË cıa nó. MÈi ∞c tr˜ng ˜Òc s˚ dˆng ∫ xây
d¸ng mÎt cây nh˜ trong Isolation Forest [60]. MÈi £nh I trong cÏ s d˙ liªu ˜Òc
˜Óc l˜Òng giá tr‡ liên quan li (I ) theo ∞c tr˜ng i trên mÈi cây Ti (i 2 {1, ..., t})
và ánh x§ I sang không gian ∞c tr˜ng liên quan nh˜ :
I 0
= [l1(I ), ..., lt (I )]T
(1.16)
và truy vßn Q cÙng ˜Òc bi∫u diπn t˜Ïng t¸ nh˜ v™y. MÎt trÂng sË cho ∞c tr˜ng
i nh˜ sau :
wi (Q) =
li (Q)
c( )
1, (1.17)
trong ó c( ) = 2(ln( 1) ( 1)/ + E), E ⇡ 0.5772 ( theo [60]). X∏p h§ng
mÎt £nh I vÓi truy vßn Q theo giá tr‡ trÂng sË trung bình :
Score(I | Q) =
1
t
tX
i=1
(wi (Q) ⇥ li (I )). (1.18)
Xu và cÎng s¸ [115] ti∏n hành hÂc tr˜Óc (t˘c là s˚ dˆng ∞c tr˜ng cıa toàn
bÎ các £nh trong cÏ s d˙ liªu tính Î t˜Ïng t¸ tr˜Óc) t¯ d˙ liªu ∞c tr˜ng b¨ng
cách xây d¸ng mËi liên quan ng˙ nghæa gi˙a các £nh thông qua Á th‡ (ma tr™n
k∑). Nghiên c˘u này s˚ dˆng kˇ thu™t hÂc ánh x§ t¯ không gian ∞c tr˜ng m˘c
thßp sang không gian ng˙ nghæa m˘c cao nh˜ trong Manifold Ranking (MR) [41],
cho phép gi£m chi phí tính toán khi xây d¸ng ma tr™n li∑n k∑. D˙ liªu ∞c tr˜ng
cıa tßt c£ các £nh ˜Òc trích rút và s˚ dˆng nh˜ to§ Î cıa các i∫m trong Á
th‡. Ti∏p theo, l¸a chÂn bi∫u diπn cho các i∫m nh˜ các anchor và xây d¸ng ma
tr™n trÂng sË Z b¨ng kernel regression vÓi mÎt lân c™n nh‰ s. Các anchor ˜Òc
l¸a chÂn off-line và không £nh h˜ng trong quá trình x˚ l˛ on-line. Khi mÎt truy
vßn ˜Òc ˜a vào, sau khi trích rút ∞c tr˜ng m˘c thßp, sau ó c™p nh™t trÂng sË
cho ma tr™n Z, tính toán i∫m x∏p h§ng, chi ti∏t v∑ tính toán này có trong [115].
41. 27
1.7 Tra c˘u £nh d¸a vào nÎi dung s˚ dˆng kˇ
thu™t máy hÂc
Các kˇ thu™t hÂc máy có hiªu n´ng t´ng áng k∫ Ëi vÓi các hª thËng CBIR
nh˜ các kˇ thu™t máy vector hÈ trÒ (SVM) , hÂc t´ng c˜Ìng (boosting),... MÎt
h§n ch∏ là không có d˙ liªu hußn luyªn t¯ tr˜Óc vÓi mÈi truy vßn cˆ th∫, d˙ liªu
hußn luyªn chø có ˜Òc sau khi ng˜Ìi dùng ph£n hÁi vÓi £nh truy vßn ˜Òc ˜a
vào bi mÎt ng˜Ìi dùng. Bên c§nh d˙ liªu hußn luyªn là t˜Ïng Ëi ít và d˙ liªu
ki∫m tra b‡ nhiπu do vßn ∑ kho£ng trËng ng˙ nghæa.
1.7.1 Hußn luyªn và ki∫m tra
Mˆc ích s˚ dˆng các kˇ thu™t hÂc máy ∫ th¸c hiªn nhiªm vˆ x∏p h§ng.
ây là nhiªm vˆ hÂc giám sát do có các pha hußn luyªn và ki∫m tra. D˙ liªu bao
gÁm truy vßn và các £nh, trong ó mÈi truy vßn liên quan ∏n mÎt sË các £nh. S¸
liên quan cıa các £nh Ëi vÓi truy vßn ˜Òc cho bi mÎt nhãn, k˛ hiªu mÎt lo§i
( ˜Òc ˜a ra trong pha hußn luyªn và d¸ báo trong pha ki∫m tra).
Gi£ s˚ Q là t™p truy vßn và D là t™p £nh (truy vßn và £nh có th∫ là ∞c tr˜ng
£nh). Gi£ s˚ Y = {1, 2, ..., l} là t™p nhãn, trong ó nhãn bi∫u diπn h§ng (lÓp ho∞c
i∫m sË). TÁn t§i th˘ t¸ toàn bÎ gi˙a các h§ng 1 ... l 1 l, trong ó
là quan hª th˘ t¸. Cho {Q1, Q2, ..., Qm} là t™p truy vßn cho hußn luyªn và Qi là
truy vßn th˘ i. Cho Di = {Ii,1, Ii,2, ..., Ii,ni } là t™p các £nh liên quan vÓi truy vßn
Qi và yi = {yi,1, yi,2, ..., yi,ni } là t™p các nhãn liên quan vÓi truy vßn Qi , trong ó
ni là cÔ cıa t™p £nh Di và yi ; Ii,j là £nh th˘ j cıa Di ; yi,j 2 Y là th˘ t¸ nhãn
th˘ j trong yi t˜Ïng ˘ng vÓi Î liên quan cıa £nh Ii,j Ëi vÓi qi . T™p hußn luyªn
gËc ˜Òc k˛ hiªu là S = {(Qi , Di ), yi }n
i=1.
Vector ∞c tr˜ng xi,j = (Qi , Ii,j ) ˜Òc t§o t¯ mÈi c∞p £nh - truy vßn
(Qi , Ii,j ), i = 1, 2, ..., m, j = 1, 2, ..., ni , trong ó k˛ hiªu là các hàm ∞c
42. 28
tr˜ng. Các ∞c tr˜ng ˜Òc xác ‡nh nh˜ các hàm cıa c∞p £nh truy vßn. Cho
xi = {xi,1, xi,2, ..., xi,ni }, bi∫u diπn t™p hußn luyªn S0
= {(xi , yi )}m
i=1, ây x 2 X
và X ✓ Rd
. Mˆc ích ∫ hußn luyªn mÎt mô hình x∏p h§ng (cˆc bÎ) f (Q, I ) = f (x)
có th∫ gán mÎt i∫m sË cho mÎt c∞p £nh-truy vßn Q và I ho∞c t˜Ïng ˜Ïng vÓi
vector ∞c tr˜ng x ã cho. TÍng quát hÏn, ta cÙng có th∫ xem hußn luyªn mÎt
mô hình x∏p h§ng toàn cˆc F(Q, D) = F((x)). Mô hình x∏p h§ng cˆc bÎ ˜a ra
mÎt i∫m sË duy nhßt, mô hình x∏p h§ng toàn cˆc ˜a ra danh sách i∫m sË.
D˙ liªu ki∫m tra gÁm mÎt truy vßn mÓi Qm+1 và các £nh liên quan Dm+1.
T = {(Qm+1), Dm+1)}, t§o ra vector ∞c tr˜ng xm+1, s˚ dˆng mô hình x∏p h§ng
hußn luyªn tr˜Óc ∫ gán các i∫m sË cho Dm+1 các £nh, s≠p x∏p các £nh này d¸a
vào các i∫m sË và ˜a ra danh sách các £nh ¶u ra.
1.7.2 Nhãn d˙ liªu
Có hai cách t§o ra nhãn d˙ liªu. Th˘ nhßt, ˜Òc t§o ra bi ánh giá cıa con
ng˜Ìi và th˘ hai ˜Òc lßy ra t¯ d˙ liªu l‡ch s˚ tìm ki∏m (search log). Cách th˘ hai
˜Òc miêu t£ chi ti∏t trong [58]. Ti∏p c™n th˘ nhßt, mÎt t™p các truy vßn ˜Òc
l¸a chÂn ng®u nhiên t¯ l‡ch s˚ truy vßn cıa mÎt hª thËng tìm ki∏m. Gi£ s˚ r¨ng
có nhi∑u hª thËng tìm ki∏m (trong gi£ l™p chø có mÎt hª thËng). Ti∏p c™n th˘
hai, các truy vßn ˜Òc ˜a vào các hª thËng tìm ki∏m và các £nh x∏p h§ng cao
nhßt ˜Òc tr£ v∑ (top rank). Nh˜ v™y, mÈi truy vßn liên quan vÓi nhi∑u £nh. Con
ng˜Ìi ánh giá d¸a vào s¸ liên quan trên các c∞p £nh-truy vßn. S¸ ánh giá liên
quan th˜Ìng theo nhi∑u m˘c Î. Con ng˜Ìi ánh giá liên quan theo quan i∫m
cıa trung bình các ng˜Ìi dùng. Các nhãn bi∫u diπn s¸ liên quan sau ó ˜Òc gán
cho các c∞p £nh-truy vßn. ánh giá s¸ liên quan trên mÎt c∞p £nh-truy vßn có th∫
˜Òc th¸c hiªn bi nhi∑u ánh giá, sau ó ti∏n hành bi∫u quy∏t d¸a vào a sË.
43. 29
1.7.3 Xây d¸ng mô hình hÂc
Gi£ ‡nh cho X là không gian vào (không gian ∞c tr˜ng) gÁm danh sách các
vector ∞c tr˜ng và Y là không gian ¶u ra gÁm danh sách các h§ng. Gi£ s˚ x
là mÎt ph¶n t˚ cıa X bi∫u diπn mÎt danh sách các vector ∞c tr˜ng và y là mÎt
ph¶n t˚ cıa Y bi∫u diπn mÎt danh sách các th˘ h§ng. Cho P(X , Y ) là phân phËi
xác sußt k∏t hÒp ch˜a bi∏t, trong ó bi∏n ng®u nhiên X lßy x là giá tr‡ cıa nó và
t˜Ïng t¸ Y lßy y là giá tr‡ cıa nó.
Gi£ s˚ F(·) là mÎt hàm ánh x§ t¯ danh sách các vector ∞c tr˜ng x tÓi mÎt
danh sách i∫m sË (score). Mˆc ích cıa nhiªm vˆ hÂc là t¸ Îng hÂc mÎt hàm
ˆF(x) cho d˙ liªu hußn luyªn (x1, y1), (x2, y2), ..., (xm, ym). MÈi m®u hußn luyªn
gÁm các vector ∞c tr˜ng xi và lÓp t˜Ïng ˘ng yi (i = 1, ..., m) trong ó m k˛ hiªu
là sË m®u hußn luyªn.
Bi∫u diπn cho F(x) và y là F(x) = (f (x1), f (x2), ..., f (xn)) và y = (y1, y2, ..., yn).
Các vector ∞c tr˜ng bi∫u diπn các Ëi t˜Òng ∫ x∏p h§ng. K˛ hiªu f (x) hàm x∏p
h§ng cˆc bÎ và n k˛ hiªu sË vector ∞c tr˜ng và các i∫m sË.
MÎt hàm lÈi L(·, ·) ˜Òc dùng ∫ ánh giá k∏t qu£ d¸ báo cıa F(·). Các vector
∞c tr˜ng x ˜Òc x∏p h§ng d¸a vào F(x), sau ó top k các k∏t qu£ cıa x∏p
h§ng ˜Òc ánh giá s˚ dˆng các i∫m sË y t˜Ïng ˘ng. N∏u các vector ∞c tr˜ng
vÓi các i∫m sË cao s≥ ˜Òc x∏p h§ng cao hÏn, khi ó lÈi là nh‰ hÏn. Ng˜Òc l§i, lÈi
s≥ là lÓn. Hàm lÈi ˜Òc bi∫u diπn mÎt cách cˆ th∫ nh˜ L(F(x), y). Chú ˛, hàm lÈi
cho x∏p h§ng là khác so vÓi hàm lÈi trong các nhiªm vˆ hÂc thËng kê khác, trong
tr˜Ìng hÒp này nó dùng ∫ s≠p x∏p.
Trong CBIR, các vector ∞c tr˜ng x có ˜Òc t¯ mÎt truy vßn và các £nh
liên quan cıa nó. Các i∫m sË y bi∫u diπn Î liên quan cıa các £nh Ëi vÓi truy
vßn. Hàm x∏p h§ng toàn cˆc F(·), trong th¸c t∏ có th∫ là mÎt hàm x∏p h§ng cˆc
bÎ f (·). SË vector ∞c tr˜ng trong x kh£ n´ng rßt lÓn, th™m chí không giÓi h§n.
S¸ ánh giá (hàm lÈi) chø t™p trung vào top k các k∏t qu£. ∫ c£i thiªn hiªu
45. 31
˜Òc giÓi thiªu bi Freund và Schapire [30] d®n ∏n các bi∏n th∫ boosting phÍ bi∏n
hiªn nay và ã tr thành mÎt trong nh˙ng thu™t toán hÂc m§nh. Trong quá trình
hÂc, gi˙ phân bË trÂng sË Dl (i) trên các m®u hußn luyªn. Theo phân bË này, t§i
mÈi l¶n l∞p boosting s≥ l¸a chÂn bÎ hÂc y∏u và ˜a thêm vào mô hình. Sau mÈi
l¶n l∞p l, m®u ˜Òc ánh l§i trÂng sË, d¸a vào mÎt hàm lÈi (loss function), (thí dˆ
e yF(x)
trong tr˜Ìng hÒp AdaBoost). Nh¨m t™p trung vào các m®u khó, b‰ qua
các m®u dπ. Gi£i thu™t AdaBoost là thu™t toán hÂc hiªu qu£ và phÍ bi∏n, do khá
dπ dàng cài ∞t, h¶u nh˜ không c¶n thi∏t tÓi tham sË hiªu chønh. Trên th¸c t∏ chø
có mÎt tham sË là sË tËi a L l¶n l∞p. Viªc thi∏t l™p tham sË rßt quan trÂng bi
vì thu™t toán có th∫ có xu h˜Óng overfit (quá khÓp) n∏u thi∏t l™p L lÓn.
Kˇ thu™t máy vector hÈ trÒ (SVM)
Các kˇ thu™t hÂc máy và ph£n hÁi liên quan ˜Òc ∑ xußt nh¨m hiªu chønh
khái niªm truy vßn. H¶u h∏t các kˇ thu™t truy∑n thËng òi h‰i mÎt sË l˜Òng lÓn
m®u hußn luyªn [68], [125] và truy vßn khi t§o vÓi các m®u tËt [47], [83], [113].
Trong nhi∑u tình huËng ˘ng dˆng th¸c t∏, các thu™t toán hÂc có th∫ làm viªc ngay
c£ khi nghèo d˙ liªu hußn luyªn và h§n ch∏ thÌi gian hußn luyªn.
∫ gi£m sË l˜Òng m®u yêu c¶u, các nghiên c˘u quan tâm ∏n các kˇ thu™t
hÂc tích c¸c. MÎt trong nh˙ng ph˜Ïng pháp nh˜ v™y là SVM, d¸a vào ph£n hÁi
liên quan [15], [18], [33],[93], [101], [120] khi phân lÓp. HÂc tích c¸c có th∫ ˜Òc
mô hình hoá nh˜ sau : Cho mÎt cÏ s d˙ liªu E ch˘a mÎt t™p con các ch˜a gán
nhãn U và mÎt t™p con X ã gán nhãn. Ph˜Ïng pháp hÂc gÁm hai thành ph¶n
f và s. Thành ph¶n f là mÎt phân lÓp ˜Òc hußn luyªn trên t™p d˙ liªu ã gán
nhãn X . Thành ph¶n s là hàm lßy m®u ˜a ra mÎt t™p gán nhãn hiªn thÌi X ,
quy∏t ‡nh l¸a chÂn t™p con u 2 U chÂn cho truy vßn ng˜Ìi dùng. Cách hÂc tích
c¸c này ˜a ∏n mÎt f mÓi, sau mÈi l¶n l∞p cıa ph£n hÁi liên quan.
Kˇ thu™t này có th∫ mô t£ sau ây : T™p d˙ liªu ¶u vào/ ¶u ra X , Y , t™p
hußn luyªn (x1, y1), (x2, y2), . . . , (xm, ym). Mˆc ích muËn hÂc mÎt hàm phân lÓp
46. 32
y = f (x, ) trong ó là các trÂng sË c¶n hußn luyªn, minh ho§ nh˜ vector 1.9.
Ví dˆ, chÂn mô hình t¯ t™p các siêu phØng, hàm phân lÓp s≥ có d§ng :
Hình 1.9. Minh ho§ siêu phØng
f (x, w, b) = sign(wx + b) (1.20)
Tiêu chí cıa SVM là chÂn siêu phØng sao cho l∑ là c¸c §i và tËi thi∫u hóa lÈi,
d®n tÓi ˜a v∑ viªc gi£i bài toán tËi ˜u b™c 2 (Quadratic). ¶u ra cıa bài toán
tËi ˜u là w và b, trong ó w có d§ng nh˜ sau :
w =
mX
i=1
↵i xi (1.21)
VÓi tiêu chí l∑ c¸c §i, các ↵ ˜Òc gi£i ra s≥ có rßt ít giá tr‡ khác 0. Các m®u
d˙ liªu trong t™p hußn luyªn X t˜Ïng ˘ng vÓi ↵i khác 0 ˜Òc gÂi là vector t¸a
(Support vector)
SVM ph‰ng oán k∏t qu£ tra c˘u theo các m®u hußn luyªn. D¸a vào k∏t qu£
tra c˘u, ng˜Ìi dùng l¸a chÂn các £nh liên quan và các £nh không liên quan. Các
£nh liên quan t§o thành t™p m®u d˜Ïng và các £nh không liên quan t§o thành
t™p m®u âm. Sau khi hÂc t™p m®u hußn luyªn, b¨ng cách s˚ dˆng SVM, bÎ phân
lÓp SVM f (x) s≥ d¶n i∑u chønh theo mˆc ích tra c˘u cıa ng˜Ìi dùng. MÈi £nh
Ii trong cÏ s d˙ liªu, i∫m sË ˜Òc tính toán theo score(Ii ) = f (xi ), ây chính
48. 34
Ti∏p c™n Pareto có th∫ thßy trong nhi∑u nghiên c˘u liên quan tÓi cÏ s d˙
liªu [13], [82] ho∞c m§ng [24]. Trong [77] ∑ xußt mÎt kˇ thu™t s˚ dˆng tính tËi ˜u
Pareto ∫ th¸c hiªn mÎt quá trình sÏ lÂc, lo§i b‰ các Ëi t˜Òng ít §i diªn t¯ quá
trình l¸a chÂn k-láng ri∑ng trong khi v®n gi˙ l§i nh˙ng Ëi t˜Òng tri∫n vÂng nhßt.
Nghiên c˘u này lßy các k∏t qu£ cıa mÎt truy vßn gÁm tßt c£ các i∫m Pareto. T™p
Pareto bao phı không gian các Ëi t˜Òng liên quan vÓi truy vßn hÏn các ph˜Ïng
pháp s˚ dˆng k∏t hÒp Î o kho£ng cách. Trong [1] ánh giá theo cách khác nhau
∫ k∏t hÒp hai ph˜Ïng pháp ph£n hÁi liên quan ã có, nhßn m§nh s¸ bßt bình
Øng trong kh£o sát và s¸ khai thác trong tình huËng các ph˜Ïng pháp d¸a vào
kho£ng cách.
Nghiên c˘u g¶n ây s˚ dˆng ti∏p c™n Pareto trong CBIR cıa Hsiao và cÎng
s¸ [43]. Quá trình hÂc tr˜Óc t¯ cÏ s d˙ liªu ∞c tr˜ng (SIFT, l˜Òc Á h˜Óng
các gradient (HoG)) b¨ng thu™t toán EMR [115] ˜Òc th¸c hiªn. Ti∏p c™n Pareto
˜Òc s˚ dˆng nh˜ bài toán a mˆc tiêu ∫ so sánh lßy ra các k∏t qu£ cuËi cùng
t¯ k∏t hÒp các x∏p h§ng cıa nhi∑u truy vßn, l¸a chÂn lßy ra các i∫m Pareto l¶n
l˜Òt t¯ng front (không có thu™t toán lßy Pareto front a m˘c sâu).
Các ˜u i∫m cıa ti∏p c™n Pareto ch˜a ˜Òc nghiên c˘u rÎng rãi trong CBIR.
Ti∏p c™n tËi ˜u Pareto có th∫ thu gÂn t™p ˘ng viên trên không gian a ∞c tr˜ng,
nh˜ rút gÂn không gian tìm ki∏m ∫ c£i thiªn k∏t qu£ tra c˘u v∑ m∞t Î chính xác
cıa hª thËng CBIR s≥ ˜Òc ∑ xußt trong Ch˜Ïng 2. Quá trình t˜Ïng tác gi˙a hª
thËng và ng˜Ìi dùng giúp l¸a chÂn các i∫m liên quan trong khi ph˜Ïng pháp d¸a
vào Pareto lßy tßt c£ các Pareto front nh˙ng i∫m nhi∑u m˘c sâu d®n tÓi kích
th˜Óc không gian tìm ki∏m lÓn. ∑ xußt trên thuÎc công trình nghiên c˘u [CT7].
1.9 Ph˜Ïng pháp ánh giá hiªu n´ng trong CBIR
ánh giá hiªu n´ng là công viªc rßt quan trÂng, cho phép ∫ ánh giá m˘c
Î hiªu qu£ §t ˜Òc cıa các kˇ thu™t ∫ có nh˙ng c£i ti∏n. M¨uller-Henning và