SlideShare a Scribd company logo
1 of 26
Nhận viết đề tài trọn gói – ZL: 0909 23 26 20–
Luanvanmaster.com
TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26
20
BỘ GIÁO DỤC VÀ ĐÀO TẠO
ĐẠI HỌC ĐÀ NẴNG
NGUYỄN VŨ TÙNG DƯỠNG
XÂY DỰNG VÀ ĐÁNH GIÁ
HỆ THỐNG TÌM KIẾM THÔNG TIN
Chuyên ngành: Khoa học máy tính
Mã số: 60.48.01.01
TÓM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT
Đà Nẵng - Năm 2016
Nhận viết đề tài trọn gói – ZL: 0909 23 26 20–
Luanvanmaster.com
TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20
Công trình được hoàn thành tại
ĐẠI HỌC ĐÀ NẴNG
Người hướng dẫn khoa học: PGS.TS. Võ Trung Hùng
Phản biện 1: TS. Huỳnh Công Pháp
Phản biện 2: TS. Lê Xuân Việt
Luận văn sẽ được bảo vệ tại Hội đồng chấm Luận văn tốt
nghiệp thạc sĩ kỹ thuật họp tại Đại học Đà Nẵng vào ngày 25
tháng 07 năm 2016
Có thể tìm hiểu luận văn tại:
Trung tâm Thông tin-Học liệu, Đại học Đà Nẵng
Nhận viết đề tài trọn gói – ZL: 0909 23 26 20–
Luanvanmaster.com
TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20
1
MỞ ĐẦU
1. Tính cấp thiết của đề tài
Cùng với sự phát triển chung của xã hội đặc biệt là công nghệ
thông tin, nhu cầu học tập của con người càng được nâng cao do đó
nhu cầu tìm kiếm thông tin là rất lớn và ngày càng tăng. Tuy nhiên,
một thực trạng mà chúng ta cần phải đề cập đến ở đây là: Thứ nhất,
có quá nhiều công cụ tìm kiếm dẫn đến sự khó khăn khi lựa chọn.
Thứ hai, thông tin tìm kiếm được là không hoặc chưa được phù hợp
với yêu cầu của người dùng. Thứ ba, các công cụ tìm kiếm không có
mã nguồn mở nên rất khó cho việc ứng dụng… Một trong những lý
do quan trọng nhất dẫn đến những hạn chế trên đó chính là chất
lượng và khả năng ứng dụng của các phần mềm tìm kiếm. Giải pháp
nào giúp chúng ta có thể giải quyết được những vấn đề trên để cho
người dùng có được một sự lựa chọn phù hợp và đáng tin cậy khi tìm
kiếm thông tin và có thể ứng dụng nó cho công việc của chính mình?
Một trong những giải pháp đó chính là chúng ta cần tập trung nghiên
cứu các vấn đề liên quan đến tìm kiếm thông tin, đánh giá hệ thống
tìm kiếm thông tin. Phát triển các công cụ nhằm xây dựng các ứng
dụng tìm kiếm và đánh giá chất lượng của hệ thống tìm kiếm.
Do đó việc xây dựng một công cụ để tìm kiếm và đánh giá chất
lượng tìm kiếm là phù hợp trong bối cảnh hiện nay. Vì vậy tôi đã
quyết định chọn đề tài "Xây dựng và đánh giá hệ thống tìm kiếm
thông tin" làm đề tài tốt nghiệp luận văn cao học.
2. Mục tiêu nghiên cứu
 Mục tiêu chung: Là xây dựng và đánh giá chất lượng hệ
thống tìm kiếm thông tin.

 Mục tiêu cụ thể của đề tài
- Phân tích, chuẩn hóa tài liệu, lập chỉ mục tài liệu và tìm kiếm
Nhận viết đề tài trọn gói – ZL: 0909 23 26 20–
Luanvanmaster.com
TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20
2
của phần mềm mã nguồn mở Lucene.
- Xây dựng các mô-đun tương tác và kết hợp với Lucene để
nhằm mục đích tìm kiếm thông tin và đánh giá kết quả tìm kiếm.
3. Đối tượng và phạm vi nghiên cứu
 Đối tượng nghiên cứu
Cơ sở lý thuyết tìm kiếm thông tin, phương phương pháp lập
chỉ mục, ngôn ngữ lập trình C#, công cụ tìm kiếm (thư viện mã
nguồn mở Lucene), các phương pháp đánh giá hệ thống tìm kiếm
thông tin (các độ đo, cách đánh giá).
 Phạm vi nghiên cứu
- Phương pháp thu thập, chuẩn hóa lập chỉ mục tập tài liệu và
các phương pháp đánh giá một hệ thống tìm kiếm, ngôn ngữ C#.
- Bộ tài liệu tiếng Việt khoảng 255 tài liệu.
4. Phương pháp nghiên cứu
Tôi sử dụng hai phương pháp chính là phương pháp nghiên
cứu tài liệu, phương pháp điều tra và phương pháp thử nghiệm.
5. Bố cục đề tài
CHƯƠNG 1. NGHIÊN CỨU TỔNG QUAN.
CHƯƠNG 2. GIẢI PHÁP XÂY DỰNG HỆ THỐNG .
CHƯƠNG 3. TRIỂN KHAI THỰC NGHIỆM.
6. Tổng quan tài liệu nghiên cứu
Trong quá trình nghiên cứu, thực hiện đề tài, tôi nhận thấy có
một số hướng nghiên cứu chính là các kết quả công bố như sau:
- Các bài báo về các lĩnh vực liên quan về xử lý văn bản; tìm
kiếm và truy xuất thông tin.
- Nguồn tài liệu từ các luận văn thạc sĩ về các lĩnh vực liên
quan như hệ thống tìm kiếm thông tin; đánh giá hệ thống tìm kiếm và
truy xuất thông tin; thuật toán tìm kiếm và truy xuất thông tin.
Nhận viết đề tài trọn gói – ZL: 0909 23 26 20–
Luanvanmaster.com
TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20
3
CHƯƠNG 1
NGHIÊN CỨU TỔNG QUAN
1.1. TỔNG QUAN VỀ HỆ THỐNG TÌM KIẾM THÔNG TIN
1.1.1. Giới thiệu về tìm kiếm thông tin
a. Khái niệm
Tìm kiếm thông tin (Information Retrieval - IR) là tìm kiếm tài
nguyên (thường là các tài liệu - documents) trên một tập các dữ liệu
phi cấu trúc (thường là văn bản dạng text) được lưu trữ trên máy tính
nhằm thỏa mãn nhu cầu về thông tin.
b. Nguyên tắc hoạt động
Nguyên tắc hoạt động cơ bản của hệ thống tìm kiếm thông tin
là so khớp nhu cầu thông tin của người sử dụng với các tài liệu được
lưu trữ trong cơ sở dữ liệu của hệ thống.
Hình 1.1. Mô hình hoạt động của hệ thống tìm kiếm thông tin
Nhận viết đề tài trọn gói – ZL: 0909 23 26 20–
Luanvanmaster.com
TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20
4
1.1.2. Một số mô hình tìm kiếm thông tin
Mục tiêu chính của các hệ tìm kiếm thông tin là kết quả trả về
là các tài liệu càng liên quan đến câu hỏi truy vấn càng tốt. Vì thế
người ta đã nghiên cứu và đưa ra rất nhiều mô hình tìm kiếm nhằm
tính toán một cách chính xác độ tương quan này.
Một số mô hình tìm kiếm cơ bản: Mô hình tìm kiếm boolean,
mô hình tìm kiếm boolean mở rộng, mô hình không gian vector, mô
hình xác suất.
1.1.3. Một số công cụ đang được áp dụng
a. Công cụ tìm kiếm trên mạng internet
 Giới thiệu về tìm kiếm trên mạng internet
Máy truy tìm hay máy tìm kiếm (search engine), hay còn được
gọi với nghĩa rộng hơn là công cụ tìm kiếm (search tool), nguyên
thuỷ là một phần mềm nhằm tìm ra các trang trên mạng Internet có
nội dung theo yêu cầu người dùng dựa vào các thông tin mà chúng
có. Trữ lượng thông tin này của công cụ tìm kiếm thực chất là một
loại cơ sở dữ liệu (database) cực lớn. Việc tìm các tài liệu sẽ dựa trên
các từ khóa (keyword) được người dùng gõ vào và trả về một danh
mục của các trang WEB có chứa từ khóa mà nó tìm được.
 Một số công cụ đang được áp dụng

- GOOGLE (http://www.google.com).
- BING (http://www.bing.com).
- BAIDU (http://www.baidu.com).
b. Công cụ tìm kiếm trên máy tính cá nhân
 Giới thiệu về tìm kiếm trên máy tính cá nhân
Công cụ tìm kiếm trên máy tính cá nhân hay Desktop Search là
một phần mềm dùng để tìm kiếm nội dung của tệp tin dữ liệu trên
máy tính cá nhân, nó hoạt động nhanh hơn tìm kiếm trên WEB. Các
Nhận viết đề tài trọn gói – ZL: 0909 23 26 20–
Luanvanmaster.com
TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20
5
công cụ này được thiết kế để tìm kiếm thông tin trên máy tính của
người sử dụng như e-mail, văn bản, âm thanh hoặc phim ảnh…
 Một số công cụ đang áp dụng

- Windows Desktop Search.
- Google Desktop.
1.2. TỔNG QUAN VỀ ĐÁNH GIÁ KẾT QUẢ TÌM KIẾM
1.2.1. Giới thiệu
Khi nhu cầu tìm kiếm thông tin phát triển, có rất nhiều mô
hình, thuật toán, hệ thống truy xuất thông tin ra đời. Do đó, việc đánh
giá các mô hình, thuật toán, hệ thống truy xuất thông tin là điều bắt
buộc phải làm.
Mục tiêu của việc so sánh các phương pháp là để khẳng định
được phương pháp này là thực sự tốt hơn (chứ không phải là tốt hơn
do ngẫu nhiên) phương pháp kia trong việc đạt được mục đích dự
định của nó. Không có đánh giá, rất khó để có thể biết được phương
pháp nào tốt hơn. Tuy nhiên, để làm được điều này cần có một có
một nền tảng về phương pháp đánh giá được xây dựng tốt và đáng tin
cậy.
1.2.2. Đánh giá hệ thống tìm kiếm thông tin
 Các tiêu chuẩn được dùng để đánh giá
Có 3 tiêu chuẩn dùng để đánh giá hệ thống tìm kiếm thông tin:
- Tiêu chuẩn về tính hiệu quả: Tức là sự chính xác, tính đầy đủ
của kết quả trả về so với mục đích tìm kiếm của người sử dụng.
- Tiêu chuẩn về tính hiệu năng: Gồm có tốc độ tìm kiếm của
thuật toán, khả năng lưu trữ, thời gian trả về cho con người sử dụng,
thời gian lập chỉ mục, kích thước chỉ mục…
- Tiêu chuẩn về khả năng sử dụng hệ thống: Tức là có thể
nghiên cứu, học hỏi trên hệ thống tìm kiếm, người không biết tin học
Nhận viết đề tài trọn gói – ZL: 0909 23 26 20–
Luanvanmaster.com
TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20
6
hay các chuyên gia tin học đều có thể sử dụng hệ thống.
 Các mô hình đánh giá
Có 4 mô hình thường được dùng để đánh giá:
- Đánh giá hộp trắng: Là đánh giá hệ thống dựa trên kết quả
việc đánh giá tất cả các thành phần của hệ thống.
- Đánh giá hộp đen: Đánh giá bằng cách xem hệ thống như là
một thực thể hợp nhất và tiến hành đánh giá chung cả hệ thống mà
không đánh giá chính xác các thành phần bên trong hệ thống.
- Đánh giá hướng hệ thống: Là hướng đánh giá dựa trên câu
truy vấn và mức độ liên quan của tài liệu trả về so với câu truy vấn.
- Đánh giá hướng người dùng (User Studies Evaluation): đánh
giá mức độ hài lòng của người sử dụng.
 Một số phương pháp đánh giá
- Phương pháp Cranfield.
- Phương pháp TREC.
1.2.3. Các độ đo
Có 2 độ đo thường được dùng trong đánh giá hệ thống tìm
kiếm thông tin đó là độ đo chính xác và độ đo bao phủ:
- Độ chính xác (precision): Là ước tính có bao nhiêu tài liệu
thật sự liên quan được tìm thấy:
 |{TËp tµi liÖu liªn quan} {TËp kÕt qu¶}|
§é chÝnh x¸c
|{TËp kÕt qu¶}|
- Độ bao phủ (Recall): Đo lường tính toàn diện của hệ thống:
 |{TËp tµi liÖu liªn quan} {TËp kÕt qu¶}|

§é bao phñ
|{TËp tµi liÖu liªn quan}|
Theo các công thức tính toán trên ta có thể thấy rằng việc tính
các độ đo là không hề đơn gian, vì việc kiểm tra tài liệu có liên quan
Nhận viết đề tài trọn gói – ZL: 0909 23 26 20–
Luanvanmaster.com
TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20
7
hay không có liên quan đến yêu cầu truy vấn thì chúng ta cần phải
tiến hành kiểm tra thủ công và sẽ rất tốn kém nếu thực hiện trên một
bộ dữ liệu lớn.
1.2.4. Phương pháp tính độ chính xác
Có nhiều phương pháp sử dụng các độ đo để tính toán đánh giá
một hệ thống tìm kiếm thông tin. Phương pháp độ chính xác trung
bình (Chỉ sử dụng độ chính xác không quan tâm đến độ bao phủ)
phương pháp đó dựa trên giá trị đơn Swet's E-measure hoặc chiều dài
tìm kiếm trung bình thì cũng chỉ sử dụng một giá trị để tính toán.
Phương pháp tính độ chính xác dựa trên 11 điểm chuẩn của độ bao
phủ sử dụng cả hai độ đo độ bao phủ và độ chính xác.
1.3. MỘT SỐ MÃ NGUỒN MỞ VỀ TÌM KIẾM THÔNG TIN
1.3.1. Giới thiệu về Lucene
1.3.2. Giới thiệu về Solr
1.3.3. Giới thiệu về Sphinx
1.4. TIỂU KẾT CHƯƠNG
Chương này tôi đã nghiên cứu tổng quan về hệ thống tìm kiếm
thông tin như: Giới thiệu về tìm kiếm thông tin, một số mô hình tìm
kiếm và công cụ tìm kiếm đang được áp dụng hiện nay. Nghiên cứu
tổng quan về đánh giá kết quả tìm kiếm như: Giới thiệu, đánh giá hệ
thống tìm kiếm, các độ đo và phương pháp đánh giá hệ thống tìm
kiếm. Nghiên cứu tổng quan về một số thư viện mã nguồn mở trong
tìm kiếm thông tin như thư viện mã nguồn mở Lucene, Solr hay
Sphinx.
Nhận viết đề tài trọn gói – ZL: 0909 23 26 20–
Luanvanmaster.com
TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20
8
CHƯƠNG 2
GIẢI PHÁP XÂY DỰNG CÔNG CỤ
2.1. GIỚI THIỆU
2.2. MÔ HÌNH HỆ THỐNG
Trong mô hình đề xuất này, xây dựng hai giai đoạn chính là
giai đoạn xây dựng hệ thống tìm kiếm và giai đoạn xây dựng hệ
thống đánh giá. Trong giai đoạn xây dựng hệ thống tìm kiếm gồm có
các thành phần cơ bản sau: Bộ sưu tập tài liệu, thư viện mã nguồn mở
Lucene, tập tài liệu sau khi đánh chỉ mục, giao diện yêu cầu tìm
kiếm.
Hình 2.1. Mô hình tìm kiếm và đánh giá tìm kiếm
Nhận viết đề tài trọn gói – ZL: 0909 23 26 20–
Luanvanmaster.com
TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20
9
Trong giai đoạn đánh giá hệ thống tìm kiếm gồm có: Giao diện
yêu cầu tìm kiếm, tập các câu truy vấn, tập tài liệu kết quả (sau khi
tìm kiếm), tập tài liệu đánh giá, mô-đun đánh giá và kết quả thu được.
2.3. GIẢI PHÁP
2.3.1. Giải pháp đánh chỉ mục
 Mục đích: Đánh chỉ mục các tập tin văn bản dùng để phục
vụ cho việc tìm kiếm và đánh giá.

 Đầu vào: Tập tài liệu văn bản.

 Đầu ra: Tập tài liệu đã được đánh chỉ mục.

 Xử lý:
Tiến trình lập chỉ mục là một tiến trình gồm nhiều thao tác
phức tạp, có thể tóm gọn gồm 3 nhóm thao tác chính:
- Rút trích tài liệu.
- Phân tích tài liệu được rút trích.
- Lưu vào tập chỉ mục.
Giải pháp như sau:
Hình 2.2. Tạo chỉ mục các tập tài liệu văn bản đầu vào
Nhận viết đề tài trọn gói – ZL: 0909 23 26 20–
Luanvanmaster.com
TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20
10
2.3.2. Giải pháp tìm kiếm
 Mục đích: Truy vấn thông tin để tìm kiếm ra những tài liệu
liên quan.

 Đầu vào: Câu truy vấn.

 Đầu ra: Tập các tài liệu liên quan.

 Xử lý:
- Nhập câu truy vấn.
- Chọn trường thông tin.
- Biên dịch câu truy vấn.
- Tìm kiếm.
Hình 2.3. Tìm kiếm tài liệu dựa trên câu hỏi truy vấn
2.3.3. Giải pháp đánh giá
 Mục đích: Đánh giá kết quả tìm kiếm.

 Đầu vào: Kết quả các tài liệu liên quan đã được tìm kiếm

 Đầu ra: Kết quả đánh giá.

 Xử lý:
- Khi có tập tài liệu kết quả, tiến hành đánh giá hệ thống dựa
trên tập tài liệu đánh giá thông qua các độ đo (độ chính xác, độ bao
phủ).
+ Độ chính xác ở thứ hạng k (P(k)): Giả sử
Nhận viết đề tài trọn gói – ZL: 0909 23 26 20–
Luanvanmaster.com
TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20
11
Retrieved(k) là tập gồm k tài liệu đầu mà hệ thống tìm được. Độ
chính xác ở hạng k (P(k)) có thể được định nghĩa như sau:
Relevent  retrieved(k) 
P(k) = 
k
 
 
+ Độ chính xác trung bình: Là một độ đo kết hợp độ
chính xác ở các mức bao phủ và được tính bởi công thức sau:
MAP 
1
Relevant
Retrieved
 Rel(i).P(i)
k 1
Hình 2.4. Đánh giá kết quả tìm kiếm dựa trên tập tài liệu đánh giá
2.4. CÁC TIẾN TRÌNH HOẠT ĐỘNG CỦA LUCENE
2.4.1. Xây dựng tập chỉ mục tìm kiếm: gồm các phần sau:
 Cách mô hình hóa nội dung văn bản với Lucene

 Các thủ tục cơ bản trên tập chỉ mục: Thêm tài liệu vào tập
chỉ mục, xóa tài liệu từ tập chỉ mục, cập nhập tài liệu trong tập chỉ
mục.

 Các thủ tục cơ bản trên tập chỉ mục
Có nhiều phương pháp để biểu diễn tài liệu và một phương
pháp tự động cơ bản được thực hiện theo các bước:
- Bước 1: Tách từ - Tokenization.
Nhận viết đề tài trọn gói – ZL: 0909 23 26 20–
Luanvanmaster.com
TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20
12
- Bước 2: Loại bỏ từ thông dụng – stop word.
- Bước 3: Qui về từ gốc – stemming.
- Bước 4: Đánh trọng số cho từ chỉ mục – term weighting.
 Các tuỳ chọn cho Field: Lựa chọn cho chỉ mục, các tùy
chọn cho lưu trữ, tùy chọn cho Vector mục từ, sự kết hợp các tùy
chọn.

 Thiết lập mức độ quan trọng cho các tài liệu và các trường
Không phải tất cả các tài liệu và các trường được tạo ra đều có
mức độ quan trọng như nhau. Nâng cao mức độ quan trọng cho
chúng có thể được thực hiện trong suốt tiến trình lập chỉ mục hoặc
tiến trình tìm kiếm.
 Cắt giảm trường thông tin (Field truncation)
Khi lập chỉ mục cho các tài liệu có kích thước chưa xác định,
để đảm bảo cung cấp đủ bộ nhớ RAM cũng như dung lượng đĩa cứng
cần thiết, thư viện Lucene cho phép giới hạn số mục từ cần được lập
chỉ mục trên các trường tương ứng.
 Tối ưu hóa tập chỉ mục
Khi tạo chỉ mục cho nhiều tài liệu, sẽ có rất nhiều segment
được tạo ra. Lúc tìm kiếm hệ thống sẽ thực hiện tìm qua tất cả các
segment này và kết hợp kết quả lại. Để giảm thiểu số lượng segment
và tiết kiệm bộ nhớ, Lucene hỗ trợ phương thức cho phép hợp các
segment lại chỉ còn một vài segment, vừa đơn giản, tiết kiệm bộ nhớ
vừa tìm kiếm nhanh hơn.
2.4.2. Tìm kiếm trên tập chỉ mục
Mục đích của hệ thống tìm kiếm là phải trả về kết quả chính
xác trong thời gian nhanh nhất. Khả năng của Lucene có thể trả về
hàng trăm, hàng nghìn và có thể hàng triệu tài liệu liên quan chỉ trong
thời gian ngắn với các phương thức đơn giản. Một số lớp chính sử
Nhận viết đề tài trọn gói – ZL: 0909 23 26 20–
Luanvanmaster.com
TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20
13
dụng cho tìm kiếm bao gồm: IndexSearcher, Query, QueryParser,
TopDocs, ScoreDoc.
 Phân tích truy vấn: QueryParse
QueryParser của Lucene là lớp đối tượng chính được sử dụng để tạo
ra câu truy vấn từ nội dung tìm kiếm của người sử dụng.
 Tìm kiếm với đối tượng IndexSearcher
Toàn bộ quá trình tìm kiếm được thực hiện dựa trên một số lớp đối
tượng chính như IndexSearcher, IndexReader, TopDocs… Và mối
quan hệ giữa chúng được minh họa trong sơ đồ bên:
Query

IndexSearcher

TopDos
IndexSearcher

Index
 Danh sách kết quả: TopDocs
Khi gọi tìm kiếm với phương thức search (Query, n) sẽ nhận
được kết quả trả về trong TopDocs, đối tượng này chứa danh sách n
các mã tài liệu được xếp thứ tự theo mức độ liên quan.
 Công thức tính điểm số của Lucene
Lucene sử dụng công thức tính điểm số tương đồng bên dưới
để xác định độ tương đồng giữa câu truy vấn q của người sử dụng với
mỗi tài liệu d có trong kho dữ liệu tìm kiếm dựa trên sự so khớp với
mỗi mục từ t trong câu truy vấn.
 tinq (tf(tind)xidf(t2
)xboost(t.fieldind)x
lengthNorm(t.fieldind))xcood(q,d)xqueryNorm(q)
 Các loại truy vấn Lucene hỗ trợ: Tìm kiếm theo mục từ:
TermQuery, Tìm kiếm theo phạm vi: RangeQuery, Tìm kiếm trên
chuỗi ký tự: PrefixQuery, Tìm kiếm với toán tử logic: BooleanQuery,
Tìm kiếm với ký tự thay thế: WildcardQuery, Tìm kiếm theo cụm từ:
PharseQuery, Tìm kiếm mục từ tương tự: FuzzyQuery, Lấy tất cả tài
Nhận viết đề tài trọn gói – ZL: 0909 23 26 20–
Luanvanmaster.com
TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20
14
liệu: MatchAllDocsQuery.
2.4.3. Tiến trình phân tích của Lucene
Các bước Lucene thường sử dụng để phân tích như:
 Sử dụng trình phân tích: dùng khi chuyển văn bản sang

mục từ.

 Từ vựng - Token: Analyzer là lớp cơ sở, nó thực hiện
chuyển dữ liệu văn bản sang một dòng các từ vựng (Token) trong lớp
TokenStream.

 Loại bỏ các từ thường dùng - Stopword: StopAnalyzer thực
hiện loại bỏ một số từ đặc biệt gọi là các stop word.

 Chuẩn hoá từ - Stemming: Tiến trình xử lý cuối cùng là
loại bỏ các hình thái khác nhau của từ để đưa nó về dạng gốc.

 Phân tích ngôn ngữ: Chúng ta phải giải quyết nhiều vấn đề
khi phân tích các văn bản với những ngôn ngữ khác nhau.

2.5. THU THẬP BỘ TÀI LIỆU

Hệ thống tìm kiếm sử dụng nguồn tài liệu có sẵn từ hệ thống
lưu trữ của cá nhân và cơ quan nhờ quá trình sưu tầm được trong vài
năm trở lại đây. Nguồn dữ liệu này được lưu trữ dưới nhiều hình thức
file như doc, docx, xls, xlsx, ppt, pptx, pdf...

2.6. TIỂU KẾT CHƯƠNG

Chương này tôi đã nghiên cứu và đề xuất mô hình tìm kiếm và

đánh giá hệ thống tìm kiếm thông tin. Trong mô hình, tôi đã đề xuất
trình bày từng giai đoạn gồm đánh chỉ mục cho tài liệu, giai đoạn tìm
kiếm tài liệu và sau đó là giai đoạn đánh giá hệ thống tìm kiếm thông
qua tập tài liệu đánh giá. Trong mỗi giai đoạn tôi đều đưa ra mô hình
đề xuất và cách xử lý. Ngoài ra việc phân tích các tiến trình của
Lucene, thu thập bộ tài liệu cũng là những giải pháp để xây dựng
hoàn thiện hệ thống.
Nhận viết đề tài trọn gói – ZL: 0909 23 26 20–
Luanvanmaster.com
TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20
15
CHƯƠNG 3
TRIỂN KHAI THỰC NGIỆM
3.1. CÔNG CỤ THỰC NGHIỆM
3.1.1. Ngôn ngữ lập trình
Công cụ được sử dụng để xây dựng ứng dụng thử nghiệm của
luận văn là ngôn ngữ lập trình Microsoft Visual C#.
C# là một ngôn ngữ lập trình hướng đối tượng được phát triển
bởi Microsoft, là phần khởi đầu cho kế hoạch .NET của họ. Tên của
ngôn ngữ bao gồm kí tự thăng theo Microsoft nhưng theo ECMA là
#, chỉ bao gồm dấu số thường. Microsoft phát triển C# dựa trên C++
và Java. C# được miêu tả là ngôn ngữ có được sự cân bằng giữa C++,
Visual Basic, Delphi và Java.
3.1.2. Mã nguồn Lucene
a. Tải mã nguồn lucene: Người dùng ở khắp nơi có thể truy
cập tại địa chỉ http://lucene.apache.org để tìm hiểu cũng như tải về
mã nguồn các phiên bản của Lucene.
b. Các thành phần của Lucene.NET: Các thành phần chính
của Lucene được ứng dụng trong hệ thống: Lucene.Net.Documents,
Lucene.Net.Analysis, Lucene.Net.Analysis, Lucene.Net.Index,
Lucene.Net.Store, Lucene.Net.QueryParsers, Ngoài ra, một số thành
phần có chức năng bổ trợ cho Lucene như Lucene.Net.Util,
Lucene.Net.Util.Cache… Sẽ thực hiện các thao tác chuyển đổi, ghi
nhớ cho truy cập nhanh hay chứa các thông số cho quá trình tạo chỉ
mục cũng như tìm kiếm.
c. Các thành phần kế thừa và phát triển mới:
VietnameseAnayzer, VietnameseStemFilter,
AutoGetFont, AutoConvert, ExtractFile.
Nhận viết đề tài trọn gói – ZL: 0909 23 26 20–
Luanvanmaster.com
TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20
16
3.2. CÁC MÔ-ĐUN HỆ THỐNG
3.2.1. Mô-đun tạo chỉ mục
Trong mô-đun này, cho phép người sử dụng thực hiện việc
đánh chỉ mục cho tập tài liệu, sử dụng các lớp đối tượng Directory,
Field, Document, Analyzer, TopDocs… Để tiến hành việc đánh chỉ
mục gồm các giai đoạn cơ bản như: Quá trình rút trích tài liệu, quá
trình phân tích tài liệu và quá trình lưu chỉ mục cho tập tài liệu.
Hình 3.4. Mô-đun tạo chỉ mục tài liệu
3.2.2. Mô-đun tìm kiếm
Trong mô-đun này, thực hiện việc tìm kiếm tài liệu dựa trên
các yêu cầu truy vấn của người dùng. Toàn bộ quá trình tìm kiếm
được thực hiện dựa trên một số lớp đối tượng như IndexSearcher,
IndexReader, TopDocs… Ngoài ra đoạn code đã mô tả được các đối
tượng mà Lucene sử dụng cho việc khai báo các đối tượng sử dụng
trong việc tìm kiếm, cuối cùng là quá trình tìm kiếm.
Nhận viết đề tài trọn gói – ZL: 0909 23 26 20–
Luanvanmaster.com
TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20
17
Hình 3.5. Mô-đun tìm kiếm tài
liệu 3.2.3. Mô-đun đánh giá
Trong mô-đun này, tiến hành việc đánh giá hệ thống tìm kiếm
dựa trên tập tài liệu kết quả thu được. Việc đánh giá dựa trên việc
tính độ chính xác của hệ thống ứng với các độ đo về độ liên quan.
Hình 3.6. Mô-đun đánh giá kết quả tìm kiếm
Nhận viết đề tài trọn gói – ZL: 0909 23 26 20–
Luanvanmaster.com
TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26
20
18
3.3. THỬ NGHIỆM
Giao diện dùng để tìm kiếm và tính toán các độ đo cho việc
đánh giá kết quả tìm kiếm.
Hình 3.15. Kết quả tìm kiếm
Hình 3.16. Kết quả đánh giá
Nhận viết đề tài trọn gói – ZL: 0909 23 26 20–
Luanvanmaster.com
TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20
19
3.4. KẾT QUẢ VÀ ĐÁNH GIÁ
 Thử nghiệm
Tiến hành thử nghiệm như sau: Tìm kiếm các câu truy vấn
khác nhau với tổng số tài liệu liên quan trả về là 5.
Tiến hành truy vấn lần lượt các câu truy vấn trên với tổng số
tài liệu liên quan trả về là 5 thì ta có bảng kết quả như sau:
Bảng 3.1. Bảng giá trị R, P tính với n tài liệu được trả về
Số tài liệu liên
Số tài liệu Độ bao Độ chính
N quan được trả
trả về phủ (R) xác (P)
về
1 1 1 1/5=0.2 1/1=1.00
2 2 2 2/5=0.4 2/2=1.00
3 2 3 2/5=0.4 2/3=0.67
4 3 4 3/5=0.6 3/4=0.75
5 3 5 3/5=0.6 3/5=0.60
6 4 6 4/5=0.8 4/6=0.67
7 4 7 4/5=0.8 4/7=0.57
8 4 8 4/5=0.8 4/8=0.50
9 4 9 4/5=0.8 4/9=0.44
10 4 10 4/5=0.8 4/10=0.40
11 4 11 4/5=0.8 4/11=0.36
12 4 12 4/5=0.8 4/12=0.33
13 5 13 4/5=0.8 5/13=0.38
14 5 14 5/5=1.0 5/14=0.36
- Sau khi lấy được độ chính xác ở thứ hạng k tài liệu đầu, tiến
hành lấy độ chính xác trung bình (Mean average precision – MAP)
để so sánh tổng hợp và đưa ra đánh giá ban đầu cho hệ thống.
Nhận viết đề tài trọn gói – ZL: 0909 23 26 20–
Luanvanmaster.com
TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20
20
Nhìn bảng giá trị trên, ta thấy tại giá trị R=0.6 có 2 giá trị P
(P=0.75 và P=0.6) và ngược lại tại giá trị P=1.0 có 2 giá trị R
(R=0.2, R=0.4).
Để xây dựng đường cong cho một câu truy vấn ta dùng phương
pháp tính nội suy độ chính xác dựa trên 11 điểm chuẩn của độ bao
phủ: Xét các giá trị R tại các điểm chuẩn 0.0, 0.1, 0.2, 0.3, 0.4, 0.5,
0.6, 0.7. 0.8, 0.9, 1.0.
Tại các vị trí tính giá trị P theo công thức sau:
PR(i) = max PR(j) với j>=i
Bảng 3.2. Bảng nội suy các giá trị P cho câu hỏi thứ k
Độ bao phủ Độ chính Độ bao phủ
Độ chính
N xác đã nội
(R) xác (P) chuẩn hóa
suy
1 1/5=0.2 1/1=1.00 hóa 1.00
2 2/5=0.4 2/2=1.00 0.1 1.00
3 2/5=0.4 2/3=0.67 0.2 1.00
4 3/5=0.6 3/4=0.75 0.3 1.00
5 4/5=0.8 3/5=0.60 0.4 1.00
6 4/5=0.8 4/6=0.67 0.5 0.75
7 4/5=0.8 4/7=0.57 0.6 0.75
8 4/5=0.8 4/8=0.50 0.7 0.67
9 4/5=0.8 4/9=0.44 0.8 0.67
10 4/5=0.8 4/10=0.40 0.9 0.38
11 4/5=0.8 4/11=0.36 1.0 0.38
12 4/5=0.8 4/12=0.33
13 5/5=1.0 5/13=0.38
14 5/5=1.0 5/14=0.36
Nhận viết đề tài trọn gói – ZL: 0909 23 26 20–
Luanvanmaster.com
TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20
21
Đồ thị RP cho câu hỏi thứ k
Hình 3.17. Đồ thị RP cho câu hỏi thứ k
 Kết luận:
Tiến hành thử nghiệm trên cùng một máy tính cá nhân cấu
hình: Intel (R) Core (TM) i3-4005U CPU, tốc độ xử lý 1.70GHz,
RAM 4.00 GB, Dung lượng ổ cứng 500 GB, bộ tài liệu thử nghiệm là
bộ tài liệu nhỏ và vừa với khoảng 255 tệp văn bản ta thu được kết quả
như sau:
Bảng 3.3. Bảng so sánh kết quả các công cụ tìm kiếm
Lucene WDS GD
Khả
- Các loại tệp - Các loại tệp - Các loại tệp
như: Văn bản, như: Văn bản, như: Văn bản,
năng tìm
hình ảnh... hình ảnh, âm hình ảnh, âm
kiếm
thanh, Web... thanh, Web...
- Không giới - Không giới - Có giới hạn số
Lập chỉ
hạn số lượng tài hạn số lượng tài lượng tài liệu
liệu lập chỉ mục. liệu lập chỉ mục. lâp chỉ mục là
mục
dưới 10.000 tài
liệu.
Nhận viết đề tài trọn gói – ZL: 0909 23 26 20–
Luanvanmaster.com
TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20
22
Lucene WDS GD
- Thời gian - Thời gian - Thời gian
Lập chỉ trung bình: ~ 1s/ trung bình: trung bình:
mục 1 tài liệu. ~1.2s/ 1 tài liệu. ~1.3s/ 1 tài liệu.
- Mức độ tìm - Mức độ tìm - Mức độ tìm kiếm: Tìm
kiếm kiếm: Tìm kiếm kiếm: Tìm kiếm
theo tên tệp, tiêu theo tên tệp, theo tên tệp,
đề, loại tệp, nội ngày lưu tệp, ngày lưu tệp,
dung... Ngoài ra chủ đề... Chủ chủ đề... Chủ
Lucene còn giới yếu là theo tên yếu theo tên tệp.
hạn về số lượng tệp.
và thời gian tìm
kiếm.
- Thời gian tìm - Thời gian tìm - Thời gian tìm
kiếm: Trung kiếm trung bình: kiếm trung bình:
Tìm kiếm bình ~0.05s/ 1 Trung bình ~ Trung bình ~
lần tìm kiếm. 0.1s/ 1 lần tìm 0.1s/ 1 lần tìm
kiếm. kiếm.
- Kết quả trả về: - Kết quả trả về: - Kết quả trả về: Kết
quả tài liệu Kết quả tài liệu Kết quả tài liệu liên quan
được liên quan được liên quan được
trả về so với câu trả về so với câu trả về so với câu
truy vấn tương truy vấn có độ truy vấn có độ
ứng có độ chính chính xác không chính xác không
xác ~78%. cao hoặc không cao hoặc không
tìm thấy kết quả. tìm thấy kết quả.
Nhận viết đề tài trọn gói – ZL: 0909 23 26 20–
Luanvanmaster.com
TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20
23
 Đánh giá
- Qua nghiên cứu này, đã thu được một số kết quả ban đầu làm
tiền đề quan trọng cho những nghiên cứu sau. Nghiên cứu đã xem lại
một cách có hệ thống việc tìm kiếm và đánh giá các hệ thống tìm
kiếm thông tin.
- Có thể tích hợp thư viện mã nguồn mở Lucene với nhiều
ngôn ngữ khác nhau nhằm phục vụ cho việc tìm kiếm và đánh giá hệ
thống tìm kiếm thông qua nhiều phương pháp khác nhau.
- Mô hình tìm kiếm này rất phù hợp cho việc tìm kiếm tài liệu
phục vụ cho công việc ở một cá nhân, gia đình hay một đơn vị cơ
quan được tổ chức khép kín (như các tổ chuyên môn trong một
trường học, các phòng ban nghành trong một cơ quan nhà nước...).
3.5. TIỂU KẾT CHƯƠNG
Trong chương này tôi đã đạt được các kết quả thử nghiệm như
sau: Sử dụng ngôn ngữ lập trình C# xây dựng được các demo thử
nghiệm cho việc lập chỉ mục, tìm kiếm tài liệu và tính các độ đo
nhằm phục vụ cho việc tổng hợp và đưa ra những kết quả đánh giá
cho hệ thống tìm kiếm thông tin.
Nhận viết đề tài trọn gói – ZL: 0909 23 26 20–
Luanvanmaster.com
TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20
24
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN
Qua thời gian nghiên cứu, thử nghiệm và ứng dụng, luận văn
đã đạt được một số kết quả:
- Bước đầu nghiên cứu, ứng dụng và khai thác công cụ để giải
quyết những khó khăn đang tồn tại trong lĩnh vực tìm kiếm.
- Bước đầu xây dựng thành công cơ bản một hệ thống tìm
kiếm và đánh giá hệ thống tìm kiếm phục vụ yêu cầu cấp thiết của
một cá nhân hoặc đơn vị.
- Mở ra hướng nghiên cứu ứng dựng trong lĩnh vực tìm kiếm
và đánh giá hệ thống tìm kiếm.
Dựa trên những kết quả thu được này xin đề xuất một số
hướng phát triển tiếp theo như sau:
- Việc so sánh các phương pháp trên cùng một tập dữ liệu
chuẩn, dùng chung là quan trọng để đánh giá một cách khách quan.
- Việc phân tích thống kê các kết quả thu được cũng rất quan
trọng để biết được phương pháp nào tốt hơn thực sự và đánh giá được
mức độ của sự khác biệt.
- Nghiên cứu chuyên sâu để có những cải tiến phù hợp cho mô
hình phát triển ứng dụng.
- Cách tiếp cận này nên được mở rộng ra các lĩnh vực khác của
khoa học máy tính.
- Cần nghiên cứu các kỹ thuật tinh chỉnh tham số và tối ưu các
phương pháp cho các lần nghiên cứu kế tiếp.
- Mong muốn được tiếp tục nghiên cứu và phát triển hệ thống.
Cần sự trợ giúp về nguồn thông tin, sự đóng góp của các nhà phát
triển trong lĩnh vực này để có thể góp phần làm nên hệ thống đủ
mạnh, có tính ứng dụng cao phục vụ cho nhu cầu của nhiều người sử
dụng.

More Related Content

Similar to Xây Dựng Và Đánh Giá Hệ Thống Tìm Kiếm Thông Tin.doc

Nghiên Cứu Xây Dựng Hệ Thống Đảm Bảo An Toàn Dữ Liệu Đào Tạo Tại Trường Đại H...
Nghiên Cứu Xây Dựng Hệ Thống Đảm Bảo An Toàn Dữ Liệu Đào Tạo Tại Trường Đại H...Nghiên Cứu Xây Dựng Hệ Thống Đảm Bảo An Toàn Dữ Liệu Đào Tạo Tại Trường Đại H...
Nghiên Cứu Xây Dựng Hệ Thống Đảm Bảo An Toàn Dữ Liệu Đào Tạo Tại Trường Đại H...Dịch vụ viết đề tài trọn gói 0934.573.149
 
Giáo trình phân tích thiết kế hệ thống thông tin
Giáo trình phân tích thiết kế hệ thống thông tinGiáo trình phân tích thiết kế hệ thống thông tin
Giáo trình phân tích thiết kế hệ thống thông tinVõ Phúc
 
Ứng Dụng Khai Phá Dữ Liệu Xây Dựng Hệ Thống Trợ Giúp Phòng, Chống Và Giảm Nhẹ...
Ứng Dụng Khai Phá Dữ Liệu Xây Dựng Hệ Thống Trợ Giúp Phòng, Chống Và Giảm Nhẹ...Ứng Dụng Khai Phá Dữ Liệu Xây Dựng Hệ Thống Trợ Giúp Phòng, Chống Và Giảm Nhẹ...
Ứng Dụng Khai Phá Dữ Liệu Xây Dựng Hệ Thống Trợ Giúp Phòng, Chống Và Giảm Nhẹ...Dịch vụ viết thuê Luận Văn - ZALO 0932091562
 
Luận Văn Ứng Dụng Khai Thác Mẫu Chuỗi Để Khai Thác Hành Vi Sử Dụng Web.doc
Luận Văn Ứng Dụng Khai Thác Mẫu Chuỗi Để Khai Thác Hành Vi Sử Dụng Web.docLuận Văn Ứng Dụng Khai Thác Mẫu Chuỗi Để Khai Thác Hành Vi Sử Dụng Web.doc
Luận Văn Ứng Dụng Khai Thác Mẫu Chuỗi Để Khai Thác Hành Vi Sử Dụng Web.doctcoco3199
 
Luận Văn Ứng Dụng Khai Thác Mẫu Chuỗi Để Khai Thác Hành Vi Sử Dụng Web.doc
Luận Văn Ứng Dụng Khai Thác Mẫu Chuỗi Để Khai Thác Hành Vi Sử Dụng Web.docLuận Văn Ứng Dụng Khai Thác Mẫu Chuỗi Để Khai Thác Hành Vi Sử Dụng Web.doc
Luận Văn Ứng Dụng Khai Thác Mẫu Chuỗi Để Khai Thác Hành Vi Sử Dụng Web.doctcoco3199
 

Similar to Xây Dựng Và Đánh Giá Hệ Thống Tìm Kiếm Thông Tin.doc (20)

Giao trinhpttkhttt
Giao trinhpttkhtttGiao trinhpttkhttt
Giao trinhpttkhttt
 
Luan van
Luan vanLuan van
Luan van
 
Luận văn: Nghiên cứu và ứng dụng mẫu thiết kế trong phương pháp hướng đối tượng
Luận văn: Nghiên cứu và ứng dụng mẫu thiết kế trong phương pháp hướng đối tượngLuận văn: Nghiên cứu và ứng dụng mẫu thiết kế trong phương pháp hướng đối tượng
Luận văn: Nghiên cứu và ứng dụng mẫu thiết kế trong phương pháp hướng đối tượng
 
Nghiên Cứu Xây Dựng Hệ Thống Đảm Bảo An Toàn Dữ Liệu Đào Tạo Tại Trường Đại H...
Nghiên Cứu Xây Dựng Hệ Thống Đảm Bảo An Toàn Dữ Liệu Đào Tạo Tại Trường Đại H...Nghiên Cứu Xây Dựng Hệ Thống Đảm Bảo An Toàn Dữ Liệu Đào Tạo Tại Trường Đại H...
Nghiên Cứu Xây Dựng Hệ Thống Đảm Bảo An Toàn Dữ Liệu Đào Tạo Tại Trường Đại H...
 
Gt pttk he_thong_thong_tin
Gt pttk he_thong_thong_tinGt pttk he_thong_thong_tin
Gt pttk he_thong_thong_tin
 
Giáo trình phân tích thiết kế hệ thống thông tin
Giáo trình phân tích thiết kế hệ thống thông tinGiáo trình phân tích thiết kế hệ thống thông tin
Giáo trình phân tích thiết kế hệ thống thông tin
 
Mo hinh-hoa-he-thong-phan-1
Mo hinh-hoa-he-thong-phan-1Mo hinh-hoa-he-thong-phan-1
Mo hinh-hoa-he-thong-phan-1
 
Cơ sở lý luận về phân tích thiết kế hệ thống thông tin quản lý bán hàng.docx
Cơ sở lý luận về phân tích thiết kế hệ thống thông tin quản lý bán hàng.docxCơ sở lý luận về phân tích thiết kế hệ thống thông tin quản lý bán hàng.docx
Cơ sở lý luận về phân tích thiết kế hệ thống thông tin quản lý bán hàng.docx
 
Ứng Dụng Khai Phá Dữ Liệu Xây Dựng Hệ Thống Trợ Giúp Phòng, Chống Và Giảm Nhẹ...
Ứng Dụng Khai Phá Dữ Liệu Xây Dựng Hệ Thống Trợ Giúp Phòng, Chống Và Giảm Nhẹ...Ứng Dụng Khai Phá Dữ Liệu Xây Dựng Hệ Thống Trợ Giúp Phòng, Chống Và Giảm Nhẹ...
Ứng Dụng Khai Phá Dữ Liệu Xây Dựng Hệ Thống Trợ Giúp Phòng, Chống Và Giảm Nhẹ...
 
Đề tài: Công cụ sinh dữ liệu thử tự động cho chương trình Java
Đề tài: Công cụ sinh dữ liệu thử tự động cho chương trình JavaĐề tài: Công cụ sinh dữ liệu thử tự động cho chương trình Java
Đề tài: Công cụ sinh dữ liệu thử tự động cho chương trình Java
 
Ứng Dụng Random Forest Để Tư Vấn Chọn Lộ Trình Học Trong Học Chế Tín Chỉ.doc
Ứng Dụng Random Forest Để Tư Vấn Chọn Lộ Trình Học Trong Học Chế Tín Chỉ.docỨng Dụng Random Forest Để Tư Vấn Chọn Lộ Trình Học Trong Học Chế Tín Chỉ.doc
Ứng Dụng Random Forest Để Tư Vấn Chọn Lộ Trình Học Trong Học Chế Tín Chỉ.doc
 
Luận Văn Ứng Dụng Khai Thác Mẫu Chuỗi Để Khai Thác Hành Vi Sử Dụng Web.doc
Luận Văn Ứng Dụng Khai Thác Mẫu Chuỗi Để Khai Thác Hành Vi Sử Dụng Web.docLuận Văn Ứng Dụng Khai Thác Mẫu Chuỗi Để Khai Thác Hành Vi Sử Dụng Web.doc
Luận Văn Ứng Dụng Khai Thác Mẫu Chuỗi Để Khai Thác Hành Vi Sử Dụng Web.doc
 
Luận Văn Ứng Dụng Khai Thác Mẫu Chuỗi Để Khai Thác Hành Vi Sử Dụng Web.doc
Luận Văn Ứng Dụng Khai Thác Mẫu Chuỗi Để Khai Thác Hành Vi Sử Dụng Web.docLuận Văn Ứng Dụng Khai Thác Mẫu Chuỗi Để Khai Thác Hành Vi Sử Dụng Web.doc
Luận Văn Ứng Dụng Khai Thác Mẫu Chuỗi Để Khai Thác Hành Vi Sử Dụng Web.doc
 
Ứng Dụng Logic Mờ Xây Dựng Mô Hình Trắc Nghiệm Thích Nghi.doc
Ứng Dụng Logic Mờ Xây Dựng Mô Hình Trắc Nghiệm Thích Nghi.docỨng Dụng Logic Mờ Xây Dựng Mô Hình Trắc Nghiệm Thích Nghi.doc
Ứng Dụng Logic Mờ Xây Dựng Mô Hình Trắc Nghiệm Thích Nghi.doc
 
Đồ-Án-1.docx
Đồ-Án-1.docxĐồ-Án-1.docx
Đồ-Án-1.docx
 
Nghiên Cứu Chất Lƣợng Phần Mềm Kế Toán Việt Nam.doc
Nghiên Cứu Chất Lƣợng Phần Mềm Kế Toán Việt Nam.docNghiên Cứu Chất Lƣợng Phần Mềm Kế Toán Việt Nam.doc
Nghiên Cứu Chất Lƣợng Phần Mềm Kế Toán Việt Nam.doc
 
Phân Tích Dữ Liệu Phân Hạng Tín Dụng Dựa Trên Bộ Dữ Liệu Xyz Bằng Phần Mềm Or...
Phân Tích Dữ Liệu Phân Hạng Tín Dụng Dựa Trên Bộ Dữ Liệu Xyz Bằng Phần Mềm Or...Phân Tích Dữ Liệu Phân Hạng Tín Dụng Dựa Trên Bộ Dữ Liệu Xyz Bằng Phần Mềm Or...
Phân Tích Dữ Liệu Phân Hạng Tín Dụng Dựa Trên Bộ Dữ Liệu Xyz Bằng Phần Mềm Or...
 
Luận văn: Nhận dạng và phân loại hoa quả trong ảnh màu, HAY
Luận văn: Nhận dạng và phân loại hoa quả trong ảnh màu, HAYLuận văn: Nhận dạng và phân loại hoa quả trong ảnh màu, HAY
Luận văn: Nhận dạng và phân loại hoa quả trong ảnh màu, HAY
 
Nghiên Cứu Kỹ Thuật Khai Phá Quy Trình Và Ứng Dụng Để Phân Tích Quy Trình Yêu...
Nghiên Cứu Kỹ Thuật Khai Phá Quy Trình Và Ứng Dụng Để Phân Tích Quy Trình Yêu...Nghiên Cứu Kỹ Thuật Khai Phá Quy Trình Và Ứng Dụng Để Phân Tích Quy Trình Yêu...
Nghiên Cứu Kỹ Thuật Khai Phá Quy Trình Và Ứng Dụng Để Phân Tích Quy Trình Yêu...
 
Luận văn: Nghiên cứu công nghệ tìm kiếm (Mã nguồn mở) Lucene
Luận văn: Nghiên cứu công nghệ tìm kiếm (Mã nguồn mở) LuceneLuận văn: Nghiên cứu công nghệ tìm kiếm (Mã nguồn mở) Lucene
Luận văn: Nghiên cứu công nghệ tìm kiếm (Mã nguồn mở) Lucene
 

More from Dịch vụ viết đề tài trọn gói 0934.573.149

Luận Văn Một Số Biện Pháp Nâng Cao Hiệu Quả Sử Dụng Nguồn Nhân Lực Tại Công T...
Luận Văn Một Số Biện Pháp Nâng Cao Hiệu Quả Sử Dụng Nguồn Nhân Lực Tại Công T...Luận Văn Một Số Biện Pháp Nâng Cao Hiệu Quả Sử Dụng Nguồn Nhân Lực Tại Công T...
Luận Văn Một Số Biện Pháp Nâng Cao Hiệu Quả Sử Dụng Nguồn Nhân Lực Tại Công T...Dịch vụ viết đề tài trọn gói 0934.573.149
 
Luận Văn Lễ Hội Hoa Phượng Đỏ Hải Phòng Và Thực Trạng Tổ Chức Lễ Hội Lần Thứ ...
Luận Văn Lễ Hội Hoa Phượng Đỏ Hải Phòng Và Thực Trạng Tổ Chức Lễ Hội Lần Thứ ...Luận Văn Lễ Hội Hoa Phượng Đỏ Hải Phòng Và Thực Trạng Tổ Chức Lễ Hội Lần Thứ ...
Luận Văn Lễ Hội Hoa Phượng Đỏ Hải Phòng Và Thực Trạng Tổ Chức Lễ Hội Lần Thứ ...Dịch vụ viết đề tài trọn gói 0934.573.149
 
Luận Văn Lễ Hội Báo Slao Xã Quốc Khánh Với Phát Triển Du Lịch Văn Hóa Ở Tràng...
Luận Văn Lễ Hội Báo Slao Xã Quốc Khánh Với Phát Triển Du Lịch Văn Hóa Ở Tràng...Luận Văn Lễ Hội Báo Slao Xã Quốc Khánh Với Phát Triển Du Lịch Văn Hóa Ở Tràng...
Luận Văn Lễ Hội Báo Slao Xã Quốc Khánh Với Phát Triển Du Lịch Văn Hóa Ở Tràng...Dịch vụ viết đề tài trọn gói 0934.573.149
 
Luận Văn Kỹ Thuật Giấu Tin Thuận Nghịch Trong Ảnh Bằng Hiệu Chỉnh Hệ Số Wavel...
Luận Văn Kỹ Thuật Giấu Tin Thuận Nghịch Trong Ảnh Bằng Hiệu Chỉnh Hệ Số Wavel...Luận Văn Kỹ Thuật Giấu Tin Thuận Nghịch Trong Ảnh Bằng Hiệu Chỉnh Hệ Số Wavel...
Luận Văn Kỹ Thuật Giấu Tin Thuận Nghịch Trong Ảnh Bằng Hiệu Chỉnh Hệ Số Wavel...Dịch vụ viết đề tài trọn gói 0934.573.149
 
Luận Văn Khai Thác Giá Trị Hệ Thống Chùa Tại Thủy Nguyên Phục Vụ Phát Triển D...
Luận Văn Khai Thác Giá Trị Hệ Thống Chùa Tại Thủy Nguyên Phục Vụ Phát Triển D...Luận Văn Khai Thác Giá Trị Hệ Thống Chùa Tại Thủy Nguyên Phục Vụ Phát Triển D...
Luận Văn Khai Thác Giá Trị Hệ Thống Chùa Tại Thủy Nguyên Phục Vụ Phát Triển D...Dịch vụ viết đề tài trọn gói 0934.573.149
 
Luận Văn Khai thác các giá trị lịch sử - văn hóa làng cổ loa, xã cổ loa, huyệ...
Luận Văn Khai thác các giá trị lịch sử - văn hóa làng cổ loa, xã cổ loa, huyệ...Luận Văn Khai thác các giá trị lịch sử - văn hóa làng cổ loa, xã cổ loa, huyệ...
Luận Văn Khai thác các giá trị lịch sử - văn hóa làng cổ loa, xã cổ loa, huyệ...Dịch vụ viết đề tài trọn gói 0934.573.149
 
Luận Văn Hoàn Thiện Tổ Chức Công Tác Hạch Toán Kế Toán Tiền Lương Và Các Khoả...
Luận Văn Hoàn Thiện Tổ Chức Công Tác Hạch Toán Kế Toán Tiền Lương Và Các Khoả...Luận Văn Hoàn Thiện Tổ Chức Công Tác Hạch Toán Kế Toán Tiền Lương Và Các Khoả...
Luận Văn Hoàn Thiện Tổ Chức Công Tác Hạch Toán Kế Toán Tiền Lương Và Các Khoả...Dịch vụ viết đề tài trọn gói 0934.573.149
 
Luận Văn Hoàn Thiện Công Tác Kế Toán Vốn Bằng Tiền Tại Công Ty Cổ Phần Bao Bì...
Luận Văn Hoàn Thiện Công Tác Kế Toán Vốn Bằng Tiền Tại Công Ty Cổ Phần Bao Bì...Luận Văn Hoàn Thiện Công Tác Kế Toán Vốn Bằng Tiền Tại Công Ty Cổ Phần Bao Bì...
Luận Văn Hoàn Thiện Công Tác Kế Toán Vốn Bằng Tiền Tại Công Ty Cổ Phần Bao Bì...Dịch vụ viết đề tài trọn gói 0934.573.149
 

More from Dịch vụ viết đề tài trọn gói 0934.573.149 (20)

Luận Văn Một Số Biện Pháp Nhằm Quản Lý Hàng Hóa Tốt Hơn Tại Công Ty Tnhh.doc
Luận Văn Một Số Biện Pháp Nhằm Quản Lý Hàng Hóa Tốt Hơn Tại Công Ty Tnhh.docLuận Văn Một Số Biện Pháp Nhằm Quản Lý Hàng Hóa Tốt Hơn Tại Công Ty Tnhh.doc
Luận Văn Một Số Biện Pháp Nhằm Quản Lý Hàng Hóa Tốt Hơn Tại Công Ty Tnhh.doc
 
Luận Văn Một Số Biện Pháp Nâng Cao Hiệu Quả Sử Dụng Nguồn Nhân Lực Tại Công T...
Luận Văn Một Số Biện Pháp Nâng Cao Hiệu Quả Sử Dụng Nguồn Nhân Lực Tại Công T...Luận Văn Một Số Biện Pháp Nâng Cao Hiệu Quả Sử Dụng Nguồn Nhân Lực Tại Công T...
Luận Văn Một Số Biện Pháp Nâng Cao Hiệu Quả Sử Dụng Nguồn Nhân Lực Tại Công T...
 
Luận Văn Một Số Biện Pháp Maketing Nhằm Nâng Cao Hiệu Quả Kinh Doanh Tại Công...
Luận Văn Một Số Biện Pháp Maketing Nhằm Nâng Cao Hiệu Quả Kinh Doanh Tại Công...Luận Văn Một Số Biện Pháp Maketing Nhằm Nâng Cao Hiệu Quả Kinh Doanh Tại Công...
Luận Văn Một Số Biện Pháp Maketing Nhằm Nâng Cao Hiệu Quả Kinh Doanh Tại Công...
 
Luận Văn Lý Luận Chung Về Doanh Thu, Chi Phí, Kết Quả Kinh Doanh Và Kế Toán D...
Luận Văn Lý Luận Chung Về Doanh Thu, Chi Phí, Kết Quả Kinh Doanh Và Kế Toán D...Luận Văn Lý Luận Chung Về Doanh Thu, Chi Phí, Kết Quả Kinh Doanh Và Kế Toán D...
Luận Văn Lý Luận Chung Về Doanh Thu, Chi Phí, Kết Quả Kinh Doanh Và Kế Toán D...
 
Luận Văn Lễ Hội Hoa Phượng Đỏ Hải Phòng Và Thực Trạng Tổ Chức Lễ Hội Lần Thứ ...
Luận Văn Lễ Hội Hoa Phượng Đỏ Hải Phòng Và Thực Trạng Tổ Chức Lễ Hội Lần Thứ ...Luận Văn Lễ Hội Hoa Phượng Đỏ Hải Phòng Và Thực Trạng Tổ Chức Lễ Hội Lần Thứ ...
Luận Văn Lễ Hội Hoa Phượng Đỏ Hải Phòng Và Thực Trạng Tổ Chức Lễ Hội Lần Thứ ...
 
Luận Văn Lễ Hội Báo Slao Xã Quốc Khánh Với Phát Triển Du Lịch Văn Hóa Ở Tràng...
Luận Văn Lễ Hội Báo Slao Xã Quốc Khánh Với Phát Triển Du Lịch Văn Hóa Ở Tràng...Luận Văn Lễ Hội Báo Slao Xã Quốc Khánh Với Phát Triển Du Lịch Văn Hóa Ở Tràng...
Luận Văn Lễ Hội Báo Slao Xã Quốc Khánh Với Phát Triển Du Lịch Văn Hóa Ở Tràng...
 
Luận Văn Kỹ Thuật Giấu Tin Thuận Nghịch Trong Ảnh Bằng Hiệu Chỉnh Hệ Số Wavel...
Luận Văn Kỹ Thuật Giấu Tin Thuận Nghịch Trong Ảnh Bằng Hiệu Chỉnh Hệ Số Wavel...Luận Văn Kỹ Thuật Giấu Tin Thuận Nghịch Trong Ảnh Bằng Hiệu Chỉnh Hệ Số Wavel...
Luận Văn Kỹ Thuật Giấu Tin Thuận Nghịch Trong Ảnh Bằng Hiệu Chỉnh Hệ Số Wavel...
 
Luận Văn Khu Đô Thị Dành Cho Ngƣời Thu Nhập Trung Bình Tại Kiến An Hải Phõng.doc
Luận Văn Khu Đô Thị Dành Cho Ngƣời Thu Nhập Trung Bình Tại Kiến An Hải Phõng.docLuận Văn Khu Đô Thị Dành Cho Ngƣời Thu Nhập Trung Bình Tại Kiến An Hải Phõng.doc
Luận Văn Khu Đô Thị Dành Cho Ngƣời Thu Nhập Trung Bình Tại Kiến An Hải Phõng.doc
 
Luận Văn Khai Thác Tiềm Năng Phát Triển Du Lịch Ven Biển Tiền Hải - Thái Binh...
Luận Văn Khai Thác Tiềm Năng Phát Triển Du Lịch Ven Biển Tiền Hải - Thái Binh...Luận Văn Khai Thác Tiềm Năng Phát Triển Du Lịch Ven Biển Tiền Hải - Thái Binh...
Luận Văn Khai Thác Tiềm Năng Phát Triển Du Lịch Ven Biển Tiền Hải - Thái Binh...
 
Luận Văn Khai Thác Giá Trị Hệ Thống Chùa Tại Thủy Nguyên Phục Vụ Phát Triển D...
Luận Văn Khai Thác Giá Trị Hệ Thống Chùa Tại Thủy Nguyên Phục Vụ Phát Triển D...Luận Văn Khai Thác Giá Trị Hệ Thống Chùa Tại Thủy Nguyên Phục Vụ Phát Triển D...
Luận Văn Khai Thác Giá Trị Hệ Thống Chùa Tại Thủy Nguyên Phục Vụ Phát Triển D...
 
Luận Văn Khai thác các giá trị lịch sử - văn hóa làng cổ loa, xã cổ loa, huyệ...
Luận Văn Khai thác các giá trị lịch sử - văn hóa làng cổ loa, xã cổ loa, huyệ...Luận Văn Khai thác các giá trị lịch sử - văn hóa làng cổ loa, xã cổ loa, huyệ...
Luận Văn Khai thác các giá trị lịch sử - văn hóa làng cổ loa, xã cổ loa, huyệ...
 
Luận Văn Khách Sạn Hòn Dáu.doc
Luận Văn Khách Sạn Hòn Dáu.docLuận Văn Khách Sạn Hòn Dáu.doc
Luận Văn Khách Sạn Hòn Dáu.doc
 
Luận Văn Khách Sạn Hoàng Anh.doc
Luận Văn Khách Sạn Hoàng Anh.docLuận Văn Khách Sạn Hoàng Anh.doc
Luận Văn Khách Sạn Hoàng Anh.doc
 
Luận Văn Khách Sạn Hoa Phuợng Đồ Sơn.doc
Luận Văn Khách Sạn Hoa Phuợng Đồ Sơn.docLuận Văn Khách Sạn Hoa Phuợng Đồ Sơn.doc
Luận Văn Khách Sạn Hoa Phuợng Đồ Sơn.doc
 
Luận Văn Khách Sạn Đồ Sơn.doc
Luận Văn Khách Sạn Đồ Sơn.docLuận Văn Khách Sạn Đồ Sơn.doc
Luận Văn Khách Sạn Đồ Sơn.doc
 
Luận Văn Học Viện Văn Hóa Nghệ Thuật Dân Tộc Việt Bắc.doc
Luận Văn Học Viện Văn Hóa Nghệ Thuật Dân Tộc Việt Bắc.docLuận Văn Học Viện Văn Hóa Nghệ Thuật Dân Tộc Việt Bắc.doc
Luận Văn Học Viện Văn Hóa Nghệ Thuật Dân Tộc Việt Bắc.doc
 
Luận Văn Hoàn Thiện Tổ Chức Kế Toán Hàng Hóa Tại Công Ty Tnhh An Phöc Thịnh.doc
Luận Văn Hoàn Thiện Tổ Chức Kế Toán Hàng Hóa Tại Công Ty Tnhh An Phöc Thịnh.docLuận Văn Hoàn Thiện Tổ Chức Kế Toán Hàng Hóa Tại Công Ty Tnhh An Phöc Thịnh.doc
Luận Văn Hoàn Thiện Tổ Chức Kế Toán Hàng Hóa Tại Công Ty Tnhh An Phöc Thịnh.doc
 
Luận Văn Hoàn Thiện Tổ Chức Công Tác Kế Toán Doanh Thu, Chi Phí Bán Hàng Và X...
Luận Văn Hoàn Thiện Tổ Chức Công Tác Kế Toán Doanh Thu, Chi Phí Bán Hàng Và X...Luận Văn Hoàn Thiện Tổ Chức Công Tác Kế Toán Doanh Thu, Chi Phí Bán Hàng Và X...
Luận Văn Hoàn Thiện Tổ Chức Công Tác Kế Toán Doanh Thu, Chi Phí Bán Hàng Và X...
 
Luận Văn Hoàn Thiện Tổ Chức Công Tác Hạch Toán Kế Toán Tiền Lương Và Các Khoả...
Luận Văn Hoàn Thiện Tổ Chức Công Tác Hạch Toán Kế Toán Tiền Lương Và Các Khoả...Luận Văn Hoàn Thiện Tổ Chức Công Tác Hạch Toán Kế Toán Tiền Lương Và Các Khoả...
Luận Văn Hoàn Thiện Tổ Chức Công Tác Hạch Toán Kế Toán Tiền Lương Và Các Khoả...
 
Luận Văn Hoàn Thiện Công Tác Kế Toán Vốn Bằng Tiền Tại Công Ty Cổ Phần Bao Bì...
Luận Văn Hoàn Thiện Công Tác Kế Toán Vốn Bằng Tiền Tại Công Ty Cổ Phần Bao Bì...Luận Văn Hoàn Thiện Công Tác Kế Toán Vốn Bằng Tiền Tại Công Ty Cổ Phần Bao Bì...
Luận Văn Hoàn Thiện Công Tác Kế Toán Vốn Bằng Tiền Tại Công Ty Cổ Phần Bao Bì...
 

Recently uploaded

30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...Nguyen Thanh Tu Collection
 
SÁNG KIẾN ÁP DỤNG CLT (COMMUNICATIVE LANGUAGE TEACHING) VÀO QUÁ TRÌNH DẠY - H...
SÁNG KIẾN ÁP DỤNG CLT (COMMUNICATIVE LANGUAGE TEACHING) VÀO QUÁ TRÌNH DẠY - H...SÁNG KIẾN ÁP DỤNG CLT (COMMUNICATIVE LANGUAGE TEACHING) VÀO QUÁ TRÌNH DẠY - H...
SÁNG KIẾN ÁP DỤNG CLT (COMMUNICATIVE LANGUAGE TEACHING) VÀO QUÁ TRÌNH DẠY - H...Nguyen Thanh Tu Collection
 
GNHH và KBHQ - giao nhận hàng hoá và khai báo hải quan
GNHH và KBHQ - giao nhận hàng hoá và khai báo hải quanGNHH và KBHQ - giao nhận hàng hoá và khai báo hải quan
GNHH và KBHQ - giao nhận hàng hoá và khai báo hải quanmyvh40253
 
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...Nguyen Thanh Tu Collection
 
BỘ LUYỆN NGHE VÀO 10 TIẾNG ANH DẠNG TRẮC NGHIỆM 4 CÂU TRẢ LỜI - CÓ FILE NGHE.pdf
BỘ LUYỆN NGHE VÀO 10 TIẾNG ANH DẠNG TRẮC NGHIỆM 4 CÂU TRẢ LỜI - CÓ FILE NGHE.pdfBỘ LUYỆN NGHE VÀO 10 TIẾNG ANH DẠNG TRẮC NGHIỆM 4 CÂU TRẢ LỜI - CÓ FILE NGHE.pdf
BỘ LUYỆN NGHE VÀO 10 TIẾNG ANH DẠNG TRẮC NGHIỆM 4 CÂU TRẢ LỜI - CÓ FILE NGHE.pdfNguyen Thanh Tu Collection
 
Bài giảng môn Truyền thông đa phương tiện
Bài giảng môn Truyền thông đa phương tiệnBài giảng môn Truyền thông đa phương tiện
Bài giảng môn Truyền thông đa phương tiệnpmtiendhti14a5hn
 
SD-05_Xây dựng website bán váy Lolita Alice - Phùng Thị Thúy Hiền PH 2 7 8 6 ...
SD-05_Xây dựng website bán váy Lolita Alice - Phùng Thị Thúy Hiền PH 2 7 8 6 ...SD-05_Xây dựng website bán váy Lolita Alice - Phùng Thị Thúy Hiền PH 2 7 8 6 ...
SD-05_Xây dựng website bán váy Lolita Alice - Phùng Thị Thúy Hiền PH 2 7 8 6 ...ChuThNgnFEFPLHN
 
1.DOANNGOCPHUONGTHAO-APDUNGSTEMTHIETKEBTHHHGIUPHSHOCHIEUQUA (1).docx
1.DOANNGOCPHUONGTHAO-APDUNGSTEMTHIETKEBTHHHGIUPHSHOCHIEUQUA (1).docx1.DOANNGOCPHUONGTHAO-APDUNGSTEMTHIETKEBTHHHGIUPHSHOCHIEUQUA (1).docx
1.DOANNGOCPHUONGTHAO-APDUNGSTEMTHIETKEBTHHHGIUPHSHOCHIEUQUA (1).docxTHAO316680
 
PHƯƠNG THỨC VẬN TẢI ĐƯỜNG SẮT TRONG VẬN TẢI
PHƯƠNG THỨC VẬN TẢI ĐƯỜNG SẮT TRONG VẬN TẢIPHƯƠNG THỨC VẬN TẢI ĐƯỜNG SẮT TRONG VẬN TẢI
PHƯƠNG THỨC VẬN TẢI ĐƯỜNG SẮT TRONG VẬN TẢImyvh40253
 
Bài tập nhóm Kỹ Năng Gỉai Quyết Tranh Chấp Lao Động (1).pptx
Bài tập nhóm Kỹ Năng Gỉai Quyết Tranh Chấp Lao Động (1).pptxBài tập nhóm Kỹ Năng Gỉai Quyết Tranh Chấp Lao Động (1).pptx
Bài tập nhóm Kỹ Năng Gỉai Quyết Tranh Chấp Lao Động (1).pptxDungxPeach
 
TUYỂN TẬP 50 ĐỀ LUYỆN THI TUYỂN SINH LỚP 10 THPT MÔN TOÁN NĂM 2024 CÓ LỜI GIẢ...
TUYỂN TẬP 50 ĐỀ LUYỆN THI TUYỂN SINH LỚP 10 THPT MÔN TOÁN NĂM 2024 CÓ LỜI GIẢ...TUYỂN TẬP 50 ĐỀ LUYỆN THI TUYỂN SINH LỚP 10 THPT MÔN TOÁN NĂM 2024 CÓ LỜI GIẢ...
TUYỂN TẬP 50 ĐỀ LUYỆN THI TUYỂN SINH LỚP 10 THPT MÔN TOÁN NĂM 2024 CÓ LỜI GIẢ...Nguyen Thanh Tu Collection
 
powerpoint mẫu họp phụ huynh cuối kì 2 học sinh lớp 7 bgs
powerpoint mẫu họp phụ huynh cuối kì 2 học sinh lớp 7 bgspowerpoint mẫu họp phụ huynh cuối kì 2 học sinh lớp 7 bgs
powerpoint mẫu họp phụ huynh cuối kì 2 học sinh lớp 7 bgsNmmeomeo
 
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 7 GLOBAL SUCCESS (2 CỘ...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 7 GLOBAL SUCCESS (2 CỘ...GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 7 GLOBAL SUCCESS (2 CỘ...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 7 GLOBAL SUCCESS (2 CỘ...Nguyen Thanh Tu Collection
 
TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI LÝ LUẬN VĂN HỌC NĂM HỌC 2023-2024 - MÔN NGỮ ...
TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI LÝ LUẬN VĂN HỌC NĂM HỌC 2023-2024 - MÔN NGỮ ...TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI LÝ LUẬN VĂN HỌC NĂM HỌC 2023-2024 - MÔN NGỮ ...
TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI LÝ LUẬN VĂN HỌC NĂM HỌC 2023-2024 - MÔN NGỮ ...Nguyen Thanh Tu Collection
 
SLIDE - Tu van, huong dan cong tac tuyen sinh-2024 (đầy đủ chi tiết).pdf
SLIDE - Tu van, huong dan cong tac tuyen sinh-2024 (đầy đủ chi tiết).pdfSLIDE - Tu van, huong dan cong tac tuyen sinh-2024 (đầy đủ chi tiết).pdf
SLIDE - Tu van, huong dan cong tac tuyen sinh-2024 (đầy đủ chi tiết).pdfhoangtuansinh1
 
GIÁO TRÌNH KHỐI NGUỒN CÁC LOẠI - ĐIỆN LẠNH BÁCH KHOA HÀ NỘI
GIÁO TRÌNH  KHỐI NGUỒN CÁC LOẠI - ĐIỆN LẠNH BÁCH KHOA HÀ NỘIGIÁO TRÌNH  KHỐI NGUỒN CÁC LOẠI - ĐIỆN LẠNH BÁCH KHOA HÀ NỘI
GIÁO TRÌNH KHỐI NGUỒN CÁC LOẠI - ĐIỆN LẠNH BÁCH KHOA HÀ NỘIĐiện Lạnh Bách Khoa Hà Nội
 
Trắc nghiệm CHƯƠNG 5 môn Chủ nghĩa xã hội
Trắc nghiệm CHƯƠNG 5 môn Chủ nghĩa xã hộiTrắc nghiệm CHƯƠNG 5 môn Chủ nghĩa xã hội
Trắc nghiệm CHƯƠNG 5 môn Chủ nghĩa xã hộiNgocNguyen591215
 
3-BẢNG MÃ LỖI CỦA CÁC HÃNG ĐIỀU HÒA .pdf - ĐIỆN LẠNH BÁCH KHOA HÀ NỘI
3-BẢNG MÃ LỖI CỦA CÁC HÃNG ĐIỀU HÒA .pdf - ĐIỆN LẠNH BÁCH KHOA HÀ NỘI3-BẢNG MÃ LỖI CỦA CÁC HÃNG ĐIỀU HÒA .pdf - ĐIỆN LẠNH BÁCH KHOA HÀ NỘI
3-BẢNG MÃ LỖI CỦA CÁC HÃNG ĐIỀU HÒA .pdf - ĐIỆN LẠNH BÁCH KHOA HÀ NỘIĐiện Lạnh Bách Khoa Hà Nội
 
Access: Chuong III Thiet ke truy van Query.ppt
Access: Chuong III Thiet ke truy van Query.pptAccess: Chuong III Thiet ke truy van Query.ppt
Access: Chuong III Thiet ke truy van Query.pptPhamThiThuThuy1
 
Giới thiệu Dự án Sản Phụ Khoa - Y Học Cộng Đồng
Giới thiệu Dự án Sản Phụ Khoa - Y Học Cộng ĐồngGiới thiệu Dự án Sản Phụ Khoa - Y Học Cộng Đồng
Giới thiệu Dự án Sản Phụ Khoa - Y Học Cộng ĐồngYhoccongdong.com
 

Recently uploaded (20)

30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
 
SÁNG KIẾN ÁP DỤNG CLT (COMMUNICATIVE LANGUAGE TEACHING) VÀO QUÁ TRÌNH DẠY - H...
SÁNG KIẾN ÁP DỤNG CLT (COMMUNICATIVE LANGUAGE TEACHING) VÀO QUÁ TRÌNH DẠY - H...SÁNG KIẾN ÁP DỤNG CLT (COMMUNICATIVE LANGUAGE TEACHING) VÀO QUÁ TRÌNH DẠY - H...
SÁNG KIẾN ÁP DỤNG CLT (COMMUNICATIVE LANGUAGE TEACHING) VÀO QUÁ TRÌNH DẠY - H...
 
GNHH và KBHQ - giao nhận hàng hoá và khai báo hải quan
GNHH và KBHQ - giao nhận hàng hoá và khai báo hải quanGNHH và KBHQ - giao nhận hàng hoá và khai báo hải quan
GNHH và KBHQ - giao nhận hàng hoá và khai báo hải quan
 
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
 
BỘ LUYỆN NGHE VÀO 10 TIẾNG ANH DẠNG TRẮC NGHIỆM 4 CÂU TRẢ LỜI - CÓ FILE NGHE.pdf
BỘ LUYỆN NGHE VÀO 10 TIẾNG ANH DẠNG TRẮC NGHIỆM 4 CÂU TRẢ LỜI - CÓ FILE NGHE.pdfBỘ LUYỆN NGHE VÀO 10 TIẾNG ANH DẠNG TRẮC NGHIỆM 4 CÂU TRẢ LỜI - CÓ FILE NGHE.pdf
BỘ LUYỆN NGHE VÀO 10 TIẾNG ANH DẠNG TRẮC NGHIỆM 4 CÂU TRẢ LỜI - CÓ FILE NGHE.pdf
 
Bài giảng môn Truyền thông đa phương tiện
Bài giảng môn Truyền thông đa phương tiệnBài giảng môn Truyền thông đa phương tiện
Bài giảng môn Truyền thông đa phương tiện
 
SD-05_Xây dựng website bán váy Lolita Alice - Phùng Thị Thúy Hiền PH 2 7 8 6 ...
SD-05_Xây dựng website bán váy Lolita Alice - Phùng Thị Thúy Hiền PH 2 7 8 6 ...SD-05_Xây dựng website bán váy Lolita Alice - Phùng Thị Thúy Hiền PH 2 7 8 6 ...
SD-05_Xây dựng website bán váy Lolita Alice - Phùng Thị Thúy Hiền PH 2 7 8 6 ...
 
1.DOANNGOCPHUONGTHAO-APDUNGSTEMTHIETKEBTHHHGIUPHSHOCHIEUQUA (1).docx
1.DOANNGOCPHUONGTHAO-APDUNGSTEMTHIETKEBTHHHGIUPHSHOCHIEUQUA (1).docx1.DOANNGOCPHUONGTHAO-APDUNGSTEMTHIETKEBTHHHGIUPHSHOCHIEUQUA (1).docx
1.DOANNGOCPHUONGTHAO-APDUNGSTEMTHIETKEBTHHHGIUPHSHOCHIEUQUA (1).docx
 
PHƯƠNG THỨC VẬN TẢI ĐƯỜNG SẮT TRONG VẬN TẢI
PHƯƠNG THỨC VẬN TẢI ĐƯỜNG SẮT TRONG VẬN TẢIPHƯƠNG THỨC VẬN TẢI ĐƯỜNG SẮT TRONG VẬN TẢI
PHƯƠNG THỨC VẬN TẢI ĐƯỜNG SẮT TRONG VẬN TẢI
 
Bài tập nhóm Kỹ Năng Gỉai Quyết Tranh Chấp Lao Động (1).pptx
Bài tập nhóm Kỹ Năng Gỉai Quyết Tranh Chấp Lao Động (1).pptxBài tập nhóm Kỹ Năng Gỉai Quyết Tranh Chấp Lao Động (1).pptx
Bài tập nhóm Kỹ Năng Gỉai Quyết Tranh Chấp Lao Động (1).pptx
 
TUYỂN TẬP 50 ĐỀ LUYỆN THI TUYỂN SINH LỚP 10 THPT MÔN TOÁN NĂM 2024 CÓ LỜI GIẢ...
TUYỂN TẬP 50 ĐỀ LUYỆN THI TUYỂN SINH LỚP 10 THPT MÔN TOÁN NĂM 2024 CÓ LỜI GIẢ...TUYỂN TẬP 50 ĐỀ LUYỆN THI TUYỂN SINH LỚP 10 THPT MÔN TOÁN NĂM 2024 CÓ LỜI GIẢ...
TUYỂN TẬP 50 ĐỀ LUYỆN THI TUYỂN SINH LỚP 10 THPT MÔN TOÁN NĂM 2024 CÓ LỜI GIẢ...
 
powerpoint mẫu họp phụ huynh cuối kì 2 học sinh lớp 7 bgs
powerpoint mẫu họp phụ huynh cuối kì 2 học sinh lớp 7 bgspowerpoint mẫu họp phụ huynh cuối kì 2 học sinh lớp 7 bgs
powerpoint mẫu họp phụ huynh cuối kì 2 học sinh lớp 7 bgs
 
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 7 GLOBAL SUCCESS (2 CỘ...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 7 GLOBAL SUCCESS (2 CỘ...GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 7 GLOBAL SUCCESS (2 CỘ...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 7 GLOBAL SUCCESS (2 CỘ...
 
TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI LÝ LUẬN VĂN HỌC NĂM HỌC 2023-2024 - MÔN NGỮ ...
TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI LÝ LUẬN VĂN HỌC NĂM HỌC 2023-2024 - MÔN NGỮ ...TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI LÝ LUẬN VĂN HỌC NĂM HỌC 2023-2024 - MÔN NGỮ ...
TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI LÝ LUẬN VĂN HỌC NĂM HỌC 2023-2024 - MÔN NGỮ ...
 
SLIDE - Tu van, huong dan cong tac tuyen sinh-2024 (đầy đủ chi tiết).pdf
SLIDE - Tu van, huong dan cong tac tuyen sinh-2024 (đầy đủ chi tiết).pdfSLIDE - Tu van, huong dan cong tac tuyen sinh-2024 (đầy đủ chi tiết).pdf
SLIDE - Tu van, huong dan cong tac tuyen sinh-2024 (đầy đủ chi tiết).pdf
 
GIÁO TRÌNH KHỐI NGUỒN CÁC LOẠI - ĐIỆN LẠNH BÁCH KHOA HÀ NỘI
GIÁO TRÌNH  KHỐI NGUỒN CÁC LOẠI - ĐIỆN LẠNH BÁCH KHOA HÀ NỘIGIÁO TRÌNH  KHỐI NGUỒN CÁC LOẠI - ĐIỆN LẠNH BÁCH KHOA HÀ NỘI
GIÁO TRÌNH KHỐI NGUỒN CÁC LOẠI - ĐIỆN LẠNH BÁCH KHOA HÀ NỘI
 
Trắc nghiệm CHƯƠNG 5 môn Chủ nghĩa xã hội
Trắc nghiệm CHƯƠNG 5 môn Chủ nghĩa xã hộiTrắc nghiệm CHƯƠNG 5 môn Chủ nghĩa xã hội
Trắc nghiệm CHƯƠNG 5 môn Chủ nghĩa xã hội
 
3-BẢNG MÃ LỖI CỦA CÁC HÃNG ĐIỀU HÒA .pdf - ĐIỆN LẠNH BÁCH KHOA HÀ NỘI
3-BẢNG MÃ LỖI CỦA CÁC HÃNG ĐIỀU HÒA .pdf - ĐIỆN LẠNH BÁCH KHOA HÀ NỘI3-BẢNG MÃ LỖI CỦA CÁC HÃNG ĐIỀU HÒA .pdf - ĐIỆN LẠNH BÁCH KHOA HÀ NỘI
3-BẢNG MÃ LỖI CỦA CÁC HÃNG ĐIỀU HÒA .pdf - ĐIỆN LẠNH BÁCH KHOA HÀ NỘI
 
Access: Chuong III Thiet ke truy van Query.ppt
Access: Chuong III Thiet ke truy van Query.pptAccess: Chuong III Thiet ke truy van Query.ppt
Access: Chuong III Thiet ke truy van Query.ppt
 
Giới thiệu Dự án Sản Phụ Khoa - Y Học Cộng Đồng
Giới thiệu Dự án Sản Phụ Khoa - Y Học Cộng ĐồngGiới thiệu Dự án Sản Phụ Khoa - Y Học Cộng Đồng
Giới thiệu Dự án Sản Phụ Khoa - Y Học Cộng Đồng
 

Xây Dựng Và Đánh Giá Hệ Thống Tìm Kiếm Thông Tin.doc

  • 1. Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvanmaster.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG NGUYỄN VŨ TÙNG DƯỠNG XÂY DỰNG VÀ ĐÁNH GIÁ HỆ THỐNG TÌM KIẾM THÔNG TIN Chuyên ngành: Khoa học máy tính Mã số: 60.48.01.01 TÓM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT Đà Nẵng - Năm 2016
  • 2. Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvanmaster.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 Công trình được hoàn thành tại ĐẠI HỌC ĐÀ NẴNG Người hướng dẫn khoa học: PGS.TS. Võ Trung Hùng Phản biện 1: TS. Huỳnh Công Pháp Phản biện 2: TS. Lê Xuân Việt Luận văn sẽ được bảo vệ tại Hội đồng chấm Luận văn tốt nghiệp thạc sĩ kỹ thuật họp tại Đại học Đà Nẵng vào ngày 25 tháng 07 năm 2016 Có thể tìm hiểu luận văn tại: Trung tâm Thông tin-Học liệu, Đại học Đà Nẵng
  • 3. Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvanmaster.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 1 MỞ ĐẦU 1. Tính cấp thiết của đề tài Cùng với sự phát triển chung của xã hội đặc biệt là công nghệ thông tin, nhu cầu học tập của con người càng được nâng cao do đó nhu cầu tìm kiếm thông tin là rất lớn và ngày càng tăng. Tuy nhiên, một thực trạng mà chúng ta cần phải đề cập đến ở đây là: Thứ nhất, có quá nhiều công cụ tìm kiếm dẫn đến sự khó khăn khi lựa chọn. Thứ hai, thông tin tìm kiếm được là không hoặc chưa được phù hợp với yêu cầu của người dùng. Thứ ba, các công cụ tìm kiếm không có mã nguồn mở nên rất khó cho việc ứng dụng… Một trong những lý do quan trọng nhất dẫn đến những hạn chế trên đó chính là chất lượng và khả năng ứng dụng của các phần mềm tìm kiếm. Giải pháp nào giúp chúng ta có thể giải quyết được những vấn đề trên để cho người dùng có được một sự lựa chọn phù hợp và đáng tin cậy khi tìm kiếm thông tin và có thể ứng dụng nó cho công việc của chính mình? Một trong những giải pháp đó chính là chúng ta cần tập trung nghiên cứu các vấn đề liên quan đến tìm kiếm thông tin, đánh giá hệ thống tìm kiếm thông tin. Phát triển các công cụ nhằm xây dựng các ứng dụng tìm kiếm và đánh giá chất lượng của hệ thống tìm kiếm. Do đó việc xây dựng một công cụ để tìm kiếm và đánh giá chất lượng tìm kiếm là phù hợp trong bối cảnh hiện nay. Vì vậy tôi đã quyết định chọn đề tài "Xây dựng và đánh giá hệ thống tìm kiếm thông tin" làm đề tài tốt nghiệp luận văn cao học. 2. Mục tiêu nghiên cứu  Mục tiêu chung: Là xây dựng và đánh giá chất lượng hệ thống tìm kiếm thông tin.   Mục tiêu cụ thể của đề tài - Phân tích, chuẩn hóa tài liệu, lập chỉ mục tài liệu và tìm kiếm
  • 4. Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvanmaster.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 2 của phần mềm mã nguồn mở Lucene. - Xây dựng các mô-đun tương tác và kết hợp với Lucene để nhằm mục đích tìm kiếm thông tin và đánh giá kết quả tìm kiếm. 3. Đối tượng và phạm vi nghiên cứu  Đối tượng nghiên cứu Cơ sở lý thuyết tìm kiếm thông tin, phương phương pháp lập chỉ mục, ngôn ngữ lập trình C#, công cụ tìm kiếm (thư viện mã nguồn mở Lucene), các phương pháp đánh giá hệ thống tìm kiếm thông tin (các độ đo, cách đánh giá).  Phạm vi nghiên cứu - Phương pháp thu thập, chuẩn hóa lập chỉ mục tập tài liệu và các phương pháp đánh giá một hệ thống tìm kiếm, ngôn ngữ C#. - Bộ tài liệu tiếng Việt khoảng 255 tài liệu. 4. Phương pháp nghiên cứu Tôi sử dụng hai phương pháp chính là phương pháp nghiên cứu tài liệu, phương pháp điều tra và phương pháp thử nghiệm. 5. Bố cục đề tài CHƯƠNG 1. NGHIÊN CỨU TỔNG QUAN. CHƯƠNG 2. GIẢI PHÁP XÂY DỰNG HỆ THỐNG . CHƯƠNG 3. TRIỂN KHAI THỰC NGHIỆM. 6. Tổng quan tài liệu nghiên cứu Trong quá trình nghiên cứu, thực hiện đề tài, tôi nhận thấy có một số hướng nghiên cứu chính là các kết quả công bố như sau: - Các bài báo về các lĩnh vực liên quan về xử lý văn bản; tìm kiếm và truy xuất thông tin. - Nguồn tài liệu từ các luận văn thạc sĩ về các lĩnh vực liên quan như hệ thống tìm kiếm thông tin; đánh giá hệ thống tìm kiếm và truy xuất thông tin; thuật toán tìm kiếm và truy xuất thông tin.
  • 5. Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvanmaster.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 3 CHƯƠNG 1 NGHIÊN CỨU TỔNG QUAN 1.1. TỔNG QUAN VỀ HỆ THỐNG TÌM KIẾM THÔNG TIN 1.1.1. Giới thiệu về tìm kiếm thông tin a. Khái niệm Tìm kiếm thông tin (Information Retrieval - IR) là tìm kiếm tài nguyên (thường là các tài liệu - documents) trên một tập các dữ liệu phi cấu trúc (thường là văn bản dạng text) được lưu trữ trên máy tính nhằm thỏa mãn nhu cầu về thông tin. b. Nguyên tắc hoạt động Nguyên tắc hoạt động cơ bản của hệ thống tìm kiếm thông tin là so khớp nhu cầu thông tin của người sử dụng với các tài liệu được lưu trữ trong cơ sở dữ liệu của hệ thống. Hình 1.1. Mô hình hoạt động của hệ thống tìm kiếm thông tin
  • 6. Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvanmaster.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 4 1.1.2. Một số mô hình tìm kiếm thông tin Mục tiêu chính của các hệ tìm kiếm thông tin là kết quả trả về là các tài liệu càng liên quan đến câu hỏi truy vấn càng tốt. Vì thế người ta đã nghiên cứu và đưa ra rất nhiều mô hình tìm kiếm nhằm tính toán một cách chính xác độ tương quan này. Một số mô hình tìm kiếm cơ bản: Mô hình tìm kiếm boolean, mô hình tìm kiếm boolean mở rộng, mô hình không gian vector, mô hình xác suất. 1.1.3. Một số công cụ đang được áp dụng a. Công cụ tìm kiếm trên mạng internet  Giới thiệu về tìm kiếm trên mạng internet Máy truy tìm hay máy tìm kiếm (search engine), hay còn được gọi với nghĩa rộng hơn là công cụ tìm kiếm (search tool), nguyên thuỷ là một phần mềm nhằm tìm ra các trang trên mạng Internet có nội dung theo yêu cầu người dùng dựa vào các thông tin mà chúng có. Trữ lượng thông tin này của công cụ tìm kiếm thực chất là một loại cơ sở dữ liệu (database) cực lớn. Việc tìm các tài liệu sẽ dựa trên các từ khóa (keyword) được người dùng gõ vào và trả về một danh mục của các trang WEB có chứa từ khóa mà nó tìm được.  Một số công cụ đang được áp dụng  - GOOGLE (http://www.google.com). - BING (http://www.bing.com). - BAIDU (http://www.baidu.com). b. Công cụ tìm kiếm trên máy tính cá nhân  Giới thiệu về tìm kiếm trên máy tính cá nhân Công cụ tìm kiếm trên máy tính cá nhân hay Desktop Search là một phần mềm dùng để tìm kiếm nội dung của tệp tin dữ liệu trên máy tính cá nhân, nó hoạt động nhanh hơn tìm kiếm trên WEB. Các
  • 7. Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvanmaster.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 5 công cụ này được thiết kế để tìm kiếm thông tin trên máy tính của người sử dụng như e-mail, văn bản, âm thanh hoặc phim ảnh…  Một số công cụ đang áp dụng  - Windows Desktop Search. - Google Desktop. 1.2. TỔNG QUAN VỀ ĐÁNH GIÁ KẾT QUẢ TÌM KIẾM 1.2.1. Giới thiệu Khi nhu cầu tìm kiếm thông tin phát triển, có rất nhiều mô hình, thuật toán, hệ thống truy xuất thông tin ra đời. Do đó, việc đánh giá các mô hình, thuật toán, hệ thống truy xuất thông tin là điều bắt buộc phải làm. Mục tiêu của việc so sánh các phương pháp là để khẳng định được phương pháp này là thực sự tốt hơn (chứ không phải là tốt hơn do ngẫu nhiên) phương pháp kia trong việc đạt được mục đích dự định của nó. Không có đánh giá, rất khó để có thể biết được phương pháp nào tốt hơn. Tuy nhiên, để làm được điều này cần có một có một nền tảng về phương pháp đánh giá được xây dựng tốt và đáng tin cậy. 1.2.2. Đánh giá hệ thống tìm kiếm thông tin  Các tiêu chuẩn được dùng để đánh giá Có 3 tiêu chuẩn dùng để đánh giá hệ thống tìm kiếm thông tin: - Tiêu chuẩn về tính hiệu quả: Tức là sự chính xác, tính đầy đủ của kết quả trả về so với mục đích tìm kiếm của người sử dụng. - Tiêu chuẩn về tính hiệu năng: Gồm có tốc độ tìm kiếm của thuật toán, khả năng lưu trữ, thời gian trả về cho con người sử dụng, thời gian lập chỉ mục, kích thước chỉ mục… - Tiêu chuẩn về khả năng sử dụng hệ thống: Tức là có thể nghiên cứu, học hỏi trên hệ thống tìm kiếm, người không biết tin học
  • 8. Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvanmaster.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 6 hay các chuyên gia tin học đều có thể sử dụng hệ thống.  Các mô hình đánh giá Có 4 mô hình thường được dùng để đánh giá: - Đánh giá hộp trắng: Là đánh giá hệ thống dựa trên kết quả việc đánh giá tất cả các thành phần của hệ thống. - Đánh giá hộp đen: Đánh giá bằng cách xem hệ thống như là một thực thể hợp nhất và tiến hành đánh giá chung cả hệ thống mà không đánh giá chính xác các thành phần bên trong hệ thống. - Đánh giá hướng hệ thống: Là hướng đánh giá dựa trên câu truy vấn và mức độ liên quan của tài liệu trả về so với câu truy vấn. - Đánh giá hướng người dùng (User Studies Evaluation): đánh giá mức độ hài lòng của người sử dụng.  Một số phương pháp đánh giá - Phương pháp Cranfield. - Phương pháp TREC. 1.2.3. Các độ đo Có 2 độ đo thường được dùng trong đánh giá hệ thống tìm kiếm thông tin đó là độ đo chính xác và độ đo bao phủ: - Độ chính xác (precision): Là ước tính có bao nhiêu tài liệu thật sự liên quan được tìm thấy:  |{TËp tµi liÖu liªn quan} {TËp kÕt qu¶}| §é chÝnh x¸c |{TËp kÕt qu¶}| - Độ bao phủ (Recall): Đo lường tính toàn diện của hệ thống:  |{TËp tµi liÖu liªn quan} {TËp kÕt qu¶}|  §é bao phñ |{TËp tµi liÖu liªn quan}| Theo các công thức tính toán trên ta có thể thấy rằng việc tính các độ đo là không hề đơn gian, vì việc kiểm tra tài liệu có liên quan
  • 9. Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvanmaster.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 7 hay không có liên quan đến yêu cầu truy vấn thì chúng ta cần phải tiến hành kiểm tra thủ công và sẽ rất tốn kém nếu thực hiện trên một bộ dữ liệu lớn. 1.2.4. Phương pháp tính độ chính xác Có nhiều phương pháp sử dụng các độ đo để tính toán đánh giá một hệ thống tìm kiếm thông tin. Phương pháp độ chính xác trung bình (Chỉ sử dụng độ chính xác không quan tâm đến độ bao phủ) phương pháp đó dựa trên giá trị đơn Swet's E-measure hoặc chiều dài tìm kiếm trung bình thì cũng chỉ sử dụng một giá trị để tính toán. Phương pháp tính độ chính xác dựa trên 11 điểm chuẩn của độ bao phủ sử dụng cả hai độ đo độ bao phủ và độ chính xác. 1.3. MỘT SỐ MÃ NGUỒN MỞ VỀ TÌM KIẾM THÔNG TIN 1.3.1. Giới thiệu về Lucene 1.3.2. Giới thiệu về Solr 1.3.3. Giới thiệu về Sphinx 1.4. TIỂU KẾT CHƯƠNG Chương này tôi đã nghiên cứu tổng quan về hệ thống tìm kiếm thông tin như: Giới thiệu về tìm kiếm thông tin, một số mô hình tìm kiếm và công cụ tìm kiếm đang được áp dụng hiện nay. Nghiên cứu tổng quan về đánh giá kết quả tìm kiếm như: Giới thiệu, đánh giá hệ thống tìm kiếm, các độ đo và phương pháp đánh giá hệ thống tìm kiếm. Nghiên cứu tổng quan về một số thư viện mã nguồn mở trong tìm kiếm thông tin như thư viện mã nguồn mở Lucene, Solr hay Sphinx.
  • 10. Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvanmaster.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 8 CHƯƠNG 2 GIẢI PHÁP XÂY DỰNG CÔNG CỤ 2.1. GIỚI THIỆU 2.2. MÔ HÌNH HỆ THỐNG Trong mô hình đề xuất này, xây dựng hai giai đoạn chính là giai đoạn xây dựng hệ thống tìm kiếm và giai đoạn xây dựng hệ thống đánh giá. Trong giai đoạn xây dựng hệ thống tìm kiếm gồm có các thành phần cơ bản sau: Bộ sưu tập tài liệu, thư viện mã nguồn mở Lucene, tập tài liệu sau khi đánh chỉ mục, giao diện yêu cầu tìm kiếm. Hình 2.1. Mô hình tìm kiếm và đánh giá tìm kiếm
  • 11. Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvanmaster.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 9 Trong giai đoạn đánh giá hệ thống tìm kiếm gồm có: Giao diện yêu cầu tìm kiếm, tập các câu truy vấn, tập tài liệu kết quả (sau khi tìm kiếm), tập tài liệu đánh giá, mô-đun đánh giá và kết quả thu được. 2.3. GIẢI PHÁP 2.3.1. Giải pháp đánh chỉ mục  Mục đích: Đánh chỉ mục các tập tin văn bản dùng để phục vụ cho việc tìm kiếm và đánh giá.   Đầu vào: Tập tài liệu văn bản.   Đầu ra: Tập tài liệu đã được đánh chỉ mục.   Xử lý: Tiến trình lập chỉ mục là một tiến trình gồm nhiều thao tác phức tạp, có thể tóm gọn gồm 3 nhóm thao tác chính: - Rút trích tài liệu. - Phân tích tài liệu được rút trích. - Lưu vào tập chỉ mục. Giải pháp như sau: Hình 2.2. Tạo chỉ mục các tập tài liệu văn bản đầu vào
  • 12. Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvanmaster.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 10 2.3.2. Giải pháp tìm kiếm  Mục đích: Truy vấn thông tin để tìm kiếm ra những tài liệu liên quan.   Đầu vào: Câu truy vấn.   Đầu ra: Tập các tài liệu liên quan.   Xử lý: - Nhập câu truy vấn. - Chọn trường thông tin. - Biên dịch câu truy vấn. - Tìm kiếm. Hình 2.3. Tìm kiếm tài liệu dựa trên câu hỏi truy vấn 2.3.3. Giải pháp đánh giá  Mục đích: Đánh giá kết quả tìm kiếm.   Đầu vào: Kết quả các tài liệu liên quan đã được tìm kiếm   Đầu ra: Kết quả đánh giá.   Xử lý: - Khi có tập tài liệu kết quả, tiến hành đánh giá hệ thống dựa trên tập tài liệu đánh giá thông qua các độ đo (độ chính xác, độ bao phủ). + Độ chính xác ở thứ hạng k (P(k)): Giả sử
  • 13. Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvanmaster.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 11 Retrieved(k) là tập gồm k tài liệu đầu mà hệ thống tìm được. Độ chính xác ở hạng k (P(k)) có thể được định nghĩa như sau: Relevent  retrieved(k)  P(k) =  k     + Độ chính xác trung bình: Là một độ đo kết hợp độ chính xác ở các mức bao phủ và được tính bởi công thức sau: MAP  1 Relevant Retrieved  Rel(i).P(i) k 1 Hình 2.4. Đánh giá kết quả tìm kiếm dựa trên tập tài liệu đánh giá 2.4. CÁC TIẾN TRÌNH HOẠT ĐỘNG CỦA LUCENE 2.4.1. Xây dựng tập chỉ mục tìm kiếm: gồm các phần sau:  Cách mô hình hóa nội dung văn bản với Lucene   Các thủ tục cơ bản trên tập chỉ mục: Thêm tài liệu vào tập chỉ mục, xóa tài liệu từ tập chỉ mục, cập nhập tài liệu trong tập chỉ mục.   Các thủ tục cơ bản trên tập chỉ mục Có nhiều phương pháp để biểu diễn tài liệu và một phương pháp tự động cơ bản được thực hiện theo các bước: - Bước 1: Tách từ - Tokenization.
  • 14. Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvanmaster.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 12 - Bước 2: Loại bỏ từ thông dụng – stop word. - Bước 3: Qui về từ gốc – stemming. - Bước 4: Đánh trọng số cho từ chỉ mục – term weighting.  Các tuỳ chọn cho Field: Lựa chọn cho chỉ mục, các tùy chọn cho lưu trữ, tùy chọn cho Vector mục từ, sự kết hợp các tùy chọn.   Thiết lập mức độ quan trọng cho các tài liệu và các trường Không phải tất cả các tài liệu và các trường được tạo ra đều có mức độ quan trọng như nhau. Nâng cao mức độ quan trọng cho chúng có thể được thực hiện trong suốt tiến trình lập chỉ mục hoặc tiến trình tìm kiếm.  Cắt giảm trường thông tin (Field truncation) Khi lập chỉ mục cho các tài liệu có kích thước chưa xác định, để đảm bảo cung cấp đủ bộ nhớ RAM cũng như dung lượng đĩa cứng cần thiết, thư viện Lucene cho phép giới hạn số mục từ cần được lập chỉ mục trên các trường tương ứng.  Tối ưu hóa tập chỉ mục Khi tạo chỉ mục cho nhiều tài liệu, sẽ có rất nhiều segment được tạo ra. Lúc tìm kiếm hệ thống sẽ thực hiện tìm qua tất cả các segment này và kết hợp kết quả lại. Để giảm thiểu số lượng segment và tiết kiệm bộ nhớ, Lucene hỗ trợ phương thức cho phép hợp các segment lại chỉ còn một vài segment, vừa đơn giản, tiết kiệm bộ nhớ vừa tìm kiếm nhanh hơn. 2.4.2. Tìm kiếm trên tập chỉ mục Mục đích của hệ thống tìm kiếm là phải trả về kết quả chính xác trong thời gian nhanh nhất. Khả năng của Lucene có thể trả về hàng trăm, hàng nghìn và có thể hàng triệu tài liệu liên quan chỉ trong thời gian ngắn với các phương thức đơn giản. Một số lớp chính sử
  • 15. Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvanmaster.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 13 dụng cho tìm kiếm bao gồm: IndexSearcher, Query, QueryParser, TopDocs, ScoreDoc.  Phân tích truy vấn: QueryParse QueryParser của Lucene là lớp đối tượng chính được sử dụng để tạo ra câu truy vấn từ nội dung tìm kiếm của người sử dụng.  Tìm kiếm với đối tượng IndexSearcher Toàn bộ quá trình tìm kiếm được thực hiện dựa trên một số lớp đối tượng chính như IndexSearcher, IndexReader, TopDocs… Và mối quan hệ giữa chúng được minh họa trong sơ đồ bên: Query  IndexSearcher  TopDos IndexSearcher  Index  Danh sách kết quả: TopDocs Khi gọi tìm kiếm với phương thức search (Query, n) sẽ nhận được kết quả trả về trong TopDocs, đối tượng này chứa danh sách n các mã tài liệu được xếp thứ tự theo mức độ liên quan.  Công thức tính điểm số của Lucene Lucene sử dụng công thức tính điểm số tương đồng bên dưới để xác định độ tương đồng giữa câu truy vấn q của người sử dụng với mỗi tài liệu d có trong kho dữ liệu tìm kiếm dựa trên sự so khớp với mỗi mục từ t trong câu truy vấn.  tinq (tf(tind)xidf(t2 )xboost(t.fieldind)x lengthNorm(t.fieldind))xcood(q,d)xqueryNorm(q)  Các loại truy vấn Lucene hỗ trợ: Tìm kiếm theo mục từ: TermQuery, Tìm kiếm theo phạm vi: RangeQuery, Tìm kiếm trên chuỗi ký tự: PrefixQuery, Tìm kiếm với toán tử logic: BooleanQuery, Tìm kiếm với ký tự thay thế: WildcardQuery, Tìm kiếm theo cụm từ: PharseQuery, Tìm kiếm mục từ tương tự: FuzzyQuery, Lấy tất cả tài
  • 16. Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvanmaster.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 14 liệu: MatchAllDocsQuery. 2.4.3. Tiến trình phân tích của Lucene Các bước Lucene thường sử dụng để phân tích như:  Sử dụng trình phân tích: dùng khi chuyển văn bản sang  mục từ.   Từ vựng - Token: Analyzer là lớp cơ sở, nó thực hiện chuyển dữ liệu văn bản sang một dòng các từ vựng (Token) trong lớp TokenStream.   Loại bỏ các từ thường dùng - Stopword: StopAnalyzer thực hiện loại bỏ một số từ đặc biệt gọi là các stop word.   Chuẩn hoá từ - Stemming: Tiến trình xử lý cuối cùng là loại bỏ các hình thái khác nhau của từ để đưa nó về dạng gốc.   Phân tích ngôn ngữ: Chúng ta phải giải quyết nhiều vấn đề khi phân tích các văn bản với những ngôn ngữ khác nhau.  2.5. THU THẬP BỘ TÀI LIỆU  Hệ thống tìm kiếm sử dụng nguồn tài liệu có sẵn từ hệ thống lưu trữ của cá nhân và cơ quan nhờ quá trình sưu tầm được trong vài năm trở lại đây. Nguồn dữ liệu này được lưu trữ dưới nhiều hình thức file như doc, docx, xls, xlsx, ppt, pptx, pdf...  2.6. TIỂU KẾT CHƯƠNG  Chương này tôi đã nghiên cứu và đề xuất mô hình tìm kiếm và  đánh giá hệ thống tìm kiếm thông tin. Trong mô hình, tôi đã đề xuất trình bày từng giai đoạn gồm đánh chỉ mục cho tài liệu, giai đoạn tìm kiếm tài liệu và sau đó là giai đoạn đánh giá hệ thống tìm kiếm thông qua tập tài liệu đánh giá. Trong mỗi giai đoạn tôi đều đưa ra mô hình đề xuất và cách xử lý. Ngoài ra việc phân tích các tiến trình của Lucene, thu thập bộ tài liệu cũng là những giải pháp để xây dựng hoàn thiện hệ thống.
  • 17. Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvanmaster.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 15 CHƯƠNG 3 TRIỂN KHAI THỰC NGIỆM 3.1. CÔNG CỤ THỰC NGHIỆM 3.1.1. Ngôn ngữ lập trình Công cụ được sử dụng để xây dựng ứng dụng thử nghiệm của luận văn là ngôn ngữ lập trình Microsoft Visual C#. C# là một ngôn ngữ lập trình hướng đối tượng được phát triển bởi Microsoft, là phần khởi đầu cho kế hoạch .NET của họ. Tên của ngôn ngữ bao gồm kí tự thăng theo Microsoft nhưng theo ECMA là #, chỉ bao gồm dấu số thường. Microsoft phát triển C# dựa trên C++ và Java. C# được miêu tả là ngôn ngữ có được sự cân bằng giữa C++, Visual Basic, Delphi và Java. 3.1.2. Mã nguồn Lucene a. Tải mã nguồn lucene: Người dùng ở khắp nơi có thể truy cập tại địa chỉ http://lucene.apache.org để tìm hiểu cũng như tải về mã nguồn các phiên bản của Lucene. b. Các thành phần của Lucene.NET: Các thành phần chính của Lucene được ứng dụng trong hệ thống: Lucene.Net.Documents, Lucene.Net.Analysis, Lucene.Net.Analysis, Lucene.Net.Index, Lucene.Net.Store, Lucene.Net.QueryParsers, Ngoài ra, một số thành phần có chức năng bổ trợ cho Lucene như Lucene.Net.Util, Lucene.Net.Util.Cache… Sẽ thực hiện các thao tác chuyển đổi, ghi nhớ cho truy cập nhanh hay chứa các thông số cho quá trình tạo chỉ mục cũng như tìm kiếm. c. Các thành phần kế thừa và phát triển mới: VietnameseAnayzer, VietnameseStemFilter, AutoGetFont, AutoConvert, ExtractFile.
  • 18. Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvanmaster.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 16 3.2. CÁC MÔ-ĐUN HỆ THỐNG 3.2.1. Mô-đun tạo chỉ mục Trong mô-đun này, cho phép người sử dụng thực hiện việc đánh chỉ mục cho tập tài liệu, sử dụng các lớp đối tượng Directory, Field, Document, Analyzer, TopDocs… Để tiến hành việc đánh chỉ mục gồm các giai đoạn cơ bản như: Quá trình rút trích tài liệu, quá trình phân tích tài liệu và quá trình lưu chỉ mục cho tập tài liệu. Hình 3.4. Mô-đun tạo chỉ mục tài liệu 3.2.2. Mô-đun tìm kiếm Trong mô-đun này, thực hiện việc tìm kiếm tài liệu dựa trên các yêu cầu truy vấn của người dùng. Toàn bộ quá trình tìm kiếm được thực hiện dựa trên một số lớp đối tượng như IndexSearcher, IndexReader, TopDocs… Ngoài ra đoạn code đã mô tả được các đối tượng mà Lucene sử dụng cho việc khai báo các đối tượng sử dụng trong việc tìm kiếm, cuối cùng là quá trình tìm kiếm.
  • 19. Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvanmaster.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 17 Hình 3.5. Mô-đun tìm kiếm tài liệu 3.2.3. Mô-đun đánh giá Trong mô-đun này, tiến hành việc đánh giá hệ thống tìm kiếm dựa trên tập tài liệu kết quả thu được. Việc đánh giá dựa trên việc tính độ chính xác của hệ thống ứng với các độ đo về độ liên quan. Hình 3.6. Mô-đun đánh giá kết quả tìm kiếm
  • 20. Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvanmaster.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 18 3.3. THỬ NGHIỆM Giao diện dùng để tìm kiếm và tính toán các độ đo cho việc đánh giá kết quả tìm kiếm. Hình 3.15. Kết quả tìm kiếm Hình 3.16. Kết quả đánh giá
  • 21. Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvanmaster.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 19 3.4. KẾT QUẢ VÀ ĐÁNH GIÁ  Thử nghiệm Tiến hành thử nghiệm như sau: Tìm kiếm các câu truy vấn khác nhau với tổng số tài liệu liên quan trả về là 5. Tiến hành truy vấn lần lượt các câu truy vấn trên với tổng số tài liệu liên quan trả về là 5 thì ta có bảng kết quả như sau: Bảng 3.1. Bảng giá trị R, P tính với n tài liệu được trả về Số tài liệu liên Số tài liệu Độ bao Độ chính N quan được trả trả về phủ (R) xác (P) về 1 1 1 1/5=0.2 1/1=1.00 2 2 2 2/5=0.4 2/2=1.00 3 2 3 2/5=0.4 2/3=0.67 4 3 4 3/5=0.6 3/4=0.75 5 3 5 3/5=0.6 3/5=0.60 6 4 6 4/5=0.8 4/6=0.67 7 4 7 4/5=0.8 4/7=0.57 8 4 8 4/5=0.8 4/8=0.50 9 4 9 4/5=0.8 4/9=0.44 10 4 10 4/5=0.8 4/10=0.40 11 4 11 4/5=0.8 4/11=0.36 12 4 12 4/5=0.8 4/12=0.33 13 5 13 4/5=0.8 5/13=0.38 14 5 14 5/5=1.0 5/14=0.36 - Sau khi lấy được độ chính xác ở thứ hạng k tài liệu đầu, tiến hành lấy độ chính xác trung bình (Mean average precision – MAP) để so sánh tổng hợp và đưa ra đánh giá ban đầu cho hệ thống.
  • 22. Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvanmaster.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 20 Nhìn bảng giá trị trên, ta thấy tại giá trị R=0.6 có 2 giá trị P (P=0.75 và P=0.6) và ngược lại tại giá trị P=1.0 có 2 giá trị R (R=0.2, R=0.4). Để xây dựng đường cong cho một câu truy vấn ta dùng phương pháp tính nội suy độ chính xác dựa trên 11 điểm chuẩn của độ bao phủ: Xét các giá trị R tại các điểm chuẩn 0.0, 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7. 0.8, 0.9, 1.0. Tại các vị trí tính giá trị P theo công thức sau: PR(i) = max PR(j) với j>=i Bảng 3.2. Bảng nội suy các giá trị P cho câu hỏi thứ k Độ bao phủ Độ chính Độ bao phủ Độ chính N xác đã nội (R) xác (P) chuẩn hóa suy 1 1/5=0.2 1/1=1.00 hóa 1.00 2 2/5=0.4 2/2=1.00 0.1 1.00 3 2/5=0.4 2/3=0.67 0.2 1.00 4 3/5=0.6 3/4=0.75 0.3 1.00 5 4/5=0.8 3/5=0.60 0.4 1.00 6 4/5=0.8 4/6=0.67 0.5 0.75 7 4/5=0.8 4/7=0.57 0.6 0.75 8 4/5=0.8 4/8=0.50 0.7 0.67 9 4/5=0.8 4/9=0.44 0.8 0.67 10 4/5=0.8 4/10=0.40 0.9 0.38 11 4/5=0.8 4/11=0.36 1.0 0.38 12 4/5=0.8 4/12=0.33 13 5/5=1.0 5/13=0.38 14 5/5=1.0 5/14=0.36
  • 23. Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvanmaster.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 21 Đồ thị RP cho câu hỏi thứ k Hình 3.17. Đồ thị RP cho câu hỏi thứ k  Kết luận: Tiến hành thử nghiệm trên cùng một máy tính cá nhân cấu hình: Intel (R) Core (TM) i3-4005U CPU, tốc độ xử lý 1.70GHz, RAM 4.00 GB, Dung lượng ổ cứng 500 GB, bộ tài liệu thử nghiệm là bộ tài liệu nhỏ và vừa với khoảng 255 tệp văn bản ta thu được kết quả như sau: Bảng 3.3. Bảng so sánh kết quả các công cụ tìm kiếm Lucene WDS GD Khả - Các loại tệp - Các loại tệp - Các loại tệp như: Văn bản, như: Văn bản, như: Văn bản, năng tìm hình ảnh... hình ảnh, âm hình ảnh, âm kiếm thanh, Web... thanh, Web... - Không giới - Không giới - Có giới hạn số Lập chỉ hạn số lượng tài hạn số lượng tài lượng tài liệu liệu lập chỉ mục. liệu lập chỉ mục. lâp chỉ mục là mục dưới 10.000 tài liệu.
  • 24. Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvanmaster.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 22 Lucene WDS GD - Thời gian - Thời gian - Thời gian Lập chỉ trung bình: ~ 1s/ trung bình: trung bình: mục 1 tài liệu. ~1.2s/ 1 tài liệu. ~1.3s/ 1 tài liệu. - Mức độ tìm - Mức độ tìm - Mức độ tìm kiếm: Tìm kiếm kiếm: Tìm kiếm kiếm: Tìm kiếm theo tên tệp, tiêu theo tên tệp, theo tên tệp, đề, loại tệp, nội ngày lưu tệp, ngày lưu tệp, dung... Ngoài ra chủ đề... Chủ chủ đề... Chủ Lucene còn giới yếu là theo tên yếu theo tên tệp. hạn về số lượng tệp. và thời gian tìm kiếm. - Thời gian tìm - Thời gian tìm - Thời gian tìm kiếm: Trung kiếm trung bình: kiếm trung bình: Tìm kiếm bình ~0.05s/ 1 Trung bình ~ Trung bình ~ lần tìm kiếm. 0.1s/ 1 lần tìm 0.1s/ 1 lần tìm kiếm. kiếm. - Kết quả trả về: - Kết quả trả về: - Kết quả trả về: Kết quả tài liệu Kết quả tài liệu Kết quả tài liệu liên quan được liên quan được liên quan được trả về so với câu trả về so với câu trả về so với câu truy vấn tương truy vấn có độ truy vấn có độ ứng có độ chính chính xác không chính xác không xác ~78%. cao hoặc không cao hoặc không tìm thấy kết quả. tìm thấy kết quả.
  • 25. Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvanmaster.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 23  Đánh giá - Qua nghiên cứu này, đã thu được một số kết quả ban đầu làm tiền đề quan trọng cho những nghiên cứu sau. Nghiên cứu đã xem lại một cách có hệ thống việc tìm kiếm và đánh giá các hệ thống tìm kiếm thông tin. - Có thể tích hợp thư viện mã nguồn mở Lucene với nhiều ngôn ngữ khác nhau nhằm phục vụ cho việc tìm kiếm và đánh giá hệ thống tìm kiếm thông qua nhiều phương pháp khác nhau. - Mô hình tìm kiếm này rất phù hợp cho việc tìm kiếm tài liệu phục vụ cho công việc ở một cá nhân, gia đình hay một đơn vị cơ quan được tổ chức khép kín (như các tổ chuyên môn trong một trường học, các phòng ban nghành trong một cơ quan nhà nước...). 3.5. TIỂU KẾT CHƯƠNG Trong chương này tôi đã đạt được các kết quả thử nghiệm như sau: Sử dụng ngôn ngữ lập trình C# xây dựng được các demo thử nghiệm cho việc lập chỉ mục, tìm kiếm tài liệu và tính các độ đo nhằm phục vụ cho việc tổng hợp và đưa ra những kết quả đánh giá cho hệ thống tìm kiếm thông tin.
  • 26. Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvanmaster.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 24 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN Qua thời gian nghiên cứu, thử nghiệm và ứng dụng, luận văn đã đạt được một số kết quả: - Bước đầu nghiên cứu, ứng dụng và khai thác công cụ để giải quyết những khó khăn đang tồn tại trong lĩnh vực tìm kiếm. - Bước đầu xây dựng thành công cơ bản một hệ thống tìm kiếm và đánh giá hệ thống tìm kiếm phục vụ yêu cầu cấp thiết của một cá nhân hoặc đơn vị. - Mở ra hướng nghiên cứu ứng dựng trong lĩnh vực tìm kiếm và đánh giá hệ thống tìm kiếm. Dựa trên những kết quả thu được này xin đề xuất một số hướng phát triển tiếp theo như sau: - Việc so sánh các phương pháp trên cùng một tập dữ liệu chuẩn, dùng chung là quan trọng để đánh giá một cách khách quan. - Việc phân tích thống kê các kết quả thu được cũng rất quan trọng để biết được phương pháp nào tốt hơn thực sự và đánh giá được mức độ của sự khác biệt. - Nghiên cứu chuyên sâu để có những cải tiến phù hợp cho mô hình phát triển ứng dụng. - Cách tiếp cận này nên được mở rộng ra các lĩnh vực khác của khoa học máy tính. - Cần nghiên cứu các kỹ thuật tinh chỉnh tham số và tối ưu các phương pháp cho các lần nghiên cứu kế tiếp. - Mong muốn được tiếp tục nghiên cứu và phát triển hệ thống. Cần sự trợ giúp về nguồn thông tin, sự đóng góp của các nhà phát triển trong lĩnh vực này để có thể góp phần làm nên hệ thống đủ mạnh, có tính ứng dụng cao phục vụ cho nhu cầu của nhiều người sử dụng.