BÁO CÁO TỐT NGHIỆP LUẬN VĂN THẠC SĨ NGÀNH HỆ THỐNG THÔNG TIN
XÂY DỰNG ONTOLOGY PHỤC VỤ TÌM KIẾM NGỮ NGHĨA ĐỘNG VẬT RỪNG TRÊN ĐỊA BÀN THÀNH PHỐ ĐÀ NẴNG
Học viên: Trần Xuân Trường
Cán bộ hướng dẫn: TS. Nguyễn Trần Quốc Vinh
Xem tiếp U19 Việt Nam:
Pha cứu thua xuất sắc của Minh Long ở trận gặp U19 Trung Quốc : https://www.youtube.com/watch?v=f4HM5...
U19 chia tay - Công Phượng và Tuấn Tài ôm nhau khóc nức nở: https://www.youtube.com/watch?v=H2eyD...
U19 Việt Nam trình diễn Tiqui-taca thương hiệu Việt: https://www.youtube.com/watch?v=sgknk...
Cầu thủ U19 Việt Nam đẫm lệ ngày chia tay: https://www.youtube.com/watch?v=Oiy0-...
U19 Việt Nam lập tức dùng liệu pháp ngâm nước đá để hồi phục : https://www.youtube.com/watch?v=XTaGV...
Phó chủ tịch VFF Đoàn Nguyên Đức kêu gọi các cầu thủ U19 Việt Nam đoàn kết: https://www.youtube.com/watch?v=UuF-F...
Xúc động với hình ảnh cầu thủ U19 Việt Nam dìu nhau đứng dậy : https://www.youtube.com/watch?v=ru87K...
Xem tiếp U19 HAGL:
Kỳ 1: http://www.youtube.com/watch?v=Yg0cGW...
Kỳ 2: http://www.youtube.com/watch?v=BUbSoC...
Kỳ 3: http://www.youtube.com/watch?v=OWIjhh...
Kỳ 4: http://www.youtube.com/watch?v=R2OOxo...
Trần Gia Huy - "Siêu nhân" nhí của lò HAGL Arsenal JMG: https://www.youtube.com/watch?v=JYc0U...
SÁNG KIẾN ÁP DỤNG CLT (COMMUNICATIVE LANGUAGE TEACHING) VÀO QUÁ TRÌNH DẠY - H...
XÂY DỰNG ONTOLOGY PHỤC VỤ TÌM KIẾM NGỮ NGHĨA ĐỘNG VẬT RỪNG TRÊN ĐỊA BÀN THÀNH PHỐ ĐÀ NẴNG
1. BỘ GIÁO DỤC VÀ ĐÀO TẠO
ĐẠI HỌC ĐÀ NẴNG
BÁO CÁO TỐT NGHIỆP
LUẬN VĂN THẠC SĨ NGÀNH HỆ THỐNG THÔNG TIN
XÂY DỰNG ONTOLOGY
PHỤC VỤ TÌM KIẾM NGỮ NGHĨA ĐỘNG VẬT RỪNG
TRÊN ĐỊA BÀN THÀNH PHỐ ĐÀ NẴNG
Học viên: Trần Xuân Trường
Cán bộ hướng dẫn: TS. Nguyễn Trần Quốc Vinh
Đà Nẵng, tháng 7 năm 2016
2. NỘI DUNG TRÌNH BÀY
Giới thiệu
Bối cảnh, đặt vấn đề
Mục đích đề tài
Nội dung triển khai
Đề xuất giải pháp
Nghiên cứu tổng quan
Lý thuyết về Semantic Web
Lý thuyết về Ontology
Động vật rừng trên địa bàn thành phố Đà Nẵng
Phần mềm biên tập và xây dựng ontology
Xây dựng ontology và phần mềm
Kết luận và hướng phát triển 2
3. GIỚI THIỆU
Bối cảnh
Thành phố Đà Nẵng có lợi thế rất lớn về địa hình và được
thiên nhiên ban tặng cho nhiều sinh vật có giá trị, là một trong
những thành phố hiếm có trên thế giới về đa dạng sinh học,
nơi hội tụ sự đa dạng các hệ sinh thái rừng, biển và sông.
Hệ động vật rừng của thành phố Đà Nẵng đặc trưng cho khu
hệ động vật Nam Trường Sơn với các loài Voọc vá, Khỉ đuôi
dài,… và Bắc Trường Sơn: Tê tê, Gà tiền, Khỉ vàng.
Mặc dù sự phân bố loài không đồng đều trong các lớp động
vật nhưng thành phần thì đa dạng, đặc biệt là nguồn gen các
loài quý hiếm như: Gấu, Beo lửa, Mèo rừng, Cu ly, Vọoc vá
Chân nâu, Trĩ sao, Công, Gà tiền,…
3
4. GIỚI THIỆU
Bối cảnh
Điều tra, thống kê hệ động vật rừng của thành phố Đà Nẵng đã
được nhiều nhà khoa học, cơ quan, tổ chức thực hiện thông
qua các chương trình, dự án, các đề tài,…
Việc công bố các nội dung điều tra, thống kê đó trên internet
để cá nhân, tổ chức khác có nhu cầu tìm hiểu, tra cứu thì còn
nhiều hạn chế. Chủ yếu cung cấp tin tức, số liệu thống kê sơ
lược, chưa có website nào cung cấp chức năng tra cứu
chuyên sâu về hệ động - thực vật nói chung và động vật rừng
nói riêng tại thành phố Đà Nẵng.
4
5. GIỚI THIỆU
Vấn đề đặt ra
Có website nào cung cấp chức năng tra cứu chuyên
sâu về hệ động - thực vật nói chung và động vật rừng
nói riêng tại thành phố Đà Nẵng?
5
6. GIỚI THIỆU
Hướng giải quyết
Xây dựng ontology về động vật rừng thành phố Đà Nẵng.
Và phần mềm khai thác và tìm kiếm động vật.
Phù hợp với chủ trương của Thành phố trong việc góp phần bảo
tồn đa dạng sinh học rừng với mục tiêu Thành phố môi trường mà
Thành phố đã đề ra trong đề án "Xây dựng Đà Nẵng - Thành phố
môi trường“.
Đề xuất thực hiện đề tài “Xây dựng ontology phục vụ tìm
kiếm ngữ nghĩa động vật rừng trên địa bàn thành phố
Đà Nẵng” làm đề tài tốt nghiệp luận văn cao học.
6
8. Nội dung triển khai
ĐỀ XUẤT GIẢI PHÁP
10
Xây dựng ontology dữ liệu động vật
rừng trên địa bàn thành phố Đà Nẵng
Cộng đồng kế thừa,
khai thác và phát triển
Hoàn thiện ontology,
phần mềm tìm kiếm
Phần mềm tìm kiếm
Trọng tâm
9. Lý thuyết Semantic Web
Khái niệm
“Semantic Web là sự mở rộng của Web hiện tại mà
trong đó thông tin được định nghĩa rõ ràng cho người và
máy tính có thể cùng làm việc với nhau một cách hiệu
quả hơn” (Tim Berners-Lee)
NGHIÊN CỨU TỔNG QUAN
11
10. Lý thuyết Semantic Web
Kiến trúc
• Lớp Unicode và URI
• Lớp XML
• Lớp XML schema
• Lớp RDF
• Lớp RDF schema
• Lớp ONTOLOGY
• Lớp LOGIC
• Lớp PROOF
• Lớp TRUST
NGHIÊN CỨU TỔNG QUAN
12
11. Lý thuyết Ontology
Các thành phần của ontology:
“An ontology is a formal, explicit specification of a
shared conceptualization.” (Một ontology là một
hình thức, đặc tả rõ ràng khái niệm chia sẻ)
- R. Studer, R. Benjamins, and D. Fensel.
NGHIÊN CỨU TỔNG QUAN
13
12. Lý thuyết Ontology
Các thành phần của ontology:
Cá thể (Individuals) – Thể hiện
Cá thể là thành phần cơ bản của một ontology. Các cá thể trong một
ontology có thể bao gồm các đối tượng rời rạc như xe, con cọp…,
cũng như các đối tượng trừu tượng như con số và từ.
Lớp (Classes) - Khái niệm
Lớp là những nhóm, bộ hoặc tập hợp các đối tượng. Một lớp có thể
gộp nhiều lớp hoặc được gộp vào lớp khác. Một lớp gộp vào lớp
khác được gọi là lớp con của lớp gộp. Điều quan trọng của quan hệ
xếp gộp là tính kế thừa.
NGHIÊN CỨU TỔNG QUAN
14
13. Lý thuyết Ontology
Các thành phần của ontology:
Thuộc tính (Properties)
Các đối tượng trong ontology có thể được mô tả thông qua việc khai
báo các thuộc tính của chúng. Mỗi một thuộc tính đều có tên và giá
trị của thuộc tính đó. Các thuộc tính được sử dụng để lưu trữ các
thông tin mà đối tượng có thể có.
Mối quan hệ (Relation)
Quan hệ giữa các đối tượng trong một ontology cho biết các đối
tượng liên hệ với đối tượng khác như thế nào.
NGHIÊN CỨU TỔNG QUAN
15
14. Hệ truy vấn SPARQL
SPARQL là một ngôn ngữ để truy cập thông tin từ các đồ thị
RDF/OWL. SPARQL cung cấp các tính năng sau: trích thông tin
trong các dạng của URI, các nút trống hay giá trị nguyên thủy
hoặc các kiểu được định nghĩa từ các giá trị nguyên thủy, trích
thông tin từ các đồ thị con và xây dựng một đồ thị RDF mới
dựa trên thông tin trong đồ thị truy vấn.
NGHIÊN CỨU TỔNG QUAN
16
15. Động vật rừng trên địa bàn thành phố Đà Nẵng
TS. Đinh Thị Phương Anh (1997), Điều tra khu động – thực vật
và nhân tố ảnh hưởng, đề xuất phương án bảo tồn hợp lý khu
bảo tồn thiên nhiên bán đảo Sơn Trà, Sở Khoa học và Công
nghệ thành phố Đà Nẵng.
Sở Nông nghiệp và Phát triển Nông thôn thành phố Đà Nẵng,
Báo cáo tài nguyên rừng thành phố Đà Nẵng.
Hệ động vật rừng thành phố Đà Nẵng, tác giả Mai Hương,
Website Văn phòng thuộc Ban chỉ đạo thành phố Ứng phó biến
đổi khí hậu và nước biển dâng thành phố Đà Nẵng.
NGHIÊN CỨU TỔNG QUAN
17
16. Động vật rừng trên địa bàn thành phố Đà Nẵng
NGHIÊN CỨU TỔNG QUAN
18
TT Đơn vị thống kê
Sông Bắc-Sông
Nam
Sơn Trà
Bà
Nà
1 Số Bộ 23 25 26
2 Số Họ 60 64 80
3 Số Loài 205 135 256
4
Loài quý hiếm
(Sách đỏ Việt Nam)
34 15 44
Bảng 1.1. Phân bố thành phần loài động vật
17. Động vật rừng trên địa bàn thành phố Đà Nẵng
NGHIÊN CỨU TỔNG QUAN
19
Bảng 1.2. Phân bố 3 lớp động vật: thú, chim, bò sát
TT Lớp
Bộ Họ Loài
Sông
Bắc-
Sông
Nam
Sơn
Trà
Bà
Nà
Sông
Bắc-
Sông
Nam
Sơn
Trà
Bà
Nà
Sông
Bắc-
Sông
Nam
Sơn
Trà
Bà
Nà
1 Thú 9 8 8 23 18 26 55 36 61
2 Chim 14 15 16 37 34 46 150 106 178
3 Bò sát 2 2 2 4 8 8 9 24 17
Tổng số 25 25 26 64 64 80 214 165 256
18. Động vật rừng trên địa bàn thành phố Đà Nẵng
Nhờ sự tư vấn của Thạc sĩ Nguyễn Văn Khánh, Trường Đại
học Sư phạm, Đại học Đà Nẵng, giảng dạy và nghiên cứu trong
lĩnh vực sinh học.
NGHIÊN CỨU TỔNG QUAN
20
Xác định: Loài đặc trưng, quý hiếm
19. Phần mềm biên tập và xây dựng ontology
Phần mềm Protégé
Đây là bộ phần mềm mã nguồn mở Java được nghiên cứu và
phát triển từ năm 1998 bởi nhóm nghiên cứu của Mark Musen
thuộc đại học Stanford, California nhằm quản lý các thông tin
trong lĩnh vực sinh y học. Đây là dự án được nhận được sự
quan tâm và tài trợ từ rất nhiều tổ chức, trong đó có Bộ Quốc
Phòng Mỹ. Hiện nay, nó có một cộng đồng hàng nghìn người
sử dụng và đã có rất nhiều miền ứng dụng khác nhau sử dụng
sự hỗ trợ của công cụ này.
Mã nguồn Protégé có thể được tìm thấy tại website: http://smi-
protege.stanford.edu/.
NGHIÊN CỨU TỔNG QUAN
21
20. Xây dựng ontology và phần mềm
XÂY DỰNG ONTOLOGY VÀ PHẦN MỀM
22
Quy trình
Nguồn thông tin,
dữ liệu
Nghiên cứu
Sách đỏ
Website,…
Ontology và
phần mềm
Phần mềm Protégé
21. Xây dựng ontology động vật rừng
Quy trình phát triển gồm 7 bước do Stanford Center for Biomedical
Informatics Research đưa ra được đa số các nghiên cứu trước đây
chọn và tuân theo.
Bước 1: Xác định lĩnh vực và phạm vi của Ontology
Bước 2: Xem xét việc kế thừa các ontology có sẵn
Bước 3: Liệt kê các thuật ngữ quan trọng
Bước 4: Xác định các lớp và phân cấp của các lớp
Bước 5: Xác định các thuộc tính
Bước 6: Xác định ràng buộc của các thuộc tính
Bước 7: Tạo các thể hiện/ thực thể
XÂY DỰNG ONTOLOGY VÀ PHẦN MỀM
23
22. Xây dựng ontology động vật rừng
Bước 1: Xác định lĩnh vực và phạm vi của Ontology
Lĩnh vực cần xây dựng ontology ở đây là thông tin liên quan đến các
loài động vật rừng ở thành phố Đà Nẵng, mà cụ thể là xem xét các
thông tin chi tiết về hình dáng, màu sắc, bộ phận cơ thể, tập tính sinh
sống, thức ăn, cách săn mồi,… bên cạnh đó là thông tin về giá trị
khoa học, kinh tế, thông tin bảo tồn đa dạng sinh học.
Luận văn này sẽ chủ yếu tập trung vào xây dựng ontology cho một
số loài động vật quý hiếm, mô tả thông tin về các loài đó. Tri thức về
động vật rừng thành phố Đà Nẵng được chia sẻ theo cách cho phép
người dùng tìm được các loài động vật.
XÂY DỰNG ONTOLOGY VÀ PHẦN MỀM
24
23. Xây dựng ontology động vật rừng
Bước 2: Xem xét việc kế thừa các ontology có sẵn
Qua tìm hiểu, việc xây dựng ontology cho động vật nói chung vẫn
còn rất ít, một số nguồn ontology ở nước ngoài, đã xây dựng bằng
tiếng anh và cho phép khai thác nhưng không cho phép kế thừa,
phát triển. Bên cạnh đó, ontology về động vật tại Việt Nam vẫn chưa
có nghiên cứu và xây dựng.
Vì vậy, không có ontology sẵn có về động vật để kế thừa, yêu cầu
phải nghiên cứu xây dựng từ đầu. Đây là một vấn đề trở ngại nhất
đối với vấn đề nghiên cứu trong luận văn này.
XÂY DỰNG ONTOLOGY VÀ PHẦN MỀM
25
24. Xây dựng ontology động vật rừng
Bước 3: Liệt kê các thuật ngữ quan trọng
XÂY DỰNG ONTOLOGY VÀ PHẦN MỀM
26
Động vật Có dây sống
Không có dây sống Thú
Linh trưởng Loài
Máu nóng Máu lạnh
Đẻ trứng Sinh con
Lưỡng cư Bò sát
Chim Bay
Có túi Gặm nhấm
Có vú Mỏ vịt
Cá Chim
Bảng 2.1. Một số thuật ngữ về động vật
25. Xây dựng ontology động vật rừng
Bước 3: Liệt kê các thuật ngữ quan trọng
XÂY DỰNG ONTOLOGY VÀ PHẦN MỀM
27
Bảng 2.1. Thuật ngữ về tập tính, sinh sản, thức ăn,…
Thụ tinh trong Thụ tinh ngoài
Chi Lông
Lưỡi Miệng
Móng vuốt Mắt
Đuôi Vây
Xương Cánh
Tim Mang
Bơi Bay
Chạy Bò
Đi Nhảy
Lá Hoa
Quả Chồi non
Địa y Trọng lượng
26. Xây dựng ontology động vật rừng
Bước 4: Xác định các lớp và phân cấp của các lớp
XÂY DỰNG ONTOLOGY VÀ PHẦN MỀM
28
Bảng 2.1. Lớp và phân cấp lớp động vật
Wikipedia
27. Xây dựng ontology động vật rừng
Bước 4: Xác định các lớp và phân cấp của các lớp
XÂY DỰNG ONTOLOGY VÀ PHẦN MỀM
29
28. Xây dựng ontology động vật rừng
Bước 5: Xác định các thuộc tính
Từ danh sách một số thuật ngữ về tập tính, sinh sản, thức ăn,…ở
mục 2.5.3, có thể xác định thuộc tính của các lớp. Mỗi thuộc tính mô
tả cho một hoặc nhiều lớp. Ví dụ lớp Động vật có các thuộc tính sau:
Có mô trường sống, có phân bố, có trọng lượng, có độ dài, có màu
lông, có cách săn mồi, Có tai, có mắt,…
Bên cạnh đó, việc xem xét các từ đồng nghĩa cho thuộc tính rất quan
trọng, ví dụ: thuộc tính trọng lượng đồng nghĩa với cân nặng, độ dài
đồng nghĩa với chiều dài, chi đồng nghĩa với tay, chân,…
XÂY DỰNG ONTOLOGY VÀ PHẦN MỀM
30
29. Xây dựng ontology động vật rừng
Bước 6: Xác định ràng buộc của các thuộc tính
Từ các thuộc tính đã xác định, ta xác định kiểu ràng buộc cho thuộc tính là
giá trị, max, min, chuỗi,… Ví dụ, thuộc tính có trọng lượng (cân nặng) là
kiểu số nhận giá trị từ 30kg đến 90kg, tương tự là có độ dài (chiều dài); Có
thân nhận giá trị kiểu chuỗi ký tự (string) khi đó ta mô tả hình dạng thân,
một số đặc điểm trên thân, tương tự là thuộc tính có mắt, có tai, có
đuôi,…Thuộc tính có gia trị khoa học, có biện pháp bảo tồn,…cũng ràng
buộc giá trị kiểu chuỗi ký tự để mô tả về thuộc tính đó.
XÂY DỰNG ONTOLOGY VÀ PHẦN MỀM
31
30. Xây dựng ontology động vật rừng
Bước 7: Tạo các thể hiện/ thực thể
XÂY DỰNG ONTOLOGY VÀ PHẦN MỀM
32
Danh sách một số loài động vật quý hiếm đã sử dụng làm
thể hiện:
Bảng 2.1. Thể hiện/ thực thể động vật
31. Ontology và phần mềm
XÂY DỰNG ONTOLOGY VÀ PHẦN MỀM
33
32. Ontology và phần mềm
Hỗ trợ cộng đồng kế thừa và phát triển
XÂY DỰNG ONTOLOGY VÀ PHẦN MỀM
34
33. Ontology và phần mềm
Tìm kiếm
XÂY DỰNG ONTOLOGY VÀ PHẦN MỀM
35
34. Ontology và phần mềm
XÂY DỰNG ONTOLOGY VÀ PHẦN MỀM
36
35. KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN
Kết quả đạt được
Về mặt lý thuyết, nghiên cứu này đã tìm hiểu được các nội dung
kiến thức cơ bản, nêu được những nét đặc trưng, ưu thế của web
semantic. Tìm hiểu được phương pháp, ngôn ngữ, công cụ hỗ
trợ xây dựng ontology, đưa ra được phương pháp xây dựng
ontology động vật rừng.
Đối với kết quả thực nghiệm, luận văn đã áp dụng kiến thức,
phương pháp đã tìm hiểu để xây dựng ontology cho dữ liệu động
vật rừng trên địa bàn thành phố Đà Nẵng và xây dựng được
phần mềm để hỗ trợ việc khai thác và tìm kiếm ngữ nghĩa dựa
trên ontology động vật đã xây dựng.
37
36. KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN
Hạn chế
Ontology chỉ ở quy mô nhỏ, chưa thật sự lớn và phong phú. Ta cần
phải có được dữ liệu ontology đầy đủ để đánh giá mức độ xử lý tìm
kiếm chính xác cũng như mức độ đáp ứng được bao nhiêu người
dùng truy cập ứng dụng cùng một lúc.
Đồng thời, phần mềm ứng dụng vẫn còn chủ yếu hỗ trợ cộng đồng
kế thừa và tiếp tục phát triển ontology động vật rừng, chức năng tìm
kiếm vẫn còn đơn giản, cần đưa ra phương pháp tìm kiếm hiệu quả
hơn.
38
37. KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN
Hướng phát triển
Trong tương lai luận văn này có thể tiếp tục phát triển để ứng dụng
được vào thực tiễn. Để đạt được mục đích này cần phải tiếp tục xây
dựng và hoàn thiện ontology, làm phong phú dữ liệu các loài động
vật. Đồng thời dựa trên kinh nghiệm đã có để phát triển ontology
cho thực vật.
39
38. KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN
Kiến nghị
Để việc nghiên cứu xây dựng và phát triển ontology động vật, cũng
như phần mềm hỗ trợ tìm kiếm ngữ nghĩa động vật ngày càng hoàn
thiện và được ứng dụng vào thực tiễn, tôi kính đề nghị Khoa Tin học
– Trường Đại học Sư Phạm và Đại học Đà Nẵng tiếp tục quan tâm,
hỗ trợ và hướng dẫn các học viên có hướng nghiên cứu tương tự
sau này.
40
Kính thưa các thầy cô!
Tháng 9/2015, tôi đã được các thầy cô ở hội đồng xét duyệt đề cương góp ý kiến và cho phép thực hiện Luận văn tốt nghiệp với Đề tài: XÂY DỰNG ONTOLOGY PHỤC VỤ TÌM KIẾM NGỮ NGHĨA ĐỘNG VẬT RỪNG TRÊN ĐỊA BÀN THÀNH PHỐ ĐÀ NẴNG. Hôm nay, tôi xin được báo cáo nội dung đã thực hiện và kết quả đạt được.
Nội dung trình bày gồm các phần: Giới thiệu, Đề xuất giải pháp, Nghiên cứu tổng qua, Xây dựng ontology và phần mềm, cuối cùng là Kết luận và hướng phát triển.
Trong đó, phần Giới thiệu sẽ nêu ra Bối cảnh, từ đó đặt ra vấn đề, cũng như Mục đích của đề tài và Nội dung triển khai công việc thực hiện. Đề xuất giải pháp để giải quyết vấn đề. Sau đó, nghiên cứu các Cơ sở lý thuyết, dữ liệu động vật rừng, các phần mềm biên tập xây dựng ontology. Từ đó xây dựng Ontology và phần mềm.
Bối cảnh: trình bày như Slide
Bối cảnh: trình bày như Slide
Trình bày như Slide
Trình bày như Slide
Dự phòng
Dự phòng
Trình bày như Slide
Có thể Tóm tắt Nội dung triển khai như sau: Trọng tâm là xây dựng ontology …. để cộng đồng có thể kế thừa, khai thác và phát triển, vì với sự xây dựng của một cá nhân thì sẽ thiếu sót và chưa hoàn thiện. Vì vậy, sau khi xây dựng ontology, có thể cung cấp cho cộng đồng kế thừa và phát triển để hoàn thiện ontology cũng như phát triển phần mềm tìm kiếm hiệu quả trên Ontology.
Trình bày như Slide
Trình bày như Slide
Lướt nhanh – Dự phòng
Trình bày như Slide
Trình bày như Slide
Trình bày như Slide
Trình bày như Slide
Trình bày như Slide
Trình bày như Slide
Trình bày như Slide
Bước 1: Xác định lĩnh vực và phạm vi của Ontology
Lĩnh vực cần xây dựng ontology ở đây là thông tin liên quan đến các loài động vật rừng ở thành phố Đà Nẵng, mà cụ thể là xem xét các thông tin chi tiết về hình dáng, màu sắc, bộ phận cơ thể, tập tính sinh sống, thức ăn, cách săn mồi,… bên cạnh đó là thông tin về giá trị khoa học, kinh tế, thông tin bảo tồn đa dạng sinh học.
Luận văn này sẽ chủ yếu tập trung vào xây dựng ontology cho một số loài động vật quý hiếm, mô tả thông tin về các loài đó. Tri thức về động vật rừng thành phố Đà Nẵng được chia sẻ theo cách cho phép người dùng tìm được các loài động vật.
Bước 2: Xem xét việc kế thừa các ontology có sẵn
Qua tìm hiểu, việc xây dựng ontology cho động vật nói chung vẫn còn rất ít, một số nguồn ontology ở nước ngoài, đã xây dựng bằng tiếng anh và cho phép khai thác nhưng không cho phép kế thừa, phát triển. Bên cạnh đó, ontology về động vật tại Việt Nam vẫn chưa có nghiên cứu và xây dựng.
Vì vậy, không có ontology sẵn có về động vật để kế thừa, yêu cầu phải nghiên cứu xây dựng từ đầu. Đây là một vấn đề trở ngại nhất đối với vấn đề nghiên cứu trong luận văn này.
Bước 3: Liệt kê các thuật ngữ quan trọng
Ontology được xây dựng trên cơ sở các khái niệm trong một lĩnh vực cụ thể, vì vậy khi xây dựng ontology cần bắt đầu từ các thuật ngữ chuyên ngành để xây dựng thành các lớp trong ontology tương ứng.
Danh sách một số thuật ngữ về động vật như sau: Bảng 2.1. Một số thuật ngữ về động vật: Động vật Có dây sống Không có dây sống Thú Linh trưởng Loài Máu nóng Máu lạnh Đẻ trứng Sinh con Lưỡng cư Bò sát Chim Bay Có túi Gặm nhấm Có vú Mỏ vịt Cá Chim Ăn thịt …
Danh sách một số thuật ngữ về tập tính, sinh sản, thức ăn,… như sau: Bảng 2.2. Thuật ngữ về tập tính, sinh sản, thức ăn,… Thụ tinh trong Thụ tinh ngoài Chi Lông Lưỡi Miệng Móng vuốt Mắt Đuôi Vây Xương Cánh Tim Mang Bơi Bay Chạy Bò Đi Nhảy Lá Hoa Quả Chồi non Địa y Trọng lượng Độ dài …
Bước 4: Xác định các lớp và phân cấp của các lớp
Đây là một trong hai bước quan trọng nhất của việc xây dựng một ontology. Bước này định nghĩa các lớp từ một số thuật ngữ đã liệt kê trong bước 3, sau đó xây dựng cấu trúc lớp phân cấp theo quan hệ “lớp cha - lớp con”.
Xây dựng cấu trúc phân lớp cho dữ liệu động vật rừng thành phố Đà Nẵng thực hiện theo cấu trúc từ trên xuống, bắt đầu bằng các lớp có mức độ tổng quát cao nhất, sau đó triển khai dần đến lớp lá, ví dụ phân cấp lớp động vật:
Hình 2.1. Lớp và phân cấp lớp động vật
Bước 5: Xác định các thuộc tính
Từ danh sách một số thuật ngữ về tập tính, sinh sản, thức ăn,…ở mục 2.5.3, có thể xác định thuộc tính của các lớp. Mỗi thuộc tính mô tả cho một hoặc nhiều lớp. Ví dụ lớp Động vật có các thuộc tính sau: Có mô trường sống, có phân bố, có trọng lượng, có độ dài, có màu lông, có cách săn mồi, Có tai, có mắt,…
Bên cạnh đó, việc xem xét các từ đồng nghĩa cho thuộc tính rất quan trọng, ví dụ: thuộc tính trọng lượng đồng nghĩa với cân nặng, độ dài đồng nghĩa với chiều dài, chi đồng nghĩa với tay, chân,…
Bước 6: Xác định ràng buộc của các thuộc tính
Từ các thuộc tính đã xác định, ta xác định kiểu ràng buộc cho thuộc tính là giá trị, max, min, chuỗi,… Ví dụ, thuộc tính có trọng lượng (cân nặng) là kiểu số nhận giá trị từ 30kg đến 90kg, tương tự là có độ dài (chiều dài); Có thân nhận giá trị kiểu chuỗi ký tự (string) khi đó ta mô tả hình dạng thân, một số đặc điểm trên thân, tương tự là thuộc tính có mắt, có tai, có đuôi,…Thuộc tính có gia trị khoa học, có biện pháp bảo tồn,…cũng ràng buộc giá trị kiểu chuỗi ký tự để mô tả về thuộc tính đó.
Bước 7: Tạo các thể hiện/ thực thể
Trong khuôn khổ của luận văn này, tôi tập trung nghiên cứu xây dựng ontology cho động vật rừng thành phố Đà Nẵng, chọn lọc một số loài động vật quý hiếm để sử dụng làm thể hiện (thực thể - individuals).
Danh sách một số loài động vật quý hiếm đã sử dụng làm thể hiện:
Hình 2.2. Thể hiện/ thực thể động vật
Trong đó: loài Chà vá chân nâu (Voọc chà vá chân nâu), Chà vá chân đen (Voọc chà vá chân đen) đại diện cho Chi Chà vá (Voọc) và loài Khỉ đuôi lợn, Khỉ vàng thuộc họ Khỉ, loài Gấu chó thuộc họ Gấu, loài Báo hoa mai thuộc họ Mèo, loài Cầy mực thuộc họ Cầy, loài Tê tê vàng thuộc họ Tê tê,…
Bước 1: Xác định lĩnh vực và phạm vi của Ontology
Lĩnh vực cần xây dựng ontology ở đây là thông tin liên quan đến các loài động vật rừng ở thành phố Đà Nẵng, mà cụ thể là xem xét các thông tin chi tiết về hình dáng, màu sắc, bộ phận cơ thể, tập tính sinh sống, thức ăn, cách săn mồi,… bên cạnh đó là thông tin về giá trị khoa học, kinh tế, thông tin bảo tồn đa dạng sinh học.
Luận văn này sẽ chủ yếu tập trung vào xây dựng ontology cho một số loài động vật quý hiếm, mô tả thông tin về các loài đó. Tri thức về động vật rừng thành phố Đà Nẵng được chia sẻ theo cách cho phép người dùng tìm được các loài động vật.
Bước 2: Xem xét việc kế thừa các ontology có sẵn
Qua tìm hiểu, việc xây dựng ontology cho động vật nói chung vẫn còn rất ít, một số nguồn ontology ở nước ngoài, đã xây dựng bằng tiếng anh và cho phép khai thác nhưng không cho phép kế thừa, phát triển. Bên cạnh đó, ontology về động vật tại Việt Nam vẫn chưa có nghiên cứu và xây dựng.
Vì vậy, không có ontology sẵn có về động vật để kế thừa, yêu cầu phải nghiên cứu xây dựng từ đầu. Đây là một vấn đề trở ngại nhất đối với vấn đề nghiên cứu trong luận văn này.
Bước 3: Liệt kê các thuật ngữ quan trọng
Ontology được xây dựng trên cơ sở các khái niệm trong một lĩnh vực cụ thể, vì vậy khi xây dựng ontology cần bắt đầu từ các thuật ngữ chuyên ngành để xây dựng thành các lớp trong ontology tương ứng.
Danh sách một số thuật ngữ về động vật như sau: Bảng 2.1. Một số thuật ngữ về động vật: Động vật Có dây sống Không có dây sống Thú Linh trưởng Loài Máu nóng Máu lạnh Đẻ trứng Sinh con Lưỡng cư Bò sát Chim Bay Có túi Gặm nhấm Có vú Mỏ vịt Cá Chim Ăn thịt …
Danh sách một số thuật ngữ về tập tính, sinh sản, thức ăn,… như sau: Bảng 2.2. Thuật ngữ về tập tính, sinh sản, thức ăn,… Thụ tinh trong Thụ tinh ngoài Chi Lông Lưỡi Miệng Móng vuốt Mắt Đuôi Vây Xương Cánh Tim Mang Bơi Bay Chạy Bò Đi Nhảy Lá Hoa Quả Chồi non Địa y Trọng lượng Độ dài …
Bước 3: Liệt kê các thuật ngữ quan trọng
Ontology được xây dựng trên cơ sở các khái niệm trong một lĩnh vực cụ thể, vì vậy khi xây dựng ontology cần bắt đầu từ các thuật ngữ chuyên ngành để xây dựng thành các lớp trong ontology tương ứng.
Danh sách một số thuật ngữ về động vật như sau: Bảng 2.1. Một số thuật ngữ về động vật: Động vật Có dây sống Không có dây sống Thú Linh trưởng Loài Máu nóng Máu lạnh Đẻ trứng Sinh con Lưỡng cư Bò sát Chim Bay Có túi Gặm nhấm Có vú Mỏ vịt Cá Chim Ăn thịt …
Danh sách một số thuật ngữ về tập tính, sinh sản, thức ăn,… như sau: Bảng 2.2. Thuật ngữ về tập tính, sinh sản, thức ăn,… Thụ tinh trong Thụ tinh ngoài Chi Lông Lưỡi Miệng Móng vuốt Mắt Đuôi Vây Xương Cánh Tim Mang Bơi Bay Chạy Bò Đi Nhảy Lá Hoa Quả Chồi non Địa y Trọng lượng Độ dài …
Bước 4: Xác định các lớp và phân cấp của các lớp
Đây là một trong hai bước quan trọng nhất của việc xây dựng một ontology. Bước này định nghĩa các lớp từ một số thuật ngữ đã liệt kê trong bước 3, sau đó xây dựng cấu trúc lớp phân cấp theo quan hệ “lớp cha - lớp con”.
Xây dựng cấu trúc phân lớp cho dữ liệu động vật rừng thành phố Đà Nẵng thực hiện theo cấu trúc từ trên xuống, bắt đầu bằng các lớp có mức độ tổng quát cao nhất, sau đó triển khai dần đến lớp lá, ví dụ phân cấp lớp động vật:
Hình 2.1. Lớp và phân cấp lớp động vật
Bước 4: Xác định các lớp và phân cấp của các lớp
Đây là một trong hai bước quan trọng nhất của việc xây dựng một ontology. Bước này định nghĩa các lớp từ một số thuật ngữ đã liệt kê trong bước 3, sau đó xây dựng cấu trúc lớp phân cấp theo quan hệ “lớp cha - lớp con”.
Xây dựng cấu trúc phân lớp cho dữ liệu động vật rừng thành phố Đà Nẵng thực hiện theo cấu trúc từ trên xuống, bắt đầu bằng các lớp có mức độ tổng quát cao nhất, sau đó triển khai dần đến lớp lá, ví dụ phân cấp lớp động vật:
Hình 2.1. Lớp và phân cấp lớp động vật
Bước 5: Xác định các thuộc tính
Từ danh sách một số thuật ngữ về tập tính, sinh sản, thức ăn,…ở mục 2.5.3, có thể xác định thuộc tính của các lớp. Mỗi thuộc tính mô tả cho một hoặc nhiều lớp. Ví dụ lớp Động vật có các thuộc tính sau: Có mô trường sống, có phân bố, có trọng lượng, có độ dài, có màu lông, có cách săn mồi, Có tai, có mắt,…
Bên cạnh đó, việc xem xét các từ đồng nghĩa cho thuộc tính rất quan trọng, ví dụ: thuộc tính trọng lượng đồng nghĩa với cân nặng, độ dài đồng nghĩa với chiều dài, chi đồng nghĩa với tay, chân,…
Bước 6: Xác định ràng buộc của các thuộc tính
Từ các thuộc tính đã xác định, ta xác định kiểu ràng buộc cho thuộc tính là giá trị, max, min, chuỗi,… Ví dụ, thuộc tính có trọng lượng (cân nặng) là kiểu số nhận giá trị từ 30kg đến 90kg, tương tự là có độ dài (chiều dài); Có thân nhận giá trị kiểu chuỗi ký tự (string) khi đó ta mô tả hình dạng thân, một số đặc điểm trên thân, tương tự là thuộc tính có mắt, có tai, có đuôi,…Thuộc tính có gia trị khoa học, có biện pháp bảo tồn,…cũng ràng buộc giá trị kiểu chuỗi ký tự để mô tả về thuộc tính đó.
Bước 7: Tạo các thể hiện/ thực thể
Trong khuôn khổ của luận văn này, tôi tập trung nghiên cứu xây dựng ontology cho động vật rừng thành phố Đà Nẵng, chọn lọc một số loài động vật quý hiếm để sử dụng làm thể hiện (thực thể - individuals).
Danh sách một số loài động vật quý hiếm đã sử dụng làm thể hiện:
Hình 2.2. Thể hiện/ thực thể động vật
Trong đó: loài Chà vá chân nâu (Voọc chà vá chân nâu), Chà vá chân đen (Voọc chà vá chân đen) đại diện cho Chi Chà vá (Voọc) và loài Khỉ đuôi lợn, Khỉ vàng thuộc họ Khỉ, loài Gấu chó thuộc họ Gấu, loài Báo hoa mai thuộc họ Mèo, loài Cầy mực thuộc họ Cầy, loài Tê tê vàng thuộc họ Tê tê,…
Trang chủ hiển thị đầy đủ các chức năng để người dùng có thể hiểu được các thành phần trong ontology động vật rừng. Thanh công cụ được chia thành các mục như các Lớp (Classes), các Thuộc tính (Properties), các Thể hiện (Individuals). Bên cạnh đó, mục Sự thay đổi các chủ thể (Change by Entity) thể hiện những dự thay đổi, chỉnh sửa đã xảy ra trên ontology động vật này.
Mục các Lớp (Classes): hiển thị danh sách các lớp, được trình bày trực quang, cụ thể sự phân cấp trong các lớp, đồng thời hiển thị thông tin về lớp được chọn xem.
Bên cạnh việc người sử dụng có thể khai thác, kế thừa ontology động vật rừng, phần mềm còn cung cấp chức năng hỗ trợ người sử dụng tiếp tục phát triển ontology động vật này. Với chức năng, chỉnh sửa, xóa và thêm các lớp, các thuộc tính và các loài động vật, đáp ứng đầy đủ yêu cầu về xây dựng ontology.
Chức năng Tìm kiếm
Dựa vào ontology động vật đã xây dựng, người dùng có thể tìm kiếm các thực thể trong ontology, các loài động vật đã mô tả, các lớp, các thuộc tính.
Nhập loài động vật cần tìm:
Hình 3.21. Ô nhập từ tìm kiếm
Phần mềm sẽ hiển thị các gợi ý tìm kiếm:
Hình 3.22. Gợi ý tìm kiếm
Người dùng chọn vào gợi ý mong muốn và thông tin về kết quả sẽ được hiển thị. Với thông tin về loài động vật, các mô tả ngữ nghĩa được thể hiện đầy đủ:
Hình 3.23. Kết quả tìm kiếm loài Khỉ vàng
Hình 3.24. Kết quả tìm kiếm loài Chà vá chân nâu
Chức năng tìm kiếm trên cây phân cấp lớp cũng được hỗ trợ để người sử dụng có thể tìm chính xác lớp con hoặc loài động vật thuộc lớp nào trên cây phân lớp. Trong ví dụ dưới đây, khi chọn 2 lần vào gợi ý Khỉ thì cây phân lớp tự động xuất hiện lớp con khỉ trong lớp cha Động vật:
Chức năng Tìm kiếm
Dựa vào ontology động vật đã xây dựng, người dùng có thể tìm kiếm các thực thể trong ontology, các loài động vật đã mô tả, các lớp, các thuộc tính.
Nhập loài động vật cần tìm:
Hình 3.21. Ô nhập từ tìm kiếm
Phần mềm sẽ hiển thị các gợi ý tìm kiếm:
Hình 3.22. Gợi ý tìm kiếm
Người dùng chọn vào gợi ý mong muốn và thông tin về kết quả sẽ được hiển thị. Với thông tin về loài động vật, các mô tả ngữ nghĩa được thể hiện đầy đủ:
Hình 3.23. Kết quả tìm kiếm loài Khỉ vàng
Hình 3.24. Kết quả tìm kiếm loài Chà vá chân nâu
Chức năng tìm kiếm trên cây phân cấp lớp cũng được hỗ trợ để người sử dụng có thể tìm chính xác lớp con hoặc loài động vật thuộc lớp nào trên cây phân lớp. Trong ví dụ dưới đây, khi chọn 2 lần vào gợi ý Khỉ thì cây phân lớp tự động xuất hiện lớp con khỉ trong lớp cha Động vật:
Việc phần mềm hỗ trợ khai thác và tìm kiếm ontology động vật rừng trên địa bàn thành phố Đà Nẵng chạy trên internet, giúp cộng đồng có thể tham khảo, thừa kế và tiếp tục phát triển, làm phong phú thêm dữ liệu cho ontology động vật, góp phần phổ biến rộng rãi thông tin về đa dạng sinh học của thành phố Đà Nẵng.