2. GVHD: Ths. Ngô Quốc Hưng.
SVTH: - Hoàng Đình Hùng – 10520086
- Lê Hà Nam – 10520526
- Phan Thanh Thanh – 12520393
3. NỘI DUNG
1. Dữ liệu liên kết
2. DBpedia
3. Vấn đề nghiên cứu
4. NỘI DUNG
1. Dữ liệu liên kết
2. DBpedia
3. Vấn đề nghiên cứu
5. Dữ liệu liên kết- Khái quát
▪ Tim Berners-Lee đặt ra trong thảo
luận xoay quanh dự án Semantic Web.
▪ Mô tả phương thức tạo ra dữ liệu có
cấu trúc, liên kết với nhau (để trở
nên hữu ích).
▪ Xây dựng dựa trên HTTP, RDF, URI để
mở rộng khả năng chia sẻ thông tin.
6. Dữ liệu liên kết- Thành phần
▪ URI - Uniform Resource Identifier (Đặc
biệt là các Dereferenceable URIs).
▪ HTTP – Hypertext Transfer Protocol.
▪ RDF (Resource Description Framework).
▪ Các định dạng cú pháp tuần tự hóa:
(RDFa, RDF/XML, N3, Turtle, và các thứ
khác).
8. Dữ liệu liên kết- Nguyên lý
▪ Nhận dạng, đặt tên các thực thể (Entity)
bằng URIs.
▪ Sử dụng giao thức HTTP URI để truy
xuất.
▪ Cung cấp thông tin hữu ích (siêu dữ liệu,
mô tả có cấu trúc) về các “thực thể được
đặt tên” đó khi URI của chúng được duyệt
▪ Chứa các liên kết đến các URIs khác liên
quan trong dữ liệu vừa được duyệt -> có
thể duyệt các thông tin khác liên quan.
9. NỘI DUNG
1. Dữ liệu liên kết
2. DBpedia
3. Vấn đề nghiên cứu
10. DBpedia- Khái quát
▪ Được mô tả bởi TimBerners-Lee. Dự án được
bắt đầu ở Free University of Berlin và Leipzig
University, phối hớp với OpenLink Software.
▪ Tập dữ liệu liên kết được trích xuất từ
Wikipedia .
▪ Cấu trúc của bộ dữ liệu này được xây dựng sẵn
có trênWorld WideWeb.
▪ Cho phép người dùng truy vấn các quan hệ và
thuộc tính liên quan đến tài nguyên Wiki bao
gồm các liên kết đến bộ dữ liệu.
11. DBpedia- Use Cases
▪ Cải tiến công cụ tìm kiếmWikipedia.
▪ Đưa dữ liệu Dbpedia lên trang web.
▪ Ứng dụng địa lý trên thiết bị di động.
▪Phân lớp dữ liệu, đánh dấu và chú thích.
▪ Multi-Domain Ontology.
▪Nucleus for theWeb of Data.
▪Giúp người dùng dễ dàng biên tập nội dung
Wikipedia.
12. DBpedia- Ứng dụng
Hình 1: Thể hiện mối liên kết trong tập dữ liệu liên kết mở
13. DBpedia- Ứng dụng
▪ DBpedia có khá nhiều ứng dụng thực
tiễn: http://wiki.dbpedia.org/Applications
▪ Ví dụ:
–DayLikeToday Tìm kiếm các sự kiện
lịch sử xảy ra trong 1 thời gian
xác định, hiển thị theo giao diện
timeline.
–AboutThisDay.com.
–DBpedia Mobile.
– etc...
14. DBpedia- Dataset
▪ Phát hành lần đầu vào ngày 23/01/2007.
▪ Phiên bản mới nhất 3.9, phát hành vào tháng 9/2013
(bao gồm 119 ngôn ngữ).
▪ Phiên bản tiếng anh hiện mô tả 4M “things”, 470M
“facts”, trong đó 3,22M “things” được phân loại một
cách nhất quán. (http://wiki.dbpedia.org/Downloads39)
– 832.000 người.
– 639.000 địa điểm (427 địa điểm dân cư).
– 372.000 công trình (116.000 âm nhạc, 78.000 bộ phim...).
– 209.000 tổ chức (49.000 công ty, 45.000 cơ sở giáo dục…).
– 226.000 loài và 5.600 bệnh…
17. NỘI DUNG
1. Dữ liệu liên kết
2. DBpedia
3. Vấn đề nghiên cứu
18. Vấn đề nghiên cứu
Wikipedia
(www.Wikipedia.com).
Dbpedia site (http://dbpedia.org).
DBpedia 3.9 (wiki.dbpedia.org/Downloads39)
Sẵn có
Lưu trữ
Khai thác
Simple Protocol and RDF Query
Ngôn Language ngữ (SPARQL)
truy vấn
19. Vấn đề nghiên cứu
Title
……
Info2
Info1
Mô hình truy vấn trên Wikipedia.
Info3 Entity
……
20. Vấn đề nghiên cứu
Info 1
Info… Info n
Entity 1
Info 2
Title in
Ehnetriety 4
Title in
Ehnetriety …
Title in
Ehnetreity n
Title in
here
Entity 2
Entity 3