SlideShare a Scribd company logo
1 of 23
http://dbpedia.org/
GVHD: Ths. Ngô Quốc Hưng. 
SVTH: - Hoàng Đình Hùng – 10520086 
- Lê Hà Nam – 10520526 
- Phan Thanh Thanh – 12520393
NỘI DUNG 
1. Dữ liệu liên kết 
2. DBpedia 
3. Vấn đề nghiên cứu
NỘI DUNG 
1. Dữ liệu liên kết 
2. DBpedia 
3. Vấn đề nghiên cứu
Dữ liệu liên kết- Khái quát 
▪ Tim Berners-Lee đặt ra trong thảo 
luận xoay quanh dự án Semantic Web. 
▪ Mô tả phương thức tạo ra dữ liệu có 
cấu trúc, liên kết với nhau (để trở 
nên hữu ích). 
▪ Xây dựng dựa trên HTTP, RDF, URI để 
mở rộng khả năng chia sẻ thông tin.
Dữ liệu liên kết- Thành phần 
▪ URI - Uniform Resource Identifier (Đặc 
biệt là các Dereferenceable URIs). 
▪ HTTP – Hypertext Transfer Protocol. 
▪ RDF (Resource Description Framework). 
▪ Các định dạng cú pháp tuần tự hóa: 
(RDFa, RDF/XML, N3, Turtle, và các thứ 
khác).
Dữ liệu liên kết- Tập dữ liệu 
▪ CKAN 
Ckan.org 
▪ Dbpedia 
Dbpedia.org 
▪ GeoNames 
Geoname.org 
▪ UMBEL 
Umbel.org 
▪ FOAF
Dữ liệu liên kết- Nguyên lý 
▪ Nhận dạng, đặt tên các thực thể (Entity) 
bằng URIs. 
▪ Sử dụng giao thức HTTP URI để truy 
xuất. 
▪ Cung cấp thông tin hữu ích (siêu dữ liệu, 
mô tả có cấu trúc) về các “thực thể được 
đặt tên” đó khi URI của chúng được duyệt 
▪ Chứa các liên kết đến các URIs khác liên 
quan trong dữ liệu vừa được duyệt -> có 
thể duyệt các thông tin khác liên quan.
NỘI DUNG 
1. Dữ liệu liên kết 
2. DBpedia 
3. Vấn đề nghiên cứu
DBpedia- Khái quát 
▪ Được mô tả bởi TimBerners-Lee. Dự án được 
bắt đầu ở Free University of Berlin và Leipzig 
University, phối hớp với OpenLink Software. 
▪ Tập dữ liệu liên kết được trích xuất từ 
Wikipedia . 
▪ Cấu trúc của bộ dữ liệu này được xây dựng sẵn 
có trênWorld WideWeb. 
▪ Cho phép người dùng truy vấn các quan hệ và 
thuộc tính liên quan đến tài nguyên Wiki bao 
gồm các liên kết đến bộ dữ liệu.
DBpedia- Use Cases 
▪ Cải tiến công cụ tìm kiếmWikipedia. 
▪ Đưa dữ liệu Dbpedia lên trang web. 
▪ Ứng dụng địa lý trên thiết bị di động. 
▪Phân lớp dữ liệu, đánh dấu và chú thích. 
▪ Multi-Domain Ontology. 
▪Nucleus for theWeb of Data. 
▪Giúp người dùng dễ dàng biên tập nội dung 
Wikipedia.
DBpedia- Ứng dụng 
Hình 1: Thể hiện mối liên kết trong tập dữ liệu liên kết mở
DBpedia- Ứng dụng 
▪ DBpedia có khá nhiều ứng dụng thực 
tiễn: http://wiki.dbpedia.org/Applications 
▪ Ví dụ: 
–DayLikeToday Tìm kiếm các sự kiện 
lịch sử xảy ra trong 1 thời gian 
xác định, hiển thị theo giao diện 
timeline. 
–AboutThisDay.com. 
–DBpedia Mobile. 
– etc...
DBpedia- Dataset 
▪ Phát hành lần đầu vào ngày 23/01/2007. 
▪ Phiên bản mới nhất 3.9, phát hành vào tháng 9/2013 
(bao gồm 119 ngôn ngữ). 
▪ Phiên bản tiếng anh hiện mô tả 4M “things”, 470M 
“facts”, trong đó 3,22M “things” được phân loại một 
cách nhất quán. (http://wiki.dbpedia.org/Downloads39) 
– 832.000 người. 
– 639.000 địa điểm (427 địa điểm dân cư). 
– 372.000 công trình (116.000 âm nhạc, 78.000 bộ phim...). 
– 209.000 tổ chức (49.000 công ty, 45.000 cơ sở giáo dục…). 
– 226.000 loài và 5.600 bệnh…
DBpedia- Dataset 
▪Background
DBpedia- Dataset 
▪ Thuộc tính
NỘI DUNG 
1. Dữ liệu liên kết 
2. DBpedia 
3. Vấn đề nghiên cứu
Vấn đề nghiên cứu 
Wikipedia 
(www.Wikipedia.com). 
Dbpedia site (http://dbpedia.org). 
DBpedia 3.9 (wiki.dbpedia.org/Downloads39) 
Sẵn có 
Lưu trữ 
Khai thác 
Simple Protocol and RDF Query 
Ngôn Language ngữ (SPARQL) 
truy vấn
Vấn đề nghiên cứu 
Title 
…… 
Info2 
Info1 
Mô hình truy vấn trên Wikipedia. 
Info3 Entity 
……
Vấn đề nghiên cứu 
Info 1 
Info… Info n 
Entity 1 
Info 2 
Title in 
Ehnetriety 4 
Title in 
Ehnetriety … 
Title in 
Ehnetreity n 
Title in 
here 
Entity 2 
Entity 3
Vấn đề nghiên cứu- Giải pháp 
SPARQL
Hỏi - Đáp
Xin cảm ơn!

More Related Content

Similar to dbpedia

Module 2: Tim kiem, luu tru va chia se tu lieu DHHH
Module 2: Tim kiem, luu tru va chia se tu lieu DHHHModule 2: Tim kiem, luu tru va chia se tu lieu DHHH
Module 2: Tim kiem, luu tru va chia se tu lieu DHHHThao Linh Dao
 
hệ thống thông tin đa phương tiện trên đám mây .pptx
hệ thống thông tin đa phương tiện trên đám mây .pptxhệ thống thông tin đa phương tiện trên đám mây .pptx
hệ thống thông tin đa phương tiện trên đám mây .pptxthienphuctd1
 
Tài liệu hướng dẫn sử dụng dublin core
Tài liệu hướng dẫn sử dụng dublin coreTài liệu hướng dẫn sử dụng dublin core
Tài liệu hướng dẫn sử dụng dublin corejackjohn45
 
Bài 1: Tổng quan về cơ sở dữ liệu - Giáo trình FPT
Bài 1: Tổng quan về cơ sở dữ liệu - Giáo trình FPTBài 1: Tổng quan về cơ sở dữ liệu - Giáo trình FPT
Bài 1: Tổng quan về cơ sở dữ liệu - Giáo trình FPTMasterCode.vn
 
Chuong 1 tong_quan_ve_csdl
Chuong 1 tong_quan_ve_csdlChuong 1 tong_quan_ve_csdl
Chuong 1 tong_quan_ve_csdlHuy Feng
 
Bao cao web 2.0
Bao cao web 2.0Bao cao web 2.0
Bao cao web 2.0Daniel Anh
 
Bài giảng môn Cơ sở dữ liệu - truongkinhtethucpham.com
Bài giảng môn Cơ sở dữ liệu - truongkinhtethucpham.comBài giảng môn Cơ sở dữ liệu - truongkinhtethucpham.com
Bài giảng môn Cơ sở dữ liệu - truongkinhtethucpham.commai_non
 
Bài Giảng Cơ Sở Dữ Liệu Hướng Đối Tượng (Object-Oriented Data Base).pdf
Bài Giảng Cơ Sở Dữ Liệu Hướng Đối Tượng (Object-Oriented Data Base).pdfBài Giảng Cơ Sở Dữ Liệu Hướng Đối Tượng (Object-Oriented Data Base).pdf
Bài Giảng Cơ Sở Dữ Liệu Hướng Đối Tượng (Object-Oriented Data Base).pdfNuioKila
 
Lưu trữ và xử lý dữ liệu trong điện toán đám mây
Lưu trữ và xử lý dữ liệu trong điện toán đám mâyLưu trữ và xử lý dữ liệu trong điện toán đám mây
Lưu trữ và xử lý dữ liệu trong điện toán đám mâyPhamTuanKhiem
 
Sưu tầm các định nghĩa về thư viện số trên mạng hoặc tài liệu giấy 2019
Sưu tầm các định nghĩa về thư viện số trên mạng hoặc tài liệu giấy  2019Sưu tầm các định nghĩa về thư viện số trên mạng hoặc tài liệu giấy  2019
Sưu tầm các định nghĩa về thư viện số trên mạng hoặc tài liệu giấy 2019Phan Minh Trí
 
Digital library standard and technology
Digital library standard and technologyDigital library standard and technology
Digital library standard and technologyMinh Tri Lam
 
bai giang mon sql- buoi 1.ppt
bai giang mon sql- buoi 1.pptbai giang mon sql- buoi 1.ppt
bai giang mon sql- buoi 1.pptHungHuyNguyen3
 
Gioi thieu nguon tai nguyen thong tin tthl dhtn nov 2012
Gioi thieu nguon tai nguyen thong tin tthl dhtn nov 2012Gioi thieu nguon tai nguyen thong tin tthl dhtn nov 2012
Gioi thieu nguon tai nguyen thong tin tthl dhtn nov 2012Hieu Thieu
 
Linq n hibernate net-tier
Linq n hibernate net-tierLinq n hibernate net-tier
Linq n hibernate net-tierNguyen Tran
 
Báo cáo bài tập Lưu trữ và xử lý dữ liệu lớn.pptx
Báo cáo bài tập Lưu trữ và xử lý dữ liệu lớn.pptxBáo cáo bài tập Lưu trữ và xử lý dữ liệu lớn.pptx
Báo cáo bài tập Lưu trữ và xử lý dữ liệu lớn.pptxBách Nguyễn
 

Similar to dbpedia (20)

Module 2: Tim kiem, luu tru va chia se tu lieu DHHH
Module 2: Tim kiem, luu tru va chia se tu lieu DHHHModule 2: Tim kiem, luu tru va chia se tu lieu DHHH
Module 2: Tim kiem, luu tru va chia se tu lieu DHHH
 
hệ thống thông tin đa phương tiện trên đám mây .pptx
hệ thống thông tin đa phương tiện trên đám mây .pptxhệ thống thông tin đa phương tiện trên đám mây .pptx
hệ thống thông tin đa phương tiện trên đám mây .pptx
 
Tài liệu hướng dẫn sử dụng dublin core
Tài liệu hướng dẫn sử dụng dublin coreTài liệu hướng dẫn sử dụng dublin core
Tài liệu hướng dẫn sử dụng dublin core
 
Bài 1: Tổng quan về cơ sở dữ liệu - Giáo trình FPT
Bài 1: Tổng quan về cơ sở dữ liệu - Giáo trình FPTBài 1: Tổng quan về cơ sở dữ liệu - Giáo trình FPT
Bài 1: Tổng quan về cơ sở dữ liệu - Giáo trình FPT
 
Com201 slide 1
Com201   slide 1Com201   slide 1
Com201 slide 1
 
Chuong 1 tong_quan_ve_csdl
Chuong 1 tong_quan_ve_csdlChuong 1 tong_quan_ve_csdl
Chuong 1 tong_quan_ve_csdl
 
Bao cao web 2.0
Bao cao web 2.0Bao cao web 2.0
Bao cao web 2.0
 
Dublincore
DublincoreDublincore
Dublincore
 
Bài giảng môn Cơ sở dữ liệu - truongkinhtethucpham.com
Bài giảng môn Cơ sở dữ liệu - truongkinhtethucpham.comBài giảng môn Cơ sở dữ liệu - truongkinhtethucpham.com
Bài giảng môn Cơ sở dữ liệu - truongkinhtethucpham.com
 
Chg2. Mang May Tinhva Internet.pdf
Chg2. Mang May Tinhva Internet.pdfChg2. Mang May Tinhva Internet.pdf
Chg2. Mang May Tinhva Internet.pdf
 
Bài Giảng Cơ Sở Dữ Liệu Hướng Đối Tượng (Object-Oriented Data Base).pdf
Bài Giảng Cơ Sở Dữ Liệu Hướng Đối Tượng (Object-Oriented Data Base).pdfBài Giảng Cơ Sở Dữ Liệu Hướng Đối Tượng (Object-Oriented Data Base).pdf
Bài Giảng Cơ Sở Dữ Liệu Hướng Đối Tượng (Object-Oriented Data Base).pdf
 
Lưu trữ và xử lý dữ liệu trong điện toán đám mây
Lưu trữ và xử lý dữ liệu trong điện toán đám mâyLưu trữ và xử lý dữ liệu trong điện toán đám mây
Lưu trữ và xử lý dữ liệu trong điện toán đám mây
 
Sưu tầm các định nghĩa về thư viện số trên mạng hoặc tài liệu giấy 2019
Sưu tầm các định nghĩa về thư viện số trên mạng hoặc tài liệu giấy  2019Sưu tầm các định nghĩa về thư viện số trên mạng hoặc tài liệu giấy  2019
Sưu tầm các định nghĩa về thư viện số trên mạng hoặc tài liệu giấy 2019
 
Neo4j
Neo4jNeo4j
Neo4j
 
Digital library standard and technology
Digital library standard and technologyDigital library standard and technology
Digital library standard and technology
 
bai giang mon sql- buoi 1.ppt
bai giang mon sql- buoi 1.pptbai giang mon sql- buoi 1.ppt
bai giang mon sql- buoi 1.ppt
 
Gioi thieu nguon tai nguyen thong tin tthl dhtn nov 2012
Gioi thieu nguon tai nguyen thong tin tthl dhtn nov 2012Gioi thieu nguon tai nguyen thong tin tthl dhtn nov 2012
Gioi thieu nguon tai nguyen thong tin tthl dhtn nov 2012
 
Linq n hibernate net-tier
Linq n hibernate net-tierLinq n hibernate net-tier
Linq n hibernate net-tier
 
Cosodulieu
CosodulieuCosodulieu
Cosodulieu
 
Báo cáo bài tập Lưu trữ và xử lý dữ liệu lớn.pptx
Báo cáo bài tập Lưu trữ và xử lý dữ liệu lớn.pptxBáo cáo bài tập Lưu trữ và xử lý dữ liệu lớn.pptx
Báo cáo bài tập Lưu trữ và xử lý dữ liệu lớn.pptx
 

dbpedia

  • 2. GVHD: Ths. Ngô Quốc Hưng. SVTH: - Hoàng Đình Hùng – 10520086 - Lê Hà Nam – 10520526 - Phan Thanh Thanh – 12520393
  • 3. NỘI DUNG 1. Dữ liệu liên kết 2. DBpedia 3. Vấn đề nghiên cứu
  • 4. NỘI DUNG 1. Dữ liệu liên kết 2. DBpedia 3. Vấn đề nghiên cứu
  • 5. Dữ liệu liên kết- Khái quát ▪ Tim Berners-Lee đặt ra trong thảo luận xoay quanh dự án Semantic Web. ▪ Mô tả phương thức tạo ra dữ liệu có cấu trúc, liên kết với nhau (để trở nên hữu ích). ▪ Xây dựng dựa trên HTTP, RDF, URI để mở rộng khả năng chia sẻ thông tin.
  • 6. Dữ liệu liên kết- Thành phần ▪ URI - Uniform Resource Identifier (Đặc biệt là các Dereferenceable URIs). ▪ HTTP – Hypertext Transfer Protocol. ▪ RDF (Resource Description Framework). ▪ Các định dạng cú pháp tuần tự hóa: (RDFa, RDF/XML, N3, Turtle, và các thứ khác).
  • 7. Dữ liệu liên kết- Tập dữ liệu ▪ CKAN Ckan.org ▪ Dbpedia Dbpedia.org ▪ GeoNames Geoname.org ▪ UMBEL Umbel.org ▪ FOAF
  • 8. Dữ liệu liên kết- Nguyên lý ▪ Nhận dạng, đặt tên các thực thể (Entity) bằng URIs. ▪ Sử dụng giao thức HTTP URI để truy xuất. ▪ Cung cấp thông tin hữu ích (siêu dữ liệu, mô tả có cấu trúc) về các “thực thể được đặt tên” đó khi URI của chúng được duyệt ▪ Chứa các liên kết đến các URIs khác liên quan trong dữ liệu vừa được duyệt -> có thể duyệt các thông tin khác liên quan.
  • 9. NỘI DUNG 1. Dữ liệu liên kết 2. DBpedia 3. Vấn đề nghiên cứu
  • 10. DBpedia- Khái quát ▪ Được mô tả bởi TimBerners-Lee. Dự án được bắt đầu ở Free University of Berlin và Leipzig University, phối hớp với OpenLink Software. ▪ Tập dữ liệu liên kết được trích xuất từ Wikipedia . ▪ Cấu trúc của bộ dữ liệu này được xây dựng sẵn có trênWorld WideWeb. ▪ Cho phép người dùng truy vấn các quan hệ và thuộc tính liên quan đến tài nguyên Wiki bao gồm các liên kết đến bộ dữ liệu.
  • 11. DBpedia- Use Cases ▪ Cải tiến công cụ tìm kiếmWikipedia. ▪ Đưa dữ liệu Dbpedia lên trang web. ▪ Ứng dụng địa lý trên thiết bị di động. ▪Phân lớp dữ liệu, đánh dấu và chú thích. ▪ Multi-Domain Ontology. ▪Nucleus for theWeb of Data. ▪Giúp người dùng dễ dàng biên tập nội dung Wikipedia.
  • 12. DBpedia- Ứng dụng Hình 1: Thể hiện mối liên kết trong tập dữ liệu liên kết mở
  • 13. DBpedia- Ứng dụng ▪ DBpedia có khá nhiều ứng dụng thực tiễn: http://wiki.dbpedia.org/Applications ▪ Ví dụ: –DayLikeToday Tìm kiếm các sự kiện lịch sử xảy ra trong 1 thời gian xác định, hiển thị theo giao diện timeline. –AboutThisDay.com. –DBpedia Mobile. – etc...
  • 14. DBpedia- Dataset ▪ Phát hành lần đầu vào ngày 23/01/2007. ▪ Phiên bản mới nhất 3.9, phát hành vào tháng 9/2013 (bao gồm 119 ngôn ngữ). ▪ Phiên bản tiếng anh hiện mô tả 4M “things”, 470M “facts”, trong đó 3,22M “things” được phân loại một cách nhất quán. (http://wiki.dbpedia.org/Downloads39) – 832.000 người. – 639.000 địa điểm (427 địa điểm dân cư). – 372.000 công trình (116.000 âm nhạc, 78.000 bộ phim...). – 209.000 tổ chức (49.000 công ty, 45.000 cơ sở giáo dục…). – 226.000 loài và 5.600 bệnh…
  • 16. DBpedia- Dataset ▪ Thuộc tính
  • 17. NỘI DUNG 1. Dữ liệu liên kết 2. DBpedia 3. Vấn đề nghiên cứu
  • 18. Vấn đề nghiên cứu Wikipedia (www.Wikipedia.com). Dbpedia site (http://dbpedia.org). DBpedia 3.9 (wiki.dbpedia.org/Downloads39) Sẵn có Lưu trữ Khai thác Simple Protocol and RDF Query Ngôn Language ngữ (SPARQL) truy vấn
  • 19. Vấn đề nghiên cứu Title …… Info2 Info1 Mô hình truy vấn trên Wikipedia. Info3 Entity ……
  • 20. Vấn đề nghiên cứu Info 1 Info… Info n Entity 1 Info 2 Title in Ehnetriety 4 Title in Ehnetriety … Title in Ehnetreity n Title in here Entity 2 Entity 3
  • 21. Vấn đề nghiên cứu- Giải pháp SPARQL

Editor's Notes

  1. PREFIX type: <http://dbpedia.org/class/yago/> PREFIX prop: <http://dbpedia.org/property/> SELECT ?country_name ?population WHERE { ?country a type:LandlockedCountries ; rdfs:label ?country_name ; prop:populationEstimate ?population . FILTER (?population > 15000000 && langMatches(lang(?country_name), "EN")) . } ORDER BY DESC(?population)