SlideShare a Scribd company logo
1 of 60
Download to read offline
連或不連,是⼀一個問題 
To link or not to link that’s a question 
鄧東波 
! 
Dongpo Deng 
dongpo.deng@gmail.com
開放資料 
(Open Data) 
沒有技術和法律上障礙的資料 
Courtesy from http://www.wired.co.uk/news/silicon-europe?page=14
開放資料是... 
• 使⽤用「開放標準」和「⾮非專屬的資料格式」 
讓資料能不受技術限制⽽而流通 
• 使⽤用「公眾領域」或「開放授權」條款釋 
出資料,使資料的使⽤用不因法律或智慧財 
產權限制,進⽽而資料可無償地被⾃自由的散 
布、再製和修改
開放資料的5顆星 
• 這五顆星的等級是以資料 
格式,及其可取得的⽅方式 
來分級 
• 所有的開放資料顆星等必 
先滿⾜足第⼀一顆星的開放資 
料,也就是以「開放授權」 
公開釋出 
http://5stardata.info/tw/
以「紫外線測站」為例
雖然是⾮非結構化資料格式,如圖⽚片, 
將資料放上網路,讓所有⼈人都可以取 
得,並附上開放的授權⽅方式,就是⼀一 
星級「開放資料」
雖然是結構化資料,但資料格式是專屬 
格式,如MS EXCEL的XLSX,但資料放 
上網路,讓所有⼈人都可以取得,並附上 
開放的授權⽅方式,就是⼆二星級的開放資 
料
資料格式為⾮非專屬格式,如CSV,不需 
要依靠特定軟體或⼯工具來處理,以致於 
許多依照標準所開發的開放資料平台, 
很容易就可以處理這樣的資料,就是三 
星級的開放資料
資料格式為⾮非專屬格式,如CSV,不需 
要依靠特定軟體或⼯工具來處理,以致於 
許多依照標準所開發的開放資料平台, 
很容易就可以處理這樣的資料,就是三 
星級的開放資料
資料格式為⾮非專屬格式,如CSV,不需 
要依靠特定軟體或⼯工具來處理,以致於 
許多依照標準所開發的開放資料平台, 
很容易就可以處理這樣的資料,就是三 
星級的開放資料
將資料項⺫⽬目以URI⽅方式分享於網絡之 
中,最普遍的做法是將資料以「資源描 
述架構」(Resource Description 
Framework, RDF) 編寫,就是四星級的 
開放資料
五顆星的開放資料: 
⾃自⼰己能夠被連結,也要連結別⼈人 
Image courtesy from http://www.ipvsecurity.com/eng/index.php/56-policies/case-studies/37-sed-ut-perspiciatis-unde-omnis-iste-natus-error-sitem
紫外線測站的知識本體(ontology) 
• 建⽴立知識本體 
• 定義語彙,清楚表達資料,使資料能夠相互連結
根據知識本體轉成RDF
因為資料是以URI⽅方式分享於網絡之 
中,因⽽而可以將描述相同的實體的URI 
相互串連,也就成為「連結開放資料」 
(Linked Open Data, LOD),就是五星 
級的開放資料!!
連結資料(Linked Data) 
• Tim Berners-Lee的連結資料的原則 
1. 使⽤用URI做為事物的名稱; 
2. 使⽤用HTTP URI ,因此⼈人們可以 
查看這些名稱; 
3. 當有⼈人查看⼀一個URI時,利⽤用標 
準(如RDF, SPARQL)來提供有⽤用 
的資訊; 
4. 包含連結到另⼀一個URI的資訊, 
使他們可以發現更多事物。
Linked Open Data Cloud 
(9/2008)
Linked Open Data Cloud 
(7/2009)
Linked Open Data Cloud 
(9/2010)
Linked Open Data Cloud 
(9/2011) 
LODE-Taiwan Biodiversity Dataset
LOD cloud (2014.4)
LOD cloud (2014.4)
為什麼要連結資料? 
• 結構化資料,使資料不但⼈人 
可理解,機器也可以讀懂 
• 在語意層級的資料整合 
• 藉由連結資料提供更多資料, 
並可能找到更多知識 
• 連結資料服務是⼀一個穩定的 
開放資料介接⽅方式 
• Error 404
規格化 
• 區分與清理出可以連結的資料 
• 分辨出資料中是「概念」成份,和 
這些概念的關係 
• 這些概念在知識領域中的解釋 
• URI 設計 
• BaseURI http://geo.lod.tw 
• TBoxURIs http://geo.lod.tw/ontology/ 
{class|property} 
• ABoxURIs 
http://geo.lod.tw/resource/Name/公館 
規格化 
模式化 
轉換與連結 
發佈 
使⽤用
模式化 
• 根據上⼀一步所區分的概念及其關係,建⽴立 
知識本體(Ontologies) 
• ⼀一組可分享的觀念之具體規格化 
• 要被其它資料連結,需使⽤用標準語彙, 
或已存在的語彙,以清楚表達資料內 
涵,沒有,再⾃自⾏行定義 
• ⽤用OWL或RDFs來表達 
• 多數⼈人⽤用Protege編寫 
規格化 
模式化 
轉換與連結 
發佈 
使⽤用
轉檔與連結 
• 要連到其它資料,要清楚資料的脈 
絡關係,以找到可以連結的資料 
• 基本上要梳理資料脈絡關係,可由 
三個⼤大⽅方向著⼿手,資料的時間特性、 
資料的空間特性、和資料的主題 
• ⼯工具 
• Silk 
• http://wifo5-03.informatik.uni-mannheim.de/bizer/silk/ 
• LIME 
• http://aksw.org/Projects/LIMES.html 
規格化 
模式化 
轉換與連結 
發佈 
使⽤用
轉檔與連結 
• 轉檔⼯工具 
• CSV and spreadsheets 
• RDF extension of Google Refine, 
XLWrap, RDF123, NOR2O 
• RDB 
• D2R Server, ODEMapster, W3C 
RDB2RDF WG – R2RML 
• XML 
• GRDDL, ReDeFer 
規格化 
模式化 
轉換與連結 
發佈 
使⽤用
轉檔與連結 
• 檢查錯誤 
• http上的問題,可及性 (accessibility) 
和反連性 (derefencability) 
• namespace和vocabulary不⼀一致 
• 對映錯誤,同⼀一個名字在資料集可 
能有好幾個 
規格化 
模式化 
轉換與連結 
發佈 
使⽤用
發佈 
• RDF stores and SPARQL endpoints 
• Jena, Virtuoso, Sesame,4Store, OWLIM, 
BBN Parliament 
• linked-data front-end services 
• Pubby, TalisPlatform, Fuseki, D2RQ 
規格化 
模式化 
轉換與連結 
發佈 
使⽤用
發佈規格化 
模式化 
轉換與連結 
發佈 
使⽤用 
HTML RDF 
D2R Pubby 
MySQL 
RDB 
Virtuoso 
RDF store 
Web
利⽤用規格化 
模式化 
轉換與連結 
出版 
利⽤用 
RelFinder
⽤用[開放的]台灣地名資料 
! 講個秘訣
處理台灣地名之⺫⽬目的 
• 地名的再使⽤用率⾼高、被連結率也⾼高 
• 地名語意常是模糊不清,連結資料適合來處理 
• 台灣多族群、多語⾔言、多時期,地名演變有⽂文化和 
歷史意義 
• ⼀一地多名、⼀一名多地 
• 定常性的地名服務做為網路世界中⽂文化累積的接⼝口 
• 地名做為「控制語彙」,⽤用在CKAN中管理其它資料
資料的限制 
• 地名資料欄位 
• 地名名稱、漢語拼⾳音、通⽤用拼⾳音、所屬村⾥里、所屬 
鄉鎮市區、所屬縣市、地名別稱、地名意義、地名 
年代時間、地名類型、地圖坐標、語⾔言別、命名族 
群、相關位置與⾯面積描述、地名沿⾰革與⽂文獻歷史簡 
述、地名相關事項訪談內容、普查使⽤用之地圖與⽂文 
獻
內容缺漏 
• 收集40,415筆地名資料, 含舊地名 
• 只有4,821筆地名有x,y 座標, 且座標系統為TM2 
• 13,615筆地名有開始時間, 8,153筆有結束時間, 
6,646筆開始和結束都有 
• 6,089筆地名具有類別, 但類別標記⽅方式沒有統⼀一, 
重複性⾼高
地名知識本體 
geo:Feature 
tpn:Place 
tpn:featureClass tpn:FeatureType 
owl:subClassOf 
skos:Concept 
owl:subClassOf 
geo:inside 
time:Interval 
geo:Geometry 
owl:subClassOf 
geo:Point 
tpn:Footprint 
geo:hasGeometry 
geo:asWKT 
geo:wktLiteral 
tpn:is_in 
owl:subClassOf 
event:Event 
event:place 
tpn:memberOf 
tpn:name 
owl="http://www.w3.org/2002/07/owl#" 
xsd="http://www.w3.org/2001/XMLSchema#" 
geo="http://www.opengis.net/ont/geosparql#" 
time="http://www.w3.org/2006/time#" 
tpn="http://lod.tw/ontologies/geoname.owl#" 
event="http://purl.org/NET/c4dm/event.owl#" 
event:time 
tpn:Name 
(NameCollection) 
tpn:PlaceName 
time:hasBeginning 
time:Instant 
tpn:startToUse 
tpn:endToUse 
time:hasEnd 
tpn:altName
taijiang.tw
詮釋資料規劃 

- 
'.- 
/- 

02
,,,,! 

2	# 
2+1 
*)$
/2 (,%
Controlled Vocabulary
Domain knowledge 
http://117.56.91.31/ 
resource/CulturalHeritage/ 
AA09706000001
⽤用別⼈人的例⼦子 
! 講個⼋八卦
• 305 筆地名和族群 
• 19 筆環境名詞對照
inappropriate use of 
vocabularies 
The region (e.g. state or province) 
associated with the address of the object
TimBL看了會很傷⼼心 
• 為了連⽽而連,結果沒把資料語意釐清,反⽽而把資料弄 
的更難理解 
• 為了「製造」連結資料,⽽而在資料集中無意義地增加 
欄位,e.g. 在地名中增加hasGroup 
• 沒有去驗証正確性,產⽣生許多連結的錯誤 
• 沒有領域知識、沒有實⽤用價值
結語 
! 
• 政府開放資料應考慮的是如何滿⾜足三顆星的條件,再思考四、 
五星的開放資料 
• 連結資料是能夠相互連結的資料,也就是可以被連,並可以 
向外連其它資料,但各國政府的資料,向外的連結率皆不⾼高 
• 根據Bizer等⼈人(2011)的統計,政府所發佈的RDF資料量 
相對是最⾼高的,約佔42%,但對外連結卻相當低,低於 
4% 
• 政府的連結資料(或連結政府資料)該由政府單位來做嗎?

More Related Content

What's hot

Crossref LIVE Chinese网络研讨会——Crossref简介 – 14 Oct 2021
Crossref LIVE Chinese网络研讨会——Crossref简介 – 14 Oct 2021  Crossref LIVE Chinese网络研讨会——Crossref简介 – 14 Oct 2021
Crossref LIVE Chinese网络研讨会——Crossref简介 – 14 Oct 2021
Crossref
 

What's hot (10)

语义互操作与关联数据
语义互操作与关联数据语义互操作与关联数据
语义互操作与关联数据
 
Crossref LIVE Chinese网络研讨会——Crossref简介 – 14 Oct 2021
Crossref LIVE Chinese网络研讨会——Crossref简介 – 14 Oct 2021  Crossref LIVE Chinese网络研讨会——Crossref简介 – 14 Oct 2021
Crossref LIVE Chinese网络研讨会——Crossref简介 – 14 Oct 2021
 
鏈結資料在圖書館的應用
鏈結資料在圖書館的應用鏈結資料在圖書館的應用
鏈結資料在圖書館的應用
 
資源探索服務之功能評估指標
資源探索服務之功能評估指標資源探索服務之功能評估指標
資源探索服務之功能評估指標
 
理解和利用关联数据 --图情档博(LAM)作为关联数据的提供者和消费者
理解和利用关联数据 --图情档博(LAM)作为关联数据的提供者和消费者理解和利用关联数据 --图情档博(LAM)作为关联数据的提供者和消费者
理解和利用关联数据 --图情档博(LAM)作为关联数据的提供者和消费者
 
知識管理過去現在未來
知識管理過去現在未來知識管理過去現在未來
知識管理過去現在未來
 
NoSQL sharing
NoSQL sharingNoSQL sharing
NoSQL sharing
 
用互相关联的数据创建超级数据库
用互相关联的数据创建超级数据库用互相关联的数据创建超级数据库
用互相关联的数据创建超级数据库
 
CKAN 中文簡介
CKAN 中文簡介CKAN 中文簡介
CKAN 中文簡介
 
20180322
2018032220180322
20180322
 

Viewers also liked (7)

Crowdsourced mapping for open collaboration: A story of Taiwan so far
Crowdsourced mapping for open collaboration: A story of Taiwan so farCrowdsourced mapping for open collaboration: A story of Taiwan so far
Crowdsourced mapping for open collaboration: A story of Taiwan so far
 
Toward Next Generation of Gazetteer: Utilizing GeoSPARQL For Developing Link...
Toward Next Generation of Gazetteer:  Utilizing GeoSPARQL For Developing Link...Toward Next Generation of Gazetteer:  Utilizing GeoSPARQL For Developing Link...
Toward Next Generation of Gazetteer: Utilizing GeoSPARQL For Developing Link...
 
2014_WWW_BTOR
2014_WWW_BTOR2014_WWW_BTOR
2014_WWW_BTOR
 
20150427_NCDR_OSM_Disaster_Mapping
20150427_NCDR_OSM_Disaster_Mapping20150427_NCDR_OSM_Disaster_Mapping
20150427_NCDR_OSM_Disaster_Mapping
 
開放街圖: 集合群眾之力的製圖 (OpenStreetMap: A crowdsoucing map )
開放街圖: 集合群眾之力的製圖 (OpenStreetMap: A crowdsoucing map )開放街圖: 集合群眾之力的製圖 (OpenStreetMap: A crowdsoucing map )
開放街圖: 集合群眾之力的製圖 (OpenStreetMap: A crowdsoucing map )
 
OSM 與 LocalWiki 的整合: 支援社區層級災害管理
OSM 與 LocalWiki 的整合: 支援社區層級災害管理OSM 與 LocalWiki 的整合: 支援社區層級災害管理
OSM 與 LocalWiki 的整合: 支援社區層級災害管理
 
Maker x Hacker桃園開放資料黑客松介紹簡報(20160531)
Maker x Hacker桃園開放資料黑客松介紹簡報(20160531)Maker x Hacker桃園開放資料黑客松介紹簡報(20160531)
Maker x Hacker桃園開放資料黑客松介紹簡報(20160531)
 

Similar to 20141018_OD_meetup#3

開放原始碼 Ch2.4 app - oss - db (ver 1.0)
開放原始碼 Ch2.4   app - oss - db (ver 1.0)開放原始碼 Ch2.4   app - oss - db (ver 1.0)
開放原始碼 Ch2.4 app - oss - db (ver 1.0)
My own sweet home!
 
Web可访问性
Web可访问性Web可访问性
Web可访问性
rex song
 

Similar to 20141018_OD_meetup#3 (20)

開放原始碼 Ch2.4 app - oss - db (ver 1.0)
開放原始碼 Ch2.4   app - oss - db (ver 1.0)開放原始碼 Ch2.4   app - oss - db (ver 1.0)
開放原始碼 Ch2.4 app - oss - db (ver 1.0)
 
Json ld 簡介
Json ld 簡介Json ld 簡介
Json ld 簡介
 
Web可访问性
Web可访问性Web可访问性
Web可访问性
 
Rest与面向资源的web开发
Rest与面向资源的web开发Rest与面向资源的web开发
Rest与面向资源的web开发
 
如何,高效利用搜索引擎+构建网络工具箱
如何,高效利用搜索引擎+构建网络工具箱如何,高效利用搜索引擎+构建网络工具箱
如何,高效利用搜索引擎+构建网络工具箱
 
Azure Data Lake 簡介
Azure Data Lake 簡介Azure Data Lake 簡介
Azure Data Lake 簡介
 
Sdn 101-2
Sdn 101-2Sdn 101-2
Sdn 101-2
 
網站上線了,然後呢?
網站上線了,然後呢?網站上線了,然後呢?
網站上線了,然後呢?
 
網站製作基礎概念
網站製作基礎概念網站製作基礎概念
網站製作基礎概念
 
Hadoop con 2015 hadoop enables enterprise data lake
Hadoop con 2015   hadoop enables enterprise data lakeHadoop con 2015   hadoop enables enterprise data lake
Hadoop con 2015 hadoop enables enterprise data lake
 
Wiki in Teamroom - Connected Mind
Wiki in Teamroom - Connected MindWiki in Teamroom - Connected Mind
Wiki in Teamroom - Connected Mind
 
semantic web and integration of library recources
semantic web and integration of library recourcessemantic web and integration of library recources
semantic web and integration of library recources
 
Building Big Data Platform “Pingo” in Baidu Using Alluxio
Building Big Data Platform “Pingo” in Baidu Using AlluxioBuilding Big Data Platform “Pingo” in Baidu Using Alluxio
Building Big Data Platform “Pingo” in Baidu Using Alluxio
 
资源整合与Web2.0
资源整合与Web2.0资源整合与Web2.0
资源整合与Web2.0
 
Kevenjiaoda
KevenjiaodaKevenjiaoda
Kevenjiaoda
 
资源整合与Web2.0
资源整合与Web2.0资源整合与Web2.0
资源整合与Web2.0
 
使用 .NET Standard 開發跨平台應用程式
使用 .NET Standard 開發跨平台應用程式使用 .NET Standard 開發跨平台應用程式
使用 .NET Standard 開發跨平台應用程式
 
給你一個使用 Laravel 的理由
給你一個使用 Laravel 的理由給你一個使用 Laravel 的理由
給你一個使用 Laravel 的理由
 
選一個框架當好朋友,讓您成為開心攻城獅
選一個框架當好朋友,讓您成為開心攻城獅選一個框架當好朋友,讓您成為開心攻城獅
選一個框架當好朋友,讓您成為開心攻城獅
 
吕潇 星环科技大数据技术探索与应用实践
吕潇 星环科技大数据技术探索与应用实践吕潇 星环科技大数据技术探索与应用实践
吕潇 星环科技大数据技术探索与应用实践
 

More from Dongpo Deng

20140710 tca gsdi
20140710 tca gsdi20140710 tca gsdi
20140710 tca gsdi
Dongpo Deng
 
開放資料: 全球化的草根性運動
開放資料:  全球化的草根性運動開放資料:  全球化的草根性運動
開放資料: 全球化的草根性運動
Dongpo Deng
 
Social Web Meets Sensor Web: Linked Crowdsourced Observation Data
Social Web Meets Sensor Web: Linked Crowdsourced Observation DataSocial Web Meets Sensor Web: Linked Crowdsourced Observation Data
Social Web Meets Sensor Web: Linked Crowdsourced Observation Data
Dongpo Deng
 
20140114 moi open_data
20140114 moi open_data20140114 moi open_data
20140114 moi open_data
Dongpo Deng
 
20131106 acm geocrowd
20131106 acm geocrowd20131106 acm geocrowd
20131106 acm geocrowd
Dongpo Deng
 
2012 ACM Geocrowd
2012 ACM Geocrowd2012 ACM Geocrowd
2012 ACM Geocrowd
Dongpo Deng
 
物種學名與地理空間資訊處理
物種學名與地理空間資訊處理物種學名與地理空間資訊處理
物種學名與地理空間資訊處理
Dongpo Deng
 
OpenStreetMap: Grassroots Mapping and Crowdsourcing Disaster Relief Mapping
OpenStreetMap: Grassroots Mapping and Crowdsourcing Disaster Relief MappingOpenStreetMap: Grassroots Mapping and Crowdsourcing Disaster Relief Mapping
OpenStreetMap: Grassroots Mapping and Crowdsourcing Disaster Relief Mapping
Dongpo Deng
 
SOTM Taiwan 2013 Opening Session
SOTM Taiwan 2013 Opening SessionSOTM Taiwan 2013 Opening Session
SOTM Taiwan 2013 Opening Session
Dongpo Deng
 

More from Dongpo Deng (20)

20180226 data driven smart governance
20180226 data driven smart governance20180226 data driven smart governance
20180226 data driven smart governance
 
The methods and practices of Linked Open Data
The methods and practices of Linked Open DataThe methods and practices of Linked Open Data
The methods and practices of Linked Open Data
 
Construction and reuse of linked traceable agricultural product records - An ...
Construction and reuse of linked traceable agricultural product records - An ...Construction and reuse of linked traceable agricultural product records - An ...
Construction and reuse of linked traceable agricultural product records - An ...
 
農產品產銷履歷資料鏈結化處理 (Linked Traceable Agricultural Data )
農產品產銷履歷資料鏈結化處理 (Linked Traceable Agricultural Data )農產品產銷履歷資料鏈結化處理 (Linked Traceable Agricultural Data )
農產品產銷履歷資料鏈結化處理 (Linked Traceable Agricultural Data )
 
開放街圖社群經營的不等式
開放街圖社群經營的不等式開放街圖社群經營的不等式
開放街圖社群經營的不等式
 
啟動開放,創新價值
啟動開放,創新價值 啟動開放,創新價值
啟動開放,創新價值
 
2016年歐洲資料論壇
2016年歐洲資料論壇2016年歐洲資料論壇
2016年歐洲資料論壇
 
From Structured Data to Linked Open Governmental Data
From Structured Data to Linked Open Governmental DataFrom Structured Data to Linked Open Governmental Data
From Structured Data to Linked Open Governmental Data
 
20141001 climate change&osm
20141001 climate change&osm20141001 climate change&osm
20141001 climate change&osm
 
20140721 open geomeeting
20140721 open geomeeting20140721 open geomeeting
20140721 open geomeeting
 
20140710 tca gsdi
20140710 tca gsdi20140710 tca gsdi
20140710 tca gsdi
 
開放資料: 全球化的草根性運動
開放資料:  全球化的草根性運動開放資料:  全球化的草根性運動
開放資料: 全球化的草根性運動
 
Social Web Meets Sensor Web: Linked Crowdsourced Observation Data
Social Web Meets Sensor Web: Linked Crowdsourced Observation DataSocial Web Meets Sensor Web: Linked Crowdsourced Observation Data
Social Web Meets Sensor Web: Linked Crowdsourced Observation Data
 
20140114 moi open_data
20140114 moi open_data20140114 moi open_data
20140114 moi open_data
 
TGIS 2013
TGIS 2013TGIS 2013
TGIS 2013
 
20131106 acm geocrowd
20131106 acm geocrowd20131106 acm geocrowd
20131106 acm geocrowd
 
2012 ACM Geocrowd
2012 ACM Geocrowd2012 ACM Geocrowd
2012 ACM Geocrowd
 
物種學名與地理空間資訊處理
物種學名與地理空間資訊處理物種學名與地理空間資訊處理
物種學名與地理空間資訊處理
 
OpenStreetMap: Grassroots Mapping and Crowdsourcing Disaster Relief Mapping
OpenStreetMap: Grassroots Mapping and Crowdsourcing Disaster Relief MappingOpenStreetMap: Grassroots Mapping and Crowdsourcing Disaster Relief Mapping
OpenStreetMap: Grassroots Mapping and Crowdsourcing Disaster Relief Mapping
 
SOTM Taiwan 2013 Opening Session
SOTM Taiwan 2013 Opening SessionSOTM Taiwan 2013 Opening Session
SOTM Taiwan 2013 Opening Session
 

20141018_OD_meetup#3