什么是关联数据? 由Web的发明人Tim Berners-Lee提出; 定义了一种URI规范,使得人们可以通过HTTP/URI机制,直接获得数字资源(Thing); A richer Linking mechanism for the Web that takes us from Hypertext Links (Document to Document) to Hyperdata Links (across things that documents are about)(一种Web上的富链接机制,将超文本链接(由文件指向文件)变为超数据链接(链接文件所代表的事物)) 关联数据是实现Data Web的关键技术。 Tim Burners-Lee: http://www.w3.org/DesignIssues/LinkedData.html
什么是关联数据? 维基百科的定义:关联数据是一种推荐的最佳实践,用来在语义网中使用URI和RDF发布、分享、连接各类数据、信息和知识( “a term used to describe a recommended best practice for exposing, sharing, and connecting pieces of data, information, and knowledge on the Semantic Web using URIs and RDF.”)
关联数据的四项基本原则: 使用URI作为任何事物的标识名称,不仅是标识文档 Use URIs as names for things 使用HTTP URI,使任何人都可以参引(dereference)这一全局唯一的名称 Use HTTP URIs so that people can look up those names 当有人访问名称时,以RDF形式提供有用的信息 When someone looks up a name, provide useful information 尽可能提供链接,指向其它的URI,以使人们发现更多的相关信息 Include links to other URIs so that they can discover more things
为什么要关联数据?(关联数据能够做什么?)
数据的Web与关联数据的关系 来自:Alexandre Passant & Michael Hausenblas在 WWW09(Madrid, Spain 2009-04-20)上的演示“Hello Open World!”
关联数据URI发布方式 Hash + data http 303 转向 详细请参见How to publish Linked Data on the Web: http://www4.wiwiss.fu-berlin.de/bizer/pub/LinkedDataTutorial/ (该文档已由华东师大研究生史亚光翻译,即将公开)
Open Data Commons 开放数据共用(Open Data Commons)是一种开放数据的知识产权声明 用以规范、约束、明确数据拥有着、发布者、使用者在获取、传播、利用、再生产数据时的权利和义务。 是一个Open Knowledge基金会的项目 2008年3月提出了第一种授权形式PDDL(Public Domain Dedication and License) 定义:A piece of knowledge is open if you are free to use, reuse, and redistribute it (http://www.opendefinition.org/1.0/)
目前的两种形式 Public Domain Dedication and License (PDDL) — “Public Domain for data/databases” Open Database License (ODbL) — “Share-Alike for data/databases” 定义和内容都还在不断发展变化中 中文版正在翻译,将在nkos.org中发布和维护。
关联协议Connected Commons 包含两种形式: Open Data Commons Public Domain Dedication Creative Commons CC0 license 由Talis提出,为了使Talis作为一个开放数据的服务商,吸引更多的数据提供商,开拓其Web3.0和云计算(SaaS)服务 关于OpenData Commons和CC,也已经请华东师大研究生李佳佳翻译,校对后即将公开。