• Share
  • Email
  • Embed
  • Like
  • Save
  • Private Content
Linked data: What for and How to
 

Linked data: What for and How to

on

  • 5,183 views

 

Statistics

Views

Total Views
5,183
Views on SlideShare
3,503
Embed Views
1,680

Actions

Likes
1
Downloads
155
Comments
0

10 Embeds 1,680

http://libraryview.wordpress.com 805
http://www.kevenlw.name 412
http://libraryview.me 304
http://www.chuanboxue.cn 120
http://www.zhuaxia.com 19
http://www.slideshare.net 10
http://cache.baidu.com 6
http://webcache.googleusercontent.com 2
http://zhuaxia.com 1
http://translate.googleusercontent.com 1
More...

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

CC Attribution-NonCommercial LicenseCC Attribution-NonCommercial License

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    Linked data: What for and How to Linked data: What for and How to Presentation Transcript

    • 数字环境下图书馆前沿问题研讨班
      华中科技大学 武汉 2009.7
      关联数据:意义及其实现
      Kevenlw@gmail.com
      数字图书馆研究所
      上海图书馆
    • 内容
      什么是关联数据?
      关联数据四原则
      为什么要用关联数据?
      关联数据与数字图书馆有什么关系?
      关联数据应用举例
      如何实现关联数据?
      数据关联的知识产权问题
    • 什么是关联数据?
      由Web的发明人Tim Berners-Lee提出;
      定义了一种URI规范,使得人们可以通过HTTP/URI机制,直接获得数字资源(Thing);
      A richer Linking mechanism for the Web that takes us from Hypertext Links (Document to Document) to Hyperdata Links (across things that documents are about)(一种Web上的富链接机制,将超文本链接(由文件指向文件)变为超数据链接(链接文件所代表的事物))
      关联数据是实现Data Web的关键技术。
      Tim Burners-Lee: http://www.w3.org/DesignIssues/LinkedData.html
    • 什么是RDF?
      RDF是一个语法独立的数据模型(不一定采用XML)
      可以以“主语-谓词-宾语”的三元组图形表示(A graph of triples)
      所有的资源和术语都有URI(资源的定义)
      空白节点(Blank node)是指没有全局ID的本地资源(没有定义命名域的URI,如ISBN, DOI)
      文本(Literal)指一个字串值(可以有类型以及语言属性)
      完整解释请参见http://www.rdfabout.com/以及http://www.w3.org/TR/rdf-primer/.
    • 什么是关联数据?
      维基百科的定义:关联数据是一种推荐的最佳实践,用来在语义网中使用URI和RDF发布、分享、连接各类数据、信息和知识( “a term used to describe a recommended best practice for exposing, sharing, and connecting pieces of data, information, and knowledge on the Semantic Web using URIs and RDF.”)
    • 什么是关联数据?
      通俗地说,关联数据是数据的一种发布方式,以URL的方式链接到一个数据对象,而不是一个文档。这个URL通常就是这个数据的URI,并且这个数据对象基本上是由RDF来描述的(这样才能保证数据具有语义),而且RDF文件中应该包含更多的由URI所标识的其它资源。
    • 为什么叫关联数据?
      1、URI所表示的是数据,而不是文档;
      2、URI的数据资源以RDF形式表达,其中有指向更多数据的URI,也就是链接;
      3、RDF所表达的链接其实是有语义的,不是仅仅一个link而已,而是表明了当前资源与被链接资源的关系。
    • 关联数据的四项基本原则:
      使用URI作为任何事物的标识名称,不仅是标识文档
      Use URIs as names for things
      使用HTTP URI,使任何人都可以参引(dereference)这一全局唯一的名称
      Use HTTP URIs so that people can look up those names
      当有人访问名称时,以RDF形式提供有用的信息
      When someone looks up a name, provide useful information
      尽可能提供链接,指向其它的URI,以使人们发现更多的相关信息
      Include links to other URIs so that they can discover more things
    • 为什么要关联数据?(关联数据能够做什么?)
    • 数据的Web与关联数据的关系
      来自:Alexandre Passant & Michael Hausenblas在 WWW09(Madrid, Spain 2009-04-20)上的演示“Hello Open World!”
    • 什么是数据的Web
      信息资源对象越来越细小:从文献到数据;
      信息资源需要结构化,有序组织(于是有各类信息组织方式、语言);
      信息服务的标准化、自助化、自动化(于是各类私有的API和查询语言开始标准化);
      上述特征再次证明了互联网和图书馆的一致性
    • 数据的Web的功能
      提供统一的数据模型 (RDF)
      提供统一的存取 API (RDF/SPARQL)
      提供一致的语义描述方法 (RDFS/OWL)
      提供可扩展的数据整合和混搭平台
      提供了富于想象力的数据利用空间
    • 趋势:从开放应用程序接口到开放数据
    • 机器可理解,人也可读。
    • 关联数据使web数据访问具有了标准统一的API
      linkeddata.org/
    • 关联数据与数字图书馆
    • 图书馆 标准
      能胜任新工作吗?
    • 图书馆关联数据的应用
      术语注册的简单实现(DC元数据)
      SKOS作为关联数据(LCSH)
      书目数据(包括规范记录)作为关联数据:瑞典国家联合目录
      各类实体的关联数据(FRBR三类实体)
      普遍存在的关联数据
    • 举例
    • Slide © 2009, Thomson Reuters
      including
      Thomson Reuters
    • SIOC核心本体
      SIOC Ontology Specification
      http://rdfs.org/sioc/spec/
      21
    • 使用Firefox插件Tabulator浏览Tim Burners-Lee的关联数据:http://www.w3.org/People/Berners-Lee/card
    • 如何实现关联数据?
    • 关联数据URI发布方式
      Hash + data
      http 303 转向
      详细请参见How to publish Linked Data on the Web: http://www4.wiwiss.fu-berlin.de/bizer/pub/LinkedDataTutorial/
      (该文档已由华东师大研究生史亚光翻译,即将公开)
    • 关联数据的发布方式(详细)
      URI中避免使用空白节点,避免具体化(reification),尽可能不使用RDF的集(Collection)和包(Container)
      内容协商(Negotiation), URI参引(dereferencing), CoolURI(也就是采用hash#和303转向方式指向资源)
      RDF链接, URI 别名
      本体/模式重用, 术语定义最佳实践
      在RDF描述中“必须包含”对该资源描述的内容
      封装非RDF的数据库或API, 使封闭世界的数据开放出来
    • 关联数据的知识产权声明
    • 无法适用
      X
      ©
      • 数据及其服务的知识产权,无法适用版权保护声明。
      • 没有合适的知识产权保护规范,不利于开放数据链接。
    • http://id.loc.gov/authorities/about.html#aboutTOS
    • Open Data Commons
      开放数据共用(Open Data Commons)是一种开放数据的知识产权声明
      用以规范、约束、明确数据拥有着、发布者、使用者在获取、传播、利用、再生产数据时的权利和义务。
      是一个Open Knowledge基金会的项目
      2008年3月提出了第一种授权形式PDDL(Public Domain Dedication and License)
      定义:A piece of knowledge is open if you are free to use, reuse, and redistribute it (http://www.opendefinition.org/1.0/)
    • 目前的两种形式
      Public Domain Dedication and License (PDDL) — “Public Domain for data/databases”
      Open Database License (ODbL) — “Share-Alike for data/databases”
      定义和内容都还在不断发展变化中
      中文版正在翻译,将在nkos.org中发布和维护。
    • 关联协议Connected Commons
      包含两种形式:
      Open Data Commons Public Domain Dedication
      Creative Commons CC0 license
      由Talis提出,为了使Talis作为一个开放数据的服务商,吸引更多的数据提供商,开拓其Web3.0和云计算(SaaS)服务
      关于OpenData Commons和CC,也已经请华东师大研究生李佳佳翻译,校对后即将公开。
    • 展望
    • 简单,可靠,灵活,松散耦合,富语义,自定义;
      关联数据正在成为语义网的杀手应用;
      链接无限,关联无限,语义无限;链接数据将无所不在;
      提供了进一步语义功能(包括推理)的一个基础平台,语义网将从这里起飞。
    • 谢谢!