BIBFRAME模型的演变
从FRBR到BIBFRAME 2.0
胡小菁
华东师范大学图书馆
上海文献联合编目中心年会 2016.10.25
BIBFRAME
Bibliographic
书目
Framework
框架
2上海文献联合编目中心年会 2016.10.25
美国国会图书馆(LC, Library of Congress)
准备用来取代
机读目录格式(MARC, MAchine Readable
Cataloging)
书目框架转换行动 2011年5月-
3上海文献联合编目中心年会 2016.10.25
LC声明:改变我们的书目框架
• 希望在更广泛的网络搜索环境中最大限度重用图书馆元数据,让
最终用户接触到更多优质元数据,并以创新方式使用。
• 以语义网和关联数据技术做实验
• 探索在导航关系中使用有前途的数据模型如“书目记录的功能需求”
(FRBR)
• 探索在当前基于MARC的系统之外的显示元数据的方法
• ……
准备抛弃MARC?美国国会图书馆启动“书目框架转变行动”(2011-5-24)
4上海文献联合编目中心年会 2016.10.25
BIBFRAME模型的演变
前传:FRBR
5上海文献联合编目中心年会 2016.10.25
书目记录的功能需求
FRBR
1997
2009修订
6上海文献联合编目中心年会 2016.10.25
FRBR模型(实体-关系模型)
第一组实体
作品
内容表达
载体表现
单件
第二组实体
个人
家族
团体
第三组实体
概念
实物
事件
地点
被...创作
被...实现
被...生产
被...拥有
有...作为主题
有...作为主题
有...作为主题
7上海文献联合编目中心年会 2016.10.25
FRBR第一组实体
红楼梦 / 曹雪芹原著
红楼梦 = A Dream in Red Mansions : 英文
缩写本 / 黄新渠编译
外语教学与研究出版社, 1991
图书馆五楼阅览区
H319.4 C214
8上海文献联合编目中心年会 2016.10.25
罗丹《思想者》
罗丹指导下多个雕塑
• 巴黎博物馆藏
• 青铜雕像、大理石底座
• 180x98x145厘米
• 巴黎罗丹美术馆藏
• 石膏模型
• 68.5x40x50厘米
• ……
9上海文献联合编目中心年会 2016.10.25
从传统书目到E-R模型(FRBR)
传统书目
在编图书
• 作者:曹雪芹
• 题名:红楼梦
• 出版社:……
• ……
FRBR的实体-关系模型
载体表现
• 作者(作品-关系-第2组实体)
• 题名(载体表现-特性-取值)
• 出版者(载体表现-关系-第2组实体)
• ……
10上海文献联合编目中心年会 2016.10.25
从E-R模型到关联数据(BIBFRAME)
实体-关系模型
实体(Entity)
• 关系(Relationship)
• 特性(Attribute)
• 实体-关系-实体
• 实体-特性-取值
RDF词表/本体
资源(Resource)
• 类/类型(Class/Type)
• 属性(Propert)
• 三元组(断言/陈述)
主体-谓词-客体
资源(类)-属性-值/资源(类)
作品-作者-
曹雪芹
11上海文献联合编目中心年会 2016.10.25
4个核心类
• 作品
• 实例
• 规范
• 注释
BIBFRAME 1.0模型
2013年1月
出版者 出版地 格式
主题 创作者
作品
实例
http://bibframe.org/static/images/bibframe.png
创作者/出版者
主题
12上海文献联合编目中心年会 2016.10.25
亮点:注释 Annotation
• 封面
• 评论(点评)
• 概要
• 目次
• 馆藏资料
• 馆藏单件
13上海文献联合编目中心年会 2016.10.25
BIBFRAME Profile
2014年5月
• 作品
Work
• 内容表达
Expression
• 载体表现
Manifestation
• 单件
• Item
http://loc.gov/bibframe/docs/images/wemi-bibframe-profile-small.png
• 作品
Work
• 实例
Instance
14上海文献联合编目中心年会 2016.10.25
开发进行中……
• 2013.8 使用案例与需求
• 2014.1 词表1.0
• 2014 各种草案(规范、关系、纲要)
• 2014-2015 专题研究(音像建模等)
• 2015.1 与OCLC白皮书/schema.org
• 2015.6 修订建议
• 2015.9-2016.3 试验第1阶段
• 2015.11 编辑器发布
• 2015.11 修订草案
MARC字段/
子字段
15上海文献联合编目中心年会 2016.10.25
https://www.loc.gov/bibframe/docs/images/bf2-model.jpg
BIBFRAME 2.0模型
2016年4月
事件
16上海文献联合编目中心年会 2016.10.25
FRBR事件
第三组实体(主题)
概念
实物
事件
地点
17上海文献联合编目中心年会 2016.10.25
非主题事件:演出(柴可夫斯基第5交响曲)
物件中心(盒式录音带)
• 主要責任者
• 柴可夫斯基 作曲
• 鲁道夫 肯普 指挥
• 柏林交响乐团 演奏
• 题名:柴可夫斯基第5交响曲
• 出版:英国 : 百代音乐公司出版,
1960
事件中心(演出)
• 表演者
• 演出时间
• 演出地点
• 职员(灯光、录音等)
18上海文献联合编目中心年会 2016.10.25
非主题事件:录制
BIBFRAME AV Modeling Study: Defining a Flexible Model for Description of Audiovisual Resources.
May 15, 2014. By Kara Van Malssen, AVPreserve. p.33 example 3. 19上海文献联合编目中心年会 2016.10.25
BIBFRAME核心类
BIBFRAME1.0
• 作品
• 实例
• 规范
• 注释
• 封面……
• 馆藏
FRBR第1组实体
• 作品、内容表达
• 载体表现
• 单件
BIBFRAME2.0
• 作品
• 实例
• 单件
20上海文献联合编目中心年会 2016.10.25
BIBFRAME核心类演变分析
1. 取消规范核心类:规范控制不再依赖规范检索点
2. 取消注释核心类:复用成熟关联数据词表
3. 新增单件核心类:跨越书目和馆藏格式
《中国图书馆学报》2016年第3期
21上海文献联合编目中心年会 2016.10.25
1 规范控制不再依赖规范检索点
统一资源标识符URI
国际资源标识符IRI
22上海文献联合编目中心年会 2016.10.25
图书馆目录:周树人vs鲁迅
• 国家图书馆OPAC
• 周树人:19
• 鲁迅:3846
• 上海图书馆iPAC
• 周树人:186
• 鲁迅:2928
23上海文献联合编目中心年会 2016.10.25
VIAF:鲁迅
24上海文献联合编目中心年会 2016.10.25
关联数据如何满足规范控制的功能需求?
“关联数据技术提供了概念独立于其表示形式的表达模型。可以
URI标识概念,以标签或名称属性表示各种语言或符号的表达,
从而使‘标目’问题得到完美解决,即不需要选择任何一种优先形
式(如鲁迅)作为标目,标目就是代表概念的URI,任何同义词
符号都可以作为显示标签而被检索到,系统后台直接进行同一
性处理。”
刘炜,张春景,夏翠娟.万维网时代的规范控制.
中国图书馆学报,2015(3)
25上海文献联合编目中心年会 2016.10.25
个人URI
• 虚拟国际规范档VIAF
http://viaf.org/viaf/29537230
• 国际标准名称标识符 ISNI
0000 0003 6868 2258
• 研究者标识符 ORCID
https://orcid.org/0000-0002-1703-9724(本人)
26上海文献联合编目中心年会 2016.10.25
2 复用成熟关联数据词表
在关联数据领域,复用成熟的关联数据词表,有助于包含
并扩展Web数据,是公认的最佳实践。
27上海文献联合编目中心年会 2016.10.25
直接采用RDF/RDFS命名空间
BF 1.0 模型
bf:Resource
bf:label
bf:identifierValue
BF 2.0 模型
rdf:Resource
rdfs:label
rdf:value
28上海文献联合编目中心年会 2016.10.25
考虑采用Web注释数据模型
BF 1.0 模型
• 注释类
BF 2.0 模型
• Web Annotation Data Model
29上海文献联合编目中心年会 2016.10.25
细粒度描述可能使用专门词表
• 音像
• EBUCore(欧洲广播联盟元数据规范)
• PBCore(公共广播元数据词典)
• 保存
• PREMIS(保存元数据词典数据字典)
30上海文献联合编目中心年会 2016.10.25
LC:书目框架总体规划
• 提供逻辑上伴随或支持书
目描述的数据类型
• 除书目外还包括“馆藏、
规范、分类、保存、技
术、权利及存档元数据”
国会图书馆书目框架计划总体规划
(2011-11-10)
书目
记录
馆藏
记录
规范
记录
31上海文献联合编目中心年会 2016.10.25
3 跨越书目和馆藏格式
• 在关联数据环境中,“记录”只是RDF三元组的一种组合,明确区
分书目与馆藏的必要性也就不存在了
资源-属性-值
主体-谓词-客体
某电子刊-访问政策-校园网
某电子刊-访问政策-开放获取
32上海文献联合编目中心年会 2016.10.25
变化的不仅仅是核心类
类与属性大挪移
33上海文献联合编目中心年会 2016.10.25
类和属性的变化
BIBFRAME 1.0 词表
• 类:53
• 属性:289
• 术语合计:342
BIBFRAME 2.0 词表
• 类:175
• 属性:197
• 术语合计:382
参见:BIBFRAME2.0类的变化
http://catwizard.net/posts/20160502220754.html
34上海文献联合编目中心年会 2016.10.25
题名类Title:属性 -> 子类
BF 1.0 词表
title
workTitle
instanceTitle
abbreviatedTitle
keyTitle
partTitle
subtitle
BF 2.0 词表
• WorkTitle
• InstanceTitle
• VariantTitle
• AbbreviatedTitle
• KeyTitle
• CollectiveTitle
• ParallelTitle
subtitle
35上海文献联合编目中心年会 2016.10.25
结语
36上海文献联合编目中心年会 2016.10.25
BIBFRAME开发到现在已经进入第六年,
离实际应用还会有一段时间
试验第1阶段 (2015.9-2016.3)
BIBFRAME试验第1阶段报告
试验第2阶段 (2016秋-)
37上海文献联合编目中心年会 2016.10.25
BIBFRAME编辑器:连接RDA http://bibframe.org/tools/editor
38上海文献联合编目中心年会 2016.10.25
随着BIBFRAME在专注书目描述方面不断成熟,
基于LC一直以来在维护图书馆界标准方面的努
力及所处地位,相信BIBFRAME本身也会成为
其他关联数据应用的重要词表来源。
LC:MARC21及其他标准维护者
39上海文献联合编目中心年会 2016.10.25
2015国际关联数据实施者调查的分析
使用的RDF词表和本体排名(10次以上)
1. SKOS 2. FOAF
3. DCTerms 4. DC基本元素集
5. Schema.org 6. BIBO
7. 本地词表;RDA第2组实体间关系(非官方版)
8. EDM
9. ISBD元素;WGS84地理位置
10. BIBFRAME词表 11. FRBR核心概念(非官方版)
Smith-Yoshimura, Karen. Analysis of International Linked Data Survey for Implementers.
D-Lib Magazine, 22(7/8) doi:10.1045/july2016-smith-yoshimura 40上海文献联合编目中心年会 2016.10.25
上海文献联合编目中心年会 2016.10.25

BIBFRAME模型的演变:从FRBR到BIBFRAME2.0

Editor's Notes

  • #2 45分钟
  • #4 RDF词表/本体
  • #10 FRBR模型不仅适用于图书,也适用于其他文化遗产品 《思想者》是法国雕塑家罗丹创作的雕像,该模型在罗丹的指导下有多个雕塑,最主要的雕像为青铜,底座为大理石材料,尺寸为180x98x145厘米,现藏于巴黎博物馆。1880年制作石膏模型为68.5x40x50厘米,现藏于巴黎罗丹美术馆。
  • #12 资源:范围比一般意义的“实体”更广。比如:“题名”可以定义为“资源”,属于某个“类”或“类型” 资源是类的实例 https://www.w3.org/2000/01/rdf-schema#Resource 根据RDFS的定义,rdfs:Resource,资源表示任何东西(rdfs:comment "The class resource, everything.") https://www.w3.org/TR/rdf-schema/#ch_property 属性:主体资源与客体资源之间的关系
  • #13 规范:(FRBR第2组实体)创作者、出版者、(FRBR第3组实体)主题【专业版加图示:第1组实体、第2组实体】 规范的作用:讲到2.0时再介绍
  • #14 FRBR:1990年代,前网络时代+图书馆目录 馆藏holding/Item:书目的附加,因而归入注释
  • #16 使用案例与需求,在2014年年会的时候讲过 OCLC:WorldCat.org使用schema.org OCLC and the Library of Congress to clarify approaches to library linked data (19 January 2015) LC和OCLC关于BIBFRAME和Schema书目扩展的白皮书 http://catwizard.net/posts/20150212225936.html 差异 分析揭示(两个)模型中至少有三个顶层差异。其一是前面提到的:BIBFRAME为“作品”和“实例”定义RDF类,而OCLC为“作品”但没有为“实体例”定义类。如上所指出,此差异不产生非兼容。 其二,BIBFRAME中正式定义“规范”实体为RDF类,但OCLC模型中没有。在OCLC关联数据模型中,“规范”仅仅是包含核实信息的任何资源的一个非正式名称,包括对构成图书馆资源描述重要的实体如人物、地点、机构、概念和其他实体的描述。但是,表达图书馆规范档内容的RDF数据存储库在其他方面是兼容的,包含相同对象的描述。在BIBFRAME模型中,RDF类bf:Authority定义主要是为了方便主题描述。这一问题将与LC和OCLC模型中通用的主题处理一起,在接下来的技术分析中做更深入的探索。 其三,BIBFRAME为“注释”实体定义的RDF类在OCLC模型中没有对应。不过,BIBFRAME“注释”现在包含结构化数据,可(p.10)描述评论、概要、封面图像及馆藏——多数在OCLC/Schema模型中有交替或更简化的陈述。正按照W3C的Web注释当前实施的工作,仔细评估BIBFRAME“注释”类。
  • #19 参见:FRBRoo读后 http://catwizard.net/posts/20140209153428.html 6、FRBR是静态的实体-关系,表现活动的结果;而CIDOC CRM是动态的,以事件(Event)表现创作等活动过程。 被图书馆编目洗脑多年的人,对动态与静态的区别需要细细体会 FRBRoo类:事件 - 创作E65(如:录制事件F29) - 活动E7(表演F31) - 生产E12(如:载体生产事件F32) 物件中心-事件中心(取自EDM) 影视作品录像带/DVD:类似(更关注原来的时间,而非本次出版发行情况) 影视作品:演员-剧中人(当然BF应该不会专指到这个程度) 同一演出,经典的可能会多次出版
  • #20 事件:事件内容 参与者/角色:拍摄者(责任者);警察、司机(非主题——非研究对象)
  • #21 规范:核心能力之一 注释:与网络接轨
  • #22 文章忽略了LC与OCLC白皮书:分析揭示(两个)模型中至少有三个顶层差异(详见前PPT:开发进行中)
  • #23 不是不要规范控制,人名、机构名的规范控制相当重要。 (1)图书馆传统的规范控制主要依赖名称的形式规范即规范检索点。由于语言差异,在不同国家间难以达成一致,更难以在图书馆界之外应用。关联数据以URI标识概念与事物,无需依赖规范检索点,同时也能以“首选标签”等形式兼容传统的规范形式。取消规范类,明确在关联数据语境下,名称规范只是事物的一个属性。
  • #27 不是不要规范控制,人名、机构名的规范控制相当重要。 (1)图书馆传统的规范控制主要依赖名称的形式规范即规范检索点。由于语言差异,在不同国家间难以达成一致,更难以在图书馆界之外应用。关联数据以URI标识概念与事物,无需依赖规范检索点,同时也能以“首选标签”等形式兼容传统的规范形式。取消规范类,明确在关联数据语境下,名称规范只是事物的一个属性。
  • #28 (2)复用成熟词表是关联数据领域普遍接受的最佳实践。BIBFRAME开发之初,LC基于对外部命名空间不稳定的疑虑,没有采用这一实践。各类RDF词表在这一两年的成熟发展,包括Web注释数据模型即将成为W3C标准,使LC改变做法,取消注释类,明确复用外部词表[对照英文摘要]。此外,BIBFRAME2.0草案中还采用了rdf:/rdfs:命名空间,显示BIBFRAME将专注于书目数据的核心部分。要实现对现有MARC数据的完全转换和对资源的准确揭示,针对专门资源的复杂属性,BIBFRAME必然会部分复用其他专业词表,比如音像资源的EBUCore/PBCore。
  • #29 (2)复用成熟词表是关联数据领域普遍接受的最佳实践。BIBFRAME开发之初,LC基于对外部命名空间不稳定的疑虑,没有采用这一实践。各类RDF词表在这一两年的成熟发展,包括Web注释数据模型即将成为W3C标准,使LC改变做法,取消注释类,明确复用外部词表[对照英文摘要]。此外,BIBFRAME2.0草案中还采用了rdf:/rdfs:命名空间,显示BIBFRAME将专注于书目数据的核心部分。要实现对现有MARC数据的完全转换和对资源的准确揭示,针对专门资源的复杂属性,BIBFRAME必然会部分复用其他专业词表,比如音像资源的EBUCore/PBCore。
  • #30 (2)复用成熟词表是关联数据领域普遍接受的最佳实践。BIBFRAME开发之初,LC基于对外部命名空间不稳定的疑虑,没有采用这一实践。各类RDF词表在这一两年的成熟发展,包括Web注释数据模型即将成为W3C标准,使LC改变做法,取消注释类,明确复用外部词表[对照英文摘要]。此外,BIBFRAME2.0草案中还采用了rdf:/rdfs:命名空间,显示BIBFRAME将专注于书目数据的核心部分。要实现对现有MARC数据的完全转换和对资源的准确揭示,针对专门资源的复杂属性,BIBFRAME必然会部分复用其他专业词表,比如音像资源的EBUCore/PBCore。
  • #31 (2)复用成熟词表是关联数据领域普遍接受的最佳实践。BIBFRAME开发之初,LC基于对外部命名空间不稳定的疑虑,没有采用这一实践。各类RDF词表在这一两年的成熟发展,包括Web注释数据模型即将成为W3C标准,使LC改变做法,取消注释类,明确复用外部词表[对照英文摘要]。此外,BIBFRAME2.0草案中还采用了rdf:/rdfs:命名空间,显示BIBFRAME将专注于书目数据的核心部分。要实现对现有MARC数据的完全转换和对资源的准确揭示,针对专门资源的复杂属性,BIBFRAME必然会部分复用其他专业词表,比如音像资源的EBUCore/PBCore。
  • #32 单件(馆藏记录):不属于传统“书目记录”(载体表现)范畴,因而1.0放在“注释”类下,近似扩展属性 (3)LC在提出《书目框架计划总体规划》时,支持书目描述的馆藏在需求之列,它是支持图书馆自动化系统(ILS)中流通模块的数据类型。新增的单件类是对原注释类所属馆藏相关子类的重新定义。不同于基于书目和馆藏记录的ILS,关联数据以三元组揭示资源,不需要“记录”。BIBFRAME2.0设置的简单单件和复合单件类,跨越了书目和馆藏格式/记录的明确区分,能使单件信息揭示更加灵活、轻便、准确。
  • #33 单件(馆藏记录):不属于传统“书目记录”(载体表现)范畴,因而1.0放在“注释”类下,近似扩展属性 (3)LC在提出《书目框架计划总体规划》时,支持书目描述的馆藏在需求之列,它是支持图书馆自动化系统(ILS)中流通模块的数据类型。新增的单件类是对原注释类所属馆藏相关子类的重新定义。不同于基于书目和馆藏记录的ILS,关联数据以三元组揭示资源,不需要“记录”。BIBFRAME2.0设置的简单单件和复合单件类,跨越了书目和馆藏格式/记录的明确区分,能使单件信息揭示更加灵活、轻便、准确。
  • #35 参见:FRBRoo读后 http://catwizard.net/posts/20140209153428.html FRBRoo本体:1.0版将FRBR原来3组10个“实体”扩展为33个类,2.4版(含FRAD/FRSAD)类增加到48个(属性也由31+8个增加到64+8个)
  • #38 2016年秋,LC将进行第2阶段试验Pilot
  • #39 – 编辑器上的标签是否清晰有用?【RDA术语】 标签近乎与RDA同步,并尽可能链接到该元素的主要RDA条款。试验参与者发现标签和RDA规则链接很有帮助。 – 作品/实例二分法对编目员是否清晰有用? 作品和实例模型清晰,某些属性属于实例、其他特指作品。但试验参与者通常只查RDA规则,查看或录入取值,因此如何了解模型包装不那么重要。
  • #40 成熟指不事事用自己,只专注密切相关的,周边的如管理元数据等、细粒化的如影音、地图等,可能直接采用其他的。 是否会替代MARC?不好说,因为涉及大规模的更换ILS。 但被其他新的应用采用,应该是没有疑问的,有竞争力。
  • #41 OCLC关联数据项目2014-2015调查显示,排名前十、超过10个项目采用。 http://catwizard.net/posts/20160904151045.html