Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

RDA: its implementation and localization

1,737 views

Published on

RDA的实施与本地化.
“从文献编目到知识编码:关联数据技术与应用”专题研讨班. 上海图书馆. July 21, 2012

Published in: Technology, Business
  • Be the first to comment

RDA: its implementation and localization

  1. 1. RDA 的实施与本地化 胡小菁 华东师范大学图书馆2012.7.21 “从文献编目到知识编码:关联数据技术与应用”专题研讨班 1
  2. 2. and 基于more FRB R 机器 解构 可操作 A A CR2 RDA 实施 MA RC本地化 方案 更新 “从文献编目到知识编码:关联数据技术与应用”专题研讨班 Outline 2
  3. 3. 关于 RDA《资源描述与检索》 3
  4. 4. RDA 是什么?描述与组织所有资源类型的可扩展框架 内容类型 地图、计算机、记谱、声音、触觉、图片、文本、实物 、动画、其他、未指明(共 25 种) 媒介类型 音频、计算机、缩微、显微、投影、立体、无中介、视 频、其他 载体类型 发行模式 单部、多部分专著、连续出版物、集成资源 4
  5. 5. 与原有标准的关系 AACR2 解构,但继承与兼容 ISBD 、 MARC21 、 DC 元素集兼容 5
  6. 6. 要达到什么目的? 走出图书馆界 适用范围:档,博,数字存储机构( LAM ) 走出英语世界 不限于特定元数据标准 6
  7. 7. 基本理念 基于国际编目原则声明( ICP )  最高原则:用户的便利性 采用 FR 系列概念模型(实体 / 属性 / 关系)  FRBR 实体:作品、内容表达、载体表现、单件  FRAD 实体:人个、家族、团体、地点 目标之响应用户需求  查找 find  识别 identify  选择 select  获取 obtain  理解 understand 7
  8. 8. 关于 FRBR 模型书目记录的功能需求 8
  9. 9. FRSA 关于 FR 模型 D 概念 实物 事件 地点 + Group1 + Group2FRB R FRAD Zumer, Maja. FRBR: A Generalized Approach to Dublin Core Application Profiles. Proc. Int’l Conf. on Dublin Core and Metadata Applications 2010 9
  10. 10. 书 莎士比亚目 哈姆莱特实 中文版体 朱生豪译W 外文社E 1999MI 中北馆 10
  11. 11. 书目记录中的实体 - 属性 - 关系 个人 -W 关 主要责任者:莎士比亚 著 系 题名:哈姆莱特 / 莎士比亚著 ; 朱生豪 M 译 M 出版发行:北京 : 外文出版社 , 1999 M 载体形态: 452 页 , [1] 页照片 : 图 ; 19 W 厘米 E 关系 统一题名: Hamlet 概念 -W 关 译自: Hamlet, prince of Denmark 系 主题:话剧 剧本 英国 中世纪个人 -E 关系 其他责任者:朱生豪 译 M 11
  12. 12. 实体的唯一标识符 12
  13. 13. FRBR 化显示 按作品集中(莎士比  按作品和内容表达家 亚) 族细览  皆大欢喜  文本  终成眷属  动画  哈姆莱特  按语种细览  麦克白  按媒介类型细览  仲夏夜之梦  计算机(如电子书)  ……  非中介(如纸本图书)  视频(如录像片) 13
  14. 14. RDA 与 AACR2《英美编目条例》 14
  15. 15. AACR2 vs. RDA Part I. 著录  记录属性 2 图书 / 小册子 / 印刷单页 Section 1 载体表现 M 单件 I 3 舆图资料 4 手稿 5 乐谱 Section 2 作品 W 内容表达 6 录音 7 电影和录像 E 8 图片资料 9 电子资源 Section 3 个人 / 家族 / 团体 10 三维物品及教具 Section 4 概念 / 对象 / 事件 / 地点 11 缩微品 12 连续性资源 Part II. 标目、统一题名  记录关系 和参照 Section 5 WEMI 21 选择检索点 Section 6 个人 / 家族 / 团体 22 个人 Section 7 概念 / 对象 / 事件 / 地点 23 地理名称 24 团体  记录相互间关系 25 统一题名 Section 8 WEMI 间 Section 9 个人 / 家族 / 团体间 Section 10 概念 / 对象 / 事件 / 地点间 15
  16. 16. 声音特征AACR2 元素( 7 个) RD A 元素( 8 个)type of recording type of recording( 数字 / 模playing speed 拟)groove characteristic recording medium ( 磁 / 光 )track configuration playing speednumber of tracks groove characteristicnumber of sound channels track configurationrecording and reproduction tape configuration characteristics configuration of playback channels special playback characteristics 16
  17. 17. 样例 AACR2 RDA录音类型 : analog播放速度: 7 ½ ips音轨配置: 2 track播放声道配置: mono 17
  18. 18. 关系、关系、关系 Part I. 著录  记录属性 2 图书 / 小册子 / 印刷单页 Section 1 载体表现 M 单件 I 3 舆图资料 4 手稿 5 乐谱 Section 2 作品 W 内容表达 6 录音 7 电影和录像 E 8 图片资料 9 电子资源 Section 3 个人 / 家族 / 团体 10 三维物品及教具 Section 4 概念 / 对象 / 事件 / 地点 11 缩微品 12 连续性资源 Part II. 标目、统一题名  记录关系 和参照 Section 5 WEMI 21 选择检索点 Section 6 个人 / 家族 / 团体 22 个人 Section 7 概念 / 对象 / 事件 / 地点 23 地理名称 24 团体  记录相互间关系 25 统一题名 Section 8 WEMI 间 Section 9 个人 / 家族 / 团体间 Section 10 概念 / 对象 / 事件 / 地点间 18
  19. 19. 关系 Athena Salaba: RDA-wksp6.pdf, p.3 19
  20. 20. MARC/DC/CDWA 元数据标准 结构 / 编码标准数据值标准 编目 发布标准取值体系 / 词汇表中图法 /LCSH/AAT 标准 交换格式 2709/HTML/XML 内容标准 编目规则 AACR2/RDA/CCO 20
  21. 21. RDA 与 MARC RDA in MARC 21
  22. 22. 336-338 字段 245 $h 一般资料标识  336 内容类型  337 媒介类型  338 载体类型 22
  23. 23. 260 与 264 字段 260 出版发行  264 #0 生产 $a 出版发行地 未出版资源 $b 出版发行者  264 #1 出版 $c 出版发行日期  264 #2 发行  264 #3 制造  264 #4 版权日期 23
  24. 24. 受控值采用 URI (实验) 受控值:关系指示词、 336-338 、编码数据字段 、受控检索点 MARC 咨询委员会讨论结果( 2010-1-17 )  一些参与者不愿意实验,因为涉及大量系统工 作:如何解释、取回什么、如何定义值与 URI 的关系。某些参与者愿意用一套测试记录来实 验。在问题整理出以前没有定案。  将准备文件,对如何在 MARC 中使用 URI 提 供指导与实例,供希望实验者使用。 MARC DISCUSSION PAPER NO. 2010-DP02: Encoding URIs for controlled values in MARC records (2009-12-14) 24
  25. 25. MARC 的问题之:一对多 其他形态细节 (UNIMARC-215$c / MARC21-300$b)  图书(插图) 215 $c 照片,彩图,地图  地图(形态、色彩、材料等) 215 $c 彩色,石膏  录音资料(材料、速度、录制方法、磁迹、声道 、降噪或补偿说明) 215 $c78rpm ,单声道,粗纹,横向  缩微资料(极性、缩率、色别、感光乳剂、片基 、影像布局等) 215 $c 负像, 1:15 ,彩色,硝酸片基 fade away 25
  26. 26. RDA 的实施1 、作为传统编目条例的替代品 国际范围采用2 、 FRBR 模型的实现3 、关联数据应用 注册元素集及词汇表 26
  27. 27. 应用实例: eXtensible Catalog (XC) XC Schema  采用 DC 应用纲要的概念,从不同的 Schema 中选择元数据元素  包括: 22 个 RDA 元素 (elements) 11 个 RDA 职能指示词 (role designators) 全部 DC 词汇 (dcterms) 专门定义的数据元素 关联数据 应用初步 27
  28. 28. 三种实施方案: FR 模型的实现 RDA Database Implementation Scenarios  2007.1 RDA 编辑 Tom Delsey 提出  2009.7 修订 Scenario 3 :扁平文档(无连接) Scenario 2 :关联书目和规范记录 Scenario 1 :关系 / 面向对象 28
  29. 29. 书目记录 Scenario 3 ‘Flat file’ database structure (no links) 规范记录 29
  30. 30. Scenario 2 Linked bibliographic and authority records 30
  31. 31. Scenario 1 Relational / Object-oriented database structure 31
  32. 32. 各国实施 RDA 2013 年第一季度  美国( Day one: 2013.3.31 )  LC 、 NAL 、 NLM  PCC :之后规范记录必须,书目记录时间未定  不列颠图书馆  加拿大图书馆与档案馆  德国国家图书馆  澳大利亚国家图书馆 OCLC :设想依 RDA 更新 WorldCat 记录 32
  33. 33. RDA 在中国 RDA 中文翻译  RDA 理论与实践培训 (2012.5- )  2012.7.9-11  国家图书馆出版社与  国家图书馆 ALA 签署协议  “RDA 在中国的实施和  国家图书馆与 CALIS 挑战”研讨会 联机合作编目中心组织  2012.7.11  2013 年初出版  国家图书馆 33
  34. 34. 本地化, Scenarios in China ?#1 中西文编目统一采用 RDA#2 西编采用 RDA ,中编编制并采用另一并行标准#3 编制基于 FRBR 和 ICP 的本地标准用于中西文编目#4 (至少在短期内)保持现状 Kai Li. RDA in China. “RDA Worldwide”, ALAMS 12 June 24th, 2012, Anaheim, California RDA 最终是否会用于中文资料编目? RDA 是否会用作《中国图书馆编目规则》未来版本的基础 ? 均尚未决定,也不会在一两年内决定。 ──Ben GU (SCATNews, No. 37) 34
  35. 35. 西文编目:为 RDA 做准备 政策准备  套录:沿用?改动?  原编? 培训准备 系统准备  MARC 格式设置(字段 / 子字段、索引规则)  OPAC 显示设置 35
  36. 36. 一大波僵尸正在接近! 36
  37. 37. “RDA :为关联数据而生” Machine-actionable 37
  38. 38. 让 RDA 从概念性转为行动性 数据模型会议(伦敦会议:不列颠图书 馆, 2007.4.30-5.1 )  DCMI 与 JSC 合作  元数据管理组织 ( Metadata Management Associates) 及志愿者实 施  BL 及 Siderean 软件公司资助 由 RDA 元素创立机器可操作本体 (machine- actionable ontology) 图书馆由传统数据观转轨至关联数据及语义网的 开端 Karen Coyle: RDA Vocabularies for a Twenty-First-Century Data Environment. Library Technology Reports, 2010, v.46, no.2, p.26-36 38
  39. 39. RDA 注册: RDVocab RDA 元素集 RDA 取值词 表 http://rdvocab.info/ 39
  40. 40. RDA 注册:取值词表 关系 指示词 描述 / 著录中 图书的载体形态 非照录部分的AACR2 902 p. : chiefly col. ill. ; 24 cm. 规定用语 RDA 902 pages : chieflyColoured illustrations ; 24 cm. RDA Illustrative Content http://rdvocab.info/termLIst/IllusContent/1015 RDA colour http://rdvocab.info/termList/RDAcolour/1001 RDA Extent of Text http://rdvocab.info/termList/extentText/1001 40
  41. 41. 取值词表 2011.8 第一批出版  获批 11 种 JSC D CM I /RD A 工作组  共 68 种(现 70 种) ALA 出版社 2012.1 第二批出版 评审通过  载体类型  内容类型  媒介类型 41
  42. 42. 取值词:德语版 Vocabulary: RDA Content Type http://rdvocab.info/termList/RDAContentType/1001 Concepts: cartographic dataset http://www.metadataregistry.org/conceptprop/list/concept_id/510.html 42
  43. 43. RDA 联机注册:元素集http://metadataregistry.org/rdabrowse.htm 内容标准 ↓Lable……URI 元数据标准Title http://rdvocab.info/Elements/titleEdition statement http://rdvocab.info/Elements/editionStatementPlace of production http://rdvocab.info/Elements/placeOfProductionDate of production http://rdvocab.info/Elements/dateOfProductionCopyright date http://rdvocab.info/Elements/copyrightDateIdentifier for the manifestation http://rdvocab.info/identifierForTheManifestation 43
  44. 44. 把记录细化到数据 记录 元数据注册目的 数据  建立数据层应用间的兼容 以 RDF 三元组格式表达数据 数据 主 谓 宾 数据 44
  45. 45. Bibliographic record: 12345 Name authority record: 8765Title: Cataloguing is fun! Heading: MacDonald, MaryAuthor: Mary MacDonaldContent type: text n8765 Heading “MacDonald, Mary”Media type: microform t1234 Preferred label “microform”LCSH: Cataloging Bibliographic data in 主 谓 宾 the Semantic Web / Gordon Dunsire b12345 Title “Cataloguing is fun!” b12345 Author “Mary MacDonald” n8765 b12345 Media type “microform t1234 b12345 Content type t9876 “text”b12345 LCSH “Cataloging” lc1234 t9876 Preferred label “text” lc1234 Heading “Cataloging” 45
  46. 46. RDA 的修订:机器可操作RDA 第 3 章机器可操作数据元素(讨论稿) 数量与尺寸  图书: 902 pages ; 24 cm  乐谱: 1 score and 3 parts (19 pages)  地图: 20 x 30 cm, on sheet 25 x 35 cm元素→元素 - 方面 46
  47. 47. 方面 - 单位 - 量:乐谱数量 文本描述: 1 score and 3 parts (19 pages) Aspect: extent/number of subunits (数量 / 子单元数) Unit: score Quantity: 1 Aspect: extent/number of subunits (数量 / 子单元数) Unit: parts Quantity: 3 Aspect: extent/number of subunits (数量 / 子单元数) Unit: pages Quantity: 19 Machine-Actionable Data Elements in RDA Chapter 3: Discussion Paper (May 2012) 47
  48. 48. 方面 - 单位 - 量:地图尺寸 文本描述: 20 × 30 cm, on sheet 25 × 35 cm content/carrier: map carrier: sheet  Aspect: width  Aspect: width  Unit: cm  Unit: cm  Quantity: 20  Quantity: 25  Aspect: height  Aspect: height  Unit: cm  Unit: cm  Quantity: 30  Quantity: 35Machine-Actionable Data Elements in RDA Chapter 3: Discussion Paper (May 2012) 48
  49. 49. 设计准则:文本描述→可操作 功能:  易于为确定区分内容进行匹配  按大小、尺寸或其他准则排序  基于数量对媒介材料做更细粒度的分面  为自动确定数量提供更佳途径  以不同语言提供文本值与标签  能够为特定用户精简及条列更复杂的数量信息  录入时数据有效性检查Machine-Actionable Data Elements in RDA Chapter 3: Discussion Paper (May 2012) 49
  50. 50. RDF 图示Machine-Actionable Data Elements in RDA Chapter 3: Discussion Paper (May 2012) Fig.1: RDF graphs of the basic extent sub-elements 50
  51. 51. 不只是 RDA走向 machine-actionable 51
  52. 52. 其他元数据注册 MARC21 书目 (http://marc21rdf.info/) IFLA 名称空间 (http://iflastandards.info/)  ISBD (http://iflastandards.info/ns/isbd/)  FR (http://iflastandards.info/ns/fr/) 已出版 Open Metadata Regitsry 52
  53. 53. MARC21 书目:非官方版( 2011.9.11 ) MARC21 Element Sets 元素集 (14 个 )  00X (定长 / 控制字段)  0XX 、 1XX 、 2XX 、 3XX 、 4XX 、 5XX  主题: 60X (个人) , 61X (团体 / 会议) , 63X (统 一题名) , 64X (时间) , 65X  7XX  8XX MARC21 Vocabularies 取值词表 (115 个 )  定长字段中各字符位的取值: 006 ( 1 个)、 007 ( 94 个)、 008 ( 20 个) http://marc21rdf.info/ 53
  54. 54. ISBD ( 2012.2 出版) 西班牙 ISBD Element Sets 元素集 国家图书馆书目  ISBD elements Element list (182) 关联数据 ISBD Vocabularies 取值词表 用此发布  ISBD Content Form Concept list (11)  ISBD Content Qualification of Dimensionality Concept list (2)  ISBD Content Qualification of Motion Concept list (2)  ISBD Content Qualification of Sensory Specification Concept list (5)  ISBD Content Qualification of Type Concept list (3)  ISBD Media Type Concept list (10) http://iflastandards.info/ns/isbd/ 54
  55. 55. 功能需求系列( 2012.5 出版) FRBR Element Sets 元素集  FRAD model Element list (147)  FRBRer model Element list (216)  FRBRer open model Element list (3) 待审  FRSAD model Element list (19) FRBR Vocabularies 取值词表  FRAD User Tasks Concept list (4)  FRBRer User Tasks Concept list (4)  FRSAD User Tasks Concept list (4) http://iflastandards.info/ns/fr/ 55
  56. 56. Schema.org 的图书馆扩展 类 Classes (近似内容类型)  如:档案资料、计算机文件、游戏、图像、乐谱… … 对象特性 Object Properties  如:出版地 数据特性 Data Properties  馆藏数、 OCLC 控制号 命名个体 Named Individuals (近似载体类型)  如:有声书、蓝光碟、盲文书、光盘、 VHS 录像带… … 标注特性 Annotation Properties  dc:creator, dc:description, dc:title, vs:term_status Experimental “library” extension vocabulary for use with Schema.org 56
  57. 57. LC 的后 MARC 计划 书目框架转变行动( 2011.5- )  取代 MARC 21 ,以从新兴的内容标准 中充分受益  以语义网和关联数据技术做实验  在更广泛的网络搜索环境中最大限度重用图书馆元数 据 Bibliographic Framework Transition Initiative 57
  58. 58. LC 正式启动以关联数据取代 MARC 建模计划( Modeling Initiative , 2012.5- )  Eric Miller 领导的 Zepheira 团队  把 MARC21 格式翻译到关联数据模型,同时尽可能 保留传统格式健壮且有利的方面  提出作为有力起点的模型供讨论  基于反馈及进展,改变或调整提出的模型  最初的模型将作为演示系统 / 服务的工作基础,反过 来也会用于进一步细化模型  LC 现在将开始组织不同的方案,以使图书馆参与者 更为广泛 The Library of Congress Announces Modeling Initiative 58
  59. 59. References Athena Salaba. RDA: The New Cataloging Standard, A Workshop offered by the School of Library & Information Science, Kent State University. October 21-22, 2011 Gordon Dunsire. Bibliographic data in the Semantic Web – what issues do we Presented to the ALCTS Cataloging and Classification Section Executive Committee Forum, ALA Annual, 24 June 2011 Peter J. Rolla, Machine-Actionable Data Elements in RDA Chapter 3: Discu (May 2012) Tom Delsey. RDA Database Implementation Scenarios (5JSC/Editor/2/Rev, 1 July 2009) 59
  60. 60. 推荐博客: Metadata Matters Open Metadata Registory 团队  This blog is about Metadata, attached to the site of Metadata Management Associates. 博客作者  Diane Hillmann  Gordon Dunsire  …… http://managemetadata.com/blog/ 60
  61. 61. Question ?

×