Your SlideShare is downloading. ×
What we are now and what we will be
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

What we are now and what we will be

2,661
views

Published on

我们所处的环境和我们可能的未来

我们所处的环境和我们可能的未来

Published in: Technology

0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
2,661
On Slideshare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
24
Comments
0
Likes
1
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide
  • Transcript

    • 1. 与《全国报刊索引》同仁座谈 刘炜 2008 年 8 月
    • 2.
      • 引言
      • 大背景
      • 技术环境
        • 整合搜索
        • Web2.0
      • 2.0时代的元数据服务
      • 策略建议:开放、免费、互动、混搭
    • 3.  
    • 4.  
    • 5.  
    • 6.
      • 1955 书本式索引
      • 1995 索引数据库
      • 光盘版
      • 2003 网络版
    • 7.
      • 网站平台的建立
      • 资源覆盖率的不断提高
      • 服务的拓展,推出各类增值服务
      • ……
      • 下一步?
    • 8.
      • 用户是谁?
      • 定位在哪?
      • 核心竞争力是什么?
      • 与图书馆业务和书目数据什么关系?
      • 如何可持续?
    • 9.
      • User1:  我们订了《索引》订的还很全,是你们《索引》的忠实用户
      • me:  能说说你们为什么要订吗?有用户吗?用户用得多吗?
      • User1:  用的不是太多,主要是想 查的全 , 尤其是解放前
      • 对一些 社会科学 与 报纸 很有用
      • me:  哦,明白了
      • User1:  然后通过上图进行文献传递,当然上图的 价格有些贵
      • me:  主要是解放前的资料 ?
      • User1:  你们的系统多少年才 改进检索平台 ,象社会主义的态度
      • me:  对于解放前的资料,其他有没有检索途径?
      • User1:  我以前去上图开过你们的会,我还是讨论组的发言人呢。哈哈,那时很年轻,什么都敢说
      • 现在也许是国家图书馆?但 我相信《索引》还是最全的
    • 10.  
    • 11.
      • 无处不在的信息:信息超载,眼球贫困
      • 无处不在的计算:手持设备 ipod/iphone/kindle
        • 无处不在的自助服务: ATM, Webstores, eGov, eBanking
        • 微内容的分散与聚合 Ringtones, e-News, RSS readers, My Yahoo/MSN/etc…
        • 开放运动:开放资源、开放内容与开放存取
    • 12.
      • 2006 年全球每年制造、复制出的数字信息量共计 1610 亿 GB ,中国数字信息量为 127.1 亿 GB ,占全球信息量的 7.9% ;
      • 受“富媒体”、用户创建内容和 16 亿网民三大因素推动,到 2010 年,全球数字信息量预计为 9880 亿 GB ,而中国的数字信息 量预计为 900.5 亿多 GB ,占全球信息量的 9.1% 。
      • 印度的数字信息量预计为 172 亿 GB ,韩国的数字信息量预计为 157 亿 GB ,日本的数字信息量预计为 520 亿 GB 。
    • 13.
      • 音乐作品 ( 莫扎特 ) :约 100MB
      • 报纸 ( 华尔街杂志 ) : 100MB/ 年 ( 文本 )
      • 卡片目录 ( 美国国会图书馆 ) : 17GB
      • 广播 (WABC) : 270GB/ 年 ( 未经压缩 )
      • 网络论坛 (Netnews) : 300GB/ 年
      • 地区图书馆 ( 加州大学图书馆 ) : 1.4TB( 图书扫描版 )
      • Internet 出版 (WWW) : 1997 年约 4TB
      • 电视 (CNN 新闻 ) : 1GB/1 小时 , 6TB/ 年 ( 经压缩 )
      • 录像带出租 (Blockbuster Video) : 9TB
      • 科研图书馆 ( 美国会图书馆 ) :全部图书馆数字化 20TB
      • 来源:美国伯克利加州大学教授 Peter Lyman 和 Alex Internet 公司总裁 Brewster Kahle 所著《文化制品数字化存档行动纲要》。
    • 14.
      • 图书、报纸、期刊等三大传统出版业持续发展,品种增长很快。 2005 年,中国共有图书出版社 573 家 ( 包括副牌 34 家 ) ,出版图书 222473 种 ( 其中新 版图书 128578 种 ) ,图书总印数 64.02 亿册 ( 张 ) ;出版报纸 1931 种,报纸总印数 412.6 亿份;出版期刊 9468 种,期刊总印数 27.59 亿 册。
      • 人均购书量一直徘徊在五册左右,报纸每千人天份数不到 100 份,期刊人均每年只有两本多,光盘人均只有半张。
      2006 北京国际出版论坛
    • 15.
      • 中国的日报出版总量规模连续第五年居世界第一。   根据《报告》统计,二 00 四年,中国出版的日报种类已经占全球日报总量的百分之十四点五,世界每七种日报中,就有一种出自中国;而日报平均期印量逼近一亿大关,居世界第一位,中国千人日报拥用率达到七十五点八份。   与此同时,中国报纸经济实力大幅上升,全年报纸总定价达二百五十三亿元人民币,报纸广告经营额达二百三十亿元,报纸印刷总量达到了一千五百二十六亿对开张,比上年增长近四分之一。
    • 16.
      • 中国期刊总数达 9468 种 1970 年中国有 21 种期刊,而截至今年4月底,中国期刊总数已达到 9468 种。去年,中国期刊年总印数 28.5 亿册,总印张 134.7 亿印张,定价总金额达 140 亿元人民币 , 期刊业年产值达 170 多亿元 。 ( 人民日报海外版 )
      •   我国人均拥有藏书仅 0.39 册 据悉,去年,我国人均拥有藏书量为 0.39 册,上海的人均拥有藏书量最多,为4.48册,安徽省最少,人均为0.15册。(新华网)
    • 17. 多任务上网 上网任务明确 ( 如搜索信息等 ) 参与性强 原则性强 无意识 目的明确 获取图像 / 声音 / 视频 主要获取文本信息 随机 / 发散浏览 直线地、逻辑地、顺序地浏览 交互式 / 网状联系 独立地 / 个性化的联系 新生代 一般读者
    • 18.
      • 全球信息存在形式
      纸 胶片 录象带 CDs 数字影像 磁带 硬盘 文件系统 300 Exabytes 20 Exabytes 1000 Petabytes 100 Terabytes 模拟 数据 离线 在线 Internet . 10 HTML Source: Information TYO (June 1999) by Ashok Chandra, IBM Research - Almaden
    • 19. 参照美国肯特州立大学的曾蕾教授摘译自 Lorcan Dempsey “Terms and conditions ... libraries, subject terminologies and the web 2004” 改编。原文 http://www.oclc.org/research/presentations/dempsey/dewey_20040316.ppt
    • 20. 用户 网站建设 人员培训 参考咨询 读者管理 开放资源获取 租订数字资源 资源数字化 纸质资源 ILS 用户 社区 用户
    • 21. 知识组织 资源整合 门户建设 Web 服务 开放资源获取 租订数字资源 资源数字化 社区 用户
    • 22.
      • 《索引》所处的技术环境:资源整合搜索技术
      • 《索引》面临的技术趋势: Web2.0 用户交互技术
    • 23.
      • 三种方式:
      • 联邦搜索( Federation )
        • Z39.50/ZING
        • 非标准 ( 页面分析 )
      • 元数据收割( Harvesting )
        • OAI/ORE
      • 本地获取( Gathering )
        • Google 等搜索引擎
        • 其它方式:聚合 (RSS) 、登记注册
      • 一种特例 ( 并非整合,只是链接 )
        • OpenURL
    • 24.
      • 基于协议标准
        • Z39.50/ZING
        • OAI-PMH/ORE
        • OpenURL
        • Web Services
      • 非标准的整合
        • 页面分析
        • “ 前”标准: Web2.0 方法
    • 25.
      • 在 Web 间传递信息的机制
      • 定 义
        • 应用于 Web 超链接的一种语法标准。
        • 通过预先定义的标签 ( Tag ) ,增进 Web 超链接 能力。
      • 规范
        • 定义一个标准的因特网数据链接语法。
        • 让标靶 ( Target ) 可以轻易解析数据源 ( Source ) 所传送的请求。
        • 而数据源 ( Source ) 能够很容易地对服务 提供者( Target ) 送出深度链接服务要求。
    • 26.  
    • 27. 来自:潘晓玲 2007 硕士毕业论文《数字图书馆非标准数据资源整合检索系统的研究与实现》
    • 28.
      • Web 作为平台
      • 获得集体智慧 Collective Intelligence
      • 以数据为核心 Data is the next “Intel Inside”
      • 永远的测试版(由于定位于服务而非软件)
      • 轻型商务模式 Lightweight business models
      • 软件独立于设备 Software above the level of a single device
      • 丰富的用户体验 RUE
    • 29.
      • Microformat
      • Tag/Folksonomy
      • Mashup
      • Greasemonkey
      • CoINS
      • unAPI
      • Wedget/gadget
      • OpenID
      • REST
    • 30.  
    • 31.
      • 为特殊应用而制定的特殊格式;
      • 可以插入网页或 XML 元数据中,被收割和索引;
      • 数据可被重用、与具体应用无关;也可自定义,完全取决于应用;
      • 例如: XFN, hcalendar, hcard, rel tags, rel license, lists and outlines, 等等… http://microformats.org/
    • 32.
      • People and Organizations
        • hCard
      • Calendars and Events
        • hCalendar
      • Opinions, Ratings and Reviews
        • VoteLinks , hReview
      • Social Networks
        • XFN
      • Licenses:
        • rel-license
      • Tags, Keywords, Categories
        • rel-tag
      • Lists and Outlines
        • XOXO
      http://microformats.org/about/ http://microformats.org/wiki/Main_Page
    • 33. <div class=&quot;vcard&quot;> <img style=&quot;float:left; margin-right:4px&quot; src=&quot;http://www.flickr.com/photos/kevenlw/&quot; alt=&quot;photo&quot; class=&quot;photo&quot;/> <a class=&quot;url fn&quot; href=&quot;http://my.donews.com/keven/&quot;>Keven Liu</a> <div class=&quot;org&quot;>Shanghai Library</div> <a class=&quot;email&quot; href=&quot;mailto:kevenlw@gmail.com&quot;>kevenlw@gmail.com</a> <div class=&quot;adr&quot;> <div class=&quot;street-address&quot;>Huai Hai Zhong Road</div> <span class=&quot;locality&quot;>Shanghai</span>, <span class=&quot;region&quot;>Shanghai</span>, <span class=&quot;postal-code&quot;>200031</span> <span class=&quot;country-name&quot;>China</span> </div> <div class=&quot;tel&quot;>64455555-8311</div> <a class=&quot;url&quot; href=&quot;aim:goim?screenname=kevenlw&quot;>AIM</a> <a class=&quot;url&quot; href=&quot;ymsgr:sendIM?kevenlw&quot;>YIM</a> <p style=&quot;font-size:smaller;&quot;>This <a href=&quot;http://microformats.org/wiki/hcard&quot;>hCard</a> created with the <a href=&quot;http://microformats.org/code/hcard/creator&quot;>hCard creator</a>.</p> </div> 显示形式: Keven Liu Shanghai Library kevenlw@gmail.com Huai Hai Zhong Road Shanghai , Shanghai , 200031 China 64455555-8311 AIM YIM
    • 34.
      • ‘ Microcontent’ 由 Jakob Nielsen 提出,指一小段包含元数据的文本,有特定的内容,与微格式的区别是不一定有特定的编码。
      • microcontent is a finite collection of metadata and data that has at least one unique identity and at least one unique address on the network, and that encapsulates no more than a small number of central ideas, where the number of central ideas encapsulated is usually 1. http://novaspivack.typepad.com/nova_spivacks_weblog/2003/12/defining_microc.html
    • 35.
      • 微资源的产生(例如:做网络书签?);
      • 微资源需要标识( permanent id ?);
      • 微资源需要描述( metadata );
      • 微资源需要重组(聚合);
      • 微资源的重用;
      • 微资源的呈现( tag cloud ?);
      • 微资源的管理和利用需要工具( flickr/del.icio.us/blinklist/365key… )。
    • 36.
      • 标示,为了查找。专指度高好还是低好?每个人都回折中。
      • 指代,索引中指代原件
      • 聚类,为了关联。
      • 分面标引
      • 集体智慧。
    • 37.
      • Folksonomy 由 tag 组成。
      • Tag 在 folksonomy 中是微资源的指代物。
      • 通过检出 tag 而检出微资源。
      • Tag 是平面的。
      • Tag 是随意的。
      • Tag 云图反映了 tag 的权重。
    • 38.
      • Tag 可以排序(除了目前的字顺和权重,还有多种形式,包括动态形式,如结合相关反馈、合作过滤、点击次数、甚至类 pagerank 等);
      • Tag 可以层级化(层次关系,例如 del.icio.us 目前支持的 tag 类目);
      • Tag 可以聚类(反映了资源之间的关系;经常在一起的 tag 具有较为密切的关系,等等);
      • Tag 可以规范化(同义词、反义词归并指代;用代属分参关系标注等)。
    • 39.
      • 什么是 Mashup
      • Mashup 举例
    • 40.
      • 一项网络应用其数据内容来自多个不同的站点
      • 通过第三方提供的公共应用程序接口 API 动态组合提供服务
      • 一般采用轻型的 Web 服务 ( 基于 REST 或 SOAP)
    • 41.
      • 基于 XML 的多种内容格式和基于这些格式的互操作 / 通信协议。包括 RSS , RDF (RSS 1.1), Atom 以及大量的微格式;
      • FOAF XFN 等特别设计的格式和协议 ( 主要是基于社会型网络 social networking ) 扩展了 2.0 网站的功能,允许用户分布式地交互。
    • 42.
      • GPS 接收十分普遍且费用低廉
      • 直观、新颖、实用
      • 成熟技术,低技术门槛
      • 数据免费 (google maps)
      • 应用扩展性好
      • 动态性好
      • 直接用于手持设备
      • 具有社会性应用前景
      • ……
    • 43.
      • 一致性问题
      • 潜在的法律问题
      • 盈利模式
      • 竞争
      • 可性度问题
    • 44.
      • 统一的 Mashup 应用程序接口注册服务(便于服务发现);
      • Mashup 工具的开发
      • 桌面门户的出现消灭门户:在你的客户端 Mashup
      • 杀手级应用的出现使得应用迅速普及
      • RSS 成为数据 mashup 的标准格式
      • 知识产权问题的合理妥善解决
    • 45.
      • 寻找现成应用的 API ( 到 2006 年 8 月 13 日 23:30 共有 251 个 )
        • http://www.programmableweb.com/apis
        • http://www.mashupfeed.com
      • 获得应用 ID (API key)
        • 有时并不需要
        • 通常都有免费许可,免费服务通常有一定约束
      • 仔细阅读文档
        • 服务限制 ( 次数 / 地点 / 使用等方面 )
        • 关于提问式的特殊规定
      • 编写简单代码(甚至不需要),开始 Mashup !
    • 46.
      • 在不同的 Web 应用之间拷贝 / 粘贴数据标准方式;
      • 实现一种简便的、普适的微格式应用的传输机制
    • 47.
      • 任何东西都有地址 Everything URL(URI) addressable
      • 走向社会化 Go Social
      • 随处无线接入 Wifi everywhere
      • 普遍计算 Ubiquitous computing
      • 集成、专指、移动 (synthesise, specialise, mobilise)
      • 服务于长尾
      • 语义描述是数字图书馆服务的基础
    • 48.
      • 更多的用户:去用户所在的地方!
      • 开放元数据仓储,支持元数据交换、重用与互操作
      • 开发以用户为中心的元数据
    • 49.  
    • 50.
      • B.W. ( 前万维网时代 )
        • 用于印本馆藏管理
        • 规范的馆藏记录
        • 区域性合作编目系统
        • 手工生产元数据
      • A.W. ( 后万维网时代 )
        • 用户社区不同,媒体类型多样
        • 记录类型繁多,来源广泛
        • 多库存储,松散耦合,协议交换信息
        • 元数据记录手工创建与自动半自动结合,包括自动抽取、转换、映射等方式
      翻译自 Karen Calhoun OUR Space: the new world of metadata slide 13
    • 51.
      • 加入本地馆藏
      • 提供本地仓储
      • 补充、修订元数据记录
      • 提供本地服务
    • 52.  
    • 53.
      • 专题服务(已有)
      • 原文提供(已有)
      • 资源整合 / 全文链接
      • 文献计量、学科评价、引文分析、趋势预测
      • 平台化
      • 工具化(个人知识组织工具)
      • 目标:占据科研的桌面,报刊索引的服务无所不在
    • 54.
      • 检索功能
      • 导引(文献控制)功能(利用现有的规范词表和分类体系,以及用户标注或自动生成的标签、本体)
      • 计量功能并提供工具:
        • 个人知识管理
        • 统计分析
        • 趋势分析工具 google trends
    • 55.
      • 开放数据,提供工具,让用户自己进行文献计量分析
        • 主题词检索
        • 命中结果年份统计列表
        • 命中结果学科专业分布
        • 命中结果作者分布
        • 命中结果研究单位分布
        • 命中结果刊物分布
        • (以上均可调整参数,例如“前 ** 位作者)
    • 56.
      • 会议管理(征文、信息发布、注册、日程管理、广告招商)
      • 会议录
      • 参会信息(事件)
      • 人员信息
      • 学术信息
    • 57.
      • 更强大的技术:
        • 数据加工流程的改进
          • 富语义的提取
          • 微格式的建立
          • 全文链接的实现机制
        • 用户交互平台( 2.0 )
          • 用户提供数据平台的建立(推荐刊、标签、添加目次、纠错)
          • 用户使用信息的收集反馈
        • 管理平台
          • 实时更新发布
          • 纠错机制
      • 更丰富的数据
      • 更高质量的服务
    • 58.
      • 开放
        • 数据开放,接口开放,过程开放,工具开放
      • 免费
        • 探寻新的商务模式:以读者为伙伴
        • 最大限度地拓展用户市场,占据一席之地
      • 互动
        • 社会化(社会性网络), 2.0 化
      • 混搭
        • 采用新的技术,发挥综合优势
    • 59.