從鏡射站到長期保存
柯皓仁 教授
國立臺灣師範大學
圖書資訊學研究所、圖書館
1
好漢不提當年勇,我不是好漢,
所以…
2
InfoSpring Project
國內引進電子資源的先驅計畫
國立交通大學+財團法人交大思源基金會
1995年起陸續建置電子資源鏡射站
CSA, Elsevier, Ei, ISI, OVID
除交通大學外,與20+學術單位訂戶共享
當時臺灣只有兩條T1線連到美國
投資超過美金二十五萬元
相關技術轉移CONCERT
3
Hao-Ren Ke (2002). Interlibrary Cooperation in the Era of Electronic Library – The
Taiwan Experience. In D.E. Williams & E.D. Garten Eds., Advances in Library
Administration and Organization (Vol. 19, pp. 191-244). JAI Press Inc.
InfoSpring Project的影響
Expedite a shift in research information
services
Explore the possibility of resource sharing
Integrate library and computer sciences
Establish a resource-sharing consortium
model for research information
Initiate government support
4
Hao-Ren Ke (2002). Interlibrary Cooperation in the Era of Electronic Library – The
Taiwan Experience. In D.E. Williams & E.D. Garten Eds., Advances in Library
Administration and Organization (Vol. 19, pp. 191-244). JAI Press Inc.
電子資源連線使用方式與優缺點
5
電子資源連線使用方式
國內建置鏡射站
聯盟成員購置伺服器與資料儲存空間,用以安裝國
外資料庫廠商的資料庫檢索系統
連線使用速度快且穩定
需由聯盟負責維持正常運轉
直接連線至廠商的主機
訂戶直接連線到廠商主機上檢索資料
在連線使用速度上不如鏡射站
成本、網路連線速度、加值分析、技術轉移、
廠商經營政策
6
柯皓仁、黃明居(2000年03月)。國科會數位圖書館建置計畫-電子化
資源之建置與研發。資訊傳播與圖書館學季刊,6(3),47-60。
CONCERT共享聯盟引進資料庫
現況 (至民國88年6月)
7
引進資料庫 資訊提供者 引進方式 會員數目 授權方式
Ei Village/
Compendex Web
EI 鏡射站 21 Consortium License
SDOS Elsevier 鏡射站 35 Consortium License
Web of Science
(WOS)
ISI 鏡射站 5 Consortium License
IDEAL Academic
Press
直接連資料庫廠商 62 Consortium License
IEL Online IEEE 直接連資料庫廠商 21 Consortium License
EBSCOhost
(ASE/BSP)
EBSCO 直接連資料庫廠商 96+1+53 由科資中心支付
National License
FirstSearch OCLC 直接連資料庫廠商 96 由科資中心支付
National License
SwetsNet Swets 直接連資料庫廠商 96+1+53 由科資中心支付
National License
柯皓仁、黃明居(2000年03月)。國科會數位圖書館建置計畫-電子化
資源之建置與研發。資訊傳播與圖書館學季刊,6(3),47-60。
鏡射站軟硬體與維護
8
資料庫名稱 伺服器規格及
儲存空間
資料提供方式
資料更新頻率
建置完成時間
Ei Village Sun Ultra II with 2 CPUs,
256MB RAM
FTP
平均每二週更新
民國87年6月
SDOS Sun Enterprise
(由中研院負責機器購買與資
料庫建置管理)
光碟片
平均每週更新
民國88年1月
ISI Sun Enterprise 3500 with 4
CPUs, 1GB RAM
432GB RAID-5硬碟陣列
FTP
平均每週更新
民國88年9月完成
柯皓仁、黃明居(2000年03月)。國科會數位圖書館建置計畫-電子化
資源之建置與研發。資訊傳播與圖書館學季刊,6(3),47-60。
鏡射站與連線之優缺點分析
9
鏡射站 直接連線
成本 高 低
網路連線速度 快 慢
加值分析項目 多 少
技術轉移 可 無
廠商經營策略 複雜 簡單
柯皓仁、黃明居(2000年03月)。國科會數位圖書館建置計畫-電子化
資源之建置與研發。資訊傳播與圖書館學季刊,6(3),47-60。
設置鏡射站的費用
Sever/Storage Cost
Powerful Server
Enormous Storage Space
Manpower for
System Maintenance
Data Loading
Technology Management
Cooperation between Library Science and
Computer Science
10
從鏡射站到長期保存
11
Definition of Digital Preservation
Digital preservation is defined as the
managed activities necessary
For the long term maintenance of a byte stream
(including metadata) sufficient to reproduce a
suitable facsimile of the original document, and
For the continued accessibility of the document
contents through time and changing technology
圖書館的使命
Access and Archiving
為了現在的讀者,也為了將來的讀者
12
電子期刊長期保存值得投注更多
的關心
數位出版的蓬勃發展
不言可喻
純電子期刊(無紙本)的數量逐漸增多
完全邁向純電子期刊時代的前提之一 – 無懈可擊的電子期
刊保存方案
使用者偏好使用電子期刊
7-8成使用者習慣於使用電子期刊
雖有電子期刊如何保存的疑慮,但許多教師仍接受
刪訂紙本期刊
13
電子期刊長期保存值得投注更多
的關心
圖書館的責任
電子資源費用占圖書館整體預算的比例逐漸上升
ARL: 6成、國內大學圖書館:5成
圖書館仍因為經費考量而刪訂紙本期刊(e-Only)
2006年的ARL調查中有58%會員館刪訂紙本期刊
區域性或國家性的紙本期刊典藏中心並非適合的電子期刊
長期保存方式
永久使用(perpetual access) 不等於 長期保存
永久使用:在停訂後還可以使用先前訂購的內容
可能需要付Access Fee
是否可以信賴出版社或分銷商持續提供舊內容的取用,尤其
是當出版社停止刊行或圖書館停止訂閱某期刊
長期保存:降低數位內容永久喪失的風險,確保後人得以
使用 14
NERL Generic License
15
NERL Generic License (Cont.)
16
電子期刊(出版品)的長期保存是
誰的責任?
紙本時代,出版社有長期保存的責任嗎?
數位出版時代,出版社有長期保存的責任嗎?
電子期刊長久保存的責任是分散、難以理解的
17
Yet as the creation and use of digital information accelerate,
responsibility for preservation is diffuse, and the responsible parties …
have been slow to identify and invest in the necessary infrastructure to
ensure that the published scholarly record represented in electronic
formats remains intact over the long-term.
Urgent Action Needed to Preserve Scholarly Electronic Journals ,
Donald J. Waters et al., 2005
2CUL’s Preservation Status Quo
Preservation through LOCKSS & Portico
“Only 13% (or 15%) of Cornell’s and Columbia’s e-
journals are currently being preserved.”
What’s not preserved?
Available through aggregators: 25-30%
Miscellaneous freely accessible: 22-25%
Newsletters: 10%
East Asian: 10%
Participating publishers: 8-9%
Non-participating publishers: 4-5%
Digitized collections with e-journals (commercial): 5%
Digitized collections, library based (e.g. Hathi Trust): 4%
Government, IGO (e.g. OECD): 3-4%
Book series, conference proceedings: 2-3%
Data errors (e.g., ISSN mismatch): 2%
18
全球電子期刊長期保存的趨勢
出版社與文化機構合作提供過刊的Dark Archives
許多國家通過電子出版品(包含電子期刊)法定寄存法律
NIH致力於建立政府補助計畫衍生之出版品的免費取用
典藏庫(當然,出版社抗議)
開放取用(Open Access)運動與長期保存的連結
各國國家圖書館建立或資助電子期刊長期保存計畫與
相關標準
第三方團體與聯盟建立電子期刊長期保存機制
電子期刊長期保存典藏庫認證規範的制定
19
全球電子期刊長期保存計畫
20
Dark
Archive
E-Journal Archiving Metes and Bounds: A Survey of
the Landscape
全球電子期刊長期保存計畫(續)
21政府、聯盟支持佔很大的比例
E-Journal Archiving Metes and Bounds: A Survey of
the Landscape
臺灣電子資源長期保存現況
Elsevier SDOS
數位學位論文聯盟DDC
臺灣學術電子書暨資料庫聯盟
委員意見:Raw Data 的典藏工作非常重要,建議
積極執行
22
大陸電子資源長期保存現況
中國高校人文社會科學文獻中心(CASHL)文科
外文資源的宏觀建設
開展國家的戰略收藏和存檔,以保證現在或者將來
,正常情況或者出現不可預知災難的任何情況下,
都可以擁有文獻,為用戶提供最終的文獻保障服務
23
肖瓏(2014)。面向人文社會科學領域的服務創新探索。2014年數位
化論文典藏聯盟年會【數位科技的多元發展與資訊服務應用】
韓國電子資源長期保存現況
KISTI(Korea Institute of Science and
Technology Information) 主導
KELSI Consortium
2004年7月提出NDA計畫
2006年12月NDA測試系統研製成功
運作現況
有20個出版商已經同意或者已經簽約
已收集至少4900種期刊的690萬篇電子文章
需要 8T 存儲量
24
http://www.slidefinder.net/d/digital_archiving_and/preservatio
n_activities_korea/honanchoi_nda_in_korea/1275469
長期保存技術與途徑
25
長期保存技術
更新(refreshing)
轉置(migration)
模擬(emulation)
標準化(standardization)
封裝(encapsulation)
重製系統(redundancy) – mirror site
技術保存(technology preservation)
26
長期保存系統設計參考模型
OAIS Reference Model
27
長期保存方案成功要素
最低要件 – The archives must
Be willing to negotiate and accept appropriate
deposits from scholar publishers
Have sufficient control of the material to ensure
long-term preservation
Plan for contingencies
Supply libraries with the preserved content under
conditions negotiated with the publishers
Work as part of a network for adequate
redundancy of the material
28
Honey, S. L. (2005). Preservation of Electronic Scholarly
Publishing: An Analysis of Three Approaches. Portal: Library
and the Academy, 5(1), 59-75.
長期保存方案成功要素 (續)
分析長期保存方案的五大因素
Adequate incentives or at least no dis-incentives
for all stakeholders
Equitably shared costs among all stakeholders
Long-term economic sustainability
Provisions for technological integrity of the
scholarly material
Provisions for the intellectual integrity of the
scholarly materials
29
Honey, S. L. (2005). Preservation of Electronic Scholarly
Publishing: An Analysis of Three Approaches. Portal: Library
and the Academy, 5(1), 59-75.
長期保存方案
Dark Archives
Moving Wall Archives
JSTOR
Caching Software
LOCKSS
30
Honey, S. L. (2005). Preservation of Electronic Scholarly
Publishing: An Analysis of Three Approaches. Portal: Library
and the Academy, 5(1), 59-75.
Dark Archives
Dark Archives -- In reference to data storage,
an archive that cannot be accessed by any users.
Access to the data is either limited to a set few
individuals or completely restricted to all. The purpose
of a dark archive is to function as a repository for
information that can be used as a failsafe during
disaster recovery.
Light (lit) Archives -- In reference to data storage,
an archive that can be accessed by
many authorized users. Access to the data is open to
all the members of the "community" that have a need
for the data.
31
LOCKSS
32
結語
恭賀中國知網臺灣知識服務平台鏡像站啟動
思考臺灣電子資源長期保存整體策略愈形重要
33

從鏡射站到長期保存