SlideShare a Scribd company logo
1 of 21
建構整合異質性數位典藏之
開放原始碼資源探索系統
先導研究
政大圖檔所博士生 陳勇汀
(布丁布丁吃布丁)
pudding@nccu.edu.tw
2015年5月7日
大綱
研究動機
從資源聯合目錄查詢系統到資源探索系統
以VuFind整合異質性資料來源之系統架構
系統建置成果展示
未來發展方向
政大數位典藏
http://da.lib.nccu.edu.tw/
學術資料庫入口網站
http://www.adb.ssic.nccu.edu.tw/list.php
政大數位典藏與學術資料庫的目錄
3
陳芳明手稿
(CONTENTdm)
臺灣政治與社會發展
海外史料資料庫
資源聯合目錄
查詢系統
資源聯合目錄查詢系統
4
數位資源與目錄
Broadcast Search
廣 播 式 整 合 檢 索
1
4
2 3
Federated Search System
?
資源探索系統
網路級資源探索系統
5
EBSCO
Discovery
Service
ProQuest
圖書館自動化
系統(ILS)
預先獲取
與索引
學術文獻
資料庫
單位
數位典藏資源
1
2
3
Web-Scale Resource Discovery System
Balnaves的開放原始碼方案
6
圖書館管理系統 資源探索系統 數位圖書館系統
The National Parliament of
Solomon Islands
索羅門群島國會
數位圖書館
Balnaves, E. (2013). From OPAC to Archive: integrated discovery and digital libraries with open source.
開放原始碼資源探索系統VuFind
VuFind係由維拉諾瓦大學法爾維紀念圖書館
為圖書館所發展的圖書館資源入口網站
7
館藏書目記錄
館藏期刊
數位圖書館
數位物件
機構典藏
機構書目
其他圖書館的
館藏與資源
Villanova University's Falvey Memorial Library
VuFind的數位資源整合能力 (1/2)
8
圖書館自動化系統(OPAC)
Search/Retrieval via URL
SRU
OAI-PMH
Search API
(Web service)
innovative
VuFind的數位資源整合能力 (2/2)
9
全文檢索引擎全文分析工具
ODT
Data Import Handler
資料匯入處理器
Koha 3.16
臺灣百年圖書館史
數位圖書館
異質性資料來源整合對象
10
政大機構典藏 孫中山紀念圖書館
先導研究系統架構
11
虛擬機器雲端平臺
VuFind
資源探索系統
Koha
臺灣百年圖書館史
數位圖書館
孫中山紀念圖書館
館藏目錄
政大機構典藏
MySQL ODBC
MySQL
ODBC
OAI-PMH
1. 圖書館自動化系統Koha的整合
12
1. MySQL建立供VuFind
連線的帳號
2. MySQL開放從VuFind
登入的權限
3. 安裝VuFind
4. 設定MySQL的連線主
機、帳號與密碼
MySQL ODBC
2. 典藏系統DSpace的整合
13
1. 確認DSpace的OAI資
訊的來源網址
2. 確認DSpace提供的後
設資料完整性
3. 設定OAI與後設資料對
應檔案
4. 執行獲取與匯入指令
5. 重新啟動VuFind
※4,5必須撰寫為排程檔,定期進行獲取與匯入
OAI-PMH
3. 關聯式資料庫MySQL的整合
14
1. MySQL建立供VuFind
連線的帳號
2. MySQL開放從VuFind
登入的權限
3. 設定Solr所需函式庫
4. Solr核心biblio加入資
料匯入處理器的設定
※6,7必須撰寫為排程檔,定期進行資料匯入
5. 設定資料匯入處理器,
以SQL指令查詢
MySQL資料庫
6. 執行資料匯入處理器
7. 重新啟動VuFind
MySQL ODBC
VuFind常用欄位名稱與說明
欄位名稱 說明 欄位名稱 說明
id 辨識碼 callnumber 索書號
title 標題 description 描述
author 作者 contents 目錄
publishDate 出版日 language 語言
url 網址 format 格式
allfields 後設資料所有欄位 physical 實體描述
fulltext 全文內容 publisher 出版者
instituion 典藏機構 edition 版本
collection 典藏系列 series 系列
building 實體所在位置 topic 主題
dewey-full 杜威十進分類法 genre 類別
lccn 美國國會圖書館分
類法
geographic 地理位置
isbn ISBN號碼 era 時代
issn ISSN號碼 thumbnail 縮圖網址 15
資料獲取方式比較
圖書館自動化
系統
機構典藏&
數位典藏系統
關聯式資料庫
系統 Koha DSpace MySQL
資料交換方式 MySQL ODBC OAI-PMH MySQL ODBC
+ Solr DataImport
提供者伺服器
設定
開放MySQL帳戶
權限
預設公開
不需設定
開放MySQL帳戶
權限
需要批次執行 否,設定之後直
接生效
是 是
備註 各種圖書館自動
化系統的設定方
法不盡相同,有
些是採用批次設
定
要注意提供者的
OAI欄位設定是否
完整
非VuFind原始功能,
而是Apache Solr
功能
16
系統建置成果展示
17
相關性排序
層面分析
書目清單收藏夾
18
相似資料
來源網址
系統實機展示
19
本研究先導系統
 http://pc-pudding.dlll.nccu.edu.tw:11180/vufind/
VuFind Live Demo
 http://vufind.org/demo/
未來發展方向
與更多異質性資料來源進行整合
 實現圖書館館藏目錄、電子期刊、數位典
藏、機構典藏的一站式查詢入口。
利用VuFind開放原始碼特性,發展加值應用。
 綜合跨資料庫的數位資源,建構數位人文
分析功能,呈現異質性資源的多重脈絡。
 結合即時性的網路計量新指標Altmetircs,
呈現文件層級計量的影響力。
從內容、檢索、需求符合程度進行整體的評估
研究
20
Thank You
For Your Listening
BLOG: 布丁布丁吃什麼?
http://pulipuli.blogspot.tw/
21
VuFind2虛擬應用範本下載網址
https://github.com/pulipulichen/vufind/

More Related Content

Similar to 20150504 建構整合異質性數位典藏之開放原始碼資源探索系統先導研究

2016台灣資料科學年會開場投影片
2016台灣資料科學年會開場投影片2016台灣資料科學年會開場投影片
2016台灣資料科學年會開場投影片台灣資料科學年會
 
香港六合彩 » SlideShare
香港六合彩 » SlideShare香港六合彩 » SlideShare
香港六合彩 » SlideSharelajxhfum
 
香港六合彩 » SlideShare
香港六合彩 » SlideShare香港六合彩 » SlideShare
香港六合彩 » SlideShareurehfdcf
 
香港六合彩|六合彩
香港六合彩|六合彩香港六合彩|六合彩
香港六合彩|六合彩lnmbixr
 
香港六合彩
香港六合彩香港六合彩
香港六合彩fawymar
 
中文公版著作數位資料庫之建置
中文公版著作數位資料庫之建置中文公版著作數位資料庫之建置
中文公版著作數位資料庫之建置maolins
 
溯古追今看未來 – 台灣圖書館資訊系統與數位化
溯古追今看未來 – 台灣圖書館資訊系統與數位化溯古追今看未來 – 台灣圖書館資訊系統與數位化
溯古追今看未來 – 台灣圖書館資訊系統與數位化皓仁 柯
 
Scholarly communication
Scholarly communicationScholarly communication
Scholarly communicationJian Qin
 
圖資趨勢.計畫書撰寫綜觀(柯皓仁教授)
圖資趨勢.計畫書撰寫綜觀(柯皓仁教授)圖資趨勢.計畫書撰寫綜觀(柯皓仁教授)
圖資趨勢.計畫書撰寫綜觀(柯皓仁教授)皓仁 柯
 
10 dii德温特专利数据的检索
10 dii德温特专利数据的检索10 dii德温特专利数据的检索
10 dii德温特专利数据的检索cueb
 
新浪微博数据挖掘方案
新浪微博数据挖掘方案新浪微博数据挖掘方案
新浪微博数据挖掘方案venciallee
 
5 bib excel对cssci的转换和分析
5 bib excel对cssci的转换和分析5 bib excel对cssci的转换和分析
5 bib excel对cssci的转换和分析cueb
 
香港六合彩
香港六合彩香港六合彩
香港六合彩suoyi
 

Similar to 20150504 建構整合異質性數位典藏之開放原始碼資源探索系統先導研究 (20)

2016台灣資料科學年會開場投影片
2016台灣資料科學年會開場投影片2016台灣資料科學年會開場投影片
2016台灣資料科學年會開場投影片
 
Dltrendsatzjpolytech
DltrendsatzjpolytechDltrendsatzjpolytech
Dltrendsatzjpolytech
 
1
11
1
 
IR
IRIR
IR
 
香港六合彩 » SlideShare
香港六合彩 » SlideShare香港六合彩 » SlideShare
香港六合彩 » SlideShare
 
香港六合彩 » SlideShare
香港六合彩 » SlideShare香港六合彩 » SlideShare
香港六合彩 » SlideShare
 
香港六合彩|六合彩
香港六合彩|六合彩香港六合彩|六合彩
香港六合彩|六合彩
 
香港六合彩
香港六合彩香港六合彩
香港六合彩
 
基教信息化新发展(祝智庭)2011 0530
基教信息化新发展(祝智庭)2011 0530基教信息化新发展(祝智庭)2011 0530
基教信息化新发展(祝智庭)2011 0530
 
中文公版著作數位資料庫之建置
中文公版著作數位資料庫之建置中文公版著作數位資料庫之建置
中文公版著作數位資料庫之建置
 
溯古追今看未來 – 台灣圖書館資訊系統與數位化
溯古追今看未來 – 台灣圖書館資訊系統與數位化溯古追今看未來 – 台灣圖書館資訊系統與數位化
溯古追今看未來 – 台灣圖書館資訊系統與數位化
 
Scholarly communication
Scholarly communicationScholarly communication
Scholarly communication
 
圖資趨勢.計畫書撰寫綜觀(柯皓仁教授)
圖資趨勢.計畫書撰寫綜觀(柯皓仁教授)圖資趨勢.計畫書撰寫綜觀(柯皓仁教授)
圖資趨勢.計畫書撰寫綜觀(柯皓仁教授)
 
信息时代的学与教 华中师2011.4.2
信息时代的学与教  华中师2011.4.2信息时代的学与教  华中师2011.4.2
信息时代的学与教 华中师2011.4.2
 
Ir作業991015
Ir作業991015Ir作業991015
Ir作業991015
 
Ir作業991015
Ir作業991015Ir作業991015
Ir作業991015
 
10 dii德温特专利数据的检索
10 dii德温特专利数据的检索10 dii德温特专利数据的检索
10 dii德温特专利数据的检索
 
新浪微博数据挖掘方案
新浪微博数据挖掘方案新浪微博数据挖掘方案
新浪微博数据挖掘方案
 
5 bib excel对cssci的转换和分析
5 bib excel对cssci的转换和分析5 bib excel对cssci的转换和分析
5 bib excel对cssci的转换和分析
 
香港六合彩
香港六合彩香港六合彩
香港六合彩
 

More from Yung-Ting Chen

讓AI繪圖成為你的教學利器 Stable Diffusion 工作坊 - 2024 - blog
讓AI繪圖成為你的教學利器 Stable Diffusion 工作坊 - 2024 - blog讓AI繪圖成為你的教學利器 Stable Diffusion 工作坊 - 2024 - blog
讓AI繪圖成為你的教學利器 Stable Diffusion 工作坊 - 2024 - blogYung-Ting Chen
 
文本探勘實作 - 2020 - blog.pptx
文本探勘實作 - 2020 - blog.pptx文本探勘實作 - 2020 - blog.pptx
文本探勘實作 - 2020 - blog.pptxYung-Ting Chen
 
大數據時代下的文本分析 - 2020 - blog.pptx
大數據時代下的文本分析 - 2020 - blog.pptx大數據時代下的文本分析 - 2020 - blog.pptx
大數據時代下的文本分析 - 2020 - blog.pptxYung-Ting Chen
 
比較性分析:關聯規則 - 2020 - blog.pptx
比較性分析:關聯規則 - 2020 - blog.pptx比較性分析:關聯規則 - 2020 - blog.pptx
比較性分析:關聯規則 - 2020 - blog.pptxYung-Ting Chen
 
預測性分析:分類 - 2020 - blog.pptx
預測性分析:分類 - 2020 - blog.pptx預測性分析:分類 - 2020 - blog.pptx
預測性分析:分類 - 2020 - blog.pptxYung-Ting Chen
 
探索性分析:分群與異常偵測 - 2020 - blog.pptx
探索性分析:分群與異常偵測 - 2020 - blog.pptx探索性分析:分群與異常偵測 - 2020 - blog.pptx
探索性分析:分群與異常偵測 - 2020 - blog.pptxYung-Ting Chen
 
3. 洞悉未來:時間序列預測 - 2021.pptx
3. 洞悉未來:時間序列預測 - 2021.pptx3. 洞悉未來:時間序列預測 - 2021.pptx
3. 洞悉未來:時間序列預測 - 2021.pptxYung-Ting Chen
 
2. 看穿因果:熱點分析 - 2021.pptx
2. 看穿因果:熱點分析 - 2021.pptx2. 看穿因果:熱點分析 - 2021.pptx
2. 看穿因果:熱點分析 - 2021.pptxYung-Ting Chen
 
1. 神鳥領航:初識Weka - 2021.pptx
1. 神鳥領航:初識Weka - 2021.pptx1. 神鳥領航:初識Weka - 2021.pptx
1. 神鳥領航:初識Weka - 2021.pptxYung-Ting Chen
 
論文神器+ChatGPT - blog - 2023.pptx
論文神器+ChatGPT - blog - 2023.pptx論文神器+ChatGPT - blog - 2023.pptx
論文神器+ChatGPT - blog - 2023.pptxYung-Ting Chen
 
大數據時代下的文本分析 - 22 dils text.pptx
大數據時代下的文本分析 - 22 dils text.pptx大數據時代下的文本分析 - 22 dils text.pptx
大數據時代下的文本分析 - 22 dils text.pptxYung-Ting Chen
 
人工智慧的可解釋性 - blog - 2023.pptx
人工智慧的可解釋性 - blog - 2023.pptx人工智慧的可解釋性 - blog - 2023.pptx
人工智慧的可解釋性 - blog - 2023.pptxYung-Ting Chen
 
Introduction to TextRank - 22.pptx
Introduction to TextRank - 22.pptxIntroduction to TextRank - 22.pptx
Introduction to TextRank - 22.pptxYung-Ting Chen
 
Subgroup-Discovery-2021.pptx
Subgroup-Discovery-2021.pptxSubgroup-Discovery-2021.pptx
Subgroup-Discovery-2021.pptxYung-Ting Chen
 
1. introduction of weka
1. introduction of weka1. introduction of weka
1. introduction of wekaYung-Ting Chen
 
3. classification and regression
3. classification and regression3. classification and regression
3. classification and regressionYung-Ting Chen
 
2. clustering and association rule mining
2. clustering and association rule mining2. clustering and association rule mining
2. clustering and association rule miningYung-Ting Chen
 

More from Yung-Ting Chen (20)

讓AI繪圖成為你的教學利器 Stable Diffusion 工作坊 - 2024 - blog
讓AI繪圖成為你的教學利器 Stable Diffusion 工作坊 - 2024 - blog讓AI繪圖成為你的教學利器 Stable Diffusion 工作坊 - 2024 - blog
讓AI繪圖成為你的教學利器 Stable Diffusion 工作坊 - 2024 - blog
 
文本探勘實作 - 2020 - blog.pptx
文本探勘實作 - 2020 - blog.pptx文本探勘實作 - 2020 - blog.pptx
文本探勘實作 - 2020 - blog.pptx
 
大數據時代下的文本分析 - 2020 - blog.pptx
大數據時代下的文本分析 - 2020 - blog.pptx大數據時代下的文本分析 - 2020 - blog.pptx
大數據時代下的文本分析 - 2020 - blog.pptx
 
比較性分析:關聯規則 - 2020 - blog.pptx
比較性分析:關聯規則 - 2020 - blog.pptx比較性分析:關聯規則 - 2020 - blog.pptx
比較性分析:關聯規則 - 2020 - blog.pptx
 
預測性分析:分類 - 2020 - blog.pptx
預測性分析:分類 - 2020 - blog.pptx預測性分析:分類 - 2020 - blog.pptx
預測性分析:分類 - 2020 - blog.pptx
 
探索性分析:分群與異常偵測 - 2020 - blog.pptx
探索性分析:分群與異常偵測 - 2020 - blog.pptx探索性分析:分群與異常偵測 - 2020 - blog.pptx
探索性分析:分群與異常偵測 - 2020 - blog.pptx
 
3. 洞悉未來:時間序列預測 - 2021.pptx
3. 洞悉未來:時間序列預測 - 2021.pptx3. 洞悉未來:時間序列預測 - 2021.pptx
3. 洞悉未來:時間序列預測 - 2021.pptx
 
2. 看穿因果:熱點分析 - 2021.pptx
2. 看穿因果:熱點分析 - 2021.pptx2. 看穿因果:熱點分析 - 2021.pptx
2. 看穿因果:熱點分析 - 2021.pptx
 
1. 神鳥領航:初識Weka - 2021.pptx
1. 神鳥領航:初識Weka - 2021.pptx1. 神鳥領航:初識Weka - 2021.pptx
1. 神鳥領航:初識Weka - 2021.pptx
 
論文神器+ChatGPT - blog - 2023.pptx
論文神器+ChatGPT - blog - 2023.pptx論文神器+ChatGPT - blog - 2023.pptx
論文神器+ChatGPT - blog - 2023.pptx
 
大數據時代下的文本分析 - 22 dils text.pptx
大數據時代下的文本分析 - 22 dils text.pptx大數據時代下的文本分析 - 22 dils text.pptx
大數據時代下的文本分析 - 22 dils text.pptx
 
人工智慧的可解釋性 - blog - 2023.pptx
人工智慧的可解釋性 - blog - 2023.pptx人工智慧的可解釋性 - blog - 2023.pptx
人工智慧的可解釋性 - blog - 2023.pptx
 
Introduction to TextRank - 22.pptx
Introduction to TextRank - 22.pptxIntroduction to TextRank - 22.pptx
Introduction to TextRank - 22.pptx
 
Subgroup-Discovery-2021.pptx
Subgroup-Discovery-2021.pptxSubgroup-Discovery-2021.pptx
Subgroup-Discovery-2021.pptx
 
1. introduction of weka
1. introduction of weka1. introduction of weka
1. introduction of weka
 
4. applications
4. applications4. applications
4. applications
 
3. classification and regression
3. classification and regression3. classification and regression
3. classification and regression
 
2. clustering and association rule mining
2. clustering and association rule mining2. clustering and association rule mining
2. clustering and association rule mining
 
20180518 pbl
20180518 pbl20180518 pbl
20180518 pbl
 
20180518 kals
20180518 kals20180518 kals
20180518 kals
 

20150504 建構整合異質性數位典藏之開放原始碼資源探索系統先導研究

Editor's Notes

  1. 研究動機 從資源聯合目錄查詢系統到資源探索系統 以VuFind整合異質性資料來源之系統架構 系統建置成果 未來發展方向
  2. http://www.blogmarketingacademy.com/crossroads-internet-marketing/
  3. 複雜的介面 究竟哪些電子資源是可以被整合查詢的? 可同時查找的最多電子資源數量 系統回憶時間慢 (甚至 connection timeout) – 即時分散式檢索 相關排序機制不佳 去除重複機制不佳
  4. 國內主要的資源探索系統有四種產品,Ex Libris公司推出的Primo是最早整合圖書館自動化系統館藏資料與電子資料庫產品;而資料庫廠商也有各自的資源探索系統,如ProQuest公司的Summon與EBSCO公司的Discovery Service;圖書館自動化廠商也不落人後,擁有臺灣許多圖書館採用的圖書館自動化系統Millennium的Innovative Interfaces公司,也推出了資源探索系統產品Encore。
  5. 在圖書館自動化系統的整合上,VuFind支援來自ExLibris公司的Voyager與Aleph、Innovative 公司的Millennium、NewGenLib、SirsiDynix公司的Horizon、Sysmphony以及Koha的MARC資料匯入與整合, 也可以透過SRU資料交換協定整合OCLC公司所建置的WorldCat中的書目資料。 而數位典藏與機構典藏的後設資料彙整主要則是使用OAI-PMH資料交換協定,能夠相容於OCLC的ContentDM與MIT的DSpace等數位典藏與機構典藏系統。 然而VuFind不僅支援圖書館標準的資料交換協定,VuFind使用的全文檢索引擎Solr更能夠整合各種關聯式資料庫的資料內容,即使是未能提供資料交換標準的自行建置之數位典藏系統,也能夠在VuFind中進行整合索引。
  6. Apache Tika http://baike.baidu.com/link?url=R45MFD39HcR69UNjAsTcyMn8PY9hJ6uRlCOajiBwpMXO1_PxtKkryrzZWgoLZ4XU-uzwRVEDGsbZW8bNsPbOrK PDF Word PowerPoint HTML OpenDocument RMDB - Oracle - MySQL MSSQL PostgreSQL SQLite NoSQL
  7. http://pc-pudding.dlll.nccu.edu.tw:11180/vufind/
  8. VuFind Live Demo http://vufind.org/demo/