あのデータベースは今
データを救うオープンサイエンスの
あり方を検討する
京都大学学術研究支援室
天野絵里子
Special thanks to 極地研の南山さん
Code4Lib JAPAN カンファレンス 2015
ライトニングトーク
2015年9月6日 東京
公的
研究
助成
論文
データ
新たな
知の創出
オープンアクセス
オープンデータ
オープンサイエンス政策
企業
一般市民
過去の研究成果データはどうなった?
人文系のデータはどうする?
国立国会図書館
Dnavi
DNaviとは?
• 国会図書館データベース・ナビゲーション・サービス
• 2002年データ収集開始
• 「検索サイトからは見つけにくいウェブ上の各種データベース等の
情報資源が有効に活用されるよう、書誌情報(メタデータ)を用いて、
これら情報資源の入り口まで案内(ナビゲーション)」
• 22,196 件(公開 17,470 件/公開停止 4,726 件)
• 2014年3月でサービス終了 → デジコレに1データセットとして収録
国立国会図書館
Dnavi
データベース
科研の成果物
データベース科研とは?
• 科研費・研究成果公開促進費
• 「研究成果の公開発表、重要な学術研究の成果の発信及び、データベースの
作成・公開について助成することによって、我が国の学術の振興と普及に資
するとともに、学術の国際交流に寄与することを目的とするものであり、優
れた研究成果の公的流通の促進を図るものです。」
• データベースのデータを助成
• 平成18年~ 公開されたデータベースの一覧あり
http://www.jsps.go.jp/j-
grantsinaid/13_seika/#data
あのデータベースは今
国立国会図書館
Dnavi
データベース
科研の成果物
データベース名 クリック後 現状
A技術データベース サイトを
表示
DBは行方不明
B生物データベース DBを表示 2005年が最新
C文献情報データベ
ース
Not found 別のURLで
生存
あのデータベースは今
これはやばい
なくなるまえに・・・
機関リポジトリにアーカイブしよう
IRDBのコンテンツ種別の統計
2015.1
ターゲット
• 提供主体が大学/研究機関
(機関リポジトリ推進委員会 協力員の所属機関)
• 特殊なアプリケーションが不要
• なんかいまにも消えそう
優先順位 低
• “ 理系 ”
• 運営組織が現在もしっかりしている
• 更新日が最近(例:2013年以降)
• 動画、画像(方法は要検討)
• ライセンス処理でもめそうなもの
データをどう移行する?
1.データ一つずつにメタデータを振って登録
労力の問題。。。
2.データ全体をCSV・MDB形式で登録
テキストデータ限定?
3.移行プログラムの開発
DBのメタデータスキーマは(恐らく)バラバラ
API公開などの状況はまず望めない
なんだそれだけ!?
公的
研究
助成
論文
データ
新たな
知の創出
オープンアクセス
オープンデータ
企業
一般市民
ToDo
• Dnaviのレコードから対象をフィルタリング
• 協力してくれる機関リポジトリをさがす
• ライセンス処理の検討
機関リポジトリ推進委員会
オープンサイエンス班 にご意見を!

あのデータベースは今 : データを救うオープンサイエンス

Editor's Notes

  • #13 日本の機関リポジトリのコンテンツを分析するシステム、IRDB。 紀要論文が約半分であり、データ・データセットは4%程度。しかもほとんどがCSIプロジェクト時の千葉大学のもの。