More Related Content
Similar to CiNiiのメタデータ・デザイン@LinkedData勉強会(2012.01.18)
Similar to CiNiiのメタデータ・デザイン@LinkedData勉強会(2012.01.18)(20)
More from Ikki Ohmukai(16)
CiNiiのメタデータ・デザイン@LinkedData勉強会(2012.01.18)
- 2. 自己紹介
国立情報学研究所
コンテンツ科学研究系(教員)
セマンティックウェブ・ソーシャルメディア
Linked Open Data・LODACプロジェクト
学術コンテンツサービス研究開発センター
学術基盤推進部学術コンテンツ課システム室長
CiNii(論文)・NACSIS-CAT(大学図書館)
株式会社グルコース
日本最古?のRSSリーダー(2002〜)
- 3. CiNiiとは
国内最大規模の学術情報サービス
論文(CiNii Articles)
国内学会誌・紀要のデジタル化
本文400万件
書誌1500万件
書籍・雑誌(CiNii Books)[New!]
大学図書館の蔵書データベース
書誌1100万件
所蔵1億1000万件
著者名典拠150万件
書誌データをRDFで提供
- 4. 学術情報とメタデータ
学術情報分野の特徴
情報の構造化を生業とする職業集団・組織がある
研究者(大学・研究機関)・学会・図書館…
情報の構造化フォーマットが共有されている
タイトル・著者名・抄録・本文・参考文献…
フォーマットを変換するだけでメタデータが出せる
- 5. CiNii Articlesのメタデータ
検索:OpenSearch
RSS 1.0(=RDF)とAtom 1.0
RSS/Atom基本語彙+Dublin Core(Simple)
一般のブラウザ・フィードリーダーで扱えるように
Prism Standard
書誌情報は国際標準に準拠(Natureなど)
書誌:RDF
Dublin Core+Prism Standard(書誌情報)※日・英
FOAF(著者情報)
独自語彙は極力使用しない
はじめての試みだったため
その後…
- 7. CiNii著者検索
NII著者ID (NRID) の導入
科研費番号+機械処理による著者へのID付与
著者ごとにURIを発行(著者パーマリンク)
NRIDベースの論文検索機能
著者名→IDリスト→論文リスト
APIの提供
新たなデータ生成・管理モデル 組織
研究成果の活用
ユーザーフィードバック 機械 ユーザ
- 9. CiNii Booksのメタデータ
検索:OpenSearch
RSS/Atom基本語彙+Dublin Core(Simple)+Prism Standard
CiNii Articlesと同じ
書誌:RDF
Dublin Core+Prism Standard(書誌情報)
FOAF(著者名典拠)
Bibliographic Ontology(所蔵情報)
CiNii独自語彙
- 10. CiNiiのメタデータ設計
設計方針をどうするか?
データ構造・語彙…
厳密性と利便性のトレードオフ
日本語読み問題
書誌の階層問題
ウェブAPIとして考える
できるだけ開発者が使いやすいように
シンプルなデータ構造
ライブラリの普及状況を念頭に
世界標準(Dublin Core・FOAFなど)
- 14. まとめ
Library Linked Data(LLD)の潮流
各国の国立図書館典拠データの公開
アメリカ・イギリス・フランス・ドイツ…
国立国会図書館
何のためのLinked Open Data?
公開すること自体の重要性・ドメイン内の相互利用
ドメインを超えた相互利用
自身が持つデータの新たな価値を知る
- 15. 困っていること
Linked Open Dataの要件は厳しい
Cool URI・コンテントネゴシエーション
ライセンス(CC0?)
SPARQL
そもそもリンクするのが難しい
100万アクセス/日
オンデマンドのリンクは実質不可能(爆撃)
名寄せ
IDのURIをどうするか(ISBN・ISSN)
プロパティ?HTTP URI?URN?rdf:datatype?
IR/NIR問題
作り直したい症候群