CiNiiのメタデータ・デザイン    国立情報学研究所      大向 一輝     Twitter: @i2k
自己紹介 国立情報学研究所  コンテンツ科学研究系(教員)   セマンティックウェブ・ソーシャルメディア   Linked Open Data・LODACプロジェクト  学術コンテンツサービス研究開発センター  学術基盤推進部学術コンテンツ課シ...
CiNiiとは 国内最大規模の学術情報サービス   論文(CiNii Articles)     国内学会誌・紀要のデジタル化     本文400万件     書誌1500万件   書籍・雑誌(CiNii Books)[New!]     大学...
学術情報とメタデータ 学術情報分野の特徴  情報の構造化を生業とする職業集団・組織がある   研究者(大学・研究機関)・学会・図書館…  情報の構造化フォーマットが共有されている   タイトル・著者名・抄録・本文・参考文献…  フォーマットを変...
CiNii Articlesのメタデータ 検索:OpenSearch   RSS 1.0(=RDF)とAtom 1.0     RSS/Atom基本語彙+Dublin Core(Simple)        一般のブラウザ・フィードリーダーで扱...
CiNii Articlesのメタデータ 検索RSSと書誌RDFをつなぐ 課題・問題点   RDFとHTMLと実体をどうつなぐか?   著者が空白ノード(URIなし)
CiNii著者検索 NII著者ID (NRID) の導入   科研費番号+機械処理による著者へのID付与   著者ごとにURIを発行(著者パーマリンク) NRIDベースの論文検索機能   著者名→IDリスト→論文リスト   APIの提供 新たな...
CiNii Booksのメタデータ 検索:OpenSearch   RSS/Atom基本語彙+Dublin Core(Simple)+Prism Standard   CiNii Articlesと同じ 書誌:RDF   Dublin Core...
CiNiiのメタデータ設計 設計方針をどうするか?  データ構造・語彙…  厳密性と利便性のトレードオフ   日本語読み問題   書誌の階層問題 ウェブAPIとして考える  できるだけ開発者が使いやすいように   シンプルなデータ構造   ライ...
CiNiiメタデータへのアクセス アプリケーションID(appid)の取得 OpenSearch   REST       appid必須 RDF   URI+.rdf       appid推奨       コンテントネゴシエーション実装予定...
CiNiiウェブAPIコンテスト 2回開催(2009・2010)  第1回:24件  第2回:33件 Mashup awardへの参加 LODチャレンジへの協力
論文ったー
まとめ Library Linked Data(LLD)の潮流   各国の国立図書館典拠データの公開   アメリカ・イギリス・フランス・ドイツ…   国立国会図書館 何のためのLinked Open Data?   公開すること自体の重要性・ド...
困っていること Linked Open Dataの要件は厳しい   Cool URI・コンテントネゴシエーション   ライセンス(CC0?)   SPARQL そもそもリンクするのが難しい   100万アクセス/日   オンデマンドのリンクは実...
CiNiiのメタデータ・デザイン@LinkedData勉強会(2012.01.18)
Upcoming SlideShare
Loading in …5
×

CiNiiのメタデータ・デザイン@LinkedData勉強会(2012.01.18)

3,937 views

Published on

Published in: Technology
0 Comments
4 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
3,937
On SlideShare
0
From Embeds
0
Number of Embeds
2,169
Actions
Shares
0
Downloads
9
Comments
0
Likes
4
Embeds 0
No embeds

No notes for slide

CiNiiのメタデータ・デザイン@LinkedData勉強会(2012.01.18)

  1. 1. CiNiiのメタデータ・デザイン 国立情報学研究所 大向 一輝 Twitter: @i2k
  2. 2. 自己紹介 国立情報学研究所 コンテンツ科学研究系(教員) セマンティックウェブ・ソーシャルメディア Linked Open Data・LODACプロジェクト 学術コンテンツサービス研究開発センター 学術基盤推進部学術コンテンツ課システム室長 CiNii(論文)・NACSIS-CAT(大学図書館) 株式会社グルコース 日本最古?のRSSリーダー(2002〜)
  3. 3. CiNiiとは 国内最大規模の学術情報サービス 論文(CiNii Articles) 国内学会誌・紀要のデジタル化 本文400万件 書誌1500万件 書籍・雑誌(CiNii Books)[New!] 大学図書館の蔵書データベース 書誌1100万件 所蔵1億1000万件 著者名典拠150万件 書誌データをRDFで提供
  4. 4. 学術情報とメタデータ 学術情報分野の特徴 情報の構造化を生業とする職業集団・組織がある 研究者(大学・研究機関)・学会・図書館… 情報の構造化フォーマットが共有されている タイトル・著者名・抄録・本文・参考文献… フォーマットを変換するだけでメタデータが出せる
  5. 5. CiNii Articlesのメタデータ 検索:OpenSearch RSS 1.0(=RDF)とAtom 1.0 RSS/Atom基本語彙+Dublin Core(Simple) 一般のブラウザ・フィードリーダーで扱えるように Prism Standard 書誌情報は国際標準に準拠(Natureなど) 書誌:RDF Dublin Core+Prism Standard(書誌情報)※日・英 FOAF(著者情報) 独自語彙は極力使用しない はじめての試みだったため その後…
  6. 6. CiNii Articlesのメタデータ 検索RSSと書誌RDFをつなぐ 課題・問題点 RDFとHTMLと実体をどうつなぐか? 著者が空白ノード(URIなし)
  7. 7. CiNii著者検索 NII著者ID (NRID) の導入 科研費番号+機械処理による著者へのID付与 著者ごとにURIを発行(著者パーマリンク) NRIDベースの論文検索機能 著者名→IDリスト→論文リスト APIの提供 新たなデータ生成・管理モデル 組織 研究成果の活用 ユーザーフィードバック 機械 ユーザ
  8. 8. CiNii Booksのメタデータ 検索:OpenSearch RSS/Atom基本語彙+Dublin Core(Simple)+Prism Standard CiNii Articlesと同じ 書誌:RDF Dublin Core+Prism Standard(書誌情報) FOAF(著者名典拠) Bibliographic Ontology(所蔵情報) CiNii独自語彙
  9. 9. CiNiiのメタデータ設計 設計方針をどうするか? データ構造・語彙… 厳密性と利便性のトレードオフ 日本語読み問題 書誌の階層問題 ウェブAPIとして考える できるだけ開発者が使いやすいように シンプルなデータ構造 ライブラリの普及状況を念頭に 世界標準(Dublin Core・FOAFなど)
  10. 10. CiNiiメタデータへのアクセス アプリケーションID(appid)の取得 OpenSearch REST appid必須 RDF URI+.rdf appid推奨 コンテントネゴシエーション実装予定 アクセス状況 月間1000万〜2000万アクセス
  11. 11. CiNiiウェブAPIコンテスト 2回開催(2009・2010) 第1回:24件 第2回:33件 Mashup awardへの参加 LODチャレンジへの協力
  12. 12. 論文ったー
  13. 13. まとめ Library Linked Data(LLD)の潮流 各国の国立図書館典拠データの公開 アメリカ・イギリス・フランス・ドイツ… 国立国会図書館 何のためのLinked Open Data? 公開すること自体の重要性・ドメイン内の相互利用 ドメインを超えた相互利用 自身が持つデータの新たな価値を知る
  14. 14. 困っていること Linked Open Dataの要件は厳しい Cool URI・コンテントネゴシエーション ライセンス(CC0?) SPARQL そもそもリンクするのが難しい 100万アクセス/日 オンデマンドのリンクは実質不可能(爆撃) 名寄せ IDのURIをどうするか(ISBN・ISSN) プロパティ?HTTP URI?URN?rdf:datatype? IR/NIR問題 作り直したい症候群

×