CiNiiのメタデータ・デザイン@LinkedData勉強会(2012.01.18)

Ikki Ohmukai
Ikki OhmukaiAssociate Professor at National Institute of Informatics
CiNiiのメタデータ・デザイン

    国立情報学研究所
      大向 一輝
     Twitter: @i2k
自己紹介

 国立情報学研究所
  コンテンツ科学研究系(教員)
   セマンティックウェブ・ソーシャルメディア
   Linked Open Data・LODACプロジェクト
  学術コンテンツサービス研究開発センター
  学術基盤推進部学術コンテンツ課システム室長
   CiNii(論文)・NACSIS-CAT(大学図書館)
 株式会社グルコース
  日本最古?のRSSリーダー(2002〜)
CiNiiとは

 国内最大規模の学術情報サービス
   論文(CiNii Articles)
     国内学会誌・紀要のデジタル化
     本文400万件
     書誌1500万件
   書籍・雑誌(CiNii Books)[New!]
     大学図書館の蔵書データベース
     書誌1100万件
     所蔵1億1000万件
     著者名典拠150万件
   書誌データをRDFで提供
学術情報とメタデータ

 学術情報分野の特徴
  情報の構造化を生業とする職業集団・組織がある
   研究者(大学・研究機関)・学会・図書館…
  情報の構造化フォーマットが共有されている
   タイトル・著者名・抄録・本文・参考文献…
  フォーマットを変換するだけでメタデータが出せる
CiNii Articlesのメタデータ
 検索:OpenSearch
   RSS 1.0(=RDF)とAtom 1.0
     RSS/Atom基本語彙+Dublin Core(Simple)
        一般のブラウザ・フィードリーダーで扱えるように
     Prism Standard
        書誌情報は国際標準に準拠(Natureなど)
 書誌:RDF
   Dublin Core+Prism Standard(書誌情報)※日・英
   FOAF(著者情報)
 独自語彙は極力使用しない
   はじめての試みだったため
   その後…
CiNii Articlesのメタデータ

 検索RSSと書誌RDFをつなぐ
 課題・問題点
   RDFとHTMLと実体をどうつなぐか?
   著者が空白ノード(URIなし)
CiNii著者検索

 NII著者ID (NRID) の導入
   科研費番号+機械処理による著者へのID付与
   著者ごとにURIを発行(著者パーマリンク)
 NRIDベースの論文検索機能
   著者名→IDリスト→論文リスト
   APIの提供
 新たなデータ生成・管理モデル            組織
   研究成果の活用
   ユーザーフィードバック        機械        ユーザ
CiNiiのメタデータ・デザイン@LinkedData勉強会(2012.01.18)
CiNii Booksのメタデータ
 検索:OpenSearch
   RSS/Atom基本語彙+Dublin Core(Simple)+Prism Standard
   CiNii Articlesと同じ
 書誌:RDF
   Dublin Core+Prism Standard(書誌情報)
   FOAF(著者名典拠)
   Bibliographic Ontology(所蔵情報)
   CiNii独自語彙
CiNiiのメタデータ設計

 設計方針をどうするか?
  データ構造・語彙…
  厳密性と利便性のトレードオフ
   日本語読み問題
   書誌の階層問題
 ウェブAPIとして考える
  できるだけ開発者が使いやすいように
   シンプルなデータ構造
   ライブラリの普及状況を念頭に
   世界標準(Dublin Core・FOAFなど)
CiNiiメタデータへのアクセス

 アプリケーションID(appid)の取得
 OpenSearch
   REST
       appid必須
 RDF
   URI+.rdf
       appid推奨
       コンテントネゴシエーション実装予定
 アクセス状況
   月間1000万〜2000万アクセス
CiNiiウェブAPIコンテスト

 2回開催(2009・2010)
  第1回:24件
  第2回:33件
 Mashup awardへの参加
 LODチャレンジへの協力
論文ったー
まとめ

 Library Linked Data(LLD)の潮流
   各国の国立図書館典拠データの公開
   アメリカ・イギリス・フランス・ドイツ…
   国立国会図書館
 何のためのLinked Open Data?
   公開すること自体の重要性・ドメイン内の相互利用
   ドメインを超えた相互利用
     自身が持つデータの新たな価値を知る
困っていること
 Linked Open Dataの要件は厳しい
   Cool URI・コンテントネゴシエーション
   ライセンス(CC0?)
   SPARQL
 そもそもリンクするのが難しい
   100万アクセス/日
   オンデマンドのリンクは実質不可能(爆撃)
   名寄せ
 IDのURIをどうするか(ISBN・ISSN)
   プロパティ?HTTP URI?URN?rdf:datatype?
 IR/NIR問題
 作り直したい症候群
1 of 15

Recommended

オープンデータ 〜日本版データリポジトリの可能性〜 by
オープンデータ〜日本版データリポジトリの可能性〜オープンデータ〜日本版データリポジトリの可能性〜
オープンデータ 〜日本版データリポジトリの可能性〜National Institute of Informatics (NII)
3.5K views32 slides
CiNii Booksに見る学術情報サービスの理想と現実@ku-librarians勉強会(2012.07.13) by
CiNii Booksに見る学術情報サービスの理想と現実@ku-librarians勉強会(2012.07.13) CiNii Booksに見る学術情報サービスの理想と現実@ku-librarians勉強会(2012.07.13)
CiNii Booksに見る学術情報サービスの理想と現実@ku-librarians勉強会(2012.07.13) Ikki Ohmukai
1.3K views26 slides
学術情報流通のための識別子とメタデータDBを対象とした融合研究シーズ探索 - 超高層物理学分野における観測データを例として - by
学術情報流通のための識別子とメタデータDBを対象とした融合研究シーズ探索 - 超高層物理学分野における観測データを例として -学術情報流通のための識別子とメタデータDBを対象とした融合研究シーズ探索 - 超高層物理学分野における観測データを例として -
学術情報流通のための識別子とメタデータDBを対象とした融合研究シーズ探索 - 超高層物理学分野における観測データを例として -National Institute of Informatics
791 views20 slides
D2RQ Mapper by
D2RQ MapperD2RQ Mapper
D2RQ Mapperyayamamo @ DBCLS Kashiwanoha
1.7K views1 slide
セマンティック・ウェブと学術情報サービス@国立国会図書館講演会(2010.07.27) by
セマンティック・ウェブと学術情報サービス@国立国会図書館講演会(2010.07.27)セマンティック・ウェブと学術情報サービス@国立国会図書館講演会(2010.07.27)
セマンティック・ウェブと学術情報サービス@国立国会図書館講演会(2010.07.27)Ikki Ohmukai
1.2K views19 slides
RDFによるデータ統合と相互運用性のための技術開発 by
RDFによるデータ統合と相互運用性のための技術開発RDFによるデータ統合と相互運用性のための技術開発
RDFによるデータ統合と相互運用性のための技術開発Toshiaki Katayama
393 views1 slide

More Related Content

Similar to CiNiiのメタデータ・デザイン@LinkedData勉強会(2012.01.18)

研究データ流通を支える情報基盤とは by
研究データ流通を支える情報基盤とは研究データ流通を支える情報基盤とは
研究データ流通を支える情報基盤とはNational Institute of Informatics (NII)
2.6K views44 slides
つながる目録、つながるサービス@図書館総合展(2015.11.12) by
つながる目録、つながるサービス@図書館総合展(2015.11.12)つながる目録、つながるサービス@図書館総合展(2015.11.12)
つながる目録、つながるサービス@図書館総合展(2015.11.12)Ikki Ohmukai
3.2K views21 slides
データ共有基盤の構築に向けて by
データ共有基盤の構築に向けてデータ共有基盤の構築に向けて
データ共有基盤の構築に向けてNational Institute of Informatics (NII)
2.3K views51 slides
Infosta実習 発表ver by
Infosta実習 発表verInfosta実習 発表ver
Infosta実習 発表verskdmai
375 views42 slides
20151029 CODATA by
20151029 CODATA20151029 CODATA
20151029 CODATATaro misumi
152 views57 slides
Web API入門 by
Web API入門Web API入門
Web API入門Masao Takaku
46.8K views78 slides

Similar to CiNiiのメタデータ・デザイン@LinkedData勉強会(2012.01.18)(20)

つながる目録、つながるサービス@図書館総合展(2015.11.12) by Ikki Ohmukai
つながる目録、つながるサービス@図書館総合展(2015.11.12)つながる目録、つながるサービス@図書館総合展(2015.11.12)
つながる目録、つながるサービス@図書館総合展(2015.11.12)
Ikki Ohmukai3.2K views
Infosta実習 発表ver by skdmai
Infosta実習 発表verInfosta実習 発表ver
Infosta実習 発表ver
skdmai375 views
国立情報学研究所のオープンデータに関する取り組み@図書館総合展(2013.10.30) by Ikki Ohmukai
国立情報学研究所のオープンデータに関する取り組み@図書館総合展(2013.10.30)国立情報学研究所のオープンデータに関する取り組み@図書館総合展(2013.10.30)
国立情報学研究所のオープンデータに関する取り組み@図書館総合展(2013.10.30)
Ikki Ohmukai1.6K views
20040820 ku-librarians勉強会 #58:機関リポジトリ(『電子図書館の新たな潮流』シリーズ 第2回) by kulibrarians
20040820 ku-librarians勉強会 #58:機関リポジトリ(『電子図書館の新たな潮流』シリーズ 第2回)20040820 ku-librarians勉強会 #58:機関リポジトリ(『電子図書館の新たな潮流』シリーズ 第2回)
20040820 ku-librarians勉強会 #58:機関リポジトリ(『電子図書館の新たな潮流』シリーズ 第2回)
kulibrarians436 views
知識インフラの本質と「未来の」ライブラリアンへの期待(2017.4.22) by Ikki Ohmukai
知識インフラの本質と「未来の」ライブラリアンへの期待(2017.4.22)知識インフラの本質と「未来の」ライブラリアンへの期待(2017.4.22)
知識インフラの本質と「未来の」ライブラリアンへの期待(2017.4.22)
Ikki Ohmukai1.4K views
MojiHimoji(20110218) by 真 岡本
MojiHimoji(20110218)MojiHimoji(20110218)
MojiHimoji(20110218)
真 岡本717 views
ポータル研修 201208 天野_発表用 by Eriko Amano
ポータル研修 201208 天野_発表用ポータル研修 201208 天野_発表用
ポータル研修 201208 天野_発表用
Eriko Amano658 views
Linked Open Dataの基礎と これからの情報活用 by KAMURA
Linked Open Dataの基礎と これからの情報活用Linked Open Dataの基礎と これからの情報活用
Linked Open Dataの基礎と これからの情報活用
KAMURA7.5K views
図書館でAPIをスルメのように 味わうには by Takanori Hayashi
図書館でAPIをスルメのように 味わうには図書館でAPIをスルメのように 味わうには
図書館でAPIをスルメのように 味わうには
Takanori Hayashi4.3K views
Linked Open Dataによる多様なミュージアム情報の統合 by KAMURA
Linked Open Dataによる多様なミュージアム情報の統合Linked Open Dataによる多様なミュージアム情報の統合
Linked Open Dataによる多様なミュージアム情報の統合
KAMURA2K views
Linked Open Dataで市民協働と情報技術者をつなげる試み by Shun Shiramatsu
Linked Open Dataで市民協働と情報技術者をつなげる試みLinked Open Dataで市民協働と情報技術者をつなげる試み
Linked Open Dataで市民協働と情報技術者をつなげる試み
Shun Shiramatsu386 views
リサーチ・ナビ検索システムの技術 by Yoji Kiyota
リサーチ・ナビ検索システムの技術リサーチ・ナビ検索システムの技術
リサーチ・ナビ検索システムの技術
Yoji Kiyota2K views

More from Ikki Ohmukai

CiNii Researchと大学図書館(2018.6.18) by
CiNii Researchと大学図書館(2018.6.18)CiNii Researchと大学図書館(2018.6.18)
CiNii Researchと大学図書館(2018.6.18)Ikki Ohmukai
1.1K views15 slides
ビジネスで使えるオープンデータの技術@ビジネス活用のためのオープンデータセミナー(2016.01.22) by
ビジネスで使えるオープンデータの技術@ビジネス活用のためのオープンデータセミナー(2016.01.22)ビジネスで使えるオープンデータの技術@ビジネス活用のためのオープンデータセミナー(2016.01.22)
ビジネスで使えるオープンデータの技術@ビジネス活用のためのオープンデータセミナー(2016.01.22)Ikki Ohmukai
1.9K views29 slides
2016年10月、神戸に LODの国際会議がやってくる!@神戸ITフェスティバル2015(2015.11.6) by
2016年10月、神戸に LODの国際会議がやってくる!@神戸ITフェスティバル2015(2015.11.6)2016年10月、神戸に LODの国際会議がやってくる!@神戸ITフェスティバル2015(2015.11.6)
2016年10月、神戸に LODの国際会議がやってくる!@神戸ITフェスティバル2015(2015.11.6)Ikki Ohmukai
2.2K views28 slides
オープンデータをつかう図書館、オープンデータをつくる図書館(完全版)@京都図書館大会(2015.8.17) by
オープンデータをつかう図書館、オープンデータをつくる図書館(完全版)@京都図書館大会(2015.8.17)オープンデータをつかう図書館、オープンデータをつくる図書館(完全版)@京都図書館大会(2015.8.17)
オープンデータをつかう図書館、オープンデータをつくる図書館(完全版)@京都図書館大会(2015.8.17)Ikki Ohmukai
4.5K views81 slides
オープンデータをつかう図書館、オープンデータをつくる図書館@京都図書館大会(2015.8.17) by
オープンデータをつかう図書館、オープンデータをつくる図書館@京都図書館大会(2015.8.17)オープンデータをつかう図書館、オープンデータをつくる図書館@京都図書館大会(2015.8.17)
オープンデータをつかう図書館、オープンデータをつくる図書館@京都図書館大会(2015.8.17)Ikki Ohmukai
6.8K views51 slides
学術コンテンツサービスでの活用事例@Lucene/Solr勉強会(2015.5.13) by
学術コンテンツサービスでの活用事例@Lucene/Solr勉強会(2015.5.13)学術コンテンツサービスでの活用事例@Lucene/Solr勉強会(2015.5.13)
学術コンテンツサービスでの活用事例@Lucene/Solr勉強会(2015.5.13)Ikki Ohmukai
7.2K views26 slides

More from Ikki Ohmukai(16)

CiNii Researchと大学図書館(2018.6.18) by Ikki Ohmukai
CiNii Researchと大学図書館(2018.6.18)CiNii Researchと大学図書館(2018.6.18)
CiNii Researchと大学図書館(2018.6.18)
Ikki Ohmukai1.1K views
ビジネスで使えるオープンデータの技術@ビジネス活用のためのオープンデータセミナー(2016.01.22) by Ikki Ohmukai
ビジネスで使えるオープンデータの技術@ビジネス活用のためのオープンデータセミナー(2016.01.22)ビジネスで使えるオープンデータの技術@ビジネス活用のためのオープンデータセミナー(2016.01.22)
ビジネスで使えるオープンデータの技術@ビジネス活用のためのオープンデータセミナー(2016.01.22)
Ikki Ohmukai1.9K views
2016年10月、神戸に LODの国際会議がやってくる!@神戸ITフェスティバル2015(2015.11.6) by Ikki Ohmukai
2016年10月、神戸に LODの国際会議がやってくる!@神戸ITフェスティバル2015(2015.11.6)2016年10月、神戸に LODの国際会議がやってくる!@神戸ITフェスティバル2015(2015.11.6)
2016年10月、神戸に LODの国際会議がやってくる!@神戸ITフェスティバル2015(2015.11.6)
Ikki Ohmukai2.2K views
オープンデータをつかう図書館、オープンデータをつくる図書館(完全版)@京都図書館大会(2015.8.17) by Ikki Ohmukai
オープンデータをつかう図書館、オープンデータをつくる図書館(完全版)@京都図書館大会(2015.8.17)オープンデータをつかう図書館、オープンデータをつくる図書館(完全版)@京都図書館大会(2015.8.17)
オープンデータをつかう図書館、オープンデータをつくる図書館(完全版)@京都図書館大会(2015.8.17)
Ikki Ohmukai4.5K views
オープンデータをつかう図書館、オープンデータをつくる図書館@京都図書館大会(2015.8.17) by Ikki Ohmukai
オープンデータをつかう図書館、オープンデータをつくる図書館@京都図書館大会(2015.8.17)オープンデータをつかう図書館、オープンデータをつくる図書館@京都図書館大会(2015.8.17)
オープンデータをつかう図書館、オープンデータをつくる図書館@京都図書館大会(2015.8.17)
Ikki Ohmukai6.8K views
学術コンテンツサービスでの活用事例@Lucene/Solr勉強会(2015.5.13) by Ikki Ohmukai
学術コンテンツサービスでの活用事例@Lucene/Solr勉強会(2015.5.13)学術コンテンツサービスでの活用事例@Lucene/Solr勉強会(2015.5.13)
学術コンテンツサービスでの活用事例@Lucene/Solr勉強会(2015.5.13)
Ikki Ohmukai7.2K views
Linked Open Data入門@関西オープンデータEXPO(2015.2.11) by Ikki Ohmukai
Linked Open Data入門@関西オープンデータEXPO(2015.2.11)Linked Open Data入門@関西オープンデータEXPO(2015.2.11)
Linked Open Data入門@関西オープンデータEXPO(2015.2.11)
Ikki Ohmukai2.8K views
図書館とLinked Open Data@大学図書館問題研究会全国大会(2014.8.24) by Ikki Ohmukai
図書館とLinked Open Data@大学図書館問題研究会全国大会(2014.8.24)図書館とLinked Open Data@大学図書館問題研究会全国大会(2014.8.24)
図書館とLinked Open Data@大学図書館問題研究会全国大会(2014.8.24)
Ikki Ohmukai3.3K views
情報の構造化@Linked Open Data連続講座(2014.6.2) by Ikki Ohmukai
情報の構造化@Linked Open Data連続講座(2014.6.2)情報の構造化@Linked Open Data連続講座(2014.6.2)
情報の構造化@Linked Open Data連続講座(2014.6.2)
Ikki Ohmukai8.3K views
オープンデータとLinked Open Data@筑波大学研究談話会(2013.12.18) by Ikki Ohmukai
オープンデータとLinked Open Data@筑波大学研究談話会(2013.12.18)オープンデータとLinked Open Data@筑波大学研究談話会(2013.12.18)
オープンデータとLinked Open Data@筑波大学研究談話会(2013.12.18)
Ikki Ohmukai2.5K views
オープンデータとは@芸術・文化情報とオープンデータ(2013.11.28) by Ikki Ohmukai
オープンデータとは@芸術・文化情報とオープンデータ(2013.11.28)オープンデータとは@芸術・文化情報とオープンデータ(2013.11.28)
オープンデータとは@芸術・文化情報とオープンデータ(2013.11.28)
Ikki Ohmukai1.6K views
災害と知識インフラ@神戸高専産学官技術フォーラム(2013.11.20) by Ikki Ohmukai
災害と知識インフラ@神戸高専産学官技術フォーラム(2013.11.20)災害と知識インフラ@神戸高専産学官技術フォーラム(2013.11.20)
災害と知識インフラ@神戸高専産学官技術フォーラム(2013.11.20)
Ikki Ohmukai2.9K views
地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8) by Ikki Ohmukai
地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)
地場産業としてのオープンデータの可能性@関西オープンフォーラム(2013.11.8)
Ikki Ohmukai5.9K views
図書館データとLinked Open Data@国立国会図書館データベースフォーラム(2013.10.16) by Ikki Ohmukai
図書館データとLinked Open Data@国立国会図書館データベースフォーラム(2013.10.16)図書館データとLinked Open Data@国立国会図書館データベースフォーラム(2013.10.16)
図書館データとLinked Open Data@国立国会図書館データベースフォーラム(2013.10.16)
Ikki Ohmukai11.2K views
オープンデータと「つながる社会」@オープンデータ京都勉強会(2013.04.20) by Ikki Ohmukai
オープンデータと「つながる社会」@オープンデータ京都勉強会(2013.04.20)オープンデータと「つながる社会」@オープンデータ京都勉強会(2013.04.20)
オープンデータと「つながる社会」@オープンデータ京都勉強会(2013.04.20)
Ikki Ohmukai1.8K views

Recently uploaded

PCCC23:富士通株式会社 テーマ1「次世代高性能・省電力プロセッサ『FUJITSU-MONAKA』」 by
PCCC23:富士通株式会社 テーマ1「次世代高性能・省電力プロセッサ『FUJITSU-MONAKA』」PCCC23:富士通株式会社 テーマ1「次世代高性能・省電力プロセッサ『FUJITSU-MONAKA』」
PCCC23:富士通株式会社 テーマ1「次世代高性能・省電力プロセッサ『FUJITSU-MONAKA』」PC Cluster Consortium
66 views12 slides
光コラボは契約してはいけない by
光コラボは契約してはいけない光コラボは契約してはいけない
光コラボは契約してはいけないTakuya Matsunaga
27 views17 slides
定例会スライド_キャチs 公開用.pdf by
定例会スライド_キャチs 公開用.pdf定例会スライド_キャチs 公開用.pdf
定例会スライド_キャチs 公開用.pdfKeio Robotics Association
135 views64 slides
PCCC23:東京大学情報基盤センター 「Society5.0の実現を目指す『計算・データ・学習』の融合による革新的スーパーコンピューティング」 by
PCCC23:東京大学情報基盤センター 「Society5.0の実現を目指す『計算・データ・学習』の融合による革新的スーパーコンピューティング」PCCC23:東京大学情報基盤センター 「Society5.0の実現を目指す『計算・データ・学習』の融合による革新的スーパーコンピューティング」
PCCC23:東京大学情報基盤センター 「Society5.0の実現を目指す『計算・データ・学習』の融合による革新的スーパーコンピューティング」PC Cluster Consortium
27 views36 slides
Keycloakの全体像: 基本概念、ユースケース、そして最新の開発動向 by
Keycloakの全体像: 基本概念、ユースケース、そして最新の開発動向Keycloakの全体像: 基本概念、ユースケース、そして最新の開発動向
Keycloakの全体像: 基本概念、ユースケース、そして最新の開発動向Hitachi, Ltd. OSS Solution Center.
101 views26 slides
パスキーでリードする: NGINXとKeycloakによる効率的な認証・認可 by
パスキーでリードする: NGINXとKeycloakによる効率的な認証・認可パスキーでリードする: NGINXとKeycloakによる効率的な認証・認可
パスキーでリードする: NGINXとKeycloakによる効率的な認証・認可Hitachi, Ltd. OSS Solution Center.
10 views22 slides

Recently uploaded(7)

PCCC23:富士通株式会社 テーマ1「次世代高性能・省電力プロセッサ『FUJITSU-MONAKA』」 by PC Cluster Consortium
PCCC23:富士通株式会社 テーマ1「次世代高性能・省電力プロセッサ『FUJITSU-MONAKA』」PCCC23:富士通株式会社 テーマ1「次世代高性能・省電力プロセッサ『FUJITSU-MONAKA』」
PCCC23:富士通株式会社 テーマ1「次世代高性能・省電力プロセッサ『FUJITSU-MONAKA』」
光コラボは契約してはいけない by Takuya Matsunaga
光コラボは契約してはいけない光コラボは契約してはいけない
光コラボは契約してはいけない
Takuya Matsunaga27 views
PCCC23:東京大学情報基盤センター 「Society5.0の実現を目指す『計算・データ・学習』の融合による革新的スーパーコンピューティング」 by PC Cluster Consortium
PCCC23:東京大学情報基盤センター 「Society5.0の実現を目指す『計算・データ・学習』の融合による革新的スーパーコンピューティング」PCCC23:東京大学情報基盤センター 「Society5.0の実現を目指す『計算・データ・学習』の融合による革新的スーパーコンピューティング」
PCCC23:東京大学情報基盤センター 「Society5.0の実現を目指す『計算・データ・学習』の融合による革新的スーパーコンピューティング」

CiNiiのメタデータ・デザイン@LinkedData勉強会(2012.01.18)

  • 1. CiNiiのメタデータ・デザイン 国立情報学研究所 大向 一輝 Twitter: @i2k
  • 2. 自己紹介 国立情報学研究所 コンテンツ科学研究系(教員) セマンティックウェブ・ソーシャルメディア Linked Open Data・LODACプロジェクト 学術コンテンツサービス研究開発センター 学術基盤推進部学術コンテンツ課システム室長 CiNii(論文)・NACSIS-CAT(大学図書館) 株式会社グルコース 日本最古?のRSSリーダー(2002〜)
  • 3. CiNiiとは 国内最大規模の学術情報サービス 論文(CiNii Articles) 国内学会誌・紀要のデジタル化 本文400万件 書誌1500万件 書籍・雑誌(CiNii Books)[New!] 大学図書館の蔵書データベース 書誌1100万件 所蔵1億1000万件 著者名典拠150万件 書誌データをRDFで提供
  • 4. 学術情報とメタデータ 学術情報分野の特徴 情報の構造化を生業とする職業集団・組織がある 研究者(大学・研究機関)・学会・図書館… 情報の構造化フォーマットが共有されている タイトル・著者名・抄録・本文・参考文献… フォーマットを変換するだけでメタデータが出せる
  • 5. CiNii Articlesのメタデータ 検索:OpenSearch RSS 1.0(=RDF)とAtom 1.0 RSS/Atom基本語彙+Dublin Core(Simple) 一般のブラウザ・フィードリーダーで扱えるように Prism Standard 書誌情報は国際標準に準拠(Natureなど) 書誌:RDF Dublin Core+Prism Standard(書誌情報)※日・英 FOAF(著者情報) 独自語彙は極力使用しない はじめての試みだったため その後…
  • 6. CiNii Articlesのメタデータ 検索RSSと書誌RDFをつなぐ 課題・問題点 RDFとHTMLと実体をどうつなぐか? 著者が空白ノード(URIなし)
  • 7. CiNii著者検索 NII著者ID (NRID) の導入 科研費番号+機械処理による著者へのID付与 著者ごとにURIを発行(著者パーマリンク) NRIDベースの論文検索機能 著者名→IDリスト→論文リスト APIの提供 新たなデータ生成・管理モデル 組織 研究成果の活用 ユーザーフィードバック 機械 ユーザ
  • 9. CiNii Booksのメタデータ 検索:OpenSearch RSS/Atom基本語彙+Dublin Core(Simple)+Prism Standard CiNii Articlesと同じ 書誌:RDF Dublin Core+Prism Standard(書誌情報) FOAF(著者名典拠) Bibliographic Ontology(所蔵情報) CiNii独自語彙
  • 10. CiNiiのメタデータ設計 設計方針をどうするか? データ構造・語彙… 厳密性と利便性のトレードオフ 日本語読み問題 書誌の階層問題 ウェブAPIとして考える できるだけ開発者が使いやすいように シンプルなデータ構造 ライブラリの普及状況を念頭に 世界標準(Dublin Core・FOAFなど)
  • 11. CiNiiメタデータへのアクセス アプリケーションID(appid)の取得 OpenSearch REST appid必須 RDF URI+.rdf appid推奨 コンテントネゴシエーション実装予定 アクセス状況 月間1000万〜2000万アクセス
  • 12. CiNiiウェブAPIコンテスト 2回開催(2009・2010) 第1回:24件 第2回:33件 Mashup awardへの参加 LODチャレンジへの協力
  • 14. まとめ Library Linked Data(LLD)の潮流 各国の国立図書館典拠データの公開 アメリカ・イギリス・フランス・ドイツ… 国立国会図書館 何のためのLinked Open Data? 公開すること自体の重要性・ドメイン内の相互利用 ドメインを超えた相互利用 自身が持つデータの新たな価値を知る
  • 15. 困っていること Linked Open Dataの要件は厳しい Cool URI・コンテントネゴシエーション ライセンス(CC0?) SPARQL そもそもリンクするのが難しい 100万アクセス/日 オンデマンドのリンクは実質不可能(爆撃) 名寄せ IDのURIをどうするか(ISBN・ISSN) プロパティ?HTTP URI?URN?rdf:datatype? IR/NIR問題 作り直したい症候群