Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

GLAMtechこれまでの道のり

98 views

Published on

GLAMtech vol.6
日時:2018年2月3日(土)
場所:筑波大学東京キャンパス
https://glamtech006.peatix.com/

Published in: Science
  • Be the first to comment

  • Be the first to like this

GLAMtechこれまでの道のり

  1. 1. GLAMtech これまでの道のり GLAMtech Vol.6 2018年2月3日(土) 高久雅生(筑波大学) 1
  2. 2. GLAMtechのこれまで 1. 小規模館において持続可能な資料管理・提供の 仕組みと技術を考える (2017-05-01) 2. 教科書LODプロジェクトに学ぶ、小規模館におけ る持続可能な資料管理・提供の仕組みと技術 (2017-06-18) 3. GitHubのissueとreleaseをやってみる (2017-07-23) 4. Data Publishing! (2017-09-23) Season2 : Asset management 5. 小規模館において持続可能な資料管理・提供の 仕組みと技術を考える (2017-11-25) 6. GithubとFlickrでつくる収蔵資料ページ (2018-02- 03) 2
  3. 3. Season1 の振り返り • 小規模館が手元の資料(小規模データセッ トを)お手軽に安価に提供し、メンテナン スしていくための枠組みとは? 教科書LOD(約7000冊分;毎年更新) 特定歴史公文書等目録(東工大資史料館) … • (前提) 書誌情報(メタデータ)のみを扱う 一定の構造化ができている(不完全でよい)  レコードの記述が項目毎に区別できるよう分けら れており、Excel等で管理できるレベル 3
  4. 4. 事例:教科書LOD • https://jp-textbook.github.io/ • 枠組み 構造化(リソースと属性定義) Vol.2 データセット作成(RDFデータ作成) Vol.2 公開保守のための枠組み(Github) Vol.3 データ公開,発信! Vol.4 4
  5. 5. 教科書LODとは • 教科書の書誌データをLOD化 • 教科書を URI (IRI) で一意に示せる・利用 可能に 5 https://w3id.org/jp-textbook/高等学校/2006/世B/013 例:高等学校で使われている「世界史B」の教科書 (2006年に検定済み(奥付に記載あり)、東京書籍が出版) 教科書記号(例:世B)及び教科書番号(例:013) 教科書のわかりやすいところに記載さている (文部科学省が検定済教科書を整理・周知する際に使用) 高等学校地理歴史教科用 文部科学省検定済教科書 2 東書 世B 013 教科書の奥付の一部 ※平成18年=2006年 平成18年3月20日検定済 2|東書|世B013 教科書の表紙の左上
  6. 6. 6 https://w3id.org/jp-textbook/ URIを指定すれば、基本的な情報を閲覧可能 トップページから教科や種目(科目)などでブラウジング可能 Turtle形式のファイルでも全RDFデータを一括ダウンロード可能 教科書LODデータモデルの説明ドキュメントあり
  7. 7. 7 書名、出版者などの「本」としての基本的な情報 教育関連で基本的な情報: 学校種別、学年、教科、使用年度、検定年、 対応する学習指導要領など 教育図書館の資料検索結果へのリンク
  8. 8. 教科書LODのデータモデル: 教科書についての基本的な情報を記述 8 種目がある
  9. 9. 教科書LODの構築 • 国立教育政策教育図書館の保有する現行の 検定制度の教科書の書誌情報を提供いただ いて研究用に開発 対象:約7000件の書誌情報(タイトルや教科 等)に対してURI付与 安定した情報の修正・追加(データ作成機関 (教育図書館)との連携) • 付随するすべての教科・種目(科目)、学 習指導要領や教科書目録に対してもURIを付 与 • 外部サービスの活用 Githubページ 固定URIサービス(w3id.org)など 9
  10. 10. 教科書LOD構築の流れ 書誌情報 データベース 図書館システム TSVエクス ポート出力 編集 URI追加 csv2ttl.rb Turtle ファイル CSVエクス ポート出力 Rubyスク リプトHTMLファイル群 Git push Excel 人手で作成/出力 Copy&Paste 10
  11. 11. 1. 構造化 記述対象を決定して、その属性を決めよう! 11
  12. 12. 属性を決める • 適当なものを定める まずはお手軽に  深く考えない、あとで直せばよい 本気でやるなら、業界での標準的な語彙セット や関連データセットの調査を  LODstatsやdatahub等のツールも データセット特有の独自項目等は独自の語彙を 定義 • ウェブと親和性が高いのであれば、 Schema.org 語彙セット+αから始める 名称(タイトル)-> schema:title 対象学年 -> textbook:grade 所蔵請求記号 -> nier:callNumber 12
  13. 13. URI を定める • Permanent URL サービスを検討する 自身の所属組織のドメイン名も消えてなく なる未来を想定… • 著名な固定URIサービス https://w3id.org  W3C Permanent Identifier Community Group 運営 https://purl.org  Internet Archive 運営 • いずれも、固定URIサービスのドメイン 名+自身のプロジェクト名以下でURIを 固定化 https://w3id.org/jp-textbook/xxxx 13
  14. 14. 2.データセット作成 まずはRDFモデルに則ったデータを作ってみる 14
  15. 15. RDFデータ作成 • Turtle形式が最も一般的なデータ形式 もっとお手軽に実施するなら LinkData.org 等 のサービスもあるが… • “Poorman’s Linked Data Toolkit” 15
  16. 16. Poorman’s Linked Data Toolkit • Excel 1行を1レコードとみなし、いくつかのセル の値を &(文字列結合演算子)でつなげて いくだけ(お手軽) 出力には:  列をコピーし、MS Wordへペースト (Excel to word)  MS Word を全コピーし、テキストエディタに ペースト (Word to Text)  Turtleファイルとして保存(例: “filename.ttl”) (Turtle) 16
  17. 17. 3. データ公開と保守 無料でお手軽に公開+保守 17
  18. 18. Github • バージョンコントロール 変更履歴がたどれる • クラウド環境 • 無料で使える 18
  19. 19. 2つの機能:公開+保守 • 公開 Github Pages 無料で公開するためのホスティングサービス • 保守 GithubのIssue機能(課題管理機能) 19
  20. 20. Github Pages • Githubサイトでリポジトリを作成して、 Github Pagesで公開する! • https://(プロジェクト名).github.io/xxx と いうアドレスで公開される このアドレスに固定URIサービスのリダイレ クト先を振り向ける https://w3id.org の場合:  Github 上で Pull Request を送って対応依頼 https://purl.org の場合:  ウェブ上でフォームから設定できる(らしい) 20
  21. 21. Github Issues • データ保守+語彙保守 どのようにデータが追加されたか、データ 属性が変わったかを追跡できるようにして おく 21https://github.com/jp-textbook/jp-textbook.github.io/issues
  22. 22. 4. 最終版を公開 データセット公開! ウェブで宣伝! 22
  23. 23. LODデータセットの場合 ウェブの場合 • Google-ability をあげる • LODデータセットを宣伝 23

×