• Share
  • Email
  • Embed
  • Like
  • Save
  • Private Content
流通する学術情報コンテンツ: 概論
 

流通する学術情報コンテンツ: 概論

on

  • 614 views

http://www.nii.ac.jp/hrd/ja/portal/h25/curritxt.html

http://www.nii.ac.jp/hrd/ja/portal/h25/curritxt.html

Video: http://www.ustream.tv/recorded/36273915

Statistics

Views

Total Views
614
Views on SlideShare
572
Embed Views
42

Actions

Likes
1
Downloads
2
Comments
0

1 Embed 42

https://twitter.com 42

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    流通する学術情報コンテンツ: 概論 流通する学術情報コンテンツ: 概論 Presentation Transcript

    • 流通する学術情報コンテンツ ―概論― 高久雅生 筑波大学図書館情報メディア系 Email: masao@slis.tsukuba.ac.jp Twitter: @tmasao 1 平成25年度学術情報ウェブサービス担当者研修 2013年7月24日(水)
    • 自己紹介 • 高久雅生(たかくまさお)と申します。 • 筑波大学図書館情報メディア系 • 職歴: – 2004~2008: 国立情報学研究所(ポスドク研究員) – 2008~2013: 物質・材料研究機構(エンジニア) – 2013~: 筑波大学図書館情報メディア研究系(准教授) • 専門・関心: – 情報検索、情報探索行動 – 電子図書館 – 学術コミュニケーション • 教員として@知識情報・図書館学類 – (図書館情報学教育) – ディジタルドキュメント、文書処理技術 – 統計 2
    • 自己紹介:これまで作ったサービス 3 http://fuwat.to/ciniihttp://samurai.nims.go.jp/ http://masao.jpn.org/etc/junii-validator/
    • お品書き • 学術情報コンテンツ、学術データとは? • コンテンツの種別 • コンテンツの形式(フォーマット) • コンテンツの交換、標準化 • コンテンツの処理 4
    • データとは? コンテンツとは? • データ • コンテンツ • メタデータ • ソフトウェア • ハードウェア 5
    • データの内容種類 • 雑誌記事 • 学術論文 • 専門書, E-Books • 辞書・辞典 • ウェブページ • 実験データ 6
    • データの形式(フォーマット) • データの種類と形式 – 構造化データ – Webデータ – ページ画像 – 書式スタイル – パッケージデータ – 画像データ – 動画データ • データ形式の例 – XML, HTML, SGML – PDF, Flash – CSS, XSLT – EPUB, XMDF, .book, AMZ – JPEG, PNG, GIF, TIFF – MPEG, MOV – RSS, Plaintext, YAML, JSON, CSV, … 7
    • データ形式の切り口 (1) • テキスト (text) vs バイ ナリー (binary) – ビットデータ – 文字コードによる解釈 – 外字 • フォーマットの指定・ 識別・判別 • シンプルコンテンツ vs 複合メディア – 埋め込みコンテンツ – ハイパーリンク • メタデータ – 埋め込みメタデータ – 外部メタデータ記述 • 表示レイアウト – ページ概念 • 文書内の書式要素 – 見栄え / スタイル – フォント • ファイル vs ストリーム – データの保存・蓄積と配 信 8
    • データ形式の切り口 (2) • オープンフォーマット – 移植可能性 / ソフトウェ ア独立性 – Free / proprietary • 標準化 – デファクト標準とデ ジュール標準 (“de facto” vs “de jure”) • 文書フォーマットの バージョン • フォーマット変換 – テキスト → HTML – LaTeX → PDF • 圧縮 – 可逆 vs 非可逆 • セキュリティ – パスワード – 電子署名 • 長期保存 • デジタルフォレンジッ ク 9
    • データ交換の切り口 • 誰と交換するのか? – 特定の誰か – 不特定多数 • 交換の頻度は? • 作成や更新とデータ交換の関係は? • データの取得、取り込み、保存は自動化、通 信する必要があるか? →「通信プロトコル」 – ウェブ:HTTP – 機関リポジトリ:OAI-PMH – 検索データベース:Z39.50, OpenSearch, SRU 10
    • 事例:ウィキペディア 11
    • 12
    • 13
    • 14
    • 15
    • ‘’’Wikiepedia’’’ (ウィキオペ ディア)はオン ラインhyっ科辞 典として拝領す る。 ウィキペディアの構造と処理モデル 16 ブラウザ 閲覧 利用者 サーバ http://commons.wikimedia.org/wiki/File:Wikimedia_Servers- 0051_16.jpg ‘’’国立情報学研 究所’’’(こくり つじょうほうが けんきゅう じょ)は情報学 の先端研究所… <h1>国立情報学研究 所<h1> <p><strong>国立情報 学研究所</strong> (こくりつじょうほ うがけんきゅう じょ)は情報学の先 端研究所… ‘’’国立情報学研 究所’’’(こくり つじょうほうが けんきゅう じょ)は情報学 の先端研究所… MediaWiki ソフトウェア ① ② ③ ④ ⑤
    • まとめ • 学術情報コンテンツ、学術データとは? • コンテンツの種別 • コンテンツの形式(フォーマット) • コンテンツの交換、標準化 • コンテンツの処理 • 最後に… – 一方で、プラットフォーム化とサービス化が加速 – 「コンテンツ」「ソフトウェア」「ハードウェ ア」という整理だけでは把握しきれないサービス 17
    • 18
    • 19 ウェブ インターネット ネットワーク / 通信 コンテンツ ユーザ / 利用者 サービス!