「文字資料アーカイブズの現在
 -特に検索可能性を中心に」
                         公開シンポジウム
                     「文字と非文字のアーカイブズ/
                       モデルを使った文献研究」

                      日時:2011年2月18日(金)
                     会場:京都大学人文科学研究所

      岡本真(@arg)
  アカデミック・リソース・ガイド株式会社
    代表取締役/プロデューサー


                                                           1

    Copyright アカデミック・リソース・ガイド株式会社 All Rights Reserved.   arg.ne.jp
自己紹介


         私は何者か




                                                       2

Copyright アカデミック・リソース・ガイド株式会社 All Rights Reserved.   arg.ne.jp
自己紹介-岡本真(おかもと・まこと)
 現在:
  アカデミック・リソース・ガイド株式会社(2009年~)
    代表取締役/プロデューサー
    ACADEMIC RESOURCE GUIDE編集長(1998年~)
  NPO法人横浜コミュニティデザイン・ラボ
    理事(2010年~)
 過去:
  国際基督教大学卒業(1997年)
  編集者等を経て、
  1999年~2009年、ヤフー株式会社に在籍
    Yahoo!知恵袋、Yahoo!検索ランキング等の企画・設計・運
     用、産学連携のコーディネートに従事


                                                                   3

            Copyright アカデミック・リソース・ガイド株式会社 All Rights Reserved.   arg.ne.jp
[参考]
  ACADEMIC RESOURCE GUIDE
 1998年7月創刊、週刊、5000部、無料
 「インターネットの学術利用」がテーマ
 約150人の執筆者、約450回の発行




                                                               4

        Copyright アカデミック・リソース・ガイド株式会社 All Rights Reserved.   arg.ne.jp
自己紹介-岡本真(おかもと・まこと)
 兼任(大学関係):
    京都大学 情報学研究科 非常勤研究員
    国立情報学研究所 産学連携研究員
    東京大学 工学系研究科 総合研究機構 研究員
    早稲田大学 ITバイオマイニング研究所 客員研究員
    大妻女子大学 社会情報学部 非常勤講師
    関西学院大学 文学部 非常勤講師
      その他、北海道大学、流通科学大学、兵庫県立大学、追
       手門学院大学、横浜市立大学、関西大学、甲南大学等で
       講義を担当

                                                                  5

           Copyright アカデミック・リソース・ガイド株式会社 All Rights Reserved.   arg.ne.jp
[参考]
 アカデミック・リソース・ガイド株式会社
 創業:
  2009年9月30日
 前史:
  1998年7月11日創刊のメールマガジン
   “ACADEMIC RESOURCE GUIDE (ARG)”
 ビジョン:
  「学問を生かす社会へ」
 体制:
  役員1名+インターン3名
              インターン募集中!
                                                                 6

          Copyright アカデミック・リソース・ガイド株式会社 All Rights Reserved.   arg.ne.jp
[参考]
      ARGの事業内容
1. インターネットサービスの企画、開発、運用
2. インターネット活用の研修、コンサルティング
3. ウェブ技術に関わる産官学連携のコンサル
   ティング、仲介
4. 地域社会の活性化に関わるコンサルティング
5. 前各号に附帯する執筆、出版、講演、講義
6. 前各号に附帯する一切の事業

                                                              7

       Copyright アカデミック・リソース・ガイド株式会社 All Rights Reserved.   arg.ne.jp
文字資料アーカイブズの現在


 「電子書籍」元年、改正著作権法、
国立国会図書館による大規模デジタル化




                                                          8

   Copyright アカデミック・リソース・ガイド株式会社 All Rights Reserved.   arg.ne.jp
文字資料アーカイブズの現在
-電子書籍元年
 機器・デバイス
  Kindle(アマゾン)、iPad(アップル)
  GALAPAGOS(シャープ)、Reader(ソニー)
 仕様と適用
  EPUB
    例:『ブックビジネス2.0』の電子版
     iPhoneアプリ
     クリエイティブコモンズ準拠
     非DRM

                                                                 9

          Copyright アカデミック・リソース・ガイド株式会社 All Rights Reserved.   arg.ne.jp
文字資料アーカイブズの現在
-改正著作権法
第四十七条の七(情報解析のための複製等)
 著作物は、電子計算機による情報解析(多数の著作
 物その他の大量の情報から、当該情報を構成する言
 語、音、影像その他の要素に係る情報を抽出し、比
 較、分類その他の統計的な解析を行うことをいう。以
 下この条において同じ。)を行うことを目的とする場合
 には、必要と認められる限度において、記録媒体へ
 の記録又は翻案(これにより創作した二次的著作物
 の記録を含む。)を行うことができる。ただし、情報解
 析を行う者の用に供するために作成されたデータ
 ベースの著作物については、この限りでない。

                                                              10

        Copyright アカデミック・リソース・ガイド株式会社 All Rights Reserved.   arg.ne.jp
文字資料アーカイブズの現在
-国立国会図書館の大規模デジタル化
 長尾真館長の強いリーダーシップ
  2010年度補正予算
  100億円を超える予算
 大規模デジタル化
  近代デジタルライブラリーという蓄積
  1960年代後半までに刊行された日本語書籍で同館
   に所蔵されているもの
  画像データ
 文字資料アーカイブズとしての可能性
  全文テキスト化実証実験

                                                              11

        Copyright アカデミック・リソース・ガイド株式会社 All Rights Reserved.   arg.ne.jp
検索可能性という課題


抽出・解析・蓄積の先にある課題
「検索」を実現するための構造化




                                                        12

  Copyright アカデミック・リソース・ガイド株式会社 All Rights Reserved.   arg.ne.jp
検索可能性という課題
-抽出・解析・蓄積の先にある課題
 人文情報学の目的
 1. 人手では不可能な大量のデータを扱い
 2. 人手による処理では帰納できない類の情報を抽出し、
 3. 得られた情報を機械可読かつ再加工可能な形式で蓄
    積する
 蓄積の先にある「利用」と、「利用」を可能にする
  検索技術
  類似度判定、連想検索といった技術
  同時にあるペイジランク方式の限界

                                                              13

        Copyright アカデミック・リソース・ガイド株式会社 All Rights Reserved.   arg.ne.jp
検索可能性という課題
-「検索」を実現するための構造化
 様々な動向
  メタデータ付与という手法
    国立国会図書館デジタル情報資源ラウンドテーブル
  Linked-Open Data(LOD)
    LODAC Projects(武田英明ら)
 人文情報学の場合
  最終的には、「××という特徴をもつ文献はどのよ
   うな構造をしているのか」を機械可読な形式でモ
   デルとして提出する、つまり「文献の構造の情報
   学的モデル」を確立する
                                                                 14

           Copyright アカデミック・リソース・ガイド株式会社 All Rights Reserved.   arg.ne.jp
議論のための提案

ファクトデータベースへの傾斜



  研究文献のデータベース
  (レファレンスデータベース)の重要性


    本文と、その解釈の関係をメタデータ
    として内包する書誌情報の必要性

                                                              15

        Copyright アカデミック・リソース・ガイド株式会社 All Rights Reserved.   arg.ne.jp
ご清聴に感謝/ご質問はお気軽に




              岡本真
   アカデミック・リソース・ガイド株式会社
     代表取締役/プロデューサー


                                                           16

     Copyright アカデミック・リソース・ガイド株式会社 All Rights Reserved.   arg.ne.jp

MojiHimoji(20110218)

  • 1.
    「文字資料アーカイブズの現在 -特に検索可能性を中心に」 公開シンポジウム 「文字と非文字のアーカイブズ/ モデルを使った文献研究」 日時:2011年2月18日(金) 会場:京都大学人文科学研究所 岡本真(@arg) アカデミック・リソース・ガイド株式会社 代表取締役/プロデューサー 1 Copyright アカデミック・リソース・ガイド株式会社 All Rights Reserved. arg.ne.jp
  • 2.
    自己紹介 私は何者か 2 Copyright アカデミック・リソース・ガイド株式会社 All Rights Reserved. arg.ne.jp
  • 3.
    自己紹介-岡本真(おかもと・まこと)  現在: アカデミック・リソース・ガイド株式会社(2009年~)  代表取締役/プロデューサー  ACADEMIC RESOURCE GUIDE編集長(1998年~)  NPO法人横浜コミュニティデザイン・ラボ  理事(2010年~)  過去:  国際基督教大学卒業(1997年)  編集者等を経て、  1999年~2009年、ヤフー株式会社に在籍  Yahoo!知恵袋、Yahoo!検索ランキング等の企画・設計・運 用、産学連携のコーディネートに従事 3 Copyright アカデミック・リソース・ガイド株式会社 All Rights Reserved. arg.ne.jp
  • 4.
    [参考] ACADEMICRESOURCE GUIDE  1998年7月創刊、週刊、5000部、無料  「インターネットの学術利用」がテーマ  約150人の執筆者、約450回の発行 4 Copyright アカデミック・リソース・ガイド株式会社 All Rights Reserved. arg.ne.jp
  • 5.
    自己紹介-岡本真(おかもと・まこと)  兼任(大学関係):  京都大学 情報学研究科 非常勤研究員  国立情報学研究所 産学連携研究員  東京大学 工学系研究科 総合研究機構 研究員  早稲田大学 ITバイオマイニング研究所 客員研究員  大妻女子大学 社会情報学部 非常勤講師  関西学院大学 文学部 非常勤講師  その他、北海道大学、流通科学大学、兵庫県立大学、追 手門学院大学、横浜市立大学、関西大学、甲南大学等で 講義を担当 5 Copyright アカデミック・リソース・ガイド株式会社 All Rights Reserved. arg.ne.jp
  • 6.
    [参考] アカデミック・リソース・ガイド株式会社  創業:  2009年9月30日  前史:  1998年7月11日創刊のメールマガジン “ACADEMIC RESOURCE GUIDE (ARG)”  ビジョン:  「学問を生かす社会へ」  体制:  役員1名+インターン3名 インターン募集中! 6 Copyright アカデミック・リソース・ガイド株式会社 All Rights Reserved. arg.ne.jp
  • 7.
    [参考] ARGの事業内容 1. インターネットサービスの企画、開発、運用 2. インターネット活用の研修、コンサルティング 3. ウェブ技術に関わる産官学連携のコンサル ティング、仲介 4. 地域社会の活性化に関わるコンサルティング 5. 前各号に附帯する執筆、出版、講演、講義 6. 前各号に附帯する一切の事業 7 Copyright アカデミック・リソース・ガイド株式会社 All Rights Reserved. arg.ne.jp
  • 8.
    文字資料アーカイブズの現在 「電子書籍」元年、改正著作権法、 国立国会図書館による大規模デジタル化 8 Copyright アカデミック・リソース・ガイド株式会社 All Rights Reserved. arg.ne.jp
  • 9.
    文字資料アーカイブズの現在 -電子書籍元年  機器・デバイス Kindle(アマゾン)、iPad(アップル)  GALAPAGOS(シャープ)、Reader(ソニー)  仕様と適用  EPUB  例:『ブックビジネス2.0』の電子版  iPhoneアプリ  クリエイティブコモンズ準拠  非DRM 9 Copyright アカデミック・リソース・ガイド株式会社 All Rights Reserved. arg.ne.jp
  • 10.
    文字資料アーカイブズの現在 -改正著作権法 第四十七条の七(情報解析のための複製等) 著作物は、電子計算機による情報解析(多数の著作 物その他の大量の情報から、当該情報を構成する言 語、音、影像その他の要素に係る情報を抽出し、比 較、分類その他の統計的な解析を行うことをいう。以 下この条において同じ。)を行うことを目的とする場合 には、必要と認められる限度において、記録媒体へ の記録又は翻案(これにより創作した二次的著作物 の記録を含む。)を行うことができる。ただし、情報解 析を行う者の用に供するために作成されたデータ ベースの著作物については、この限りでない。 10 Copyright アカデミック・リソース・ガイド株式会社 All Rights Reserved. arg.ne.jp
  • 11.
    文字資料アーカイブズの現在 -国立国会図書館の大規模デジタル化  長尾真館長の強いリーダーシップ 2010年度補正予算  100億円を超える予算  大規模デジタル化  近代デジタルライブラリーという蓄積  1960年代後半までに刊行された日本語書籍で同館 に所蔵されているもの  画像データ  文字資料アーカイブズとしての可能性  全文テキスト化実証実験 11 Copyright アカデミック・リソース・ガイド株式会社 All Rights Reserved. arg.ne.jp
  • 12.
    検索可能性という課題 抽出・解析・蓄積の先にある課題 「検索」を実現するための構造化 12 Copyright アカデミック・リソース・ガイド株式会社 All Rights Reserved. arg.ne.jp
  • 13.
    検索可能性という課題 -抽出・解析・蓄積の先にある課題  人文情報学の目的 1.人手では不可能な大量のデータを扱い 2. 人手による処理では帰納できない類の情報を抽出し、 3. 得られた情報を機械可読かつ再加工可能な形式で蓄 積する  蓄積の先にある「利用」と、「利用」を可能にする 検索技術  類似度判定、連想検索といった技術  同時にあるペイジランク方式の限界 13 Copyright アカデミック・リソース・ガイド株式会社 All Rights Reserved. arg.ne.jp
  • 14.
    検索可能性という課題 -「検索」を実現するための構造化  様々な動向 メタデータ付与という手法  国立国会図書館デジタル情報資源ラウンドテーブル  Linked-Open Data(LOD)  LODAC Projects(武田英明ら)  人文情報学の場合  最終的には、「××という特徴をもつ文献はどのよ うな構造をしているのか」を機械可読な形式でモ デルとして提出する、つまり「文献の構造の情報 学的モデル」を確立する 14 Copyright アカデミック・リソース・ガイド株式会社 All Rights Reserved. arg.ne.jp
  • 15.
    議論のための提案 ファクトデータベースへの傾斜 研究文献のデータベース (レファレンスデータベース)の重要性 本文と、その解釈の関係をメタデータ として内包する書誌情報の必要性 15 Copyright アカデミック・リソース・ガイド株式会社 All Rights Reserved. arg.ne.jp
  • 16.
    ご清聴に感謝/ご質問はお気軽に 岡本真 アカデミック・リソース・ガイド株式会社 代表取締役/プロデューサー 16 Copyright アカデミック・リソース・ガイド株式会社 All Rights Reserved. arg.ne.jp