大学学部図書館のための
図書選定補助ツールの
紹介と考察
Code4lib japan 2013 conference
国立情報学研究所 前田朗
maeda@nii.ac.jp
はじめに
ねらいとコンセプト
開発ツール紹介
ブラウジング
専門用語の解釈
蔵書評価
選書成果の学術利用
さらなるツール
選書補助システムの考察
おわりに
ねらいとコンセプト
図書館員は何を指標に図書を選べばよいのだろうか。
図書の選定は、機械的に処理できるのだろうか…
ねらい
図書選定の理由の明確化
図書選定の質の向上
予算活用の説明
図書館業務システムの補完
図書館業務システムでは、あまり手がつ
けられていない → ツールを自作・手法
を検討する意味がある
大学の総合(中央)図書館や研究所図書室での活用も
コンセプト
職員の補助のためのツール
図書の内容理解なしで理由のある選書はできない
現状の人工知能では、テキストから内容を理解できない
使えそうな手法を必要に応じて作成
図書館の現場で必要に即し作成
十分な要件が整理できたら、統合システム化も
開発ツールの紹介
東京大学柏図書館に在籍した3年間で、実務上
に即して作成したツール類を一部紹介
ブラウジング
図書の選定を人間が行うという観点で考えれば、
人間が選定候補の図書を読みやすく一覧できる
インターフェイスは必要である。
Be-ビブリオ
開発ツール1
入力ISBNリスト順で
図書を1タイトルづつ
ブラウジング
図書リストからの書籍内容チェックに使えます!
Be-ビブリオ
Be-ビブリオが
提示する情報
書籍タイトルに
ついての
Web上のキー
ワードを集計
(現在は休止)
書籍タイトルに
ついての
Googleブログ
検索結果
書誌情報
(国会図書館
or
楽天ブックス)
内容紹介
(楽天ブックス)
書影
(楽天ブックス)
Be-ビブリオの情報あ源
楽天の「内容紹介」と「書影」 → 楽天に直に問い合わせ
て問題ないことを確認
Yahoo! 検索結果(抜粋)からのキーワード抽出
(有料化に伴い現在は休止)
Web上の書評 → Googleブログ検索がよさそう
著作権と網羅性、経費を考えると、
使える情報は限られる!
ランチャー
開発ツール2
図書館職員はOPACのハードユーザー!
使いどころを選べば、重複購入調査など業務が楽できます。
東京大学OPACランチャー(学内限定)
「次を表示」ボ
タンをクリック
するとリストの
キーワードを順
にOPAC検索
東京大学OPAC検索結果画面
ランチャーとその応用
Javascriptのみで作成
URLで検索結果HTMLを表示するDBなら簡単対応
CiNii Booksランチャーも公開中
専門用語の解釈
サブジェクトライブラリアンにはなれなくとも、
図書のタイトルや内容紹介を表面上だけでも解
釈して図書選定できるのではないか。
Wikipediaタガー
開発ツール3
Wikipediaタガー
テキストを入力
(例は「近刊検索βの[マルチンゲー
ル理論による統計解析]内容紹介)
Wikipedia
注釈すみ
テキスト
Wikipedia記事へのリンク
用途
文章を自動注釈してくれると初学者には便利か
もしれない
図書館でも職員による図書の選定に使えないか
(アプリそのままではなく、機能の組み込み)
ホームページ作成者向けに注釈結果をHTMLで保
存する機能付き
東京大学内専門用語
利用状況サーチ
開発ツール4
学部・研究所の図書室における図書
の選定に非常に有用と思います
図書タイトルや図書の内容紹介
中の専門用語を入れます
図書館室の所属する学部・研究
所を選択します
実行をすると、図書館室が所属
する学部・研究所のWebサイトでど
の程度(どのように)その専門用
語が使えるかがわかります。
学習・研究に頻出する語なら
「買い」だとおもいます。
東京大学内専門用語利用状況サーチ(学内限定)
蔵書評価
図書の選定は、PDCAサイクルに則り行われるべ
きものではないか。そのためには、現状の把握
や選書結果の評価が重要なポイントとなろう。
難語レポーター
開発ツール5
画面の入力例は「近刊検索β」にあった
「昭和前期の科学思想史」(勁草書房)の内容紹介
難語レポーター
レポート1
学術度判定(独自手法)
学術(ac.jpドメイン)限定のWeb検索と、
限定なしのWeb検索の
ヒット件数の比率で学術度を判定
レポート2
レア語をチェック(独自手法)
IPADICの[形態素生起コスト]をもとにした
独自の用語生起コストと、
Yahoo!検索件数をもとにレポート
レポート3
テキスト中の使用文字種
テキスト中の常用漢字(学年別)、
ひらがなの比率などをレポート
従来の「難読度」とは別の視点で考える
個々の用語の難易度に着目する
→ 短いフレーズでも有効に働くはず
上位概念と下位概念
学術度
レア度
日本語WordNetを見てみたが、
下位(より専門化されたもの)が
難易度として高いわけではない
国内学術サイト(ac.jp)中で
へだたって使われる用語に
着目
IPADIC(日本語辞書)の単語
コストをもとにした用語の
出現しにくさ、+ Webヒッ
ト件数
この2つの手法を採用
学術度判定
学術度 = 国内学術サイトのヒット件数 ÷
日本語Webサイトのヒット件数
レア語と同様に用語生起コストの上位3件のみ
判定
判定基準
学術度 判定
0.5より上 学術度が非常に高い
0.1~0.5 学術度が高い
0.05~0.1 学術度あり
0.01~0.05 学術度判定不可
0~0.01 学術度が低い
Libオススメ
開発ツール6
libオススメ
判定のためのしきい値をセット
判定対象図書の
ISBN(リスト)を入力
CiNii Booksの
タイトル情報
大学図書館と公共図書館の所
蔵館数とそれによる評価
ポイント
図書館が所蔵すること →
図書館のオススメと解釈す
る
性格の異なる2館種の結果
を組み合わせる
大学図書館(CiNii Books)
公共図書館(NDL Search)
公共図書館所蔵
大
学
図
書
館
所
蔵
多
多
公共図書館
オススメ
大学図書館
オススメ
一般教養本
判定不可
少
少
R言語を使った蔵書評価
実験
科学
入門
心理学
物質
電気
産業
東京大学新領域Webサイトと
東京大学柏図書館蔵書(開架一般書)相関
学生リクエスト多
のため
不足テー
マ?
これ以外に学内図書館室間の位置づけ調査も実施
選書成果の学術利用
図書館の蔵書構成は図書館が長年にわたり価値
判断を繰り返して末の結果といえる。これは有
益なコーパスとなりえないだろうか。
専門用語コレ・モカモ
開発ツール7
学術分野に応じた
関連語提示
CiNii Booksに
リンク
①
フレー
ズ入力 ②
学術文分野
(図書館)
セレクト③
クリック
専門用語コレ・モカモ
専門用語コレ・モカモの3つのねらい
• 研究・学習者向けの検索補助
サービス
• 関連語提示手法のひとつの提案
研究
• 図書館の蔵書構築をフォーカス
図書館業界
さらなるツール
図書の選定において、考慮すべき要件は多い。
個別紹介しきれなかった選書ツール・手法
あいまい重複調査
東京大学内図書室の位置づけ
学位論文タイトルマイニング
xISBNを使った最新版調査
洋図書の納品期間の推定
東京大学新領域教員の著書チェック
NCIDから和書価格を得る
シリーズものの所蔵漏れをチェック
評価表現辞書タガー
選書補助システムの考察
いままでの開発ツールをまとめ、図書の選定の
ための統合システムとして、どのようなものが
考えられるかを考察する。
ポイント1
ブラウジングを中心に置く
書籍に関連情報をまとめて提示
用語の注釈機能も取り込む
雑多な形式のリストを取り込み可に
ポイント2
ターゲットとする研究・学習データの活用
学部Webサイト
シラバス
学位論文タイトル
など
ポイント3
蔵書評価を業務サイクルに
ターゲットに合っているか
入門書と専門書のバランスは適当か
学術性は十分か
など
ブラウジング
ネット情報
書籍DBなど
ターゲットとする
研究・学習内容の
情報
評価済み受入
候補一覧
発注・受入
選定結果の評価
選書補助システム案
専門用語
の解釈
学術度
専門・教養
のバランス
研究・学修
内容との整合
グループに
よるチェック
予算・重複受入
チェック
数段階の
評価
コメント
書籍リスト
おわりに
ツール開発で関わったコミュニティ
図書系職員のためのアプリケーション
開発講習会
東京大学柏図書館
言選Web
マイニング探検会
紹介ツールの利用及びさらなる情報
「図書系職員のためのアプリケーション開発講習会」成果一覧
紹介のツールのうち一般公開のものは、以下のサイトか
らお試しいただけます。
https://mbc.dl.itc.u-tokyo.ac.jp/products.html
ご清聴ありがとうございました

大学学部図書館のための図書選定補助ツールの 紹介と考察