Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
大学学部図書館のための
図書選定補助ツールの
紹介と考察
Code4lib japan 2013 conference
国立情報学研究所 前田朗
maeda@nii.ac.jp
はじめに
ねらいとコンセプト
開発ツール紹介
ブラウジング
専門用語の解釈
蔵書評価
選書成果の学術利用
さらなるツール
選書補助システムの考察
おわりに
ねらいとコンセプト
図書館員は何を指標に図書を選べばよいのだろうか。
図書の選定は、機械的に処理できるのだろうか…
ねらい
図書選定の理由の明確化
図書選定の質の向上
予算活用の説明
図書館業務システムの補完
図書館業務システムでは、あまり手がつ
けられていない → ツールを自作・手法
を検討する意味がある
大学の総合(中央)図書館や研究所図書室で...
コンセプト
職員の補助のためのツール
図書の内容理解なしで理由のある選書はできない
現状の人工知能では、テキストから内容を理解できない
使えそうな手法を必要に応じて作成
図書館の現場で必要に即し作成
十分な要件が整理できたら、統合シ...
開発ツールの紹介
東京大学柏図書館に在籍した3年間で、実務上
に即して作成したツール類を一部紹介
ブラウジング
図書の選定を人間が行うという観点で考えれば、
人間が選定候補の図書を読みやすく一覧できる
インターフェイスは必要である。
Be-ビブリオ
開発ツール1
入力ISBNリスト順で
図書を1タイトルづつ
ブラウジング
図書リストからの書籍内容チェックに使えます!
Be-ビブリオ
Be-ビブリオが
提示する情報
書籍タイトルに
ついての
Web上のキー
ワードを集計
(現在は休止)
書籍タイトルに
ついての
Googleブログ
検索結果
書誌情報
(国会図書館
or
楽天ブックス)
内容紹介
(楽天ブックス)
書影
(楽...
Be-ビブリオの情報あ源
楽天の「内容紹介」と「書影」 → 楽天に直に問い合わせ
て問題ないことを確認
Yahoo! 検索結果(抜粋)からのキーワード抽出
(有料化に伴い現在は休止)
Web上の書評 → Googleブログ検索がよさそう
著作権...
ランチャー
開発ツール2
図書館職員はOPACのハードユーザー!
使いどころを選べば、重複購入調査など業務が楽できます。
東京大学OPACランチャー(学内限定)
「次を表示」ボ
タンをクリック
するとリストの
キーワードを順
にOPAC検索
東京大学OPAC検索結果画面
ランチャーとその応用
Javascriptのみで作成
URLで検索結果HTMLを表示するDBなら簡単対応
CiNii Booksランチャーも公開中
専門用語の解釈
サブジェクトライブラリアンにはなれなくとも、
図書のタイトルや内容紹介を表面上だけでも解
釈して図書選定できるのではないか。
Wikipediaタガー
開発ツール3
Wikipediaタガー
テキストを入力
(例は「近刊検索βの[マルチンゲー
ル理論による統計解析]内容紹介)
Wikipedia
注釈すみ
テキスト
Wikipedia記事へのリンク
用途
文章を自動注釈してくれると初学者には便利か
もしれない
図書館でも職員による図書の選定に使えないか
(アプリそのままではなく、機能の組み込み)
ホームページ作成者向けに注釈結果をHTMLで保
存する機能付き
東京大学内専門用語
利用状況サーチ
開発ツール4
学部・研究所の図書室における図書
の選定に非常に有用と思います
図書タイトルや図書の内容紹介
中の専門用語を入れます
図書館室の所属する学部・研究
所を選択します
実行をすると、図書館室が所属
する学部・研究所のWebサイトでど
の程度...
蔵書評価
図書の選定は、PDCAサイクルに則り行われるべ
きものではないか。そのためには、現状の把握
や選書結果の評価が重要なポイントとなろう。
難語レポーター
開発ツール5
画面の入力例は「近刊検索β」にあった
「昭和前期の科学思想史」(勁草書房)の内容紹介
難語レポーター
レポート1
学術度判定(独自手法)
学術(ac.jpドメイン)限定のWeb検索と、
限定なしのWeb検索の
ヒット件数の比率で学術度を判定
レポート2
レア語をチェック(独自手法)
IPADICの[形態素生起コスト]をもとにした
独自の用語生起コストと、
Yahoo!検索件数をもとにレポート
レポート3
テキスト中の使用文字種
テキスト中の常用漢字(学年別)、
ひらがなの比率などをレポート
従来の「難読度」とは別の視点で考える
個々の用語の難易度に着目する
→ 短いフレーズでも有効に働くはず
上位概念と下位概念
学術度
レア度
日本語WordNetを見てみたが、
下位(より専門化されたもの)が
難易度として高いわけではない
国内学...
学術度判定
学術度 = 国内学術サイトのヒット件数 ÷
日本語Webサイトのヒット件数
レア語と同様に用語生起コストの上位3件のみ
判定
判定基準
学術度 判定
0.5より上 学術度が非常に高い
0.1~0.5 学術度が高い
0.05~0...
Libオススメ
開発ツール6
libオススメ
判定のためのしきい値をセット
判定対象図書の
ISBN(リスト)を入力
CiNii Booksの
タイトル情報
大学図書館と公共図書館の所
蔵館数とそれによる評価
ポイント
図書館が所蔵すること →
図書館のオススメと解釈す
る
性格の異なる2館種の結果
を組み合わせる
大学図書館(CiNii Books)
公共図書館(NDL Search)
公共図書館所蔵
大
学
図
書
館
所
蔵
多
多
公...
R言語を使った蔵書評価
実験
科学
入門
心理学
物質
電気
産業
東京大学新領域Webサイトと
東京大学柏図書館蔵書(開架一般書)相関
学生リクエスト多
のため
不足テー
マ?
これ以外に学内図書館室間の位置づけ調査も実施
選書成果の学術利用
図書館の蔵書構成は図書館が長年にわたり価値
判断を繰り返して末の結果といえる。これは有
益なコーパスとなりえないだろうか。
専門用語コレ・モカモ
開発ツール7
学術分野に応じた
関連語提示
CiNii Booksに
リンク
①
フレー
ズ入力 ②
学術文分野
(図書館)
セレクト③
クリック
専門用語コレ・モカモ
専門用語コレ・モカモの3つのねらい
• 研究・学習者向けの検索補助
サービス
• 関連語提示手法のひとつの提案
研究
• 図書館の蔵書構築をフォーカス
図書館業界
さらなるツール
図書の選定において、考慮すべき要件は多い。
個別紹介しきれなかった選書ツール・手法
あいまい重複調査
東京大学内図書室の位置づけ
学位論文タイトルマイニング
xISBNを使った最新版調査
洋図書の納品期間の推定
東京大学新領域教員の著書チェック
NCIDから和書価格を得る
...
選書補助システムの考察
いままでの開発ツールをまとめ、図書の選定の
ための統合システムとして、どのようなものが
考えられるかを考察する。
ポイント1
ブラウジングを中心に置く
書籍に関連情報をまとめて提示
用語の注釈機能も取り込む
雑多な形式のリストを取り込み可に
ポイント2
ターゲットとする研究・学習データの活用
学部Webサイト
シラバス
学位論文タイトル
など
ポイント3
蔵書評価を業務サイクルに
ターゲットに合っているか
入門書と専門書のバランスは適当か
学術性は十分か
など
ブラウジング
ネット情報
書籍DBなど
ターゲットとする
研究・学習内容の
情報
評価済み受入
候補一覧
発注・受入
選定結果の評価
選書補助システム案
専門用語
の解釈
学術度
専門・教養
のバランス
研究・学修
内容との整合
グループに
よ...
おわりに
ツール開発で関わったコミュニティ
図書系職員のためのアプリケーション
開発講習会
東京大学柏図書館
言選Web
マイニング探検会
紹介ツールの利用及びさらなる情報
「図書系職員のためのアプリケーション開発講習会」成果一覧
紹介のツールのうち一般公開のものは、以下のサイトか
らお試しいただけます。
https://mbc.dl.itc.u-tokyo.ac.jp/produ...
ご清聴ありがとうございました
Upcoming SlideShare
Loading in …5
×

大学学部図書館のための図書選定補助ツールの 紹介と考察

820 views

Published on

  • Be the first to comment

  • Be the first to like this

大学学部図書館のための図書選定補助ツールの 紹介と考察

  1. 1. 大学学部図書館のための 図書選定補助ツールの 紹介と考察 Code4lib japan 2013 conference 国立情報学研究所 前田朗 maeda@nii.ac.jp
  2. 2. はじめに ねらいとコンセプト 開発ツール紹介 ブラウジング 専門用語の解釈 蔵書評価 選書成果の学術利用 さらなるツール 選書補助システムの考察 おわりに
  3. 3. ねらいとコンセプト 図書館員は何を指標に図書を選べばよいのだろうか。 図書の選定は、機械的に処理できるのだろうか…
  4. 4. ねらい 図書選定の理由の明確化 図書選定の質の向上 予算活用の説明 図書館業務システムの補完 図書館業務システムでは、あまり手がつ けられていない → ツールを自作・手法 を検討する意味がある 大学の総合(中央)図書館や研究所図書室での活用も
  5. 5. コンセプト 職員の補助のためのツール 図書の内容理解なしで理由のある選書はできない 現状の人工知能では、テキストから内容を理解できない 使えそうな手法を必要に応じて作成 図書館の現場で必要に即し作成 十分な要件が整理できたら、統合システム化も
  6. 6. 開発ツールの紹介 東京大学柏図書館に在籍した3年間で、実務上 に即して作成したツール類を一部紹介
  7. 7. ブラウジング 図書の選定を人間が行うという観点で考えれば、 人間が選定候補の図書を読みやすく一覧できる インターフェイスは必要である。
  8. 8. Be-ビブリオ 開発ツール1
  9. 9. 入力ISBNリスト順で 図書を1タイトルづつ ブラウジング 図書リストからの書籍内容チェックに使えます! Be-ビブリオ
  10. 10. Be-ビブリオが 提示する情報 書籍タイトルに ついての Web上のキー ワードを集計 (現在は休止) 書籍タイトルに ついての Googleブログ 検索結果 書誌情報 (国会図書館 or 楽天ブックス) 内容紹介 (楽天ブックス) 書影 (楽天ブックス)
  11. 11. Be-ビブリオの情報あ源 楽天の「内容紹介」と「書影」 → 楽天に直に問い合わせ て問題ないことを確認 Yahoo! 検索結果(抜粋)からのキーワード抽出 (有料化に伴い現在は休止) Web上の書評 → Googleブログ検索がよさそう 著作権と網羅性、経費を考えると、 使える情報は限られる!
  12. 12. ランチャー 開発ツール2
  13. 13. 図書館職員はOPACのハードユーザー! 使いどころを選べば、重複購入調査など業務が楽できます。 東京大学OPACランチャー(学内限定) 「次を表示」ボ タンをクリック するとリストの キーワードを順 にOPAC検索 東京大学OPAC検索結果画面
  14. 14. ランチャーとその応用 Javascriptのみで作成 URLで検索結果HTMLを表示するDBなら簡単対応 CiNii Booksランチャーも公開中
  15. 15. 専門用語の解釈 サブジェクトライブラリアンにはなれなくとも、 図書のタイトルや内容紹介を表面上だけでも解 釈して図書選定できるのではないか。
  16. 16. Wikipediaタガー 開発ツール3
  17. 17. Wikipediaタガー テキストを入力 (例は「近刊検索βの[マルチンゲー ル理論による統計解析]内容紹介) Wikipedia 注釈すみ テキスト Wikipedia記事へのリンク
  18. 18. 用途 文章を自動注釈してくれると初学者には便利か もしれない 図書館でも職員による図書の選定に使えないか (アプリそのままではなく、機能の組み込み) ホームページ作成者向けに注釈結果をHTMLで保 存する機能付き
  19. 19. 東京大学内専門用語 利用状況サーチ 開発ツール4
  20. 20. 学部・研究所の図書室における図書 の選定に非常に有用と思います 図書タイトルや図書の内容紹介 中の専門用語を入れます 図書館室の所属する学部・研究 所を選択します 実行をすると、図書館室が所属 する学部・研究所のWebサイトでど の程度(どのように)その専門用 語が使えるかがわかります。 学習・研究に頻出する語なら 「買い」だとおもいます。 東京大学内専門用語利用状況サーチ(学内限定)
  21. 21. 蔵書評価 図書の選定は、PDCAサイクルに則り行われるべ きものではないか。そのためには、現状の把握 や選書結果の評価が重要なポイントとなろう。
  22. 22. 難語レポーター 開発ツール5
  23. 23. 画面の入力例は「近刊検索β」にあった 「昭和前期の科学思想史」(勁草書房)の内容紹介 難語レポーター
  24. 24. レポート1 学術度判定(独自手法) 学術(ac.jpドメイン)限定のWeb検索と、 限定なしのWeb検索の ヒット件数の比率で学術度を判定
  25. 25. レポート2 レア語をチェック(独自手法) IPADICの[形態素生起コスト]をもとにした 独自の用語生起コストと、 Yahoo!検索件数をもとにレポート
  26. 26. レポート3 テキスト中の使用文字種 テキスト中の常用漢字(学年別)、 ひらがなの比率などをレポート
  27. 27. 従来の「難読度」とは別の視点で考える 個々の用語の難易度に着目する → 短いフレーズでも有効に働くはず 上位概念と下位概念 学術度 レア度 日本語WordNetを見てみたが、 下位(より専門化されたもの)が 難易度として高いわけではない 国内学術サイト(ac.jp)中で へだたって使われる用語に 着目 IPADIC(日本語辞書)の単語 コストをもとにした用語の 出現しにくさ、+ Webヒッ ト件数 この2つの手法を採用
  28. 28. 学術度判定 学術度 = 国内学術サイトのヒット件数 ÷ 日本語Webサイトのヒット件数 レア語と同様に用語生起コストの上位3件のみ 判定 判定基準 学術度 判定 0.5より上 学術度が非常に高い 0.1~0.5 学術度が高い 0.05~0.1 学術度あり 0.01~0.05 学術度判定不可 0~0.01 学術度が低い
  29. 29. Libオススメ 開発ツール6
  30. 30. libオススメ 判定のためのしきい値をセット 判定対象図書の ISBN(リスト)を入力
  31. 31. CiNii Booksの タイトル情報 大学図書館と公共図書館の所 蔵館数とそれによる評価
  32. 32. ポイント 図書館が所蔵すること → 図書館のオススメと解釈す る 性格の異なる2館種の結果 を組み合わせる 大学図書館(CiNii Books) 公共図書館(NDL Search) 公共図書館所蔵 大 学 図 書 館 所 蔵 多 多 公共図書館 オススメ 大学図書館 オススメ 一般教養本 判定不可 少 少
  33. 33. R言語を使った蔵書評価 実験
  34. 34. 科学 入門 心理学 物質 電気 産業 東京大学新領域Webサイトと 東京大学柏図書館蔵書(開架一般書)相関 学生リクエスト多 のため 不足テー マ? これ以外に学内図書館室間の位置づけ調査も実施
  35. 35. 選書成果の学術利用 図書館の蔵書構成は図書館が長年にわたり価値 判断を繰り返して末の結果といえる。これは有 益なコーパスとなりえないだろうか。
  36. 36. 専門用語コレ・モカモ 開発ツール7
  37. 37. 学術分野に応じた 関連語提示 CiNii Booksに リンク ① フレー ズ入力 ② 学術文分野 (図書館) セレクト③ クリック 専門用語コレ・モカモ
  38. 38. 専門用語コレ・モカモの3つのねらい • 研究・学習者向けの検索補助 サービス • 関連語提示手法のひとつの提案 研究 • 図書館の蔵書構築をフォーカス 図書館業界
  39. 39. さらなるツール 図書の選定において、考慮すべき要件は多い。
  40. 40. 個別紹介しきれなかった選書ツール・手法 あいまい重複調査 東京大学内図書室の位置づけ 学位論文タイトルマイニング xISBNを使った最新版調査 洋図書の納品期間の推定 東京大学新領域教員の著書チェック NCIDから和書価格を得る シリーズものの所蔵漏れをチェック 評価表現辞書タガー
  41. 41. 選書補助システムの考察 いままでの開発ツールをまとめ、図書の選定の ための統合システムとして、どのようなものが 考えられるかを考察する。
  42. 42. ポイント1 ブラウジングを中心に置く 書籍に関連情報をまとめて提示 用語の注釈機能も取り込む 雑多な形式のリストを取り込み可に
  43. 43. ポイント2 ターゲットとする研究・学習データの活用 学部Webサイト シラバス 学位論文タイトル など
  44. 44. ポイント3 蔵書評価を業務サイクルに ターゲットに合っているか 入門書と専門書のバランスは適当か 学術性は十分か など
  45. 45. ブラウジング ネット情報 書籍DBなど ターゲットとする 研究・学習内容の 情報 評価済み受入 候補一覧 発注・受入 選定結果の評価 選書補助システム案 専門用語 の解釈 学術度 専門・教養 のバランス 研究・学修 内容との整合 グループに よるチェック 予算・重複受入 チェック 数段階の 評価 コメント 書籍リスト
  46. 46. おわりに
  47. 47. ツール開発で関わったコミュニティ 図書系職員のためのアプリケーション 開発講習会 東京大学柏図書館 言選Web マイニング探検会
  48. 48. 紹介ツールの利用及びさらなる情報 「図書系職員のためのアプリケーション開発講習会」成果一覧 紹介のツールのうち一般公開のものは、以下のサイトか らお試しいただけます。 https://mbc.dl.itc.u-tokyo.ac.jp/products.html
  49. 49. ご清聴ありがとうございました

×