Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
ブクリス ニュース  ×  カーリル  ×  OPAC! 『気になる本』と出会える図書館サイト 図書館総合展 2011.11.9  ~ 11.11 マイニング探検会ブクリス班 嶋田綾子(日比谷図書文化館) 南雲知也(ブレインテック) 土井亮(農...
<ul><li>「何か面白い本無いかな~?」と本との出会いを求めるには、検索語を入れないと探せない OPAC はハードルが高すぎる!そこで、作りました。旬の話題のブックリストを自動で生成・表示してくれるシステム!『ブクリス』 </li></ul...
画面例1
画面例2
目指したもの <ul><li>公共図書館で実際に使えるサービス </li></ul><ul><li>多くの図書館で使えるサービス </li></ul><ul><li>-> つまり・・・ </li></ul><ul><li>設定や日々の運用が難し...
どうやって? ってなに?
資料リストを出す方法 <ul><li>各館の OPAC を使う?ブクリス側にコピーする? </li></ul><ul><li>-> 多くの図書館に対応するのは大変。 </li></ul><ul><li>カーリルローカルの API がある! </...
当初(合宿終了時)の設計 情報原 a 情報原 b 情報原 c カーリルローカル A 図書館 OPAC 【 A 図書館 ×a 】 キーワードの OPAC 検索結果 【 A 図書館 ×a 】 キーワードの OPAC 検索結果 【 A 図書館 ×a ...
できた! <ul><li>やりたいことはできた。 </li></ul><ul><li>ただし1館分 </li></ul>
問題点 <ul><li>一ソースから抽出されるキーワード候補すべてにつき、各図書館 OPAC に検索をかけなくてはならない。 </li></ul><ul><li> -> 1 ソース 1 回につき100件以上の検索。 </li></ul><ul>...
合宿以降の検討 <ul><li>キーワード抽出手法 </li></ul><ul><li>キーワードを選ぶための「共通フィルタ」の設定 </li></ul>
どうやって「適切な」キーワードを 表示する? <ul><li>キーワード作成の流れ </li></ul><ul><li>文章からキーワードを作る </li></ul><ul><li>キーワードを選ぶ </li></ul>
キーワードを作る方法 <ul><li>文章から単語を抜き出す </li></ul><ul><ul><li>手法が二つ </li></ul></ul><ul><li>専門用語を切り出すキーフレーズ抽出 </li></ul><ul><ul><li>...
キーワードを選ぶ方法(候補) <ul><li>OPAC のヒット数を調査 </li></ul><ul><li>件名などのキーワードに絞る </li></ul><ul><li>大規模図書 DB(NDL,NACSIS-CAT )のヒット数  </l...
対象とする情報源候補 <ul><li>時事系 </li></ul><ul><ul><li>新聞社のサイト </li></ul></ul><ul><li>地域系 </li></ul><ul><ul><li>市役所のサイト </li></ul></...
現在の構成 情報原 a 情報原 b 情報原 c 情報原 d キーワード候補 a キーワード候補 b キーワード候補 c キーワード候補 d フィルタリング キーワード候補 a キーワード候補 b キーワード候補 c キーワード候補 d A 図書...
合宿後ー変更点 <ul><li>CiNii Books ( NACSIS-CAT のデータ)の検索結果件数による共通フィルタを追加。 </li></ul>
どこの図書館でも使えるために <ul><li>設定オプションを豊富に用意 </li></ul><ul><ul><li>情報源 </li></ul></ul><ul><ul><li>設定するキーワード </li></ul></ul><ul><ul...
管理者画面 キーワードフィルタと、 有効 Hit 数の範囲を指定 (範囲外のキーワードは除外) キーワードの抽出手法を指定 キーワードを抽出する RSS や Web サイトを指定
管理者画面 ソース設定  Test 結果 OK 抽出したキーワードとフィルタによって除外されるキーワードが、 ポップアップ表示で確認 単語 CiNii 書籍数 心臓 2548 宮城 8121 世界最古 45 日本 648325 ユニット 561...
管理者画面 キーワード設定 選択時に表示 リストとして表示する OPAC 検索結果を選択 選択 キーワード 図書館ヒット数   心臓 5 レ 宮城 10 レ 世界最古 10   福島 8 レ ユニット 20   つきあい方 7 「世界最古」の関...
今後 <ul><li>各図書館で実際に使ってもらえるように、 API として提供したい。 </li></ul><ul><li>有効な共通フィルタを追加していきたい。 </li></ul>
ブクリスは <ul><li>「気になる本と出会えるサイト」にすべての図書館が変身できるサービス </li></ul>
ぜひお試しください <ul><li>http://maitan-a.litteldev.net/ </li></ul>
Upcoming SlideShare
Loading in …5
×

ブクリス 図書館総合展用

1,376 views

Published on

まだ未完成です。

Published in: Technology
  • Be the first to comment

ブクリス 図書館総合展用

  1. 1. ブクリス ニュース × カーリル × OPAC! 『気になる本』と出会える図書館サイト 図書館総合展 2011.11.9 ~ 11.11 マイニング探検会ブクリス班 嶋田綾子(日比谷図書文化館) 南雲知也(ブレインテック) 土井亮(農林水産研究情報総合センター) 太田飛鳥(ネクスト・リッテル研究所) 関戸麻衣(国立情報学研究所) + CiNii Books
  2. 2. <ul><li>「何か面白い本無いかな~?」と本との出会いを求めるには、検索語を入れないと探せない OPAC はハードルが高すぎる!そこで、作りました。旬の話題のブックリストを自動で生成・表示してくれるシステム!『ブクリス』 </li></ul><ul><li>http://maitan-a.litteldev.net/ </li></ul>
  3. 3. 画面例1
  4. 4. 画面例2
  5. 5. 目指したもの <ul><li>公共図書館で実際に使えるサービス </li></ul><ul><li>多くの図書館で使えるサービス </li></ul><ul><li>-> つまり・・・ </li></ul><ul><li>設定や日々の運用が難しくない </li></ul><ul><li>少しの設定変更で多くの図書館に対応可能 </li></ul>
  6. 6. どうやって? ってなに?
  7. 7. 資料リストを出す方法 <ul><li>各館の OPAC を使う?ブクリス側にコピーする? </li></ul><ul><li>-> 多くの図書館に対応するのは大変。 </li></ul><ul><li>カーリルローカルの API がある! </li></ul><ul><li>キーワードと図書館 ID をセットして検索結果( 10 件)と OPAC の URL を取得できる </li></ul>
  8. 8. 当初(合宿終了時)の設計 情報原 a 情報原 b 情報原 c カーリルローカル A 図書館 OPAC 【 A 図書館 ×a 】 キーワードの OPAC 検索結果 【 A 図書館 ×a 】 キーワードの OPAC 検索結果 【 A 図書館 ×a 】 キーワードの OPAC 検索結果 【 A 図書館 ×a 】 キーワードの OPAC 検索結果 【 A 図書館 ×a 】 キーワードの OPAC 検索結果 【 A 図書館 ×b 】 キーワードの OPAC 検索結果 【 A 図書館 ×a 】 キーワードの OPAC 検索結果 【 A 図書館 ×a 】 キーワードの OPAC 検索結果 【 A 図書館 ×c 】 キーワードの OPAC 検索結果 キーワード抽出 資料リスト作成 選択 OPAC でヒットしない単語は使えない。ヒットが多すぎる単語は一般的すぎて面白くないので使わない 。 【 A 図書館 ×a 】 キーワードの OPAC 検索結果 【 A 図書館 ×a 】 キーワードの OPAC 検索結果 【 A 図書館 ×b 】 キーワードの OPAC 検索結果 【 A 図書館 ×c 】 キーワードの OPAC 検索結果 【 A 図書館 ×a 】 キーワードの OPAC 検索結果 【 A 図書館 ×b 】 キーワードの OPAC 検索結果 【 A 図書館 ×c 】 キーワードの OPAC 検索結果 キーワードリスト a キーワードリスト b キーワードリスト c
  9. 9. できた! <ul><li>やりたいことはできた。 </li></ul><ul><li>ただし1館分 </li></ul>
  10. 10. 問題点 <ul><li>一ソースから抽出されるキーワード候補すべてにつき、各図書館 OPAC に検索をかけなくてはならない。 </li></ul><ul><li> -> 1 ソース 1 回につき100件以上の検索。 </li></ul><ul><li> -> OPAC への負荷が高い。複数図書館分を処理 する場合にも効率が良くならない。 </li></ul><ul><li>キーワードが長いものになり、 OPAC にヒットする件数が少なくなりがち。 </li></ul>
  11. 11. 合宿以降の検討 <ul><li>キーワード抽出手法 </li></ul><ul><li>キーワードを選ぶための「共通フィルタ」の設定 </li></ul>
  12. 12. どうやって「適切な」キーワードを 表示する? <ul><li>キーワード作成の流れ </li></ul><ul><li>文章からキーワードを作る </li></ul><ul><li>キーワードを選ぶ </li></ul>
  13. 13. キーワードを作る方法 <ul><li>文章から単語を抜き出す </li></ul><ul><ul><li>手法が二つ </li></ul></ul><ul><li>専門用語を切り出すキーフレーズ抽出 </li></ul><ul><ul><li>-> 長めのキーワード、オリジナリティ 使用ツール:言選 Web 、 Yahoo ! API キーフレーズ抽出 抽出例:「山中湖そば」「渡辺美里」等 </li></ul></ul><ul><li>単語を切り出す形態素解析 </li></ul><ul><ul><li>-> 短めのキーワード。一般的。 </li></ul></ul><ul><ul><li>使用ツール: Yahoo ! API 形態素解析 </li></ul></ul><ul><ul><li>抽出例:「そば」 </li></ul></ul><ul><ul><li>-> オプションで選択可能に。 </li></ul></ul><ul><ul><li>蔵書規模に合わせて選択。 </li></ul></ul>
  14. 14. キーワードを選ぶ方法(候補) <ul><li>OPAC のヒット数を調査 </li></ul><ul><li>件名などのキーワードに絞る </li></ul><ul><li>大規模図書 DB(NDL,NACSIS-CAT )のヒット数  </li></ul><ul><ul><li>-> 実現。 大量に検索をかけたときの反応から NACSIS-CAT の CiNii Books を採用(当時は試験公開版) </li></ul></ul><ul><li>検索エンジンのヒット数 </li></ul><ul><li>シソーラス等によるキーワード展開 </li></ul>
  15. 15. 対象とする情報源候補 <ul><li>時事系 </li></ul><ul><ul><li>新聞社のサイト </li></ul></ul><ul><li>地域系 </li></ul><ul><ul><li>市役所のサイト </li></ul></ul><ul><ul><li>地域ポータルサイト </li></ul></ul><ul><ul><li>Wikipedia の地名項 </li></ul></ul><ul><ul><li>地方紙のサイト </li></ul></ul><ul><ul><li>はてなブックマークの地名キーワード新着 </li></ul></ul><ul><li>図書館独自(予定) </li></ul><ul><ul><li>キーワードリスト </li></ul></ul><ul><ul><li>資料リスト </li></ul></ul>
  16. 16. 現在の構成 情報原 a 情報原 b 情報原 c 情報原 d キーワード候補 a キーワード候補 b キーワード候補 c キーワード候補 d フィルタリング キーワード候補 a キーワード候補 b キーワード候補 c キーワード候補 d A 図書館用キーワード候補 a A 図書館用キーワード候補 b A 図書館用キーワード候補 c B 図書館用キーワード候補 d B 図書館用キーワード候補 c カーリルローカル A 図書館 OPAC B 図書館 OPAC 【 A 図書館 ×a 】 キーワードの OPAC 検索結果 【 A 図書館 ×a 】 キーワードの OPAC 検索結果 【 A 図書館 ×a 】 キーワードの OPAC 検索結果 【 A 図書館 ×a 】 キーワードの OPAC 検索結果 【 A 図書館 ×a 】 キーワードの OPAC 検索結果 【 A 図書館 ×b 】 キーワードの OPAC 検索結果 【 A 図書館 ×a 】 キーワードの OPAC 検索結果 【 A 図書館 ×a 】 キーワードの OPAC 検索結果 【 A 図書館 ×c 】 キーワードの OPAC 検索結果 【 A 図書館 ×a 】 キーワードの OPAC 検索結果 【 A 図書館 ×a 】 キーワードの OPAC 検索結果 【 B 図書館 ×c 】 キーワードの OPAC 検索結果 【 A 図書館 ×a 】 キーワードの OPAC 検索結果 【 A 図書館 ×a 】 キーワードの OPAC 検索結果 【 B 図書館 ×d 】 キーワードの OPAC 検索結果 キーワード抽出 ★ B 図書館 × 情報源 d キーワード切り出し:〇○ フィルタ: α 上限:〇○件 下限:〇○件 資料リスト作成 A 図書館が選択 B 図書館が選択 共通化
  17. 17. 合宿後ー変更点 <ul><li>CiNii Books ( NACSIS-CAT のデータ)の検索結果件数による共通フィルタを追加。 </li></ul>
  18. 18. どこの図書館でも使えるために <ul><li>設定オプションを豊富に用意 </li></ul><ul><ul><li>情報源 </li></ul></ul><ul><ul><li>設定するキーワード </li></ul></ul><ul><ul><li>フィルタ </li></ul></ul><ul><ul><li>フィルタの閾値 </li></ul></ul>
  19. 19. 管理者画面 キーワードフィルタと、 有効 Hit 数の範囲を指定 (範囲外のキーワードは除外) キーワードの抽出手法を指定 キーワードを抽出する RSS や Web サイトを指定
  20. 20. 管理者画面 ソース設定  Test 結果 OK 抽出したキーワードとフィルタによって除外されるキーワードが、 ポップアップ表示で確認 単語 CiNii 書籍数 心臓 2548 宮城 8121 世界最古 45 日本 648325 ユニット 561 つきあい方 198
  21. 21. 管理者画面 キーワード設定 選択時に表示 リストとして表示する OPAC 検索結果を選択 選択 キーワード 図書館ヒット数   心臓 5 レ 宮城 10 レ 世界最古 10   福島 8 レ ユニット 20   つきあい方 7 「世界最古」の関連書籍 パズル学入門 パズルで愛を伝えよう  オーストラリアで大の字 さおり&トニーの冒険紀行 地図の歴史 ビジュアル版 イエメン 「幸福のアラビア」の原風景  法隆寺を歩く 岩波新書 新赤版 1222 源氏物語の女君たち 世界で一番おもしろい日本史 「知」のビジュアル百科 写真でたどる中国の文化と歴史 オリノコ 世界最古の森 クォークスペシャル ベネズエラネブリナ山探検紀行 世界最古の森から
  22. 22. 今後 <ul><li>各図書館で実際に使ってもらえるように、 API として提供したい。 </li></ul><ul><li>有効な共通フィルタを追加していきたい。 </li></ul>
  23. 23. ブクリスは <ul><li>「気になる本と出会えるサイト」にすべての図書館が変身できるサービス </li></ul>
  24. 24. ぜひお試しください <ul><li>http://maitan-a.litteldev.net/ </li></ul>

×