Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

図書館利用実態の可視化 および 読書感想文コンクール作品の分析

239 views

Published on

中央大学文学部・八王子市図書館部による共同研究の成果報告会が2018年6月29日に八王子市中央図書館視聴覚室で開催されました.本スライドは,その成果報告会で飯尾が報告した発表の資料です.

Published in: Education
  • Be the first to comment

  • Be the first to like this

図書館利用実態の可視化 および 読書感想文コンクール作品の分析

  1. 1. 図書館利用実態の可視化 および 読書感想文コンクール 作品の分析 八王子市図書館・中央大学共同研究 成果報告会 中央大学 文学部 社会情報学専攻 飯尾 淳
  2. 2. Copyright © Jun Iio 2 第1部 図書館利用実態の可視化
  3. 3. Copyright © Jun Iio 3 図書館利用データの可視化 ● データを行政区域ごとに集計し地図上に可視化 ● 対象としたデータ(H28年度時のデータ) – 登録者数 ● その地域の住人による図書館利用登録の数 – 利用者数 ● その地域の住人がH28年に1回でも図書館を利用した数 – 貸出回数 ● その地域の住人がH28年に図書館を利用したのべ数 – 貸出冊数 ● その地域の住人による総貸出冊数
  4. 4. Copyright © Jun Iio 4 図書館利用データの可視化 ● 詳細は1月の中間報告会にて橋本君が報告済み – 6館を「広域保障型」と「狭域保障型」に分類 ● 地区 i の来館者密度 di – 来館者密度 di = 利用者数 / 住民総数 ● 来館者密度比 Di – 来館者密度比 Di = di / maxj { dj } – (一般的には) ● 図書館に最も近い地域が 1.0 となる ● 図書館から離れるに従って,減衰する
  5. 5. Copyright © Jun Iio 5 図書館利用データの可視化 縦軸:来館者密度比 横軸:図書館と「各地区の重心」までの距離
  6. 6. Copyright © Jun Iio 6 図書館利用データの可視化 ● 来館者密度比の可視化 – 各図書館ごとの例 中央図書館 生涯学習センター図書館 川口図書館 南大沢図書館
  7. 7. Copyright © Jun Iio 7 来館者密度比10%保障
  8. 8. Copyright © Jun Iio 8 来館者密度比20%保障
  9. 9. Copyright © Jun Iio 9 その後の作業 ● 境界データの整備 – 利用した e-Stat のデータに不備があり,修正 – 「飯尾:バーティカルバーの極意(第7回,第8 回), シェルスクリプトマガジン, vol.53, vol.54, 2018年4月号・6月号」にて解説 ● Google Fusion Tables 利用によるシステム化 – 橋本君がGoogle My Mapsを使って手でやっていた 作業をアプリ利用でシステム化した – 「飯尾:バーティカルバーの極意(第9回), シェ ルスクリプトマガジン, vol.55, 2018年8月号」に て解説(予定)
  10. 10. Copyright © Jun Iio 10 ツール活用による作業効率の向上 ● 地図上への可視化に関する課題 – 八王子の「とてつもなく多い」町丁目 – 約200地区 ● システム化の効果 – 彼および仲間の費やした時間 … 数十時間 – 私がスクリプトでゴリゴリ … 数時間 – Google Fusion Tables使った … 20分 ● 今後の検討 – 年齢層別の利用状況分析など
  11. 11. Copyright © Jun Iio 11 その他 ● 対外発表(予定) J. Iio, "Lessons Learned on Data Preparation for Geographic Information Systems using Open Data," The 14th International Symposium on Open Collaboration (OpenSym2018) @ Paris, 22nd – 24th Aug. 2018. ● 今回のデータ整備で顕在 化したオープンデータの 課題について報告 ● 登録率と利用率の不 思議な相関…
  12. 12. Copyright © Jun Iio 12 第2部 読書感想文コンクール 作品の分析
  13. 13. Copyright © Jun Iio 13 読書感想文コンクール作品の分析 ● 対象とした作品 – 優秀作品 51作品 (H24年度〜H28年度,入選作品を対象) – 一般作品(比較対象) 47作品 H29年度において一次審査でC〜D判定を得たもの のうち,長さが極端に短いものを排除した残りから 抽出 ● 着眼点 – 使われている言葉にどのような特徴があるか – 誤字・脱字などは今回は対象外とする
  14. 14. Copyright © Jun Iio 14 単語の出現頻度 優秀作品 [%] 比較対象 [%] 私 3.713 1.621 自分 2.326 1.239 人 1.947 1.466 本 1.654 3.265 言葉 1.223 0.465 ない 1.197 0.632 それ 1.120 0.763 何 0.982 0.381 今 0.913 0.441 気持ち 0.751 0.274
  15. 15. Copyright © Jun Iio 15 単語の出現頻度 ● 作業の概要 – 形態素解析で品詞に分解後,名詞と形容詞を抽出 (非自立語は削除) – 全体で使われている単語数で正規化し,出現頻度を 計算 ● 補足 – 優秀作品のトップ10に入らなかった,比較対象の トップ10ワード 話,すごい,物語,おもしろい
  16. 16. Copyright © Jun Iio 16 単語の共起関係 ● 共起関係とは? – これは例文です.例として,日本語の難しさを指摘 してみます.「象は鼻が長い」,さてこの文の主語 は何か?日本語にはこのような曖昧さがあります. – 英語の例文でよく「The quick brown fox jumps over the lazy dog.」というものが使われます.英 語で使用する文字が全て使われています. ● 共起関係がある – 「例文」と「日本語」,「例文」と「英語」 ● 共起関係がない – 「日本語」と「英語」
  17. 17. Copyright © Jun Iio 17 共起ネットワーク分析 ● 頻出単語の共起性を可視化 ● 共起ネットワークグラフ – 2単語の共起確率(0.0 ≦ p << 1.0)が高いものを 線で結ぶ ● 出現頻度の高い単語は濃い色で表示 – 濃い色,かつ,ネットワークの中心に配置される単 語が「重要な単語」と考えられる
  18. 18. Copyright © Jun Iio 18 共起ネットワーク図
  19. 19. Copyright © Jun Iio 19 共起ネットワーク図からわかること ● 優秀作品 – 「私」が中心になっている – 本の話をきっかけに,私の話を展開している様子が 伺える ● 比較対象作品 – 「本」が中心になっている – 本のあらすじ紹介だけではダメ ● 読書感想文の典型的なアンチパターン
  20. 20. Copyright © Jun Iio 20 2群に関する外形的な相違 ● 優秀作品 – 適切な長さの段落に分けられている ● 比較対象作品 – 短い段落(すぐに改行する) ● いやいや書いている? – と思うと,全く段落に分けない(最初から最後まで 1つの段落で終わる)ものも! ● 使われている品詞の分布 – あまり相違はない(統計的に有意差はない)
  21. 21. Copyright © Jun Iio 21 2群に関する外形的な相違
  22. 22. Copyright © Jun Iio 22 作業を通じて明らかになった課題 ● 比較対象作品 … なぜ47作品なのか? – 当初,50作品を電子化した – 3作品に問題が… ● 図書館経由で学校に連絡 ● 学校現場での指導について,改善を期待したい ● 電子化作業の負担 – 小中学生の作品は,手書き – OCR(Optical Character Reader)は利用不可能 – 「よい作文は,字もきれい」だが…
  23. 23. Copyright © Jun Iio 23 対外発表(既報,予定) ● 既報 – 飯尾, "読書感想文コード化の試み," 第37回サイ バーワールド研究会, CW2017-09, pp. 9-12, 沖 縄 石垣, (2017.12). ● 予定 – 図書館情報学会,研究大会(11月) – 中央大学文学部紀要「社会学・社会情報学」 (2019年3月発行号)
  24. 24. Copyright © Jun Iio 24 まとめ ● 図書館利用状況の可視化(ビジュアライゼー ション)に化してシステム化した – プラットフォームが整ったので,今後の展開が容易 – 年齢層ごとの分析などに展開予定 ● 読書感想文の作品について,基本的な傾向の分 析を行った – 優秀作品とC〜D判定の作品を比較した – 頻出単語の分析,共起ネットワーク,段落の長さ – 電子化について今後の課題あり

×