行政コールセンターへの問い合わせデータを対象とした住民の要望分析
- 2. 背景① ¦ 行政の効率化 2
都市・市町村
市役所など
住民の生活状況の把握
政策や支援の改善・立案
住民の声 都市・市町村の状況
データ収集
実施
行政
- 5. 背景① ¦ 行政の効率化 5
都市・市町村
市役所など
住民の生活状況の把握
住民の声 都市・市町村の状況
データ収集
行政
- 6. 背景① ¦ 行政の効率化 6
都市・市町村
市役所など
住民の生活状況の把握
住民の声 都市・市町村の状況
データ収集
政策や支援の改善・立案
行政
- 7. 背景① ¦ 行政の効率化 7
都市・市町村
市役所など
住民の声 都市・市町村の状況
住民の生活状況の把握
政策や支援の改善・立案
データ収集
実施
行政
- 8. 背景① ¦ 行政の効率化 8
都市・市町村
市役所など
住民の生活状況の把握
政策や支援の改善・立案
住民の声 都市・市町村の状況
データ収集
実施
政策・支援の実施
人的/資金的資源の効率的な活用
行政
- 9. 背景① ¦ 行政の効率化 9
都市・市町村
市役所など
住民の生活状況の把握
政策や支援の改善・立案
住民の声 都市・市町村の状況
データ収集
実施
暮らし・生活の改善
行政
政策・支援の実施
人的/資金的資源の効率的な活用
- 10. 背景① ¦ 行政の効率化 10
都市・市町村
市役所など
住民の生活状況の把握
政策や支援の改善・立案
住民の声 都市・市町村の状況
データ収集
実施
行政
- 11. 背景① ¦ 行政の効率化 11
都市・市町村
市役所など
住民の生活状況の把握
政策や支援の改善・立案
住民の声 都市・市町村の状況
データ収集
実施
行政
住民の要望
特に
の把握
- 15. • キーワードの分布から文章の類似度を計算[Mladenic, 99]
• 顧客からの電話をどの担当が受け取るかを判別[Chu-Carroll, 99]
• 重要性が高い語句を抽出し、語句間の関係性をマップとして表示
することで、大量に記述されている概念の構造を視覚化[岡本, 00]
関連研究 ¦ コールセンターのログ解析 15
顧客の声の分析材料として古くから研究に取り組まれている
- 19. グラフィカルモデル 19
トピック 単語
k✓d↵ zd,i wd,i
✓d ⇠ Dir(↵)(d = 1, · · · , D), k ⇠ Dir( )(k = 1, · · · , K)
zd,i ⇠ Multi(✓d), wd,i ⇠ Multi( zd,i
)(i = 1, · · · , nd)
KDnd
- 20. 20
トピック 単語
トピック数
k✓d↵ zd,i wd,i
文章数
✓d ⇠ Dir(↵)(d = 1, · · · , D), k ⇠ Dir( )(k = 1, · · · , K)
zd,i ⇠ Multi(✓d), wd,i ⇠ Multi( zd,i
)(i = 1, · · · , nd)
KDnd
単語数
グラフィカルモデル
- 21. 21
トピック 単語
トピック数
のパラメータ
(K次元ベクトル)
✓d のパラメータ
(V次元ベクトル)
k
k✓d↵ zd,i wd,i
文章数
✓d ⇠ Dir(↵)(d = 1, · · · , D), k ⇠ Dir( )(k = 1, · · · , K)
zd,i ⇠ Multi(✓d), wd,i ⇠ Multi( zd,i
)(i = 1, · · · , nd)
KDnd
文章 における
各トピックの出現分布
d トピック における
単語の生起パラメータ
k
単語数
グラフィカルモデル
- 26. ⑴トピック数:
⑵1件の文章として取り扱う範囲: 1件・1日・1ヶ月・1時間帯
K = {5, 10, 15, 20, 25, 50, 100, 150, 200, 250}
実験① ¦ 条件探索 26
実験条件を変えて最適なトピック数・文章単位を探索
Twitterなど短文をLDAで扱う際に精度を上げるため、複数の文章を1つの文章として扱う[1]
[1] .Wayne Xin Zhao Comparing twitter and traditional media using topic models. In Eu- ropean Conference on Information Retrieval, pp. 338‒349. Springer, 2011.
ツイート
ツイート
ツイート
ツイート
問い合わせから作成したコーパスを用いてLDAで分析
- 27. 結果① ¦ トピック数・1文章の範囲 27
• 1つの文章として扱う範囲• トピック数
トピック数を変えた時のパープレキシティの変化
トピック数を増やすと同じような単語分布のトピックが複数出現
してしまいトピックの推定ができないため,K=10に決定
トピック数: K=10,取り扱い範囲: 1文章を1件とする
- 28. 実験② ¦ トピック推定 28
• 単語分布からトピックを推定して命名
• トピック毎の単語分布をワードクラウドを用いて可視化
実験①で得た条件においてトピック推定を行う
トピック名
推定
- 29. 結果② ¦ 推定されたトピック 29
住居に関する要望
藤沢 転入 本籍
横浜 申請
問い合わせ例:
転入届について教えて下さい。 平塚市から転出してきましたが、転出証明書を
失くしてしまいました。 転入届はできますか。
戸籍謄本の手続きについて教えてください。
出現確率の高い単語:
- 30. 結果② ¦ 推定されたトピック 30
選挙に関する要望
出現確率の高い単語:
投票 整理 選挙
期日 入場
衆議院選挙の期日前投票に行きたいです。 本日から市役所で投票できますか。
問い合わせ例:
投票所入場整理券はいつ届きますか。
- 31. • 9月末が秋の転勤シーズンになるため,10月の引越しは多い
考察① ¦ 住居に関する要望 31
それぞれのトピックに属する問い合わせの件数
住居に関する要望
[2] はこびんの引越しQ&Aサイトより http://xn--qa-083ax49r9s9b.com/post_11.html
引越し業者の繁忙期:3月後半∼4月,夏休み,10月,12月[2]