upcamp発表

768 views

Published on

Published in: Technology
0 Comments
2 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
768
On SlideShare
0
From Embeds
0
Number of Embeds
18
Actions
Shares
0
Downloads
2
Comments
0
Likes
2
Embeds 0
No embeds

No notes for slide

upcamp発表

  1. 1. Twitterにおける即時話題推定ツール えりっくさーとる @siritori
  2. 2. こんにちは!•  あわてんぼうでマイペースな好奇心の 塊とはわたしのことだ!•  キャンプ経験者•  しりとりとマッサージするのとぬい ぐるみが好き•  つくばの情報科学類
  3. 3. Q.発表って今日ですけど
  4. 4. ※わりとすっかり忘れていた
  5. 5. Q.もしかして、用意してな かったの?
  6. 6. Twitterにおける即時話題推定ツール えりっくさーとる @siritori
  7. 7. Twitter廃人における TL監視支援ツール えりっくさーとる @siritori
  8. 8. Twitter、便利ですよね•  でもフォロー数多いと –  時間が盗まれる –  疲れる•  なんとかしていろんな情報をたくさん入れ たい、ある程度まとまった状態で。•  つぶやきの類似度とかによってTLがまと められたらうれしいなー
  9. 9. 類似度
  10. 10. 「つぶやきに 含まれる単語の概念の近さ」と定義
  11. 11. 大学で仲間を募って研究開始。 Twitterにおける即時話題推定技術の研究
  12. 12. 基本的なアイディア: つぶやき内の特徴語と、その親概念と関連概念をもって きてそのつぶやきの 「特徴」とする。
  13. 13. 具体的におねがいします
  14. 14. Q.親概念とか関連概念ってどうすんの?
  15. 15. A.困ったときのWikipedia
  16. 16. でーたべーすをつくるまで1.  MySQLダンプをダウンロード2.  csv変換3.  Perlちゃんとかで適当にゴミ捨て4.  Erlangのetsテーブルに取り込む
  17. 17. おおまかなしくみ1.  UserStreamでつぶやき取得2.  形態素解析して名詞のみ取り出す3.  名詞の親概念/関連概念を引く4.  ベクトルとして保存5.  ほかのつぶやきと比較、類似度計算 をして可視化
  18. 18. で、どこまでできてるん?
  19. 19. で、どこまでできてるん?○ UserStream取得○ 上位概念と関連概念を取得 ここまで1つぶやきにつき0.3秒くらい○ 可視化アルゴリズムの実装で、こっからさきができてない... 比較アルゴリズムの開発 可視化の表示
  20. 20. と、いうわけで いい機会だし、自然言語処理とか 強い人いたら 知恵ください!
  21. 21. まさに機会学習
  22. 22. ご清聴 ありがとうございました

×