Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

かまってちゃん小町

10,599 views

Published on

かまってちゃん小町

Published in: Engineering
  • Be the first to comment

  • Be the first to like this

かまってちゃん小町

  1. 1. かまってちゃん小町 じょんすみす
  2. 2. ダレダヨ • じょんすみす • @__john_smith__ • どこにでもいる普通のアル中 • Jubatusぬいぐるみ3つ所持 • 今回で4つ目 • コレクションしてるわけではない これ→
  3. 3. ハイケイ • 発言小町に投稿したからにはレスがほしいよね? • ほしいよね? • でもレス数は少ない方に偏ってるよ
  4. 4. カイケツ • なんとかしよう • レスが稼げる文章に修正すればいいんじゃね? • じゃあどんなのならレス稼げんよの?
  5. 5. カイケツ • なんとかしよう • レスが稼げる文章に修正すればいいんじゃね? • じゃあどんなのならレス稼げんよの? Jubatusの出番だ!! ※強引な展開
  6. 6. ナイヨウ • 学習 1. タイトルと発言内容のBoWを作る 2. BoWをFeatureにしてレス数をRegressionのモデル作成 3. タイトルと発言内容のWord2Vecのモデル作成 • 予測 1. JubadumpでモデルのWeightを取り出す 2. 文章からWeightがマイナスの項目を取得 3. マイナスの項目の類義語をWord2Vecから取得 4. 類義語からWeightがプラスになるもを置き換え候補として提示
  7. 7. ナイヨウ • 今回やったことの特徴 • なんとJubatusは学習には使うが予測には使っていない! • できていないこと • モデルの性能評価
  8. 8. ナイヨウ デモ
  9. 9. ケツロン • Jubadumpつらい • 1.0.0のRegressionでは使えなかった • https://github.com/jubatus/jubadump/issues/40 • なので、今回の対応バージョンは0.9.4以下 • Pythonつらい • 適当に書いてたスクリプト名がライブラリとバッティング • import中になぜか変なファイル読もうしてエラー出てる。。 • 機械学習つらい • うまくいくかいかないかわかんな • ハッカソンだと一発勝負なとこあるよね • 時間があれば • seq2seqで予想されるコメントとか出したかったけど明らかに時間足りないw
  10. 10. かまってちゃん小町 じょんすみす

×