特定の不快感を与えるツイートの 
分類と自動生成について 
(エクシング言語処理APIハッカソン) 
加藤公一 
@hamukazu 
2014年10月18日 
1 / 8
自己紹介 
どうも!ノーブラヒートテックの人です! 
2 / 8
クソリプ公害 
近年のツイッターはクソリプにあふれている 
健全なツイ廃ツイッター生活に影響を及ぼし始めている 
3 / 8
クソリプとは 
(Naverまとめより抜粋) 
クソ+リプライの略。 リプライ(reply)は返信という意味 要は『クソな返信』、 
『つまらない返信』という意味 
その意味も、文字通り「つまらないツイートを相手に送りつけること」であり、誰 
もが気軽にコミュニケーションを取れるツールであるTwitterの使いやすさが却っ 
て災いとなって、相手のメンションやタイムラインにイラッと来るような発言が並 
んでしまう現象です。 
4 / 8
そこでソリューション 
まずは敵を知ることから:クソリプ判定器 
毒をもって毒を制す:クソリプ生成器 
5 / 8
実装に先立って 
クソリプ約5000件を収集(ハッシュタグ「#クソリプ」による) 
機械学習アルゴリズムを使って学習(エクシングさんのAPIを使わせてもらい 
ました) 
6 / 8
デモ 
7 / 8
テクノロジー 
プログラミング言語:Python 
Twitterライブラリ:tweepy 
ウェブアプリフレームワーク:bottle 
データの収集:Couch 
アルゴリズム: 
判定器:ナイーブベイズモデル 
生成器:マルコフ連鎖モデル 
8 / 8

特定の不快感を与えるツイートの分類と自動生成について