自己紹介
• 五十嵐 祐貴 ( @bonprosoft )
• Microsoft MVPfor Visual Studio and Development Technologies
• Microsoft Student Partners Fellow
• サトヤ仙台 代表
• 他
o 東北大学工学部電気情報工学科 4年(4月から)
66
職業分析・性別分析における入力
• 入力に用いる素性(特徴)は非常に重要
o Bag of Words 単語をそのまま入れる
o Polarity classifier ポジティブ・ネガティブなどの分析結果
など…
• その重み(特徴量)も重要
o 含まれていた数(各要素の値は1)
o Tf-Idf(トピック依存度)やPMI(共起頻度)を考慮したスコア
• ↑を自動で獲得する仕組みとしてword2vecが提案
o 業界全体がかなり注目