IMAMASU Ryohei
Jubatus Hackathon w/ 読売新聞 #2
2016-11-12, 13
2
韻を踏む
[インヲフム]
3
Jubatus
[yu ba ta su]
そばかす
[so ba ka su]
4
読売新聞社の膨大な言語データを
Jubatusを使って分析し、
共起性の高い言葉を使って韻を踏む
5
日本シリーズは日ハムが優勝
チャンスで大仕事、中田翔
こんな感じ
単に韻を踏むだけではなくて、関連性
の高い情報を使って韻を踏む
実は、韻を踏むだけのサービス
は、意外にたくさん転がってた
単なる単語辞書(コーパス)
ではなく、読売新聞さんの記
事だから可能
将来的なサービスイメージ
ヘイ! メ〜ン! 本日のおすすめ記事だぜ!
【速報】アメリカ大統領戦 接戦にセレブも熱視線!
【速報】アメリカ大統領戦
アメリカ大統領選挙が11月8日(現地)
に投開票され、APなど現地メディアの報
道によると、 [続きを読む]
ニュース配信にアク
セントを!
7
入力: 韻を踏みたい単語
記事データ
①単語に対して類似性
の高い記事を検索
類似度の高い記事
出力: 入力に対して、共起性
が高く、韻を踏んでる単語
②入力単語に対して、韻
を踏んでる単語を検索
韻を踏むための処理概要
アーキテクチャ(Web AP)
8
Web AP
(Python)
Flask
jubarecommender
記事データ
事前に3年分の
記事を学習類似度の高い記事を問い合わせ
Python
Client
JUMAN++
記事から単語を抽出、
読み仮名の取得
Embbeded
Python
jubarecommender
抽出した単語を学習させ、韻を踏む単語を取得
Web
Speech
API
9
デモ
チェケラ!
10
• 入力された最後の単語だけで韻を踏むのはなんとなくできたけど、自然
な文章を生成する処理まではできてません
• 類似性が高い記事を抽出して、フィルタをかけているので、韻を踏める
単語が不足がち
• 「活用度」に対して「度」のような、最後の1文字の部分一致だけが
出てきて悲しい
• どの品詞を使うか、類似記事の推薦部分、韻を踏むポイント(語尾、語
頭、真ん中)など、自然言語の部分はチューニングできそう
• ラップ難しい
感想・まとめ
11
•まずは、それっぽい文章を作る
•インタフェースをボットにする
•掛け合い
•曲にのせる
展望

JUBARHYME