Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

JUBARHYME

10,540 views

Published on

JUBARHYME

Published in: Engineering
  • Be the first to comment

  • Be the first to like this

JUBARHYME

  1. 1. IMAMASU Ryohei Jubatus Hackathon w/ 読売新聞 #2 2016-11-12, 13
  2. 2. 2 韻を踏む [インヲフム]
  3. 3. 3 Jubatus [yu ba ta su] そばかす [so ba ka su]
  4. 4. 4 読売新聞社の膨大な言語データを Jubatusを使って分析し、 共起性の高い言葉を使って韻を踏む
  5. 5. 5 日本シリーズは日ハムが優勝 チャンスで大仕事、中田翔 こんな感じ 単に韻を踏むだけではなくて、関連性 の高い情報を使って韻を踏む 実は、韻を踏むだけのサービス は、意外にたくさん転がってた 単なる単語辞書(コーパス) ではなく、読売新聞さんの記 事だから可能
  6. 6. 将来的なサービスイメージ ヘイ! メ〜ン! 本日のおすすめ記事だぜ! 【速報】アメリカ大統領戦 接戦にセレブも熱視線! 【速報】アメリカ大統領戦 アメリカ大統領選挙が11月8日(現地) に投開票され、APなど現地メディアの報 道によると、 [続きを読む] ニュース配信にアク セントを!
  7. 7. 7 入力: 韻を踏みたい単語 記事データ ①単語に対して類似性 の高い記事を検索 類似度の高い記事 出力: 入力に対して、共起性 が高く、韻を踏んでる単語 ②入力単語に対して、韻 を踏んでる単語を検索 韻を踏むための処理概要
  8. 8. アーキテクチャ(Web AP) 8 Web AP (Python) Flask jubarecommender 記事データ 事前に3年分の 記事を学習類似度の高い記事を問い合わせ Python Client JUMAN++ 記事から単語を抽出、 読み仮名の取得 Embbeded Python jubarecommender 抽出した単語を学習させ、韻を踏む単語を取得 Web Speech API
  9. 9. 9 デモ チェケラ!
  10. 10. 10 • 入力された最後の単語だけで韻を踏むのはなんとなくできたけど、自然 な文章を生成する処理まではできてません • 類似性が高い記事を抽出して、フィルタをかけているので、韻を踏める 単語が不足がち • 「活用度」に対して「度」のような、最後の1文字の部分一致だけが 出てきて悲しい • どの品詞を使うか、類似記事の推薦部分、韻を踏むポイント(語尾、語 頭、真ん中)など、自然言語の部分はチューニングできそう • ラップ難しい 感想・まとめ
  11. 11. 11 •まずは、それっぽい文章を作る •インタフェースをボットにする •掛け合い •曲にのせる 展望

×