Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

ストーリーテリング・アルゴリズムの論文紹介と擬似実装(word2vecの応用)

2,194 views

Published on

Storytellingアルゴリズムの紹介と擬似実装(word2vecの応用)
 - もくもくディープラーニング・ハッカソン入賞作品(@ドワンゴ)
  (名づけて、word2vec2word)
 - NLPStudy #4 での発表

Published in: Internet
  • 論文の方は、実はもっと細かいスライドがあります。興味があれば連絡ください。
       Reply 
    Are you sure you want to  Yes  No
    Your message goes here

ストーリーテリング・アルゴリズムの論文紹介と擬似実装(word2vecの応用)

  1. 1. @Zaoriku0 すみません昔の記憶で語ります! 引用数50 NLP勉強会 #4
  2. 2. Storytelling Algorism とは Redescription miningの一般化 (再記載? 再記述? )
  3. 3. Storytelling Algorism とは Redescription mining とは ある表現の再表現セットの組を枚挙的に見つけること 表現A 表現A‘ 類似表現の集合を見つける感じ (再記述? 再表現? )
  4. 4. Storytelling Algorism とは o1,o2,o3,o4 Subset(S) 単語集合的 但し、2進数 単語集合 のイメージ Redescription miningの一般化
  5. 5. Storytelling Algorism とは 入力: S… O{o1,o2,o3,o4…on} Z1, Zx 出力: Z1…Zx(ストーリ) パラメータ: b… 幅 d… 深さ >θ(Z間のjaccard係数) o1,o2,o3,o4 Subset(S) 単語集合的 但し、2進数 単語集合な感じ d b 論理式で結合可 単語集合な感じ
  6. 6. Storytelling Algorism の流れ ①初期化 ②次の表現候補の探索 -Signature Tableを使用しCARTwheel ③最適な候補の決定 -A*サーチ(ヒューリスティック)
  7. 7. Storytelling Algorism の流れ ①初期化 ②次の表現候補の探索 -Signature Tableを使用しCARTwheel ③最適な候補の決定 -A*サーチ(ヒューリスティック) Signature Table
  8. 8. Storytelling Algorism 略
  9. 9. Storytelling Algorism 結果(Gene Set)
  10. 10. Storytelling Algorism 結果2(Gene Set) YGR052Wは、グルコース代謝、栄養制御に係るのでは?
  11. 11. Storytelling Algorism 結果3 (PubMed) 論文のアブスト!
  12. 12. Storytelling Algorism 結果3 (PubMed) ダブリ Stories 時系列にならんだ!
  13. 13. Storytelling Algorism 所感 ・制約付き類似記事の探索 ・時系列抽出はストーリー・マイニングって感じ!
  14. 14. なんちゃって実装 Word2VecでStorytelling やってみた! Word 2 Vec 2 Word (もくもくDeepなんとかハッカソン作品)
  15. 15. ①初期化 ②次の表現候補の探索 ③最適な候補の決定 StoryTellingアルゴリズムのエッセンス!
  16. 16. ①初期化 ②次の表現候補の探索 ③最適な候補の決定 StoryTellingアルゴリズムのエッセンス!
  17. 17. ①初期化 ②次の表現候補の探索 ③最適な候補の決定 StoryTellingアルゴリズムのエッセンス!
  18. 18. ①初期化 ②次の表現候補の探索 ③最適な候補の決定 StoryTellingアルゴリズムのエッセンス!
  19. 19. ①初期化 ②次の表現候補の探索 ③最適な候補の決定 StoryTellingアルゴリズムのエッセンス!
  20. 20. ①初期化 ②次の表現候補の探索 ③最適な候補の決定 StoryTellingアルゴリズムのエッセンス!
  21. 21. ①初期化 ②次の表現候補の探索 ③最適な候補の決定 StoryTellingアルゴリズムのエッセンス!
  22. 22. ①初期化 ②次の表現候補の探索 ③最適な候補の決定 StoryTellingアルゴリズムのエッセンス!
  23. 23. ①初期化 ②次の表現候補の探索 ③最適な候補の決定 StoryTellingアルゴリズムのエッセンス!
  24. 24. StoryTellingアルゴリズムのエッセンス! ①初期化 ②次の表現候補の探索 ③最適な候補の決定 とCOS類似度 とCOS類似度
  25. 25. データ • Yahoo News Top 2階層 • パラメータ • Word2Vec • モデル次元数、window • W2V2W • 探索数、シーケンス数 • 単語遷移順位 • Python2.7 • Gensim
  26. 26. ビジネス ⇒ スポーツ
  27. 27. 日本 ⇒ アメリカ アメリカ ⇒ 日本
  28. 28. 結婚 ⇒ ビジネス ビジネス ⇒ 結婚
  29. 29. 女 ⇒ 男 男 ⇒ 女
  30. 30. •コンテンツ間の間に入るコンテツ •ユーザー間にくるユーザ •左右から探索 •特許情報 応用先の考察 ありがとうございました!

×