Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
Copyright (C) DeNA Co.,Ltd. All Rights Reserved.
Analytics Infra Dept.
System Management Unit
Kazuki Fujikawa
DeNAにおける自然言語...
Copyright (C) DeNA Co.,Ltd. All Rights Reserved.
自己紹介
 藤川和樹
⁃ DeNA システム本部 分析基盤部
 経歴
⁃ 2014. 3. 神戸大学大学院 修了
• 研究分野: 深層学習、自...
Copyright (C) DeNA Co.,Ltd. All Rights Reserved.
AGENDA
 DeNAの事業概要
 DeNAのサービスで行われているレコメンデーションの概要
 レコメンデーション・パーソナライズへの自然...
Copyright (C) DeNA Co.,Ltd. All Rights Reserved.
AGENDA
 DeNAの事業概要
 DeNAのサービスで行われているレコメンデーションの概要
 レコメンデーション・パーソナライズへの自然...
Copyright (C) DeNA Co.,Ltd. All Rights Reserved.
DeNAの事業概要
Eコマース ゲーム
Copyright (C) DeNA Co.,Ltd. All Rights Reserved.
DeNAの事業概要
Eコマース ゲーム
コミュニケーション スポーツ
エンターテインメント
自動車情報ヘルスケア
Copyright (C) DeNA Co.,Ltd. All Rights Reserved.
50億超/Day
数千万人月間のべ利用者数
ユーザアクション
Copyright (C) DeNA Co.,Ltd. All Rights Reserved.
体験提供
行動・ソーシャル情報を活用し
ユーザーひとりひとりそれぞれの興味・つながりにあった
適切な情報・サービスの提供
数千万人ひとりひとりに対...
Copyright (C) DeNA Co.,Ltd. All Rights Reserved.
パーソナライズ・レコメンデーション
×
自然言語処理
Copyright (C) DeNA Co.,Ltd. All Rights Reserved.
AGENDA
 DeNAの事業概要
 DeNAのサービスで行われているレコメンデーションの概要
 レコメンデーション・パーソナライズへの自然...
Copyright (C) DeNA Co.,Ltd. All Rights Reserved.
ユーザーひとりひとりに対する適切な情報・サービス提供
SOCIAL
芸能News
スポーツNews
▶ Play
✔ Read
興味A
興味B
I...
Copyright (C) DeNA Co.,Ltd. All Rights Reserved.
レコメンデーション例
SOCIAL
芸能News
スポーツNews
▶ Play
✔ Read
興味A
興味B
INTEREST
☆ Like
A...
Copyright (C) DeNA Co.,Ltd. All Rights Reserved.
レコメンデーション例
SOCIAL
芸能News
スポーツNews
▶ Play
✔ Read
興味A
興味B
PF
Activity
Game
...
Copyright (C) DeNA Co.,Ltd. All Rights Reserved.
レコメンデーション例
SOCIAL
芸能News
スポーツNews
▶ Play
✔ Read
興味A
興味B
PF
Activity
Game
...
Copyright (C) DeNA Co.,Ltd. All Rights Reserved.
ユーザーの興味、同じ興味を持つ人の行動パターンを利用した
レコメンデーション
News1
News2
News3
News4
パーソナル興味
興味...
Copyright (C) DeNA Co.,Ltd. All Rights Reserved.
ユーザーの行動履歴を基に、ユーザーの興味ワードを抽出する
News1
News2
News3
News4
パーソナル興味
興味→行動 確率パターン...
Copyright (C) DeNA Co.,Ltd. All Rights Reserved.
ユーザーの行動履歴を基に、ユーザーの興味ワードを抽出する
News1
News2
News3
News4
パーソナル興味
興味→行動 確率パターン...
Copyright (C) DeNA Co.,Ltd. All Rights Reserved.
ユーザーの興味、同じ興味を持つ人の行動パターンを利用した
レコメンデーション
News1
News2
News3
News4
パーソナル興味
興味...
Copyright (C) DeNA Co.,Ltd. All Rights Reserved.
興味ワードを持つ人の行動パターンからコンテンツを推薦する
News1
News2
News3
News4
パーソナル興味
興味→行動 確率パターン...
Copyright (C) DeNA Co.,Ltd. All Rights Reserved.
興味ワードを持つ人の行動パターンからコンテンツを推薦する
News1
News2
News3
News4
パーソナル興味
興味→行動 確率パターン...
Copyright (C) DeNA Co.,Ltd. All Rights Reserved.
実際にユーザーに提示した反応を興味に反映する
News1
News2
News3
News4
パーソナル興味
興味→行動 確率パターン
NEWS ...
Copyright (C) DeNA Co.,Ltd. All Rights Reserved.
ユーザーの興味、同じ興味を持つ人の行動パターンを利用した
レコメンデーション
News1
News2
News3
News4
パーソナル興味
興味...
Copyright (C) DeNA Co.,Ltd. All Rights Reserved.
AGENDA
 DeNAの事業概要
 DeNAのサービスで行われているレコメンデーションの概要
 レコメンデーション・パーソナライズへの自然...
Copyright (C) DeNA Co.,Ltd. All Rights Reserved.
ユーザーの興味、同じ興味を持つ人の行動パターンを利用した
レコメンデーション
News1
News2
News3
News4
パーソナル興味
興味...
Copyright (C) DeNA Co.,Ltd. All Rights Reserved.
暁美ほむら
平沢 唯
分散表現での概念レベルでの興味計算の挑戦
パーソナル興味
興味→行動 確率パターン
NEWS A 閲覧 ✔
暁美ほむら
綾波...
Copyright (C) DeNA Co.,Ltd. All Rights Reserved.
AGENDA
 DeNAの事業概要
 DeNAのサービスで行われているレコメンデーションの概要
 レコメンデーション・パーソナライズへの自然...
Copyright (C) DeNA Co.,Ltd. All Rights Reserved.
分散表現での概念レベルでの興味計算の挑戦
 単語の分散表現
⁃ CBOW、 Skip Gram
⁃ 実装例:Word2Vec(Mikolov+ ...
Copyright (C) DeNA Co.,Ltd. All Rights Reserved.
Word2Vec(Skip gram)
the oncat the couch
sat
distributed representation
W1...
Copyright (C) DeNA Co.,Ltd. All Rights Reserved.
Paragraph Vector(Distributed Bag-of-Words)
the oncat the couch
paragraph ...
Copyright (C) DeNA Co.,Ltd. All Rights Reserved.
Paragraph Vector の 分散実装 with Spark
 Sparkで Paragraph Vector を新規に実装
⁃ MlL...
Copyright (C) DeNA Co.,Ltd. All Rights Reserved.
Paragraph Vector を用いた類似記事算出
 WordVector演算 + ParagraphVector 類似記事算出
⁃ 「香川...
Copyright (C) DeNA Co.,Ltd. All Rights Reserved.
Paragraph Vector を用いた類似記事算出
 ParagraphVector 類似記事算出
⁃ 「本田所属のミラン、香川の同僚FWイ...
Copyright (C) DeNA Co.,Ltd. All Rights Reserved.
Paragraph Vector を活用したパーソナルレコメンド案(仮)
the oncat the couch
user id
distribu...
Copyright (C) DeNA Co.,Ltd. All Rights Reserved.
Paragraph Vector を活用したパーソナルレコメンド案(仮)
本田所属のミラン、
香川の同僚FWイ
ンモービレ獲得へ
長友、インテル残...
Copyright (C) DeNA Co.,Ltd. All Rights Reserved.
DeNAについて
 大規模なデータ
⁃ 数千万ユーザー / 月、50億アクション / 日 規模の膨大なデータ
 環境
⁃ ゲーム・サービス間で...
Upcoming SlideShare
Loading in …5
×

DeNAにおける自然言語処理活用

4,900 views

Published on

NLP若手の会 (YANS) 第10回シンポジウム (2015年) での講演資料

Published in: Data & Analytics
  • Be the first to comment

DeNAにおける自然言語処理活用

  1. 1. Copyright (C) DeNA Co.,Ltd. All Rights Reserved. Analytics Infra Dept. System Management Unit Kazuki Fujikawa DeNAにおける自然言語処理活用 2015/9/4, YANS 2015
  2. 2. Copyright (C) DeNA Co.,Ltd. All Rights Reserved. 自己紹介  藤川和樹 ⁃ DeNA システム本部 分析基盤部  経歴 ⁃ 2014. 3. 神戸大学大学院 修了 • 研究分野: 深層学習、自然言語処理 テーマ: 深層学習による複数文書の圧縮表現の獲得と株価動向推定への応用 ⁃ 2014. 4. 新卒でDeNAへ入社 • ソーシャルゲームの各種課題分析、それに伴うデータ基盤の整備 • mobageプラットフォーム・キュレーションサービスにおける パーソナライズ・レコメンドシステムの開発
  3. 3. Copyright (C) DeNA Co.,Ltd. All Rights Reserved. AGENDA  DeNAの事業概要  DeNAのサービスで行われているレコメンデーションの概要  レコメンデーション・パーソナライズへの自然言語処理活用の重要性  記事の分散表現とサービスへの活用方法の検討
  4. 4. Copyright (C) DeNA Co.,Ltd. All Rights Reserved. AGENDA  DeNAの事業概要  DeNAのサービスで行われているレコメンデーションの概要  レコメンデーション・パーソナライズへの自然言語処理活用の重要性  記事の分散表現とサービスへの活用方法の検討
  5. 5. Copyright (C) DeNA Co.,Ltd. All Rights Reserved. DeNAの事業概要 Eコマース ゲーム
  6. 6. Copyright (C) DeNA Co.,Ltd. All Rights Reserved. DeNAの事業概要 Eコマース ゲーム コミュニケーション スポーツ エンターテインメント 自動車情報ヘルスケア
  7. 7. Copyright (C) DeNA Co.,Ltd. All Rights Reserved. 50億超/Day 数千万人月間のべ利用者数 ユーザアクション
  8. 8. Copyright (C) DeNA Co.,Ltd. All Rights Reserved. 体験提供 行動・ソーシャル情報を活用し ユーザーひとりひとりそれぞれの興味・つながりにあった 適切な情報・サービスの提供 数千万人ひとりひとりに対して、適切な情報・サービス提供 Social Graph Data Mining Machine Learning ClusteringPatternMining Classification Regression Recommendation of Fun Social Experience TimeSeriesAnalysis StatisticalAnalysis Detailed Actions Social Communications Changes of Status NaturalLanguageProcessing ..etc Personality ..etc
  9. 9. Copyright (C) DeNA Co.,Ltd. All Rights Reserved. パーソナライズ・レコメンデーション × 自然言語処理
  10. 10. Copyright (C) DeNA Co.,Ltd. All Rights Reserved. AGENDA  DeNAの事業概要  DeNAのサービスで行われているレコメンデーションの概要  レコメンデーション・パーソナライズへの自然言語処理活用の重要性  記事の分散表現とサービスへの活用方法の検討
  11. 11. Copyright (C) DeNA Co.,Ltd. All Rights Reserved. ユーザーひとりひとりに対する適切な情報・サービス提供 SOCIAL 芸能News スポーツNews ▶ Play ✔ Read 興味A 興味B INTEREST ☆ Like ACTION  興味 × ソーシャル × 行動パターン を基にユーザーをモデリングし、 興味に合う・興味を広げる コンテンツを提供する
  12. 12. Copyright (C) DeNA Co.,Ltd. All Rights Reserved. レコメンデーション例 SOCIAL 芸能News スポーツNews ▶ Play ✔ Read 興味A 興味B INTEREST ☆ Like ACTION  親しい友人の最近の興味を知ることで、自分の興味を広げることが できる Social PF Friend Game Friend Game Communication FriendCommunication PF Communication User Impression User Click n ムに出会え、親しい仲間と複数ゲームを楽しめる 親しいユーザと 一緒に楽しめる ) 親しいユーザが楽しんでいる ゲームに出会う機会を提供する (親しいユーザ軸でのゲームとの出会い) 親しいユーザが 増える 興味があうユーザと 出会い・親しくなれる 機会を提供する (友 達推薦・コミュニケー ション推薦、等) Familiarities SANTOS ( Social- Activity NeTwork Optimization System)
  13. 13. Copyright (C) DeNA Co.,Ltd. All Rights Reserved. レコメンデーション例 SOCIAL 芸能News スポーツNews ▶ Play ✔ Read 興味A 興味B PF Activity Game Activity Game Impression Game Click Game Install AttentionActivity 興味にあったゲーム 興味にあったゲームを 楽しめる Interests 興味にあった ゲームに出会う機会提供する (興味軸でのゲームとの出会い) BARCA ( BAyesian network ReCommendation Algorithm) 体験提供 INTEREST ☆ Like ACTION  自分と同じ興味を持つ人の行動パターンから、ユーザーに適した コンテンツを推薦する
  14. 14. Copyright (C) DeNA Co.,Ltd. All Rights Reserved. レコメンデーション例 SOCIAL 芸能News スポーツNews ▶ Play ✔ Read 興味A 興味B PF Activity Game Activity Game Impression Game Click Game Install AttentionActivity 興味にあったゲーム 興味にあったゲームを 楽しめる Interests 興味にあった ゲームに出会う機会提供する (興味軸でのゲームとの出会い) BARCA ( BAyesian network ReCommendation Algorithm) 体験提供 INTEREST ☆ Like ACTION  自分と同じ興味を持つ人の行動パターンから、ユーザーに適した コンテンツを推薦する
  15. 15. Copyright (C) DeNA Co.,Ltd. All Rights Reserved. ユーザーの興味、同じ興味を持つ人の行動パターンを利用した レコメンデーション News1 News2 News3 News4 パーソナル興味 興味→行動 確率パターン NEWS A 閲覧 ✔ 暁美ほむら 綾波レイ 興味ワード記事の閲覧 行動興味ワード・概念 Final Fantasy RK プレイ ▶ 七つの大罪 インストール⇓ アイマス プレイ ▶ キングダム インストール⇓ 平沢 唯 綾波レイ NEWS B お気に入り☆ 暁美ほむら 平沢 唯 提示 反応 興味 クリックC 表示A インストール D 表示B 表示C 表示D クリックD 反応強化学習
  16. 16. Copyright (C) DeNA Co.,Ltd. All Rights Reserved. ユーザーの行動履歴を基に、ユーザーの興味ワードを抽出する News1 News2 News3 News4 パーソナル興味 興味→行動 確率パターン NEWS A 閲覧 ✔ 記事の閲覧 行動興味ワード・概念 Final Fantasy RK プレイ ▶ 七つの大罪 インストール⇓ アイマス プレイ ▶ キングダム インストール⇓ 綾波レイ NEWS B お気に入り☆ 暁美ほむら 平沢 唯
  17. 17. Copyright (C) DeNA Co.,Ltd. All Rights Reserved. ユーザーの行動履歴を基に、ユーザーの興味ワードを抽出する News1 News2 News3 News4 パーソナル興味 興味→行動 確率パターン NEWS A 閲覧 ✔ 暁美ほむら 綾波レイ 興味ワード記事の閲覧 行動興味ワード・概念 Final Fantasy RK プレイ ▶ 七つの大罪 インストール⇓ アイマス プレイ ▶ キングダム インストール⇓ 平沢 唯 綾波レイ NEWS B お気に入り☆ 暁美ほむら 平沢 唯
  18. 18. Copyright (C) DeNA Co.,Ltd. All Rights Reserved. ユーザーの興味、同じ興味を持つ人の行動パターンを利用した レコメンデーション News1 News2 News3 News4 パーソナル興味 興味→行動 確率パターン NEWS A 閲覧 ✔ 暁美ほむら 綾波レイ 興味ワード記事の閲覧 行動興味ワード・概念 Final Fantasy RK プレイ ▶ 七つの大罪 インストール⇓ アイマス プレイ ▶ キングダム インストール⇓ 平沢 唯 綾波レイ NEWS B お気に入り☆ 暁美ほむら 平沢 唯 UserDoc - TF-IDF 表示ページ・箇所のバイアスを除くため ユーザごとに累積閲覧テキストをDocsとみなし ユーザ間の閲覧語の差異を見る。 “UserDoc”: 対象ユーザが閲覧・評価した累積テキスト “TF”: ユーザーが閲覧・評価した記事中に該当単語が出現した頻度 “DF”: 累積閲覧・評価テキスト中に該当単語が含まれていたユーザー数
  19. 19. Copyright (C) DeNA Co.,Ltd. All Rights Reserved. 興味ワードを持つ人の行動パターンからコンテンツを推薦する News1 News2 News3 News4 パーソナル興味 興味→行動 確率パターン 暁美ほむら 綾波レイ 興味ワード記事の閲覧 興味ワード・概念 平沢 唯 綾波レイ 暁美ほむら 平沢 唯
  20. 20. Copyright (C) DeNA Co.,Ltd. All Rights Reserved. 興味ワードを持つ人の行動パターンからコンテンツを推薦する News1 News2 News3 News4 パーソナル興味 興味→行動 確率パターン NEWS A 閲覧 ✔ 暁美ほむら 綾波レイ 興味ワード記事の閲覧 行動興味ワード・概念 Final Fantasy RK プレイ ▶ 七つの大罪 インストール⇓ アイマス プレイ ▶ キングダム インストール⇓ 平沢 唯 綾波レイ NEWS B お気に入り☆ 興味ワード・概念・行動の ベイジアンネットワーク P(NewsA Read|綾波レイ) P(七つの大罪インストール |NewsA 閲覧) 暁美ほむら 平沢 唯
  21. 21. Copyright (C) DeNA Co.,Ltd. All Rights Reserved. 実際にユーザーに提示した反応を興味に反映する News1 News2 News3 News4 パーソナル興味 興味→行動 確率パターン NEWS A 閲覧 ✔ 暁美ほむら 綾波レイ 興味ワード記事の閲覧 行動興味ワード・概念 Final Fantasy RK プレイ ▶ 七つの大罪 インストール⇓ アイマス プレイ ▶ キングダム インストール⇓ 平沢 唯 綾波レイ NEWS B お気に入り☆ 提示 反応 興味 クリックC 表示A インストール D 表示B 表示C 表示D クリックD 反応強化学習 暁美ほむら 平沢 唯 ユーザーに提示した反応に関する 強化学習
  22. 22. Copyright (C) DeNA Co.,Ltd. All Rights Reserved. ユーザーの興味、同じ興味を持つ人の行動パターンを利用した レコメンデーション News1 News2 News3 News4 パーソナル興味 興味→行動 確率パターン NEWS A 閲覧 ✔ 暁美ほむら 綾波レイ 興味ワード記事の閲覧 行動興味ワード・概念 Final Fantasy RK プレイ ▶ 七つの大罪 インストール⇓ アイマス プレイ ▶ キングダム インストール⇓ 平沢 唯 綾波レイ NEWS B お気に入り☆ 提示 反応 興味 クリックC 表示A インストール D 表示B 表示C 表示D クリックD 反応強化学習 暁美ほむら 平沢 唯
  23. 23. Copyright (C) DeNA Co.,Ltd. All Rights Reserved. AGENDA  DeNAの事業概要  DeNAのサービスで行われているレコメンデーションの概要  レコメンデーション・パーソナライズへの自然言語処理活用の重要性  記事の分散表現とサービスへの活用方法の検討
  24. 24. Copyright (C) DeNA Co.,Ltd. All Rights Reserved. ユーザーの興味、同じ興味を持つ人の行動パターンを利用した レコメンデーション News1 News2 News3 News4 パーソナル興味 興味→行動 確率パターン NEWS A 閲覧 ✔ 暁美ほむら 綾波レイ 興味ワード記事の閲覧 行動興味ワード・概念 Final Fantasy RK プレイ ▶ 七つの大罪 インストール⇓ アイマス プレイ ▶ キングダム インストール⇓ 平沢 唯 綾波レイ NEWS B お気に入り☆ 提示 反応 興味 クリックC 表示A インストール D 表示B 表示C 表示D クリックD 反応強化学習 暁美ほむら 平沢 唯 各記事の特徴や、ユーザーの興味特徴を 的確に表現することは重要
  25. 25. Copyright (C) DeNA Co.,Ltd. All Rights Reserved. 暁美ほむら 平沢 唯 分散表現での概念レベルでの興味計算の挑戦 パーソナル興味 興味→行動 確率パターン NEWS A 閲覧 ✔ 暁美ほむら 綾波レイ 興味ワード 行動興味ワード・概念 Final Fantasy RK プレイ ▶ 七つの大罪 インストール⇓ アイマス プレイ ▶ キングダム インストール⇓ 平沢 唯 綾波レイ NEWS B お気に入り☆ 提示 反応 興味 クリックC 表示A インストール D 表示B 表示C 表示D クリックD 反応強化学習 まどマギ けいおん!エヴァ 興味概念 News1 News2 News3 News4 記事の閲覧
  26. 26. Copyright (C) DeNA Co.,Ltd. All Rights Reserved. AGENDA  DeNAの事業概要  DeNAのサービスで行われているレコメンデーションの概要  レコメンデーション・パーソナライズへの自然言語処理活用の重要性  記事の分散表現とサービスへの活用方法の検討
  27. 27. Copyright (C) DeNA Co.,Ltd. All Rights Reserved. 分散表現での概念レベルでの興味計算の挑戦  単語の分散表現 ⁃ CBOW、 Skip Gram ⁃ 実装例:Word2Vec(Mikolov+ 2013) ⁃ 単語の分散表現 ⁃ 単語を密ベクトルで表現 ⁃ 似た単語はベクトル空間上で近くに配置される • 同義語を考慮できる ⁃ 意味の演算が可能 • 日本 + 東京 – フランス = パリ など  文書の分散表現 ⁃ 実装例:Paragraph Vector(Le+ 2014)など ⁃ 文書への分散表現拡張
  28. 28. Copyright (C) DeNA Co.,Ltd. All Rights Reserved. Word2Vec(Skip gram) the oncat the couch sat distributed representation W1 W0  各単語の前後数単語の出現確率が高くなるよう、NNを学習させる ⁃ 目的関数:  中間層の出力をその単語の特徴とする mber of phrases using a data-driven approach, and then we treat the phrases as individual tokens ng the training. To evaluate the quality of the phrase vectors, we developed a test set of analogi- reasoning tasks that contains both words and phrases. A typical analogy pair from our test set is ontreal”:“Montreal Canadiens”::“Toronto”:“Toronto Maple Leafs”. It is considered to have been wered correctly if the nearest representation to vec(“Montreal Canadiens”) - vec(“Montreal”) + (“Toronto”) is vec(“Toronto Maple Leafs”). ally, we describe another interesting property of the Skip-gram model. We found that simple tor addition can often produce meaningful results. For example, vec(“Russia”) + vec(“river”) is e to vec(“Volga River”), and vec(“Germany”) + vec(“capital”) is close to vec(“Berlin”). This mpositionality suggests that a non-obvious degree of language understanding can be obtained by ng basic mathematical operations on the word vector representations. The Skip-gram Model training objective of the Skip-gram model is to find word representations that are useful for dicting the surrounding words in a sentence or a document. More formally, given a sequence of ning words w1, w2, w3, . . . , wT , the objective of the Skip-gram model is to maximize the average probability 1 T T t = 1 − c≤ j ≤ c,j ̸= 0 logp(wt + j |wt ) (1) ere c is the size of the training context (which can be a function of the center word wt ). Larger sults in more training examples and thus can lead to a higher accuracy, at the expense of the
  29. 29. Copyright (C) DeNA Co.,Ltd. All Rights Reserved. Paragraph Vector(Distributed Bag-of-Words) the oncat the couch paragraph id distributed representation W1 W0  Word2Vec で単語を学習させる際に、paragraph idも入力に含めて Skip gram学習させる  パラグラフに共起する単語特徴に関する分散表現を獲得することが できる sat
  30. 30. Copyright (C) DeNA Co.,Ltd. All Rights Reserved. Paragraph Vector の 分散実装 with Spark  Sparkで Paragraph Vector を新規に実装 ⁃ MlLibにはWord2Vector実装しか無かった ⁃ Spark • オープンソースのデータ分析クラスタ計算フレームワーク • 可能な限りインメモリで計算を行うことでデータ処理を高速に実行可能 ⁃ Word2Vec / Paragraph Vector 算出の分散処理 • Word2Vec / Paragraph Vector 学習は計算コストが大きいので、 計算高速化が必要 • 社内のデータ・サーバ資源を最大限活用したい ⁃ サービスの分析に必要なデータは社内HDFSに格納されているため、 大きなデータを用いる計算はHDFS上で行いたい
  31. 31. Copyright (C) DeNA Co.,Ltd. All Rights Reserved. Paragraph Vector を用いた類似記事算出  WordVector演算 + ParagraphVector 類似記事算出 ⁃ 「香川」に近い記事 • 香川所属のドルト、今夏も主力選手が退団へ…CEO「今年は2人」 • 香川所属のドルト、クロップ監督が今季末の退任を希望か…独 • ドルト香川、凱旋マッチで2ゴール! 丸岡弾も飛び出し川崎 ⁃ 「香川 + うどん」に近い記事 • “うどん県”は香川だけじゃない!?-讃岐うどんVSご当地うどんの • 香川でも最高クラスのうどんを東京で-日本橋三越『日本の“麺 • 丸亀製麺、うどんの本場・香川県で挫折? 路面1号店が撤退…
  32. 32. Copyright (C) DeNA Co.,Ltd. All Rights Reserved. Paragraph Vector を用いた類似記事算出  ParagraphVector 類似記事算出 ⁃ 「本田所属のミラン、香川の同僚FWインモービレ獲得へ 」 に近い記事 • ミラン本田の同僚エッシェン、英で保有する約1360万円の車が… • 本田所属のミラン、インザーギ監督の解任を発表…名門再建なるか… • 本田と長友がミラノダービーで先発…メクセスの豪快ボレー弾 ⁃ 「長友、インテル残留を熱望「こんなにいいチームは他にない」」 に近い記事 • 長友所属のインテル、主将の伊代表DFラノッキアと2019年まで契約 • 長友所属のインテル、コロンビア代表DFムリージョの獲得を発表 • 本田と長友がミラノダービーで先発…メクセスの豪快ボレー弾
  33. 33. Copyright (C) DeNA Co.,Ltd. All Rights Reserved. Paragraph Vector を活用したパーソナルレコメンド案(仮) the oncat the couch user id distributed representation W1 W0  Word2Vec で単語を学習させる際に、user id、ユーザーが閲覧した 累積テキストを入力し、Paragraph Vector 学習させる → うまくいかなかった  トピックが雑多に含まれるパラグラフを学習させようとすると、興味 方向の尖りが無くなり、全トピックに対して曖昧なベクトルになる sat
  34. 34. Copyright (C) DeNA Co.,Ltd. All Rights Reserved. Paragraph Vector を活用したパーソナルレコメンド案(仮) 本田所属のミラン、 香川の同僚FWイ ンモービレ獲得へ 長友、インテル残 留を熱望「こんな にいいチームは他 にない」 +1 +5 ミラン本田の同僚 エッシェン、英で 保有する約1360 万円の車が… 本田と長友がミラ ノダービーで先発 …メクセスの豪快 ボレー弾 長友所属のインテ ル、主将の伊代表 DFラノッキアと 2019年まで契約 本田と長友がミラ ノダービーで先発 …メクセスの豪快 ボレー弾 0.87 0.72 0.77 0.71 本田と長友がミラ ノダービーで先発 …メクセスの豪快 ボレー弾 ミラン本田の同僚 エッシェン、英で 保有する約1360 万円の車が… 長友所属のインテ ル、主将の伊代表 DFラノッキアと 2019年まで契約 4.27 0.87 3.85
  35. 35. Copyright (C) DeNA Co.,Ltd. All Rights Reserved. DeNAについて  大規模なデータ ⁃ 数千万ユーザー / 月、50億アクション / 日 規模の膨大なデータ  環境 ⁃ ゲーム・サービス間でログデータが整備されており、機械学習や データマイニングに集中しやすい環境 ⁃ 新しい技術導入の機会も多く、挑戦しやすい環境 DeNAでは、自然言語処理を活用した体験提供に挑戦する 仲間を募集しています!

×