Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

コンテンツの人気度を考慮したN次創作活動のモデル化

957 views

Published on

WebDB Forum 2016

Published in: Technology
  • Be the first to comment

コンテンツの人気度を考慮したN次創作活動のモデル化

  1. 1. 佃 洸摂 濱崎 雅弘 後藤 真孝 産業技術総合研究所
  2. 2. 2User Generated Content Web 歌声合成ソフトを用いた楽曲動画 sm15630734 3Dソフトを用いた3Dデータ thing:398548 thing:703847 thing:257911 thing:193647 sm1097445 sm17720979 sm23750267 ニコニコ動画 Thingiverse
  3. 3. 3二次創作 ニコニコ動画 Thingiverse sm15630734 thing:398548 歌う 踊る 演奏 sm17483164 sm16309076sm18407945 段の幅を広く 仕切りを細かく thing:1541729thing:1481404
  4. 4. 4N次創作 sm15630734 sm17703100 sm16066609 sm16094094 sm24854396 sm16394955 … … … … … … … 一次創作 二次創作 三次創作 VOCALOID 14 61
  5. 5. 5N次創作を引き起こす要因 Web オリジナル メロディが好きだから この曲を歌ってみよう 要因例1︓ 要因例2︓ オリジナル 人気の曲だから この曲を歌ってみよう コンテンツ自体の コンテンツの
  6. 6. 6要因を推定する意義 コンテンツの特徴を重視するクリエータには過去の使用コンテンツと類似のものを推薦 踊りの派生コンテンツに関するカテゴリではコンテンツの人気の影響が大きい N クリエータ目線でのランキングを生成しクリエータの創作活動を支援
  7. 7. 8派生創作の要因1︓オリジナルコンテンツの魅⼒ – 魅⼒の影響の大きさはコンテンツによって異なる – 魅⼒から受ける影響はクリエータによって異なる – 魅⼒の影響の大きさは時間によらず一定 『初音ミク』千本桜『オリジナル曲PV』 オリジナル曲「千本桜」の メロディが好きだから 歌ってみよう! オリジナル曲「千本桜」の 歌詞が好きだから 歌ってみよう!
  8. 8. 9派生創作の要因1︓オリジナルコンテンツの魅⼒ – 魅⼒の影響の大きさはコンテンツによって異なる︓ – 魅⼒から受ける影響はクリエータによって異なる︓ – 魅⼒の影響の大きさは時間によらず一定
  9. 9. 10派生創作の要因2︓オリジナルコンテンツの人気 – 人気の影響の大きさはコンテンツによって異なる︓ – 人気から受ける影響はクリエータによって異なる︓ – 人気の影響の大きさは時間の経過と共に減衰︓ – ランキングが上位のコンテンツほど影響が大きい︓ オリジナル曲再生数ランキング 1 2 3 4 『初音ミク』千本桜 『オリジナル曲PV』 【GUMI(40㍍)】 ヤクソクの種【オリ ジナル】 GUMIオリジナル曲 「ディストピア・ジ パング」 【初音ミク】イカサマ ダイス【オリジナル】 人気オリジナル曲の 「千本桜」を歌えば 自分の派生動画も 沢山の人に見てもらえるかも!
  10. 10. 11派生創作の要因2︓オリジナルコンテンツの人気 – 人気の影響の大きさはコンテンツによって異なる︓ – 人気から受ける影響はクリエータによって異なる︓ – 人気の影響の大きさは時間の経過と共に減衰︓ – ランキングが上位のコンテンツほど影響が大きい︓
  11. 11. 12派生創作の要因3︓派生コンテンツの人気 – 人気の影響の大きさはコンテンツによって異なる︓ – 人気から受ける影響はクリエータによって異なる︓ – 人気の影響の大きさは時間の経過と共に減衰︓ – ランキングが上位のコンテンツほど影響が大きい︓ 「歌ってみた」再生数ランキング 1 2 3 4 【そんなふいんきで歌 ってみた】千本桜【 ぐるたみん】 パンダヒーロー 歌 ってみた【しゃむお ん&天月】 【蛇足×ふぁねる】嗚 呼、素晴らしきニャ ン生【歌ってみた】 『千本桜』を歌ってみ た★実谷なな 人気派生動画で歌われている 「千本桜」を歌えば 自分の派生動画も 沢山の人に見てもらえるかも!
  12. 12. 13派生創作の要因3︓派生コンテンツの人気 – 人気の影響の大きさはコンテンツによって異なる︓ – 人気から受ける影響はクリエータによって異なる︓ – 人気の影響の大きさは時間の経過と共に減衰︓ – ランキングが上位のコンテンツほど影響が大きい︓
  13. 13. 14パラメータ推定|潜在変数 ( ) オリジナルコンテンツ の魅⼒ オリジナルコンテンツ の人気 の1番目の派生コンテンツの人気 の2番目の派生コンテンツの人気 1 2 3 4 5 6 7 8 9 各要因が3番目の派生コンテンツの 創作を引き起こした確率分布を作成 1 2 3 4 5 6 7 8 9 ︓3番目の派生が投稿された時刻
  14. 14. 15パラメータ推定|潜在変数 ( ) オリジナルコンテンツ の魅⼒ オリジナルコンテンツ の人気 の1番目の派生コンテンツの人気 の2番目の派生コンテンツの人気 1 2 3 4 5 6 7 8 9 例︓オリジナルコンテンツの1番目 のランキング入りが要因である 確率は低い1 2 3 4 5 6 7 8 9 ︓3番目の派生が投稿された時刻
  15. 15. 16パラメータ推定|潜在変数 ( ) オリジナルコンテンツ の魅⼒ オリジナルコンテンツ の人気 の1番目の派生コンテンツの人気 の2番目の派生コンテンツの人気 1 2 3 4 5 6 7 8 9 1 2 3 4 5 6 7 8 9 ︓3番目の派生が投稿された時刻 例︓派生コンテンツ1の3番目 のランキング入りが要因である 確率は⾼い
  16. 16. 17パラメータ推定|確率的EMアルゴリズム ︓全オリジナルコンテンツの全派生コンテンツ ︓全派生コンテンツの全潜在変数 各パラメータの事前分布に共役事前分布を使用 と の周辺化された同時分布 Eステップで をサンプリング 十分な回数のイテレーション後に各パラメータ を点推定
  17. 17. 18提案モデルの元となったモデル 商品の購買予測モデル [Iwata+ KDD2013] A 提案モデル N次創作活動においてはクリエータ間の影響は存在しないと仮定 実験によりクリエータ間の影響の効果を検証
  18. 18. 19
  19. 19. 20データセット オリジナルコンテンツ – 2010/1/1〜2013/3/31の期間にニコニコ動画に投稿された VOCALOIDを使用した楽曲動画 派生コンテンツ – 2010/1/1〜2013/6/30の期間にニコニコ動画に投稿された 「歌ってみた」「踊ってみた」「演奏してみた」の動画 ランキング – オリジナルと各派生カテゴリのデイリーランキングトップ100 歌ってみた 踊ってみた 演奏してみた オリジナル動画数 4,035 396 583 派生動画数 199,320 9,420 5,526 クリエータ数 18,715 1,153 692 オリランキグ入り回数 64,973 30,925 38,726 派生ランキング入り回数 67,627 22,954 20,492
  20. 20. 21Research Question 1 オリジナルコンテンツの魅⼒ オリジナルコンテンツの人気 派生コンテンツの人気 の3つの要因を考慮することは 派生活動のモデル化に有効か オリ魅⼒ オリ人気 派生人気 クリエータ影響 提案モデル ✓ ✓ ✓ 比較モデル1 ✓ ✓ 比較モデル2 ✓ ✓ 比較モデル3 ✓ ✓ ✓ ✓ 比較モデル4 ✓ ✓ 比較モデル5 ✓
  21. 21. 22評価方法 – 2010/1/1〜2013/3/31 – 上記期間のデータを使用して各モデルを学習 – 2013年4月から1ヶ月・2ヶ月・3ヶ月 – 各テスト期間の負の対数尤度を計算
  22. 22. 23結果 良 悪 オリ魅⼒オリ魅⼒+クリエータオリ魅⼒+オリ人気+派生人気+クリエータ オリ魅⼒+オリ人気オリ魅⼒+派生人気 オリ魅⼒+オリ人気+派生人気(提案モデル) 「歌ってみた」と「踊ってみた」では提案モデルが最⾼精度 提案モデルは全カテゴリの全期間で安定して⾼精度 クリエータ間の影響を考慮することで精度は悪化 *︓最⾼精度
  23. 23. 24Research Question 2 派生活動のモデル化においてコンテンツランキングの順位による バイアスのかけ方はどのような方法が有効か 1位 2位 3位 4位 5位 1位 2位 3位 4位 5位 1位 2位 3位 4位 5位 逆数(提案手法) 線形 一定 仮説︓ 上位のコンテンツだけが ⼤きな影響⼒を持つ 仮説︓ 中位のコンテンツも ある程度の影響⼒を持つ 仮説︓ すべてのコンテンツは 同じ影響⼒を持つ Webの検索結果では順位が下がると閲覧確率は⼤幅に低下 ランキングの閲覧⾏動モデルを反映した「逆数」の有用性検証
  24. 24. 25結果 良 悪 一定線形逆数(提案手法) 「逆数」手法が全カテゴリの全期間で最⾼精度 ランキングの閲覧⾏動モデルを考慮することは有用 *︓最⾼精度
  25. 25. 26
  26. 26. 27カテゴリ特性 オリジナル動画 の魅⼒ オリジナル動画 の人気 の1番目の派生動画の人気 の2番目の派生動画の人気 1 2 3 4 5 6 7 8 9 オリジナル動画 の3番目の派生動画の創作を引き起こした要因 オリ魅⼒ オリ人気 派生人気 各潜在変数の確率をもとに3要因それぞれの影響⼒が計算可能
  27. 27. 28カテゴリ特性 … オリジナル動画 の全ての歌ってみた動画 歌ってみた動画1 歌ってみた動画2 歌ってみた動画3 歌ってみた動画577 オリ魅⼒ オリ人気 派生人気 オリジナル動画の対象カテゴリの全派生動画を考慮することで オリジナル動画ごとの3要因それぞれの影響⼒が計算可能
  28. 28. 29カテゴリ特性 オリ魅⼒ オリ人気 400 派生人気 454 対象カテゴリの全オリジナル動画の全派生動画を考慮することで カテゴリごとの3要因それぞれの影響⼒が計算可能 オリジナル動画1の全ての歌ってみた動画 オリジナル動画2の全ての歌ってみた動画 オリジナル動画4,035の全ての歌ってみた動画
  29. 29. 30カテゴリ特性の分析結果 歌ってみた 踊ってみた 演奏してみた オリジナルコンテンツの魅⼒ 14.6 17.3 42.5 オリジナルコンテンツの人気 40.0 21.7 40.0 派生コンテンツの人気 45.4 61.0 17.5 (%) 歌ってみた – 人気の影響⼒が強く、流⾏りが重視される 踊ってみた – 手本となる踊りが必要であるため、派生の人気の影響が強い 演奏してみた – オリ人気に加えて、流⾏りに流されず好きな曲を演奏する
  30. 30. 313要因の影響⼒の時間推移 オリジナル動画1の2010年3月の歌ってみた動画 オリジナル動画1の2010年4月の歌ってみた動画 オリジナル動画1の2013年3月の歌ってみた動画 オリ魅⼒ オリ人気 派生人気 ひとつのオリジナル動画の月ごとの派生動画を考慮することで 3要因それぞれの影響⼒の月単位の推移が計算可能 オリ魅⼒ オリ人気 派生人気 オリ魅⼒ オリ人気 派生人気
  31. 31. 323要因の影響⼒の時間推移の分析結果 0 20 40 60 80 100 120 Apr-10 Oct-10 Apr-11 Oct-11 Apr-12 Oct-122010/4 2010/10 2011/4 2011/10 2012/4 2012/10 あるオリジナル曲の「歌ってみた」の派生動画 全期間を通してコンテンツの人気の影響が⼤きい 初期の段階ではオリジナルコンテンツの人気の影響が⼤きい 中期以降は人気の派生コンテンツが新たな派生を引き起こす オリ魅⼒ 派生人気 オリ人気 1380087468 sm26672034
  32. 32. 333要因の影響⼒の時間推移の分析結果 0 5 10 15 20 25 Nov-10 May-11 Nov-11 May-12 Nov-12 あるオリジナル曲の「踊ってみた」の派生動画 オリ魅⼒ 派生人気 オリ人気 初期の段階では振り付けを考えられるクリエータが オリジナルコンテンツの魅⼒に惹かれて派生コンテンツを制作 4ヶ月目以降はそれまでに投稿された派生コンテンツの 振り付けを真似て新たな派生コンテンツが投稿される 2010/11 2011/5 2011/11 2012/5 2012/11 sm16949946 sm14218062
  33. 33. 0 5 10 15 20 25 Jul-10 Jan-11 Jul-11 Jan-12 Jul-12 Jan-13 343要因の影響⼒の時間推移の分析結果 あるオリジナル曲の「演奏してみた」の派生動画 初期の段階ではコンテンツの人気度を重視するクリエータ による派生コンテンツの投稿が多い 中期以降は人気とは無関係にオリジナルコンテンツの魅⼒ に惹かれたクリエータによって派生コンテンツが投稿される 2010/7 2011/1 2011/7 2012/1 2012/7 2013/1 オリ魅⼒ 派生人気 オリ人気 sm12815839 sm15518728
  34. 34. 353要因の影響⼒の時間推移の分析結果
  35. 35. 36クリエータの特性分析結果 A オリ魅⼒ オリ人気 派生人気 B C オリ人気 派生人気 オリ魅⼒ オリ人気 派生人気 オリ魅⼒ 歌ってみた 踊ってみた 演奏してみた Aのクリエータにはコンテンツの内容を考慮したコンテンツ推薦 独自の振り付けを考えられるBのクリエータにはオリジナルを推薦 流⾏に敏感なCのクリエータには特に人気のコンテンツを推薦 ︓クリエータ 各カテゴリで派生コンテンツ投稿数上位250クリエータをプロット
  36. 36. 37まとめ|本研究の貢献・今後の課題 コンテンツの内容も考慮したモデルの提案 分析結果を誰もが閲覧できるようWebサービスとして公開 3要因を考慮すること・ランキングデータを使用することの有用性を示した N オリジナルコンテンツの魅⼒・オリジナルコンテンツの人気・派生コンテンツの人気 カテゴリ特定・要因の影響⼒の時間推移・クリエータ特性・派生創作過程 今後の 課題

×