• Save
The Character Extraction of Co-occurring Networks on Nicovideo
Upcoming SlideShare
Loading in...5
×

Like this? Share it with your network

Share

The Character Extraction of Co-occurring Networks on Nicovideo

  • 6,028 views
Uploaded on

Japanese title:ニコニコ動画におけるタグ共起ネットワークの特徴抽出 ...

Japanese title:ニコニコ動画におけるタグ共起ネットワークの特徴抽出

Abstract : Recently, User Generated Content(UGC) Video on Demand(VoD) services such as YouTube become popular all around the world. In Japan, Nicovideo which is one of UGC VoD service gathers more attention than YouTube. Users in Nicovideo make new contents by adding new features to exisiting contents and categorize contents by using shared tags. These tags cleary represent what the content is. In this paper, we analyze tag co-occurring networks on Nicovideo and extract characters and relations of contents. As a result, it is obserbed that not only category tags but also user defined tags appear as a center of contents. In additon, we can categorize tags using relations between tags.

More in: Business
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
No Downloads

Views

Total Views
6,028
On Slideshare
6,017
From Embeds
11
Number of Embeds
7

Actions

Shares
Downloads
0
Comments
0
Likes
5

Embeds 11

http://kynbit.g.hatena.ne.jp 3
http://www.slideshare.net 2
https://twitter.com 2
http://lilyann.tumblr.com 1
http://72.14.235.104 1
http://mgw.hatena.ne.jp 1
http://a0.twimg.com 1

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. ニコニコ動画における タグ共起ネットワークの特徴抽出 The Character Extraction of Co-occurring Networks on Nicovideo Presented by kynbit http://www.twitter.com/kynbit http://d.hatena.ne.jp/kynbit/ http://nicovideo.g.hatena.ne.jp/kynbit/
  • 2. 目次
    • 背景
    • ニコニコ動画の特徴
    • 目的
    • タグ共起ネットワーク
    • 特徴抽出
    • 結論
    • 今後の研究課題
  • 3. 背景
    • 近年、 Web 上では動画共有サービスの利用が盛んになっている
    アメリカ国内からの custom category への訪問者のシェア (2007 年 5 月 )[Hitwise] YouTube が 独占的な地位 関連研究 M.Cha. et al. [2007] 動画共有サービス
  • 4. ニコニコ動画とは
    • ニコニコ動画
      • 動画サービス内において、日本国内からの 1 人当りの平均利用時間・利用回数第 1 位 [ ネットレイティング社 ]
    動画に コメントが流れる マイリストに登録 タグを付与 ニコニコ動画独自のコンテンツに関する特徴を持つ
  • 5. ニコニコ動画の特徴
    • コンテンツの組み合わせが盛んに行われる
    • コンテンツに付与されるタグをユーザ間で共有
    JR 東日本 ? 初音ミク ? Video A Video B Video C User A User B Tags Users 時系列に沿って 新たな特徴を 加えた動画が 作られやすい
    • 適さないタグは淘汰
    • 対象が動画のみ
    • 文字数制限が緩い
    タグがコンテンツの内容を端的に表す
  • 6. 目的
    • ニコニコ動画独自のコンテンツ発展形態およびタグ付けに注目する
    • タグを用いてタグ共起ネットワークを構築し、解析を行う
    タグの関係性に関する特徴を抽出し、 タグのカテゴライズを行う
  • 7. タグ共起ネットワーク
    • 動画と動画に付与されているタグの 2 部グラフから、タグのみから構成される 1 部グラフへ変換
    Video A Video B Video C 盗んでいきましたシリーズ IOSYS 音楽 JR 東日本 初音ミク 絶対音感の無駄遣い 盗んでいきましたシリーズ IOSYS 音楽 2 3 2 複数の動画で共起しているタグ 単一の動画でのみ共起しているタグはノイズとして除去 時刻 の ネットワーク : と の隣接行列の値 :ネットワーク に属するノード数 : が持つ重み
  • 8. 解析対象
    • 総合ランキング ( 本日 ) に掲載されている動画
      • 対象ランキング : 「マイリスト登録」「再生」
      • 取得日時 : 2007 年 11 月 30 日~ 12 月 7 日 計 8 日間
      • 取得時刻 : 午前 5 時
      • 取得動画数 : 1 位~ 300 位までの 300 個
    多くのユーザに注目されている動画の 時系列変化からタグの特徴を抽出する
  • 9. 解析対象の基本特徴量 各ネットワークのノード数とリンク数 ノード数最大の非連結成分における ノード数とリンク数 Date Date Number Number Date Date Number Number
  • 10. クラスタリング係数と平均最短パス長 同ノード数・リンク数の ER モデルと比較 クラスタリング係数 平均最短パス長 スモールワールドネットワーク Date Clustering Coefficient Average Shortest Path Length Date
  • 11. 次数分布 マイリストランキング 再生ランキング スケールフリーネットワーク 複数のハブを中心とした 密なクラスタ同士がつながったトポロジー Degree Degree Number Number
  • 12. ネットワークの可視化 マイリストランキング 再生ランキング
  • 13. コンテンツの中心となっているタグ
    • 次数分布の上位 10 位に入った回数を計算
    • 4回以上出現したタグを列挙
    ゲーム (8) アニメ (8) 音楽 (8) 初音ミク (8) ミクオリジナル曲 (8) もっと評価されるべき (7) アイドルマスター (6) ボーカロイド殿堂入り (6)‏ 初音ミク名曲リンク (5) 才能の無駄遣い (4) KAITO(4) ゲーム (8) アニメ (8) 音楽 (8) 初音ミク (8) エンターテイメント (5)‏ アイドルマスター (5) 才能の無駄遣い (5) R-18(5)‏ タグ名 ( 出現回数 )‏ ランキング マイリスト 再生 カテゴリタグ 両ランキングに現れるタグ 片方のランキングのみ現れるタグ ユーザが行うタグ付けによってボトムアップにカテゴライズされた カテゴリタグと同等の機能を持ったタグが創発している 「マイリストに追加されやすい」「再生されやすい」「両方されやすい」 といった特徴ごとに中心となるタグが異なる
  • 14. コミュニティ分割による解析 コンテンツの様々な組み合わせが 時系列に沿って生成される
    • リンクが「多い」「密である」「重い」 サブグラフはコンテンツの関係性が強い
    • 時系列に沿って コンテンツの関連性に変化が生じる
    2 つの仮説 ニコニコ動画の特徴 Clauset, et al. [2004] による コミュニティ分割手法を リンクの重み付きに 対応させた手法を用いて分割 データ処理 Modurality の定義式 Modurality の更新に用いる : 上の全リンクの重みの総和 : コミュニティ と 間の 隣接行列 : コミュニティ が一端と なっているコミュニティ間に 存在するリンクの重みの総和 関連性の強いコミュニティ ( サブグラフ ) を抽出する
  • 15. コミュニティの時系列評価 注目するタグ 初音ミク アイドルマスター 才能の無駄遣い もっと評価されるべき 4つのタグが属しているコミュニティの時系列変化に関する評価手法 時刻が異なる 2 つのコミュニティ間の 距離 : コミュニティ に属するノード集合 : 該当タグが時刻 に属していた コミュニティ : コミュニティ に属するリンク集合 : コミュニティ と の 最大共通サブグラフ 時刻が異なる 2 つの コミュニティ間における ノード数の変化 大 タグの 関係性が一定 距離 小 関連する タグ数が一定 ノード数の 変化 タグの 関係性が変化 関連する タグ数が変化 コミュニティの時系列変化から タグをカテゴライズ J.Azaria, et al.[2005]
  • 16. コミュニティ間の距離とノード数の時系列変化 初音ミク アイドルマスター 才能の無駄遣い もっと評価されるべき 再生ランキング マイリストランキング Nov 30 Dec 7 Nov 30 Dec 7 Nov 30 Dec 7 Nov 30 Dec 7 Nov 30 Dec 7 Nov 30 Dec 7 Nov 30 Dec 7 Nov 30 Dec 7 Distance Distance Number Number Distance Distance Number Number 似たタグと 関連性を持つ 関連するタグの 関連性が変化 関連するタグ数や タグの関連性が変化
  • 17. タグのカテゴライズ
    • タグの関連性の時系列変化からタグをカテゴライズ
    似ている 関連するタグ タイプ 1 2 3 異なる 異なる 関連するタグ量の変化 小さい 大きい 小さい コンテンツ例 初音ミク アイドル マスター 才能の無駄遣い もっと評価 されるべき コンテンツを示すタグを自動的に分類することが可能になり、 「面白いタグ」や「今、話題のタグ」を抽出できる 「ネタ」「ノリ」「評価」 見ていて面白い
  • 18. 結論
    • ニコニコ動画からタグ共起ネットワークを構築・解析し、タグの関連性について特徴を抽出した
      • カテゴリタグと同程度関連するタグを持つタグが創発している
      • 動画の性質ごとに中心となるタグが異なる
      • タグの関連性の時系列変化からタグの分類が可能
  • 19. 今後の研究課題
    • 解析対象となる動画を増やすことで、タグの関係性をより精密に明らかにする
    • より長い時系列変化に注目することで、今回行った解析が妥当であるか検証する
    • コミュニティ分割以外の手法を用いて、新たなタグの関連性の特徴を抽出する
  • 20. Thank you !