ニコニコ動画における タグ共起ネットワークの特徴抽出 The Character Extraction of Co-occurring Networks on Nicovideo Presented by kynbit http://www.t...
目次 <ul><li>背景 </li></ul><ul><li>ニコニコ動画の特徴 </li></ul><ul><li>目的 </li></ul><ul><li>タグ共起ネットワーク </li></ul><ul><li>特徴抽出 </li></...
背景 <ul><li>近年、 Web 上では動画共有サービスの利用が盛んになっている </li></ul>アメリカ国内からの  custom category への訪問者のシェア (2007 年 5 月 )[Hitwise] YouTube が...
ニコニコ動画とは <ul><li>ニコニコ動画 </li></ul><ul><ul><li>動画サービス内において、日本国内からの 1 人当りの平均利用時間・利用回数第 1 位 [ ネットレイティング社 ] </li></ul></ul>動画に...
ニコニコ動画の特徴 <ul><li>コンテンツの組み合わせが盛んに行われる </li></ul><ul><li>コンテンツに付与されるタグをユーザ間で共有 </li></ul>JR 東日本 ? 初音ミク ? Video A Video B Vi...
目的 <ul><li>ニコニコ動画独自のコンテンツ発展形態およびタグ付けに注目する </li></ul><ul><li>タグを用いてタグ共起ネットワークを構築し、解析を行う </li></ul>タグの関係性に関する特徴を抽出し、 タグのカテゴラ...
タグ共起ネットワーク <ul><li>動画と動画に付与されているタグの 2 部グラフから、タグのみから構成される 1 部グラフへ変換 </li></ul>Video A Video B Video C 盗んでいきましたシリーズ IOSYS 音楽...
解析対象 <ul><li>総合ランキング ( 本日 ) に掲載されている動画 </li></ul><ul><ul><li>対象ランキング  : 「マイリスト登録」「再生」 </li></ul></ul><ul><ul><li>取得日時  :  ...
解析対象の基本特徴量 各ネットワークのノード数とリンク数 ノード数最大の非連結成分における ノード数とリンク数 Date Date Number Number Date Date Number Number
クラスタリング係数と平均最短パス長 同ノード数・リンク数の ER モデルと比較 クラスタリング係数 平均最短パス長 スモールワールドネットワーク Date Clustering Coefficient Average Shortest Path...
次数分布 マイリストランキング 再生ランキング スケールフリーネットワーク 複数のハブを中心とした 密なクラスタ同士がつながったトポロジー Degree Degree Number Number
ネットワークの可視化 マイリストランキング 再生ランキング
コンテンツの中心となっているタグ <ul><li>次数分布の上位 10 位に入った回数を計算 </li></ul><ul><li>4回以上出現したタグを列挙 </li></ul>ゲーム (8)  アニメ (8)  音楽 (8)  初音ミク (8...
コミュニティ分割による解析 コンテンツの様々な組み合わせが 時系列に沿って生成される <ul><li>リンクが「多い」「密である」「重い」 サブグラフはコンテンツの関係性が強い </li></ul><ul><li>時系列に沿って コンテンツの関...
コミュニティの時系列評価 注目するタグ 初音ミク  アイドルマスター  才能の無駄遣い  もっと評価されるべき 4つのタグが属しているコミュニティの時系列変化に関する評価手法 時刻が異なる 2 つのコミュニティ間の 距離 :  コミュニティ  ...
コミュニティ間の距離とノード数の時系列変化 初音ミク アイドルマスター 才能の無駄遣い もっと評価されるべき 再生ランキング マイリストランキング Nov 30 Dec 7 Nov 30 Dec 7 Nov 30 Dec 7 Nov 30 De...
タグのカテゴライズ <ul><li>タグの関連性の時系列変化からタグをカテゴライズ </li></ul>似ている 関連するタグ タイプ 1 2 3 異なる 異なる 関連するタグ量の変化 小さい 大きい 小さい コンテンツ例 初音ミク アイドル ...
結論 <ul><li>ニコニコ動画からタグ共起ネットワークを構築・解析し、タグの関連性について特徴を抽出した </li></ul><ul><ul><li>カテゴリタグと同程度関連するタグを持つタグが創発している </li></ul></ul><...
今後の研究課題 <ul><li>解析対象となる動画を増やすことで、タグの関係性をより精密に明らかにする </li></ul><ul><li>より長い時系列変化に注目することで、今回行った解析が妥当であるか検証する </li></ul><ul><...
Thank you !
Upcoming SlideShare
Loading in...5
×

The Character Extraction of Co-occurring Networks on Nicovideo

4,848

Published on

Japanese title:ニコニコ動画におけるタグ共起ネットワークの特徴抽出

Abstract : Recently, User Generated Content(UGC) Video on Demand(VoD) services such as YouTube become popular all around the world. In Japan, Nicovideo which is one of UGC VoD service gathers more attention than YouTube. Users in Nicovideo make new contents by adding new features to exisiting contents and categorize contents by using shared tags. These tags cleary represent what the content is. In this paper, we analyze tag co-occurring networks on Nicovideo and extract characters and relations of contents. As a result, it is obserbed that not only category tags but also user defined tags appear as a center of contents. In additon, we can categorize tags using relations between tags.

Published in: Business
0 Comments
6 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
4,848
On Slideshare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
0
Comments
0
Likes
6
Embeds 0
No embeds

No notes for slide
  • The Character Extraction of Co-occurring Networks on Nicovideo

    1. 1. ニコニコ動画における タグ共起ネットワークの特徴抽出 The Character Extraction of Co-occurring Networks on Nicovideo Presented by kynbit http://www.twitter.com/kynbit http://d.hatena.ne.jp/kynbit/ http://nicovideo.g.hatena.ne.jp/kynbit/
    2. 2. 目次 <ul><li>背景 </li></ul><ul><li>ニコニコ動画の特徴 </li></ul><ul><li>目的 </li></ul><ul><li>タグ共起ネットワーク </li></ul><ul><li>特徴抽出 </li></ul><ul><li>結論 </li></ul><ul><li>今後の研究課題 </li></ul>
    3. 3. 背景 <ul><li>近年、 Web 上では動画共有サービスの利用が盛んになっている </li></ul>アメリカ国内からの custom category への訪問者のシェア (2007 年 5 月 )[Hitwise] YouTube が 独占的な地位 関連研究 M.Cha. et al. [2007] 動画共有サービス
    4. 4. ニコニコ動画とは <ul><li>ニコニコ動画 </li></ul><ul><ul><li>動画サービス内において、日本国内からの 1 人当りの平均利用時間・利用回数第 1 位 [ ネットレイティング社 ] </li></ul></ul>動画に コメントが流れる マイリストに登録 タグを付与 ニコニコ動画独自のコンテンツに関する特徴を持つ
    5. 5. ニコニコ動画の特徴 <ul><li>コンテンツの組み合わせが盛んに行われる </li></ul><ul><li>コンテンツに付与されるタグをユーザ間で共有 </li></ul>JR 東日本 ? 初音ミク ? Video A Video B Video C User A User B Tags Users 時系列に沿って 新たな特徴を 加えた動画が 作られやすい <ul><li>適さないタグは淘汰 </li></ul><ul><li>対象が動画のみ </li></ul><ul><li>文字数制限が緩い </li></ul>タグがコンテンツの内容を端的に表す
    6. 6. 目的 <ul><li>ニコニコ動画独自のコンテンツ発展形態およびタグ付けに注目する </li></ul><ul><li>タグを用いてタグ共起ネットワークを構築し、解析を行う </li></ul>タグの関係性に関する特徴を抽出し、 タグのカテゴライズを行う
    7. 7. タグ共起ネットワーク <ul><li>動画と動画に付与されているタグの 2 部グラフから、タグのみから構成される 1 部グラフへ変換 </li></ul>Video A Video B Video C 盗んでいきましたシリーズ IOSYS 音楽 JR 東日本 初音ミク 絶対音感の無駄遣い 盗んでいきましたシリーズ IOSYS 音楽 2 3 2 複数の動画で共起しているタグ 単一の動画でのみ共起しているタグはノイズとして除去 時刻 の ネットワーク : と の隣接行列の値 :ネットワーク に属するノード数 : が持つ重み
    8. 8. 解析対象 <ul><li>総合ランキング ( 本日 ) に掲載されている動画 </li></ul><ul><ul><li>対象ランキング : 「マイリスト登録」「再生」 </li></ul></ul><ul><ul><li>取得日時 : 2007 年 11 月 30 日~ 12 月 7 日 計 8 日間 </li></ul></ul><ul><ul><li>取得時刻 : 午前 5 時 </li></ul></ul><ul><ul><li>取得動画数 : 1 位~ 300 位までの 300 個 </li></ul></ul>多くのユーザに注目されている動画の 時系列変化からタグの特徴を抽出する
    9. 9. 解析対象の基本特徴量 各ネットワークのノード数とリンク数 ノード数最大の非連結成分における ノード数とリンク数 Date Date Number Number Date Date Number Number
    10. 10. クラスタリング係数と平均最短パス長 同ノード数・リンク数の ER モデルと比較 クラスタリング係数 平均最短パス長 スモールワールドネットワーク Date Clustering Coefficient Average Shortest Path Length Date
    11. 11. 次数分布 マイリストランキング 再生ランキング スケールフリーネットワーク 複数のハブを中心とした 密なクラスタ同士がつながったトポロジー Degree Degree Number Number
    12. 12. ネットワークの可視化 マイリストランキング 再生ランキング
    13. 13. コンテンツの中心となっているタグ <ul><li>次数分布の上位 10 位に入った回数を計算 </li></ul><ul><li>4回以上出現したタグを列挙 </li></ul>ゲーム (8) アニメ (8) 音楽 (8) 初音ミク (8) ミクオリジナル曲 (8) もっと評価されるべき (7) アイドルマスター (6) ボーカロイド殿堂入り (6)‏ 初音ミク名曲リンク (5) 才能の無駄遣い (4) KAITO(4) ゲーム (8) アニメ (8) 音楽 (8) 初音ミク (8) エンターテイメント (5)‏ アイドルマスター (5) 才能の無駄遣い (5) R-18(5)‏ タグ名 ( 出現回数 )‏ ランキング マイリスト 再生 カテゴリタグ 両ランキングに現れるタグ 片方のランキングのみ現れるタグ ユーザが行うタグ付けによってボトムアップにカテゴライズされた カテゴリタグと同等の機能を持ったタグが創発している 「マイリストに追加されやすい」「再生されやすい」「両方されやすい」 といった特徴ごとに中心となるタグが異なる
    14. 14. コミュニティ分割による解析 コンテンツの様々な組み合わせが 時系列に沿って生成される <ul><li>リンクが「多い」「密である」「重い」 サブグラフはコンテンツの関係性が強い </li></ul><ul><li>時系列に沿って コンテンツの関連性に変化が生じる </li></ul>2 つの仮説 ニコニコ動画の特徴 Clauset, et al. [2004] による コミュニティ分割手法を リンクの重み付きに 対応させた手法を用いて分割 データ処理 Modurality の定義式 Modurality の更新に用いる : 上の全リンクの重みの総和 : コミュニティ と 間の 隣接行列 : コミュニティ が一端と なっているコミュニティ間に 存在するリンクの重みの総和 関連性の強いコミュニティ ( サブグラフ ) を抽出する
    15. 15. コミュニティの時系列評価 注目するタグ 初音ミク アイドルマスター 才能の無駄遣い もっと評価されるべき 4つのタグが属しているコミュニティの時系列変化に関する評価手法 時刻が異なる 2 つのコミュニティ間の 距離 : コミュニティ に属するノード集合 : 該当タグが時刻 に属していた コミュニティ : コミュニティ に属するリンク集合 : コミュニティ と の 最大共通サブグラフ 時刻が異なる 2 つの コミュニティ間における ノード数の変化 大 タグの 関係性が一定 距離 小 関連する タグ数が一定 ノード数の 変化 タグの 関係性が変化 関連する タグ数が変化 コミュニティの時系列変化から タグをカテゴライズ J.Azaria, et al.[2005]
    16. 16. コミュニティ間の距離とノード数の時系列変化 初音ミク アイドルマスター 才能の無駄遣い もっと評価されるべき 再生ランキング マイリストランキング Nov 30 Dec 7 Nov 30 Dec 7 Nov 30 Dec 7 Nov 30 Dec 7 Nov 30 Dec 7 Nov 30 Dec 7 Nov 30 Dec 7 Nov 30 Dec 7 Distance Distance Number Number Distance Distance Number Number 似たタグと 関連性を持つ 関連するタグの 関連性が変化 関連するタグ数や タグの関連性が変化
    17. 17. タグのカテゴライズ <ul><li>タグの関連性の時系列変化からタグをカテゴライズ </li></ul>似ている 関連するタグ タイプ 1 2 3 異なる 異なる 関連するタグ量の変化 小さい 大きい 小さい コンテンツ例 初音ミク アイドル マスター 才能の無駄遣い もっと評価 されるべき コンテンツを示すタグを自動的に分類することが可能になり、 「面白いタグ」や「今、話題のタグ」を抽出できる 「ネタ」「ノリ」「評価」 見ていて面白い
    18. 18. 結論 <ul><li>ニコニコ動画からタグ共起ネットワークを構築・解析し、タグの関連性について特徴を抽出した </li></ul><ul><ul><li>カテゴリタグと同程度関連するタグを持つタグが創発している </li></ul></ul><ul><ul><li>動画の性質ごとに中心となるタグが異なる </li></ul></ul><ul><ul><li>タグの関連性の時系列変化からタグの分類が可能 </li></ul></ul>
    19. 19. 今後の研究課題 <ul><li>解析対象となる動画を増やすことで、タグの関係性をより精密に明らかにする </li></ul><ul><li>より長い時系列変化に注目することで、今回行った解析が妥当であるか検証する </li></ul><ul><li>コミュニティ分割以外の手法を用いて、新たなタグの関連性の特徴を抽出する </li></ul>
    20. 20. Thank you !

    ×