Successfully reported this slideshow.
Your SlideShare is downloading. ×

Structural data analysis based on multilayer networks

Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Upcoming SlideShare
Graph Neural Networks
Graph Neural Networks
Loading in …3
×

Check these out next

1 of 138 Ad
Advertisement

More Related Content

Slideshows for you (20)

Similar to Structural data analysis based on multilayer networks (20)

Advertisement

Recently uploaded (20)

Advertisement

Structural data analysis based on multilayer networks

  1. 1. 多層ネットワークによる 構造データ分析 村田剛志 東京工業大学 情報理工学院 情報工学系 murata@c.titech.ac.jp http://www.net.c.titech.ac.jp/ 令和元年度 東北大学電気通信研究所 共同プロジェクト研究会 応用物理学会プラズマエレクトロニクス分科会 第32回プラズマ新領域研究会 物理 化学混成系プラズマにおける情報系機能発現 ~プラズマ反応場をネットワーク科学として捉える~ 本スライドはslideshareにて公開 上記サイトにリンクあり
  2. 2. 村田剛志(むらたつよし) • 東京工業大学 情報理工学院 情報工学系 准教授 • 専門:人工知能、ネットワーク科学、機械学習 • 人工知能学会、情報処理学会、日本ソフトウェ ア科学会、AAAI、ACM 各会員 • 本を出しました Pythonで学ぶネットワーク分析 ---ColaboratoryとNetworkXを使った実践入門--- 村田 剛志 著 発売日:2019/09/15 発行元:オーム社 https://atarum.github.io/
  3. 3. 「多層ネットワークによる 構造データ分析」 • 概要: ネットワーク分析は、対象世界における 構造やプロセスを理解する上で重要であるが、 現実のソーシャルメディア等は多種類の頂点 や辺から構成されており、従来の分析手法で は不十分であることが少なくない。本講演で は、交通網や動的ネットワークなどの現実の 多様な構造データを表現し分析するための枠 組みとして注目されてきている多層ネットワー ク研究について紹介する。
  4. 4. 目次 1. ネットワーク科学における課題 2. multilayer networkとは 3. 研究事例 4. トピックス – テンソルによる表現 – ランダムウオーク、移動可能性(navigability) – ランキング – temporal networkとmultilayer network – ネットワーク特徴量 – 生成モデル – コミュニティ抽出 5. ツール/データセット/関連会議/参考文献
  5. 5. 1.ネットワーク科学における課題 特徴量 モデル プロセス アルゴリズム
  6. 6. 1.ネットワーク科学における課題 特徴量 モデル プロセス アルゴリズム パス長、密度、直径、時数分布、 クラスタ係数、 … ダイクストラ法、グラフ分割、中 心性の計算、 … ランダムネットワーク、スケール フリーネットワーク、スモール ワールドネットワーク、べき法則、 configuration model、… 口コミ/病気の伝搬、影響最大 化、SI model、SIR model、リンク 予測 …
  7. 7. 中心性・ランキング • どの頂点が中心的か? – ソーシャルメディアでのオピニオンリーダー – 街のどこへでも短時間で駆けつけられるような場所 – … • 次数中心性(Degree Centrality) – 他の多くの頂点とつながっている頂点を中心的とみなす • 固有ベクトル中心性(Eigenvector Centrality) – 周囲の頂点の中心性も加味し、多くの中心的な頂点とつながってい る頂点を中心的とみなす • 近接中心性(Closeness Centrality) – ネットワーク中の他の頂点へ短い距離で到達できる頂点を中心的と みなす • 媒介中心性(Betweenness Centrality) – その頂点がなくなると多くの経路が分断されてしまうような頂点を中 心的とみなす
  8. 8. 中心性の例 参考: https://aksakalli.github.io/2017/07/17/network-centrality-measures-and-their-visualization.html
  9. 9. 特徴量計算 • 頂点数は同じでも、ネットワークはさまざま ランダムグラフ ピーターセングラフ 完全グラフ サイクルグラフ 2部グラフ バーベルグラフ スターグラフ ホイールグラフ スケールフリーグラフ
  10. 10. 特徴量の例 • 密度 • 直径 • クラスタ係数 • 平均次数 • 次数分布 • 平均パス長 • 次数相関 • …
  11. 11. コミュニティ抽出 • 密に結びついた部分ネットワーク(コミュニ ティ) – 友人グループや派閥などに対応 – 類似頂点がコミュニティを構成→嗜好の似た人 に商品や情報を推薦 • さまざまな定義、さまざまな抽出手法 参考: https://python-graph-gallery.com/324-map-a-color-to-network-nodes/ http://ryancompton.net/2014/06/16/community-detection-and-colored-plotting-in-networkx/
  12. 12. 2.Multilayer networkとは • 単純なネットワークでは扱えないような、現実 のより複雑な関係を表現・分析したい – 複数の交通機関(鉄道、バス…)での輸送網 – 複数のSNS(Facebook, Twitter, …)での情報伝搬 異なる種類の人間関係 (友好、敵対、職斡旋…) 複数の航空会社による 航空網
  13. 13. 輸送ネットワーク • ヨーロッパの航空ネットワーク (http://muxviz.net/gallery.php)
  14. 14. 異種ネットワーク上の災害の連鎖 • 2003年イタリアの大規模停電 – 発電所の停止→インターネットのノード故障→さら なる発電所の停止→… Sergey V. Buldyrev et al., "Catastrophic Cascade of Failures in Interdependent Networks" Nature 464, pp.1025-1028, 2010 発電所ネット インターネット
  15. 15. 様々な用語 • multilayer network, multiplex network, multivariate network, multinetwork, multirelational network, multirelational data, multilayered network, multidimensional network, multisilice network, multiplex of interdependent networks, hypernetwork, overlay network, composite network, multilevel network, multiweighted graph, heterogeneous network, multitype network, interconnected networks, interdependent networks, partially interdependent networks, network of networks, coupled networks, interconnecting networks, interacting networks, heterogeneous information network, meta-network, …
  16. 16. 様々な用語 • (Kivela et al., “Multilayer Networks”より)
  17. 17. multilayer networksの定義 • M=(VM, EM, V, L) – V: 頂点集合 – L: レイヤの集合の列(0次元:通常ネットワーク, 1 次元:上図, 2次元:下図) – VM:頂点とレイヤのタプルの集合 – EM:辺集合(タプルの組の集合) V={1,2,3,4} L={L1,L2}, L1={A,B}, L2={X,Y} VM={(1,A,X), (2,A,X), (3,A,X),…} EM={((1,A,X),(2,A,X)), ((1,A,X),(1,B,X)),…}
  18. 18. Layer間のつながり • 1次元vs2次元
  19. 19. 異なる種類のインタラクション • Kivera et.al, “Multilayer Networks”, Journal of Complex Networks, Vol.2, No.3, pp.203-271, 2014 異 な る 会 議 異なる種類の接触 同一人物 単純ネットワークでの表現MAP, MB, YYA, ACの4人のネットワーク
  20. 20. 単純ネットワークへの変換 • 便宜的に単純なネットワークへの変換(aggregation, projection) – 全てのlayerを1枚のlayerに押しつぶす • 情報が失われる – layer内の辺の差の情報が失われる – layer間の辺の情報が失われる – layer毎の異なる性質(次数分布等)が不明確にな る
  21. 21. multiplex(multislice) :単純化した multilayer • Lが1次元、全頂点が各レイヤに出現、レイヤ 間を結ぶ辺(coupling)が – 全ての対応頂点間のもの(categorical coupling) – 隣接する対応頂点間のもの(ordinal coupling) ordinal coupling categorical coupling
  22. 22. 3.研究事例 • 多層ネットワークの制約付きコミュニティ抽出 – "マルチスライスネットワークにおける制約付きコミュニティ抽出 法“, 江口 幸司, 村田 剛志, 人工知能学会論文誌, Vol.32, No.1, p.WII-C_1-9, 2017. https://www.jstage.jst.go.jp/article/tjsai/32/1/32_WII- C/_article/-char/ja/ • 動的ネットワークの情報伝搬の最大化 – "Selecting Seed Nodes for Influence Maximization in Dynamic Networks“, Shogo Osawa, Tsuyoshi Murata, Proceedings of the 6th Workshop on Complex Networks (CompleNet2015), Vol.597, pp.91-98, 2015. https://link.springer.com/chapter/10.1007/978- 3-319-16112-9_9 – "Extended methods for influence maximization in dynamic networks“, Tsuyoshi Murata, Hokuto Koga, Computational Social Networks 5:8, 21 pages, 2018. https://computationalsocialnetworks.springeropen.com/articles /10.1186/s40649-018-0056-8
  23. 23. マルチプレックスネットワークにおける 制約付きコミュニティ抽出法の拡張 江口幸司 情報理工学院 情報工学系 情報工学コース 村田研究室 242018/2/2
  24. 24. コミュニティ抽出 • ネットワークからエッジのつながりが密な 部分ネットワーク(コミュニティ)を見つけ出す →ネットワーク構造の分析、情報推薦などに応 用 25 コミュニティ抽出結果
  25. 25. 制約付きコミュニティ抽出 • 制約を考慮したコミュニティ抽出 – 背景知識 – ユーザからのフィードバック • 精度の向上が期待される 26 Tokyo Chiba Chiba 制約付き コミュニティ抽出結果
  26. 26. マルチプレックスネットワーク • マルチレイヤネットワークの一種 –複数のネットワークをエッジでつないで 組み合わせたもの 27 各レイヤは 同じノードの集合を持つ レイヤ間エッジ (同じノード間だけに存在) レイヤ レイヤ内 エッジ
  27. 27. マルチプレックスネットワークにおける コミュニティ抽出 • ノード同士が複数の種類のつながり(エッジ)を 持つようなネットワークを分析することができる 28 Aarhus University の Computer Scienceにおける 教員のネットワーク ロンドンの交通網のネットワーク
  28. 28. 従来法 評価関数:制約付きハミルトニアン[3][4] 最適化法:Louvain法[5] マルチプレックスネットワークにおける 制約付きコミュニティ抽出法[7] 29 評価関数を 最適化する アルゴリズム 拡張 1 2 評価関数:モジュラリティ[1][2] 最適化法:Gen Louvain法 [6] [4]Eaton and Mansbach, 2012. [3]Reichardt and Bornholdt, 2006. [5]Blondel et al., 2008. [2]Newman and Girvan, 2004. [6]Jutla et al., 2011-2014. [1]Mucha et al., 2010. コミュニティ 抽出の結果 を定量化モノ 制約付き マルチ 制約なし [7]Eguchi and Murata, 2017.
  29. 29. 目的 • 応用範囲の拡大 – 人間関係の分析 – 交通網の分析 – 論文の参照関係の分析 など 30 マルチプレックスネットワークにおける 制約付きコミュニティ抽出法を 大規模ネットワークに拡張する
  30. 30. マルチプレックスネットワークにおける ハミルトニアン[7] 31 multiplex 報酬項:コミュニティ内にエッジが存在 罰則項:コミュニティ間にエッジが存在 レイヤ内エッジ について(既存) レイヤ間エッジ について(追加) 𝑨𝒊𝒋𝒔:レイヤ𝒔における 隣接行列𝑨の(𝒊, 𝒋)要素 𝒈𝒊𝒔:レイヤ𝒔のノード𝒊が属する コミュニティのインデックス 𝜹:クロネッカーのデルタ 報酬項:コミュニティ間にエッジがない 罰則項:コミュニティ間にエッジが存在 報酬項:コミュニティ内にエッジが存在 罰則項:コミュニティ内にエッジがない [7]Eguchi and Murata, 2017.
  31. 31. マルチプレックスネットワークにおける 制約付きハミルトニアン[7] 32 multiplex (node 𝑖 and 𝑗 have must-link constraint) (nodes 𝑗 in layer s and 𝑟 have cannot-link constraint) (nodes 𝑗 in layer s and 𝑟 have must-link constraint) (node 𝑖 and 𝑗 have cannot-link constraint) (otherwise) (otherwise) (otherwise) (otherwise) 制約付き ハミルトニアン 同一レイヤ上のノードのペア (既存) 異なるレイヤ上のノードのペア(追加) Gen Louvain法で 最適化 multiplex multiplex multiplex 𝜇 𝑐 [7]Eguchi and Murata, 2017.
  32. 32. 従来法の問題点 33 制約を人手によって与えている •大規模ネットワークには適用が困難 •ユーザにかかる負担が大きい 適用できる対象が限られる •小規模な無向ネットワークのみ 従来法を改良
  33. 33. 提案法:大規模ネットワークへの拡張 制約付与の自動化 • ネットワークの構造的特徴に基づいて できるだけ人手の場合に近い制約を 自動的に付与 処理の高速化・省メモリ化 • 実装をOctaveからC++に変更 • メモリの動的確保を活用 34
  34. 34. 制約付与の自動化 • 制約付与戦略にしたがって自動的に制約付与 – 制約を付与すべきノードを選択する基準 • 3つの制約付与戦略を提案 35 異なるコミュニティに属する隣接ノードの数が 隣接ノードの総数に占める割合 • boundary: 隣接コミュニティ率が高い ものを優先 • degree: 次数が高いものを優先 • mix: 隣接コミュニティの数が 多いものを優先
  35. 35. boundary戦略 36 隣接コミュニティ率 •3,4,7,8→0 •2 →0.33 •5,6 →0.5 •1 →0.67
  36. 36. degree戦略 次数 •3,4,5,7,8→2 •1,2 →3 •6 →4 37
  37. 37. mix戦略 38 隣接コミュニティ数 •3,4,7,8→0 •2,5 →1 •1,6 →2 隣接コミュニティの 種類 •6→1 •1→2
  38. 38. 提案法のアルゴリズム(1/2) 39 制約付与戦略を選択 制約付きコミュニティ抽出(従来法と同様)
  39. 39. 提案法のアルゴリズム(2/2) 40 精度を計算 制約を自動的に付与 レイヤ間 レイヤ内 NMI: コミュニティ抽出結果を[0,1]で定量化 1に近いほど精度が高い
  40. 40. 処理の高速化・省メモリ化 メリット デメリット Octave • 行列演算が容易 • 反復処理に時間 を要する • 行列宣言の際に 確保できるメモリ が大きくない C++ • 反復処理がOctave に比べて高速 • メモリの動的確保 によって省メモリ化 • 行列演算が面倒 41[10]Eigen: http://eigen.tuxfamily.org/ 行列演算用ライブラリ Eigen[10]を用いる
  41. 41. 実験 42 従来法と提案法の比較実験 • 同じ実験の結果を比較 • 自動の場合にも、人手の場合と同様の 制約を付与できるか? 高速化に関する実験 • 大規模な実ネットワークでコミュニティ抽出、 従来法と提案法で計算時間の比較 大規模化・制約付与戦略に関する実験 • 大規模な人工ベンチマークにおいて 提案法によって制約付きコミュニティ抽出
  42. 42. 従来法と提案法の比較実験 • 人工ベンチマークネットワークにおいて 制約付きコミュニティ抽出を繰り返す – 制約付与戦略: boundary戦略 – 従来法:実装→Octave, 制約付与→手作業 – 提案法:実装→C++, 制約付与→自動 コミュニティ抽出の精度(NMI)を比較 制約付与を自動化した場合にも、人手による 場合と同等の制約を付与することができるか? 43
  43. 43. • パラメータ – 𝜔 = 1 (レイヤ間エッジの重み) – 𝜇 𝑐 = 2 (制約項の重み) 44 ノード数 エッジ数 レイヤ数 Sample1-1 10 11 3 Sample1-2 20 36 3 Sample1-3 30 54 3 Sample1-4 40 67 3 Sample1-5 50 78 3 ※ネットワーク間に依存性はない 従来法と提案法の比較実験
  44. 44. 従来法と提案法の結果の比較 45 正解コミュニティ構造が得られるまでの 変化の仕方はほぼ同じ NMI (精度) 制約数 制約数 従来法 提案法
  45. 45. 高速化に関する実験 • 比較的大規模な実ネットワークにおいて コミュニティ抽出 –正解ラベルがない→制約なし –従来法(Octave)と提案法(C++)で計算時 間を比較 46 ノード数 エッジ数 レイヤ数 YEAST LANDSCAPE MULTIPLEX NETWORK 4,458 8,473,997 4 PIERRE AUGER MULTIPLEX 514 7,153 16
  46. 46. 高速化に関する実験 実験結果:計算時間[sec] 47 従来法 提案法 高速化 YEAST LANDSCAPE MULTIPLEX NETWORK 15,658.7 664.90 23.6倍 PIERRE AUGER MULTIPLEX 54.29 52.91 1.03倍 ノード数が多い場合に、より高速化の効果を発揮
  47. 47. 大規模化・制約付与戦略に関する実験 • 提案法を用いて制約付きコミュニティ抽出 –各パラメータを変化させた複数のネットワーク (人工ベンチマークネットワーク)で比較 –制約付与戦略の比較:boundary, degree, mix 48 [11]Bazzi et al., 2016. Bazziらのベンチマーク[11] • レイヤ間に任意の依存性を持たせる • マルチプレックスだけでなく、テンポラルなど さまざまなマルチレイヤネットワークを生成可能
  48. 48. 大規模化・制約付与戦略に関する実験 • パラメータ: – 𝑝 = 0.95 (レイヤ間の類似度) – 𝜇 𝑐 = 2 (制約項の重み) – 𝜇 = 0.1 or 0.2 (ランダムエッジの割合) – 𝜔 = 0.7 or 0.9 (レイヤ間エッジの重み) 49 𝑝 𝜔 𝑝𝜇 𝑐 𝜇
  49. 49. 各実験の設定 50 𝜔の値が異なる 場合 • Sample3-1、 𝜔 = 0.7 • Sample3-1、 𝜔 = 0.9 𝜇の値が異なる 場合 • Sample3-1、 𝜔 = 0.7 • Sample3-2、 𝜔 = 0.7 ノード数が異なる 場合 • Sample3-1、 𝜔 = 0.7 • Sample3-3、 𝜔 = 0.7 データセット ノード数 エッジ数 レイヤ数 𝝁 Sample3-1 1,000 29,380 5 0.1 Sample3-2 1,000 28,614 5 0.2 Sample3-3 2,000 58,983 5 0.1
  50. 50. 制約付きコミュニティ抽出 (𝜔の値が異なる場合) 51 NMI (精度) 制約数 制約数 𝜔 = 0.7 𝜔 = 0.9 • レイヤ間エッジによるつながりが強い →他のレイヤ上の変化の影響を受けやすい • レイヤ間エッジによるつながりが弱い →柔軟なコミュニティ抽出
  51. 51. 制約付きコミュニティ抽出 (𝜇の値が異なる場合) 52 NMI (精度) 制約数 制約数 𝜇 = 0.1 𝜇 = 0.2 ランダムエッジの割合が大きい→ • ネットワークの構造情報だけでは 正解コミュニティ構造を得ることが難しい • (構造に基づいた)制約が有効になりづらい
  52. 52. 制約付きコミュニティ抽出 (ノード数が異なる場合) 53 NMI (精度) 制約数 制約数 𝑁 = 1000 𝑁 = 2000 ノード数が多い→ • すべてのノードが正解コミュニティに属すること が難しい(誤ったコミュニティに属しやすい) • 他のノードに影響されうるノードが多い
  53. 53. 制約付与戦略の比較(1/3) 54 NMI (精度) 制約数 制約数 𝜔 = 0.7, 𝜇 = 0.1, 𝑁 = 1000 𝜔 = 0.9, 𝜇 = 0.1, 𝑁 = 1000 制約数25あたりから degreeが最も良い boundaryが最も良い
  54. 54. 制約付与戦略の比較(2/3) 55 NMI (精度) 制約数 制約数 𝜔 = 0.7, 𝜇 = 0.2, 𝑁 = 1000 𝜔 = 0.7, 𝜇 = 0.1, 𝑁 = 2000 ほぼ変わらない わずかにmixが良い degreeとmixが同程度 初めはboundaryが良い
  55. 55. 制約付与戦略の比較(3/3) 56 いかなる場合にも有効で あるような(万能な)戦略はない • 𝜔の値が大きい、𝜇の値が小さい →boundary戦略 • 𝜔の値が小さい、𝜇の値が小さい →degree戦略 • 𝜇の値が大きい、またはノード数が多い→mix戦略 ノード数が多い時、途中まではboundary戦略を 用いた場合に最も精度が良い • 最初にboundary戦略→ 途中でdegree戦略またはmix戦略に切り替える? 𝜔 𝜇
  56. 56. まとめ 57 マルチプレックスネットワークにおける 制約付きコミュニティ抽出法の拡張 • 制約付与を自動化:制約付与戦略にしたがう • 高速化、省メモリ化: C++によって実装 結果 • 提案法で従来法と同様の制約を付与できた • 提案法により高速化に成功した • 大規模な人工ネットワークにおいて制約付き コミュニティ抽出をおこなうことができた • ネットワークの特徴に応じて制約付与戦略の 使い分けが必要であるとわかった
  57. 57. 3.研究事例 • 多層ネットワークの制約付きコミュニティ抽出 – "マルチスライスネットワークにおける制約付きコミュニティ抽出 法“, 江口 幸司, 村田 剛志, 人工知能学会論文誌, Vol.32, No.1, p.WII-C_1-9, 2017. https://www.jstage.jst.go.jp/article/tjsai/32/1/32_WII- C/_article/-char/ja/ • 動的ネットワークの情報伝搬の最大化 – "Selecting Seed Nodes for Influence Maximization in Dynamic Networks“, Shogo Osawa, Tsuyoshi Murata, Proceedings of the 6th Workshop on Complex Networks (CompleNet2015), Vol.597, pp.91-98, 2015. https://link.springer.com/chapter/10.1007/978- 3-319-16112-9_9 – "Extended methods for influence maximization in dynamic networks“, Tsuyoshi Murata, Hokuto Koga, Computational Social Networks 5:8, 21 pages, 2018. https://computationalsocialnetworks.springeropen.com/articles /10.1186/s40649-018-0056-8
  58. 58. 動的ネットワークにおける 影響最大化 計算工学専攻 村田研究室 大澤 翔吾 59
  59. 59. 発表内容 • 研究背景 • 関連研究 • 提案手法 • 実験 • 考察 • まとめ 60
  60. 60. 情報や病気の広がり ネットワーク上の情報拡散として表現可能 61 拡散 拡散 情報を最も広く拡散する ノード集合を見つける • 病気の感染拡大防止 • 口コミマーケティングの最 適化 拡散が始まるノード 集合が変わると拡散 規模も大きく変わる
  61. 61. 影響最大化問題 62 入力 • ネットワーク • 情報拡散モデル • シード数𝑘 出力 情報を最も広く拡散で きるノード集合𝒮 𝒮 = 𝑘 • 影響最大化問題は NP-Hard [Kempe 2003] • 多くの近似手法が提案されている [Chen 2013][Ohsaka 2014] – ほとんどは静的ネットワークが対象 • 現実世界のネットワークは動的 – 時間の経過に伴って構造が変化
  62. 62. 動的ネットワーク向けの既存手法 63 精度 速度 中心性ベース 低い 非常に高速 MCSベース 非常に高い 低速 速度と精度を両立した手法がない • 大きく分けて二種類 – 中心性ベース [Holme 2013] – Monte-Carloシミュレーションベース(MCS) [Berger-Wolf 2007]
  63. 63. 研究概要 • 動的ネットワークにおける影響最大化問題の 新しい近似手法を提案 – ノード集合の拡散力を高速なヒューリスティックを用いて 近似 • 精度と速度を両立 64 精度 速度 中心性ベース 低い 非常に高速 MCSベース 非常に高い 低速 提案手法 高い 高速
  64. 64. 発表内容 • 研究背景 • 関連研究 • 提案手法 • 実験 • 考察 • まとめ 65
  65. 65. 𝑡 = 1 情報拡散モデル • SI modelを考える 66 I 情報を持っている (Infected) S 情報を持っていない (Susceptible) I S S I S シード集合𝑈 𝑡 = 2 I S I S 𝑡 = 3 I I S 確率𝜆で状態Iになる (感染率) I I S 𝑈 の拡散力𝜎 𝑈 = 拡散終了時の 𝐼ノード数の期待値
  66. 66. 中心性ベースの手法 67 拡散先に重複が多い ノードを複数選んでしまう 1. 全ノードの中心性計算 2. 中心性が最も高い𝑘個の ノードを出力 高速だが低精度 アルゴリズム なぜ低精度か
  67. 67. 中心性ベースの手法の問題点(1) 68 中心性が最も高い2つのノードを選ぶ C D BA E G F 0.166 0.300 0.143 0.315 0.143 0.20.143 Closeness中心性
  68. 68. 中心性ベースの手法の問題点(2) 69 中心性が最も高い2ノード(B, D): 拡散先に重複が多く,拡散力が大きく増加しない C D BA E G F 0.166 0.300 0.143 0.315 0.143 0.20.143
  69. 69. 中心性ベースの手法の問題点(3) 70 D, Fを選べばより広く拡散 →中心性の情報だけでは判断不可能 C D BA E G F 0.166 0.300 0.143 0.315 0.143 0.20.143
  70. 70. MCSベースの手法 71 拡散力の近似 𝜎 ⋅ の 計算コストが膨大 [𝜎 ⋅ の厳密計算は#P-Hard] 1. 空のノード集合𝒮 = ∅ から始める 2. 拡散力の近似の増分 𝜎 𝒮 ∪ 𝑛 が最大の ノード𝑛を𝒮に順次追加 高精度だが低速 アルゴリズム なぜ低速か
  71. 71. 𝝈 𝒮 の近似計算 𝒮をシードとした情報拡散シミュレーションを𝑅回行い, 拡散規模(情報拡散終了時のIノード数)の平均を 𝜎 𝒮 とする 72 試行回数 拡散規模 1 2ノード 2 4ノード 3 3ノード 平均 𝝈 𝒮 = 𝟐 + 𝟒 + 𝟑 𝟑 = 𝟑 𝑅 = 3のときの例 𝜎 ⋅ を精度よく近似する には大きい𝑅が必要 情報拡散シミュレーションを何 回も行うので低速
  72. 72. 発表内容 • 研究背景 • 関連研究 • 提案手法 • 実験 • 考察 • まとめ 73
  73. 73. 提案手法の処理 1. 空のノード集合𝒮 = ∅から始める 2. 拡散力の近似 𝜎 ⋅ の増分が最大になる ノード𝑛を追加 • 𝑛 = argmax 𝑖∉𝑈 𝜎 𝒮 ∪ 𝑖 − 𝜎 𝒮 3. 𝒮 = 𝑘となるまで追加し続ける 74 基本的なアルゴリズムはMCSと同じ 𝝈 ⋅ の近似手法が異なる
  74. 74. 拡散力𝝈 ⋅ の近似計算 75 1. 𝑝 𝑛 𝑡 = ノード𝑛が時刻𝑡で状態Iである確率の近似 𝑝 𝑛 1 = 1 𝑛 ∈ 𝒮 0 𝑛 ∉ 𝒮 2. 各時刻 𝑡 = 1,2, … 𝑇 に対して 𝑝 𝑛 𝑡 + 1 = 1 − 1 − 𝑝 𝑛 𝑡 𝑖∈neighbors 𝑛,𝑡 1 − 𝑝𝑖 𝑡 𝜆 3. 拡散力の近似 𝜎 𝒮 は 𝑛 𝑖1 𝑖2 𝑖 𝑚 𝜎 𝒮 = 𝑛 𝑝 𝑛 𝑇 + 1 ノードの確率が互いに独立であると仮定する近似 …
  75. 75. 76 厳密計算との比較 A B C D F E <厳密計算> A~Fの経路上にあるノードの 確率は互いに依存している 全経路を列挙して 依存関係を調べるので 計算コストが膨大 A B C D F E <提案手法> 各確率は互いに独立と仮定 隣接ノードだけ見れば良い 𝑃 𝐶, 𝐸 ≠ 𝑃 𝐶 × 𝑃(𝐸) 𝑃 𝐶, 𝐸 = 𝑃 𝐶 × 𝑃(𝐸)として近似 1 1 2 2 3 4 4 1 1 2 2 3 4 4
  76. 76. MCSとの計算量比較 77 手法 𝝈 ⋅ の近似計算量 全体の計算量 MCSベース 𝒪 𝑚𝑅 𝒪 𝑁𝑘𝑚𝑅 提案手法 𝓞 𝒎 𝓞 𝑵𝒌𝒎 MCSのように情報拡散シミュレーションを何回 も実行しないで済むので高速
  77. 77. 発表内容 • 研究背景 • 関連研究 • 提案手法 • 実験 • 考察 • まとめ 78
  78. 78. 実験 • 提案手法との比較対象 – 中心性が高い順に選ぶ手法 (closeness, broadcast) – Monte-Carloシミュレーションを用いた手法 (MCS) 𝑅 = 1,000 • 評価指標 – 各手法が選んだノード集合の拡散力:高いほど良い (情報を拡散できたノードの割合) • データセット 79 名前 ノード数 エッジ数 期間[分] Hospital 75 2,424 5,792 High school 2011 126 28,563 4,539 High school 2012 180 45,049 12,158 Infectious 200 943 469 TI model 500 308,000 3,000
  79. 79. パラメータ設定 1. シード数𝑘を変化させる – 感染率𝜆 = 0.01, 𝑘 = 1,2,3,4,5 – 手法の精度と速度を見る 2. 感染率𝜆を変化させる – 𝜆 = 0.001,0.005,0.01,0.05, 𝑘 = 5 – 精度だけ見る(速度は𝜆に依存しない) 80
  80. 80. 𝒌を変化させる実験(精度) 81 Hospital 提案手法は中心性 ベースの手法より 一貫して精度がよい MCSに精度は劣るが はるかに高速 (次のスライド) シード数𝑘 ノード集合の拡散力[%] 全てのネットワークで 同様の傾向
  81. 81. 𝒌を変化させる実験(速度) 82 TI model 提案手法は,中心性 ベースの手法より低速 だが現実的な計算時間 (30万エッジ,18分) シード数𝑘 実行時間[秒] MCSは192時間もの 計算時間を要した 提案手法の640倍低速 192時間 18分
  82. 82. 感染率𝝀を変化させる実験 83 名前 ノード数 エッジ数 期間[分] Hospital 75 2,424 5,792 High school 2011 126 28,563 4,539 High school 2012 180 45,049 12,158 Infectious 200 943 469 TI model 500 308,000 3,000 A B 感染率の値に対する精度の 振る舞いが2種類に別れた
  83. 83. 実験結果(2-A) 84 Hospital 提案手法は中心性 ベースの手法より 一貫して精度がよい 感染率𝜆の値が増えると 拡散力の差が縮まる 感染率𝜆 ノード集合の拡散力[%] グループAの ネットワークで 同様の傾向
  84. 84. 実験結果(2-B) 85 TI model 提案手法は中心性 ベースの手法より 一貫して精度がよい 感染率𝜆の値が減ると 拡散力の差が縮まる (前スライドと逆の傾向) 感染率𝜆 ノード集合の拡散力[%] グループBの ネットワークで 同様の傾向
  85. 85. 発表内容 • 研究背景 • 関連研究 • 提案手法 • 実験 • 考察 • まとめ 86
  86. 86. 考察 87 ネットワーク 手法間に差異が 見られない条件 Hospital 感染率が高い High school 2011 感染率が高い High school 2012 感染率が高い Infectious 感染率が低い TI model 感染率が低い ネットワークによって 情報の広がりやすさが 大きく異なることが原因 情報が広がりやすいネットワーク: 感染率が大きいと どの手法でも広く拡散 情報が広がりにくいネットワーク: 感染率が小さいと ほとんど拡散しない A B
  87. 87. 情報の広がりやすさ • 各ノード𝑛に対して拡散力𝜎 𝑛 を計算 – シードノードが𝑛だけの時に, 情報がどれくらい拡散するか • 各ノードの拡散力の分布を求めて 情報の広がりやすさを判断 88
  88. 88. 拡散力の分布(グループA) 89 単一ノードの拡散力 % ノード数 𝜆 = 0.05のとき 大多数のノードが 80~90%以上の 拡散力を持つ 情報が非常に 広がりやすい グループAの ネットワークで 同様の傾向 Hospital
  89. 89. 拡散力の分布(グループB) 90 単一ノードの拡散力 % ノード数 𝜆 = 0.001のとき 2%以上の拡散力を持つ ノードが存在しない 情報がほとんど 広がらない グループBの ネットワークで 同様の傾向 TI model
  90. 90. 考察のまとめ 91 ネットワーク 手法間に差異が 見られない条件 ←のときの 情報の広がりやすさ Hospital 感染率が高い 非常に広がりやすい High school 2011 感染率が高い 非常に広がりやすい High school 2012 感染率が高い 非常に広がりやすい Infectious 感染率が低い ほとんど広がらない TI model 感染率が低い ほとんど広がらない 情報が非常に広がりやすい(にくい) 極端な状況でなければ提案手法は特に有効
  91. 91. 発表内容 • 研究背景 • 関連研究 • 提案手法 • 実験 • 考察 • まとめ 92
  92. 92. まとめ • 動的ネットワークにおける影響最大化問題の 新しい近似手法を提案 – 拡散力を高速に近似する貪欲アルゴリズム – 精度と速度を両立 • 比較実験 – 感染率によっては手法間に違いが見られなかった – 情報が非常に広がりやすいかほとんど広がらない という極端な状況以外では,提案手法は特に有効 93
  93. 93. 4. トピックス • テンソルによる表現 • ランダムウオーク、移動可能性(navigability) • multilayer networkのランキング • temporal networkとmultilayer network • multilayer networkのネットワーク特徴量 • multilayer networkの生成モデル • multilayer networkのコミュニティ抽出
  94. 94. 隣接行列とテンソル • 通常ネットワークG=(V,E)における隣接行列 – A∈{0,1} |V|×|V| (2次元行列) – Aij = 1 iff (i,j) ∈E • multilayer networkM=(VM, EM, V, L)における隣 接テンソル – A∈{0,1} |V|×|V|×|L1|×|L1|×…×|Ld|×|Ld| – Auvαβ = 1 iff ((u,α),(v,β)) ∈EM
  95. 95. テンソル • n次元の隣接行列 頂点 レイヤ レイヤ間 基底 レイヤ内 基底
  96. 96. “Mathematical Formulation of Multilayer Networks” • Manlio De Domenico, Albert Sole-Ribalta, Emanuele Cozzo, Mikko Kivela, Ytamir Moreno, Mason A. Porter, Sergio Gomez and Alex Arenas • Physical Review X, 3, 041022, 2013, 15pages • ネットワーク特徴量(次数中心性、クラスタ係数、固有 ベクトル中心性、モジュラリティ、von Neumann entropy, diffusion)をテンソル表現に拡張。特殊な場合 として単一レイヤネットワークでのテンソル表現は既 存の特徴量と同一になることを示す。 • multiplexに限定されず、一般的なmultilayerでの枠組。
  97. 97. “Diffusion Dynamics on Multiplex Networks” • S. Gomez, A. Diaz-Guilera, J. Gomez-Gardenes, C. J. Perez-Vicente, Y. Moreno, A. Arenas • Physical Review Letters, 110, 028701, 5pages, 2013 • 2層のmultiplex networkにおけるsupra- Laplacianの定義 ((N1+N2)×(N1+N2)の行列で 表記) • Layer間の係数が小さい場合と大きい場合に 分けて議論
  98. 98. 移動可能性(navigability) • multilayer networkでのランダムウオーク – 時刻t+Δtのレイヤβの 頂点jでの滞在確率 同一頂点 に留まる 他レイヤ の対応頂 点に移動 同一レイ ヤの他頂 点に移動 他レイヤ の他頂点 に移動
  99. 99. Multilayer networkとしてのロンドン交 通網 • ランダムな故障に対する理論的耐性 (resilience)は、実際の地下鉄不通のtweetに よる実データとかなり一致
  100. 100. “Navigability of interconnected networks under random failures” • Manlio De Domenico, Albert Sole-Ribalta, Sergio Gomez, and Alex Arenas, PNAS, doi 10.1073/pnas.1318469111 (2014) • ランダムウオークによるカバレッジ、ランダムな 故障に対するresilienceについて • Navigationを(i)同じノードに留まる(ii)同じレイヤ 内i->jに移動(iii)同じノードでレイヤα->βに移動 (iv)異なるノードi->j異なるレイヤα->βに移動に分 けて定式化 • London地下鉄や航空ネットワークなどのシミュ レーションと実データとの比較
  101. 101. multilayer networkでのランキング • multilayer networkとそれをaggregateした単 純ネットワークとではランキングが異なる – 周辺的なノードの中心性を過剰評価する傾向
  102. 102. “Ranking in interconnected multilayer networks reveals versatile nodes” • Manlio De Domenico, Albert Sole-Ribalta, Elisa Omodei, Sergio Gomez, Alex Arenas • Nature Communications 6, Article number:6868, Published 23 April 2015 • doi:10.1038/ncomms7868 • Multilayer networkの中心性としてversatile centralityを提案。Aggregateなものと比較して 予測精度が向上。航空会社ネットワークでの 渋滞シミュレーションなどで実験
  103. 103. temporal networkとしてのmultilayer network • 一定の間隔毎に切ってmultilayer network化 – 「一定の時間間隔」をどう決めるか – layer間の辺の強さをどう決めるか A B C D EF 0<=t < 5 A B C D EF 5<=t < 10 A B C D EF 10<=t < 15 "Temporal Networks", Petter Holme, Jari Saramakid, Physics Reports, Vol.519, Issue 3, pp.97–125, 2012
  104. 104. “Temporal Networks”でのランダム化 時刻をランダム化 頂点ペアは不変 元の動的グラフ 頂点ペアをランダ ム化 時刻は不変 RP RE
  105. 105. RPとRE • RP(randomly permuted times): – コンタクト時刻をランダム化 – トポロジーは不変 • RE(randomized edges) – 各辺の端点を他辺のとランダムに交換 – トポロジーは変わる 各時刻の辺出現数は不変 コンタクト順序の影響 を調べるのに使う トポロジーの影響 を調べるのに使う RP RE
  106. 106. ネットワーク特徴量 • 例: クラスタ係数 • [Manlio De Domenico, 2013]は次数中心性、 クラスタ係数、固有 ベクトル中心性、モ ジュラリティ、von Neumann entropy, diffusion)をテンソル 表現に拡張。
  107. 107. Multilayer networkの特徴量 • (Kivela et al., “Multilayer Networks”より) • layer内networkを比較する特徴量 – global overlap[45]: 2つのlayerで共有する辺の数 – global inter-clustering coefficient[259]:layerにまたがるクラスタ係数 – layer間の隣接行列要素の相関[19] – degree of multiplexity[178]:(複数の型の辺をもつ頂点ペア数)/(全ての頂点ペ ア数) – 次数やlocal clustering coefficientの相関[19,104,182,250,259] • 純粋にmulti-layerに特有の特徴量 – interdependence[234,250]:最短パスの中で、複数のlayer辺が使われる割合 – 全頂点が全layerにあるmultiplex network以外の特徴量 • 頂点のmultiplexity degree [285]:その頂点が存在するlayerの数 • [67]:社会ネットでmultiplexity degreeが1のものと2以上のもの(bridge)を比較 – layer毎に別communityと解釈なら、assortativityやmodularityも特徴量[226]
  108. 108. ネットワーク生成モデル • (節番号や論文引用はKivela et al., “Multilayer Networks”のもの)
  109. 109. 4.3 Models of Multiplex Networks • 人工multiplex networksを作る単純な方法 – 通常の生成モデル(ER random graph や configuration model)を用いて各層を作り、次に layer間を辺でつなぐ[125,199,231][125,217] – 各層を独立に作ったmultiplex networkから始め て、次に(ノードのラベルを変えるなどして)layer間 の相関を作り出す方法[104] • Exponential random graph models (ERGMs)は multilevel networksやmultiplex networksを扱 える [122,273,274][153]𝑃(𝐺 𝑀) = exp 𝜃 ∙ 𝑓 𝐺 𝑀 𝑍 𝜃 model parameter を表すベクトル 正規化関数 network diagnostics(異 種辺の△)のベクトル
  110. 110. microcanonical/canonical network ensembles[256,316] • microcanonical ensembles – 制約集合を厳密に満たすネットワークの集合 • canonical network ensembles – Shannon entropy最大化:平均的に制約を満たす – multiplex networkよりも辺の重なりに対して有効 • (空間に埋め込まれた)spatial networksのモデ ル化に使われる[150]
  111. 111. 他の生成モデル • 優先的選択などの手法をmultiplex networkに拡 張したもの – Criado[95](一部の頂点だけを含んだ)layerを増やすこ とでmultiplex networkの成長をモデル化 – 優先的戦略で辺や頂点を追加するもの[182,214,250] • layer間の辺が作られる確率は、layer内の次数(からなる関 数)に比例 • attachment kernelがaffine(平行移動を伴う線形写像) • 異なるlayerに頂点が異なる回数だけ生成されるのを許すモ デル • 非線形のattachment kernel attachment kernel
  112. 112. 4.4 Models of interconnected networks • monoplexネットワークの生成モデルを他のmultilayer に一般化 – 動的プロセスの研究にモデルは有効 • 似通ったネットワークモデルの研究 – interacting network, node color, node type, module – block modelやmixture modelによるモデル化も • 単純な方法は各layerを作って、異なるlayer間をランダ ムに辺で結ぶ(lattice, ER random graph, configuration network, BA network) – 均一にランダムにする必要はない • layer間を結ぶ異なる戦略で中心性がどう変わるかの研究 • SIRでの伝搬にどう影響するかの研究
  113. 113. configuration modelの拡張 • 複数の次数分布を多変数で表す – [10,200] – Soderberg – Newman – Gleeson – [17] node-colored graphのERモデル – [9] node-colored 2部グラフのconfiguration model • layer内-layer間の次数相関を取り入れたモデ ル 𝑃𝛼(𝑘1, … , 𝑘 𝑏) layer αの頂点がlayer βの頂点kβ個とつながる確率 𝑃(𝑘1, … , 𝑘 𝑏) layer独立な多次元分布 + 𝜏 𝛼𝛽 layerαとβ間 の辺の割合 𝑃𝛼(𝑘) 各layerの次数分布 + mixing matrix layer間の 辺の割合 結合確率行列P 𝑃 𝛼𝛽(𝑘) layerαの頂点がk個のlayerβ の頂点とつながる確率 𝑃 𝛼𝛽(𝑘, 𝑘′) layerα内で次数kの頂点がk’個のlayerβの頂点とつながる確率 𝑃 𝛼𝛽(𝑘 𝛼𝛼, 𝑘 𝛼𝛽, 𝑘′ 𝛽𝛽, 𝑘′ 𝛼𝛽) layer間次数layer内次数
  114. 114. configuration model • (2頂点をランダムに選んで辺を追加する) random graphでは次数分布がポアソン分布 • 任意の次数分布のネットワークを生成する手 法 – 与えられた次数の切り株を用意 – 切り株の間をランダムにつなぐ 頂 点 次 数 a 2 b 2 c 3 d 3 e 4 a b c d e b c ed a a b c d e
  115. 115. パラメータ Stochastic block model (1) • 与えられたグラフの背後にある生成モデルの パラメータ – k:グループ数 – 𝑧:各頂点のグループID – M:グループ間の結合確率の行列(k*k) • モデルからグラフを生成 – 頂点iとjの間の辺をMzizjの確率で生成(ziとzjは頂 点iとjが属するグループのID) • グラフからモデルを推定 予め与える http://tuvalu.santafe.edu/~aaronc/courses/5352/fall2013/
  116. 116. Stochastic block model (2) • M(stochastic block matrix)と生成されるグラフ – グループ内:ランダムグラフ、グループ間:ランダム 2部グラフ http://tuvalu.santafe.edu/~aaronc/courses/5352/fall2013/ 対角成分0.50 それ以外0.01 →グループ内が密 対角成分0.01 それ以外0.12 →グループ間が密
  117. 117. コミュニティ抽出 • (節番号や論文引用はKivela et al., “Multilayer Networks”のもの)
  118. 118. 4.5 Communities and other mesoscale structures • monoplex networkでもコミュニティの定義は様々 • multilayer networkではさらにひどい状況 – 次数ひとつとってもいろいろな拡張があるから • blockmodeling[33,112,152,350] – 類似結合パターンの頂点集合を出力 – 必ずしも密な部分を見つけるものではない • roleを割り当てる[264] • monoplexからスタートしてlayerを割り当てて multilayerにする[83,270]
  119. 119. Community structure in multilayer networks (1) • multilayerでのコミュニティ抽出研究は僅か • Muchaによるmodularityの拡張[237,238] – ひとつの頂点がlayerによって別のコミュニティに 属しても良い – 最適化は計算量的に問題 • 特にtemporal networkの時に顕著 • 最適解を維持してサイズを小さくする手法[12]を multislice modularity最適化に適用[74] 𝑄 𝑚𝑢𝑙𝑡𝑖𝑠𝑙𝑖𝑐𝑒 = 1 2𝜇 𝑖𝑗𝑠𝑟 𝐴𝑖𝑗𝑠 − 𝛾𝑠 𝑘𝑖𝑠 𝑘𝑗𝑠 2𝑚 𝑠 𝛿 𝑠𝑟 + 𝛿𝑖𝑗 𝐶𝑗𝑠𝑟 𝛿 𝑔𝑖𝑠, 𝑔𝑗𝑟 i,j:node r,s:slice Aijs:slice sのnode i-j間の辺 Cjsr:node iのslice s-r間の辺 Kis:node iのslice s内の次数 2ms:slice s内の辺総数 γs:slice s内のresolution parameter 2μ:全sliceの辺総数 slice node "Community Structure in Time-Dependent, Multiscale, and Multiplex Networks",Peter J. Mucha et al., Science Vol.328 No. 5980 pp.876-878 2010.
  120. 120. Community structure in multilayer networks (2) • multilayer networkのnull modelをどうするか – modularityは「ランダムな」ネットワークと比べて密かを調べる 関数 – null modelの決め方によって、得られるコミュニティも異なる – [29]はいろいろなnull modelを提案 – Multislice modularityの最適化 • 政党の再組織化[237,238] • 振る舞いのダイナミクス[362] • 脳機能ネットワーク[30,32] • 非線形振動子の動的な出力の振る舞い[29,31] • 国際関係ネットワーク[94] – モジュラリティだけでなくコミュニティ抽出手法もmultilayerに拡 張[237,238][96]
  121. 121. Community structure in multilayer networks (3) • Spectral clusteringの拡張 – [228]はspectral clusteringと、 hypergraphへのPerron- Frobenius theoremを拡張し、multilayer networkを hypergraphに写像したものに適用 – [204]:heavy subgraphの拡張(recurrent heavy network) • 各layerで従来手法でコミュニティを抽出 – [20]では各layerでのコミュニティと、全layerをつぶした aggregated networkのコミュニティを比較→かなりの違い あり→aggregationによって情報欠損 – [44]では各layerでコミュニティを抽出し、各頂点を tuple(c,α)で表現し、(閾値以上出現する)layer内コミュニ ティの集合としてmultilayer communityを定義
  122. 122. Community structure in multilayer networks (4) • multilayer networkをaggregateすれば(つぶせば)、従来のコミュニ ティ抽出手法が適用可→全ての可能な(2bの)aggregationを試す [213] • [333]:各layerでの目的関数(utility matrix)の和をutility integration と定義 – modularityならutility matrix=modularity matrix • Inverse community detection – 真のcommunityが与えられている→aggregateしたネットワークから真 のコミュニティが抽出されるようにaggregateの際の線形結合の重みを 調整する[72] – [275]:より複雑な重みづけ(metaclustering) • ランダムな重みづけでいろいろaggregateして、それぞれをclusteringして、異 なるclusterの距離行列を作る←階層クラスタリングを用いてコミュニティ抽出 • Multi-relational dataのクラスタリング手法[319-321]
  123. 123. 4.5.2 methods based on tensor decomposition • monoplex networkに対するSVDのように、 multiplex networkに対してはtensor- decompositionを用いる – CANDECOM/PARAFAC(CP):𝐴 𝑢𝑣𝛼 ≈ 𝑟 𝑅 𝑥 𝑢𝑟 𝑦𝑣𝑟 𝑧 𝛼𝑟 • 𝑥, 𝑦 ∈ 𝑅 𝑛×𝑅, 𝑧 ∈ 𝑅 𝑏×𝑅 – three-way DEDICOM, Tucker decomposition [14,322] – Nonnegative tensor factorization [131] – hypergraphのクラスタリング手法を利用[207]
  124. 124. “Comparison of communities detection algorithms for multiplex” • Chuan Wen Loe, Henrik Jeldtoft Jensen • Physica A: Statistical Mechanics and its Applications, Volume 431, 1 August 2015, Pages 29–45 • http://www.sciencedirect.com/science/article/pii/S0378437115002125 • multiplex networkからのコミュニティ抽出手法の比較を行った論文。人工 ネットワークとして、Erdos-Renyiランダムグラフ、WSスモールワールドグラ フ、BAスケールフリーグラフの3つを組み合わせた6通りの2層グラフに対 して、projection3種類(A1A2A3)、クラスタベース類似度分割(A4)、一般カ ノニカル相関(A5)、CLECC bridge検出(A6)、頻出パターンマイニング(A7)、 テンソル分解(A8)の8通りでコミュニティ抽出を行い、類似点や相違点を 比較。Redundancy, CLECC, modularityに注目して2層コミュニティを結合し たSSRM(structured synthetic random multiplex)というベンチマークを提案 • 評価手法としてはNMIの他に、overlapping communitiesの評価手法とし てOmega Indexを使う。これは同じコミュニティに属する頂点ペアの集合を 考え、二つの分割でのその集合のANDの大きさをもとに計算する指標。
  125. 125. “Finding Redundant and Complementary Communities in Multidimensional Networks”• Michele Berlingerio, Michele Coscia, Fosca Giannotti, CIKM 2011, pp.2181-2184, 2011. • Multidimensional networkにおけるコミュニティの評価指標として、 complementarityとredundancyを提案 • コミュニティ抽出手法自体は、multilayerを単一layerに重みづけ projectionして既存手法を利用。 • IMDbの実データで3つのコミュ抽出手法(Label propagation, random walk, fast greedy optimization)、3つの重みづけ手法 (flattening, 重み付きflattening, common neighbor重みづけ)の結 果を比較 • 3つの問いQ1:異なる重みづけとコミュ抽出手法での性能評価、Q2: 重みづけとコミュ抽出手法が、complementarityとredundancyの分 布に与える影響、Q3:重みづけとコミュ抽出手法のベストパラメータ • コミュニティの実例も示す。 multilayer networkをaggregateして コミュニティ抽出する論文も多い
  126. 126. 5. ツール • MuxViz – http://muxviz.net/ – Multilayer networkの可視化・分析ツール • GenLouvain – http://www.plexmath.eu/?page_id=327 – コミュニティ抽出手法のLouvain法[Blodel 2008]を multiplexに拡張 • MapEquation – http://www.mapequation.org/ – ランダムウオークによるコミュニティ抽出手法Infomap [Rosvall, 2008]をmultiplexに拡張
  127. 127. Multilayer Networksの可視化 • http://www.plexmath.eu/?page_id=327 • http://muxviz.net/
  128. 128. Pythonベースの分析・可視化ツール • Pymnet – http://www.mkivela.com/pymnet/index.html – 大規模化を考慮した実装 • multiNetX – https://github.com/nkoub/multinetx – 従来のツール(networkX)の拡張 • Py3Plex – https://github.com/SkBlaz/Py3plex – 可視化、アニメーションを重視
  129. 129. 5. データセット(1) • 実データ [Kivela 2014]参照
  130. 130. 5. データセット(2) • 人工データ – mLFR Benchmark: Testing Community Detection Algorithms in Multi-layered, Multiplex and Multiple Social Networks (Netsci2015 talk) – https://www.ii.pwr.edu.pl/~brodka/mlfr.php
  131. 131. 5. データセット(3) • Mark Newman's Website – http://www-personal.umich.edu/~mejn/netdata/ • Stanford Network Analysis Project – http://snap.stanford.edu/ • Network Repository – http://networkrepository.com/ • Sociopatterns – http://www.sociopatterns.org/datasets/ • Kaggle (for data science) – https://www.kaggle.com/ • Google Dataset Search – https://toolbox.google.com/datasetsearch
  132. 132. 5. 関連国際会議(物理系) • NetSci (2020.7.6-10?, Rome) – https://netscisociety.net/home • NetSci-X (2020.1.20-23, Tokyo) – https://netscix2020tokyo.github.io/ • CompleNet (2020.3.31-4.3, Exeter, UK) – https://complenet.weebly.com/ • CCS(ECCS) (2019.9.30-10.4, Singapore) – http://event.ntu.edu.sg/ccs2019/Pages/Home.aspx • Complex Networks (2019.12.10-12, Lisbon) – http://www.complexnetworks.org/
  133. 133. 関連国際会議 (人工知能、機械学習、Web、社会学) • IC2S2 (2019.7.17-20, Amsterdam) – https://2019.ic2s2.org/ • KDD (2019.8.4-8, Anchorage) – https://www.kdd.org/kdd2019/ • IJCAI (2019.8.10-16, Macao) – https://ijcai19.org/ • ECML/PKDD 2019.9.16-20, Wurzburg) – http://ecmlpkdd2019.org/ • CIKM (2019.11.3-7, Beijing) – http://www.cikm2019.net/ • ICDM (2019.11.8-11, Beijing) – http://icdm2019.bigke.org/ • BigData (2019.12.9-12, Los Angeles) – http://cci.drexel.edu/bigdata/bigda ta2019/index.html • NeurIPS (2019.12.2-8, Vancouver) – https://nips.cc/ • WSDM 2020.2.5-9, Houston) – http://www.wsdm- conference.org/2020/ • AAAI (2020.2.7-12, New York) – https://aaai.org/Conferences/AAAI -20/ • TheWeb(WWW) (2020.4.20-24, Taipei) – https://www2020.thewebconf.org/ • Sunbelt (2020.6.1-7, Paris) – https://www.insna.org/news/sunb elt-2020-save-the-date---june-1-7- 2020 • ICWSM (2020.6.?-?, Atlanta) – https://www.icwsm.org/2020/
  134. 134. 関連国内会議 • ネットワーク生態学研究会 (2020.3.2-3) – http://www.neteco.jp/symposium.html • 計算社会科学研究会 – https://css-japan.com/ • ネットワークが創発する知能研究会 – http://www.ai.comp.ae.keio.ac.jp/jwein19/ • (電子情報通信学会情報ネットワーク科学特別 研究専門委員会(活動終了)) – https://www.ieice.org/~netsci/
  135. 135. 5.参考文献 • チュートリアル – Mason Porter: “Multilayer Network Tutorial” https://web.stanford.edu/group/networkforum/cgi-bin/drupal/node/53 – Alex Arena: “Multilayer interconnected complex networks: an introduction” http://lbs.epfl.ch/files/content/sites/lbs/files/shared/talks- guests/EPFL_Arenas.pdf – Rushed Kanawati: “Mining Multiplex Network: A tutorial” http://lipn.fr/munm/MUNM/Home.html • サーベイ論文 – Kivela et al., “Multilayer Networks”, Journal of Complex Networks 2 (3), pp.203 - 271 (2014), http://comnet.oxfordjournals.org/content/early/2014/07/14/comnet.c nu016 – Boccaletti et al., “The structure and dynamics of multilayer networks”, Physics Reports, 544, pp.1-122 (2014), http://www.sciencedirect.com/science/article/pii/S0370157314002105 • ネットワーク分析全般のリンク集 – Awesome Network Analysis https://github.com/briatte/awesome- network-analysis
  136. 136. まとめ • 現実の複雑な関係を表現・分析する枠組みと しての多層ネットワーク – そもそもデータからネットワークをどう作るか、 ネットワークとして捉えるのが適切か – 未観測部分、ノイズ、動的変化などをどうするか – ネットワークを「分析」したら、どう「制御」するか
  137. 137. 多層ネットワークによる 構造データ分析 村田剛志 東京工業大学 情報理工学院 情報工学系 murata@c.titech.ac.jp http://www.net.c.titech.ac.jp/ 令和元年度 東北大学電気通信研究所 共同プロジェクト研究会 応用物理学会プラズマエレクトロニクス分科会 第32回プラズマ新領域研究会 物理 化学混成系プラズマにおける情報系機能発現 ~プラズマ反応場をネットワーク科学として捉える~ 本スライドはslideshareにて公開 上記サイトにリンクあり

Editor's Notes

  • コミュニティ抽出はネットワーク分析の手法の一つ
    ネットワークからエッジのつながりが密な部分ネットワーク(コミュニティ)を見つけ出すことをいう
    背景知識やユーザからのフィードバックなどを考慮したコミュニティ抽出を制約付きコミュニティ抽出という
    制約を考慮することで精度の向上が期待される

    このネットワークでは、たとえばこのようなコミュニティ構造を得ることができる
    居住地の情報を制約として考慮した場合、このようにコミュニティ構造が変化することが考えられる
  • コミュニティ抽出はネットワーク分析の手法の一つ
    ネットワークからエッジのつながりが密な部分ネットワーク(コミュニティ)を見つけ出すことをいう
    背景知識やユーザからのフィードバックなどを考慮したコミュニティ抽出を制約付きコミュニティ抽出という
    制約を考慮することで精度の向上が期待される

    このネットワークでは、たとえばこのようなコミュニティ構造を得ることができる
    居住地の情報を制約として考慮した場合、このようにコミュニティ構造が変化することが考えられる
  • 複数のネットワークをエッジでつなぐことによって組み合わせたネットワークをマルチプレックスネットワークという
    これを構成するそれぞれのネットワークをレイヤーと呼ぶ
    各レイヤーは同じノードの集合を持ち、レイヤー間のエッジは同じノード間のみに存在する
  • マルチプレックスネットワークは交通網や人間関係といったノード間に複数の種類のつながりがあるようなネットワークを表現するのに役立つ
    マルチプレックスネットワークにおいてコミュニティ抽出をおこなうことで、そのようなネットワークの分析が可能
  • コミュニティ抽出は評価関数と呼ばれる、コミュニティ抽出の結果の質を定量化するための関数を何らかのアルゴリズムによって最適化することでおこなわれる
    評価関数にはモジュラリティやそれを一般化したハミルトニアンなどがある
    これまでの研究では、モノプレックスネットワークの制約付きコミュニティ抽出の評価関数である制約付きハミルトニアンをマルチプレックスネットワークに拡張し、その最適化法にマルチプレックスネットワークのモジュラリティ最適化法であるGen Louvain法を用いることでマルチプレックスネットワークにおける制約付きコミュニティ抽出をおこなう方法を提案していた
  • この問題を解決するため、本研究ではマルチプレックスネットワークにおいて制約付きコミュニティ抽出を適用できる対象を広げることが目的
    主に大規模ネットワークと有向ネットワークに対応することを目指す
    これによって制約付きコミュニティ抽出をSNSや人間関係、論文の引用関係などの分析に用いることができるなど、応用範囲が広がることが期待される

    大規模ネットワークに対応するために制約付与を自動化する
    有向グラフで表されるネットワークに対応するために評価関数を拡張する
  • 本研究では、マルチスライスネットワークにおけるハミルトニアンを、このように定義しました。
    まず、初めの四つの項は同一スライス上に存在するノード同士の関係を考慮しています。
    これは、シングルスライスネットワークにおけるハミルトニアンと同じものであり、同じコミュニティに属するノード同士にエッジがあれば報酬、なければ罰則、異なるコミュニティに属するノード同士にエッジがあれば罰則、なければ報酬を与えています。
    これに、異なるスライス上に存在するノード同士の関係を考慮するための項を付け加えます。
    五項目は同じコミュニティに属するノード同士にエッジがあれば報酬を、異なるコミュニティに属するノード同士にエッジがあれば罰則を与えています。
    なお、ハミルトニアンは、値が小さいほどいいコミュニティ抽出結果であることを表します。
  • 次に、マルチスライスネットワークのハミルトニアンに制約を与えるための制約項をこのように定義します。
    本研究では、ノードのペアに対して、同じコミュニティに属するべきであるという正の制約、または異なるコミュニティに属するべきであるという負の制約を与えることにします。
    一つ目の項は、同じスライス内に存在するノード同士に関する制約を考慮しています。
    これは、シングルスライスネットワークにおける制約項と同じです。
    二項目は、異なるスライス上に存在するノード同士に関する制約を考慮しています。
    ここでは、異なるスライス上に存在するノードのペアは、同じノードのみを考えます。
    この二つの項は、制約が与えられたノード同士が属するコミュニティが、与えられた制約と異なる場合に制約を与えています。
    たとえば、正の制約が与えられたノード同士が異なるコミュニティに属する場合には罰則が与えられます。

    この制約項にパラメータμで重み付けして、ハミルトニアンに付加することで、マルチスライスネットワークにおける制約付きハミルトニアンを構築します。
  • この問題を解決するため、本研究ではマルチプレックスネットワークにおいて制約付きコミュニティ抽出を適用できる対象を広げることが目的
    主に大規模ネットワークと有向ネットワークに対応することを目指す
    これによって制約付きコミュニティ抽出をSNSや人間関係、論文の引用関係などの分析に用いることができるなど、応用範囲が広がることが期待される

    大規模ネットワークに対応するために制約付与を自動化する
    有向グラフで表されるネットワークに対応するために評価関数を拡張する
  • 大規模ネットワークに対応するために、入力されたネットワークに対して何らかの戦略に則って自動的に制約を付与するプログラムの実装を目指す
    制約付与の際に用いる戦略としては、先行研究である仲田らがおこなった制約付きコミュニティ抽出の実験で用いられたものを中心に検討する
    boundary、hub、betweenness、deltaHなど
  • 大規模ネットワークに対応するために、入力されたネットワークに対して何らかの戦略に則って自動的に制約を付与するプログラムの実装を目指す
    制約付与の際に用いる戦略としては、先行研究である仲田らがおこなった制約付きコミュニティ抽出の実験で用いられたものを中心に検討する
    boundary、hub、betweenness、deltaHなど
  • 大規模ネットワークに対応するために、入力されたネットワークに対して何らかの戦略に則って自動的に制約を付与するプログラムの実装を目指す
    制約付与の際に用いる戦略としては、先行研究である仲田らがおこなった制約付きコミュニティ抽出の実験で用いられたものを中心に検討する
    boundary、hub、betweenness、deltaHなど
  • 大規模ネットワークに対応するために、入力されたネットワークに対して何らかの戦略に則って自動的に制約を付与するプログラムの実装を目指す
    制約付与の際に用いる戦略としては、先行研究である仲田らがおこなった制約付きコミュニティ抽出の実験で用いられたものを中心に検討する
    boundary、hub、betweenness、deltaHなど
  • 大規模ネットワークに対応するために、入力されたネットワークに対して何らかの戦略に則って自動的に制約を付与するプログラムの実装を目指す
    制約付与の際に用いる戦略としては、先行研究である仲田らがおこなった制約付きコミュニティ抽出の実験で用いられたものを中心に検討する
    boundary、hub、betweenness、deltaHなど
  • 大規模ネットワークに対応するために、入力されたネットワークに対して何らかの戦略に則って自動的に制約を付与するプログラムの実装を目指す
    制約付与の際に用いる戦略としては、先行研究である仲田らがおこなった制約付きコミュニティ抽出の実験で用いられたものを中心に検討する
    boundary、hub、betweenness、deltaHなど
  • 大規模ネットワークに対応するために、入力されたネットワークに対して何らかの戦略に則って自動的に制約を付与するプログラムの実装を目指す
    制約付与の際に用いる戦略としては、先行研究である仲田らがおこなった制約付きコミュニティ抽出の実験で用いられたものを中心に検討する
    boundary、hub、betweenness、deltaHなど
  • 大規模ネットワークに対応するために、入力されたネットワークに対して何らかの戦略に則って自動的に制約を付与するプログラムの実装を目指す
    制約付与の際に用いる戦略としては、先行研究である仲田らがおこなった制約付きコミュニティ抽出の実験で用いられたものを中心に検討する
    boundary、hub、betweenness、deltaHなど
  • 大規模ネットワークに対応するために、入力されたネットワークに対して何らかの戦略に則って自動的に制約を付与するプログラムの実装を目指す
    制約付与の際に用いる戦略としては、先行研究である仲田らがおこなった制約付きコミュニティ抽出の実験で用いられたものを中心に検討する
    boundary、hub、betweenness、deltaHなど
  • 大規模ネットワークに対応するために、入力されたネットワークに対して何らかの戦略に則って自動的に制約を付与するプログラムの実装を目指す
    制約付与の際に用いる戦略としては、先行研究である仲田らがおこなった制約付きコミュニティ抽出の実験で用いられたものを中心に検討する
    boundary、hub、betweenness、deltaHなど
  • 大規模ネットワークに対応するために、入力されたネットワークに対して何らかの戦略に則って自動的に制約を付与するプログラムの実装を目指す
    制約付与の際に用いる戦略としては、先行研究である仲田らがおこなった制約付きコミュニティ抽出の実験で用いられたものを中心に検討する
    boundary、hub、betweenness、deltaHなど
  • 大規模ネットワークに対応するために、入力されたネットワークに対して何らかの戦略に則って自動的に制約を付与するプログラムの実装を目指す
    制約付与の際に用いる戦略としては、先行研究である仲田らがおこなった制約付きコミュニティ抽出の実験で用いられたものを中心に検討する
    boundary、hub、betweenness、deltaHなど
  • 大規模ネットワークに対応するために、入力されたネットワークに対して何らかの戦略に則って自動的に制約を付与するプログラムの実装を目指す
    制約付与の際に用いる戦略としては、先行研究である仲田らがおこなった制約付きコミュニティ抽出の実験で用いられたものを中心に検討する
    boundary、hub、betweenness、deltaHなど
  • 大規模ネットワークに対応するために、入力されたネットワークに対して何らかの戦略に則って自動的に制約を付与するプログラムの実装を目指す
    制約付与の際に用いる戦略としては、先行研究である仲田らがおこなった制約付きコミュニティ抽出の実験で用いられたものを中心に検討する
    boundary、hub、betweenness、deltaHなど
  • 大規模ネットワークに対応するために、入力されたネットワークに対して何らかの戦略に則って自動的に制約を付与するプログラムの実装を目指す
    制約付与の際に用いる戦略としては、先行研究である仲田らがおこなった制約付きコミュニティ抽出の実験で用いられたものを中心に検討する
    boundary、hub、betweenness、deltaHなど
  • 大規模ネットワークに対応するために、入力されたネットワークに対して何らかの戦略に則って自動的に制約を付与するプログラムの実装を目指す
    制約付与の際に用いる戦略としては、先行研究である仲田らがおこなった制約付きコミュニティ抽出の実験で用いられたものを中心に検討する
    boundary、hub、betweenness、deltaHなど
  • 大規模ネットワークに対応するために、入力されたネットワークに対して何らかの戦略に則って自動的に制約を付与するプログラムの実装を目指す
    制約付与の際に用いる戦略としては、先行研究である仲田らがおこなった制約付きコミュニティ抽出の実験で用いられたものを中心に検討する
    boundary、hub、betweenness、deltaHなど
  • 大規模ネットワークに対応するために、入力されたネットワークに対して何らかの戦略に則って自動的に制約を付与するプログラムの実装を目指す
    制約付与の際に用いる戦略としては、先行研究である仲田らがおこなった制約付きコミュニティ抽出の実験で用いられたものを中心に検討する
    boundary、hub、betweenness、deltaHなど
  • 大規模ネットワークに対応するために、入力されたネットワークに対して何らかの戦略に則って自動的に制約を付与するプログラムの実装を目指す
    制約付与の際に用いる戦略としては、先行研究である仲田らがおこなった制約付きコミュニティ抽出の実験で用いられたものを中心に検討する
    boundary、hub、betweenness、deltaHなど
  • 大規模ネットワークに対応するために、入力されたネットワークに対して何らかの戦略に則って自動的に制約を付与するプログラムの実装を目指す
    制約付与の際に用いる戦略としては、先行研究である仲田らがおこなった制約付きコミュニティ抽出の実験で用いられたものを中心に検討する
    boundary、hub、betweenness、deltaHなど
  • 大規模ネットワークに対応するために、入力されたネットワークに対して何らかの戦略に則って自動的に制約を付与するプログラムの実装を目指す
    制約付与の際に用いる戦略としては、先行研究である仲田らがおこなった制約付きコミュニティ抽出の実験で用いられたものを中心に検討する
    boundary、hub、betweenness、deltaHなど
  • 大規模ネットワークに対応するために、入力されたネットワークに対して何らかの戦略に則って自動的に制約を付与するプログラムの実装を目指す
    制約付与の際に用いる戦略としては、先行研究である仲田らがおこなった制約付きコミュニティ抽出の実験で用いられたものを中心に検討する
    boundary、hub、betweenness、deltaHなど
  • 大規模ネットワークに対応するために、入力されたネットワークに対して何らかの戦略に則って自動的に制約を付与するプログラムの実装を目指す
    制約付与の際に用いる戦略としては、先行研究である仲田らがおこなった制約付きコミュニティ抽出の実験で用いられたものを中心に検討する
    boundary、hub、betweenness、deltaHなど
  • 村田研究室の大澤です.
    動的ネットワークにおける影響最大化の研究について発表します.
  • まず,研究背景から説明します.
  • インフルエンザなどの感染症や,噂や口コミなどの情報が人々の間に広がっていく現象は,ネットワーク上の情報拡散として表現することができます.
    ネットワーク上の情報拡散の性質の一つとして,拡散が始まるノード集合が変わると,拡散の規模も大きく変わることが挙げられます.
    もし,情報を最も広く拡散するノード集合を見つけることができれば,病気の感染拡大を防止したり,効率的に口コミマーケティングを行うのに役に立ちます.
  • 最も情報を広く拡散できるノード集合を見つける問題は,影響最大化問題として定式化されています.
    影響最大化問題は,ネットワーク構造,情報拡散モデル,ノード数kを入力として,情報を最も広く拡散できる,大きさkのノード集合を出力する問題です.
    影響最大化はNP-Hardであることが証明されています.
    そのため,多くの近似解法が提案されていますが,これらの近似解法はほとんど静的ネットワークを対象としています.
    一方で,現実世界のネットワークは動的,つまり,時間の経過に伴って構造が変化するため,動的ネットワークを対象とした手法の開発が求められています.
  • 動的ネットワーク向けの既存手法には,大きく分けて中心性ベースの手法と,Monte-Carloシミュレーションベースの手法があります.
    詳細は後ほど説明しますが,中心性ベースの手法は高速ですが低精度,MCSベースの手法は高精度ですが低速で,速度と精度を両立した手法がまだありません.
  • そこで本研究では,動的ネットワーにおける影響最大化問題の新しい近似手法を提案します.
    提案手法は,貪欲なアルゴリズムで,ノード集合の拡散力を,高速なヒューリスティックを用いて近似するものです.
    この新しいヒューリスティックによって,MCSベースほどではありませんが,高い精度を保ちつつ,影響最大化問題を高速に解くことができるようになりました.
  • 次に関連研究について説明します.
  • 影響最大化問題を解くには、ネットワーク上をどのように情報が広がるかを定義する必要があります。
    その定義を与えるものが情報拡散モデルです。
    本研究では,情報拡散モデルとして代表的なSIモデルを考えます.
    SIモデルでは,ノードは2つの状態,SかIのどちらかに割り当てられます.
    状態Sは,情報を持っていない状態,状態Iは,情報を持っている状態を表しています.
    ここにある時刻3つのネットワークにおいて,SIモデルによる情報拡散の例を考えてみます.
    最初の時刻では,シード集合と呼ばれる集合に属するノードのみが状態Iであり,他のノードはすべて状態Sです.
    状態Iのノードが状態Sのノードと隣接した時に,状態Sのノードは次の時刻において,感染率と呼ばれる確率λで状態Iになります.
    ここで、一度状態Iになったノードはその後状態Sに戻ることはなく、情報を拡散する機会を与えられ続けます。
    この操作を時刻1から最終時刻まで繰り返し,最終時刻に達したら情報拡散を終了します.
    ここで,SIモデルにおけるノード集合Uの拡散力σ(U)は,情報拡散終了時のIノード数の期待値として定義します.
    影響最大化問題はすなわち,σ(U)を最大化する大きさkの集合Uを見つける問題です.
  • 次に,動的ネットワーク向けの既存手法について説明します.
    中心性ベースの手法は,ノードの中心性が最も高いk個のノードを出力する手法で,高速ですが低精度です.
    精度が低い理由は,拡散先に重複が多いノードを複数選んでしまうからです.
  • この問題点を詳しく見るために,このネットワークから中心性が最も高い2つのノードを選ぶことを考えてみます.
  • このネットワークで中心性が最も高いノードはBとDですが,この2つのノードは情報を拡散できる集合が全く同じ{A,B,C,D,E}なので,Dに加えてBを選んでも拡散力が大きく増加しません.
  • この場合,Dに加えてFを選べば情報を広く拡散できますが,そのことを中心性の情報だけから判断することはできません.
  • 次にMCSベースの手法について説明します.
    MCSベースの手法は,空のノード集合Sから始めて,拡散力の近似の増分が最大となるノードを順次Sに追加していく貪欲なアルゴリズムで,高精度ですが低速です.
    低速な理由は,拡散力の近似計算の計算コストが膨大だからです.
    拡散力σの厳密な計算は#P-Hardなので、何らかの近似が必要ですが、MCSベースの近似では時間がかかります。
  • MCSベースの手法では,拡散力σを近似するために,R回の情報拡散シミュレーションを行い、拡散規模の平均をσの近似値とします.
    例えば,R=3とすると,1回目のシミュレーションの結果がIノード数2,2回目が4,3回目が3だったとすると,これらの平均がσの近似値となります.
    ここで、大規模なネットワークにおいてσを精度よく求めるためにはRを大きくする必要があります。
    この何回もシミュレーションを繰り返すことが速度低下の原因になっています.
  • 次に,提案手法について説明します
  • 提案手法のアルゴリズムは基本的にはMCSと同じ貪欲なものですが,σの近似手法が異なります.
  • 提案手法によるσの近似方法を説明します.
    まず,各ノードが各時刻において状態Iである確率の近似を考えます.
    これは,最初の時刻では,シードに属すれば1,そうでなければ0で,この時点では厳密な確率と一致します.
    その後,各時刻について,各ノードの確率をこの式で更新します.
    この式は,各ノードの確率間が互いに独立であると仮定した時に得られる確率です.
    最終時刻の確率が求まったら,その確率を足し合わせることでσの近似値としています.
  • 提案手法による近似を,厳密計算と比較してみます.
    ここで,ノードAがシードであり,時刻5におけるFの確率を求めたいとします.
    エッジの数字はエッジが出現する時刻を表しています。
    Fの確率を求めるためには,前の時刻における隣接ノード,CとEの同時確率分布を求める必要があります.
    しかし,シードノードからの経路上にあるノードは互いに依存しているため,厳密な同時確率分布を求めるためには,AからFの経路を列挙して,依存関係を調べて、その依存関係を加味したうえで同時確率を求める必要があり、計算コストが膨大になります.
    ここで,提案手法では,各ノードの確率が独立であると仮定します.
    この仮定により,同時確率を各ノードの確率の積で表すことができるので,隣接ノードだけ見ればよく,高速に計算が終わります。
  • MCSベースの近似手法と計算量を比較すると、MCSベースの手法ではエッジ数×Rの時間がかかるのに対して、提案手法はエッジ数の計算量だけですみます。
    提案手法は、MCSのように情報拡散シミュレーションを何回も実行しないで済むので高速です。
  • 実験について説明します.
  • 提案手法との比較対象に使うのは,中心性が高い順に選ぶ手法と,MCSベースの手法です.
    中心性ベースの手法で使う中心性には,closeness中心性とbroadcast中心性を使います.
    MCSベースの手法では,σの近似に使うRの値を1,000とします.
    評価指標には,各手法が選んだノード集合の拡散力を使います.
    影響最大化問題は拡散力の高いノード集合を見つける問題なので,この値が高いほど手法の精度は良いと言えます.
    実験には,ここに示す5つのネットワークを用います.
  • 影響最大化問題のパラメータ設定として、感染率を固定してkを変化させるパターンと、感染率を変化させてkを固定するパターンの、2通りのパラメータ設定を行いました。
  • ここで,ネットワークにおける情報の広がりやすさを調べるために,シードノードがノード一つだけの時の拡散力を全ノードについて計算して,その分布を求めて情報の広がりやすさを判断します.
  • ネットワークにおける情報の広がりやすさを調べるために,ネットワークにおける各ノードの拡散力のヒストグラムを求めた.
    結果はこのチャートになっていて横軸がノードの拡散力,縦軸がノード数になっています.
    例えばここは,λが0.05の時に,自分一人で情報を60%のノードに拡散できるノードが20ノードあることを示しています.

×