Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Structural data analysis based on multilayer networks

148 views

Published on

Introduction on data analysis based on multilayer networks (in Japanese). Some references of tools, datasets, conferences and Web sites are also mentioned.

Published in: Data & Analytics
  • Be the first to comment

  • Be the first to like this

Structural data analysis based on multilayer networks

  1. 1. 多層ネットワークによる 構造データ分析 村田剛志 東京工業大学 情報理工学院 情報工学系 murata@c.titech.ac.jp http://www.net.c.titech.ac.jp/ 令和元年度 東北大学電気通信研究所 共同プロジェクト研究会 応用物理学会プラズマエレクトロニクス分科会 第32回プラズマ新領域研究会 物理 化学混成系プラズマにおける情報系機能発現 ~プラズマ反応場をネットワーク科学として捉える~ 本スライドはslideshareにて公開 上記サイトにリンクあり
  2. 2. 村田剛志(むらたつよし) • 東京工業大学 情報理工学院 情報工学系 准教授 • 専門:人工知能、ネットワーク科学、機械学習 • 人工知能学会、情報処理学会、日本ソフトウェ ア科学会、AAAI、ACM 各会員 • 本を出しました Pythonで学ぶネットワーク分析 ---ColaboratoryとNetworkXを使った実践入門--- 村田 剛志 著 発売日:2019/09/15 発行元:オーム社 https://atarum.github.io/
  3. 3. 「多層ネットワークによる 構造データ分析」 • 概要: ネットワーク分析は、対象世界における 構造やプロセスを理解する上で重要であるが、 現実のソーシャルメディア等は多種類の頂点 や辺から構成されており、従来の分析手法で は不十分であることが少なくない。本講演で は、交通網や動的ネットワークなどの現実の 多様な構造データを表現し分析するための枠 組みとして注目されてきている多層ネットワー ク研究について紹介する。
  4. 4. 目次 1. ネットワーク科学における課題 2. multilayer networkとは 3. 研究事例 4. トピックス – テンソルによる表現 – ランダムウオーク、移動可能性(navigability) – ランキング – temporal networkとmultilayer network – ネットワーク特徴量 – 生成モデル – コミュニティ抽出 5. ツール/データセット/関連会議/参考文献
  5. 5. 1.ネットワーク科学における課題 特徴量 モデル プロセス アルゴリズム
  6. 6. 1.ネットワーク科学における課題 特徴量 モデル プロセス アルゴリズム パス長、密度、直径、時数分布、 クラスタ係数、 … ダイクストラ法、グラフ分割、中 心性の計算、 … ランダムネットワーク、スケール フリーネットワーク、スモール ワールドネットワーク、べき法則、 configuration model、… 口コミ/病気の伝搬、影響最大 化、SI model、SIR model、リンク 予測 …
  7. 7. 中心性・ランキング • どの頂点が中心的か? – ソーシャルメディアでのオピニオンリーダー – 街のどこへでも短時間で駆けつけられるような場所 – … • 次数中心性(Degree Centrality) – 他の多くの頂点とつながっている頂点を中心的とみなす • 固有ベクトル中心性(Eigenvector Centrality) – 周囲の頂点の中心性も加味し、多くの中心的な頂点とつながってい る頂点を中心的とみなす • 近接中心性(Closeness Centrality) – ネットワーク中の他の頂点へ短い距離で到達できる頂点を中心的と みなす • 媒介中心性(Betweenness Centrality) – その頂点がなくなると多くの経路が分断されてしまうような頂点を中 心的とみなす
  8. 8. 中心性の例 参考: https://aksakalli.github.io/2017/07/17/network-centrality-measures-and-their-visualization.html
  9. 9. 特徴量計算 • 頂点数は同じでも、ネットワークはさまざま ランダムグラフ ピーターセングラフ 完全グラフ サイクルグラフ 2部グラフ バーベルグラフ スターグラフ ホイールグラフ スケールフリーグラフ
  10. 10. 特徴量の例 • 密度 • 直径 • クラスタ係数 • 平均次数 • 次数分布 • 平均パス長 • 次数相関 • …
  11. 11. コミュニティ抽出 • 密に結びついた部分ネットワーク(コミュニ ティ) – 友人グループや派閥などに対応 – 類似頂点がコミュニティを構成→嗜好の似た人 に商品や情報を推薦 • さまざまな定義、さまざまな抽出手法 参考: https://python-graph-gallery.com/324-map-a-color-to-network-nodes/ http://ryancompton.net/2014/06/16/community-detection-and-colored-plotting-in-networkx/
  12. 12. 2.Multilayer networkとは • 単純なネットワークでは扱えないような、現実 のより複雑な関係を表現・分析したい – 複数の交通機関(鉄道、バス…)での輸送網 – 複数のSNS(Facebook, Twitter, …)での情報伝搬 異なる種類の人間関係 (友好、敵対、職斡旋…) 複数の航空会社による 航空網
  13. 13. 輸送ネットワーク • ヨーロッパの航空ネットワーク (http://muxviz.net/gallery.php)
  14. 14. 異種ネットワーク上の災害の連鎖 • 2003年イタリアの大規模停電 – 発電所の停止→インターネットのノード故障→さら なる発電所の停止→… Sergey V. Buldyrev et al., "Catastrophic Cascade of Failures in Interdependent Networks" Nature 464, pp.1025-1028, 2010 発電所ネット インターネット
  15. 15. 様々な用語 • multilayer network, multiplex network, multivariate network, multinetwork, multirelational network, multirelational data, multilayered network, multidimensional network, multisilice network, multiplex of interdependent networks, hypernetwork, overlay network, composite network, multilevel network, multiweighted graph, heterogeneous network, multitype network, interconnected networks, interdependent networks, partially interdependent networks, network of networks, coupled networks, interconnecting networks, interacting networks, heterogeneous information network, meta-network, …
  16. 16. 様々な用語 • (Kivela et al., “Multilayer Networks”より)
  17. 17. multilayer networksの定義 • M=(VM, EM, V, L) – V: 頂点集合 – L: レイヤの集合の列(0次元:通常ネットワーク, 1 次元:上図, 2次元:下図) – VM:頂点とレイヤのタプルの集合 – EM:辺集合(タプルの組の集合) V={1,2,3,4} L={L1,L2}, L1={A,B}, L2={X,Y} VM={(1,A,X), (2,A,X), (3,A,X),…} EM={((1,A,X),(2,A,X)), ((1,A,X),(1,B,X)),…}
  18. 18. Layer間のつながり • 1次元vs2次元
  19. 19. 異なる種類のインタラクション • Kivera et.al, “Multilayer Networks”, Journal of Complex Networks, Vol.2, No.3, pp.203-271, 2014 異 な る 会 議 異なる種類の接触 同一人物 単純ネットワークでの表現MAP, MB, YYA, ACの4人のネットワーク
  20. 20. 単純ネットワークへの変換 • 便宜的に単純なネットワークへの変換(aggregation, projection) – 全てのlayerを1枚のlayerに押しつぶす • 情報が失われる – layer内の辺の差の情報が失われる – layer間の辺の情報が失われる – layer毎の異なる性質(次数分布等)が不明確にな る
  21. 21. multiplex(multislice) :単純化した multilayer • Lが1次元、全頂点が各レイヤに出現、レイヤ 間を結ぶ辺(coupling)が – 全ての対応頂点間のもの(categorical coupling) – 隣接する対応頂点間のもの(ordinal coupling) ordinal coupling categorical coupling
  22. 22. 3.研究事例 • 多層ネットワークの制約付きコミュニティ抽出 – "マルチスライスネットワークにおける制約付きコミュニティ抽出 法“, 江口 幸司, 村田 剛志, 人工知能学会論文誌, Vol.32, No.1, p.WII-C_1-9, 2017. https://www.jstage.jst.go.jp/article/tjsai/32/1/32_WII- C/_article/-char/ja/ • 動的ネットワークの情報伝搬の最大化 – "Selecting Seed Nodes for Influence Maximization in Dynamic Networks“, Shogo Osawa, Tsuyoshi Murata, Proceedings of the 6th Workshop on Complex Networks (CompleNet2015), Vol.597, pp.91-98, 2015. https://link.springer.com/chapter/10.1007/978- 3-319-16112-9_9 – "Extended methods for influence maximization in dynamic networks“, Tsuyoshi Murata, Hokuto Koga, Computational Social Networks 5:8, 21 pages, 2018. https://computationalsocialnetworks.springeropen.com/articles /10.1186/s40649-018-0056-8
  23. 23. マルチプレックスネットワークにおける 制約付きコミュニティ抽出法の拡張 江口幸司 情報理工学院 情報工学系 情報工学コース 村田研究室 242018/2/2
  24. 24. コミュニティ抽出 • ネットワークからエッジのつながりが密な 部分ネットワーク(コミュニティ)を見つけ出す →ネットワーク構造の分析、情報推薦などに応 用 25 コミュニティ抽出結果
  25. 25. 制約付きコミュニティ抽出 • 制約を考慮したコミュニティ抽出 – 背景知識 – ユーザからのフィードバック • 精度の向上が期待される 26 Tokyo Chiba Chiba 制約付き コミュニティ抽出結果
  26. 26. マルチプレックスネットワーク • マルチレイヤネットワークの一種 –複数のネットワークをエッジでつないで 組み合わせたもの 27 各レイヤは 同じノードの集合を持つ レイヤ間エッジ (同じノード間だけに存在) レイヤ レイヤ内 エッジ
  27. 27. マルチプレックスネットワークにおける コミュニティ抽出 • ノード同士が複数の種類のつながり(エッジ)を 持つようなネットワークを分析することができる 28 Aarhus University の Computer Scienceにおける 教員のネットワーク ロンドンの交通網のネットワーク
  28. 28. 従来法 評価関数:制約付きハミルトニアン[3][4] 最適化法:Louvain法[5] マルチプレックスネットワークにおける 制約付きコミュニティ抽出法[7] 29 評価関数を 最適化する アルゴリズム 拡張 1 2 評価関数:モジュラリティ[1][2] 最適化法:Gen Louvain法 [6] [4]Eaton and Mansbach, 2012. [3]Reichardt and Bornholdt, 2006. [5]Blondel et al., 2008. [2]Newman and Girvan, 2004. [6]Jutla et al., 2011-2014. [1]Mucha et al., 2010. コミュニティ 抽出の結果 を定量化モノ 制約付き マルチ 制約なし [7]Eguchi and Murata, 2017.
  29. 29. 目的 • 応用範囲の拡大 – 人間関係の分析 – 交通網の分析 – 論文の参照関係の分析 など 30 マルチプレックスネットワークにおける 制約付きコミュニティ抽出法を 大規模ネットワークに拡張する
  30. 30. マルチプレックスネットワークにおける ハミルトニアン[7] 31 multiplex 報酬項:コミュニティ内にエッジが存在 罰則項:コミュニティ間にエッジが存在 レイヤ内エッジ について(既存) レイヤ間エッジ について(追加) 𝑨𝒊𝒋𝒔:レイヤ𝒔における 隣接行列𝑨の(𝒊, 𝒋)要素 𝒈𝒊𝒔:レイヤ𝒔のノード𝒊が属する コミュニティのインデックス 𝜹:クロネッカーのデルタ 報酬項:コミュニティ間にエッジがない 罰則項:コミュニティ間にエッジが存在 報酬項:コミュニティ内にエッジが存在 罰則項:コミュニティ内にエッジがない [7]Eguchi and Murata, 2017.
  31. 31. マルチプレックスネットワークにおける 制約付きハミルトニアン[7] 32 multiplex (node 𝑖 and 𝑗 have must-link constraint) (nodes 𝑗 in layer s and 𝑟 have cannot-link constraint) (nodes 𝑗 in layer s and 𝑟 have must-link constraint) (node 𝑖 and 𝑗 have cannot-link constraint) (otherwise) (otherwise) (otherwise) (otherwise) 制約付き ハミルトニアン 同一レイヤ上のノードのペア (既存) 異なるレイヤ上のノードのペア(追加) Gen Louvain法で 最適化 multiplex multiplex multiplex 𝜇 𝑐 [7]Eguchi and Murata, 2017.
  32. 32. 従来法の問題点 33 制約を人手によって与えている •大規模ネットワークには適用が困難 •ユーザにかかる負担が大きい 適用できる対象が限られる •小規模な無向ネットワークのみ 従来法を改良
  33. 33. 提案法:大規模ネットワークへの拡張 制約付与の自動化 • ネットワークの構造的特徴に基づいて できるだけ人手の場合に近い制約を 自動的に付与 処理の高速化・省メモリ化 • 実装をOctaveからC++に変更 • メモリの動的確保を活用 34
  34. 34. 制約付与の自動化 • 制約付与戦略にしたがって自動的に制約付与 – 制約を付与すべきノードを選択する基準 • 3つの制約付与戦略を提案 35 異なるコミュニティに属する隣接ノードの数が 隣接ノードの総数に占める割合 • boundary: 隣接コミュニティ率が高い ものを優先 • degree: 次数が高いものを優先 • mix: 隣接コミュニティの数が 多いものを優先
  35. 35. boundary戦略 36 隣接コミュニティ率 •3,4,7,8→0 •2 →0.33 •5,6 →0.5 •1 →0.67
  36. 36. degree戦略 次数 •3,4,5,7,8→2 •1,2 →3 •6 →4 37
  37. 37. mix戦略 38 隣接コミュニティ数 •3,4,7,8→0 •2,5 →1 •1,6 →2 隣接コミュニティの 種類 •6→1 •1→2
  38. 38. 提案法のアルゴリズム(1/2) 39 制約付与戦略を選択 制約付きコミュニティ抽出(従来法と同様)
  39. 39. 提案法のアルゴリズム(2/2) 40 精度を計算 制約を自動的に付与 レイヤ間 レイヤ内 NMI: コミュニティ抽出結果を[0,1]で定量化 1に近いほど精度が高い
  40. 40. 処理の高速化・省メモリ化 メリット デメリット Octave • 行列演算が容易 • 反復処理に時間 を要する • 行列宣言の際に 確保できるメモリ が大きくない C++ • 反復処理がOctave に比べて高速 • メモリの動的確保 によって省メモリ化 • 行列演算が面倒 41[10]Eigen: http://eigen.tuxfamily.org/ 行列演算用ライブラリ Eigen[10]を用いる
  41. 41. 実験 42 従来法と提案法の比較実験 • 同じ実験の結果を比較 • 自動の場合にも、人手の場合と同様の 制約を付与できるか? 高速化に関する実験 • 大規模な実ネットワークでコミュニティ抽出、 従来法と提案法で計算時間の比較 大規模化・制約付与戦略に関する実験 • 大規模な人工ベンチマークにおいて 提案法によって制約付きコミュニティ抽出
  42. 42. 従来法と提案法の比較実験 • 人工ベンチマークネットワークにおいて 制約付きコミュニティ抽出を繰り返す – 制約付与戦略: boundary戦略 – 従来法:実装→Octave, 制約付与→手作業 – 提案法:実装→C++, 制約付与→自動 コミュニティ抽出の精度(NMI)を比較 制約付与を自動化した場合にも、人手による 場合と同等の制約を付与することができるか? 43
  43. 43. • パラメータ – 𝜔 = 1 (レイヤ間エッジの重み) – 𝜇 𝑐 = 2 (制約項の重み) 44 ノード数 エッジ数 レイヤ数 Sample1-1 10 11 3 Sample1-2 20 36 3 Sample1-3 30 54 3 Sample1-4 40 67 3 Sample1-5 50 78 3 ※ネットワーク間に依存性はない 従来法と提案法の比較実験
  44. 44. 従来法と提案法の結果の比較 45 正解コミュニティ構造が得られるまでの 変化の仕方はほぼ同じ NMI (精度) 制約数 制約数 従来法 提案法
  45. 45. 高速化に関する実験 • 比較的大規模な実ネットワークにおいて コミュニティ抽出 –正解ラベルがない→制約なし –従来法(Octave)と提案法(C++)で計算時 間を比較 46 ノード数 エッジ数 レイヤ数 YEAST LANDSCAPE MULTIPLEX NETWORK 4,458 8,473,997 4 PIERRE AUGER MULTIPLEX 514 7,153 16
  46. 46. 高速化に関する実験 実験結果:計算時間[sec] 47 従来法 提案法 高速化 YEAST LANDSCAPE MULTIPLEX NETWORK 15,658.7 664.90 23.6倍 PIERRE AUGER MULTIPLEX 54.29 52.91 1.03倍 ノード数が多い場合に、より高速化の効果を発揮
  47. 47. 大規模化・制約付与戦略に関する実験 • 提案法を用いて制約付きコミュニティ抽出 –各パラメータを変化させた複数のネットワーク (人工ベンチマークネットワーク)で比較 –制約付与戦略の比較:boundary, degree, mix 48 [11]Bazzi et al., 2016. Bazziらのベンチマーク[11] • レイヤ間に任意の依存性を持たせる • マルチプレックスだけでなく、テンポラルなど さまざまなマルチレイヤネットワークを生成可能
  48. 48. 大規模化・制約付与戦略に関する実験 • パラメータ: – 𝑝 = 0.95 (レイヤ間の類似度) – 𝜇 𝑐 = 2 (制約項の重み) – 𝜇 = 0.1 or 0.2 (ランダムエッジの割合) – 𝜔 = 0.7 or 0.9 (レイヤ間エッジの重み) 49 𝑝 𝜔 𝑝𝜇 𝑐 𝜇
  49. 49. 各実験の設定 50 𝜔の値が異なる 場合 • Sample3-1、 𝜔 = 0.7 • Sample3-1、 𝜔 = 0.9 𝜇の値が異なる 場合 • Sample3-1、 𝜔 = 0.7 • Sample3-2、 𝜔 = 0.7 ノード数が異なる 場合 • Sample3-1、 𝜔 = 0.7 • Sample3-3、 𝜔 = 0.7 データセット ノード数 エッジ数 レイヤ数 𝝁 Sample3-1 1,000 29,380 5 0.1 Sample3-2 1,000 28,614 5 0.2 Sample3-3 2,000 58,983 5 0.1
  50. 50. 制約付きコミュニティ抽出 (𝜔の値が異なる場合) 51 NMI (精度) 制約数 制約数 𝜔 = 0.7 𝜔 = 0.9 • レイヤ間エッジによるつながりが強い →他のレイヤ上の変化の影響を受けやすい • レイヤ間エッジによるつながりが弱い →柔軟なコミュニティ抽出
  51. 51. 制約付きコミュニティ抽出 (𝜇の値が異なる場合) 52 NMI (精度) 制約数 制約数 𝜇 = 0.1 𝜇 = 0.2 ランダムエッジの割合が大きい→ • ネットワークの構造情報だけでは 正解コミュニティ構造を得ることが難しい • (構造に基づいた)制約が有効になりづらい
  52. 52. 制約付きコミュニティ抽出 (ノード数が異なる場合) 53 NMI (精度) 制約数 制約数 𝑁 = 1000 𝑁 = 2000 ノード数が多い→ • すべてのノードが正解コミュニティに属すること が難しい(誤ったコミュニティに属しやすい) • 他のノードに影響されうるノードが多い
  53. 53. 制約付与戦略の比較(1/3) 54 NMI (精度) 制約数 制約数 𝜔 = 0.7, 𝜇 = 0.1, 𝑁 = 1000 𝜔 = 0.9, 𝜇 = 0.1, 𝑁 = 1000 制約数25あたりから degreeが最も良い boundaryが最も良い
  54. 54. 制約付与戦略の比較(2/3) 55 NMI (精度) 制約数 制約数 𝜔 = 0.7, 𝜇 = 0.2, 𝑁 = 1000 𝜔 = 0.7, 𝜇 = 0.1, 𝑁 = 2000 ほぼ変わらない わずかにmixが良い degreeとmixが同程度 初めはboundaryが良い
  55. 55. 制約付与戦略の比較(3/3) 56 いかなる場合にも有効で あるような(万能な)戦略はない • 𝜔の値が大きい、𝜇の値が小さい →boundary戦略 • 𝜔の値が小さい、𝜇の値が小さい →degree戦略 • 𝜇の値が大きい、またはノード数が多い→mix戦略 ノード数が多い時、途中まではboundary戦略を 用いた場合に最も精度が良い • 最初にboundary戦略→ 途中でdegree戦略またはmix戦略に切り替える? 𝜔 𝜇
  56. 56. まとめ 57 マルチプレックスネットワークにおける 制約付きコミュニティ抽出法の拡張 • 制約付与を自動化:制約付与戦略にしたがう • 高速化、省メモリ化: C++によって実装 結果 • 提案法で従来法と同様の制約を付与できた • 提案法により高速化に成功した • 大規模な人工ネットワークにおいて制約付き コミュニティ抽出をおこなうことができた • ネットワークの特徴に応じて制約付与戦略の 使い分けが必要であるとわかった
  57. 57. 3.研究事例 • 多層ネットワークの制約付きコミュニティ抽出 – "マルチスライスネットワークにおける制約付きコミュニティ抽出 法“, 江口 幸司, 村田 剛志, 人工知能学会論文誌, Vol.32, No.1, p.WII-C_1-9, 2017. https://www.jstage.jst.go.jp/article/tjsai/32/1/32_WII- C/_article/-char/ja/ • 動的ネットワークの情報伝搬の最大化 – "Selecting Seed Nodes for Influence Maximization in Dynamic Networks“, Shogo Osawa, Tsuyoshi Murata, Proceedings of the 6th Workshop on Complex Networks (CompleNet2015), Vol.597, pp.91-98, 2015. https://link.springer.com/chapter/10.1007/978- 3-319-16112-9_9 – "Extended methods for influence maximization in dynamic networks“, Tsuyoshi Murata, Hokuto Koga, Computational Social Networks 5:8, 21 pages, 2018. https://computationalsocialnetworks.springeropen.com/articles /10.1186/s40649-018-0056-8
  58. 58. 動的ネットワークにおける 影響最大化 計算工学専攻 村田研究室 大澤 翔吾 59
  59. 59. 発表内容 • 研究背景 • 関連研究 • 提案手法 • 実験 • 考察 • まとめ 60
  60. 60. 情報や病気の広がり ネットワーク上の情報拡散として表現可能 61 拡散 拡散 情報を最も広く拡散する ノード集合を見つける • 病気の感染拡大防止 • 口コミマーケティングの最 適化 拡散が始まるノード 集合が変わると拡散 規模も大きく変わる
  61. 61. 影響最大化問題 62 入力 • ネットワーク • 情報拡散モデル • シード数𝑘 出力 情報を最も広く拡散で きるノード集合𝒮 𝒮 = 𝑘 • 影響最大化問題は NP-Hard [Kempe 2003] • 多くの近似手法が提案されている [Chen 2013][Ohsaka 2014] – ほとんどは静的ネットワークが対象 • 現実世界のネットワークは動的 – 時間の経過に伴って構造が変化
  62. 62. 動的ネットワーク向けの既存手法 63 精度 速度 中心性ベース 低い 非常に高速 MCSベース 非常に高い 低速 速度と精度を両立した手法がない • 大きく分けて二種類 – 中心性ベース [Holme 2013] – Monte-Carloシミュレーションベース(MCS) [Berger-Wolf 2007]
  63. 63. 研究概要 • 動的ネットワークにおける影響最大化問題の 新しい近似手法を提案 – ノード集合の拡散力を高速なヒューリスティックを用いて 近似 • 精度と速度を両立 64 精度 速度 中心性ベース 低い 非常に高速 MCSベース 非常に高い 低速 提案手法 高い 高速
  64. 64. 発表内容 • 研究背景 • 関連研究 • 提案手法 • 実験 • 考察 • まとめ 65
  65. 65. 𝑡 = 1 情報拡散モデル • SI modelを考える 66 I 情報を持っている (Infected) S 情報を持っていない (Susceptible) I S S I S シード集合𝑈 𝑡 = 2 I S I S 𝑡 = 3 I I S 確率𝜆で状態Iになる (感染率) I I S 𝑈 の拡散力𝜎 𝑈 = 拡散終了時の 𝐼ノード数の期待値
  66. 66. 中心性ベースの手法 67 拡散先に重複が多い ノードを複数選んでしまう 1. 全ノードの中心性計算 2. 中心性が最も高い𝑘個の ノードを出力 高速だが低精度 アルゴリズム なぜ低精度か
  67. 67. 中心性ベースの手法の問題点(1) 68 中心性が最も高い2つのノードを選ぶ C D BA E G F 0.166 0.300 0.143 0.315 0.143 0.20.143 Closeness中心性
  68. 68. 中心性ベースの手法の問題点(2) 69 中心性が最も高い2ノード(B, D): 拡散先に重複が多く,拡散力が大きく増加しない C D BA E G F 0.166 0.300 0.143 0.315 0.143 0.20.143
  69. 69. 中心性ベースの手法の問題点(3) 70 D, Fを選べばより広く拡散 →中心性の情報だけでは判断不可能 C D BA E G F 0.166 0.300 0.143 0.315 0.143 0.20.143
  70. 70. MCSベースの手法 71 拡散力の近似 𝜎 ⋅ の 計算コストが膨大 [𝜎 ⋅ の厳密計算は#P-Hard] 1. 空のノード集合𝒮 = ∅ から始める 2. 拡散力の近似の増分 𝜎 𝒮 ∪ 𝑛 が最大の ノード𝑛を𝒮に順次追加 高精度だが低速 アルゴリズム なぜ低速か
  71. 71. 𝝈 𝒮 の近似計算 𝒮をシードとした情報拡散シミュレーションを𝑅回行い, 拡散規模(情報拡散終了時のIノード数)の平均を 𝜎 𝒮 とする 72 試行回数 拡散規模 1 2ノード 2 4ノード 3 3ノード 平均 𝝈 𝒮 = 𝟐 + 𝟒 + 𝟑 𝟑 = 𝟑 𝑅 = 3のときの例 𝜎 ⋅ を精度よく近似する には大きい𝑅が必要 情報拡散シミュレーションを何 回も行うので低速
  72. 72. 発表内容 • 研究背景 • 関連研究 • 提案手法 • 実験 • 考察 • まとめ 73
  73. 73. 提案手法の処理 1. 空のノード集合𝒮 = ∅から始める 2. 拡散力の近似 𝜎 ⋅ の増分が最大になる ノード𝑛を追加 • 𝑛 = argmax 𝑖∉𝑈 𝜎 𝒮 ∪ 𝑖 − 𝜎 𝒮 3. 𝒮 = 𝑘となるまで追加し続ける 74 基本的なアルゴリズムはMCSと同じ 𝝈 ⋅ の近似手法が異なる
  74. 74. 拡散力𝝈 ⋅ の近似計算 75 1. 𝑝 𝑛 𝑡 = ノード𝑛が時刻𝑡で状態Iである確率の近似 𝑝 𝑛 1 = 1 𝑛 ∈ 𝒮 0 𝑛 ∉ 𝒮 2. 各時刻 𝑡 = 1,2, … 𝑇 に対して 𝑝 𝑛 𝑡 + 1 = 1 − 1 − 𝑝 𝑛 𝑡 𝑖∈neighbors 𝑛,𝑡 1 − 𝑝𝑖 𝑡 𝜆 3. 拡散力の近似 𝜎 𝒮 は 𝑛 𝑖1 𝑖2 𝑖 𝑚 𝜎 𝒮 = 𝑛 𝑝 𝑛 𝑇 + 1 ノードの確率が互いに独立であると仮定する近似 …
  75. 75. 76 厳密計算との比較 A B C D F E <厳密計算> A~Fの経路上にあるノードの 確率は互いに依存している 全経路を列挙して 依存関係を調べるので 計算コストが膨大 A B C D F E <提案手法> 各確率は互いに独立と仮定 隣接ノードだけ見れば良い 𝑃 𝐶, 𝐸 ≠ 𝑃 𝐶 × 𝑃(𝐸) 𝑃 𝐶, 𝐸 = 𝑃 𝐶 × 𝑃(𝐸)として近似 1 1 2 2 3 4 4 1 1 2 2 3 4 4
  76. 76. MCSとの計算量比較 77 手法 𝝈 ⋅ の近似計算量 全体の計算量 MCSベース 𝒪 𝑚𝑅 𝒪 𝑁𝑘𝑚𝑅 提案手法 𝓞 𝒎 𝓞 𝑵𝒌𝒎 MCSのように情報拡散シミュレーションを何回 も実行しないで済むので高速
  77. 77. 発表内容 • 研究背景 • 関連研究 • 提案手法 • 実験 • 考察 • まとめ 78
  78. 78. 実験 • 提案手法との比較対象 – 中心性が高い順に選ぶ手法 (closeness, broadcast) – Monte-Carloシミュレーションを用いた手法 (MCS) 𝑅 = 1,000 • 評価指標 – 各手法が選んだノード集合の拡散力:高いほど良い (情報を拡散できたノードの割合) • データセット 79 名前 ノード数 エッジ数 期間[分] Hospital 75 2,424 5,792 High school 2011 126 28,563 4,539 High school 2012 180 45,049 12,158 Infectious 200 943 469 TI model 500 308,000 3,000
  79. 79. パラメータ設定 1. シード数𝑘を変化させる – 感染率𝜆 = 0.01, 𝑘 = 1,2,3,4,5 – 手法の精度と速度を見る 2. 感染率𝜆を変化させる – 𝜆 = 0.001,0.005,0.01,0.05, 𝑘 = 5 – 精度だけ見る(速度は𝜆に依存しない) 80
  80. 80. 𝒌を変化させる実験(精度) 81 Hospital 提案手法は中心性 ベースの手法より 一貫して精度がよい MCSに精度は劣るが はるかに高速 (次のスライド) シード数𝑘 ノード集合の拡散力[%] 全てのネットワークで 同様の傾向
  81. 81. 𝒌を変化させる実験(速度) 82 TI model 提案手法は,中心性 ベースの手法より低速 だが現実的な計算時間 (30万エッジ,18分) シード数𝑘 実行時間[秒] MCSは192時間もの 計算時間を要した 提案手法の640倍低速 192時間 18分
  82. 82. 感染率𝝀を変化させる実験 83 名前 ノード数 エッジ数 期間[分] Hospital 75 2,424 5,792 High school 2011 126 28,563 4,539 High school 2012 180 45,049 12,158 Infectious 200 943 469 TI model 500 308,000 3,000 A B 感染率の値に対する精度の 振る舞いが2種類に別れた
  83. 83. 実験結果(2-A) 84 Hospital 提案手法は中心性 ベースの手法より 一貫して精度がよい 感染率𝜆の値が増えると 拡散力の差が縮まる 感染率𝜆 ノード集合の拡散力[%] グループAの ネットワークで 同様の傾向
  84. 84. 実験結果(2-B) 85 TI model 提案手法は中心性 ベースの手法より 一貫して精度がよい 感染率𝜆の値が減ると 拡散力の差が縮まる (前スライドと逆の傾向) 感染率𝜆 ノード集合の拡散力[%] グループBの ネットワークで 同様の傾向
  85. 85. 発表内容 • 研究背景 • 関連研究 • 提案手法 • 実験 • 考察 • まとめ 86
  86. 86. 考察 87 ネットワーク 手法間に差異が 見られない条件 Hospital 感染率が高い High school 2011 感染率が高い High school 2012 感染率が高い Infectious 感染率が低い TI model 感染率が低い ネットワークによって 情報の広がりやすさが 大きく異なることが原因 情報が広がりやすいネットワーク: 感染率が大きいと どの手法でも広く拡散 情報が広がりにくいネットワーク: 感染率が小さいと ほとんど拡散しない A B
  87. 87. 情報の広がりやすさ • 各ノード𝑛に対して拡散力𝜎 𝑛 を計算 – シードノードが𝑛だけの時に, 情報がどれくらい拡散するか • 各ノードの拡散力の分布を求めて 情報の広がりやすさを判断 88
  88. 88. 拡散力の分布(グループA) 89 単一ノードの拡散力 % ノード数 𝜆 = 0.05のとき 大多数のノードが 80~90%以上の 拡散力を持つ 情報が非常に 広がりやすい グループAの ネットワークで 同様の傾向 Hospital
  89. 89. 拡散力の分布(グループB) 90 単一ノードの拡散力 % ノード数 𝜆 = 0.001のとき 2%以上の拡散力を持つ ノードが存在しない 情報がほとんど 広がらない グループBの ネットワークで 同様の傾向 TI model
  90. 90. 考察のまとめ 91 ネットワーク 手法間に差異が 見られない条件 ←のときの 情報の広がりやすさ Hospital 感染率が高い 非常に広がりやすい High school 2011 感染率が高い 非常に広がりやすい High school 2012 感染率が高い 非常に広がりやすい Infectious 感染率が低い ほとんど広がらない TI model 感染率が低い ほとんど広がらない 情報が非常に広がりやすい(にくい) 極端な状況でなければ提案手法は特に有効
  91. 91. 発表内容 • 研究背景 • 関連研究 • 提案手法 • 実験 • 考察 • まとめ 92
  92. 92. まとめ • 動的ネットワークにおける影響最大化問題の 新しい近似手法を提案 – 拡散力を高速に近似する貪欲アルゴリズム – 精度と速度を両立 • 比較実験 – 感染率によっては手法間に違いが見られなかった – 情報が非常に広がりやすいかほとんど広がらない という極端な状況以外では,提案手法は特に有効 93
  93. 93. 4. トピックス • テンソルによる表現 • ランダムウオーク、移動可能性(navigability) • multilayer networkのランキング • temporal networkとmultilayer network • multilayer networkのネットワーク特徴量 • multilayer networkの生成モデル • multilayer networkのコミュニティ抽出
  94. 94. 隣接行列とテンソル • 通常ネットワークG=(V,E)における隣接行列 – A∈{0,1} |V|×|V| (2次元行列) – Aij = 1 iff (i,j) ∈E • multilayer networkM=(VM, EM, V, L)における隣 接テンソル – A∈{0,1} |V|×|V|×|L1|×|L1|×…×|Ld|×|Ld| – Auvαβ = 1 iff ((u,α),(v,β)) ∈EM
  95. 95. テンソル • n次元の隣接行列 頂点 レイヤ レイヤ間 基底 レイヤ内 基底
  96. 96. “Mathematical Formulation of Multilayer Networks” • Manlio De Domenico, Albert Sole-Ribalta, Emanuele Cozzo, Mikko Kivela, Ytamir Moreno, Mason A. Porter, Sergio Gomez and Alex Arenas • Physical Review X, 3, 041022, 2013, 15pages • ネットワーク特徴量(次数中心性、クラスタ係数、固有 ベクトル中心性、モジュラリティ、von Neumann entropy, diffusion)をテンソル表現に拡張。特殊な場合 として単一レイヤネットワークでのテンソル表現は既 存の特徴量と同一になることを示す。 • multiplexに限定されず、一般的なmultilayerでの枠組。
  97. 97. “Diffusion Dynamics on Multiplex Networks” • S. Gomez, A. Diaz-Guilera, J. Gomez-Gardenes, C. J. Perez-Vicente, Y. Moreno, A. Arenas • Physical Review Letters, 110, 028701, 5pages, 2013 • 2層のmultiplex networkにおけるsupra- Laplacianの定義 ((N1+N2)×(N1+N2)の行列で 表記) • Layer間の係数が小さい場合と大きい場合に 分けて議論
  98. 98. 移動可能性(navigability) • multilayer networkでのランダムウオーク – 時刻t+Δtのレイヤβの 頂点jでの滞在確率 同一頂点 に留まる 他レイヤ の対応頂 点に移動 同一レイ ヤの他頂 点に移動 他レイヤ の他頂点 に移動
  99. 99. Multilayer networkとしてのロンドン交 通網 • ランダムな故障に対する理論的耐性 (resilience)は、実際の地下鉄不通のtweetに よる実データとかなり一致
  100. 100. “Navigability of interconnected networks under random failures” • Manlio De Domenico, Albert Sole-Ribalta, Sergio Gomez, and Alex Arenas, PNAS, doi 10.1073/pnas.1318469111 (2014) • ランダムウオークによるカバレッジ、ランダムな 故障に対するresilienceについて • Navigationを(i)同じノードに留まる(ii)同じレイヤ 内i->jに移動(iii)同じノードでレイヤα->βに移動 (iv)異なるノードi->j異なるレイヤα->βに移動に分 けて定式化 • London地下鉄や航空ネットワークなどのシミュ レーションと実データとの比較
  101. 101. multilayer networkでのランキング • multilayer networkとそれをaggregateした単 純ネットワークとではランキングが異なる – 周辺的なノードの中心性を過剰評価する傾向
  102. 102. “Ranking in interconnected multilayer networks reveals versatile nodes” • Manlio De Domenico, Albert Sole-Ribalta, Elisa Omodei, Sergio Gomez, Alex Arenas • Nature Communications 6, Article number:6868, Published 23 April 2015 • doi:10.1038/ncomms7868 • Multilayer networkの中心性としてversatile centralityを提案。Aggregateなものと比較して 予測精度が向上。航空会社ネットワークでの 渋滞シミュレーションなどで実験
  103. 103. temporal networkとしてのmultilayer network • 一定の間隔毎に切ってmultilayer network化 – 「一定の時間間隔」をどう決めるか – layer間の辺の強さをどう決めるか A B C D EF 0<=t < 5 A B C D EF 5<=t < 10 A B C D EF 10<=t < 15 "Temporal Networks", Petter Holme, Jari Saramakid, Physics Reports, Vol.519, Issue 3, pp.97–125, 2012
  104. 104. “Temporal Networks”でのランダム化 時刻をランダム化 頂点ペアは不変 元の動的グラフ 頂点ペアをランダ ム化 時刻は不変 RP RE
  105. 105. RPとRE • RP(randomly permuted times): – コンタクト時刻をランダム化 – トポロジーは不変 • RE(randomized edges) – 各辺の端点を他辺のとランダムに交換 – トポロジーは変わる 各時刻の辺出現数は不変 コンタクト順序の影響 を調べるのに使う トポロジーの影響 を調べるのに使う RP RE
  106. 106. ネットワーク特徴量 • 例: クラスタ係数 • [Manlio De Domenico, 2013]は次数中心性、 クラスタ係数、固有 ベクトル中心性、モ ジュラリティ、von Neumann entropy, diffusion)をテンソル 表現に拡張。
  107. 107. Multilayer networkの特徴量 • (Kivela et al., “Multilayer Networks”より) • layer内networkを比較する特徴量 – global overlap[45]: 2つのlayerで共有する辺の数 – global inter-clustering coefficient[259]:layerにまたがるクラスタ係数 – layer間の隣接行列要素の相関[19] – degree of multiplexity[178]:(複数の型の辺をもつ頂点ペア数)/(全ての頂点ペ ア数) – 次数やlocal clustering coefficientの相関[19,104,182,250,259] • 純粋にmulti-layerに特有の特徴量 – interdependence[234,250]:最短パスの中で、複数のlayer辺が使われる割合 – 全頂点が全layerにあるmultiplex network以外の特徴量 • 頂点のmultiplexity degree [285]:その頂点が存在するlayerの数 • [67]:社会ネットでmultiplexity degreeが1のものと2以上のもの(bridge)を比較 – layer毎に別communityと解釈なら、assortativityやmodularityも特徴量[226]
  108. 108. ネットワーク生成モデル • (節番号や論文引用はKivela et al., “Multilayer Networks”のもの)
  109. 109. 4.3 Models of Multiplex Networks • 人工multiplex networksを作る単純な方法 – 通常の生成モデル(ER random graph や configuration model)を用いて各層を作り、次に layer間を辺でつなぐ[125,199,231][125,217] – 各層を独立に作ったmultiplex networkから始め て、次に(ノードのラベルを変えるなどして)layer間 の相関を作り出す方法[104] • Exponential random graph models (ERGMs)は multilevel networksやmultiplex networksを扱 える [122,273,274][153]𝑃(𝐺 𝑀) = exp 𝜃 ∙ 𝑓 𝐺 𝑀 𝑍 𝜃 model parameter を表すベクトル 正規化関数 network diagnostics(異 種辺の△)のベクトル
  110. 110. microcanonical/canonical network ensembles[256,316] • microcanonical ensembles – 制約集合を厳密に満たすネットワークの集合 • canonical network ensembles – Shannon entropy最大化:平均的に制約を満たす – multiplex networkよりも辺の重なりに対して有効 • (空間に埋め込まれた)spatial networksのモデ ル化に使われる[150]
  111. 111. 他の生成モデル • 優先的選択などの手法をmultiplex networkに拡 張したもの – Criado[95](一部の頂点だけを含んだ)layerを増やすこ とでmultiplex networkの成長をモデル化 – 優先的戦略で辺や頂点を追加するもの[182,214,250] • layer間の辺が作られる確率は、layer内の次数(からなる関 数)に比例 • attachment kernelがaffine(平行移動を伴う線形写像) • 異なるlayerに頂点が異なる回数だけ生成されるのを許すモ デル • 非線形のattachment kernel attachment kernel
  112. 112. 4.4 Models of interconnected networks • monoplexネットワークの生成モデルを他のmultilayer に一般化 – 動的プロセスの研究にモデルは有効 • 似通ったネットワークモデルの研究 – interacting network, node color, node type, module – block modelやmixture modelによるモデル化も • 単純な方法は各layerを作って、異なるlayer間をランダ ムに辺で結ぶ(lattice, ER random graph, configuration network, BA network) – 均一にランダムにする必要はない • layer間を結ぶ異なる戦略で中心性がどう変わるかの研究 • SIRでの伝搬にどう影響するかの研究
  113. 113. configuration modelの拡張 • 複数の次数分布を多変数で表す – [10,200] – Soderberg – Newman – Gleeson – [17] node-colored graphのERモデル – [9] node-colored 2部グラフのconfiguration model • layer内-layer間の次数相関を取り入れたモデ ル 𝑃𝛼(𝑘1, … , 𝑘 𝑏) layer αの頂点がlayer βの頂点kβ個とつながる確率 𝑃(𝑘1, … , 𝑘 𝑏) layer独立な多次元分布 + 𝜏 𝛼𝛽 layerαとβ間 の辺の割合 𝑃𝛼(𝑘) 各layerの次数分布 + mixing matrix layer間の 辺の割合 結合確率行列P 𝑃 𝛼𝛽(𝑘) layerαの頂点がk個のlayerβ の頂点とつながる確率 𝑃 𝛼𝛽(𝑘, 𝑘′) layerα内で次数kの頂点がk’個のlayerβの頂点とつながる確率 𝑃 𝛼𝛽(𝑘 𝛼𝛼, 𝑘 𝛼𝛽, 𝑘′ 𝛽𝛽, 𝑘′ 𝛼𝛽) layer間次数layer内次数
  114. 114. configuration model • (2頂点をランダムに選んで辺を追加する) random graphでは次数分布がポアソン分布 • 任意の次数分布のネットワークを生成する手 法 – 与えられた次数の切り株を用意 – 切り株の間をランダムにつなぐ 頂 点 次 数 a 2 b 2 c 3 d 3 e 4 a b c d e b c ed a a b c d e
  115. 115. パラメータ Stochastic block model (1) • 与えられたグラフの背後にある生成モデルの パラメータ – k:グループ数 – 𝑧:各頂点のグループID – M:グループ間の結合確率の行列(k*k) • モデルからグラフを生成 – 頂点iとjの間の辺をMzizjの確率で生成(ziとzjは頂 点iとjが属するグループのID) • グラフからモデルを推定 予め与える http://tuvalu.santafe.edu/~aaronc/courses/5352/fall2013/
  116. 116. Stochastic block model (2) • M(stochastic block matrix)と生成されるグラフ – グループ内:ランダムグラフ、グループ間:ランダム 2部グラフ http://tuvalu.santafe.edu/~aaronc/courses/5352/fall2013/ 対角成分0.50 それ以外0.01 →グループ内が密 対角成分0.01 それ以外0.12 →グループ間が密
  117. 117. コミュニティ抽出 • (節番号や論文引用はKivela et al., “Multilayer Networks”のもの)
  118. 118. 4.5 Communities and other mesoscale structures • monoplex networkでもコミュニティの定義は様々 • multilayer networkではさらにひどい状況 – 次数ひとつとってもいろいろな拡張があるから • blockmodeling[33,112,152,350] – 類似結合パターンの頂点集合を出力 – 必ずしも密な部分を見つけるものではない • roleを割り当てる[264] • monoplexからスタートしてlayerを割り当てて multilayerにする[83,270]
  119. 119. Community structure in multilayer networks (1) • multilayerでのコミュニティ抽出研究は僅か • Muchaによるmodularityの拡張[237,238] – ひとつの頂点がlayerによって別のコミュニティに 属しても良い – 最適化は計算量的に問題 • 特にtemporal networkの時に顕著 • 最適解を維持してサイズを小さくする手法[12]を multislice modularity最適化に適用[74] 𝑄 𝑚𝑢𝑙𝑡𝑖𝑠𝑙𝑖𝑐𝑒 = 1 2𝜇 𝑖𝑗𝑠𝑟 𝐴𝑖𝑗𝑠 − 𝛾𝑠 𝑘𝑖𝑠 𝑘𝑗𝑠 2𝑚 𝑠 𝛿 𝑠𝑟 + 𝛿𝑖𝑗 𝐶𝑗𝑠𝑟 𝛿 𝑔𝑖𝑠, 𝑔𝑗𝑟 i,j:node r,s:slice Aijs:slice sのnode i-j間の辺 Cjsr:node iのslice s-r間の辺 Kis:node iのslice s内の次数 2ms:slice s内の辺総数 γs:slice s内のresolution parameter 2μ:全sliceの辺総数 slice node "Community Structure in Time-Dependent, Multiscale, and Multiplex Networks",Peter J. Mucha et al., Science Vol.328 No. 5980 pp.876-878 2010.
  120. 120. Community structure in multilayer networks (2) • multilayer networkのnull modelをどうするか – modularityは「ランダムな」ネットワークと比べて密かを調べる 関数 – null modelの決め方によって、得られるコミュニティも異なる – [29]はいろいろなnull modelを提案 – Multislice modularityの最適化 • 政党の再組織化[237,238] • 振る舞いのダイナミクス[362] • 脳機能ネットワーク[30,32] • 非線形振動子の動的な出力の振る舞い[29,31] • 国際関係ネットワーク[94] – モジュラリティだけでなくコミュニティ抽出手法もmultilayerに拡 張[237,238][96]
  121. 121. Community structure in multilayer networks (3) • Spectral clusteringの拡張 – [228]はspectral clusteringと、 hypergraphへのPerron- Frobenius theoremを拡張し、multilayer networkを hypergraphに写像したものに適用 – [204]:heavy subgraphの拡張(recurrent heavy network) • 各layerで従来手法でコミュニティを抽出 – [20]では各layerでのコミュニティと、全layerをつぶした aggregated networkのコミュニティを比較→かなりの違い あり→aggregationによって情報欠損 – [44]では各layerでコミュニティを抽出し、各頂点を tuple(c,α)で表現し、(閾値以上出現する)layer内コミュニ ティの集合としてmultilayer communityを定義
  122. 122. Community structure in multilayer networks (4) • multilayer networkをaggregateすれば(つぶせば)、従来のコミュニ ティ抽出手法が適用可→全ての可能な(2bの)aggregationを試す [213] • [333]:各layerでの目的関数(utility matrix)の和をutility integration と定義 – modularityならutility matrix=modularity matrix • Inverse community detection – 真のcommunityが与えられている→aggregateしたネットワークから真 のコミュニティが抽出されるようにaggregateの際の線形結合の重みを 調整する[72] – [275]:より複雑な重みづけ(metaclustering) • ランダムな重みづけでいろいろaggregateして、それぞれをclusteringして、異 なるclusterの距離行列を作る←階層クラスタリングを用いてコミュニティ抽出 • Multi-relational dataのクラスタリング手法[319-321]
  123. 123. 4.5.2 methods based on tensor decomposition • monoplex networkに対するSVDのように、 multiplex networkに対してはtensor- decompositionを用いる – CANDECOM/PARAFAC(CP):𝐴 𝑢𝑣𝛼 ≈ 𝑟 𝑅 𝑥 𝑢𝑟 𝑦𝑣𝑟 𝑧 𝛼𝑟 • 𝑥, 𝑦 ∈ 𝑅 𝑛×𝑅, 𝑧 ∈ 𝑅 𝑏×𝑅 – three-way DEDICOM, Tucker decomposition [14,322] – Nonnegative tensor factorization [131] – hypergraphのクラスタリング手法を利用[207]
  124. 124. “Comparison of communities detection algorithms for multiplex” • Chuan Wen Loe, Henrik Jeldtoft Jensen • Physica A: Statistical Mechanics and its Applications, Volume 431, 1 August 2015, Pages 29–45 • http://www.sciencedirect.com/science/article/pii/S0378437115002125 • multiplex networkからのコミュニティ抽出手法の比較を行った論文。人工 ネットワークとして、Erdos-Renyiランダムグラフ、WSスモールワールドグラ フ、BAスケールフリーグラフの3つを組み合わせた6通りの2層グラフに対 して、projection3種類(A1A2A3)、クラスタベース類似度分割(A4)、一般カ ノニカル相関(A5)、CLECC bridge検出(A6)、頻出パターンマイニング(A7)、 テンソル分解(A8)の8通りでコミュニティ抽出を行い、類似点や相違点を 比較。Redundancy, CLECC, modularityに注目して2層コミュニティを結合し たSSRM(structured synthetic random multiplex)というベンチマークを提案 • 評価手法としてはNMIの他に、overlapping communitiesの評価手法とし てOmega Indexを使う。これは同じコミュニティに属する頂点ペアの集合を 考え、二つの分割でのその集合のANDの大きさをもとに計算する指標。
  125. 125. “Finding Redundant and Complementary Communities in Multidimensional Networks”• Michele Berlingerio, Michele Coscia, Fosca Giannotti, CIKM 2011, pp.2181-2184, 2011. • Multidimensional networkにおけるコミュニティの評価指標として、 complementarityとredundancyを提案 • コミュニティ抽出手法自体は、multilayerを単一layerに重みづけ projectionして既存手法を利用。 • IMDbの実データで3つのコミュ抽出手法(Label propagation, random walk, fast greedy optimization)、3つの重みづけ手法 (flattening, 重み付きflattening, common neighbor重みづけ)の結 果を比較 • 3つの問いQ1:異なる重みづけとコミュ抽出手法での性能評価、Q2: 重みづけとコミュ抽出手法が、complementarityとredundancyの分 布に与える影響、Q3:重みづけとコミュ抽出手法のベストパラメータ • コミュニティの実例も示す。 multilayer networkをaggregateして コミュニティ抽出する論文も多い
  126. 126. 5. ツール • MuxViz – http://muxviz.net/ – Multilayer networkの可視化・分析ツール • GenLouvain – http://www.plexmath.eu/?page_id=327 – コミュニティ抽出手法のLouvain法[Blodel 2008]を multiplexに拡張 • MapEquation – http://www.mapequation.org/ – ランダムウオークによるコミュニティ抽出手法Infomap [Rosvall, 2008]をmultiplexに拡張
  127. 127. Multilayer Networksの可視化 • http://www.plexmath.eu/?page_id=327 • http://muxviz.net/
  128. 128. Pythonベースの分析・可視化ツール • Pymnet – http://www.mkivela.com/pymnet/index.html – 大規模化を考慮した実装 • multiNetX – https://github.com/nkoub/multinetx – 従来のツール(networkX)の拡張 • Py3Plex – https://github.com/SkBlaz/Py3plex – 可視化、アニメーションを重視
  129. 129. 5. データセット(1) • 実データ [Kivela 2014]参照
  130. 130. 5. データセット(2) • 人工データ – mLFR Benchmark: Testing Community Detection Algorithms in Multi-layered, Multiplex and Multiple Social Networks (Netsci2015 talk) – https://www.ii.pwr.edu.pl/~brodka/mlfr.php
  131. 131. 5. データセット(3) • Mark Newman's Website – http://www-personal.umich.edu/~mejn/netdata/ • Stanford Network Analysis Project – http://snap.stanford.edu/ • Network Repository – http://networkrepository.com/ • Sociopatterns – http://www.sociopatterns.org/datasets/ • Kaggle (for data science) – https://www.kaggle.com/ • Google Dataset Search – https://toolbox.google.com/datasetsearch
  132. 132. 5. 関連国際会議(物理系) • NetSci (2020.7.6-10?, Rome) – https://netscisociety.net/home • NetSci-X (2020.1.20-23, Tokyo) – https://netscix2020tokyo.github.io/ • CompleNet (2020.3.31-4.3, Exeter, UK) – https://complenet.weebly.com/ • CCS(ECCS) (2019.9.30-10.4, Singapore) – http://event.ntu.edu.sg/ccs2019/Pages/Home.aspx • Complex Networks (2019.12.10-12, Lisbon) – http://www.complexnetworks.org/
  133. 133. 関連国際会議 (人工知能、機械学習、Web、社会学) • IC2S2 (2019.7.17-20, Amsterdam) – https://2019.ic2s2.org/ • KDD (2019.8.4-8, Anchorage) – https://www.kdd.org/kdd2019/ • IJCAI (2019.8.10-16, Macao) – https://ijcai19.org/ • ECML/PKDD 2019.9.16-20, Wurzburg) – http://ecmlpkdd2019.org/ • CIKM (2019.11.3-7, Beijing) – http://www.cikm2019.net/ • ICDM (2019.11.8-11, Beijing) – http://icdm2019.bigke.org/ • BigData (2019.12.9-12, Los Angeles) – http://cci.drexel.edu/bigdata/bigda ta2019/index.html • NeurIPS (2019.12.2-8, Vancouver) – https://nips.cc/ • WSDM 2020.2.5-9, Houston) – http://www.wsdm- conference.org/2020/ • AAAI (2020.2.7-12, New York) – https://aaai.org/Conferences/AAAI -20/ • TheWeb(WWW) (2020.4.20-24, Taipei) – https://www2020.thewebconf.org/ • Sunbelt (2020.6.1-7, Paris) – https://www.insna.org/news/sunb elt-2020-save-the-date---june-1-7- 2020 • ICWSM (2020.6.?-?, Atlanta) – https://www.icwsm.org/2020/
  134. 134. 関連国内会議 • ネットワーク生態学研究会 (2020.3.2-3) – http://www.neteco.jp/symposium.html • 計算社会科学研究会 – https://css-japan.com/ • ネットワークが創発する知能研究会 – http://www.ai.comp.ae.keio.ac.jp/jwein19/ • (電子情報通信学会情報ネットワーク科学特別 研究専門委員会(活動終了)) – https://www.ieice.org/~netsci/
  135. 135. 5.参考文献 • チュートリアル – Mason Porter: “Multilayer Network Tutorial” https://web.stanford.edu/group/networkforum/cgi-bin/drupal/node/53 – Alex Arena: “Multilayer interconnected complex networks: an introduction” http://lbs.epfl.ch/files/content/sites/lbs/files/shared/talks- guests/EPFL_Arenas.pdf – Rushed Kanawati: “Mining Multiplex Network: A tutorial” http://lipn.fr/munm/MUNM/Home.html • サーベイ論文 – Kivela et al., “Multilayer Networks”, Journal of Complex Networks 2 (3), pp.203 - 271 (2014), http://comnet.oxfordjournals.org/content/early/2014/07/14/comnet.c nu016 – Boccaletti et al., “The structure and dynamics of multilayer networks”, Physics Reports, 544, pp.1-122 (2014), http://www.sciencedirect.com/science/article/pii/S0370157314002105 • ネットワーク分析全般のリンク集 – Awesome Network Analysis https://github.com/briatte/awesome- network-analysis
  136. 136. まとめ • 現実の複雑な関係を表現・分析する枠組みと しての多層ネットワーク – そもそもデータからネットワークをどう作るか、 ネットワークとして捉えるのが適切か – 未観測部分、ノイズ、動的変化などをどうするか – ネットワークを「分析」したら、どう「制御」するか
  137. 137. 多層ネットワークによる 構造データ分析 村田剛志 東京工業大学 情報理工学院 情報工学系 murata@c.titech.ac.jp http://www.net.c.titech.ac.jp/ 令和元年度 東北大学電気通信研究所 共同プロジェクト研究会 応用物理学会プラズマエレクトロニクス分科会 第32回プラズマ新領域研究会 物理 化学混成系プラズマにおける情報系機能発現 ~プラズマ反応場をネットワーク科学として捉える~ 本スライドはslideshareにて公開 上記サイトにリンクあり

×