第14回AIツール入門講座
「Google Colaboratoryによる
ネットワーク分析入門」
3. ネットワークの特徴量
中心性、クラスタ係数、次数分布など、ネットワークの性質を理
解する上で必要な特徴量について説明します。
データ構造:辺リスト
• 頂点ペアの列挙 頂点:A, …, F 辺:A-B,B-C, …
データ構造:隣接行列
• 辺あり→1、辺なし→0の行列
6×6の行列
matplotlibでの描画
• さまざまな描画を並べる matplotlibのライブラリを使用
横1列に3個描画、その1番目 頂点をランダムに配置
頂点を円周上に配置
頂点をばねモデルで配置
次数・次数分布
• 頂点からの辺の本数
• その分布
グラフの基本情報を表示
ヒストグラムを表示
有向グラフ
• 入次数と出次数
有向グラフ
共引用(co-citation)
• B→EかつB→Fならば、E-F
有向グラフ
多重辺を許
すグラフ
書誌結合(bibliographic coupling)
• A→FかつB→Fならば、A-B
共引用の計算
• A:ネットワークの隣接行列
• AT:その転置行列
• ATAの対角成分を0としたもの
が共引用の隣接行列
転置行列 行列の積
対角成分を
0に
パス(経路)
• 頂点1-頂点2-…-頂点n
• 隣接行列の積で計算できる
B→C→D→Bと
B→D→C→Bの
ループが2つ
ループがない⇔隣接行列の全固有値が0
• 固有値計算のためにnumpyを使用
直径
• グラフの任意の2頂点間の最短パス長の中で最大のもの
連結・連結成分
• 連結:グラフ上の任意の2頂点間のパスが存在
• 連結成分の個数:グラフラプラシアンの固有値
が0となるものの個数 𝐿 = 𝐷 − 𝐴
𝐿 ∙ 1 = 0 ∙ 1各頂点の次数を成分
とする対角行列
少なくとも1つの固
有値0をもつ
隣接行列
クラスタ係数
• (ある人の)友達2人が友達同士
である割合(値の範囲は0から1)
• 完全グラフ:クラスタ係数は1
• 2部グラフ:クラスタ係数は0
• 社会ネットワークでは比較的大
きな値をとる
?
中心性
• どれが最も中心?
• 赤
• 青
• 緑
• 水色
• 黄色
いろいろな中心性
• どれが最も中心?
• 次数中心性
• 固有ベクトル中心性
• 近接中心性
• 媒介中心性
中心性の比較
次数中心性
近接中心性
固有ベクトル中心性
媒介中心性

Introduction of network analysis with Google Colaboratory -- Network Metrics