Complex network ws_percolation
- 1. WSモデル上の
パーコレーション解析
@yokkuns: 里 洋平
yohei0511@gmail.com
2012.05.23 複雑ネットワーク勉強会
2012年5月23日水曜日
- 2. 本日の内容
複雑ネットワーク - 基礎から応用まで
- 8.4 WSモデル上のパーコレーション -
2012年5月23日水曜日
- 3. AGENDA
◆ 自己紹介
◆ パーコレーションとは
◆ WSモデル上のパーコレーション
2012年5月23日水曜日
- 4. 自己紹介
時系列解析や異常検知などの方法論を
実ビジネスに適用するデータマイニングエンジニア
◆ 名前: 里 洋平
◆ ID : yokkuns
◆ 職業:
データマイニングエンジニア
◆ 統計解析 パターン認識 機械学
習 データマイニング NLP 金融工学
などを勉強中
2012年5月23日水曜日
- 8. 活動例: 異常検知
Anomaly detection
複数時系列から異常な振る舞いを検知する
C
A
時系列のモデリング 複数時系列の異常検知 B
時系列A 時系列A
異常な振る舞い
時系列B
時系列C 時系列B 時系列C
異常な振る舞いの時系列を検出
例1:トラフィック異常検知 例2:CM効果のノイズ除去
トラフィックA ケースA
CM効果
トラフィックB ケースB
トラフィックC 調査 ケースC
異常な振る舞いをしている 異常な振る舞いをしているケースを
トラフィックの原因を調査する 除外して、CMの効果を算出する
85
2012年5月23日水曜日
- 9. 活動例: 時系列解析と異常検知
Anomaly detection
新しいデータと過去時系列モデルの乖離から異常検出
8000.0000
異常スコア推移
モデル構築
3.0000
異常値
◇例 : ARIMAモデル 2.2500
5970.7500 1.5000
0.7500
3941.5000 0
異常スコアの算出
-0.7500
◇例 : 対数損失
1912.2500 -1.5000
-2.2500
-117.0000 -3.0000
t
4/ 週
4/ 1週
4/ 8週
5/ 週
5/ 週
5/ 週
5/ 週
5/ 週
6/ 週
6/ 週
6/ 週
6/ 週
7/ 週
7/ 週
7/ 週
7/ 8週
週
4
25
2
9
16
23
30
6
13
20
27
4
11
25
1
1
1
4/
86
2012年5月23日水曜日
- 10. 活動例: 時系列解析と影響分析
TV Commercial Effects
時系列的な振る舞いの特徴から各KPIへのCMの影響度を算出
イベン
CM時系列 ト
新規
登録
CM ARPP
U
ARPU
各KPIの時系列
その他
外部
継続率
要因
ケース
87
2012年5月23日水曜日
- 12. AGENDA
◆ 自己紹介
◆ パーコレーションとは
◆ WSモデル上のパーコレーション
2012年5月23日水曜日
- 13. ネットワーク上の感染伝搬モデル
ネットワーク上の感染伝搬は、感染の種類だけでなく
ネットワークの構造も大きく影響している
感染症の種類 昔 今
ペスト じわじわと前線が進む 飛びながら速く広がる?!
インフルエンザ じわじわと前線が進む? 飛びながら速く広がる
ペストがはやった"#世紀と現代では、人のネットワーク構造が異なる!
!!!!・ 昔は高速移動手段がなかったため平均距離$が大きかったため、広がるのが遅かった!
!!!!・ 現在は、飛行機などの存在により、$は小さいため、急速に広がる!
!
!!!!⇒!感染症の種類よりもネットワークの構造が帰結を決める
2
2012年5月23日水曜日
- 14. パーコレーション
空間構造をもち、時間を持たない確率モデル
森林火災、感染症、噂の伝搬など様々な伝搬現象を表す
3
図!"#$%!&&#'()%*+),-./01-2'(&(.*3*1*(*&4)5)*42#&6786%)42'&%)42'9*:'.-#;(
2012年5月23日水曜日
- 15. パーコレーションの種類
頂点に黒石 or 白石を置くサイト・パーコレーションと
枝に黒石 or 白石を置くボンド・パーコレーションがある
4
2012年5月23日水曜日
- 16. 相転移と臨界確率
数値計算や近似計算によって、臨界確率を境に
浸透が起こりやすくなる事が分かっている
θ(q)
θ(q)
qc
図!"#$%!&&'''()*+,-*),(.%&)*+,-*),&/01)2*31+14,56782-9,:1;,< 5
2012年5月23日水曜日
- 17. AGENDA
◆ 自己紹介
◆ パーコレーションとは
◆ WSモデル上のパーコレーション
2012年5月23日水曜日
- 18. WS上のパーコレーション概要
枝をつなぎ変える程 平均距離Lが小さくなるため
臨界確率 qc が小さくなり 浸透が起こりやすい
2012年5月23日水曜日
- 19. 黒石の連結成分の大きさの平均を求めたい
黒石の連結成分の大きさがN となる確率P(N )から期待値を計算する
P(N )はつなぎかえ確率pの値によって変化し
直接評価するのが難しいため母関数を用いて考える
黒石の連結成分の大きさの平均が の時
ネットワーク全体に浸透が起こる
直接求めるのは難しいため母関数を考える
2012年5月23日水曜日
- 20. 母関数のアプローチ
輪に沿った連結成分(ローカルクラスタ)と
ショートカットによるそれらの結合の様子を考える
2012年5月23日水曜日
- 21. 完全クラスタの構成要素
ショートカットも含めた成分(完全クラスタ)は
1個のローカルクラスタと複数の完全クラスタの結合で表現出来る
2012年5月23日水曜日
- 22. 完全クラスタの母関数
完全クラスタは、以下のように表現出来る
また、その母関数をH0(x)とする
= n1 +
n1
+
n1
+・・・
+ N + + +・・・
N N
完全クラスタ +・・・
ローカルクラスタ
2012年5月23日水曜日
- 23. 完全クラスタの母関数
ローカルクラスタのサイズがN の時に注目する
各項に完全クラスタがあり、その母関数もH0(x)
= n1 +
n1
+
n1
+・・・
+ N + + +・・・
N N
完全クラスタ +・・・ ローカルクラスタのサイズがN の条件の元で
ショートカットの数がm個の成分
ローカルクラスタ
2012年5月23日水曜日
- 24. 完全クラスタの母関数
母関数は、ローカルクラスタの分布と
ショートカットによる完全クラスタとの結合の分布の式で書き下せる
2012年5月23日水曜日
- 25. 完全クラスタの母関数
母関数は、ローカルクラスタの分布と
ショートカットによる完全クラスタとの結合の分布の式で書き下せる
m個の完全クラスタの
母関数
ローカルクラスタのサイズが ローカルクラスタのサイズがN の条件の元で
N になる確率 ショートカットの数がm個になる確率
2012年5月23日水曜日
- 26. ショートカットがある確率
ネットワーク全体ではショートカットの数は、p<k>N/2本
端点は2 p<k>N/2 = p<k>N個
二項定理を用いて長さNの輪のうちN の部分に端点がm個入る確率を表す
mこの端点の 端点がm回 端点が(総数-m)回
N内の位置の組み合わせ数 N に入る確率 N 以外に入る確率
2012年5月23日水曜日
- 27. ローカルクラスタの確率
輪に沿って右側に黒石によって進む事が出来る確率を用いて
ローカルクラスタの確率を表す
2012年5月23日水曜日
- 28. ローカルクラスタの確率
輪に沿って右側に黒石によって進む事が出来る確率を用いて
ローカルクラスタの確率を表す
最初が黒石である確率
右側にN -1回 ローカルクラスタの
最初の石がローカルクラスタの
辿れる確率 両端の先が全て白石である確率
どこでも良いことを意味する
それなりに荒い近似
2012年5月23日水曜日
- 29. 母関数の展開
完全クラスタの部分を整理して展開する
※
2012年5月23日水曜日
- 30. 連結成分の大きさの平均の算出
母関数をxについて微分してx=1で連結成分の大きさの平均になる
x=1を代入
H0(1) = 1より
2012年5月23日水曜日
- 31. 計算の補足
x=1を代入
2012年5月23日水曜日
- 32. パーコレーションの臨界確率
臨界確率は、連結成分の大きさの平均が無限大になるところ
pはWSモデルのつなぎかえ確率なので我々が与える
最終的にqcだけの式になるので、数値計算で求める
2012年5月23日水曜日
- 33. 臨界指数
ベキ指数が連結成分の大きさ以外の様々な変数についても求まる
このようなベキ指数を相転移の臨界指数という
2012年5月23日水曜日
- 34. AGENDA
◆ 自己紹介
◆ パーコレーションとは
◆ WSモデル上のパーコレーション
2012年5月23日水曜日