Your SlideShare is downloading. ×
how-calculate-cluster-coefficience
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

how-calculate-cluster-coefficience

1,396

Published on

無向グラフにおいてクラスタ係数をどう求めるかというはなしです。

無向グラフにおいてクラスタ係数をどう求めるかというはなしです。

Published in: Education
0 Comments
3 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
1,396
On Slideshare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
8
Comments
0
Likes
3
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. クラスタ係数のはなし第3回複雑ネットワーク勉強会LT
  • 2. 無向グラフのクラスタ係数をいかにして求めるかというお話です。30分くらいで作ったので色々とアレですがLTのネタです。
  • 3. クラスタ係数概要この場合のクラスタ係数は 1/3(http://www.cmpt.phys.tohoku.ac.jp/~daichi/jouhourigaku2007/intro.html)
  • 4. クラスタ係数のアルゴリズム (1/6)
  • 5. クラスタ係数のアルゴリズム (2/6) 対象を決める
  • 6. クラスタ係数のアルゴリズム (3/6) 隣接点を取得
  • 7. クラスタ係数のアルゴリズム (4/6) 隣接点から2点選ぶ 隣接点同士が接続して いるなら三角形成立 カウントアップ
  • 8. クラスタ係数のアルゴリズム (5/6) 1点目の隣接点を固定した まま別の隣接点を選ぶ 隣接点同士が接続して なかったら三角形は できない 以後、1点目の接続点が 全て選ばれるまで繰り返し
  • 9. クラスタ係数のアルゴリズム (6/6)1.三角形は2重に取得されているはずなので半分に する2.できうる三角形は頂点をnとした時 n(n-1)/23. 1の結果を2で割るとある頂点に関するクラスタ係数 になる
  • 10. データ量が多くなるとつらい• 大規模なネットワークデータにおいて計算に 相性のよいデータ構造は? – 隣接行列:行列が大きくなりすぎる – エッジリスト:重複する項目が増えて大きくな りすぎる – なので、メモリに全てのデータを保持するのが そもそもつらい – かといってファイルを走査するのはナンセンス• 決まりきった計算ならNoSQL使うのがベター
  • 11. NoSQL(TokyoCabinet)と併用 隣接点が欲しく計算のプログラム なったら引きに行く TokyoCabinet Key : Value = ID : 隣接点のID全部 という構造で予めデータを作っておく Ex. 1 : “2¥t4¥t5¥t10¥t12….” 2 : “1¥t6¥10¥…” ….
  • 12. その他クラスタ係数の話題・Mixiのスモールワールド性の検証http://alpha.mixi.co.jp/blog/?p=144・TokyoCabinetを利用したクラスタ係数算出プログラムhttps://gist.github.com/1715893

×