SlideShare a Scribd company logo
1 of 5
Download to read offline
Dispersion centrality: applicazione
della dispersione in casi di studio reali
Amedeo Leo | Alessio Petrozziello | Simone Romano
amedeo.leo92@gmail.com | alessio92p@gmail.com | s.romano1992@gmail.com
Università degli Studi di Salerno
Abstract
In questo lavoro si vogliono mostrare alcuni casi di studio reali in cui la dispersione[1](una
nuova misura per Social Network Analysis) è utilizzata per evidenziare nodi all’interno di
una rete con particolari caratteristiche. In particolare verrà mostrato come la Dispersion
centrality(nuova misura che introdurremo) insieme alla Betweenness centrality rappresentano
un metodo efficace per isolare nodi che si differenziano dal resto della rete.
1. Introduzione
L’articolo [1] mostra la dispersione, un’unità di
misura applicabile agli archi di un grafo. Lo stu-
dio proposto parte da un’analisi di tale misura
per confrontarla con alcune delle misure già pre-
senti e diffuse in letteratura(degree centrality,
closeness centrality, betweenness centrality) e
punta a cercare una relazione con queste. In
particolare scopo dello studio è utilizzare la dis-
persione in unione ad una delle altre misure
per ricavare informazioni aggiuntive inerenti la
struttura della rete analizzata. Ciò che seman-
ticamente rappresenta la dispersione è quanto
amici in comune di due nodi non sono ben
collegati. Innanzitutto quello che è stato fatto
è portare una misura applicata ad archi(quale la
dispersione) ad un singolo nodo, introducendo
la dispersion centrality definita, a partire da
un nodo, come la somma delle dispersioni da
tutti i suoi vicini. Per ricavare dei risultati val-
utabili è stata implementata una libreria scritta
in python utilizzando la libreria [2]. Tale libre-
ria consente, dato un grafo in input in formato
edge, di calcolare per tutti i nodi del grafo alcune
delle misure principali utilizzate in social net-
work analysis aggiungendo dunque la dispersion
centrality e di stampare i risultati in formato
.cvs analizzabile poi con altri tool descritti in
seguito. I paragrafi successivi formalizzeranno
in maniera più precisa il concetto di dispersione
così come proprosto in [1]; a questo punto ver-
ranno dettagliate le metodologie utilizzate, i casi
di studio e i risultati. Verranno dunque proposte
delle conclusioni.
2. Dispersione
Nella sociologia matematica, i legami interper-
sonali sono definiti come connessioni che “in-
globano” delle informazioni tra le persone. La
forza di un legame costituisce una dimensione
importante in cui si possono caratterizzare i col-
legamenti di una persona ai suoi “vicini di rete”.
Informalmente, si riferisce alla vicinanza di un
collegamento: definisce un insieme che varia da
legami forti a deboli; i primi sono spesso incor-
porati nella rete, circondati da un vasto numero
di vicini, mentre gli ultimi coinvolgono spesso
pochi vicini e sono utilizzati come “ponti” per
diverse zone della rete, fornendo accesso a im-
portanti informazioni. Il punto critico è dunque
identificare gli individui più importanti in una
rete sociale. La caratteristica fondamentale in
queste analisi è l’embeddedness (“annidamento”
o “radicamento”): è una quantità che tipica-
mente aumenta con la forza dei legami, poiché
rappresenta il numero di persone che due nodi
vicini hanno in comune. Tuttavia, è un mezzo
debole per poter identificare le relazioni di una
rete. In questo lavoro proponiamo una mis-
urazione alternativa, chiamata dispersione, che
è significativamente più efficace. Tale misura
non prende in considerazione solo il numero di
individui comuni a due persone, ma anche alla
struttura della rete determinata da questo nu-
1
mero; approssimativamente, una connessione tra
due persone ha un’alta dispersione quando i loro
vicini non sono connessi tra loro. La dispersione
riflette la teoria del “social foci”: molte per-
sone hanno grandi gruppi (o “cluster”) di amici
o conoscenti corrispondenti a interazioni ben
definite nella loro vita, come, nel nostro caso
di studio, individui che frequentano un dojo
e relativi istruttori oppure una rete criminale
con i corrispondenti boss. Poiché molte persone
all’interno di tali cluster si conoscono, questi ul-
timi contengono dei link con alta embeddedness,
anche se non corrispondono necessariamente a
legami particolarmente forti. Al contrario, i col-
legamenti agli amici di una persona possono
avere radicamento minore, ma coinvolgono i
vicini comuni di investimento da numerosi e
diversi foci. Quindi, invece dell’embeddedness,
ipotizziamo che i collegamenti tra un nodo u e un
suo vicino v riflettano una struttura “dispersa”:
in tal modo, i vicini comuni di u e v non sono
ben connessi l’un l’altro, e quindi u e v agiscono
congiuntamente come gli unici intermediari tra
queste diverse parti della rete.
Per poter definire la dispersione in termini
matematici, formuliamo una serie di definizioni:
per iniziare, consideriamo Gu come il sottografo
indotto su u e sui suoi vicini, e per ogni nodo v
definiamo Cuv come l’insieme dei vicini comuni
di u e v. Per esprimere l’idea che le coppie di
nodi in Cuv devono essere distanti in Gu quando
non consideriamo i path in due step attraverso u
e v stessi, definiamo la dispersione assoluta della
collegamento u-v, disp(u,v), come la somma di
tutte le distanze a coppie tra i nodi in Cuv, mis-
urata in Gu - u, v; ovvero,
disp(u, v) =
s,t∈Cuv
dv(s, t)
dove dv è la distanza tra due nodi in Cuv;
tale distanza dv (s,t) equivale a 1 se s e t non
sono direttamente connessi e non hanno nodi in
comuni in Gu, oltre a u e v stessi, e equivale a 0
altrimenti. Nei nostri casi di studio intervengono
anche altre misurazioni: la dispersione normal-
izzata, norm(u,v), definita come il rapporto tra
la dispersione e l’embeddness; da questa sono
state create altre due metriche per aumentare le
prestazioni: la prima è la dispersione parametriz-
zata, definita da:
(disp(u, v) + b)α
emb(u, v) + c
La seconda è l’applicazione della dispersione in
maniera ricorsiva: individuare i nodi v il cui
collegamento u-v raggiunge una elevata disper-
sione normalizzata sulla base di una serie di
vicini comuni Cuv, che, a loro volta, hanno alta
dispersione normalizzata nei loro legami con u.
Per realizzare questa idea, assegniamo valori ai
nodi che riflettono la dispersione nei loro legami
con u, e quindi aggiorniamo questi valori con
quelli di dispersione associati ad altri nodi. In
particolare, definiamo xv= 1 per tutti i vicini v
di u, e aggiorniamo iterativamente ogni xv:
xv =
w∈Cuv
x2
w + 2 s,t∈Cuv
dv(s, t)xsxt
emb(u, v) + c
Tuttavia, tali misurazioni, data una coppia
di nodi definita da un arco, determinano un
insieme di valori: per poter confrontare i risul-
tati ottenuti, occorrerebbero nuove funzioni che
restituiscono una sola misura. Per questo obiet-
tivo, abbiamo definito diverse nuove metriche:
centralità di dispersione, dispersione massima,
dispersione minima, dispersione media. Tali fun-
zioni non si basano su una coppia di nodi, ma
su un singolo nodo: determinano quanto questo
nodo venga coinvolto nel calcolo delle disper-
sioni dei suoi vicini. Sommando le dispersioni
di tali vicini, ne abbiamo determinato l’effettiva
misurazione, la dispersione massima, la minima
e la media. Inoltre, abbiamo effettuato i test
sui grafi anche su altre funzioni ben note: la
betweenness centrality, la degree centrality e la
closeness centrality. La prima, per un nodo v, è
determinata dall’espressione
g(v) =
s=v=t
σs,t(v)
σs,t
Dove σst è il numero totale di cammini min-
imi da s a t e σst è il numero di tali cammini
che attraversano v. La degree centrality è stata
una delle prime metriche sviluppate: è definita
come il numero di archi incidenti su un nodo,
2
ovvero la quantità di legami che ha un nodo.
Nei nostri casi di studio, gli archi non sono di-
rezionati, quindi useremo solo una misurazione
(e non indegree o outdegree). Il significato dato
da tale metrica è rappresentato dal fatto che
gli individui più importanti sono coloro con più
legami nella rete. La closeness centrality, invece,
misura quanti passaggi devono essere fatti, par-
tendo da un nodo v, per raggiungere il maggior
numero possibile di nodi. In tal caso, la persona
più importante può raggiungere facilmente le
altre nella rete.
3. Metodologie
Durante lo sviluppo di questo progetto ci siamo
avvalsi del supporto di diverse tecnologie per la
manipolazione e visualizzazione dei grafi tra cui:
• Python
• Xml
• Csv
• Snap
• Gephi
• Cran-R
• Weka
3.1. Python
Python è un linguaggio di programmazione di-
namico orientato agli oggetti utilizzabile per
molti tipi di sviluppo software. Offre un forte
supporto all’integrazione con altri linguaggi e
programmi, è fornito di una estesa libreria stan-
dard e può essere imparato in pochi giorni. Molti
programmatori Python possono confermare un
sostanziale aumento di produttività e ritengono
che il linguaggio incoraggi allo sviluppo di codice
di qualità e manutenibilità superiori. Python
gira su Windows, Linux/Unix, Mac OS X, OS/2,
Amiga, palmari Palm e cellulari Nokia; è stato
anche portato sulle macchine virtuali Java e
.NET.
3.2. Snap
Stanford Network Analysis Platform (SNAP) è
una libreria per network analysis e graph mining.
E’ scritta in C++ e scala facilmente con grafi
massivi con centinaia di milioni di nodi e miliardi
di archi. E’ capace di manipolare grafi molto
grandi, calcolare proprietà strutturali, gener-
are graphi random e regolari e supporta gli at-
tributi su nodi e archi. Snap.py è una interfaccia
Python per SNAP. Essa provvede le performance
di SNAP, uniti alla flessibilità di Python. Molte
delle funzioni di SNAP in C++ sono disponibili
nella libreria Snap.py
3.3. Gephi
Gephi è un tool di visualizzazione ed esplo-
razione interattiva di qualsiasi tipo di rete,
sistemi complessi, grafi dinimaci e gerarchici.
Gephi gira su Windwos, Linux e OS X. E’ open-
sorce e free
3.4. Implementazione
Varie funzioni necessarie e di supporto sono state
sviluppate tra cui:
• fromGexfToEdge: permette la trasfor-
mazione da un file di gephi ad un file di
tipo EDGE, importabile in SNAP
• commonNeighbors: permette di trovare il
vicinato comune tra due nodi
• dispersion: calcola la dispersione tra due
nodi, così come da formula
• embeddedness: corrisponde al vicinato co-
mune tra due nodi
• norm: calcola la dispersione normalizzata
dispersione
embeddedness
• performance: calcola la norma aggiun-
gendo dei parametri costanti di ottimiz-
zazione
• recDisp: calcola la dispersione ricorsiva da
un nodo a tutti gli altri come da formula
• printNodeInformations_XML: crea un file
XML con tutti le informazioni su ogni
nodo del grafo (degree centrality, between-
ness centrality, closeness centrality, disper-
sion centrality)
• dispersionCentrality: calcola la disper-
sione su ogni nodo vicino e ne effettua
la somma
3
• printNodesInformations_CSV: crea un file
CSV con tutte le informazioni sui nodi,
standard facilmente importabile in CRAN-
R o Weka, tool di data analisys
4. Casi di studio
Al fine di valutare quanto ipotizzato in fase di
analisi del problema sono stati studiati alcuni
casi reali. In particolare il primo caso studi-
ato è stato quello rappresentatne un club di
karate(presentato in [3]). Lo studio [3] risale
al 1977. Gli autori hanno osservato il compor-
tamento del club di karate dal 1970 al 1972,
registrando ciò che accadeva all’interno del club.
In particolare il club era formato da due istrut-
tori i quali, a seguito di litigi dovuti a disaccordi
sul prezzo delle lezioni, litigarono. La rete si di-
vise in due parti, ciascuna con a capo uno degli
istruttori e i relativi allievi. Infine, ulitmo caso
di studio è il grafo di una rete criminale. Ciò che
si vuole mostrare è che la dispersion centrality
consente di evidenziare nodi che rappresentano
nodi particolari(dal punto di vista semantico)
all’interno del grafo.
5. Risultati
Di seguito sono mostrati e commentati i risul-
tati dei test effettuati sui vari casi di studio.
Le metriche utilizzate per analizzare i risultati
della dispersion centrality sono degree centrality,
closeness centrality e betweenness centrality.
5.1. Karate
Nella figura seguente si evince che, nella rete del
Karate analizzata, esiste una netta correlazione
tra betweenness centrality e dispersion central-
ity, come si può notare nel relativo quadrante.
In particolare gli outlier rappresentano i nodi
1, 34, 33 relativi ai 3 nodi più importanti della
rete ovvero il capo istruttore e i 2 maestri.
id
0.1 0.2 0.3 0.4 0.5
q
q q
qqq qqq q
qq q q
q
q
q
qq
q
qq
q
q
qq
q
q
q
q
q
q
q
q
q
q q
qqqqq q q
qqq q
q
q
q
qq
q
qq
q
q
qq
q
q
q
q
q
q
q
q
0 50 100 150 200
q
q q
qqq qqq q
qqq q
q
q
q
qq
q
qq
q
q
qq
q
q
q
q
q
q
q
q
0102030
q
q q
q qqqqqq
qqqq
q
q
q
qq
q
qq
q
q
qq
q
q
q
q
q
q
q
q
0.10.30.5
q
q
q
q
q
q
qqq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qqq q q q
q
q
q
q
q
degree_centrality
q
q
q
q
q
q
qq q
q
q
q
q
q
q
q
q
q
q
q
q
q
q
q qqqqq
q
q
q
q
q
q
q
q
q
q
q
qqq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qqqqqq
q
q
q
q
q
q
q
q
q
q
q
qqq
q
q
q
q
q
q
q
q
q
q
q
q
q
q
qqqqqq
q
q
q
q
q
q
q
q q
q
qqq
q
q
q
qq
q
q
q
q
q
q
q
qq
q
q
qq q q q q
q qq
q
q
q
qq
q
q qq
q
q
q
q q
q
q
q
q
q
q
q
qq
q
q
qqqqq q
qqq
q
closeness_centrality
q
q
qq
q
q qq
q
q
q
qq
q
q
q
q
q
q
q
qq
q
q
qqqqqq
qqq
q
0.300.400.50
q
q
qq
q
qqq
q
q
q
qq
q
q
q
q
q
q
q
qq
q
q
qqqqqq
qqq
q
050150
q
q
q
q
qq
qq
q
q
qqq
q
q
q
q
q
qq
q
q
q
qqq q q q qq qq q
q
q
q
q
qq
qq
q
q
qq q
q
q
q
q
q
qq
q
q
q
qqqqqq q qqqq
q
q
q
q
qq
qq
q
q
qqq
q
q
q
q
q
qq
q
q
q
q qqqqqq qqqq
betweenness_centrality
q
q
q
q
qq
qq
q
q
qqq
q
q
q
q
q
qq
q
q
q
qqqqqqqqqqq
0 5 10 15 20 25 30 35
q
q
q
q
q
qqqqq qqqq q q q qqq qq
q
qqq q q q qq q
q q
q
q
q
q
q
q qqq qqq q qq qq qqq qq
q
qqqqqq q qq
qq
0.30 0.40 0.50
q
q
q
q
q
qqq q qqqq qq qq qqq qq
q
q qqqqqq qq
qq
q
q
q
q
q
q qqq qqqq qq qq qqq qq
q
qqqqqqqq
q
qq
0 10 20 30 40
010203040
dispersion_centrality
5.2. Rete criminale
La figura seguente mostra i risultati ottenuti
applicando le stesse metriche ad una rete crimi-
nale. Ciò che si evince è, ancora una volta, che
gli outlier evidenziati dalla betweenness central-
ity sono gli stessi evidenziati dalla dispersion
centrality.
id
0.00 0.05 0.10 0.15 0.20
q
qq
q q
qqq
q
qq
q
qq
q
q
qqq
qq
q
q
q
q
q
qqq
qq
q
q
q
q
q
qq qqqqqq
q
q
q
q qq
q
qq
qq
q
qq
q
qq
q
qqq
q
q
q
q
q
qqqqqq
q
q
qqq
qqqq
qqqqqq
qq
q
q
q
q
q
q
q
q
q
q
qqq q
qqqq
q qq qqqqqqqqqqqqq
q
qqq
qq
q
q
q
qqq
q
qq
qqqqqqqq
qqq
q
q
qq
q q
qqq
q
qq
q
qq
q
q
qqq
qq
q
q
q
q
q
qqq
qq
q
q
q
q
q
qqqqqqqq
q
q
q
qqq
q
qq
qq
q
qq
q
qq
q
qqq
q
q
q
q
q
qqqqqq
q
q
qqq
qqqq
qqqqqq
qq
q
q
q
q
q
q
q
q
q
q
qqq q
qqqq
q qq qqqqqqqqqqqqq
q
qqq
qq
q
q
q
qqq
q
qq
q q q qqq qq
qqq
q
0 1000 2000 3000 4000
q
qq
q q
qqq
q
qq
q
qq
q
q
qqq
qq
q
q
q
q
q
qqq
qq
q
q
q
q
q
qqqqqqqq
q
q
q
q qq
q
qq
qq
q
qq
q
qq
q
qqq
q
q
q
q
q
qqqqqq
q
q
qqq
qqqq
qqq qqq
qq
q
q
q
q
q
q
q
q
q
q
qqqq
qqqq
qqqqqqqqqqqqqqqq
q
qqq
qq
q
q
q
qqq
q
qq
qqqqqqqq
qqq
q
050100
q
qq
q q
qqq
q
q q
q
qq
q
q
qqq
qq
q
q
q
q
q
qqq
qq
q
q
q
q
q
qqqqqqqq
q
q
q
q qq
q
qq
qq
q
qq
q
qq
q
qqq
q
q
q
q
q
qqqqqq
q
q
qqq
qqqq
qqqqqq
qq
q
q
q
q
q
q
q
q
q
q
qqqq
qqqq
qqqqqqqqqqqqqqqq
q
qqq
qq
q
q
q
qqq
q
qq
qqqqqqqq
qqq
q
0.000.100.20
q
qq
q
q
qqq
q
q
q
qq
q
q
qqqq
qq
q
qq
q
q
qq
q qqq q
q
q
q
qq
q
qqqqq
q
q q
q
q
q
q
qq qq q qq
q qq qqqq q
q
qq
q
qqqqqq
qqqqq qqqq
q
q
qqqq qq
q
q
q
q q
q
q q
q
qqqq
q
q
qqq
q
qq
q
qqqqqqqqqq
qq qqqq
qq
qq
qqqq q qqqqqqqqqq qqq q
degree_centrality
q
qq
q
q
qqq
q
q
q
qq
q
q
qqqq
qq
q
qq
q
q
qq
qqqqq
q
q
q
qq
q
qqqqq
q
q q
q
q
q
q
qq qqqqq
q qqq qqqq
q
qq
q
qqqqqq
qqqqqqqqq
q
q
qqqqqq
q
q
q
qq
q
qq
q
qqqq
q
q
qqq
q
qq
q
qqqqqqqqqq
qqqqqq
qq
qq
qqqqqqqq q q qqq qq qqq q
q
qq
q
q
qqq
q
q
q
q q
q
q
qqqq
qq
q
qq
q
q
qq
qqqqq
q
q
q
qq
q
qqqqq
q
q q
q
q
q
q
qqqqqqq
q qqqqqqq
q
qq
q
qqqqqq
qqqqqqqqq
q
q
q qqqqq
q
q
q
qq
q
qq
q
qqqq
q
q
qqq
q
qq
q
qqqqqqqqqq
qqqqqq
qq
qq
qqqqqqqqqqqqqqqqqqq
q
qq
q
q
qqq
q
q
q
qq
q
q
qqqq
qq
q
qq
q
q
qq
qqqqq
q
q
q
qq
q
qqqqq
q
qq
q
q
q
q
qqqqqqq
qqqqqqqq
q
qq
q
qqqqqq
qqqqqqqqq
q
q
qqqqqq
q
q
q
qq
q
qq
q
qqqq
q
q
qqq
q
qq
q
qqqqqqqqqq
qqqqqq
qq
qq
qqqqqqqqqqqqqqqqqqq
q
qq
q
q
qqqq
qq qq
q q qqqq
qq
q
qq
q
qqqq qqq q
q
q q
qqqqqqqq
q
q
q
qqq
q
qq
q
q q qq
q
q
q q
qqq qq qq q qqqqqq qqqqq qqqq
q
qqqqq qq
q
q
qq q
q
q q
q qqq
q
q
qqqqq
qq
q
qqqqqqqqqq
qq
q
qqq
q
qqq qqq
q
q
qqq
q
q
q
q
q
q
q
qq
q
q
q
qq
q
q
qqq q
qqqq
q qqqqq
qq
q
qq
q
q qqqqqqq
q
q q
qq qqqqqq
q
q
q
q qq
q
qq
q
qqqq
q
q
qq
qqqq qqq qqqqqqqqqqqqqqqq
q
qqqqqqq
q
q
q qq
q
qq
qqqq
q
q
qqqqq
qq
q
qqqqqqqqqq
qq
q
qqq
q
q qqqqq
q
q
qqq
q
q
q
q
q
q
q
qq
q
q
closeness_centrality
q
qq
q
q
qqq q
qqq q
q qqqqq
qq
q
qq
q
q qqqqqqq
q
q q
qqqqqqqq
q
q
q
q qq
q
qq
q
qqqq
q
q
qq
qqqqqqq qqqqqqqqqqqqqqqq
q
qq qqqqq
q
q
qqq
q
qq
qqqq
q
q
qqqqq
qq
q
qqqqqqqqqq
qq
q
qqq
q
q qqqqq
q
q
qqq
q
q
q
q
q
q
q
qq
q
q
0.20.61.0
q
qq
q
q
qqq q
q qqq
q qqqqq
qq
q
qq
q
qqqqqqqq
q
q q
qqqqqqqq
q
q
q
q qq
q
qq
q
qqqq
q
q
qq
qqqqqqqqqqqqqqqqqqqqqqq
q
qqqqqqq
q
q
qqq
q
qq
qqqq
q
q
qqqqq
qq
q
qqqqqqqqqq
qq
q
qqq
q
qqqqqq
q
q
qqq
q
q
q
q
q
q
q
qq
q
q
020004000
q
qq
q
q
qqq
q
q
q
q
q
q
q q
qqqqq q qq
q
q
q
q
q qqq q
q
q
q
qqqqqqqq
q
q
q
q
q
q
q
qq qq q qqq
q
q qqqq qq qq
q
qqqqqq qqqqq qqqq
q
qq
q
qq qq
q
q
qq qq q q
q
qqqqq qqqqqqqqqqqqqqqqqqqq qqqq
q
q
q
q qqqq q qqqqqqqqqq qqq q
q
qq
q
q
qqq
q
q
q
q
q
q
qq
qqq qqq qq
q
q
q
q
qqqqq
q
q
q
qq qqqqqq
q
q
q
q
q
q
q
qqqqqqq q
q
qqqqqq qqq
q
qqqqqqqqqqqqqqq
q
qq
q
qqqq
q
q
q qq qqq
q
qqqq q qqqqq qq qqqqqqqqqqqqqqqqq
q
q
q
qqqqqqqqqqqqqqqqqqqq
q
qq
q
q
qqq
q
q
q
q
q
q
qq
qqq qqq qq
q
q
q
q
qqqqq
q
q
q
qqqqqqqq
q
q
q
q
q
q
q
qq qqqqqq
q
qq qqqqqqq
q
qqqqqqqqqqqqqqq
q
qq
q
qqqq
q
q
qqqqqq
q
qqqq qqqqqq qq qqqqqqqqqqqqqqqqq
q
q
q
qqqqqqqqq q q qqq qq qqq q
betweenness_centrality
q
qq
q
q
qqq
q
q
q
q
q
q
qq
qqqqqqqq
q
q
q
q
qqqqq
q
q
q
qqqqqqqq
q
q
q
q
q
q
q
qqqqqqqq
q
qqqqqqqqq
q
qqqqqqqqqqqqqqq
q
qq
q
qqqq
q
q
qqq qqq
q
qqqqq qqqqqqqqqqqqqqqqqqqqqqqq
q
q
q
qqqqqqqqqqqqqqqqqqqq
0 50 100 150
q
qq
q
q
qqq
q
q
q
qqq
q
qqqqqq q qq
q
qqqq qqq q
q
q
q
qqqqqqqqq q qq
q
qq qq qq q qqq qq qqqq qq qq q qqqqqq qqqqq qqqqqqqqqq qqqq qq q
q
q qq qqqqq
q
qqqqqqqqqqqqqqqqqqq qqqq qqqq qqqq q qqqqqqqqqq qqq q
q
qq
q
q
qqq
q
q
q
qqq
q
qqqq qqq qq
q
q qqqqqqq
q
q
q
qq qqqqqq qqq q
q
q qqqqqqqq qqqqqqqq qqq qqqqqqqqqqqqqqqq qqqqqqqq q qq qq
q
qq qqqqq q
q
qqqq qq qqqqqqqqqqqqqqqqq qq qqqqqqqqqqqqqqqqqqqqq
0.2 0.4 0.6 0.8 1.0
q
qq
q
q
qqq
q
q
q
qqq
q
qqqq qqq qq
q
qqqqqqqq
q
q
q
qqqqqqqqqq qq
q
q qqq qqqqqq qqq qqqqqqqqqqqqqqqqqqqqqqq qqqqqqqq qqqqq
q
qq qqqqq q
q
qqqq qq qqqqqqqqqqqqqqqqq qqqqqqqqqqqq q q qqq qq qqq q
q
qq
q
q
qqq
q
q
q
q qq
q
qqqqqqqqq
q
q qqqqqqq
q
q
q
qqqqqqqq qq qq
q
q qqqqqqqqq qqqqqqqqqq qqqqqqqqqqqqqqqq qqq qqqqq qqqqq
q
qqqqqqqq
q
qqqqqqqqqqqqqqqqqqqqqqq qq qqqqqqqqqqqqqqqqqqqqq
0 10 20 30
0102030dispersion_centrality
6. Conclusioni
Partendo dall’analisi della dispersione[1](unità
applicabile ad un arco di una rete) abbiamo con-
siderato, dato un nodo, la somma delle disper-
sioni tra questo nodo ed i suoi vicini(dispersion
centrality) in modo da ottenere una misura
confrontabile con degree centrality, closeness
centrality e betweenness centrality. Ciò che
è emerso dai risultati sui dataset utilizzati è
4
quanto segue: la dispersion centrality fornisce le
stesse informazioni della betweenness centrality.
La differenza sostanziale è che il calcolo della
dispersion centrality è parallelizzabile.
References
[1] Romantic Partnerships and the Disper-
sion of Social Ties: A Network Analy-
sis of Relationship Status on Facebook -
http://arxiv.org/pdf/1310.6753.pdf
[2] Snap http://snap.stanford.edu/
[3] Journal of Anthropological Research,
Vol. 33, No. 4 (Winter, 1977), pp.
452-473 http://www1.ind.ku.dk/
complexLearning/zachary1977.pdf
5

More Related Content

Viewers also liked

系統的レビューの出版数
系統的レビューの出版数系統的レビューの出版数
系統的レビューの出版数SR WS
 
North Bill Disposal, LLC Brochure Final
North Bill Disposal, LLC Brochure FinalNorth Bill Disposal, LLC Brochure Final
North Bill Disposal, LLC Brochure FinalBarbie Salerno
 
Presentation on Occeanic Pollution
Presentation on Occeanic PollutionPresentation on Occeanic Pollution
Presentation on Occeanic Pollutionvrindaps2015
 
AbjectCatalogue2f
AbjectCatalogue2fAbjectCatalogue2f
AbjectCatalogue2fYusra Ali
 
20160319コクランタイトル登録WSその3グループを決めて、ワークシートを埋めよう
20160319コクランタイトル登録WSその3グループを決めて、ワークシートを埋めよう20160319コクランタイトル登録WSその3グループを決めて、ワークシートを埋めよう
20160319コクランタイトル登録WSその3グループを決めて、ワークシートを埋めようSR WS
 
20160319コクランタイトル登録WSその2タイトル登録のやり方
20160319コクランタイトル登録WSその2タイトル登録のやり方20160319コクランタイトル登録WSその2タイトル登録のやり方
20160319コクランタイトル登録WSその2タイトル登録のやり方SR WS
 
20160319コクランタイトル登録WSその1PICOをつくる
20160319コクランタイトル登録WSその1PICOをつくる20160319コクランタイトル登録WSその1PICOをつくる
20160319コクランタイトル登録WSその1PICOをつくるSR WS
 
Инструкция сигвеи Q7 Q6
Инструкция сигвеи Q7 Q6Инструкция сигвеи Q7 Q6
Инструкция сигвеи Q7 Q6Сергей К.
 
Réussir son startup weekend agile
Réussir son startup weekend agileRéussir son startup weekend agile
Réussir son startup weekend agileFlorian Labadens
 
Letterの書き方
Letterの書き方Letterの書き方
Letterの書き方SR WS
 
Automi suoggettiinfiniti
Automi suoggettiinfinitiAutomi suoggettiinfiniti
Automi suoggettiinfinitiSimone Romano
 

Viewers also liked (20)

系統的レビューの出版数
系統的レビューの出版数系統的レビューの出版数
系統的レビューの出版数
 
Визнані світом
Визнані світомВизнані світом
Визнані світом
 
North Bill Disposal, LLC Brochure Final
North Bill Disposal, LLC Brochure FinalNorth Bill Disposal, LLC Brochure Final
North Bill Disposal, LLC Brochure Final
 
Presentation on Occeanic Pollution
Presentation on Occeanic PollutionPresentation on Occeanic Pollution
Presentation on Occeanic Pollution
 
Taxonomy
TaxonomyTaxonomy
Taxonomy
 
AbjectCatalogue2f
AbjectCatalogue2fAbjectCatalogue2f
AbjectCatalogue2f
 
20160319コクランタイトル登録WSその3グループを決めて、ワークシートを埋めよう
20160319コクランタイトル登録WSその3グループを決めて、ワークシートを埋めよう20160319コクランタイトル登録WSその3グループを決めて、ワークシートを埋めよう
20160319コクランタイトル登録WSその3グループを決めて、ワークシートを埋めよう
 
20160319コクランタイトル登録WSその2タイトル登録のやり方
20160319コクランタイトル登録WSその2タイトル登録のやり方20160319コクランタイトル登録WSその2タイトル登録のやり方
20160319コクランタイトル登録WSその2タイトル登録のやり方
 
20160319コクランタイトル登録WSその1PICOをつくる
20160319コクランタイトル登録WSその1PICOをつくる20160319コクランタイトル登録WSその1PICOをつくる
20160319コクランタイトル登録WSその1PICOをつくる
 
Инструкция сигвеи Q7 Q6
Инструкция сигвеи Q7 Q6Инструкция сигвеи Q7 Q6
Инструкция сигвеи Q7 Q6
 
Voyage à parís
Voyage à parísVoyage à parís
Voyage à parís
 
Open ideas tesina
Open ideas tesinaOpen ideas tesina
Open ideas tesina
 
Réussir son startup weekend agile
Réussir son startup weekend agileRéussir son startup weekend agile
Réussir son startup weekend agile
 
Книга - мудрість століть
Книга - мудрість столітьКнига - мудрість століть
Книга - мудрість століть
 
Letterの書き方
Letterの書き方Letterの書き方
Letterの書き方
 
Hadoop analyzerJR
Hadoop analyzerJRHadoop analyzerJR
Hadoop analyzerJR
 
Smart api
Smart apiSmart api
Smart api
 
Automi suoggettiinfiniti
Automi suoggettiinfinitiAutomi suoggettiinfiniti
Automi suoggettiinfiniti
 
День Святого Валентина
День Святого ВалентинаДень Святого Валентина
День Святого Валентина
 
презентація "Людина - не товар"
презентація "Людина - не товар"презентація "Людина - не товар"
презентація "Людина - не товар"
 

Similar to Dispersion centrality

Web Mining e analisi di reti sociali
Web Mining e analisi di reti socialiWeb Mining e analisi di reti sociali
Web Mining e analisi di reti socialiMariagiovanna Scarale
 
Tesi - Distrettualizzazione di reti acquedottistiche mediante la teoria delle...
Tesi - Distrettualizzazione di reti acquedottistiche mediante la teoria delle...Tesi - Distrettualizzazione di reti acquedottistiche mediante la teoria delle...
Tesi - Distrettualizzazione di reti acquedottistiche mediante la teoria delle...Maurizio Peretto
 
SNA e Scienza delle Reti
SNA e Scienza delle RetiSNA e Scienza delle Reti
SNA e Scienza delle Retieugenio iorio
 
Progettazione e intelligenza artificiale
Progettazione e intelligenza artificialeProgettazione e intelligenza artificiale
Progettazione e intelligenza artificialeAlessandri Giuseppe
 
Social Network Analysis Applicata
Social Network Analysis ApplicataSocial Network Analysis Applicata
Social Network Analysis ApplicataGiovanni Carturan
 
TEDxPompeii Social Networking Analysis
TEDxPompeii Social Networking AnalysisTEDxPompeii Social Networking Analysis
TEDxPompeii Social Networking AnalysisCamillo Di Tullio
 
Networking Lezione 21 Novembre
Networking Lezione 21 NovembreNetworking Lezione 21 Novembre
Networking Lezione 21 Novembreand_cerase
 
Learning of non-homogeneous Continuous Times Bayesian Networks Thesis
Learning of non-homogeneous Continuous Times Bayesian Networks ThesisLearning of non-homogeneous Continuous Times Bayesian Networks Thesis
Learning of non-homogeneous Continuous Times Bayesian Networks ThesisGuido Colangiuli
 
03 Social Network Analysis
03   Social Network Analysis03   Social Network Analysis
03 Social Network AnalysisMarco Muzzarelli
 
Cmplx school spoleto_ve_reti1su3_22ago2016
Cmplx school spoleto_ve_reti1su3_22ago2016Cmplx school spoleto_ve_reti1su3_22ago2016
Cmplx school spoleto_ve_reti1su3_22ago2016Valerio Eletti
 
Comprendere_le_Reti_per_Governare_l_EA_12nov2013
Comprendere_le_Reti_per_Governare_l_EA_12nov2013Comprendere_le_Reti_per_Governare_l_EA_12nov2013
Comprendere_le_Reti_per_Governare_l_EA_12nov2013Matteo Busanelli
 
Alignment free sequence comparison—a review
Alignment free sequence comparison—a reviewAlignment free sequence comparison—a review
Alignment free sequence comparison—a reviewFranco
 
Social Network Analysis
Social Network Analysis Social Network Analysis
Social Network Analysis Claudia Licari
 

Similar to Dispersion centrality (18)

Web Mining e analisi di reti sociali
Web Mining e analisi di reti socialiWeb Mining e analisi di reti sociali
Web Mining e analisi di reti sociali
 
Tesi - Distrettualizzazione di reti acquedottistiche mediante la teoria delle...
Tesi - Distrettualizzazione di reti acquedottistiche mediante la teoria delle...Tesi - Distrettualizzazione di reti acquedottistiche mediante la teoria delle...
Tesi - Distrettualizzazione di reti acquedottistiche mediante la teoria delle...
 
Relazione
RelazioneRelazione
Relazione
 
SNA e Scienza delle Reti
SNA e Scienza delle RetiSNA e Scienza delle Reti
SNA e Scienza delle Reti
 
Progettazione e intelligenza artificiale
Progettazione e intelligenza artificialeProgettazione e intelligenza artificiale
Progettazione e intelligenza artificiale
 
Social Network Analysis Applicata
Social Network Analysis ApplicataSocial Network Analysis Applicata
Social Network Analysis Applicata
 
FSTI1112 1 1/2
FSTI1112 1 1/2FSTI1112 1 1/2
FSTI1112 1 1/2
 
TEDxPompeii Social Networking Analysis
TEDxPompeii Social Networking AnalysisTEDxPompeii Social Networking Analysis
TEDxPompeii Social Networking Analysis
 
Networking Lezione 21 Novembre
Networking Lezione 21 NovembreNetworking Lezione 21 Novembre
Networking Lezione 21 Novembre
 
Learning of non-homogeneous Continuous Times Bayesian Networks Thesis
Learning of non-homogeneous Continuous Times Bayesian Networks ThesisLearning of non-homogeneous Continuous Times Bayesian Networks Thesis
Learning of non-homogeneous Continuous Times Bayesian Networks Thesis
 
Social Network Analysis
Social Network AnalysisSocial Network Analysis
Social Network Analysis
 
03 Social Network Analysis
03   Social Network Analysis03   Social Network Analysis
03 Social Network Analysis
 
Algoritmi epidemici
Algoritmi epidemiciAlgoritmi epidemici
Algoritmi epidemici
 
Social Network Analysis
Social Network AnalysisSocial Network Analysis
Social Network Analysis
 
Cmplx school spoleto_ve_reti1su3_22ago2016
Cmplx school spoleto_ve_reti1su3_22ago2016Cmplx school spoleto_ve_reti1su3_22ago2016
Cmplx school spoleto_ve_reti1su3_22ago2016
 
Comprendere_le_Reti_per_Governare_l_EA_12nov2013
Comprendere_le_Reti_per_Governare_l_EA_12nov2013Comprendere_le_Reti_per_Governare_l_EA_12nov2013
Comprendere_le_Reti_per_Governare_l_EA_12nov2013
 
Alignment free sequence comparison—a review
Alignment free sequence comparison—a reviewAlignment free sequence comparison—a review
Alignment free sequence comparison—a review
 
Social Network Analysis
Social Network Analysis Social Network Analysis
Social Network Analysis
 

Dispersion centrality

  • 1. Dispersion centrality: applicazione della dispersione in casi di studio reali Amedeo Leo | Alessio Petrozziello | Simone Romano amedeo.leo92@gmail.com | alessio92p@gmail.com | s.romano1992@gmail.com Università degli Studi di Salerno Abstract In questo lavoro si vogliono mostrare alcuni casi di studio reali in cui la dispersione[1](una nuova misura per Social Network Analysis) è utilizzata per evidenziare nodi all’interno di una rete con particolari caratteristiche. In particolare verrà mostrato come la Dispersion centrality(nuova misura che introdurremo) insieme alla Betweenness centrality rappresentano un metodo efficace per isolare nodi che si differenziano dal resto della rete. 1. Introduzione L’articolo [1] mostra la dispersione, un’unità di misura applicabile agli archi di un grafo. Lo stu- dio proposto parte da un’analisi di tale misura per confrontarla con alcune delle misure già pre- senti e diffuse in letteratura(degree centrality, closeness centrality, betweenness centrality) e punta a cercare una relazione con queste. In particolare scopo dello studio è utilizzare la dis- persione in unione ad una delle altre misure per ricavare informazioni aggiuntive inerenti la struttura della rete analizzata. Ciò che seman- ticamente rappresenta la dispersione è quanto amici in comune di due nodi non sono ben collegati. Innanzitutto quello che è stato fatto è portare una misura applicata ad archi(quale la dispersione) ad un singolo nodo, introducendo la dispersion centrality definita, a partire da un nodo, come la somma delle dispersioni da tutti i suoi vicini. Per ricavare dei risultati val- utabili è stata implementata una libreria scritta in python utilizzando la libreria [2]. Tale libre- ria consente, dato un grafo in input in formato edge, di calcolare per tutti i nodi del grafo alcune delle misure principali utilizzate in social net- work analysis aggiungendo dunque la dispersion centrality e di stampare i risultati in formato .cvs analizzabile poi con altri tool descritti in seguito. I paragrafi successivi formalizzeranno in maniera più precisa il concetto di dispersione così come proprosto in [1]; a questo punto ver- ranno dettagliate le metodologie utilizzate, i casi di studio e i risultati. Verranno dunque proposte delle conclusioni. 2. Dispersione Nella sociologia matematica, i legami interper- sonali sono definiti come connessioni che “in- globano” delle informazioni tra le persone. La forza di un legame costituisce una dimensione importante in cui si possono caratterizzare i col- legamenti di una persona ai suoi “vicini di rete”. Informalmente, si riferisce alla vicinanza di un collegamento: definisce un insieme che varia da legami forti a deboli; i primi sono spesso incor- porati nella rete, circondati da un vasto numero di vicini, mentre gli ultimi coinvolgono spesso pochi vicini e sono utilizzati come “ponti” per diverse zone della rete, fornendo accesso a im- portanti informazioni. Il punto critico è dunque identificare gli individui più importanti in una rete sociale. La caratteristica fondamentale in queste analisi è l’embeddedness (“annidamento” o “radicamento”): è una quantità che tipica- mente aumenta con la forza dei legami, poiché rappresenta il numero di persone che due nodi vicini hanno in comune. Tuttavia, è un mezzo debole per poter identificare le relazioni di una rete. In questo lavoro proponiamo una mis- urazione alternativa, chiamata dispersione, che è significativamente più efficace. Tale misura non prende in considerazione solo il numero di individui comuni a due persone, ma anche alla struttura della rete determinata da questo nu- 1
  • 2. mero; approssimativamente, una connessione tra due persone ha un’alta dispersione quando i loro vicini non sono connessi tra loro. La dispersione riflette la teoria del “social foci”: molte per- sone hanno grandi gruppi (o “cluster”) di amici o conoscenti corrispondenti a interazioni ben definite nella loro vita, come, nel nostro caso di studio, individui che frequentano un dojo e relativi istruttori oppure una rete criminale con i corrispondenti boss. Poiché molte persone all’interno di tali cluster si conoscono, questi ul- timi contengono dei link con alta embeddedness, anche se non corrispondono necessariamente a legami particolarmente forti. Al contrario, i col- legamenti agli amici di una persona possono avere radicamento minore, ma coinvolgono i vicini comuni di investimento da numerosi e diversi foci. Quindi, invece dell’embeddedness, ipotizziamo che i collegamenti tra un nodo u e un suo vicino v riflettano una struttura “dispersa”: in tal modo, i vicini comuni di u e v non sono ben connessi l’un l’altro, e quindi u e v agiscono congiuntamente come gli unici intermediari tra queste diverse parti della rete. Per poter definire la dispersione in termini matematici, formuliamo una serie di definizioni: per iniziare, consideriamo Gu come il sottografo indotto su u e sui suoi vicini, e per ogni nodo v definiamo Cuv come l’insieme dei vicini comuni di u e v. Per esprimere l’idea che le coppie di nodi in Cuv devono essere distanti in Gu quando non consideriamo i path in due step attraverso u e v stessi, definiamo la dispersione assoluta della collegamento u-v, disp(u,v), come la somma di tutte le distanze a coppie tra i nodi in Cuv, mis- urata in Gu - u, v; ovvero, disp(u, v) = s,t∈Cuv dv(s, t) dove dv è la distanza tra due nodi in Cuv; tale distanza dv (s,t) equivale a 1 se s e t non sono direttamente connessi e non hanno nodi in comuni in Gu, oltre a u e v stessi, e equivale a 0 altrimenti. Nei nostri casi di studio intervengono anche altre misurazioni: la dispersione normal- izzata, norm(u,v), definita come il rapporto tra la dispersione e l’embeddness; da questa sono state create altre due metriche per aumentare le prestazioni: la prima è la dispersione parametriz- zata, definita da: (disp(u, v) + b)α emb(u, v) + c La seconda è l’applicazione della dispersione in maniera ricorsiva: individuare i nodi v il cui collegamento u-v raggiunge una elevata disper- sione normalizzata sulla base di una serie di vicini comuni Cuv, che, a loro volta, hanno alta dispersione normalizzata nei loro legami con u. Per realizzare questa idea, assegniamo valori ai nodi che riflettono la dispersione nei loro legami con u, e quindi aggiorniamo questi valori con quelli di dispersione associati ad altri nodi. In particolare, definiamo xv= 1 per tutti i vicini v di u, e aggiorniamo iterativamente ogni xv: xv = w∈Cuv x2 w + 2 s,t∈Cuv dv(s, t)xsxt emb(u, v) + c Tuttavia, tali misurazioni, data una coppia di nodi definita da un arco, determinano un insieme di valori: per poter confrontare i risul- tati ottenuti, occorrerebbero nuove funzioni che restituiscono una sola misura. Per questo obiet- tivo, abbiamo definito diverse nuove metriche: centralità di dispersione, dispersione massima, dispersione minima, dispersione media. Tali fun- zioni non si basano su una coppia di nodi, ma su un singolo nodo: determinano quanto questo nodo venga coinvolto nel calcolo delle disper- sioni dei suoi vicini. Sommando le dispersioni di tali vicini, ne abbiamo determinato l’effettiva misurazione, la dispersione massima, la minima e la media. Inoltre, abbiamo effettuato i test sui grafi anche su altre funzioni ben note: la betweenness centrality, la degree centrality e la closeness centrality. La prima, per un nodo v, è determinata dall’espressione g(v) = s=v=t σs,t(v) σs,t Dove σst è il numero totale di cammini min- imi da s a t e σst è il numero di tali cammini che attraversano v. La degree centrality è stata una delle prime metriche sviluppate: è definita come il numero di archi incidenti su un nodo, 2
  • 3. ovvero la quantità di legami che ha un nodo. Nei nostri casi di studio, gli archi non sono di- rezionati, quindi useremo solo una misurazione (e non indegree o outdegree). Il significato dato da tale metrica è rappresentato dal fatto che gli individui più importanti sono coloro con più legami nella rete. La closeness centrality, invece, misura quanti passaggi devono essere fatti, par- tendo da un nodo v, per raggiungere il maggior numero possibile di nodi. In tal caso, la persona più importante può raggiungere facilmente le altre nella rete. 3. Metodologie Durante lo sviluppo di questo progetto ci siamo avvalsi del supporto di diverse tecnologie per la manipolazione e visualizzazione dei grafi tra cui: • Python • Xml • Csv • Snap • Gephi • Cran-R • Weka 3.1. Python Python è un linguaggio di programmazione di- namico orientato agli oggetti utilizzabile per molti tipi di sviluppo software. Offre un forte supporto all’integrazione con altri linguaggi e programmi, è fornito di una estesa libreria stan- dard e può essere imparato in pochi giorni. Molti programmatori Python possono confermare un sostanziale aumento di produttività e ritengono che il linguaggio incoraggi allo sviluppo di codice di qualità e manutenibilità superiori. Python gira su Windows, Linux/Unix, Mac OS X, OS/2, Amiga, palmari Palm e cellulari Nokia; è stato anche portato sulle macchine virtuali Java e .NET. 3.2. Snap Stanford Network Analysis Platform (SNAP) è una libreria per network analysis e graph mining. E’ scritta in C++ e scala facilmente con grafi massivi con centinaia di milioni di nodi e miliardi di archi. E’ capace di manipolare grafi molto grandi, calcolare proprietà strutturali, gener- are graphi random e regolari e supporta gli at- tributi su nodi e archi. Snap.py è una interfaccia Python per SNAP. Essa provvede le performance di SNAP, uniti alla flessibilità di Python. Molte delle funzioni di SNAP in C++ sono disponibili nella libreria Snap.py 3.3. Gephi Gephi è un tool di visualizzazione ed esplo- razione interattiva di qualsiasi tipo di rete, sistemi complessi, grafi dinimaci e gerarchici. Gephi gira su Windwos, Linux e OS X. E’ open- sorce e free 3.4. Implementazione Varie funzioni necessarie e di supporto sono state sviluppate tra cui: • fromGexfToEdge: permette la trasfor- mazione da un file di gephi ad un file di tipo EDGE, importabile in SNAP • commonNeighbors: permette di trovare il vicinato comune tra due nodi • dispersion: calcola la dispersione tra due nodi, così come da formula • embeddedness: corrisponde al vicinato co- mune tra due nodi • norm: calcola la dispersione normalizzata dispersione embeddedness • performance: calcola la norma aggiun- gendo dei parametri costanti di ottimiz- zazione • recDisp: calcola la dispersione ricorsiva da un nodo a tutti gli altri come da formula • printNodeInformations_XML: crea un file XML con tutti le informazioni su ogni nodo del grafo (degree centrality, between- ness centrality, closeness centrality, disper- sion centrality) • dispersionCentrality: calcola la disper- sione su ogni nodo vicino e ne effettua la somma 3
  • 4. • printNodesInformations_CSV: crea un file CSV con tutte le informazioni sui nodi, standard facilmente importabile in CRAN- R o Weka, tool di data analisys 4. Casi di studio Al fine di valutare quanto ipotizzato in fase di analisi del problema sono stati studiati alcuni casi reali. In particolare il primo caso studi- ato è stato quello rappresentatne un club di karate(presentato in [3]). Lo studio [3] risale al 1977. Gli autori hanno osservato il compor- tamento del club di karate dal 1970 al 1972, registrando ciò che accadeva all’interno del club. In particolare il club era formato da due istrut- tori i quali, a seguito di litigi dovuti a disaccordi sul prezzo delle lezioni, litigarono. La rete si di- vise in due parti, ciascuna con a capo uno degli istruttori e i relativi allievi. Infine, ulitmo caso di studio è il grafo di una rete criminale. Ciò che si vuole mostrare è che la dispersion centrality consente di evidenziare nodi che rappresentano nodi particolari(dal punto di vista semantico) all’interno del grafo. 5. Risultati Di seguito sono mostrati e commentati i risul- tati dei test effettuati sui vari casi di studio. Le metriche utilizzate per analizzare i risultati della dispersion centrality sono degree centrality, closeness centrality e betweenness centrality. 5.1. Karate Nella figura seguente si evince che, nella rete del Karate analizzata, esiste una netta correlazione tra betweenness centrality e dispersion central- ity, come si può notare nel relativo quadrante. In particolare gli outlier rappresentano i nodi 1, 34, 33 relativi ai 3 nodi più importanti della rete ovvero il capo istruttore e i 2 maestri. id 0.1 0.2 0.3 0.4 0.5 q q q qqq qqq q qq q q q q q qq q qq q q qq q q q q q q q q q q q qqqqq q q qqq q q q q qq q qq q q qq q q q q q q q q 0 50 100 150 200 q q q qqq qqq q qqq q q q q qq q qq q q qq q q q q q q q q 0102030 q q q q qqqqqq qqqq q q q qq q qq q q qq q q q q q q q q 0.10.30.5 q q q q q q qqq q q q q q q q q q q q q q q qqq q q q q q q q q degree_centrality q q q q q q qq q q q q q q q q q q q q q q q q qqqqq q q q q q q q q q q q qqq q q q q q q q q q q q q q q qqqqqq q q q q q q q q q q q qqq q q q q q q q q q q q q q q qqqqqq q q q q q q q q q q qqq q q q qq q q q q q q q qq q q qq q q q q q qq q q q qq q q qq q q q q q q q q q q q q qq q q qqqqq q qqq q closeness_centrality q q qq q q qq q q q qq q q q q q q q qq q q qqqqqq qqq q 0.300.400.50 q q qq q qqq q q q qq q q q q q q q qq q q qqqqqq qqq q 050150 q q q q qq qq q q qqq q q q q q qq q q q qqq q q q qq qq q q q q q qq qq q q qq q q q q q q qq q q q qqqqqq q qqqq q q q q qq qq q q qqq q q q q q qq q q q q qqqqqq qqqq betweenness_centrality q q q q qq qq q q qqq q q q q q qq q q q qqqqqqqqqqq 0 5 10 15 20 25 30 35 q q q q q qqqqq qqqq q q q qqq qq q qqq q q q qq q q q q q q q q q qqq qqq q qq qq qqq qq q qqqqqq q qq qq 0.30 0.40 0.50 q q q q q qqq q qqqq qq qq qqq qq q q qqqqqq qq qq q q q q q q qqq qqqq qq qq qqq qq q qqqqqqqq q qq 0 10 20 30 40 010203040 dispersion_centrality 5.2. Rete criminale La figura seguente mostra i risultati ottenuti applicando le stesse metriche ad una rete crimi- nale. Ciò che si evince è, ancora una volta, che gli outlier evidenziati dalla betweenness central- ity sono gli stessi evidenziati dalla dispersion centrality. id 0.00 0.05 0.10 0.15 0.20 q qq q q qqq q qq q qq q q qqq qq q q q q q qqq qq q q q q q qq qqqqqq q q q q qq q qq qq q qq q qq q qqq q q q q q qqqqqq q q qqq qqqq qqqqqq qq q q q q q q q q q q qqq q qqqq q qq qqqqqqqqqqqqq q qqq qq q q q qqq q qq qqqqqqqq qqq q q qq q q qqq q qq q qq q q qqq qq q q q q q qqq qq q q q q q qqqqqqqq q q q qqq q qq qq q qq q qq q qqq q q q q q qqqqqq q q qqq qqqq qqqqqq qq q q q q q q q q q q qqq q qqqq q qq qqqqqqqqqqqqq q qqq qq q q q qqq q qq q q q qqq qq qqq q 0 1000 2000 3000 4000 q qq q q qqq q qq q qq q q qqq qq q q q q q qqq qq q q q q q qqqqqqqq q q q q qq q qq qq q qq q qq q qqq q q q q q qqqqqq q q qqq qqqq qqq qqq qq q q q q q q q q q q qqqq qqqq qqqqqqqqqqqqqqqq q qqq qq q q q qqq q qq qqqqqqqq qqq q 050100 q qq q q qqq q q q q qq q q qqq qq q q q q q qqq qq q q q q q qqqqqqqq q q q q qq q qq qq q qq q qq q qqq q q q q q qqqqqq q q qqq qqqq qqqqqq qq q q q q q q q q q q qqqq qqqq qqqqqqqqqqqqqqqq q qqq qq q q q qqq q qq qqqqqqqq qqq q 0.000.100.20 q qq q q qqq q q q qq q q qqqq qq q qq q q qq q qqq q q q q qq q qqqqq q q q q q q q qq qq q qq q qq qqqq q q qq q qqqqqq qqqqq qqqq q q qqqq qq q q q q q q q q q qqqq q q qqq q qq q qqqqqqqqqq qq qqqq qq qq qqqq q qqqqqqqqqq qqq q degree_centrality q qq q q qqq q q q qq q q qqqq qq q qq q q qq qqqqq q q q qq q qqqqq q q q q q q q qq qqqqq q qqq qqqq q qq q qqqqqq qqqqqqqqq q q qqqqqq q q q qq q qq q qqqq q q qqq q qq q qqqqqqqqqq qqqqqq qq qq qqqqqqqq q q qqq qq qqq q q qq q q qqq q q q q q q q qqqq qq q qq q q qq qqqqq q q q qq q qqqqq q q q q q q q qqqqqqq q qqqqqqq q qq q qqqqqq qqqqqqqqq q q q qqqqq q q q qq q qq q qqqq q q qqq q qq q qqqqqqqqqq qqqqqq qq qq qqqqqqqqqqqqqqqqqqq q qq q q qqq q q q qq q q qqqq qq q qq q q qq qqqqq q q q qq q qqqqq q qq q q q q qqqqqqq qqqqqqqq q qq q qqqqqq qqqqqqqqq q q qqqqqq q q q qq q qq q qqqq q q qqq q qq q qqqqqqqqqq qqqqqq qq qq qqqqqqqqqqqqqqqqqqq q qq q q qqqq qq qq q q qqqq qq q qq q qqqq qqq q q q q qqqqqqqq q q q qqq q qq q q q qq q q q q qqq qq qq q qqqqqq qqqqq qqqq q qqqqq qq q q qq q q q q q qqq q q qqqqq qq q qqqqqqqqqq qq q qqq q qqq qqq q q qqq q q q q q q q qq q q q qq q q qqq q qqqq q qqqqq qq q qq q q qqqqqqq q q q qq qqqqqq q q q q qq q qq q qqqq q q qq qqqq qqq qqqqqqqqqqqqqqqq q qqqqqqq q q q qq q qq qqqq q q qqqqq qq q qqqqqqqqqq qq q qqq q q qqqqq q q qqq q q q q q q q qq q q closeness_centrality q qq q q qqq q qqq q q qqqqq qq q qq q q qqqqqqq q q q qqqqqqqq q q q q qq q qq q qqqq q q qq qqqqqqq qqqqqqqqqqqqqqqq q qq qqqqq q q qqq q qq qqqq q q qqqqq qq q qqqqqqqqqq qq q qqq q q qqqqq q q qqq q q q q q q q qq q q 0.20.61.0 q qq q q qqq q q qqq q qqqqq qq q qq q qqqqqqqq q q q qqqqqqqq q q q q qq q qq q qqqq q q qq qqqqqqqqqqqqqqqqqqqqqqq q qqqqqqq q q qqq q qq qqqq q q qqqqq qq q qqqqqqqqqq qq q qqq q qqqqqq q q qqq q q q q q q q qq q q 020004000 q qq q q qqq q q q q q q q q qqqqq q qq q q q q q qqq q q q q qqqqqqqq q q q q q q q qq qq q qqq q q qqqq qq qq q qqqqqq qqqqq qqqq q qq q qq qq q q qq qq q q q qqqqq qqqqqqqqqqqqqqqqqqqq qqqq q q q q qqqq q qqqqqqqqqq qqq q q qq q q qqq q q q q q q qq qqq qqq qq q q q q qqqqq q q q qq qqqqqq q q q q q q q qqqqqqq q q qqqqqq qqq q qqqqqqqqqqqqqqq q qq q qqqq q q q qq qqq q qqqq q qqqqq qq qqqqqqqqqqqqqqqqq q q q qqqqqqqqqqqqqqqqqqqq q qq q q qqq q q q q q q qq qqq qqq qq q q q q qqqqq q q q qqqqqqqq q q q q q q q qq qqqqqq q qq qqqqqqq q qqqqqqqqqqqqqqq q qq q qqqq q q qqqqqq q qqqq qqqqqq qq qqqqqqqqqqqqqqqqq q q q qqqqqqqqq q q qqq qq qqq q betweenness_centrality q qq q q qqq q q q q q q qq qqqqqqqq q q q q qqqqq q q q qqqqqqqq q q q q q q q qqqqqqqq q qqqqqqqqq q qqqqqqqqqqqqqqq q qq q qqqq q q qqq qqq q qqqqq qqqqqqqqqqqqqqqqqqqqqqqq q q q qqqqqqqqqqqqqqqqqqqq 0 50 100 150 q qq q q qqq q q q qqq q qqqqqq q qq q qqqq qqq q q q q qqqqqqqqq q qq q qq qq qq q qqq qq qqqq qq qq q qqqqqq qqqqq qqqqqqqqqq qqqq qq q q q qq qqqqq q qqqqqqqqqqqqqqqqqqq qqqq qqqq qqqq q qqqqqqqqqq qqq q q qq q q qqq q q q qqq q qqqq qqq qq q q qqqqqqq q q q qq qqqqqq qqq q q q qqqqqqqq qqqqqqqq qqq qqqqqqqqqqqqqqqq qqqqqqqq q qq qq q qq qqqqq q q qqqq qq qqqqqqqqqqqqqqqqq qq qqqqqqqqqqqqqqqqqqqqq 0.2 0.4 0.6 0.8 1.0 q qq q q qqq q q q qqq q qqqq qqq qq q qqqqqqqq q q q qqqqqqqqqq qq q q qqq qqqqqq qqq qqqqqqqqqqqqqqqqqqqqqqq qqqqqqqq qqqqq q qq qqqqq q q qqqq qq qqqqqqqqqqqqqqqqq qqqqqqqqqqqq q q qqq qq qqq q q qq q q qqq q q q q qq q qqqqqqqqq q q qqqqqqq q q q qqqqqqqq qq qq q q qqqqqqqqq qqqqqqqqqq qqqqqqqqqqqqqqqq qqq qqqqq qqqqq q qqqqqqqq q qqqqqqqqqqqqqqqqqqqqqqq qq qqqqqqqqqqqqqqqqqqqqq 0 10 20 30 0102030dispersion_centrality 6. Conclusioni Partendo dall’analisi della dispersione[1](unità applicabile ad un arco di una rete) abbiamo con- siderato, dato un nodo, la somma delle disper- sioni tra questo nodo ed i suoi vicini(dispersion centrality) in modo da ottenere una misura confrontabile con degree centrality, closeness centrality e betweenness centrality. Ciò che è emerso dai risultati sui dataset utilizzati è 4
  • 5. quanto segue: la dispersion centrality fornisce le stesse informazioni della betweenness centrality. La differenza sostanziale è che il calcolo della dispersion centrality è parallelizzabile. References [1] Romantic Partnerships and the Disper- sion of Social Ties: A Network Analy- sis of Relationship Status on Facebook - http://arxiv.org/pdf/1310.6753.pdf [2] Snap http://snap.stanford.edu/ [3] Journal of Anthropological Research, Vol. 33, No. 4 (Winter, 1977), pp. 452-473 http://www1.ind.ku.dk/ complexLearning/zachary1977.pdf 5