SlideShare a Scribd company logo
Reti sociali, algoritmi spettrali,
SNAP
●

Perché le reti sociali sono diverse dalle altre?

 Il PageRank e le comunità

●

 SNAP: un laboratorio per tutti

●
Le reti sociali
Le reti sociali studiate in letteratura sono 
“complesse”:
 Pochi gradi di separazione
●
 Elevato clustering
●

… ma hanno una particolarità.
Assortative mixing nelle reti sociali
Nelle  reti  sociali  i  nodi  della  rete  tendono  a 
collegarsi preferibilmente con nodi con un grado 
k simile.
 I gradi dei nodi vicini sono correlati 
positivamente.

➔

In  sociologia,  per  le  reti  in  cui  i  gradi  dei  nodi 
vicini  sono  correlati  si  parla  di  assortative 
mixing.
Come si osserva l'assortatività?

r di Pearson: coefficiente di correlazione tra il 
“grado in eccesso” (excess degree qi = ki) dei nodi 
vicini

∑ jk jk (e jk −q j q k )
r=
2
2
∑k k q k −(∑k qk )
Come si osserva l'assortatività?
Knn(k): grado medio dei vicini dei nodi di grado k

∑ ∑

K nn (k )=

k i =k j ∈I (i)

kj

NP (k ) k

Knn(k) crescente → mixing assortativo
Knn(k) decrescente  → mixing disassortativo
Come si osserva l'assortatività?

r : quantitativo e non ambiguo
Knn(k): qualitativo ma più utile se il rumore 
statistico è elevato e il coefficiente r è troppo 
vicino a 0.
Le correlazioni nelle reti sociali
Perché le reti sociali sono diverse?

Nelle reti sociali i nodi sono organizzati in 
comunità
Le reti sociali sono soprattutto reti collaborative
Il modello di rete sociale
di Newman e Park
N nodi, G comunità
● r : probabilità che un nodo appartenga a m 
m
●

comunità
● s : probabilità che un gruppo contenga n nodi
n
 nodi distribuiti nelle comunità in modo casuale
●
 due nodi nella stessa comunità sono connessi 
con probabilità p
●
Il modello di rete sociale
di Newman e Park
Nodi e comunità

Link possibili
Il modello di rete sociale
di Newman e Park
Nodi e comunità

Link possibili
Il calcolo della correlazione r

 Nel modello di Newman e Park, la correlazione 
r si può calcolare analiticamente. 
●

 rn e sn siano distribuzioni poissoniane 

●

→ probabilità costante che un nodo appartenga 
ad una comunità
Il calcolo della correlazione r
In questo caso, la correlazione r si può calcolare 
analiticamente:

p
r=
>0
1+ ν+ νμ p
dove 

ν=∑n n r n
μ=∑n n s n
Il calcolo della correlazione r
Verifica del modello
Rete degli autori di articoli scientifici
rreal = 0.145
rteor = 0.174 ± 0.45
Rete dei manager
rreal = 0.276
rteor = 0.116
Il calcolo della correlazione r
Verifica del modello
Rete degli autori di articoli scientifici
rreal = 0.145
rteor = 0.174 ± 0.45 OK
Rete dei manager
rreal = 0.276
rteor = 0.116
Il calcolo della correlazione r
Verifica del modello
Rete degli autori di articoli scientifici
rreal = 0.145
rteor = 0.174 ± 0.45 OK
Rete dei manager
rreal = 0.276
rteor = 0.116  ???
Algoritmi spettrali

Algoritmi basati sullo studio di matrici associate 
alle reti
●
 PageRank
●
 Community detection
PageRank

Algoritmo con cui Google “valuta” la rilevanza 
delle pagine web
Una pagina web è rilevante se la probabilità di 
visitarla navigando sui link della rete è alta
Ad ogni pagina web viene assegnato un valore 
detto “PageRank”, PR(i).
PageRank

PageRank: distribuzione stazionaria di un 
random walk a tempi discreti sulla rete WWW 
(diretta)
PR(i) : probabilità che un navigatore casuale si trovi
sul nodo i dopo un tempo t → ∞
Il calcolo del PageRank
Il calcolo del PageRank

Probabilità 
di transizione
Il calcolo del PageRank

v  = distribuzione iniziale

vi  = probabilità di trovare un random walk sul 
nodo i al tempo iniziale
v(t) = distribuzione del random walk dopo t passi
(t)
i

v  = probabilità di trovare un random walk sul 
nodo i al tempo t
PR(i) = v

(∞)
i
Il calcolo del PageRank

v  = distribuzione iniziale

vi  = probabilità di trovare un random walk sul 
nodo i al tempo iniziale
v(t) = distribuzione del random walk dopo t passi
(t)
i

v  = probabilità di trovare un random walk sul 
nodo i al tempo t
PR(i) = v

(∞)
i

∑ v i =∑ v
i

i

=∑ v =∑ PR(i)=1

(t )
i

i

(∞)
i

i
Il calcolo del PageRank
La distribuzione al primo step evolve così :
(1)
v i =∑ j Aij v j
Per un generico intervallo t →t +1 :
(t +1)
(t )
v i =∑ j Aij v j
Se t →∞
(∞)
(∞)
v i =∑ j Aij v j
Il calcolo del PageRank
Usando il formalismo vettoriale
(∞ )

v  = Av

(∞)

Quindi 
il PageRank è l'autovettore principale 
della matrice A associato all'autovalore 1
Le “patologie” della rete
Loop e nodi con out­degree nullo possono ridurre 
lo stato stazionario in uno stato banale.
Per ovviare a questo problema, Brin e Page 
modificarono il processo stocastico così:
con probabilità 1­p, ad ogni passo il “random 
surfer” segue i link della rete
●
con probabilità p il “random surfer” salta su 
un'altra pagina scelta casualmente
●
Le “patologie” della rete
Il processo stocastico ora è descritto 
dall'equazione

v

p
=(1− p) ∑ Aij v +
N
j

(t +1)
i

(t )
j

e tende all'autovettore principale della matrice
con
Teorema di Perron-Frobenius

La matrice M:
 ha un autovalore 1 di molteplicità 1
●
 1 è l'autovalore massimo
●
 l'autovettore corrispondente ha tutti elementi 
positivi
●

●
Le comunità

La matrice A

T

 ha un autovalore pari a 1

●

 corrisponde ad un autovalore con 
componenti costanti
●
Le comunità
Se una rete ha componenti disconnesse...
Le comunità
… la matrice A è a blocchi...
Le comunità
… e la trasposta ha più autovettori principali
con un aspetto particolare.
Le comunità
Dunque
La molteplicità dell'autovalore 1 ci dice il 
numero di componenti disconnesse
●

Le componenti dell'autovettore di AT che hanno 
lo stesso valore corrispondono a nodi che 
appartengono alla stessa componente
●

Lo studio di autovettori e autovalori di A e AT ci 
permette di capire la presenza di comunità 
all'interno della rete
●
Bibliografia
M. E. J. Newman e Juyong Park 
“Why social networks are different from other types of networks”
Phys. Rev. E 68, 036122 (2003)
Page, Lawrence, Sergey Brin, Rajeev Motwani, and Terry 
Winograd. 
"The PageRank citation ranking: bringing order to the web." 
(1999).
Capocci, Andrea, et al. 
"Detecting communities in large networks." 
Physica A: Statistical Mechanics and its Applications 352.2 
(2005): 669­676.
Analizzare le reti con Awk
http://snap.stanford.edu/data/ca-CondMat.html
Scrivi la P(k):
awk ' { k[$1]++; k[$2]++ } END{for (i in k) count[k[i]]++; for (i in
count) print i,count[i]}' ca-CondMat.txt | sort -n >
pdk_condmat.dat

More Related Content

Viewers also liked

Algoritmi
Algoritmi Algoritmi
Algoritmi
Tania de Angelis
 
15 - Programmazione: Algoritmi
15 - Programmazione: Algoritmi15 - Programmazione: Algoritmi
15 - Programmazione: AlgoritmiMajong DevJfu
 
Esercizio Sugli Algoritmi
Esercizio Sugli AlgoritmiEsercizio Sugli Algoritmi
Realtà aumentata markerless basata su algoritmi di Image Recognition e SLAM
Realtà aumentata markerless basata su  algoritmi di Image Recognition e SLAMRealtà aumentata markerless basata su  algoritmi di Image Recognition e SLAM
Realtà aumentata markerless basata su algoritmi di Image Recognition e SLAM
Simone Sabbatini
 
Cosa sono gli algoritmi?
Cosa sono gli algoritmi?Cosa sono gli algoritmi?
Cosa sono gli algoritmi?mattuzzi
 
come costruire un algoritmo
come costruire un algoritmocome costruire un algoritmo
Google Page Rank Algorithm
Google Page Rank AlgorithmGoogle Page Rank Algorithm
Google Page Rank Algorithm
Omkar Dash
 
Un algoritmo è per sempre
Un algoritmo è per sempreUn algoritmo è per sempre
Un algoritmo è per sempre
Alessandro Bogliolo
 
Flow Chart - Diagramma a blocchi
Flow Chart - Diagramma a blocchiFlow Chart - Diagramma a blocchi
Flow Chart - Diagramma a blocchi
dibari.92
 
ECDL modulo 1 ud1: algoritmi rappr informazione
ECDL modulo 1 ud1: algoritmi rappr informazioneECDL modulo 1 ud1: algoritmi rappr informazione
ECDL modulo 1 ud1: algoritmi rappr informazioneFabio Cantaro
 

Viewers also liked (10)

Algoritmi
Algoritmi Algoritmi
Algoritmi
 
15 - Programmazione: Algoritmi
15 - Programmazione: Algoritmi15 - Programmazione: Algoritmi
15 - Programmazione: Algoritmi
 
Esercizio Sugli Algoritmi
Esercizio Sugli AlgoritmiEsercizio Sugli Algoritmi
Esercizio Sugli Algoritmi
 
Realtà aumentata markerless basata su algoritmi di Image Recognition e SLAM
Realtà aumentata markerless basata su  algoritmi di Image Recognition e SLAMRealtà aumentata markerless basata su  algoritmi di Image Recognition e SLAM
Realtà aumentata markerless basata su algoritmi di Image Recognition e SLAM
 
Cosa sono gli algoritmi?
Cosa sono gli algoritmi?Cosa sono gli algoritmi?
Cosa sono gli algoritmi?
 
come costruire un algoritmo
come costruire un algoritmocome costruire un algoritmo
come costruire un algoritmo
 
Google Page Rank Algorithm
Google Page Rank AlgorithmGoogle Page Rank Algorithm
Google Page Rank Algorithm
 
Un algoritmo è per sempre
Un algoritmo è per sempreUn algoritmo è per sempre
Un algoritmo è per sempre
 
Flow Chart - Diagramma a blocchi
Flow Chart - Diagramma a blocchiFlow Chart - Diagramma a blocchi
Flow Chart - Diagramma a blocchi
 
ECDL modulo 1 ud1: algoritmi rappr informazione
ECDL modulo 1 ud1: algoritmi rappr informazioneECDL modulo 1 ud1: algoritmi rappr informazione
ECDL modulo 1 ud1: algoritmi rappr informazione
 

More from Andrea Capocci

La ricezione delle onde con un circuito RLC
La ricezione delle onde con un circuito RLCLa ricezione delle onde con un circuito RLC
La ricezione delle onde con un circuito RLC
Andrea Capocci
 
Relazioni 1
Relazioni 1Relazioni 1
Relazioni 1
Andrea Capocci
 
Probabilità e statistica: la scienza della previsione
Probabilità e statistica: la scienza della previsioneProbabilità e statistica: la scienza della previsione
Probabilità e statistica: la scienza della previsione
Andrea Capocci
 
Caduta dal terzo piano
Caduta dal terzo pianoCaduta dal terzo piano
Caduta dal terzo piano
Andrea Capocci
 
Energia e trasformazioni
Energia e trasformazioniEnergia e trasformazioni
Energia e trasformazioni
Andrea Capocci
 
Energia e trasformazioni
Energia e trasformazioniEnergia e trasformazioni
Energia e trasformazioniAndrea Capocci
 
Lezione 2: Robustezza, epidemie e correlazioni nelle reti
Lezione 2: Robustezza, epidemie e correlazioni nelle retiLezione 2: Robustezza, epidemie e correlazioni nelle reti
Lezione 2: Robustezza, epidemie e correlazioni nelle reti
Andrea Capocci
 
Il DDL 953 "ex-Aprea" nelle scuole superiori
Il DDL 953 "ex-Aprea" nelle scuole superioriIl DDL 953 "ex-Aprea" nelle scuole superiori
Il DDL 953 "ex-Aprea" nelle scuole superiori
Andrea Capocci
 
Brevetti e ricerca scientifica
Brevetti e ricerca scientificaBrevetti e ricerca scientifica
Brevetti e ricerca scientificaAndrea Capocci
 
L'impatto della proprietà intellettuale sulla ricerca
L'impatto della proprietà intellettuale sulla ricercaL'impatto della proprietà intellettuale sulla ricerca
L'impatto della proprietà intellettuale sulla ricercaAndrea Capocci
 
L'impatto della proprietà intellettuale sulla ricerca
L'impatto della proprietà intellettuale sulla ricercaL'impatto della proprietà intellettuale sulla ricerca
L'impatto della proprietà intellettuale sulla ricercaAndrea Capocci
 
Il Protocollo Sul Welfare 2007
Il Protocollo Sul Welfare 2007Il Protocollo Sul Welfare 2007
Il Protocollo Sul Welfare 2007Andrea Capocci
 
Il Protocollo Sul Welfare 2007
Il Protocollo Sul Welfare 2007Il Protocollo Sul Welfare 2007
Il Protocollo Sul Welfare 2007Andrea Capocci
 
Il Protocollo Sul Welfare
Il Protocollo Sul WelfareIl Protocollo Sul Welfare
Il Protocollo Sul Welfare
Andrea Capocci
 
I problemi della ricerca in Europa
I problemi della ricerca in EuropaI problemi della ricerca in Europa
I problemi della ricerca in EuropaAndrea Capocci
 
I problemi della scienza in Europa
I problemi della scienza in EuropaI problemi della scienza in Europa
I problemi della scienza in Europa
Andrea Capocci
 

More from Andrea Capocci (17)

La ricezione delle onde con un circuito RLC
La ricezione delle onde con un circuito RLCLa ricezione delle onde con un circuito RLC
La ricezione delle onde con un circuito RLC
 
Relazioni 1
Relazioni 1Relazioni 1
Relazioni 1
 
Probabilità e statistica: la scienza della previsione
Probabilità e statistica: la scienza della previsioneProbabilità e statistica: la scienza della previsione
Probabilità e statistica: la scienza della previsione
 
Caduta dal terzo piano
Caduta dal terzo pianoCaduta dal terzo piano
Caduta dal terzo piano
 
Energia e trasformazioni
Energia e trasformazioniEnergia e trasformazioni
Energia e trasformazioni
 
Energia e trasformazioni
Energia e trasformazioniEnergia e trasformazioni
Energia e trasformazioni
 
Lezione 2: Robustezza, epidemie e correlazioni nelle reti
Lezione 2: Robustezza, epidemie e correlazioni nelle retiLezione 2: Robustezza, epidemie e correlazioni nelle reti
Lezione 2: Robustezza, epidemie e correlazioni nelle reti
 
Il DDL 953 "ex-Aprea" nelle scuole superiori
Il DDL 953 "ex-Aprea" nelle scuole superioriIl DDL 953 "ex-Aprea" nelle scuole superiori
Il DDL 953 "ex-Aprea" nelle scuole superiori
 
Brevetti e ricerca scientifica
Brevetti e ricerca scientificaBrevetti e ricerca scientifica
Brevetti e ricerca scientifica
 
L'impatto della proprietà intellettuale sulla ricerca
L'impatto della proprietà intellettuale sulla ricercaL'impatto della proprietà intellettuale sulla ricerca
L'impatto della proprietà intellettuale sulla ricerca
 
L'impatto della proprietà intellettuale sulla ricerca
L'impatto della proprietà intellettuale sulla ricercaL'impatto della proprietà intellettuale sulla ricerca
L'impatto della proprietà intellettuale sulla ricerca
 
Il Protocollo Sul Welfare 2007
Il Protocollo Sul Welfare 2007Il Protocollo Sul Welfare 2007
Il Protocollo Sul Welfare 2007
 
Il Protocollo Sul Welfare 2007
Il Protocollo Sul Welfare 2007Il Protocollo Sul Welfare 2007
Il Protocollo Sul Welfare 2007
 
Il Protocollo Sul Welfare
Il Protocollo Sul WelfareIl Protocollo Sul Welfare
Il Protocollo Sul Welfare
 
Pula 5 Giugno 2007
Pula 5 Giugno 2007Pula 5 Giugno 2007
Pula 5 Giugno 2007
 
I problemi della ricerca in Europa
I problemi della ricerca in EuropaI problemi della ricerca in Europa
I problemi della ricerca in Europa
 
I problemi della scienza in Europa
I problemi della scienza in EuropaI problemi della scienza in Europa
I problemi della scienza in Europa
 

Lezione3: Reti sociali, Algoritmi spettrali e SNAP