4. — Definizione di Congestion Game:
— n giocatori ;
— a ciascun giocatore i viene assegnato un insieme finito di
strategie
(ossia un insieme di risorse disponibili all’i-esimo giocatore);
— a ciascun giocatore i viene assegnata una funzione di costo
che desidera minimizzare (il costo di ogni
strategia dipende solo dal numero di giocatori che usano la risorsa
in questione)
Congestion Game
}{ 1, ,… np p
iS
Maggiore è il numero dei
giocatori che utilizzano
una risorsa
1:i nc S S× × →L N
Maggiore
è il
costo
4
5. — Formalmente il costo per pi è
— Uno stato è una qualsiasi combinazione di
strategie per gli n giocatori.
— equilibrio di Nash puro: uno stato
è un equilibrio di Nash se
numero di giocatori che
usano la risorsa “e”
funzione di costo (non negativa)
1 1( , , )n ns s s S S= … ∈ × ×L
'
1 1( , , , , ) ( , , , , )i i i n i i np c s s s c s s s∀ … … ≤ … …
'
i is S∀ ∈
Congestion Game
( )
| |i
i
r
s
r s
rd f
∈
∑
1 1( , , )n ns s s S S= … ∈ × ×L
Per ogni
giocatore
Il costo della strategia
scelta da pi
Il giocatore pi non è
incentivato a
cambiare
Per ogni
altra strategia
5
12. ε-N.E. e Dinamiche ε-Nash
Se più di un giocatore ha una ε-mossa disponibile, solo il giocatore il cui
relativo guadagno è il più grande effettuerà la sua mossa. In altre parole, il
giocatore pi effettua la sua mossa se, tale mossa massimizza il rapporto
Se i giocatori non hanno
più ε-mosse da effettuare
I giocatori hanno raggiunto
un ε-equilibrio di Nash
( ) 1( , , , , )
( )
R
− … …
=
'
i i i n
i
c s c s s s
c s
Costo ottenuto nel caso
in cui il giocatore effettua
la mossa si’
Minore è tale costo e
maggiore è il rapporto R
Costo Precedente
12
14. ENUNCIATO
In un gioco a congestione simmetrico dove, ogni arco soddisfa la
condizione “α-bounded jump “, se nelle dinamiche ε-approssimate nello
stato s la prossima mossa è fatto dal giocatore pi ,allora
( ) ( )∀ ≠ ≤j ij i c s α c s
Lemma 3.2
Per ogni giocatore
pj diverso dal
giocatore pi
Il costo del giocatore pj è
al più α volte il costo del
giocatore pi
14
16. Lemma 3.2
Ossia
A questo punto, confrontiamo il costo che il giocatore
pi paga per effettuare la sua mossa con quanto avrebbe pagato il
giocatore pj per effettuare la sua mossa da sj’’ (se vedessimo vincere l’uno
o l’altro giocatore): ∀ arco che il giocatore pi vuole
usare, possiamo avere che
1( , , , , )… …'
ni ic s s s
1( , , ', , )i ne s s s∈ K K
1 1
( ) ( , , , , ) ( ) ( , , , , )
( ) ( )
j− … … − … …
≤
j j n i i
'
i
i n
'
j
'
s s s sc c s s c c s s
c cs s
(1)
Per la condizione di “bounded jump” abbiamo che . ( ) ( )( ) 1 ( )e s e sd f e d f eα+ ≤
1. pi sta già usando l’arco
“e” prima della mossa pj paga al più per usare l’arco
e
( )( ) 1e sd f e +
pi paga per usare l’arco
e
( )( )e sd f e
(perchè pj stesso potrebbe essere il
nuovo
giocatore che utilizza l’arco e)
16
17. Lemma 3.2
2. pi non sta già usando
l’arco e prima della
mossa pj paga al più lo stesso prezzo ( )( ) 1e sd f e +
pi paga per usare l’arco
e
( )( ) 1e sd f e +
Sommando su tutti gli archi abbiamo che 'ie s∈
1 1( , , , , ) ( , , , , )j α… … ≤ … …'' '
j n i i nc s s s c s s s (2)
iR
1( ) ( , , , , )
( )
i jα− … …'
j n
j
c s c s s s
c s
1( ) ( , , , , )
( )
j− … …
≤
''
j j n
j
c s c s s s
c s
1( ) ( , , , , )
( )
− … …
≤
'
i i i n
i
c s c s s s
c s
Sostituendo la (2) nella disequazione (1) abbiamo che
jR
17
18. 18
Lemma 3.2
Semplificando, abbiamo ( ) ( )∀ ≠ ≤j ij i c s α c s
1 1
( ) ( , , , , ) ( ) ( , , , , )
( ) ( ) ( ) ( )
i jα … … … …
⇒ − ≤ − ⇒
' '
j n i i i n
j j i i
c s c s s s c s c s s s
c s c s c s c s
1 1
( , , , , ) ( , , , , )
1 1
( ) ( )
i jα … … … …
⇒ − ≤ − ⇒
' '
n i i n
j i
c s s s c s s s
c s c s
1 1
( , , , , ) ( , , , , )
( ) ( )
i jα … … … …
⇒ − ≤ − ⇒
' '
n i i n
j i
c s s s c s s s
c s c s
1 1
( , , , , ) ( , , , , )
( ) ( )
i jα … … … …
⇒ ≥ ⇒
' '
n i i n
j i
c s s s c s s s
c s c s
1
( ) ( )
α
≥
j ic s c s
21. Teorema 3.1
Da cui, dopo un movimento di pi stato s allo stato s’
( ) ( ) ( ) ( ) ( )φ φ ε− = − >' '
i i is s c s c s c s
Variazione del
potenziale
Variazione del
costo per pi
= Trattandosi di un ε-mossa la variazione
del costo per pi è più di ε-volte il
costo dello stato precedente s
( )φ≥ s
ε
αn
1
( ) ( )φ≥ic s s
αn
Dato che
In generale
Nello stato iniziale 𝜙 =𝜙max = potenziale iniziale; dato che
n
φ
φ
ε
α
=
⋅
Ad ogni passo
φ ≤max nCe dal momento chelog ( )
nα
φ
ε
⎡ ⎤
⎢ ⎥
⎢ ⎥
s
Numero totale di passi per la convergenza
21
24. Meccanismi di coordinamento
— Osservazione: finora abbiamo sempre utilizzato un meccanismo di
coordinamento nel quale il giocatore con il maggiore incentivo fa la
prima mossa
— 1) Domanda: quando vengono utilizzati altri meccanismi di
coordinamento cosa succede? Per queste varianti dell’ ε-Nash
dynamics, il teorema 3.1 è ancora valido (convergenza polinomiale a
ε-equilibri di Nash)?
— 2) Domanda: quando non viene utilizzato nessun meccanismo di
coordinamento cosa succede? E’ possibile convergere polinomiale a ε-
equilibri di Nash?
24
25. Varianti della ε-Nash dynamics
Largest gain dynamics: ad ogni passo, tra tutti i giocatori con un ε-
mossa disponibili, quello che si muove è quello il cui miglioramento dei
costi (assoluto) è il maggiore.
Una variante della ε-Nash dynamics
( ) 1Cerchiamo il giocatore che massimizza ( , , , , )R = − … …'
i i i nc s c s s s
Costo Precedente Costo del giocatore
se effettua la mossa
si’
Un’altra variante della ε-Nash dynamics
Heaviest first dynamics: ad ogni passo, tra tutti i giocatori con un ε-mossa
disponibili, si consente la mossa al giocatore con il maggior costo corrente
( )Cerchiamo il giocatore con più grandeic s
25
27. — 2) Domanda: quando non viene utilizzato nessun meccanismo di
coordinamento cosa succede? E’ possibile convergere polinomiale a ε-
equilibri di Nash?
The unrestricted dynamics è un meccanismo in cui i giocatori:
• possono muoversi in un ordine arbitrario
• sono soggetti ad una sola condizione “necessaria”: a ogni
giocatore deve essere data la possibilità di fare la propria mossa
entro un certo limite di tempo
— Osservazione: finora abbiamo sempre utilizzato un meccanismo di
coordinamento nel quale il giocatore con il maggiore incentivo fa la
prima mossa
Le dinamiche senza “restrizioni”
27
28. — Più formalmente la dinamica senza restrizioni è
— una sequenza di q1 ,q2 ,… ,qn dove
ogni qt indica un giocatore
— al passo t al giocatore qt è data la possibilità di muoversi
Le dinamiche senza “restrizioni”
Si
Fa la mossa
qt ha un ε-mossa?
No
Non fa nulla
— Vogliamo che per qualche costante T ogni giocatore pi compaia
almeno una volta in ogni intervallo di sequenza con lunghezza T
28
30. Le dinamiche senza “restrizioni”
— 2) Domanda: quando non viene utilizzato nessun meccanismo di
coordinamento cosa succede? E’ possibile convergere polinomiale a ε-
equilibri di Nash?
Risposta: Si
Dal
Teorema 4.1 In ogni gioco a congestione simmetrico con n giocatori i
cui archi soddisfano α-bounded jump condition, qualsiasi ε-Nash-
dynamics, in cui a ogni giocatore viene data la possibilità di fare la
propria mossa all'interno di ogni intervallo di tempo di lunghezza t ,
converge da qualsiasi stato iniziale in un numero di passi pari a
è un limite
superiore al costo
di ogni giocatore
( 1)
( )
(1 )
⎡ ⎤+
⎢ ⎥−⎢ ⎥
n α
log nC T
ε ε ( ) ( )0 0(1 )
( 1)
φ φ φ− ≥
−
+
t
s s
ε ε
n α
30
31. Le dinamiche senza “restrizioni”
Per provare il teorema 4.1 è utile enunciare (e dimostrare) il seguente
Lemma:
Lemma 4.2 Sia ci (s) il costo sostenuto dal giocatore pi nello stato
s , e sia ci (s’) il costo di pi “in uno stato futuro s’ in cui non si è
mosso”. Allora
( ) ( ) ( ) ( )( ).φ φ ε− ≥ −' '
i is s c s c s
“Concettualmente”
mette in relazione
il miglioramento della
funzione potenziale
la variazione del costo per
pi, anche quando il giocatore
non fa nessuna mossa per
molti steps
31
32. Dimostrazione lemma
Le dinamiche senza “restrizioni”
Sappiamo che ( ) ( ) ( )( ) ( )( )( )S∈
= −− ∑
i
'e s e s
e
'
i i d f e d f ec s c s
la variazione del costo
per pi
I contributi positivi a questa somma sono
dati dagli archi e che altri giocatori hanno
liberato
( ) ( )> 's s
f e f e
e∀ Sapendo che il primo giocatore pj che rinuncia a e aveva un costo di
almeno allora la funzione potenziale migliora di almeno ( )( )e sd f e
( )( )e sεd f e
32
33. valore che ha
assunto la funzione
potenziale all'inizio
dell'intervallo
Il miglioramento totale di 𝜙 è è
Le dinamiche senza “restrizioni”
Dimostrazione Teorema 4.1
Ai fini della prova è sufficiente mostrare che durante ogni intervallo in cui a ogni
giocatore è data la possibilità di effettuare una mossa, la funzione potenziale 𝜙
diminuisce di almeno
0(1 )
( 1)
φ
−
+
ε ε
n α
( 1)
( )
(1 )
⎡ ⎤+
⎢ ⎥−⎢ ⎥
n α
log nC T
ε ε
Convergenza in
al più
( ) ( ) ( ) ( ) ( )( ): ( ) ( )
( )φ φ ε
>
− ≥ ≥ −∑
s 's
' '
i i
e
e
f e
s
f e
εd f ces s s c s
ε-volte quanto
ci guadagna pi
33
34. § Siano gli stati durante questo intervallo
(non necessariamente differenti)
Le dinamiche senza “restrizioni”
0 1
, , ,… T
s s s
§ Sia ph il giocatore con il maggior costo in s0
§ Sia t ≥ 0 la prima volta in cui,durante l’intervallo, al giocatore ph è data
la possibilità di muoversi
Avremo due casi:
• Caso(i): al tempo t , ph ha un ε-mossa a disposizione
• Caso(ii): al tempo t , ph non ha un ε-mossa a disposizione
34
35. Le dinamiche senza “restrizioni”
Caso(i)
dal Lemma 4.2, abbiamo la garanzia che
( ) ( ) ( ) ( )( )0 0
φ φ− ≥ −t t
h hs s ε c s c s
il miglioramento della
funzione potenziale
la variazione del costo per ph,
anche quando il giocatore non fa
nessuna mossa per molti steps
Dopo l’ ε-mossa di ph , 𝜙 sarà migliorata di almeno
( ) ( )0 0
φ≥h
ε
εc s s
n
ε-Media del
potenziale iniziale
Il teorema è soddisfatto
( 1)
( )
(1 )
⎡ ⎤+
⎢ ⎥−⎢ ⎥
n α
log nC T
ε ε
Convergenza
in al più
35
36. Le dinamiche senza “restrizioni”
Caso(ii)
Non avendo un ε-mossa a disposizione non vogliamo che ph possa fare
un ε-mossa adottando semplicemente la strategia di un altro giocatore,
pi
• Al momento t, dobbiamo avere
hi pp ≠∀
)(⋅ t
iα c s ( ) ( )−t t
h hεc s c s
≥
Costo di ph
per simulare
la mossa di pi
Utilità di ph
per simulare
la mossa di pi
( ) ( )( )
( )
( )
( )1
1
(3)
t
it t t
i h h
c s
c s c s c s
α
α ε
ε
⋅
⋅ ≥ − ⇒ ≥
−
36
37. Le dinamiche senza “restrizioni”
(1° caso)
Consideriamo un giocatore pi, a cui è data la possibilità di fare la sua
mossa al tempo t’ > t ossia, dopo che a ph è stata data la possibilità di
muoversi
(2° caso)
Consideriamo l’ultimo giocatore, pi ,a cui è data la possibilità di fare la
sua mossa al tempo t’ < t
Analizzeremo due casi:
37
39. Le dinamiche senza “restrizioni”
(2° caso)
Sia pi , l’ultimo giocatore che fa la sua mossa al tempo t’ < t,
Nell’istante t’
( )
( ) ( ) (4)
(3)dalla proprietà
possiamo affermare che
( )
1
1
≤
−
≤
−
'
t t
h i
t t
h i
α
c s c s
ε
α
c s c s
ε
Infatti da (3) la condizione
deve essere soddisfatta da pi
anche al tempo t (e anche
subito dopo)
Dato che fare la mossa può
solo ridurre il suo costo,
soddisfa la condizione anche al
tempo t’
39
40. — Allora la variazione di potenziale
Le dinamiche senza “restrizioni”
( ) ( ) ( ) ( ) ( )( ){ }
( ) ( ) ( )
0 0
0
( ,
1
( ,
φ φ− ≥ −
−⎧ ⎫
≥ −⎨ ⎬
⎩ ⎭
't t
i h h
t t
h h h
t
s s max ε c s ε c s c s
ε
ε max c s c s c s
α
( ) ( ()
1
3)≤
−
t t
h i
α
c s c s
ε
Deriva
dalla condizione
massimo miglioramento
ottenuto da pi per la sua mossa
Deriva dal LEMMA 4.2
( ) ( ) ( ) ( )( )0 0
φ φ− ≥ −t t
h hs s ε c s c s
40
41. ( ) ( ) ( ) ( ) ( )( ){ }
( ) ( ) ( )
0 0
0
( ,
1
,
φ φ− ≥ −
−⎧ ⎫
≥ −⎨ ⎬
⎩ ⎭
't t
i h h
t t
h h h
t
s s max ε c s ε c s c s
ε
ε max c s c s c s
α
( ) ( ) ( )
( )0
00 (1 ) (1 )
1 1
allora
φ
φ φ
− −
+
≥ ≥
− +
− h
t
sε ε ε ε
c s
α ε α n
s s
Le dinamiche senza “restrizioni”
— Allora la variazione di potenziale
massimo miglioramento
ottenuto da pi per la sua mossa
è minima quando
( ) ( )0
1
=
+ −
t
h h
α
c s c s
α ε
È soddisfatta
Deriva dal LEMMA 4.2
( ) ( ) ( ) ( )( )0 0
φ φ− ≥ −t t
h hs s ε c s c s
41
42. Le dinamiche senza “restrizioni”
Risposta: Si
2) Domanda: quando non viene utilizzato nessun meccanismo di
coordinamento cosa succede? E’ possibile convergere polinomiale a
ε-equilibri di Nash?
3) Domanda: se generalizziamo il gioco permettendo a ciascun
giocatore di dichiarare il proprio ε (che in un certo qual modo indica la
“tolleranza” all’infelicità o, se vogliamo, la propensione a accontentarsi del
giocatore). E’ possibile convergere polinomiale a ε-equilibri di Nash?
Parliamo di Giocatori eterogenei
42
43. Giocatori eterogenei
Heterogeneouse players: è una generalizzazione delle impostazione
precedenti dove ciascun giocatore pi ha un proprio valore ε, che
chiameremo εi che specifica la sua “tolleranza” all’infelicità
Per ogni
giocatore
Per ogni
strategia
Il giocatore pi non ha più di un
εi-incentivo a cambiare
strategia
ε-equilibrio di Nash: per , uno stato
è un ε- equilibrio di Nash se
( ) [0,1)= ∈ n
iε ε
1 1( , , )= … ∈ × ×Ln ns s s S S
1 1, ( , , , , ) (1 ) ( , , , , )i∀ … … ≥ − … …'
i i i n i i np c s s s ε c s s s ∀ ∈'
i is S
43
45. Giocatori eterogenei
— Vedremo che
— questa dinamica converge in passi
( log( ))
(1 )−min max
nα
O nC
ε ε
=min i iε min ε e =max i iε max ε
— il numero di passi di tempo in cui un giocatore con tolleranza εi
"sarà" infelice "(cioè, avrà un ε-move disponibile) è essenzialmente
log( )
⎛ ⎞
⎜ ⎟
⎝ ⎠min
nα
nC
ε
O
a prescindere dagli
εj-valori degli altri
giocatori.
45
46. i max ip ε ε∀ ≥
Giocatori eterogenei
Teorema 5.2 Sia εmax < 1 il valore massimo di εi , tra tutti i giocatori pi .
Allora, , ci sono al massimo “volte” in cui
qualche giocatore pj con εj ≥ ε sarà in grado di muoversi prima che l’ ε-
Nash dynamics converga
0∀ >ε
log( )
(1 )
⎡ ⎤
⎢ ⎥
−⎢ ⎥max
nα
nC
ε ε
Dimostrazione Teorema 5.2
Sia s =(s1,…,sn), uno stato in cui un giocatore pj con εj ≥ ε ha una εj -
move disponibile. Ai fini della prova è sufficiente dimostrare che la
riduzione della funzione potenziale 𝜙 è almeno è almeno
( )1
( )φ
−j maxε ε
s
αn
46
48. max
( 1)
( )
(1 )j
⎡ ⎤+
⎢ ⎥
−⎢ ⎥⎢ ⎥
n α
log nC T
ε ε
Giocatori eterogenei
Se il ph= pi allora abbiamo già finito, dal momento che ad ogni
passo il potenziale si riduce di almeno
( ) ( )
( ) ( )
φ φ
ε ε≥ ⇒ ≥h h
s s
c s c s
n n
Caso(i)
Il teorema è soddisfatto
Convergenza
in al più n.
passi pari a
48
50. Sappiamo che
•
•
Combinando le due disequazioni, abbiamo
Giocatori eterogenei
( ) ( ) ( )− <h i h hc s αc s ε c s
( ) ( )
( )11
( ) ( )
j
j
ε
ε
−−
> ⇒ >
hh
i h i h
εε
c s c s c s c s
α α
( ) (1 ) ( ) ( ) ( )< − ⇒ <h j i h ic s'' α ε c s c s'' αc s
• Caso(1): la mossa da s a s’’ non deve essere una εh-move per ph
( ) ( )( ) ( ) ( ) ( )− ≤ ⇒ ≥ −h h h h h h h hc s c s'' ε c s c s'' c s ε c s
( ) ( ) ( ) ( )− ≤ <h h h h ic s ε c s c s'' αc s
50
(Dal teorema 3.1)
Allora
( ) ( )
( )la variazione di potenziale
1
( ) ( )jεφ φ φ>
−
− > i
j h
c s
ε ε
s s' s
αn
Il teorema è
soddisfatto
51. 51
Allora
( )la variazione di potenziale ( ) ( )j
s
n
ε
φ φ φ
α
− ≥s s'
□
Giocatori eterogenei
( ) ( )α<h ic s c s
Dato che
• Caso(2): il guadagno relativo per ph non è più grande del guadagno
relativo che ottiene consentendo a pi di effettuare la sua
mossa ,ossia,
( ) ( )<h ic s'' αc s'
( ) ( )( ) ( )
( ) ( )
− −
≤h h i i
h i
c s c s'' c s c s'
c s c s
Siccome
stato abbiamo allora
1
( ) ( ) ( )( )
n
i
s φ φ∀ ≤ ≥∑ iis c s sc s
αn
hR iR