Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Modello logistico
1. Sommario
Introduzione
Le variabili
Costruzione del modello
4 motivi per vincere
Applicazione di un modello logit alle elezioni americane
Barbara Amendola Marco D’Alessandro Imma Fantasia
Antonio Napolitano Ida Riccio
Universit`a degli Studi di Napoli Federico II
8 novembre 2017
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio 4 motivi per vincere
4. Sommario
Introduzione
Le variabili
Costruzione del modello
Introduzione
Clinton VS Trump
Figura: I due principali candidati alle presidenziali
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio 4 motivi per vincere
5. Sommario
Introduzione
Le variabili
Costruzione del modello
Introduzione
Aspetti salienti del Sistema Elettorale Americano
Il sistema secondo il quale vengono eletti il Presidente degli
Stati Uniti e il suo Vicepresidente, che appartengono alla
medesima lista, `e un sistema elettorale indiretto.
Essi, infatti, non vengono eletti direttamente dai singoli
cittadini ma da 538 Grandi Elettori (numero fisso dal 1964).
Questi Grandi Elettori vengono eletti su base statale ed il
loro numero varia Stato per Stato. Infatti, in ciascuno di essi
il numero di Grandi Elettori `e dato dalla somma di 2 senatori
e di un numero di deputati proporzionale al numero di abitanti
residenti in ciascuno Stato.
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio 4 motivi per vincere
6. Sommario
Introduzione
Le variabili
Costruzione del modello
Introduzione
Aspetti salienti del Sistema Elettorale Americano
I cittadini dello Stato in questione esprimono la loro preferenza
per un candidato, ma quello che viene eletto non `e il singolo
individuo, bens`ı il gruppo di Grandi Elettori ad esso associati.
Per i voti dei cittadini non viene fatto un conteggio generale, bens`ı
un conteggio singolo, cio`e Stato per Stato, regolato dal sistema del
“winner takes all”, ossia una maggioranza secca. Se anche solo
di un voto in pi`u rispetto ai propri avversari, il candidato in
questione comunque `e ritenuto il vincitore e a lui vengono
assegnati tutti i grandi elettori di quello stato. Il candidato che
ottiene il voto di almeno 270 Grandi Elettori `e il vincitore e
nuovo Presidente degli Stati Uniti d’America.
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio 4 motivi per vincere
7. Sommario
Introduzione
Le variabili
Costruzione del modello
Analisi esplorativa delle variabili
La variabile dipendente: Voto
Due modalit`a di risposta:
0 se nello Stato preso in esame H.Clinton ha ottenuto la
maggioranza dei voti;
1 se nello Stato preso in esame D.Trump ha ottenuto la
maggioranza dei voti.
Osservazione: La variabile di risposta `e di natura dicotomica,
quindi ci`o che stimeremo `e un modello per dati binari, nello
specifico si tratter`a di un modello di regressione logistica.
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio 4 motivi per vincere
8. Sommario
Introduzione
Le variabili
Costruzione del modello
La variabile di risposta: Voto
Probabilit`a
Ci`o che andremo a studiare `e la probabilit`a che la variabile di
risposta Y assuma valore 1 (cio`e la probabilit`a di successo
dell’evento) condizionatamente al valore assunto dalle variabili
esplicative (X1, X2, ...Xp):
P(Y = 1|X = x) = π(x) =
exp(β0 + β1x1 + ... + βpxp)
1 + exp(β0 + β1x1 + ... + βpxp)
(1)
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio 4 motivi per vincere
9. Sommario
Introduzione
Le variabili
Costruzione del modello
Analisi esplorativa delle variabili
Variabili esplicative
Variabili quantitative:
1 Densit`a di popolazione;
2 Grandi Elettori;
3 Immigrati;
4 Index Crime;
5 PIL
Variabili qualitative:
1 Spesa;
2 Russian hackers;
3 Swing States
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio 4 motivi per vincere
11. Sommario
Introduzione
Le variabili
Costruzione del modello
Le Variabili
Summary dei dati
Figura: Informazioni riassuntive delle variabili
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio 4 motivi per vincere
12. Sommario
Introduzione
Le variabili
Costruzione del modello
Rappresentazione grafica delle variabili dicotomiche
Variabile di risposta: Voto
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio 4 motivi per vincere
13. Sommario
Introduzione
Le variabili
Costruzione del modello
Rappresentazione grafica delle variabili dicotomiche
Stati pro-Clinton VS Stati pro-Trump
Figura: Numero di Grandi Elettori per Stato
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio 4 motivi per vincere
14. Sommario
Introduzione
Le variabili
Costruzione del modello
Rappresentazione grafica delle variabili dicotomiche
Variabile esplicativa: Swing States
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio 4 motivi per vincere
15. Sommario
Introduzione
Le variabili
Costruzione del modello
Rappresentazione grafica delle variabili dicotomiche
Variabile esplicativa: Spesa
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio 4 motivi per vincere
16. Sommario
Introduzione
Le variabili
Costruzione del modello
Rappresentazioni grafiche delle variabili dicotomiche
Variabile esplicativa: Russian hackers
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio 4 motivi per vincere
17. Sommario
Introduzione
Le variabili
Costruzione del modello
Distribuzioni delle variabili continue
Variabile esplicativa: PIL
tapply(trump$PIL, trump$Voto, mean)
0 1
454172.5 308194.9
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio 4 motivi per vincere
18. Sommario
Introduzione
Le variabili
Costruzione del modello
Distribuzioni delle variabili continue
Variabile esplicativa: Crime Index
tapply(trump$Crime, trump$Voto, mean)
0 1
34.80000 38.56667
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio 4 motivi per vincere
19. Sommario
Introduzione
Le variabili
Costruzione del modello
Distribuzioni delle variabili continue
Variabile esplicativa: Immigrati
tapply(trump$Immigrati, trump$Voto, mean)
0 1
326450.0 169566.7
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio 4 motivi per vincere
20. Sommario
Introduzione
Le variabili
Costruzione del modello
Distribuzioni delle variabili continue
Variabile esplicativa: Grandi Elettori
tapply(trump$G.E., trump$Voto, mean)
0 1
11.40000 10.06667
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio 4 motivi per vincere
21. Sommario
Introduzione
Le variabili
Costruzione del modello
Distribuzioni delle variabili continue
Variabile esplicativa: Densit`a
tapply(trump$Dens, trump$Voto, mean)
0 1
109.25000 36.46667
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio 4 motivi per vincere
22. Sommario
Introduzione
Le variabili
Costruzione del modello
Il modello di partenza
Modello 1
Figura: Modello con tutte le variabili
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio 4 motivi per vincere
24. Sommario
Introduzione
Le variabili
Costruzione del modello
Interpretazione dei coefficienti
Odds ratios
exp(β0)
= exp(−4.400)
= 0.01227 (2)
exp(β1)
= exp(−0.05722)
= 0.94438 (3)
exp(β2)
= exp(7.393)
= 1624.83 (4)
exp(β3)
= exp(2.520)
= 12.424 (5)
exp(β4)
= exp(−0.0000544)
= 0.999945 (6)
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio 4 motivi per vincere
25. Sommario
Introduzione
Le variabili
Costruzione del modello
Sugli odds ratios
Intervalli di confidenza
OR 2.5 % 97.5 %
(Intercept) 1.227201e-02 0.0001008066 3.615996e-01
Dens 9.443846e-01 0.8889386905 9.811937e-01
Spesa1 1.624838e+03 7.0559283321 8.443105e+06
G.E. 1.242473e+01 2.7173190349 1.317088e+02
PIL 9.999456e-01 0.9998924065 9.999792e-01
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio 4 motivi per vincere
26. Sommario
Introduzione
Le variabili
Costruzione del modello
Profilo 1
Al variare della densit`a
Figura: Al variare della variabile Densit`a
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio 4 motivi per vincere
27. Sommario
Introduzione
Le variabili
Costruzione del modello
Profilo 2
Al variare del numero di Grandi Elettori
Figura: Al variare della variabile Grandi Elettori
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio 4 motivi per vincere
28. Sommario
Introduzione
Le variabili
Costruzione del modello
Profilo 3
Al variare della ricchezza negli Stati
Figura: Al variare della variabile PIL
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio 4 motivi per vincere
29. Sommario
Introduzione
Le variabili
Costruzione del modello
Analisi dei residui
Residui di devianza standardizzati
Figura: Residui di devianza
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio 4 motivi per vincere