1. Sommario
Introduzione
Analisi descrittive
Modello logit ordinale
Conclusioni
Il basket non `e solo matematica
Applicazione di un modello logit ordinale alle squadre di NBA
Barbara Amendola Marco D’Alessandro Imma Fantasia
Antonio Napolitano Ida Riccio
Universit`a degli Studi di Napoli Federico II
13 dicembre 2017
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio Il basket non `e solo matematica
2. Sommario
Introduzione
Analisi descrittive
Modello logit ordinale
Conclusioni
1 Introduzione
2 Analisi descrittive
3 Modello logit ordinale
4 Conclusioni
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio Il basket non `e solo matematica
3. Sommario
Introduzione
Analisi descrittive
Modello logit ordinale
Conclusioni
Player Efficiency Rating
Il Player Efficiency Rating (PER) `e un dato statistico ideato dal
giornalista sportivo americano John Hollinger, curatore della
rubrica ESPN Insider.
Hollinger ha stabilito un valore medio della Lega, invariabile e fisso
di anno in anno, pari a 15.00 per ogni stagione.
La formula di questo indicatore `e:
PER = uPER ·
lgPACE
tmPACE
·
15
lguPER
(1)
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio Il basket non `e solo matematica
4. Sommario
Introduzione
Analisi descrittive
Modello logit ordinale
Conclusioni
La scala di misurazione
All-time great season: 35.0+
Runaway MVP candidate: 30.0-35.0
Strong MVP candidate: 27.5-30.0
Weak MVP candidate: 25.0-27.5
Definite All-Star: 22.5-25.0
Borderline All-Star: 20.0-22.5
Second offensive option: 18.0-20.0
Third offensive option: 16.5-18.0
Slightly above-average player: 15.0-16.5
Rotation player: 13.0-15.0
Non-rotation player: 11.0-13.0
Fringe roster player: 9.0-11.0
Player who won’t stick: 0-9.0
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio Il basket non `e solo matematica
5. Sommario
Introduzione
Analisi descrittive
Modello logit ordinale
Conclusioni
Struttura dei dati
’data.frame’: 150 obs. of 12 variables:
Age : int 35 40 32 37 31 29 27 27 37 ...
Esperienza: int 16 15 12 17 11 9 7 6 14 10 ...
Partite : int 1143 1011 796 1121 774 577 ...
Rimbalzi : num 2.8 3.6 8.3 9.4 5.9 4.4 3.4 ...
Assists : num 5.8 3.8 1.9 3.2 2.3 6.8 2.3 ...
FTP : num 75.3 82.6 80.3 75.4 79.6 90.2 ...
EFGP : num 51 52 49 51.4 48.7 57.5 54.5 ...
Blocks : num 0.1 0.3 1 1.6 0.8 0.2 0.6 1.1 ...
Steals : num 0.9 1.3 0.8 0.5 1.3 1.8 0.9 1.4 ...
Fouls : num 1.7 2.1 2.5 2.2 2.5 2.5 2.2 2.8 ...
Ruolo : Factor w/ 5 levels "C","PF","PG","SG","SF"
Rating : Ord.factor w/ 5 levels "1"<"2"<"3"<"4"<"5"
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio Il basket non `e solo matematica
6. Sommario
Introduzione
Analisi descrittive
Modello logit ordinale
Conclusioni
La variabile di risposta: Rating
Figura: Rating
1= Prestazione mediocre
2= Prestazione discreta
3= Prestazione sufficiente
4= Prestazione buona
5= Prestazione eccellente
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio Il basket non `e solo matematica
9. Sommario
Introduzione
Analisi descrittive
Modello logit ordinale
Conclusioni
La variabile categorica: Ruolo
Figura: Ruoli
PG= Point Guard
SG= Shooting Guard
PF= Power Forward
C= Center
SF=Small Forward
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio Il basket non `e solo matematica
13. Sommario
Introduzione
Analisi descrittive
Modello logit ordinale
Conclusioni
Il modello: i parametri
Call:
polr(formula= rating ~ ruolo + steals + esperienza + efgp +
rimbalzi, data = basket, Hess = T)
Coefficients:
Value Std. Error t value
ruoloC -2.2982 1.00607 -2.284
ruoloPF -1.6538 0.81706 -2.024
ruoloSF -2.5098 0.71605 -3.505
ruoloSG -1.5884 0.62296 -2.550
steals 2.7595 0.68729 4.015
esperienza 0.1460 0.04723 3.091
efgp 0.2574 0.05673 4.537
rimbalzi 0.6956 0.13740 5.063
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio Il basket non `e solo matematica
14. Sommario
Introduzione
Analisi descrittive
Modello logit ordinale
Conclusioni
Il modello: l’intercetta
I thresholds α, invece, sono i seguenti:
Intercepts:
Value Std. Error t value
1|2 12.4170 2.8311 4.3859
2|3 17.4216 3.0532 5.7060
3|4 21.7294 3.2491 6.6879
4|5 25.1451 3.5459 7.0913
Essi corrispondono ai ”punti di taglio” effettuati sulla variabile latente, ed
all’intercetta del nostro modello.
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio Il basket non `e solo matematica
15. Sommario
Introduzione
Analisi descrittive
Modello logit ordinale
Conclusioni
Interpretazione dei parametri
Gli Odds Ratio associati al modello sono:
exp(β1)
= exp(−2.2982)
= 0.10044172 (2)
exp(β2)
= exp(−1.6538)
= 0.19133080 (3)
exp(β3)
= exp(−2.5098)
= 0.08128387 (4)
exp(β4)
= exp(−1.5884)
= 0.20425575 (5)
exp(β5)
= exp(2.7595)
= 15.791370 (6)
exp(β6)
= exp(0.1460)
= 1.157186 (7)
exp(β7)
= exp(0.2574)
= 1.293513 (8)
exp(β8)
= exp(0.6956)
= 2.004979 (9)
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio Il basket non `e solo matematica
16. Sommario
Introduzione
Analisi descrittive
Modello logit ordinale
Conclusioni
Pseudo-R2
Gli Pseudo-R2
sono validi anche quando la variabile di risposta (sia
essa ordinata o non) presenta pi`u di 2 modalit`a.
Le conclusioni sono le stesse gi`a viste per il modello probit binario.
Lo Pseudo-R2
di McFadden `e pari a:
McFadden
0.3963059
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio Il basket non `e solo matematica
19. Sommario
Introduzione
Analisi descrittive
Modello logit ordinale
Conclusioni
Tavola di previsione-realizzazione
La percentuale di previsione corretta del nostro modello `e del 65%.
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio Il basket non `e solo matematica
20. Sommario
Introduzione
Analisi descrittive
Modello logit ordinale
Conclusioni
Bibliografia
Alan Agresti. Categorical Data Analysis. Gainesville, Wiley-
Interscience, 2013
Alan Agresti. Analysis of Ordinal Categorical Data. Gainesville, Wiley
Edition, 2010
Philip Hans Franses, Richard Paap. Quantitative models in
marketing research. Cambridge, Cambridge University Press, 2004
Annette J. Dobson, Adrian G. Barnett. An Introduction to
generalized linear models. Herston, CRC Press, 2008
Appunti dalle lezioni del corso.
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio Il basket non `e solo matematica