SlideShare a Scribd company logo
1 of 20
Download to read offline
Sommario
Introduzione
Analisi descrittive
Modello logit ordinale
Conclusioni
Il basket non `e solo matematica
Applicazione di un modello logit ordinale alle squadre di NBA
Barbara Amendola Marco D’Alessandro Imma Fantasia
Antonio Napolitano Ida Riccio
Universit`a degli Studi di Napoli Federico II
13 dicembre 2017
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio Il basket non `e solo matematica
Sommario
Introduzione
Analisi descrittive
Modello logit ordinale
Conclusioni
1 Introduzione
2 Analisi descrittive
3 Modello logit ordinale
4 Conclusioni
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio Il basket non `e solo matematica
Sommario
Introduzione
Analisi descrittive
Modello logit ordinale
Conclusioni
Player Efficiency Rating
Il Player Efficiency Rating (PER) `e un dato statistico ideato dal
giornalista sportivo americano John Hollinger, curatore della
rubrica ESPN Insider.
Hollinger ha stabilito un valore medio della Lega, invariabile e fisso
di anno in anno, pari a 15.00 per ogni stagione.
La formula di questo indicatore `e:
PER = uPER ·
lgPACE
tmPACE
·
15
lguPER
(1)
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio Il basket non `e solo matematica
Sommario
Introduzione
Analisi descrittive
Modello logit ordinale
Conclusioni
La scala di misurazione
All-time great season: 35.0+
Runaway MVP candidate: 30.0-35.0
Strong MVP candidate: 27.5-30.0
Weak MVP candidate: 25.0-27.5
Definite All-Star: 22.5-25.0
Borderline All-Star: 20.0-22.5
Second offensive option: 18.0-20.0
Third offensive option: 16.5-18.0
Slightly above-average player: 15.0-16.5
Rotation player: 13.0-15.0
Non-rotation player: 11.0-13.0
Fringe roster player: 9.0-11.0
Player who won’t stick: 0-9.0
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio Il basket non `e solo matematica
Sommario
Introduzione
Analisi descrittive
Modello logit ordinale
Conclusioni
Struttura dei dati
’data.frame’: 150 obs. of 12 variables:
Age : int 35 40 32 37 31 29 27 27 37 ...
Esperienza: int 16 15 12 17 11 9 7 6 14 10 ...
Partite : int 1143 1011 796 1121 774 577 ...
Rimbalzi : num 2.8 3.6 8.3 9.4 5.9 4.4 3.4 ...
Assists : num 5.8 3.8 1.9 3.2 2.3 6.8 2.3 ...
FTP : num 75.3 82.6 80.3 75.4 79.6 90.2 ...
EFGP : num 51 52 49 51.4 48.7 57.5 54.5 ...
Blocks : num 0.1 0.3 1 1.6 0.8 0.2 0.6 1.1 ...
Steals : num 0.9 1.3 0.8 0.5 1.3 1.8 0.9 1.4 ...
Fouls : num 1.7 2.1 2.5 2.2 2.5 2.5 2.2 2.8 ...
Ruolo : Factor w/ 5 levels "C","PF","PG","SG","SF"
Rating : Ord.factor w/ 5 levels "1"<"2"<"3"<"4"<"5"
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio Il basket non `e solo matematica
Sommario
Introduzione
Analisi descrittive
Modello logit ordinale
Conclusioni
La variabile di risposta: Rating
Figura: Rating
1= Prestazione mediocre
2= Prestazione discreta
3= Prestazione sufficiente
4= Prestazione buona
5= Prestazione eccellente
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio Il basket non `e solo matematica
Sommario
Introduzione
Analisi descrittive
Modello logit ordinale
Conclusioni
Le variabili quantitative discrete
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio Il basket non `e solo matematica
Sommario
Introduzione
Analisi descrittive
Modello logit ordinale
Conclusioni
Le variabili quantitative continue
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio Il basket non `e solo matematica
Sommario
Introduzione
Analisi descrittive
Modello logit ordinale
Conclusioni
La variabile categorica: Ruolo
Figura: Ruoli
PG= Point Guard
SG= Shooting Guard
PF= Power Forward
C= Center
SF=Small Forward
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio Il basket non `e solo matematica
Sommario
Introduzione
Analisi descrittive
Modello logit ordinale
Conclusioni
Distribuzione del Rating in base al Ruolo
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio Il basket non `e solo matematica
Sommario
Introduzione
Analisi descrittive
Modello logit ordinale
Conclusioni
Confronti in media per Ruolo
PG C PF SF SG
Age 27.70 29.16 28.03 26.83 28.13
Esperienza 6.766 8.366 7.266 5.866 7.133
Partite 468.8 560.8 505.5 384.5 477.7
Rimbalzi 3.603 7.653 5.993 4.196 3.236
EFGP 48.11 54.12 51.66 50.05 49.96
Blocks 0.286 1.173 0.693 0.400 0.316
Fouls 2.030 2.596 2.323 2.046 1.946
Points 13.71 11.43 12.32 11.51 12.57
Assists 5.426 1.560 1.753 1.850 2.533
Steals 1.233 0.703 0.793 0.816 0.963
FTP 79.66 67.44 76.05 76.72 80.15
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio Il basket non `e solo matematica
Sommario
Introduzione
Analisi descrittive
Modello logit ordinale
Conclusioni
Confronti in media per Rating
1 2 3 4 5
Age 21.60 27.67 28.13 29.57 29.50
Rimbalzi 2.720 3.535 5.200 7.984 7.250
Fouls 1.820 1.952 2.288 2.584 2.175
Esperienza 1.200 5.905 7.579 9.368 10.50
Partite 87.0 386.7 515.6 653.4 748.2
Assists 1.280 1.790 2.826 3.936 5.650
FTP 68.80 77.65 75.06 75.63 81.15
EFGP 43.22 49.91 51.50 52.13 52.87
Blocks 0.180 0.315 0.685 0.889 1.075
Steals 0.580 0.745 0.930 1.173 1.600
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio Il basket non `e solo matematica
Sommario
Introduzione
Analisi descrittive
Modello logit ordinale
Conclusioni
Il modello: i parametri
Call:
polr(formula= rating ~ ruolo + steals + esperienza + efgp +
rimbalzi, data = basket, Hess = T)
Coefficients:
Value Std. Error t value
ruoloC -2.2982 1.00607 -2.284
ruoloPF -1.6538 0.81706 -2.024
ruoloSF -2.5098 0.71605 -3.505
ruoloSG -1.5884 0.62296 -2.550
steals 2.7595 0.68729 4.015
esperienza 0.1460 0.04723 3.091
efgp 0.2574 0.05673 4.537
rimbalzi 0.6956 0.13740 5.063
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio Il basket non `e solo matematica
Sommario
Introduzione
Analisi descrittive
Modello logit ordinale
Conclusioni
Il modello: l’intercetta
I thresholds α, invece, sono i seguenti:
Intercepts:
Value Std. Error t value
1|2 12.4170 2.8311 4.3859
2|3 17.4216 3.0532 5.7060
3|4 21.7294 3.2491 6.6879
4|5 25.1451 3.5459 7.0913
Essi corrispondono ai ”punti di taglio” effettuati sulla variabile latente, ed
all’intercetta del nostro modello.
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio Il basket non `e solo matematica
Sommario
Introduzione
Analisi descrittive
Modello logit ordinale
Conclusioni
Interpretazione dei parametri
Gli Odds Ratio associati al modello sono:
exp(β1)
= exp(−2.2982)
= 0.10044172 (2)
exp(β2)
= exp(−1.6538)
= 0.19133080 (3)
exp(β3)
= exp(−2.5098)
= 0.08128387 (4)
exp(β4)
= exp(−1.5884)
= 0.20425575 (5)
exp(β5)
= exp(2.7595)
= 15.791370 (6)
exp(β6)
= exp(0.1460)
= 1.157186 (7)
exp(β7)
= exp(0.2574)
= 1.293513 (8)
exp(β8)
= exp(0.6956)
= 2.004979 (9)
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio Il basket non `e solo matematica
Sommario
Introduzione
Analisi descrittive
Modello logit ordinale
Conclusioni
Pseudo-R2
Gli Pseudo-R2
sono validi anche quando la variabile di risposta (sia
essa ordinata o non) presenta pi`u di 2 modalit`a.
Le conclusioni sono le stesse gi`a viste per il modello probit binario.
Lo Pseudo-R2
di McFadden `e pari a:
McFadden
0.3963059
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio Il basket non `e solo matematica
Sommario
Introduzione
Analisi descrittive
Modello logit ordinale
Conclusioni
Profilo di risposta 1
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio Il basket non `e solo matematica
Sommario
Introduzione
Analisi descrittive
Modello logit ordinale
Conclusioni
Profilo di risposta 2
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio Il basket non `e solo matematica
Sommario
Introduzione
Analisi descrittive
Modello logit ordinale
Conclusioni
Tavola di previsione-realizzazione
La percentuale di previsione corretta del nostro modello `e del 65%.
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio Il basket non `e solo matematica
Sommario
Introduzione
Analisi descrittive
Modello logit ordinale
Conclusioni
Bibliografia
Alan Agresti. Categorical Data Analysis. Gainesville, Wiley-
Interscience, 2013
Alan Agresti. Analysis of Ordinal Categorical Data. Gainesville, Wiley
Edition, 2010
Philip Hans Franses, Richard Paap. Quantitative models in
marketing research. Cambridge, Cambridge University Press, 2004
Annette J. Dobson, Adrian G. Barnett. An Introduction to
generalized linear models. Herston, CRC Press, 2008
Appunti dalle lezioni del corso.
Amendola - D’Alessandro - Fantasia - Napolitano - Riccio Il basket non `e solo matematica

Il basket non è solo matematica

  • 1. Sommario Introduzione Analisi descrittive Modello logit ordinale Conclusioni Il basket non `e solo matematica Applicazione di un modello logit ordinale alle squadre di NBA Barbara Amendola Marco D’Alessandro Imma Fantasia Antonio Napolitano Ida Riccio Universit`a degli Studi di Napoli Federico II 13 dicembre 2017 Amendola - D’Alessandro - Fantasia - Napolitano - Riccio Il basket non `e solo matematica
  • 2. Sommario Introduzione Analisi descrittive Modello logit ordinale Conclusioni 1 Introduzione 2 Analisi descrittive 3 Modello logit ordinale 4 Conclusioni Amendola - D’Alessandro - Fantasia - Napolitano - Riccio Il basket non `e solo matematica
  • 3. Sommario Introduzione Analisi descrittive Modello logit ordinale Conclusioni Player Efficiency Rating Il Player Efficiency Rating (PER) `e un dato statistico ideato dal giornalista sportivo americano John Hollinger, curatore della rubrica ESPN Insider. Hollinger ha stabilito un valore medio della Lega, invariabile e fisso di anno in anno, pari a 15.00 per ogni stagione. La formula di questo indicatore `e: PER = uPER · lgPACE tmPACE · 15 lguPER (1) Amendola - D’Alessandro - Fantasia - Napolitano - Riccio Il basket non `e solo matematica
  • 4. Sommario Introduzione Analisi descrittive Modello logit ordinale Conclusioni La scala di misurazione All-time great season: 35.0+ Runaway MVP candidate: 30.0-35.0 Strong MVP candidate: 27.5-30.0 Weak MVP candidate: 25.0-27.5 Definite All-Star: 22.5-25.0 Borderline All-Star: 20.0-22.5 Second offensive option: 18.0-20.0 Third offensive option: 16.5-18.0 Slightly above-average player: 15.0-16.5 Rotation player: 13.0-15.0 Non-rotation player: 11.0-13.0 Fringe roster player: 9.0-11.0 Player who won’t stick: 0-9.0 Amendola - D’Alessandro - Fantasia - Napolitano - Riccio Il basket non `e solo matematica
  • 5. Sommario Introduzione Analisi descrittive Modello logit ordinale Conclusioni Struttura dei dati ’data.frame’: 150 obs. of 12 variables: Age : int 35 40 32 37 31 29 27 27 37 ... Esperienza: int 16 15 12 17 11 9 7 6 14 10 ... Partite : int 1143 1011 796 1121 774 577 ... Rimbalzi : num 2.8 3.6 8.3 9.4 5.9 4.4 3.4 ... Assists : num 5.8 3.8 1.9 3.2 2.3 6.8 2.3 ... FTP : num 75.3 82.6 80.3 75.4 79.6 90.2 ... EFGP : num 51 52 49 51.4 48.7 57.5 54.5 ... Blocks : num 0.1 0.3 1 1.6 0.8 0.2 0.6 1.1 ... Steals : num 0.9 1.3 0.8 0.5 1.3 1.8 0.9 1.4 ... Fouls : num 1.7 2.1 2.5 2.2 2.5 2.5 2.2 2.8 ... Ruolo : Factor w/ 5 levels "C","PF","PG","SG","SF" Rating : Ord.factor w/ 5 levels "1"<"2"<"3"<"4"<"5" Amendola - D’Alessandro - Fantasia - Napolitano - Riccio Il basket non `e solo matematica
  • 6. Sommario Introduzione Analisi descrittive Modello logit ordinale Conclusioni La variabile di risposta: Rating Figura: Rating 1= Prestazione mediocre 2= Prestazione discreta 3= Prestazione sufficiente 4= Prestazione buona 5= Prestazione eccellente Amendola - D’Alessandro - Fantasia - Napolitano - Riccio Il basket non `e solo matematica
  • 7. Sommario Introduzione Analisi descrittive Modello logit ordinale Conclusioni Le variabili quantitative discrete Amendola - D’Alessandro - Fantasia - Napolitano - Riccio Il basket non `e solo matematica
  • 8. Sommario Introduzione Analisi descrittive Modello logit ordinale Conclusioni Le variabili quantitative continue Amendola - D’Alessandro - Fantasia - Napolitano - Riccio Il basket non `e solo matematica
  • 9. Sommario Introduzione Analisi descrittive Modello logit ordinale Conclusioni La variabile categorica: Ruolo Figura: Ruoli PG= Point Guard SG= Shooting Guard PF= Power Forward C= Center SF=Small Forward Amendola - D’Alessandro - Fantasia - Napolitano - Riccio Il basket non `e solo matematica
  • 10. Sommario Introduzione Analisi descrittive Modello logit ordinale Conclusioni Distribuzione del Rating in base al Ruolo Amendola - D’Alessandro - Fantasia - Napolitano - Riccio Il basket non `e solo matematica
  • 11. Sommario Introduzione Analisi descrittive Modello logit ordinale Conclusioni Confronti in media per Ruolo PG C PF SF SG Age 27.70 29.16 28.03 26.83 28.13 Esperienza 6.766 8.366 7.266 5.866 7.133 Partite 468.8 560.8 505.5 384.5 477.7 Rimbalzi 3.603 7.653 5.993 4.196 3.236 EFGP 48.11 54.12 51.66 50.05 49.96 Blocks 0.286 1.173 0.693 0.400 0.316 Fouls 2.030 2.596 2.323 2.046 1.946 Points 13.71 11.43 12.32 11.51 12.57 Assists 5.426 1.560 1.753 1.850 2.533 Steals 1.233 0.703 0.793 0.816 0.963 FTP 79.66 67.44 76.05 76.72 80.15 Amendola - D’Alessandro - Fantasia - Napolitano - Riccio Il basket non `e solo matematica
  • 12. Sommario Introduzione Analisi descrittive Modello logit ordinale Conclusioni Confronti in media per Rating 1 2 3 4 5 Age 21.60 27.67 28.13 29.57 29.50 Rimbalzi 2.720 3.535 5.200 7.984 7.250 Fouls 1.820 1.952 2.288 2.584 2.175 Esperienza 1.200 5.905 7.579 9.368 10.50 Partite 87.0 386.7 515.6 653.4 748.2 Assists 1.280 1.790 2.826 3.936 5.650 FTP 68.80 77.65 75.06 75.63 81.15 EFGP 43.22 49.91 51.50 52.13 52.87 Blocks 0.180 0.315 0.685 0.889 1.075 Steals 0.580 0.745 0.930 1.173 1.600 Amendola - D’Alessandro - Fantasia - Napolitano - Riccio Il basket non `e solo matematica
  • 13. Sommario Introduzione Analisi descrittive Modello logit ordinale Conclusioni Il modello: i parametri Call: polr(formula= rating ~ ruolo + steals + esperienza + efgp + rimbalzi, data = basket, Hess = T) Coefficients: Value Std. Error t value ruoloC -2.2982 1.00607 -2.284 ruoloPF -1.6538 0.81706 -2.024 ruoloSF -2.5098 0.71605 -3.505 ruoloSG -1.5884 0.62296 -2.550 steals 2.7595 0.68729 4.015 esperienza 0.1460 0.04723 3.091 efgp 0.2574 0.05673 4.537 rimbalzi 0.6956 0.13740 5.063 Amendola - D’Alessandro - Fantasia - Napolitano - Riccio Il basket non `e solo matematica
  • 14. Sommario Introduzione Analisi descrittive Modello logit ordinale Conclusioni Il modello: l’intercetta I thresholds α, invece, sono i seguenti: Intercepts: Value Std. Error t value 1|2 12.4170 2.8311 4.3859 2|3 17.4216 3.0532 5.7060 3|4 21.7294 3.2491 6.6879 4|5 25.1451 3.5459 7.0913 Essi corrispondono ai ”punti di taglio” effettuati sulla variabile latente, ed all’intercetta del nostro modello. Amendola - D’Alessandro - Fantasia - Napolitano - Riccio Il basket non `e solo matematica
  • 15. Sommario Introduzione Analisi descrittive Modello logit ordinale Conclusioni Interpretazione dei parametri Gli Odds Ratio associati al modello sono: exp(β1) = exp(−2.2982) = 0.10044172 (2) exp(β2) = exp(−1.6538) = 0.19133080 (3) exp(β3) = exp(−2.5098) = 0.08128387 (4) exp(β4) = exp(−1.5884) = 0.20425575 (5) exp(β5) = exp(2.7595) = 15.791370 (6) exp(β6) = exp(0.1460) = 1.157186 (7) exp(β7) = exp(0.2574) = 1.293513 (8) exp(β8) = exp(0.6956) = 2.004979 (9) Amendola - D’Alessandro - Fantasia - Napolitano - Riccio Il basket non `e solo matematica
  • 16. Sommario Introduzione Analisi descrittive Modello logit ordinale Conclusioni Pseudo-R2 Gli Pseudo-R2 sono validi anche quando la variabile di risposta (sia essa ordinata o non) presenta pi`u di 2 modalit`a. Le conclusioni sono le stesse gi`a viste per il modello probit binario. Lo Pseudo-R2 di McFadden `e pari a: McFadden 0.3963059 Amendola - D’Alessandro - Fantasia - Napolitano - Riccio Il basket non `e solo matematica
  • 17. Sommario Introduzione Analisi descrittive Modello logit ordinale Conclusioni Profilo di risposta 1 Amendola - D’Alessandro - Fantasia - Napolitano - Riccio Il basket non `e solo matematica
  • 18. Sommario Introduzione Analisi descrittive Modello logit ordinale Conclusioni Profilo di risposta 2 Amendola - D’Alessandro - Fantasia - Napolitano - Riccio Il basket non `e solo matematica
  • 19. Sommario Introduzione Analisi descrittive Modello logit ordinale Conclusioni Tavola di previsione-realizzazione La percentuale di previsione corretta del nostro modello `e del 65%. Amendola - D’Alessandro - Fantasia - Napolitano - Riccio Il basket non `e solo matematica
  • 20. Sommario Introduzione Analisi descrittive Modello logit ordinale Conclusioni Bibliografia Alan Agresti. Categorical Data Analysis. Gainesville, Wiley- Interscience, 2013 Alan Agresti. Analysis of Ordinal Categorical Data. Gainesville, Wiley Edition, 2010 Philip Hans Franses, Richard Paap. Quantitative models in marketing research. Cambridge, Cambridge University Press, 2004 Annette J. Dobson, Adrian G. Barnett. An Introduction to generalized linear models. Herston, CRC Press, 2008 Appunti dalle lezioni del corso. Amendola - D’Alessandro - Fantasia - Napolitano - Riccio Il basket non `e solo matematica