Your SlideShare is downloading. ×
Audience basket 2011
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×

Saving this for later?

Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime - even offline.

Text the download link to your phone

Standard text messaging rates apply

Audience basket 2011

400
views

Published on

Regressione Lineare, Previsione

Regressione Lineare, Previsione

Published in: Education

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
400
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
1
Comments
0
Likes
0
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. ANALISI DELL’AUDIENCE MEDIA DELLE DIRETTE DELLA SERIE A DI BASKET
    • La regressione lineare è una metodologia statistica che tenta di individuare una relazione tra una variabile Y ed una o più variabili X che si presume la determinano.
    • E' chiaro che non tutti i fenomeni possono essere spiegati con la regressione lineare senza errori "eccessivi". Per cui esistono una serie di indici che testano la "bontà" del modello stimato.
  • 2.
    • fascia oraria e giornata di programmazione (sabato sera, domenica ore 11.45/12.00, domenica 18.15, domenica 20.00/21.00);
    • numerosità dei tifosi delle squadre coinvolte nella partita (il dato è stato preso da SportFans);
    • posizione in classifica delle squadre prima di disputare il match (1°, 2°, 3°, …, ultima, etc.);
    Variabili analizzate (1 di 3) La variabile dipendente inserita nel nostro modello è l’Audience Media delle dirette del campionato di serie A trasmesse da Sky nelle ultime 4 RG (2007-08, 2008-09, 2009-10, 2010-11 fino alla 16° giornata inclusa). Per tentare di spiegare a cosa sono dovuti livelli elevati o ridotti dell’Audience Media sono state testate le seguenti variabili:
  • 3.
    • differenza punti in classifica fra le squadre prima di disputare il match;
    • appeal della gara (è un indicatore costruito per combinare assieme le variabili “posizioni in classifica” e “differenza punti”);
    • BIG (presenza di almeno una fra le prime cinque squadre come numero di tifosi: Milano, Treviso, Siena, Roma, Virtus Bologna);
    • presenza di ognuna delle squadre del campionato di serie A 2010-2011 (l’Armani Jeans Milano è stata considerata sia nella modalità “in casa” che nella modalità “in trasferta”);
    • contemporanea presenza di una partita della serie A di calcio che vedeva in campo almeno una fra Juventus, Inter o Milan (le squadre con il maggior numero di tifosi nel calcio);
    • equilibrio della gara inteso come scarto in termini di punti alla conclusione della gara stesso (es. risultato: 90 a 80, scarto 10 punti; abbiamo analizzato classi di scarto).
    Variabili analizzate (2 di 3)
  • 4.
    • Mese dell’anno in cui si sono disputati i match di Regular Season (da settembre a maggio)
    • “ Natale”: è stato considerato il periodo natalizio (dal 25/12 fino al 5/1) per valutare la non sovrapposizione del Campionato di Serie A di Basket con quello della Serie A di calcio
    • Derby: Milano-Cantù, Milano-Varese, Cantù-Varese, Fortitudo-Virtus, Pesaro-Montegranaro, Napoli-Avellino, Avellino-Caserta
    Variabili analizzate (3 di 3)
  • 5. Il modello di regressione è stato costruito sulla base di 328 partite (tutte le partite delle stagioni 2007-08, 2008-2009 e 2009-2010, più le prime 48 dirette della stagione 2010-2011). Il miglior modello per spiegare l’Audience è stato ottenuto includendo queste 17 variabili (sono ordinate in base all’importanza che il modello gli attribuisce nella spiegazione dell’Audience): Il modello VARIABILI COEFFICIENTI Milano 13949,9 "Natale" 13933,0 Derby 8644,9 Siena 7148,1 Roma 4915,8 Diff.pti -678,8 Treviso -3303,1 Teramo -4304,6 Montegranaro -4793,3 Pesaro -4810,1 Cantù -4934,5 Caserta -6446,9 Juve - Inter – Milan -7772,8 Brindisi -10760,7 Biella -11318,6 Avellino -11701,7 Cremona -12154,0 (Constant) 41464,0
  • 6. Interpretazione dei risultati (1 di 3)
    • Le variabili “numero di tifosi”, “BIG”, e quelle riferite alle singole squadre risultano evidentemente correlate, ovvero esprimono sostanzialmente il medesimo contenuto informativo. La correlazione fra i regressori causa problemi al modello in quanto peggiora la significatività e la precisione delle stime dei coefficienti rendendo più difficoltosa l’interpretazione dei risultati. Per ottimizzare il modello, evitando la ridondanza nel contenuto informativo dei dati, sono state incluse nel modello solamente le variabili relative alle squadre ed escluse le variabili “numero di tifosi” e “BIG”. Queste ultime due risultano anch’esse significative nello spiegare l’Audience Media, tuttavia l’informazione contenuta nelle variabili “Squadra” è risultata più completa ed il modello di regressione che le include il migliore.
    • Un discorso analogo vale per le variabili “Posizione in classifica”, “Differenza punti in classifica” ed “Appeal”. Fra queste tre la caratteristica che meglio aiuta a comprendere la dinamica dell’Audience è risultata essere la “Differenza Punti” che quindi è stata inserita nel modello a scapito delle altre due.
  • 7. Interpretazione dei risultati (2 di 3)
    • La variabile “ Scarto a fine gara ”, utilizzata per misurare l’equilibrio della gara, non è risultata significativa nello spiegare l’Audience Media delle dirette. Ciò è in parte spiegato dalla natura stessa della variabile Audience che rappresenta una misura di sintesi calcolata sull’intera durata della partita, pertanto vistosi cali dell’Audience nel finale di gara possono essere contro-bilanciati dall’ascolto registrato nei primi due quarti del match. In quest’ottica si nota come le misure ex-ante (posizione in classifica, differenza punti in classifica) siano decisamente più utili di questa misura ex-post al fine di ottenere una migliore comprensione dell’Audience.
    • Sulla base del modello ottenuto si può concludere inoltre che anche la fascia oraria e la giornata di programmazione non sono fattori determinanti per il fenomeno Audience Media.
    VARIABILI NON SIGNIFICATIVE
  • 8. Interpretazione dei risultati (3 di 3)
    • I valori dei coefficienti delle 17 variabili significative incluse nel modello rappresentano l’impatto di ciascuna variabile sull’Audience. Ad esempio il coefficiente dell’ AJ Milano , pari a 13.950, significa che la presenza di Milano nel match porta (in media) un contributo positivo di 13.950 spettatori.
    • La presenza in contemporanea di una partita di calcio di Juve, Inter o Milan causa invece un calo di circa 7.800 spettatori alla diretta del basket.
    • La squadra che in assoluto porta la diminuzione più elevata nel livello dell’Audience e la Vanoli-Braga Cremona , la cui presenza nella gara porta (in media) un contributo negativo di 12.150 spettatori.
    • Per ogni per ogni punto di differenza in classifica fra le due squadre che disputano il match si ha in media un calo di 679 spettatori (se ad esempio la differenza punti è uguale a 6 si ha un calo di 679x6 = 4.074 spettatori).
    VARIABILI SIGNIFICATIVE
  • 9. Indicatore R 2
    • Questo particolare indicatore fornisce una misura di quanto le variabili inserite nel modello (Milano, Siena, diff.pti, Juve-Inter-Milan, ecc.) spiegano l’Audience. Ovvero è un indicatore della bontà del modello stimato.
    • Nel nostro caso R 2 = 0.40 , ciò significa che il modello realizzato è in grado di spiegare il 40% dell’Audience Media (variabile dipendente). Il restante 60% è spiegato da variabili non incluse nel modello poiché non individuate o non direttamente osservabili.
  • 10. Confronto fra le squadre (dal 2007/08 alla 16°giornata della stagione 2010-11) Squadre Partite % Audience Media Diff. Rispetto all’Audience Media totale Dev.Std. Aud. Share medio Contatti netti medi Milano 44 22% 50.566 15.636 19.778 0,29% 211.135 Virtus 38 19% 34.738 -192 17.239 0,20% 181.462 Roma 37 18% 42.864 7.934 17.651 0,23% 196.426 Caserta 27 13% 28.138 -6.792 15.833 0,15% 166.620 Cantù 26 13% 34.193 -737 23.687 0,18% 177.872 Avellino 26 13% 25.317 -9.613 14.660 0,13% 150.947 Treviso 25 12% 29.462 -5.468 20.564 0,15% 164.738 Siena 24 12% 40.825 5.895 17.040 0,23% 196.887 Pesaro 22 11% 30.993 -3.937 17.659 0,17% 170.551 Teramo 20 10% 33.437 -1.493 13.815 0,17% 173.622 Biella 20 10% 26.990 -7.940 12.152 0,14% 155.267 Montegranaro 18 9% 30.562 -4.368 16.559 0,16% 172.756 Varese 12 6% 32.138 -2.792 19.929 0,19% 165.561 Cremona 11 5% 27.201 -7.729 13.159 0,16% 156.457 Sassari 3 1% 45.126 10.196 7.888 0,25% 205.731 Brindisi 2 1% 32.758 -2.172 1.981 0,18% 238.805 TOTALE 201 100% 34.930 0 18.780 0,19% 177.791
  • 11. Confronto fra le fasce orarie (dal 2007/08 alla 16°giornata della stagione 2010-11) Squadre Partite % Audience media Differenza Audience Media totale Dev.Std. Audience Share medio Contatti netti medi Sabato sera 55 27% 20.950 -13.980 11.059 0,09% 163.558 Domenica 12.00 60 30% 48.907 48.907 17.728 0,31% 189.255 Domenica pomeriggio 46 23% 35.041 35.041 17.744 0,19% 175.002 Domenica sera 25 12% 35.028 35.028 15.514 0,13% 198.451 Altre 15 7% 33.059 33.059 12.491 0,21% 159.326 TOTALE 201 100% 34.930 0 18.780 0,19% 177.791
  • 12. Interpretazione della Deviazione Standard (1 di 2)
    • La deviazione standard (Dev.Std.) è un indicatore della variabilità di una caratteristica in una determinata popolazione. Più risulta elevata maggiormente differenti sono i valori di tale caratteristica fra gli individui appartenenti alla popolazione.
    • Nel nostro studio la caratteristica oggetto di indagine è l’Audience Media e la popolazione di riferimento sono le partite.
  • 13.
    • Fra le squadre con che sono state trasmesse in diretta almeno 20 volte quella con la deviazione standard maggiore è Cantù (23.687), mentre quella con deviazione standard minore è Biella (12.152). Le due squadre in questione non hanno una differenza di Audience Media molto elevata (circa 7200 spettatori in meno per Biella), ma le partite di Cantù presentano un’Audience maggiormente variabile.
    • Ciò significa che le avversarie di turno influenzano maggiormente l’Audience di Cantù rispetto a quanto non siano in grado di fare le avversarie di Biella.
    • In termini pratici trasmettendo in diretta una partita fra una BIG e Cantù si hanno possibilità più elevate di ottenere un’Audience medio/alta rispetto a quella che si potrebbe ottenere in un match fra una BIG e Biella (i cui ascolti in generale sono bassi e poco variabili).
    Interpretazione della Deviazione Standard (2 di 2)
  • 14. La previsione (1 di 3) Uno degli obiettivi dell’analisi di regressione è prevedere i valori futuri della variabile dipendente (l’Audience Media) attraverso le variabili indipendenti incluse nel modello. Per farlo, la regressione multipla deve rendere massima la capacità previsiva delle variabili indipendenti considerandole globalmente. La regressione multipla permette di sfruttare molte opzioni, sia nella forma, sia nella specificazione delle variabili indipendenti, che consentono di modificare l’equazione in modo tale da accrescere la sua capacità previsiva. Spesso, però, questa viene potenziata a scapito dell’interpretazione. Attualmente stiamo tentando di realizzare ulteriori specificazioni del modello che consentano di individuare oltre ai fattori maggiormente determinanti per comprendere al meglio i dati storici dell’Audience anche le variabili più utili per prevederne i valori futuri sulla base delle informazioni disponibili ex-ante la gara (squadre coinvolte, contro-programmazione, posizione in classifica, differenza punti in classifica, ecc.).
  • 15. La previsione (2 di 3) Il miglior modello previsivo ottenuto al momento attuale (31/01/2011) è stato ottenuto calibrando il modello di regressione sulle ultime due stagioni di Regular Season (135 dirette; tutta la stagione 2009/10 più le prime 48 dirette della stagione in corso). Il MAE è uno degli indicatori utilizzabili per valutare la bontà previsiva di un modello e per il confronto fra modelli. E’ ottenuto calcolando media degli errori di previsione in valore assoluto (errore di previsione = valore ‘vero’ – valore previsto dal modello). Nel nostro caso il MAE assume valore pari a 10.395, ovvero in media la differenza fra il numero reale di spettatori che seguono la diretta ed il numero previsto dal modello (ex-ante la partita) è pari a 10.395.
  • 16. La previsione (3 di 3) Nella tabella seguente sono indicate le variabili incluse nel modello previsivo ed i relativi coefficienti: L’indicatore R 2 in questo modello (calibrato su 135 partite) risulta pari a 0,47 . VARIABILI COEFFICIENTI "Natale" 14249,5 Milano 13899,2 Roma 8681,8 Siena 8412,5 Varese 3720,1 Virtus 2300,7 Derby 730,2 Pesaro 320,8 Pti.POS 309,9 Diff.pti -305,2 Cantù -1056,6 Caserta -3436,4 Teramo -3609,3 Treviso -4087 Cremona -4615,7 Brindisi -6160,2 Juve,Inter,Milan -7282,6 Biella -8008 Montegranaro -10429,3 Avellino -11453,8 (Constant) 26867,8