1. CORRELAZIONE DELLE
SPESE MEDIE MENSILI Caso pratico
di regressione
FAMILIARI TRA NORD- lineare
OVEST E SUD NEL 2011
2. INDICE
Dati di partenza
Il diagramma a dispersione
La retta di regressione
La bontà del modello di regressione
lineare
La correlazione esistente fra le due
variabili
Conclusioni
3. DATI DI PARTENZA
Abbiamo rilevato le spese medie mensili
familiari tra Nord-Ovest (X) e Sud (Y) e
abbiamo ottenuto i seguenti dati :
PANE E LATTE, FORMAGGI E OLI E PATATE, FRUTTA E ZUCCHERO, CAFFE’ E
CARNE PESCE BEVANDE
CEREALI UOVA GRASSI ORTAGGI DROGHERIA
X( NORD-OVEST) 79,86 118,54 34,82 68,26 16,07 84,45 34,26 48,95
116,0
Y ( SUD) 81,02 116,05 51,43 68,92 17,87 90,11 36,31 39,45
5
4. CHE COS’È IL DIAGRAMMA A
DISPERSIONE?
Il diagramma di dispersione serve per
rappresentare la relazione tra due variabili
statistiche.
E‛ il diagramma cartesiano sul quale ciascuna
unità statistica è rappresentata mediante
coordinante che rappresentano i valori di due
variabili statistiche oggetto di studio osservati
su quella unità.
6. CHE COS’È LA RETTA DI REGRESSIONE?
Lo studio della regressione consiste nella
determinazione di una funzione matematica
che esprime la relazione fra le variabili.
Applicando il metodo dei minimi quadrati si
ottiene la retta y = a + b∙x che è detta retta di
regressione di y rispetto ad x.
7. LA RETTA DI REGRESSIONE
La retta di regressione trovata è:
y=0,9445+5,3574x
Trattasi quindi di una retta crescente. Al
aumentare delle spese familiari del Nord-
Ovest crescono in modo lineare le spese
familiari del Sud.
8. COME CALCOLO LA BONTÀ DEL MODELLO
DI REGRESSIONE LINEARE?
Utilizzo il coefficiente di determinazione r al
quadrato dal rapporto fra la covarianza al
quadrato di xy e il prodotto fra la varianza di x
e la varianza di y. Tale coefficiente è
compreso tra 0 e 1 ed esprime la percentuale
di variabilità totale dovuta alla dipendenza
lineare della y dalla x. Più il coefficiente si
avvicina a 1 più il modello di regressione
utilizzato risulta efficace.
9. LA BONTÀ DEL MODELLO DI REGRESSIONE
LINEARE
Il modello di regressione lineare è valido
perché il 95,13% della variabilità totale è
dovuto alla dipendenza lineare della y dalla x.
10. COME SI CALCOLA CORRELAZIONE?
Per misurare l’intensità, o forza del
legame, fra le due variabili, nel caso sempre
di regressione lineare, si introduce una misura
della loro correlazione data dal coefficiente di
correlazione lineare di Bravais – Pearson che
può variare da -1 a 1.
11. LA CORRELAZIONE ESISTENTE FRA LE DUE
VARIABILI
In questo caso, esiste una correlazione
positiva o diretta fra le due variabili in quanto
il coefficiente di correlazione lineare è
compreso fra 0 e 1.
12. CONCLUSIONI
Abbiamo constatato lo studio statistico molto
efficace per raggiungere gli obiettivi che ci
eravamo posti. Quindi, possiamo dire che al
Sud vi è una spesa media mensile familiare
che cresce in modo lineare rispetto alla spesa
familiare del Nord- Ovest.