Lss dispersione correlazione_covarianza_excel

Lean Six Sigma
La dispersione, la covarianza e la correlazione con Excel

Agenda
• I grafici a dispersione
• La covarianza
• La correlazione

Predisporre due serie di dati (tabella), la variabile Y come variabile dipendente a
destra, la variabile X come variabile esplicativa a sinistra. Selezionare i valore
delle serie, dal menù INSERISCI cliccare su Grafici Consigliati.
I grafici a dispersione
I diagrammi a dispersione sono utili per analizzare le relazioni tra due variabili (XY). Occorre avere due serie di dati per cui si presume una relazione dipendente tra una serie e
l'altra. Per esempio, potremmo considerare la relazione tra una variabile quantitativa e una variabile di costo, tipo dimensioni e costo di un prodotto, oppure età e casi di
malattia.
Cliccando sul grafico con il tasto dx del mouse selezionate l'icona Serie e
cliccate su Seleziona Dati
1 2

Verifcare che Excel utilizzi correttamente i dati, sulle X la variabile esplicativa
(es. età), sulle Y la variabile dipendente (es. nr. Malati).
malattia.
Se l'intervallo dell'asse è troppo grande operate in modo da renderlo più
idoneo, posizionando il cursore del mouse sull'asse X o Y e cliccando sul
tasto dx, per cui comparirà un elenco da cui selezionare Formato asse ….
3 4
Nell'esempio portare il
minimo a 15 e il massimo
a 60, in modo da rendere
più leggibile il grafico

Grafico finale
malattia.
Esempio con relazione di dipendenza evidente tra le due serie di dati
5 6
Applicando la statistica descrittiva è
possibile è possibile rappresentare le
grandezze per classi o raggruppamenti

malattia.
Applicazione della statistica descrittiva e rappresentazione grafica per quadranti su incrocio delle due medie. Nell’esempio sono riportate le funzioni di xls per il calcolo delle
statistiche.
6

La covarianza
Dal menù Dati selezionare Analisi dati e cliccare su Covarianza
1
La Covarianza è un parametro che misura la relazione lineare tra due variabili, aiuta a
capire la tendenza di due variabili al variare assieme anziché in modo indipendente.
L'output generato è prodotto tra le unità di misura delle due serie/variabili utilizzate.
Lo strumento di analisi di excel calcola la Covarianza della Popolazione (n. al
denominatore), anziché la Covarianza del Campione (n-1 al denominatore).
La Covarianza è una misura del grado di associazione tra due variabili:
se COV (X,Y) > 0 allora l'associazione è positiva
se COV (X,Y) < 0 allora l'associazione è negativa

Compilare i campi Intervallo di input, Dati raggruppati per Colonne, Etichette
nella prima riga e Intervallo di output se si desidera inserire l'analisi di
COVARIANZA all'interno dello stesso foglio
La covarianza
L'output è una matrice di COVARIANZA fra le coppie di serie utilizzate, il
valore 0,5511 è il valore di COVARIANZA
2 3
La Covarianza è un parametro che misura la relazione lineare tra due variabili, aiuta a capire la tendenza di due variabili al variare assieme anziché in modo indipendente.
Anziché utilizzare Analisi dati è possibile
utilizzare la funzione Covarianza, prendendo
come dati la stessa coppia di serie utilizzata,
senza indicare le celle di etichetta
Il vantaggio della funzione è che è
dinamica, mentre lo strumento di
Analisi dati è statico.

La correlazione
La Correlazione è una misura molto utile per analizzare la dipendenza tra due serie di dati, la Correlazione è anche detta Covarianza normalizzata:
Corr (X,Y) = Cov (X,Y)/RADQ(VARX*VARY) >> il risultato è valore compreso tra - 1 e 1
Correlazione
negativa • Corr(X,Y)<0
Correlazione
positiva • Corr(X,Y)>0
Correlazione
nulla • Corr(X,Y)=0
Excel offre uno strumento immediato, dal menù Dati selezionare Analisi dati e
cliccare su Correlazione:
1

Compilare i campi: 1) Intervallo di input 2) Dati raggruppati per Colonne 3)
Etichette nella prima riga 4) Intervallo di output (se si desidera inserire l'analisi
di CORRELAZIONE all'interno dello stesso foglio)
La correlazione
L'output che si ottiene è una matrice di Correlazione fra le coppie di serie
utilizzate, il valore 0,0129 è il valore di Correlazione.
2 3
Anziché utilizzare Analisi dati è possibile
utilizzare la funzione Correlazione,
prendendo come dati la stessa coppia di
serie utilizzata, senza indicare le celle di
etichetta
Il vantaggio della funzione è che è
dinamica, mentre lo strumento di
Analisi dati è statico.

Correlazione quasi nulla (valore prossimo allo 0)
La correlazione
Correlazione positiva (valore prossimo ad 1)
4 5
Una correlazione nulla non significa
che le due variabili siano anche
indipendenti (*).
(*) per una trattazione più approfondita: Probabilità e inferenza statistica, Orsi R., Il Mulino)

Correlazione positiva (r=1) Correlazione negativa (r<0) Correlazione nulla (r=0)
La correlazione
Rappresentazione
grafica delle
tipologie di
correzione

………………………..to be continued

Lss dispersione correlazione_covarianza_excel

Recommended

Recommended

More Related Content

Similar to Lss dispersione correlazione_covarianza_excel

Similar to Lss dispersione correlazione_covarianza_excel (20)

Lss dispersione correlazione_covarianza_excel