SlideShare a Scribd company logo
Lean Six Sigma
La dispersione, la covarianza e la correlazione con Excel
Agenda
• I grafici a dispersione
• La covarianza
• La correlazione
Predisporre due serie di dati (tabella), la variabile Y come variabile dipendente a
destra, la variabile X come variabile esplicativa a sinistra. Selezionare i valore
delle serie, dal menù INSERISCI cliccare su Grafici Consigliati.
I grafici a dispersione
I diagrammi a dispersione sono utili per analizzare le relazioni tra due variabili (XY). Occorre avere due serie di dati per cui si presume una relazione dipendente tra una serie e
l'altra. Per esempio, potremmo considerare la relazione tra una variabile quantitativa e una variabile di costo, tipo dimensioni e costo di un prodotto, oppure età e casi di
malattia.
Cliccando sul grafico con il tasto dx del mouse selezionate l'icona Serie e
cliccate su Seleziona Dati
1 2
Verifcare che Excel utilizzi correttamente i dati, sulle X la variabile esplicativa
(es. età), sulle Y la variabile dipendente (es. nr. Malati).
I grafici a dispersione
I diagrammi a dispersione sono utili per analizzare le relazioni tra due variabili (XY). Occorre avere due serie di dati per cui si presume una relazione dipendente tra una serie e
l'altra. Per esempio, potremmo considerare la relazione tra una variabile quantitativa e una variabile di costo, tipo dimensioni e costo di un prodotto, oppure età e casi di
malattia.
Se l'intervallo dell'asse è troppo grande operate in modo da renderlo più
idoneo, posizionando il cursore del mouse sull'asse X o Y e cliccando sul
tasto dx, per cui comparirà un elenco da cui selezionare Formato asse ….
3 4
Nell'esempio portare il
minimo a 15 e il massimo
a 60, in modo da rendere
più leggibile il grafico
Grafico finale
I grafici a dispersione
I diagrammi a dispersione sono utili per analizzare le relazioni tra due variabili (XY). Occorre avere due serie di dati per cui si presume una relazione dipendente tra una serie e
l'altra. Per esempio, potremmo considerare la relazione tra una variabile quantitativa e una variabile di costo, tipo dimensioni e costo di un prodotto, oppure età e casi di
malattia.
Esempio con relazione di dipendenza evidente tra le due serie di dati
5 6
Applicando la statistica descrittiva è
possibile è possibile rappresentare le
grandezze per classi o raggruppamenti
I grafici a dispersione
I diagrammi a dispersione sono utili per analizzare le relazioni tra due variabili (XY). Occorre avere due serie di dati per cui si presume una relazione dipendente tra una serie e
l'altra. Per esempio, potremmo considerare la relazione tra una variabile quantitativa e una variabile di costo, tipo dimensioni e costo di un prodotto, oppure età e casi di
malattia.
Applicazione della statistica descrittiva e rappresentazione grafica per quadranti su incrocio delle due medie. Nell’esempio sono riportate le funzioni di xls per il calcolo delle
statistiche.
6
Agenda
• I grafici a dispersione
• La covarianza
• La correlazione
La covarianza
Dal menù Dati selezionare Analisi dati e cliccare su Covarianza
1
La Covarianza è un parametro che misura la relazione lineare tra due variabili, aiuta a
capire la tendenza di due variabili al variare assieme anziché in modo indipendente.
L'output generato è prodotto tra le unità di misura delle due serie/variabili utilizzate.
Lo strumento di analisi di excel calcola la Covarianza della Popolazione (n. al
denominatore), anziché la Covarianza del Campione (n-1 al denominatore).
La Covarianza è una misura del grado di associazione tra due variabili:
se COV (X,Y) > 0 allora l'associazione è positiva
se COV (X,Y) < 0 allora l'associazione è negativa
Compilare i campi Intervallo di input, Dati raggruppati per Colonne, Etichette
nella prima riga e Intervallo di output se si desidera inserire l'analisi di
COVARIANZA all'interno dello stesso foglio
La covarianza
L'output è una matrice di COVARIANZA fra le coppie di serie utilizzate, il
valore 0,5511 è il valore di COVARIANZA
2 3
La Covarianza è un parametro che misura la relazione lineare tra due variabili, aiuta a capire la tendenza di due variabili al variare assieme anziché in modo indipendente.
Anziché utilizzare Analisi dati è possibile
utilizzare la funzione Covarianza, prendendo
come dati la stessa coppia di serie utilizzata,
senza indicare le celle di etichetta
Il vantaggio della funzione è che è
dinamica, mentre lo strumento di
Analisi dati è statico.
Agenda
• I grafici a dispersione
• La covarianza
• La correlazione
La correlazione
La Correlazione è una misura molto utile per analizzare la dipendenza tra due serie di dati, la Correlazione è anche detta Covarianza normalizzata:
Corr (X,Y) = Cov (X,Y)/RADQ(VARX*VARY) >> il risultato è valore compreso tra - 1 e 1
Correlazione
negativa • Corr(X,Y)<0
Correlazione
positiva • Corr(X,Y)>0
Correlazione
nulla • Corr(X,Y)=0
Excel offre uno strumento immediato, dal menù Dati selezionare Analisi dati e
cliccare su Correlazione:
1
Compilare i campi: 1) Intervallo di input 2) Dati raggruppati per Colonne 3)
Etichette nella prima riga 4) Intervallo di output (se si desidera inserire l'analisi
di CORRELAZIONE all'interno dello stesso foglio)
La correlazione
L'output che si ottiene è una matrice di Correlazione fra le coppie di serie
utilizzate, il valore 0,0129 è il valore di Correlazione.
2 3
La Correlazione è una misura molto utile per analizzare la dipendenza tra due serie di dati, la Correlazione è anche detta Covarianza normalizzata:
Corr (X,Y) = Cov (X,Y)/RADQ(VARX*VARY) >> il risultato è valore compreso tra - 1 e 1
Anziché utilizzare Analisi dati è possibile
utilizzare la funzione Correlazione,
prendendo come dati la stessa coppia di
serie utilizzata, senza indicare le celle di
etichetta
Il vantaggio della funzione è che è
dinamica, mentre lo strumento di
Analisi dati è statico.
Correlazione quasi nulla (valore prossimo allo 0)
La correlazione
Correlazione positiva (valore prossimo ad 1)
4 5
La Correlazione è una misura molto utile per analizzare la dipendenza tra due serie di dati, la Correlazione è anche detta Covarianza normalizzata:
Corr (X,Y) = Cov (X,Y)/RADQ(VARX*VARY) >> il risultato è valore compreso tra - 1 e 1
Una correlazione nulla non significa
che le due variabili siano anche
indipendenti (*).
(*) per una trattazione più approfondita: Probabilità e inferenza statistica, Orsi R., Il Mulino)
Correlazione positiva (r=1) Correlazione negativa (r<0) Correlazione nulla (r=0)
La correlazione
La Correlazione è una misura molto utile per analizzare la dipendenza tra due serie di dati, la Correlazione è anche detta Covarianza normalizzata:
Corr (X,Y) = Cov (X,Y)/RADQ(VARX*VARY) >> il risultato è valore compreso tra - 1 e 1
Rappresentazione
grafica delle
tipologie di
correzione
………………………..to be continued

More Related Content

Similar to Lss dispersione correlazione_covarianza_excel

I fenomeni bivariati
I fenomeni bivariatiI fenomeni bivariati
I fenomeni bivariati
Vispo Srl
 
Grafici Excel
Grafici ExcelGrafici Excel
Grafici Excel
Salvatore Cianciabella
 
Lastatistica
LastatisticaLastatistica
Lastatistica
garofaloloredana
 
ACP - Analisi delle componenti principali
ACP - Analisi delle componenti principaliACP - Analisi delle componenti principali
ACP - Analisi delle componenti principali
Paola Pozzolo - La tua statistica
 
Appunti statistica descrittiva 2
Appunti statistica descrittiva 2Appunti statistica descrittiva 2
Appunti statistica descrittiva 2ESmargiassi
 
Metodo dei minimi quadrati
Metodo dei minimi quadratiMetodo dei minimi quadrati
Metodo dei minimi quadrati
Luigi Pasini
 
Il modello Logistico
Il modello LogisticoIl modello Logistico
Il modello Logistico
silvanoandorno
 
Le misure di variabilità
Le misure di variabilitàLe misure di variabilità
Le misure di variabilità
Vispo Srl
 
Grafici con Excel
Grafici con ExcelGrafici con Excel
Grafici con Excel
Salvatore Cianciabella
 
Grafici Excel
Grafici ExcelGrafici Excel
Grafici Excel
Salvatore Cianciabella
 
Classificazione automatica per dati ad alta dimensionalità: un approccio fuzz...
Classificazione automatica per dati ad alta dimensionalità: un approccio fuzz...Classificazione automatica per dati ad alta dimensionalità: un approccio fuzz...
Classificazione automatica per dati ad alta dimensionalità: un approccio fuzz...
Marco D'Alessandro
 
Informatica - uso di excel
Informatica - uso di excelInformatica - uso di excel
Informatica - uso di excelDario
 
SNACK! La migliore app sul cibo- Esperimento di Psicofisica
SNACK! La migliore app sul cibo- Esperimento di PsicofisicaSNACK! La migliore app sul cibo- Esperimento di Psicofisica
SNACK! La migliore app sul cibo- Esperimento di Psicofisica
Monica Pennati
 
Statistica sociale
Statistica socialeStatistica sociale
Statistica sociale
Lucia Schirru
 
Misura psicologia esercizi-5-6-7-8-9
Misura psicologia esercizi-5-6-7-8-9Misura psicologia esercizi-5-6-7-8-9
Misura psicologia esercizi-5-6-7-8-9stefano_s
 
Applicazione su “RStudio” del modello di regressione lineare
Applicazione su “RStudio” del modello di regressione lineareApplicazione su “RStudio” del modello di regressione lineare
Applicazione su “RStudio” del modello di regressione lineare
Loredana Liverani
 
La statistica, medie e indici di variabilità
La statistica, medie e indici di variabilitàLa statistica, medie e indici di variabilità
La statistica, medie e indici di variabilità
Luigi Pasini
 
Algoritmi di clustering e correlazione: una panoramica
Algoritmi di clustering e correlazione: una panoramicaAlgoritmi di clustering e correlazione: una panoramica
Algoritmi di clustering e correlazione: una panoramica
Paolo Caressa
 

Similar to Lss dispersione correlazione_covarianza_excel (20)

I fenomeni bivariati
I fenomeni bivariatiI fenomeni bivariati
I fenomeni bivariati
 
Grafici Excel
Grafici ExcelGrafici Excel
Grafici Excel
 
Lastatistica
LastatisticaLastatistica
Lastatistica
 
ACP - Analisi delle componenti principali
ACP - Analisi delle componenti principaliACP - Analisi delle componenti principali
ACP - Analisi delle componenti principali
 
8 Statistica
8 Statistica8 Statistica
8 Statistica
 
Appunti statistica descrittiva 2
Appunti statistica descrittiva 2Appunti statistica descrittiva 2
Appunti statistica descrittiva 2
 
Metodo dei minimi quadrati
Metodo dei minimi quadratiMetodo dei minimi quadrati
Metodo dei minimi quadrati
 
Il modello Logistico
Il modello LogisticoIl modello Logistico
Il modello Logistico
 
Le misure di variabilità
Le misure di variabilitàLe misure di variabilità
Le misure di variabilità
 
Grafici con Excel
Grafici con ExcelGrafici con Excel
Grafici con Excel
 
Grafici Excel
Grafici ExcelGrafici Excel
Grafici Excel
 
Classificazione automatica per dati ad alta dimensionalità: un approccio fuzz...
Classificazione automatica per dati ad alta dimensionalità: un approccio fuzz...Classificazione automatica per dati ad alta dimensionalità: un approccio fuzz...
Classificazione automatica per dati ad alta dimensionalità: un approccio fuzz...
 
Informatica - uso di excel
Informatica - uso di excelInformatica - uso di excel
Informatica - uso di excel
 
SNACK! La migliore app sul cibo- Esperimento di Psicofisica
SNACK! La migliore app sul cibo- Esperimento di PsicofisicaSNACK! La migliore app sul cibo- Esperimento di Psicofisica
SNACK! La migliore app sul cibo- Esperimento di Psicofisica
 
Statistica sociale
Statistica socialeStatistica sociale
Statistica sociale
 
Misura psicologia esercizi-5-6-7-8-9
Misura psicologia esercizi-5-6-7-8-9Misura psicologia esercizi-5-6-7-8-9
Misura psicologia esercizi-5-6-7-8-9
 
Applicazione su “RStudio” del modello di regressione lineare
Applicazione su “RStudio” del modello di regressione lineareApplicazione su “RStudio” del modello di regressione lineare
Applicazione su “RStudio” del modello di regressione lineare
 
La statistica, medie e indici di variabilità
La statistica, medie e indici di variabilitàLa statistica, medie e indici di variabilità
La statistica, medie e indici di variabilità
 
Psicometria Parte I
 Psicometria Parte I Psicometria Parte I
Psicometria Parte I
 
Algoritmi di clustering e correlazione: una panoramica
Algoritmi di clustering e correlazione: una panoramicaAlgoritmi di clustering e correlazione: una panoramica
Algoritmi di clustering e correlazione: una panoramica
 

Lss dispersione correlazione_covarianza_excel

  • 1. Lean Six Sigma La dispersione, la covarianza e la correlazione con Excel
  • 2. Agenda • I grafici a dispersione • La covarianza • La correlazione
  • 3. Predisporre due serie di dati (tabella), la variabile Y come variabile dipendente a destra, la variabile X come variabile esplicativa a sinistra. Selezionare i valore delle serie, dal menù INSERISCI cliccare su Grafici Consigliati. I grafici a dispersione I diagrammi a dispersione sono utili per analizzare le relazioni tra due variabili (XY). Occorre avere due serie di dati per cui si presume una relazione dipendente tra una serie e l'altra. Per esempio, potremmo considerare la relazione tra una variabile quantitativa e una variabile di costo, tipo dimensioni e costo di un prodotto, oppure età e casi di malattia. Cliccando sul grafico con il tasto dx del mouse selezionate l'icona Serie e cliccate su Seleziona Dati 1 2
  • 4. Verifcare che Excel utilizzi correttamente i dati, sulle X la variabile esplicativa (es. età), sulle Y la variabile dipendente (es. nr. Malati). I grafici a dispersione I diagrammi a dispersione sono utili per analizzare le relazioni tra due variabili (XY). Occorre avere due serie di dati per cui si presume una relazione dipendente tra una serie e l'altra. Per esempio, potremmo considerare la relazione tra una variabile quantitativa e una variabile di costo, tipo dimensioni e costo di un prodotto, oppure età e casi di malattia. Se l'intervallo dell'asse è troppo grande operate in modo da renderlo più idoneo, posizionando il cursore del mouse sull'asse X o Y e cliccando sul tasto dx, per cui comparirà un elenco da cui selezionare Formato asse …. 3 4 Nell'esempio portare il minimo a 15 e il massimo a 60, in modo da rendere più leggibile il grafico
  • 5. Grafico finale I grafici a dispersione I diagrammi a dispersione sono utili per analizzare le relazioni tra due variabili (XY). Occorre avere due serie di dati per cui si presume una relazione dipendente tra una serie e l'altra. Per esempio, potremmo considerare la relazione tra una variabile quantitativa e una variabile di costo, tipo dimensioni e costo di un prodotto, oppure età e casi di malattia. Esempio con relazione di dipendenza evidente tra le due serie di dati 5 6 Applicando la statistica descrittiva è possibile è possibile rappresentare le grandezze per classi o raggruppamenti
  • 6. I grafici a dispersione I diagrammi a dispersione sono utili per analizzare le relazioni tra due variabili (XY). Occorre avere due serie di dati per cui si presume una relazione dipendente tra una serie e l'altra. Per esempio, potremmo considerare la relazione tra una variabile quantitativa e una variabile di costo, tipo dimensioni e costo di un prodotto, oppure età e casi di malattia. Applicazione della statistica descrittiva e rappresentazione grafica per quadranti su incrocio delle due medie. Nell’esempio sono riportate le funzioni di xls per il calcolo delle statistiche. 6
  • 7. Agenda • I grafici a dispersione • La covarianza • La correlazione
  • 8. La covarianza Dal menù Dati selezionare Analisi dati e cliccare su Covarianza 1 La Covarianza è un parametro che misura la relazione lineare tra due variabili, aiuta a capire la tendenza di due variabili al variare assieme anziché in modo indipendente. L'output generato è prodotto tra le unità di misura delle due serie/variabili utilizzate. Lo strumento di analisi di excel calcola la Covarianza della Popolazione (n. al denominatore), anziché la Covarianza del Campione (n-1 al denominatore). La Covarianza è una misura del grado di associazione tra due variabili: se COV (X,Y) > 0 allora l'associazione è positiva se COV (X,Y) < 0 allora l'associazione è negativa
  • 9. Compilare i campi Intervallo di input, Dati raggruppati per Colonne, Etichette nella prima riga e Intervallo di output se si desidera inserire l'analisi di COVARIANZA all'interno dello stesso foglio La covarianza L'output è una matrice di COVARIANZA fra le coppie di serie utilizzate, il valore 0,5511 è il valore di COVARIANZA 2 3 La Covarianza è un parametro che misura la relazione lineare tra due variabili, aiuta a capire la tendenza di due variabili al variare assieme anziché in modo indipendente. Anziché utilizzare Analisi dati è possibile utilizzare la funzione Covarianza, prendendo come dati la stessa coppia di serie utilizzata, senza indicare le celle di etichetta Il vantaggio della funzione è che è dinamica, mentre lo strumento di Analisi dati è statico.
  • 10. Agenda • I grafici a dispersione • La covarianza • La correlazione
  • 11. La correlazione La Correlazione è una misura molto utile per analizzare la dipendenza tra due serie di dati, la Correlazione è anche detta Covarianza normalizzata: Corr (X,Y) = Cov (X,Y)/RADQ(VARX*VARY) >> il risultato è valore compreso tra - 1 e 1 Correlazione negativa • Corr(X,Y)<0 Correlazione positiva • Corr(X,Y)>0 Correlazione nulla • Corr(X,Y)=0 Excel offre uno strumento immediato, dal menù Dati selezionare Analisi dati e cliccare su Correlazione: 1
  • 12. Compilare i campi: 1) Intervallo di input 2) Dati raggruppati per Colonne 3) Etichette nella prima riga 4) Intervallo di output (se si desidera inserire l'analisi di CORRELAZIONE all'interno dello stesso foglio) La correlazione L'output che si ottiene è una matrice di Correlazione fra le coppie di serie utilizzate, il valore 0,0129 è il valore di Correlazione. 2 3 La Correlazione è una misura molto utile per analizzare la dipendenza tra due serie di dati, la Correlazione è anche detta Covarianza normalizzata: Corr (X,Y) = Cov (X,Y)/RADQ(VARX*VARY) >> il risultato è valore compreso tra - 1 e 1 Anziché utilizzare Analisi dati è possibile utilizzare la funzione Correlazione, prendendo come dati la stessa coppia di serie utilizzata, senza indicare le celle di etichetta Il vantaggio della funzione è che è dinamica, mentre lo strumento di Analisi dati è statico.
  • 13. Correlazione quasi nulla (valore prossimo allo 0) La correlazione Correlazione positiva (valore prossimo ad 1) 4 5 La Correlazione è una misura molto utile per analizzare la dipendenza tra due serie di dati, la Correlazione è anche detta Covarianza normalizzata: Corr (X,Y) = Cov (X,Y)/RADQ(VARX*VARY) >> il risultato è valore compreso tra - 1 e 1 Una correlazione nulla non significa che le due variabili siano anche indipendenti (*). (*) per una trattazione più approfondita: Probabilità e inferenza statistica, Orsi R., Il Mulino)
  • 14. Correlazione positiva (r=1) Correlazione negativa (r<0) Correlazione nulla (r=0) La correlazione La Correlazione è una misura molto utile per analizzare la dipendenza tra due serie di dati, la Correlazione è anche detta Covarianza normalizzata: Corr (X,Y) = Cov (X,Y)/RADQ(VARX*VARY) >> il risultato è valore compreso tra - 1 e 1 Rappresentazione grafica delle tipologie di correzione