L'analisi dei dati è molto importante nella Lean Six Sigma, nel framework DMAIC la fase M è cruciale. Così la verifica di relazioni tra variabili è decisiva nella valutazione dei fenomeni e nel miglioramento dei processi. Senza essere esperti in statistica, con Excel è possibile ottenere informazioni utili e in modo semplificato per l'analisi e il problem solving..
Un'elenco di consigli pratici su come impostare un'analisi descrittiva, dalla creazione del dataset alla scelta del tipo di variabili, alla valutazione degli indici univariati e dei grafici più opportuni.
Un'elenco di consigli pratici su come impostare un'analisi descrittiva, dalla creazione del dataset alla scelta del tipo di variabili, alla valutazione degli indici univariati e dei grafici più opportuni.
I fenomeni bivariati sono quei fenomeni che possono essere caratterizzati studiando congiuntamente due variabili.
Se le variabili sono entrambe quantitative si può procedere a un’analisi di interdipendenza, altrimenti si ricorre all’utilizzo di misure di associazione (per caratteri qualitativi).
Corso di Statistica del Prof. Garau.
Slide a cura di Giorgio Garau e Lucia Schirru.
Una caratteristica importante di una distribuzione statistica è la sua variabilità. La variabilità è, infatti, la quantità di dispersione presente nei dati.
Come gli indici di posizione, anche gli indici di dispersione o variabilità servono per descrivere sinteticamente (o caratterizzare) le distribuzioni statistiche quantitative (per le variabili qualitative si usano gli indici di diversità).
Classificazione automatica per dati ad alta dimensionalità: un approccio fuzz...Marco D'Alessandro
Tesi di Laurea Magistrale in Metodi statistici per dati complessi.
Obiettivo del presente lavoro è quello di presentare uno studio dei principali effetti dell'alta dimensionalità dei dati sugli algoritmi di cluster analysis. Attenzione particolare è rivolta al caso in cui le variabili rilevate siano qualitative, ed al caso in cui l'appartenenza delle osservazioni ai gruppi non sia dicotomica.
SNACK! La migliore app sul cibo- Esperimento di PsicofisicaMonica Pennati
L’ esperimento che abbiamo deciso di proporre ha cercato di identificare quale fosse la homepage di app per smartphone con la struttura più gradita. In particolare ci si è limitati ad app che vertono sul tema cucina e che quindi necessitano di presentare fotografie di cibo nella propria pagina iniziale.Per fare ciò si è deciso di utilizzare il Metodo del confronto a coppie di Thurstone.
Ci si è quindi identificati con una ipotetica azienda che volesse lanciare sul mercato un applicazione sul tema food e che quindi sarebbe interessata. a identificare la struttura della presentazione fotografica preferita dagli utenti.Per fare ciò si è andati a cercare 5 strutture diverse di 5 applicazioni esistenti per smartphone sul tema.
Slide del corso di statistica sociale del Prof. Giorgio Garau, per la laurea in Assistente sociale. Indici di posizione, variabilità e mutua variabilità: concentrazione ed eterogeneità.
Il ruolo della statistica nell'informazione a cura di Lucia Schirru
Applicazione su “RStudio” del modello di regressione lineareLoredana Liverani
Il lavoro, eseguito sul software statistico RStudio, consiste nell’applicazione critica (stime e commenti) di un modello di regressione lineare a dati prestabiliti. Il file di dati utilizzato contiene informazioni sulla spesa mensile di un campione di 150 clienti di alcuni siti specializzati in e-commerce, i quali hanno aderito ad un questionario online.
Algoritmi di clustering e correlazione: una panoramicaPaolo Caressa
Le slide di una presentazione su alcuni concetti fondamentali relativi agli algoritmi di clustering e correlazione comunemente utilizzati nell'industria. Slide presentate internamente alla CODIN s.p.a. nel giugno 2012.
More Related Content
Similar to Lss dispersione correlazione_covarianza_excel
I fenomeni bivariati sono quei fenomeni che possono essere caratterizzati studiando congiuntamente due variabili.
Se le variabili sono entrambe quantitative si può procedere a un’analisi di interdipendenza, altrimenti si ricorre all’utilizzo di misure di associazione (per caratteri qualitativi).
Corso di Statistica del Prof. Garau.
Slide a cura di Giorgio Garau e Lucia Schirru.
Una caratteristica importante di una distribuzione statistica è la sua variabilità. La variabilità è, infatti, la quantità di dispersione presente nei dati.
Come gli indici di posizione, anche gli indici di dispersione o variabilità servono per descrivere sinteticamente (o caratterizzare) le distribuzioni statistiche quantitative (per le variabili qualitative si usano gli indici di diversità).
Classificazione automatica per dati ad alta dimensionalità: un approccio fuzz...Marco D'Alessandro
Tesi di Laurea Magistrale in Metodi statistici per dati complessi.
Obiettivo del presente lavoro è quello di presentare uno studio dei principali effetti dell'alta dimensionalità dei dati sugli algoritmi di cluster analysis. Attenzione particolare è rivolta al caso in cui le variabili rilevate siano qualitative, ed al caso in cui l'appartenenza delle osservazioni ai gruppi non sia dicotomica.
SNACK! La migliore app sul cibo- Esperimento di PsicofisicaMonica Pennati
L’ esperimento che abbiamo deciso di proporre ha cercato di identificare quale fosse la homepage di app per smartphone con la struttura più gradita. In particolare ci si è limitati ad app che vertono sul tema cucina e che quindi necessitano di presentare fotografie di cibo nella propria pagina iniziale.Per fare ciò si è deciso di utilizzare il Metodo del confronto a coppie di Thurstone.
Ci si è quindi identificati con una ipotetica azienda che volesse lanciare sul mercato un applicazione sul tema food e che quindi sarebbe interessata. a identificare la struttura della presentazione fotografica preferita dagli utenti.Per fare ciò si è andati a cercare 5 strutture diverse di 5 applicazioni esistenti per smartphone sul tema.
Slide del corso di statistica sociale del Prof. Giorgio Garau, per la laurea in Assistente sociale. Indici di posizione, variabilità e mutua variabilità: concentrazione ed eterogeneità.
Il ruolo della statistica nell'informazione a cura di Lucia Schirru
Applicazione su “RStudio” del modello di regressione lineareLoredana Liverani
Il lavoro, eseguito sul software statistico RStudio, consiste nell’applicazione critica (stime e commenti) di un modello di regressione lineare a dati prestabiliti. Il file di dati utilizzato contiene informazioni sulla spesa mensile di un campione di 150 clienti di alcuni siti specializzati in e-commerce, i quali hanno aderito ad un questionario online.
Algoritmi di clustering e correlazione: una panoramicaPaolo Caressa
Le slide di una presentazione su alcuni concetti fondamentali relativi agli algoritmi di clustering e correlazione comunemente utilizzati nell'industria. Slide presentate internamente alla CODIN s.p.a. nel giugno 2012.
Similar to Lss dispersione correlazione_covarianza_excel (20)
3. Predisporre due serie di dati (tabella), la variabile Y come variabile dipendente a
destra, la variabile X come variabile esplicativa a sinistra. Selezionare i valore
delle serie, dal menù INSERISCI cliccare su Grafici Consigliati.
I grafici a dispersione
I diagrammi a dispersione sono utili per analizzare le relazioni tra due variabili (XY). Occorre avere due serie di dati per cui si presume una relazione dipendente tra una serie e
l'altra. Per esempio, potremmo considerare la relazione tra una variabile quantitativa e una variabile di costo, tipo dimensioni e costo di un prodotto, oppure età e casi di
malattia.
Cliccando sul grafico con il tasto dx del mouse selezionate l'icona Serie e
cliccate su Seleziona Dati
1 2
4. Verifcare che Excel utilizzi correttamente i dati, sulle X la variabile esplicativa
(es. età), sulle Y la variabile dipendente (es. nr. Malati).
I grafici a dispersione
I diagrammi a dispersione sono utili per analizzare le relazioni tra due variabili (XY). Occorre avere due serie di dati per cui si presume una relazione dipendente tra una serie e
l'altra. Per esempio, potremmo considerare la relazione tra una variabile quantitativa e una variabile di costo, tipo dimensioni e costo di un prodotto, oppure età e casi di
malattia.
Se l'intervallo dell'asse è troppo grande operate in modo da renderlo più
idoneo, posizionando il cursore del mouse sull'asse X o Y e cliccando sul
tasto dx, per cui comparirà un elenco da cui selezionare Formato asse ….
3 4
Nell'esempio portare il
minimo a 15 e il massimo
a 60, in modo da rendere
più leggibile il grafico
5. Grafico finale
I grafici a dispersione
I diagrammi a dispersione sono utili per analizzare le relazioni tra due variabili (XY). Occorre avere due serie di dati per cui si presume una relazione dipendente tra una serie e
l'altra. Per esempio, potremmo considerare la relazione tra una variabile quantitativa e una variabile di costo, tipo dimensioni e costo di un prodotto, oppure età e casi di
malattia.
Esempio con relazione di dipendenza evidente tra le due serie di dati
5 6
Applicando la statistica descrittiva è
possibile è possibile rappresentare le
grandezze per classi o raggruppamenti
6. I grafici a dispersione
I diagrammi a dispersione sono utili per analizzare le relazioni tra due variabili (XY). Occorre avere due serie di dati per cui si presume una relazione dipendente tra una serie e
l'altra. Per esempio, potremmo considerare la relazione tra una variabile quantitativa e una variabile di costo, tipo dimensioni e costo di un prodotto, oppure età e casi di
malattia.
Applicazione della statistica descrittiva e rappresentazione grafica per quadranti su incrocio delle due medie. Nell’esempio sono riportate le funzioni di xls per il calcolo delle
statistiche.
6
8. La covarianza
Dal menù Dati selezionare Analisi dati e cliccare su Covarianza
1
La Covarianza è un parametro che misura la relazione lineare tra due variabili, aiuta a
capire la tendenza di due variabili al variare assieme anziché in modo indipendente.
L'output generato è prodotto tra le unità di misura delle due serie/variabili utilizzate.
Lo strumento di analisi di excel calcola la Covarianza della Popolazione (n. al
denominatore), anziché la Covarianza del Campione (n-1 al denominatore).
La Covarianza è una misura del grado di associazione tra due variabili:
se COV (X,Y) > 0 allora l'associazione è positiva
se COV (X,Y) < 0 allora l'associazione è negativa
9. Compilare i campi Intervallo di input, Dati raggruppati per Colonne, Etichette
nella prima riga e Intervallo di output se si desidera inserire l'analisi di
COVARIANZA all'interno dello stesso foglio
La covarianza
L'output è una matrice di COVARIANZA fra le coppie di serie utilizzate, il
valore 0,5511 è il valore di COVARIANZA
2 3
La Covarianza è un parametro che misura la relazione lineare tra due variabili, aiuta a capire la tendenza di due variabili al variare assieme anziché in modo indipendente.
Anziché utilizzare Analisi dati è possibile
utilizzare la funzione Covarianza, prendendo
come dati la stessa coppia di serie utilizzata,
senza indicare le celle di etichetta
Il vantaggio della funzione è che è
dinamica, mentre lo strumento di
Analisi dati è statico.
11. La correlazione
La Correlazione è una misura molto utile per analizzare la dipendenza tra due serie di dati, la Correlazione è anche detta Covarianza normalizzata:
Corr (X,Y) = Cov (X,Y)/RADQ(VARX*VARY) >> il risultato è valore compreso tra - 1 e 1
Correlazione
negativa • Corr(X,Y)<0
Correlazione
positiva • Corr(X,Y)>0
Correlazione
nulla • Corr(X,Y)=0
Excel offre uno strumento immediato, dal menù Dati selezionare Analisi dati e
cliccare su Correlazione:
1
12. Compilare i campi: 1) Intervallo di input 2) Dati raggruppati per Colonne 3)
Etichette nella prima riga 4) Intervallo di output (se si desidera inserire l'analisi
di CORRELAZIONE all'interno dello stesso foglio)
La correlazione
L'output che si ottiene è una matrice di Correlazione fra le coppie di serie
utilizzate, il valore 0,0129 è il valore di Correlazione.
2 3
La Correlazione è una misura molto utile per analizzare la dipendenza tra due serie di dati, la Correlazione è anche detta Covarianza normalizzata:
Corr (X,Y) = Cov (X,Y)/RADQ(VARX*VARY) >> il risultato è valore compreso tra - 1 e 1
Anziché utilizzare Analisi dati è possibile
utilizzare la funzione Correlazione,
prendendo come dati la stessa coppia di
serie utilizzata, senza indicare le celle di
etichetta
Il vantaggio della funzione è che è
dinamica, mentre lo strumento di
Analisi dati è statico.
13. Correlazione quasi nulla (valore prossimo allo 0)
La correlazione
Correlazione positiva (valore prossimo ad 1)
4 5
La Correlazione è una misura molto utile per analizzare la dipendenza tra due serie di dati, la Correlazione è anche detta Covarianza normalizzata:
Corr (X,Y) = Cov (X,Y)/RADQ(VARX*VARY) >> il risultato è valore compreso tra - 1 e 1
Una correlazione nulla non significa
che le due variabili siano anche
indipendenti (*).
(*) per una trattazione più approfondita: Probabilità e inferenza statistica, Orsi R., Il Mulino)
14. Correlazione positiva (r=1) Correlazione negativa (r<0) Correlazione nulla (r=0)
La correlazione
La Correlazione è una misura molto utile per analizzare la dipendenza tra due serie di dati, la Correlazione è anche detta Covarianza normalizzata:
Corr (X,Y) = Cov (X,Y)/RADQ(VARX*VARY) >> il risultato è valore compreso tra - 1 e 1
Rappresentazione
grafica delle
tipologie di
correzione