<ul><li>Il metodo dei minimi quadrati è una tecnica che permette di trovare una funzione, detta  funzione di regressione ,...
Diagramma a dispersione Lo scopo è quindi quello di interpolare i dati rilevati con una funzione che sintetizzi in modo op...
Con questa formula si minimizza la somma dei quadrati e non la somma delle semplici differenze fra valori rilevati e valor...
 
<ul><li>Si possono calcolare i coefficienti “a” e “b” della retta di regressione di “y” su “x”  </li></ul><ul><li>( y = a ...
<ul><li>Esempio: </li></ul><ul><li>Sono stati rilevati i seguenti risultati in Economia in una classe con rispettive assen...
<ul><li>Per determinare la retta di regressione di “y” su “x” si usa la  tabella a doppia entrata , in cui 6 è il numero d...
<ul><li>E(xy) = 5,5·2·1/6 + 6,5· 1·1/6 + 6,5·2·1/6 + 6,5·3·1/6 + 7,5·0·1/6 + 11·0·1/6 = 8,3331 </li></ul><ul><li>E(x) = 5,...
 
Lo studio della regressione consiste nella determinazione di un coefficiente che esprime la relazione, più o meno intensa,...
Prendiamo ora in considerazione la retta di regressione di X su Y che possiamo scrivere come  x = a 2  + b 2 y Soffermiamo...
<ul><li>r = -1 </li></ul>La correlazione è detta  perfetta inversa  e le due rette sono coincidenti e decrescenti. <ul><li...
<ul><li>0 < r < 1  </li></ul>La correlazione è  positiva o diretta  e le due rette sono incidenti e crescenti. <ul><li>r =...
Molto interessante risulta essere anche il quadrato del coefficiente r, detto  coefficiente di determinazione , il quale i...
 
Upcoming SlideShare
Loading in …5
×

La correlazione lineare fra due variabili statistiche

5,956 views

Published on

lavoro a cura di un gruppo di alunne della mia 4AT 2011/2012

Published in: Education
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
5,956
On SlideShare
0
From Embeds
0
Number of Embeds
28
Actions
Shares
0
Downloads
29
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

La correlazione lineare fra due variabili statistiche

  1. 2. <ul><li>Il metodo dei minimi quadrati è una tecnica che permette di trovare una funzione, detta funzione di regressione , che si avvicini il più possibile alle rilevazioni grezze tratte da due variabili statistiche e riportate in un grafico, chiamato Diagramma a dispersione. In particolare la funzione trovata deve minimizzare la somma dei quadrati delle differenze tra i valori osservati e i corrispondenti valori teorici individuati sulla funzione stessa. </li></ul>
  2. 3. Diagramma a dispersione Lo scopo è quindi quello di interpolare i dati rilevati con una funzione che sintetizzi in modo opportuno l’andamento del fenomeno studiato. Quando si parla di interpolare si intende determinare, a partire dai dati rilevati, una funzione che rappresenti il fenomeno, mediante una legge matematica o mediante una tabella di valori più regolari. X Y 20 2 40 6 50 5 60 8
  3. 4. Con questa formula si minimizza la somma dei quadrati e non la somma delle semplici differenze fra valori rilevati e valori teorici, poichè le differenze negative potrebbero compensare quelle positive fornendo un risultato non significativo.
  4. 6. <ul><li>Si possono calcolare i coefficienti “a” e “b” della retta di regressione di “y” su “x” </li></ul><ul><li>( y = a + bx ) senza fare uso delle derivate nel modo seguente: </li></ul>a = E(y) – b E(x)
  5. 7. <ul><li>Esempio: </li></ul><ul><li>Sono stati rilevati i seguenti risultati in Economia in una classe con rispettive assenze fino al 12/11/11. </li></ul>Alunno 1 2 3 4 5 6 Risultati (x) 6,5 7,5 11 5,5 6,5 6,5 Assenze (y) 1 0 2 0 2 3
  6. 8. <ul><li>Per determinare la retta di regressione di “y” su “x” si usa la tabella a doppia entrata , in cui 6 è il numero degli alunni presi in considerazione: </li></ul>A questo punto si applicano le formule precedentemente descritte. y/x 0 1 2 3 Totale 5,5 1/6 1/6 6,5 1/6 1/6 1/6 3/6 7,5 1/6 1/6 11 1/6 1/6 Totale 2/6 1/6 2/6 1/6 1
  7. 9. <ul><li>E(xy) = 5,5·2·1/6 + 6,5· 1·1/6 + 6,5·2·1/6 + 6,5·3·1/6 + 7,5·0·1/6 + 11·0·1/6 = 8,3331 </li></ul><ul><li>E(x) = 5,5·1/6 + 6,5·3/6 + 7,5·1/6 + 11·1/6 = 7,2499 </li></ul><ul><li>E(y) = 0·2/6 + 1·1/6 + 2·2/6 + 3·1/6 = 1,3332 </li></ul><ul><li>E(x²) = (5,5)²1/6 + (6,5)²·3/6 + (7,5)²·1/6 + (11)²·1/6 = 55,7082 </li></ul><ul><li>b = -0,4233 </li></ul><ul><li>a = 4,4020 </li></ul><ul><li>y = 4,4020 – 0,4233x </li></ul>
  8. 11. Lo studio della regressione consiste nella determinazione di un coefficiente che esprime la relazione, più o meno intensa, fra le due variabili considerate. Applicando il metodo dei minimi quadrati si ottiene la retta y = a 1 + b 1 x che è detta retta di regressione di Y rispetto ad X. Per misurare l’intensità, o forza del legame, fra le due variabili, nel caso sempre di regressione lineare, si introduce una misura della loro correlazione data dal coefficiente di correlazione lineare di Bravais – Pearson, che può variare da -1 a 1.
  9. 12. Prendiamo ora in considerazione la retta di regressione di X su Y che possiamo scrivere come x = a 2 + b 2 y Soffermiamo ora l’attenzione sui coefficienti b 1 e b 2 . Notiamo come b 1 rappresenti il coefficiente angolare della prima retta di regressione, mentre b 2 non rappresenti il coefficiente angolare della seconda retta di regressione ma il suo reciproco. I due coefficienti b 1 e b 2 possono essere facilmente calcolati con le seguenti formule: Grazie a questi ultimi due coefficienti, possiamo facilmente calcolare r con la formula seguente:
  10. 13. <ul><li>r = -1 </li></ul>La correlazione è detta perfetta inversa e le due rette sono coincidenti e decrescenti. <ul><li>-1 < r < 0 </li></ul>La correlazione è detta negativa inversa e le due rette sono decrescenti ed incidenti. <ul><li>r = 0 </li></ul>Non c’è correlazione e le due rette sono perpendicolari tra loro e sono parallele agli assi cartesiani.
  11. 14. <ul><li>0 < r < 1 </li></ul>La correlazione è positiva o diretta e le due rette sono incidenti e crescenti. <ul><li>r = 1 </li></ul>La correlazione è perfetta diretta e le due rette sono coincidenti e crescenti.
  12. 15. Molto interessante risulta essere anche il quadrato del coefficiente r, detto coefficiente di determinazione , il quale indica la percentuale di variabilità totale dovuta alla dipendenza lineare della y dalla x. Se r 2 si avvicina a 1, il modello di regressione lineare è efficace.

×