L’InterpolazioneNell’esame di fenomeni di qualsiasi natura si cerca di esprimere, sia medianterelazioni matematiche, sia m...
Nell’interpolazione matematica la funzione interpolante cercata passa per i valori xi , yi    mentre nell’interpolazione...
che sia minima la somma dei quadrati delle differenze fra i valori osservati yi ed i                             n        ...
Funzione interpolante: la rettaApplichiamo il metodo dei minimi quadrati nel caso in cui come funzioneinterpolante venga s...
Compilo la tabella  n                             x           y              xy        x^2          f(x)       y-f(x)     ...
L’interpolazione per punti notiLo scopo è quello di determinare una funzione che passa esattamente per tutti ipunti del di...
Upcoming SlideShare
Loading in …5
×

01 interpolazione e-minimi_quadrati

3,627 views

Published on

Published in: Investor Relations
  • Be the first to comment

  • Be the first to like this

01 interpolazione e-minimi_quadrati

  1. 1. L’InterpolazioneNell’esame di fenomeni di qualsiasi natura si cerca di esprimere, sia medianterelazioni matematiche, sia mediante specifici indici, i legami rilevati, o ipotizzati, frale grandezze che interagiscono nei fenomeni stessi. Nello studio dei legami fra duevariabili statistiche, partendo da un insieme di coppie  xi , yi  di dati rilevati, sidetermina, se possibile, una funzione y  f  x  che rappresenti il fenomeno.Vari sono gli scopi della ricerca di tale funzione; fra essi ricordiamo:- descrivere sinteticamente la relazione fra due variabili osservate;- determinare la legge di distribuzione dei dati statistici;- ricavare eventuali dati intermedi mancanti;- correggere valori affetti da errori accidentali o perturbati da cause secondarie. Pertrovare una funzione che rappresenti il fenomeno si può procedere in due modi:- determinare una funzione che assuma esattamente i valori  xi , yi  rilevati; questoprocedimento viene detto interpolazione per punti noti, o interpolazionematematica;- determinare una funzione il cui grafico “si accosti” il più possibile ai punti deldiagramma a dispersione; questo procedimento viene detto interpolazione (operequazione) fra punti noti, o interpolazione statistica.In Statistica, al contrario di quanto accade in Matematica, scegliendo una funzionepolinomiale che sia soddisfatta da tutte le coppie assegnate di valori, essendo ilnumero delle coppie di valori piuttosto elevato, risulterebbe tanto complessa dadeterminare, quanto di scarsa utilità.Per tale motivo nelle applicazioni statistiche si preferisce cercare una funzione ilcui grafico “si avvicini” al grafico rappresentativo delle coppie di valori rilevati. Ilprocedimento che trattiamo utilizza il metodo dei minimi quadrati che illustriamo. INTERPOLAZIONE INTERPOLAZIONE MATEMATICA STATISTICA 1
  2. 2. Nell’interpolazione matematica la funzione interpolante cercata passa per i valori xi , yi  mentre nell’interpolazione statistica la funzione interpolante cercatapassa tra i valori  xi , yi  .Per ora dedichiamoci all’interpolazione statistica e cerchiamo un metodo con cuiricavare la funzione che passa tra i valori  xi , yi  noti.Metodo dei minimi quadratiSi considerino due variabili X ed Y sulle quali sono effettuate n rilevazioniespresse dalle coppie:  x1 , y1  ,  x2 , y2  , …,  xn , yn  .Si presentano due problemi:- scegliere il tipo di funzione che si ritiene esprima meglio la relazione tra X ed Y ;- determinare i parametri della funzione scelta.Tale funzione è detta funzione interpolante.Per quanto riguarda la scelta della funzione interpolante, non esistono criterigenerali validi per ogni caso e si possono solo dare delle indicazioni. La sceltadella funzione dipende da un’eventuale relazione tra le variabili riscontratadall’osservazione dei valori assunti dalle stesse. Ad esempio, se gli incrementi deivalori di Y , per incrementi costanti di X , sono quasi costanti, la curva che megliorappresenta il fenomeno è la retta. Se invece il confronto tra i valori osservatipresenta caratteristiche diverse, allora la curva che meglio rappresenta ilfenomeno deve in generale avere le stesse caratteristiche. La scelta della funzionedipende anche dallo scopo per cui si fa la ricerca. Ad esempio, se lo scopo èpuramente descrittivo del fenomeno, allora si cercherà una funzione semplice. Seinvece lo scopo è investigativo, ossia se si vuole ricavare la legge, o un modellomatematico del fenomeno, allora la funzione sarà più complessa.Indichiamo con yi i valori teorici sulla curva corrispondenti ai valori xi rilevati. ˆSostituendo ai valori yi rilevati i valori yi teorici, si commettono errori dati dalla ˆdifferenza: di  yi  yi che possono essere positivi, negativi o nulli. ˆOccorre minimizzare questi errori, ma non è corretto minimizzare la somma delledi , in quanto gli errori positivi potrebbero compensare quelli negativi.Il criterio corretto per ottenere un buon accostamento è quello di minimizzare lasomma dei quadrati delle di , precisamente: la condizione di accostamento datadal metodo dei minimi quadrati è: determinare la funzione interpolante in modo 2
  3. 3. che sia minima la somma dei quadrati delle differenze fra i valori osservati yi ed i n   yi  yi  2valori teorici yi , cioè ˆ ˆ . i 1Ricavata la funzione che si ritiene più rappresentativa della distribuzione, bisognaverificare che i valori teorici approssimino i valori empirici, ossia che il grado diaccostamento sia accettabile.A questo scopo si calcolano, per prima cosa, le differenze di  yi  yi che ˆdovranno essere, il più possibile, di segni alternati; quindi si calcolano gli indici diaccostamento.Gli indici di accostamento più usati sono l’indice lineare relativo I1 e l’indicequadratico relativo I 2 aventi le seguenti espressioni:   yi  yi  2 ˆ I1   yi  yi ˆ I2  n .  yiˆ  yi ˆ nFra i due indici è preferibile il secondo poiché il metodo dei minimi quadrati operasui quadrati delle differenze. I valori ottenuti vanno considerati in relazione alfenomeno; comunque, in linea di massima, per avere un buon accostamentonon devono superare il valore 0,1 (in certi casi non devono superare 0,01);ovviamente, tanto più piccoli sono i valori di I1 e di I 2 , tanto migliore èl’accostamento. Se lo scopo della ricerca della funzione è quello di avere unmodello matematico del fenomeno, attualmente è stato introdotto un indice dettocoefficiente di determinazione che tiene conto dello scarto quadratico medio deivalori yi e indicata con y  yi nla media aritmetica dei valori yi , il coefficiente di determinazione ha la seguenteespressione:   yi  yi  2 ˆ   1 .   yi  y  2Quanto più  è “vicino” ad 1, tanto più il modello rappresenta bene il fenomeno. 3
  4. 4. Funzione interpolante: la rettaApplichiamo il metodo dei minimi quadrati nel caso in cui come funzioneinterpolante venga scelta la retta.La funzione scelta è una funzione di primo grado in x ed y , avente quindiun’espressione del tipo: y  ax  b ,con a e b parametri reali. nImponendo che sia minima la funzione f  a, b     yi  a  bxi  . 2 i 1Sfruttando il calcolo delle derivate parziali per ottenere la condizione di minimo siottiene: a  xi  yi  n xi yi b  xi  xi yi   yi  xi 2   xi   n xi 2   xi   n xi 2 2 2da cui la funzione interpolante è y  xi  yi  n xi yi x   xi  xi yi   yi  xi 2 .   xi   n xi 2   xi   n xi 2 2 2Osservazione: si può dimostrare che la retta interpolante passa per il baricentrodella distribuzione ossia per il punto  x , y  , dove x e y sono le medie aritmetichedi xi e yi .Un esempio guida:Il consumo pro capite di pesce in chilogrammi è stato Anni kg 1971 10,34 1972 10,56 1973 9,9 1974 9,68 1975 10,01 1976 10,56 1977 10,12 1978 10,78 1979 11 1980 12,1 4
  5. 5. Compilo la tabella n x y xy x^2 f(x) y-f(x) (y-f(x)^2 1 1971 10,34 20380,14 3884841 9,82 0,52 0,27 2 1972 10,56 20824,32 3888784 9,97 0,59 0,35 3 1973 9,9 19532,7 3892729 10,12 -0,22 0,05 4 1974 9,68 19108,32 3896676 10,28 -0,60 0,36 5 1975 10,01 19769,75 3900625 10,43 -0,42 0,18 6 1976 10,56 20866,56 3904576 10,58 -0,02 0,00 7 1977 10,12 20007,24 3908529 10,73 -0,61 0,38 8 1978 10,78 21322,84 3912484 10,89 -0,11 0,01 9 1979 11 21769 3916441 11,04 -0,04 0,00 10 1980 12,1 23958 3920400 11,19 0,91 0,82ottengo n 10 Σx 19755 Σy 105,05 Σxy 207538,87 (Σx)^2 390260025 Σx^2 39026085 Σ(y-f(x)) 0,00Σ(y-f(x))^2 2,42 Σf(x) 105,05da cui la retta di regressione è y  0,153 x  291, 088 .L’indice quadratico relativo è I  0, 047 minore di 0,1 quindi la retta trovata fornisceuna buona interpolazione.Rappresentando graficamente si ottiene: 12,5 12 11,5 kg pesce pro capite 11 10,5 10 9,5 9 8,5 8 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 anniNOTA: in molti casi è possibile sostituire i valori della X con 1,2,3,4,….ottenendouna semplificazione. 5
  6. 6. L’interpolazione per punti notiLo scopo è quello di determinare una funzione che passa esattamente per tutti ipunti del diagramma a dispersione. In questo caso si parla di interpolazionematematica.Si può dimostrare che per determinare la funzione che passa per le n coppie xi , yi  si può usare il polinomio di interpolazione di Lagrange:y  x  x2   x  x3  .......  x  xn  y   x  x2   x  x3  .......  x  xn  y  ...   x  x1  x  x2  .......  x  xn 1  y  x1  x2   x1  x3  .......  x1  xn  1  x2  x1   x2  x3  .......  x2  xn  2  xn  x1  xn  x2  .......  xn  xn 1  n 6

×