SlideShare a Scribd company logo
1 of 28
Download to read offline
Corso di Statistica
Lezioni di sostegno
A.A. 2006-2007
Docente: Dott. Giorgio VACCHIANO
Dip. AgroSelviTer_ Sez. Selvicoltura
giorgio.vacchiano@unito.it
Università degli Studi di Torino
19.2.2008 Statistica – dott. G.Vacchiano 2
Esercizio 1: 007
Per controllare la qualità dell’insegnamento, il preside fa
spiare il professore di statistica in 7 lezioni successive, e
annota quante volte il prof sbaglia una spiegazione:
Lezione I II III IV V VI VII
Errori 3 1 1 0 5 2 0
Sapendo che il prof ogni tanto si sveglia male ( = 1.5),
calcolare il numero minimo e massimo di errori
(distribuiti normalmente) atteso nel 95% dei casi.
Esercizio1:limitifiduciali
19.2.2008 Statistica – dott. G.Vacchiano 3
Esercizio1:limitifiduciali
TEOREMA DEL LIMITE CENTRALE:
La media delle medie campionarie è uno stimatore
esatto della media della popolazione.
Se voglio stimare da UN SOLO campione,
commetterò un errore. La media reale sarà
racchiusa in un intervallo fiduciale (o “di
confidenza”).
Esercizio 1: 007
19.2.2008 Statistica – dott. G.Vacchiano 4
Esercizio1:limitifiduciali
xm= 1.7 errori
p= 0.95
= 0.05
= 1.5
n= 7
Esercizio 1: 007
99%
95%
19.2.2008 Statistica – dott. G.Vacchiano 5
Esercizio1:limitifiduciali
Esercizio 1: 007
x
Z
n
fiduc x Z
n
0.025
1.5
1.7
7
Z
0.6 errori
2.8 errori Limite sup.
Limite inf.
±Z: 2 code (non so se Xm è > o < ).
19.2.2008 Statistica – dott. G.Vacchiano 6
Esercizio 1: 007
Qual è la probabilità che la didattica del prof rispetti
gli standard minimi di facoltà (valore atteso 1±0.5
errori per lezione)?
Esercizio1:limitifiduciali
= 1 errore
= 0.5 errori
Xm= 1.7 errori
Confronto tra media
campionaria
& media di una popolazione
19.2.2008 Statistica – dott. G.Vacchiano 7
Esercizio1:limitifiduciali
Probabilità didattica uguale o
migliore alla media di facoltà
TEST A 1 CODA
Var.Casuale: xm
1.7 1
3.704
0.5
7
calcZ
Esercizio 1: 007
Zcalc
x
Z
n
p = 0.001
19.2.2008 Statistica – dott. G.Vacchiano 8
Il prof ha meno dello 0.1%
di probabilità di soddisfare
gli standard di facoltà
Esercizio 1: 007
Esercizio1:limitifiduciali
19.2.2008 Statistica – dott. G.Vacchiano 9
Esercizio 2: nessuno è perfetto
La ditta ACME fornisce tondini di ferro per cemento armato. Il
tondino è certificato per una resistenza media a trazione di 50
N/mm ( =1.2). In 6 casi di incidente in cui il materiale era stato
usato per realizzare opere di contenimento, il tondino ha ceduto ai
seguenti valori di trazione:
N/cm 470 482 490 517 547 434
Si può affermare che la ACME ha rilasciato una certificazione
truffaldina?
Esercizio2:testdelleipotesi
19.2.2008 Statistica – dott. G.Vacchiano 10
Esercizio 2: nessuno è perfetto.
Problema:
Confronto media campione – media popolazione.
Esercizio2:testdelleipotesi
= 50 N/mm
= 1.2 N/mmm= 49 N/mm
19.2.2008 Statistica – dott. G.Vacchiano 11
Esercizio 2: nessuno è perfetto
Soluzione: Test delle ipotesi
IPOTESI ZERO (nulla):
la media del campione è solo
casualmente minore di quella della
pop. (errore di campionamento).
IPOTESI ALTERNATIVA:
La media del campione è
significativamente minore di quella
della popolazione (truffa in vista!!).
Esercizio2:testdelleipotesi
19.2.2008 Statistica – dott. G.Vacchiano 12
Esercizio 2: nessuno è perfetto.
Regione in cui deve situarsi il campione per essere
significativamente diverso dalla popolazione:
Esercizio2:testdelleipotesi
95% dei casi:
Regione di
“non rifiuto” di H0.
5% dei casi:
Regione di
rifiuto di H0.
95%
NB: la regione di rifiuto può essere
rappresentata da una o due code.
Resistenza media a trazione
19.2.2008 Statistica – dott. G.Vacchiano 13
Esercizio 2: nessuno è perfetto.
Esercizio2:testdelleipotesi
Nulla in statistica (e in
scienza) può mai essere
accettato.
L’obiettivo è falsificare.
19.2.2008 Statistica – dott. G.Vacchiano 14
Esercizio 2: nessuno è perfetto.
Se il verificarsi di quella media campionaria è raro, è probabile che
il campione appartenga ad una popolazione diversa.
Esercizio2:testdelleipotesi
Tondino
certificato
Tondino
truffaldino
“…È più probabile che
la media campionaria
appartenga all’una o
all’altra popolazione?”
19.2.2008 Statistica – dott. G.Vacchiano 15
Esercizio 2: nessuno è perfetto.
1. Confronto i valori-soglia.
Sospetto che il tondino sia più debole, considero quindi solo
una coda.
ptest=0.95
test=0.05
Ztest=-1.645
Esercizio2:testdelleipotesi
p49 50
2.041
1.2
6
calcZ
SE
NB: una sola coda –> la truffa è ragionevole
solo per valori inferiori a quelli certificati
(non superiori!!).
19.2.2008 Statistica – dott. G.Vacchiano 16
Esercizio 2: nessuno è perfetto.
2. Oppure, confronto le probabilità associate
ptest=0.95
calc=0.05
pcalc=0.979
calc=0.021
Esercizio2:testdelleipotesi
p
49 50
2.041
1.2
6
calcZ
19.2.2008 Statistica – dott. G.Vacchiano 17
Esercizio 2: nessuno è perfetto.
LA REGOLA MADRE:
pcalc<ptest: rifiuto H0
|Zcalc|>|Ztab|: rifiuto H0
pcalc>ptest: non rifiuto H0
|Zcalc|<|Ztab|: non rifiuto H0
Esercizio2:testdelleipotesi
Sono stato
truffato!
19.2.2008 Statistica – dott. G.Vacchiano 18
Esercizio3:distribuzionedit
19.2.2008 Statistica – dott. G.Vacchiano 19
Esercizio3:distribuzionedit
19.2.2008 Statistica – dott. G.Vacchiano 20
Esercizio3:distribuzionedit
19.2.2008 Statistica – dott. G.Vacchiano 21
Esercizio3:distribuzionedit
1899: Birraio capo
Guinness Brewery
Dublin (EIRE)
19.2.2008 Statistica – dott. G.Vacchiano 22
Esercizio3:distribuzionedit
IPOTESI NULLA
IPOTESI ALTERNATIVA
x
t
s
n
19.2.2008 Statistica – dott. G.Vacchiano 23
Esercizio3:distribuzionedit
Valori di t
Gradidilibertà significatività
19.2.2008 Statistica – dott. G.Vacchiano 24
Esercizio3:distribuzionedit
Simulazione di esame
19.2.2008 Statistica – dott. G.Vacchiano 25
WOW.
IN QUESTO
COMPITO NON
C’E’ UN ERRORE.
QUALCUNO HA
CAPITO TUTTO!
FINALMENTE !
DA NON CRE…
E’ LA LISTA
DELLE RISPOSTE.
L’HO SCRITTA
IO.
1. Stimare, con α =5%, l’intervallo di confidenza dell’altezza media di una varietà di
pomodoro, attraverso esemplari alti 22, 25, 21, 23, 24, 25, 21 pollici.
La stima dei limiti fiduciali va effettuata attraverso la distribuzione di t, dal momento che la deviazione standard della
popolazione (s) è ignota. La formula per calcolare i limiti fiduciali è simile in tutto a quella utilizzata con Z:
μ = ± t*E.S. + xmedio
dove t: valore tabulato per il livello di errore desiderato e per i GRADI DI LIBERTA’ del campione (n-1) 1
ES: errore standard (deviazione standard della distribuzione delle medie campionarie)= (s/radice[n])
xmedio: stimatore di μ..
Calcolo della deviazione standard campionaria:
x x-xmedio (x-xmedio)2
22 -1 1
25 2 4
21 -2 4
23 0 0
24 1 1
25 2 4
21 -2 4
Media 23
GL 6
SS devianza 18 somma (x-xmedio)2
s2
varianza 3 SS / GL
s dev.st. 1.73 radice (s2
)
ES errore st. 0.65 s /radice(n)
Valore di t tabulato per α = 0.05 e GL = 6: 2.44
Limiteinf = - t*E.S. + xmedio = 21.414 pollici
Limitesup = + t*E.S. + xmedio = 24.586 pollici
L’intervallo fiduciale può essere espresso attraverso i suoi due limiti o come differenza tra questi (=3.172 pollici).
1
Esiste una intera famiglia di distribuzioni t, una per ogni grado di libertà.
3. Da una fornitura di 1000 pali di castagno per viticoltura si estrae un campione di 20
elementi per un controllo della qualità. La densità del legno misurata nei 20 pali è riportata
nella tabella seguente:
id ρ id ρ
1 .681 11 .681
2 .654 12 .654
3 .630 13 .630
4 .460 14 .460
5 .690 15 .690
6 .672 16 .672
7 .693 17 .693
8 .701 18 .701
9 .725 19 .725
10 .697 20 .697
Calcolare i limiti fiduciari della densità media della fornitura di pali con un livello di
confidenza del 95%.
Valore di t tabulato per α =0.05 e GL =19: 2.093
Limiteinf = - t*E.S. + xmedio = 0.626 kg/dm3
Limitesup = + t*E.S. + xmedio = 0.695 kg/dm3
x x-xmedio (x-xmedio)2
0.681 0.0207 0.0004
0.654 -0.0063 0.00004
0.63 -0.0303 0.0009
0.46 -0.2003 0.0401
0.69 0.0297 0.0009
0.672 0.0117 0.0001
0.693 0.0327 0.0011
0.701 0.0407 0.0017
0.725 0.0647 0.0042
0.697 0.0367 0.0013
0.681 0.0207 0.0004
0.654 -0.0063 0.00004
0.63 -0.0303 0.0009
0.46 -0.2003 0.0401
0.69 0.0297 0.0009
0.672 0.0117 0.0001
0.693 0.0327 0.0011
0.701 0.0407 0.0017
0.725 0.0647 0.0042
0.697 0.0367 0.0013
Media 0.6603
GL 19
SS devianza 0.1016 somma (x-xmedio)2
s2
varianza 0.0053 SS / GL
s dev.st. 0.0731 radice (s2
)
ES errore st. 0.0163 s /radice(n)
4. In un vivaio sono coltivate pianticelle di ciliegio per legname di pregio; dopo due mesi dalla
semina questa specie raggiunge un’altezza media di 25 centimetri (σ = 1.7 cm). A causa di un
incidente, su quel terreno sono state disperse sostanze tossiche. Per una verifica dei loro
potenziali effetti negativi sulla crescita delle piantine vengono seminate sul terreno inquinato
7 pianticelle che, controllate dopo 2 mesi, raggiungono un’altezza media di 23 cm. Si può
sostenere che le sostanze tossiche disperse inibiscano la crescita delle piantine?
Per verificare l’ipotesi relativa alla media xmedio di un campione rispetto ad una media attesa μ, si può ricorrere alla
distribuzione normale standardizzata – in questo caso la distribuzione di Z poiché σ è nota. Al fine di verificare che
l’effetto dell’inquinante sia reale e che la variazione di altezza rilevata non sia dovuta solamente al caso
(campionamento effettuato in una coda della distribuzione normale), occorre valutare se la media della popolazione µ
da cui è estratto il campione (ciliegi su terreno inquinato) è statisticamente minore di quella attesa µ0 (piantine di
ciliegio in genere).
IPOTESI NULLA: H0 : xmedio ≥ µ
IPOTESI ALTERNATIVA: H1 : xmedio < µ
Scelgo di effettuare un test A UNA CODA: poiché il testo del problema specifica già qual è la direzione dell’effetto
dell’inquinante (solo negativo) posso considerare solo una parte della distribuzione normale (quella a sinistra poiché
la media del campione è minore di quella della popolazione).2
Se l’ipotesi nulla è vera, le 7 piantine del campione appartengono alla popolazione con media 25 cm e deviazione
standard 1.7; occorre determinare se la probabilità che il campione appartenga a questa popolazione (= area sottesa
alla distribuzione di Z) sia troppo piccola per accettare questa ipotesi.
μ = 25 cm
σ = 1.7 cm
xmedio = 23 cm
n = 7
Z = (xmedio – μ) /ES NB: la distribuzione è sempre delle medie campionarie (tra le medie derivanti da
tutti i possibili campioni di 7 piantine di ciliegio ne scelgo una), quindi occorre
usare ES.
Z = (23-25) / (1.7/ radice[7]) = -3.11 Z CALCOLATO
Z = 1.645 Z TABULATO (livello di confidenza del 95%, si esclude una probabilità del 5% in una coda)
Z = 2.3267 Z TABULATO (livello di confidenza del 99%, calcolo per interpolazione)
I valori di Z tabulati, da considerare negativi poiché sappiamo di essere nella coda sinistra, individuano il limite della
ZONA DI ACCETTAZIONE DELL’IPOTESI NULLA: se Z calcolato cade oltre tale zona, le probabilità associate al
suo dato sono troppo piccole per accettare di trovarsi davanti ad un’unica popolazione, e l’ipotesi nulla pertanto è
rifiutata. L’inquinate ha cioè avuto un effetto ALTAMENTE SIGNIFICATIVO (livello di errore minore di 0.01).
2
Un test è unilaterale o a una coda, quando il ricercatore si chiede se una media è maggiore dell'altra, escludendo a priori che essa possa essere
minore. Un test è bilaterale o a due code, quando il ricercatore si chiede se tra le due medie esista una differenza significativa, senza che egli abbia
indicazioni su quali sia la maggiore o la minore.
ZONA DI RIFIUTO
ZONA DI
ACCETTAZIONE
-2.3267 (test a una coda, coda sx)
ZONA DI RIFIUTO
ZONA DI
ACCETTAZIONE
-1.645 (test a una coda, coda sx)
-3.11 (Z CALCOLATO)
-3.11 (Z CALCOLATO)

More Related Content

More from Giorgio Vacchiano

More from Giorgio Vacchiano (20)

Understanding and modeling masting in European tree species
Understanding and modeling masting in European tree speciesUnderstanding and modeling masting in European tree species
Understanding and modeling masting in European tree species
 
Prescribed burning for forest management in Italy
Prescribed burning for forest management in ItalyPrescribed burning for forest management in Italy
Prescribed burning for forest management in Italy
 
European forests and the bioeconomy
European forests and the bioeconomyEuropean forests and the bioeconomy
European forests and the bioeconomy
 
FVS Training Bolzano 10/9
FVS Training Bolzano 10/9FVS Training Bolzano 10/9
FVS Training Bolzano 10/9
 
FVS Training Bolzano 5/9
FVS Training Bolzano 5/9FVS Training Bolzano 5/9
FVS Training Bolzano 5/9
 
FVS Training Bolzano 7/9
FVS Training Bolzano 7/9FVS Training Bolzano 7/9
FVS Training Bolzano 7/9
 
FVS Training Bolzano 3/9
FVS Training Bolzano 3/9FVS Training Bolzano 3/9
FVS Training Bolzano 3/9
 
FVS Training Bolzano 1/9
FVS Training Bolzano 1/9FVS Training Bolzano 1/9
FVS Training Bolzano 1/9
 
FVS Training Bolzano 6/9
FVS Training Bolzano 6/9FVS Training Bolzano 6/9
FVS Training Bolzano 6/9
 
FVS Training Bolzano 4/9
FVS Training Bolzano 4/9FVS Training Bolzano 4/9
FVS Training Bolzano 4/9
 
FVS Training Bolzano 8/9
FVS Training Bolzano 8/9FVS Training Bolzano 8/9
FVS Training Bolzano 8/9
 
FVS Training Bolzano 2/9
FVS Training Bolzano 2/9FVS Training Bolzano 2/9
FVS Training Bolzano 2/9
 
FVS Training Bolzano 9/9
FVS Training Bolzano 9/9FVS Training Bolzano 9/9
FVS Training Bolzano 9/9
 
Esercitazioni di statistica 10/10
Esercitazioni di statistica 10/10Esercitazioni di statistica 10/10
Esercitazioni di statistica 10/10
 
Esercitazioni di statistica 9/10
Esercitazioni di statistica 9/10Esercitazioni di statistica 9/10
Esercitazioni di statistica 9/10
 
Esercitazioni di statistica 1/10
Esercitazioni di statistica 1/10Esercitazioni di statistica 1/10
Esercitazioni di statistica 1/10
 
Competizione in foresta 2013
Competizione in foresta 2013Competizione in foresta 2013
Competizione in foresta 2013
 
2012 Vacchiano Gorlier
2012 Vacchiano Gorlier 2012 Vacchiano Gorlier
2012 Vacchiano Gorlier
 
Vacchiano 2004 faggio
Vacchiano 2004 faggioVacchiano 2004 faggio
Vacchiano 2004 faggio
 
Vacchiano et al. PS
Vacchiano et al. PSVacchiano et al. PS
Vacchiano et al. PS
 

Recently uploaded

Nicola pisano aaaaaaaaaaaaaaaaaa(1).pptx
Nicola pisano aaaaaaaaaaaaaaaaaa(1).pptxNicola pisano aaaaaaaaaaaaaaaaaa(1).pptx
Nicola pisano aaaaaaaaaaaaaaaaaa(1).pptx
lorenzodemidio01
 
Scienza Potere Puntoaaaaaaaaaaaaaaa.pptx
Scienza Potere Puntoaaaaaaaaaaaaaaa.pptxScienza Potere Puntoaaaaaaaaaaaaaaa.pptx
Scienza Potere Puntoaaaaaaaaaaaaaaa.pptx
lorenzodemidio01
 
Presentazione tre geni della tecnologia informatica
Presentazione tre geni della tecnologia informaticaPresentazione tre geni della tecnologia informatica
Presentazione tre geni della tecnologia informatica
nico07fusco
 
Adducchio.Samuel-Steve_Jobs.ppppppppppptx
Adducchio.Samuel-Steve_Jobs.ppppppppppptxAdducchio.Samuel-Steve_Jobs.ppppppppppptx
Adducchio.Samuel-Steve_Jobs.ppppppppppptx
sasaselvatico
 
case passive_GiorgiaDeAscaniis.pptx.....
case passive_GiorgiaDeAscaniis.pptx.....case passive_GiorgiaDeAscaniis.pptx.....
case passive_GiorgiaDeAscaniis.pptx.....
giorgiadeascaniis59
 

Recently uploaded (20)

Scrittura seo e scrittura accessibile
Scrittura seo e scrittura accessibileScrittura seo e scrittura accessibile
Scrittura seo e scrittura accessibile
 
Storia-CarloMagno-TeccarelliLorenzo.pptx
Storia-CarloMagno-TeccarelliLorenzo.pptxStoria-CarloMagno-TeccarelliLorenzo.pptx
Storia-CarloMagno-TeccarelliLorenzo.pptx
 
Esame di Stato 2024 - Materiale conferenza online 09 aprile 2024
Esame di Stato 2024 - Materiale conferenza online 09 aprile 2024Esame di Stato 2024 - Materiale conferenza online 09 aprile 2024
Esame di Stato 2024 - Materiale conferenza online 09 aprile 2024
 
Nicola pisano aaaaaaaaaaaaaaaaaa(1).pptx
Nicola pisano aaaaaaaaaaaaaaaaaa(1).pptxNicola pisano aaaaaaaaaaaaaaaaaa(1).pptx
Nicola pisano aaaaaaaaaaaaaaaaaa(1).pptx
 
Oppressi_oppressori.pptx................
Oppressi_oppressori.pptx................Oppressi_oppressori.pptx................
Oppressi_oppressori.pptx................
 
discorso generale sulla fisica e le discipline.pptx
discorso generale sulla fisica e le discipline.pptxdiscorso generale sulla fisica e le discipline.pptx
discorso generale sulla fisica e le discipline.pptx
 
Presentazioni Efficaci e lezioni di Educazione Civica
Presentazioni Efficaci e lezioni di Educazione CivicaPresentazioni Efficaci e lezioni di Educazione Civica
Presentazioni Efficaci e lezioni di Educazione Civica
 
descrizioni della antica civiltà dei sumeri.pptx
descrizioni della antica civiltà dei sumeri.pptxdescrizioni della antica civiltà dei sumeri.pptx
descrizioni della antica civiltà dei sumeri.pptx
 
Scienza Potere Puntoaaaaaaaaaaaaaaa.pptx
Scienza Potere Puntoaaaaaaaaaaaaaaa.pptxScienza Potere Puntoaaaaaaaaaaaaaaa.pptx
Scienza Potere Puntoaaaaaaaaaaaaaaa.pptx
 
Tosone Christian_Steve Jobsaaaaaaaa.pptx
Tosone Christian_Steve Jobsaaaaaaaa.pptxTosone Christian_Steve Jobsaaaaaaaa.pptx
Tosone Christian_Steve Jobsaaaaaaaa.pptx
 
Presentazione tre geni della tecnologia informatica
Presentazione tre geni della tecnologia informaticaPresentazione tre geni della tecnologia informatica
Presentazione tre geni della tecnologia informatica
 
Adducchio.Samuel-Steve_Jobs.ppppppppppptx
Adducchio.Samuel-Steve_Jobs.ppppppppppptxAdducchio.Samuel-Steve_Jobs.ppppppppppptx
Adducchio.Samuel-Steve_Jobs.ppppppppppptx
 
LE ALGHE.pptx ..........................
LE ALGHE.pptx ..........................LE ALGHE.pptx ..........................
LE ALGHE.pptx ..........................
 
case passive_GiorgiaDeAscaniis.pptx.....
case passive_GiorgiaDeAscaniis.pptx.....case passive_GiorgiaDeAscaniis.pptx.....
case passive_GiorgiaDeAscaniis.pptx.....
 
ProgettoDiEducazioneCivicaDefinitivo_Christian Tosone.pptx
ProgettoDiEducazioneCivicaDefinitivo_Christian Tosone.pptxProgettoDiEducazioneCivicaDefinitivo_Christian Tosone.pptx
ProgettoDiEducazioneCivicaDefinitivo_Christian Tosone.pptx
 
Aristotele, vita e opere e fisica...pptx
Aristotele, vita e opere e fisica...pptxAristotele, vita e opere e fisica...pptx
Aristotele, vita e opere e fisica...pptx
 
Una breve introduzione ad Elsa Morante, vita e opere
Una breve introduzione ad Elsa Morante, vita e opereUna breve introduzione ad Elsa Morante, vita e opere
Una breve introduzione ad Elsa Morante, vita e opere
 
Quadrilateri e isometrie studente di liceo
Quadrilateri e isometrie studente di liceoQuadrilateri e isometrie studente di liceo
Quadrilateri e isometrie studente di liceo
 
Descrizione Piccolo teorema di Talete.pptx
Descrizione Piccolo teorema di Talete.pptxDescrizione Piccolo teorema di Talete.pptx
Descrizione Piccolo teorema di Talete.pptx
 
CHIẾN THẮNG KÌ THI TUYỂN SINH VÀO LỚP 10 THPT MÔN NGỮ VĂN - PHAN THẾ HOÀI (36...
CHIẾN THẮNG KÌ THI TUYỂN SINH VÀO LỚP 10 THPT MÔN NGỮ VĂN - PHAN THẾ HOÀI (36...CHIẾN THẮNG KÌ THI TUYỂN SINH VÀO LỚP 10 THPT MÔN NGỮ VĂN - PHAN THẾ HOÀI (36...
CHIẾN THẮNG KÌ THI TUYỂN SINH VÀO LỚP 10 THPT MÔN NGỮ VĂN - PHAN THẾ HOÀI (36...
 

Esercitazioni di statistica 8/10

  • 1. Corso di Statistica Lezioni di sostegno A.A. 2006-2007 Docente: Dott. Giorgio VACCHIANO Dip. AgroSelviTer_ Sez. Selvicoltura giorgio.vacchiano@unito.it Università degli Studi di Torino
  • 2. 19.2.2008 Statistica – dott. G.Vacchiano 2 Esercizio 1: 007 Per controllare la qualità dell’insegnamento, il preside fa spiare il professore di statistica in 7 lezioni successive, e annota quante volte il prof sbaglia una spiegazione: Lezione I II III IV V VI VII Errori 3 1 1 0 5 2 0 Sapendo che il prof ogni tanto si sveglia male ( = 1.5), calcolare il numero minimo e massimo di errori (distribuiti normalmente) atteso nel 95% dei casi. Esercizio1:limitifiduciali
  • 3. 19.2.2008 Statistica – dott. G.Vacchiano 3 Esercizio1:limitifiduciali TEOREMA DEL LIMITE CENTRALE: La media delle medie campionarie è uno stimatore esatto della media della popolazione. Se voglio stimare da UN SOLO campione, commetterò un errore. La media reale sarà racchiusa in un intervallo fiduciale (o “di confidenza”). Esercizio 1: 007
  • 4. 19.2.2008 Statistica – dott. G.Vacchiano 4 Esercizio1:limitifiduciali xm= 1.7 errori p= 0.95 = 0.05 = 1.5 n= 7 Esercizio 1: 007 99% 95%
  • 5. 19.2.2008 Statistica – dott. G.Vacchiano 5 Esercizio1:limitifiduciali Esercizio 1: 007 x Z n fiduc x Z n 0.025 1.5 1.7 7 Z 0.6 errori 2.8 errori Limite sup. Limite inf. ±Z: 2 code (non so se Xm è > o < ).
  • 6. 19.2.2008 Statistica – dott. G.Vacchiano 6 Esercizio 1: 007 Qual è la probabilità che la didattica del prof rispetti gli standard minimi di facoltà (valore atteso 1±0.5 errori per lezione)? Esercizio1:limitifiduciali = 1 errore = 0.5 errori Xm= 1.7 errori Confronto tra media campionaria & media di una popolazione
  • 7. 19.2.2008 Statistica – dott. G.Vacchiano 7 Esercizio1:limitifiduciali Probabilità didattica uguale o migliore alla media di facoltà TEST A 1 CODA Var.Casuale: xm 1.7 1 3.704 0.5 7 calcZ Esercizio 1: 007 Zcalc x Z n p = 0.001
  • 8. 19.2.2008 Statistica – dott. G.Vacchiano 8 Il prof ha meno dello 0.1% di probabilità di soddisfare gli standard di facoltà Esercizio 1: 007 Esercizio1:limitifiduciali
  • 9. 19.2.2008 Statistica – dott. G.Vacchiano 9 Esercizio 2: nessuno è perfetto La ditta ACME fornisce tondini di ferro per cemento armato. Il tondino è certificato per una resistenza media a trazione di 50 N/mm ( =1.2). In 6 casi di incidente in cui il materiale era stato usato per realizzare opere di contenimento, il tondino ha ceduto ai seguenti valori di trazione: N/cm 470 482 490 517 547 434 Si può affermare che la ACME ha rilasciato una certificazione truffaldina? Esercizio2:testdelleipotesi
  • 10. 19.2.2008 Statistica – dott. G.Vacchiano 10 Esercizio 2: nessuno è perfetto. Problema: Confronto media campione – media popolazione. Esercizio2:testdelleipotesi = 50 N/mm = 1.2 N/mmm= 49 N/mm
  • 11. 19.2.2008 Statistica – dott. G.Vacchiano 11 Esercizio 2: nessuno è perfetto Soluzione: Test delle ipotesi IPOTESI ZERO (nulla): la media del campione è solo casualmente minore di quella della pop. (errore di campionamento). IPOTESI ALTERNATIVA: La media del campione è significativamente minore di quella della popolazione (truffa in vista!!). Esercizio2:testdelleipotesi
  • 12. 19.2.2008 Statistica – dott. G.Vacchiano 12 Esercizio 2: nessuno è perfetto. Regione in cui deve situarsi il campione per essere significativamente diverso dalla popolazione: Esercizio2:testdelleipotesi 95% dei casi: Regione di “non rifiuto” di H0. 5% dei casi: Regione di rifiuto di H0. 95% NB: la regione di rifiuto può essere rappresentata da una o due code. Resistenza media a trazione
  • 13. 19.2.2008 Statistica – dott. G.Vacchiano 13 Esercizio 2: nessuno è perfetto. Esercizio2:testdelleipotesi Nulla in statistica (e in scienza) può mai essere accettato. L’obiettivo è falsificare.
  • 14. 19.2.2008 Statistica – dott. G.Vacchiano 14 Esercizio 2: nessuno è perfetto. Se il verificarsi di quella media campionaria è raro, è probabile che il campione appartenga ad una popolazione diversa. Esercizio2:testdelleipotesi Tondino certificato Tondino truffaldino “…È più probabile che la media campionaria appartenga all’una o all’altra popolazione?”
  • 15. 19.2.2008 Statistica – dott. G.Vacchiano 15 Esercizio 2: nessuno è perfetto. 1. Confronto i valori-soglia. Sospetto che il tondino sia più debole, considero quindi solo una coda. ptest=0.95 test=0.05 Ztest=-1.645 Esercizio2:testdelleipotesi p49 50 2.041 1.2 6 calcZ SE NB: una sola coda –> la truffa è ragionevole solo per valori inferiori a quelli certificati (non superiori!!).
  • 16. 19.2.2008 Statistica – dott. G.Vacchiano 16 Esercizio 2: nessuno è perfetto. 2. Oppure, confronto le probabilità associate ptest=0.95 calc=0.05 pcalc=0.979 calc=0.021 Esercizio2:testdelleipotesi p 49 50 2.041 1.2 6 calcZ
  • 17. 19.2.2008 Statistica – dott. G.Vacchiano 17 Esercizio 2: nessuno è perfetto. LA REGOLA MADRE: pcalc<ptest: rifiuto H0 |Zcalc|>|Ztab|: rifiuto H0 pcalc>ptest: non rifiuto H0 |Zcalc|<|Ztab|: non rifiuto H0 Esercizio2:testdelleipotesi Sono stato truffato!
  • 18. 19.2.2008 Statistica – dott. G.Vacchiano 18 Esercizio3:distribuzionedit
  • 19. 19.2.2008 Statistica – dott. G.Vacchiano 19 Esercizio3:distribuzionedit
  • 20. 19.2.2008 Statistica – dott. G.Vacchiano 20 Esercizio3:distribuzionedit
  • 21. 19.2.2008 Statistica – dott. G.Vacchiano 21 Esercizio3:distribuzionedit 1899: Birraio capo Guinness Brewery Dublin (EIRE)
  • 22. 19.2.2008 Statistica – dott. G.Vacchiano 22 Esercizio3:distribuzionedit IPOTESI NULLA IPOTESI ALTERNATIVA x t s n
  • 23. 19.2.2008 Statistica – dott. G.Vacchiano 23 Esercizio3:distribuzionedit Valori di t Gradidilibertà significatività
  • 24. 19.2.2008 Statistica – dott. G.Vacchiano 24 Esercizio3:distribuzionedit
  • 25. Simulazione di esame 19.2.2008 Statistica – dott. G.Vacchiano 25 WOW. IN QUESTO COMPITO NON C’E’ UN ERRORE. QUALCUNO HA CAPITO TUTTO! FINALMENTE ! DA NON CRE… E’ LA LISTA DELLE RISPOSTE. L’HO SCRITTA IO.
  • 26. 1. Stimare, con α =5%, l’intervallo di confidenza dell’altezza media di una varietà di pomodoro, attraverso esemplari alti 22, 25, 21, 23, 24, 25, 21 pollici. La stima dei limiti fiduciali va effettuata attraverso la distribuzione di t, dal momento che la deviazione standard della popolazione (s) è ignota. La formula per calcolare i limiti fiduciali è simile in tutto a quella utilizzata con Z: μ = ± t*E.S. + xmedio dove t: valore tabulato per il livello di errore desiderato e per i GRADI DI LIBERTA’ del campione (n-1) 1 ES: errore standard (deviazione standard della distribuzione delle medie campionarie)= (s/radice[n]) xmedio: stimatore di μ.. Calcolo della deviazione standard campionaria: x x-xmedio (x-xmedio)2 22 -1 1 25 2 4 21 -2 4 23 0 0 24 1 1 25 2 4 21 -2 4 Media 23 GL 6 SS devianza 18 somma (x-xmedio)2 s2 varianza 3 SS / GL s dev.st. 1.73 radice (s2 ) ES errore st. 0.65 s /radice(n) Valore di t tabulato per α = 0.05 e GL = 6: 2.44 Limiteinf = - t*E.S. + xmedio = 21.414 pollici Limitesup = + t*E.S. + xmedio = 24.586 pollici L’intervallo fiduciale può essere espresso attraverso i suoi due limiti o come differenza tra questi (=3.172 pollici). 1 Esiste una intera famiglia di distribuzioni t, una per ogni grado di libertà.
  • 27. 3. Da una fornitura di 1000 pali di castagno per viticoltura si estrae un campione di 20 elementi per un controllo della qualità. La densità del legno misurata nei 20 pali è riportata nella tabella seguente: id ρ id ρ 1 .681 11 .681 2 .654 12 .654 3 .630 13 .630 4 .460 14 .460 5 .690 15 .690 6 .672 16 .672 7 .693 17 .693 8 .701 18 .701 9 .725 19 .725 10 .697 20 .697 Calcolare i limiti fiduciari della densità media della fornitura di pali con un livello di confidenza del 95%. Valore di t tabulato per α =0.05 e GL =19: 2.093 Limiteinf = - t*E.S. + xmedio = 0.626 kg/dm3 Limitesup = + t*E.S. + xmedio = 0.695 kg/dm3 x x-xmedio (x-xmedio)2 0.681 0.0207 0.0004 0.654 -0.0063 0.00004 0.63 -0.0303 0.0009 0.46 -0.2003 0.0401 0.69 0.0297 0.0009 0.672 0.0117 0.0001 0.693 0.0327 0.0011 0.701 0.0407 0.0017 0.725 0.0647 0.0042 0.697 0.0367 0.0013 0.681 0.0207 0.0004 0.654 -0.0063 0.00004 0.63 -0.0303 0.0009 0.46 -0.2003 0.0401 0.69 0.0297 0.0009 0.672 0.0117 0.0001 0.693 0.0327 0.0011 0.701 0.0407 0.0017 0.725 0.0647 0.0042 0.697 0.0367 0.0013 Media 0.6603 GL 19 SS devianza 0.1016 somma (x-xmedio)2 s2 varianza 0.0053 SS / GL s dev.st. 0.0731 radice (s2 ) ES errore st. 0.0163 s /radice(n)
  • 28. 4. In un vivaio sono coltivate pianticelle di ciliegio per legname di pregio; dopo due mesi dalla semina questa specie raggiunge un’altezza media di 25 centimetri (σ = 1.7 cm). A causa di un incidente, su quel terreno sono state disperse sostanze tossiche. Per una verifica dei loro potenziali effetti negativi sulla crescita delle piantine vengono seminate sul terreno inquinato 7 pianticelle che, controllate dopo 2 mesi, raggiungono un’altezza media di 23 cm. Si può sostenere che le sostanze tossiche disperse inibiscano la crescita delle piantine? Per verificare l’ipotesi relativa alla media xmedio di un campione rispetto ad una media attesa μ, si può ricorrere alla distribuzione normale standardizzata – in questo caso la distribuzione di Z poiché σ è nota. Al fine di verificare che l’effetto dell’inquinante sia reale e che la variazione di altezza rilevata non sia dovuta solamente al caso (campionamento effettuato in una coda della distribuzione normale), occorre valutare se la media della popolazione µ da cui è estratto il campione (ciliegi su terreno inquinato) è statisticamente minore di quella attesa µ0 (piantine di ciliegio in genere). IPOTESI NULLA: H0 : xmedio ≥ µ IPOTESI ALTERNATIVA: H1 : xmedio < µ Scelgo di effettuare un test A UNA CODA: poiché il testo del problema specifica già qual è la direzione dell’effetto dell’inquinante (solo negativo) posso considerare solo una parte della distribuzione normale (quella a sinistra poiché la media del campione è minore di quella della popolazione).2 Se l’ipotesi nulla è vera, le 7 piantine del campione appartengono alla popolazione con media 25 cm e deviazione standard 1.7; occorre determinare se la probabilità che il campione appartenga a questa popolazione (= area sottesa alla distribuzione di Z) sia troppo piccola per accettare questa ipotesi. μ = 25 cm σ = 1.7 cm xmedio = 23 cm n = 7 Z = (xmedio – μ) /ES NB: la distribuzione è sempre delle medie campionarie (tra le medie derivanti da tutti i possibili campioni di 7 piantine di ciliegio ne scelgo una), quindi occorre usare ES. Z = (23-25) / (1.7/ radice[7]) = -3.11 Z CALCOLATO Z = 1.645 Z TABULATO (livello di confidenza del 95%, si esclude una probabilità del 5% in una coda) Z = 2.3267 Z TABULATO (livello di confidenza del 99%, calcolo per interpolazione) I valori di Z tabulati, da considerare negativi poiché sappiamo di essere nella coda sinistra, individuano il limite della ZONA DI ACCETTAZIONE DELL’IPOTESI NULLA: se Z calcolato cade oltre tale zona, le probabilità associate al suo dato sono troppo piccole per accettare di trovarsi davanti ad un’unica popolazione, e l’ipotesi nulla pertanto è rifiutata. L’inquinate ha cioè avuto un effetto ALTAMENTE SIGNIFICATIVO (livello di errore minore di 0.01). 2 Un test è unilaterale o a una coda, quando il ricercatore si chiede se una media è maggiore dell'altra, escludendo a priori che essa possa essere minore. Un test è bilaterale o a due code, quando il ricercatore si chiede se tra le due medie esista una differenza significativa, senza che egli abbia indicazioni su quali sia la maggiore o la minore. ZONA DI RIFIUTO ZONA DI ACCETTAZIONE -2.3267 (test a una coda, coda sx) ZONA DI RIFIUTO ZONA DI ACCETTAZIONE -1.645 (test a una coda, coda sx) -3.11 (Z CALCOLATO) -3.11 (Z CALCOLATO)