1. Corso di Statistica
Lezioni di sostegno
A.A. 2006-2007
Docente: Dott. Giorgio VACCHIANO
Dip. AgroSelviTer_ Sez. Selvicoltura
giorgio.vacchiano@unito.it
Università degli Studi di Torino
2. Normalità dei dati
“Le variabili distribuite normalmente sono
estremamente rare” (???)
Campionamento
Errori di misurazione e registrazione dei dati
Dati aberranti
Caratteristiche della variabile
18.2.2008 Statistica – dott. G.Vacchiano 2
3. Normalità dei dati
Per individuare gli outlier:
1. Esame visivo
2. Rappresentazione grafica (BOXPLOT)
3. Test delle ipotesi (es. Grubbs)
18.2.2008 Statistica – dott. G.Vacchiano 3
4. Normalità dei dati
Rimuovere i dati
aberranti è “auspicabile,
onesto e importante” (Jude
& McClelland, 1989).
… ma non tutti sono
d’accordo. Perché?
18.2.2008 Statistica – dott. G.Vacchiano 4
5. Normalità dei dati
In alternativa è possibile applicare una trasformazione,
cioè una operazione matematica applicata a tutti i
valori della distribuzione.
18.2.2008 Statistica – dott. G.Vacchiano 5
Distribuzione
normale
6. Normalità dei dati
Xt = rad(x+c)
Xt = Log(x)
Xt = -x+c
18.2.2008 Statistica – dott. G.Vacchiano 6
Potenza
7. Asner et al. 2003
Global synthesis of leaf
area index observations
“Following a statistical outlier
analysis (IRQ), global mean
(±sd) LAI decreased from 5.2
(4.1) to 4.5 (2.5).”
18.2.2008 Statistica – dott. G.Vacchiano 7
8. Plantamura et al. 2004
Densità del cinghiale e selezione dell’habitat
Trasformazione dal formato
continuo a categorico (es. quota)
Eliminazione outlier (> |3 sd|)
Verifica della normalità:
test di Kolmogorov-Smirnov
Trasformazione logaritmica
(Log10)
18.2.2008 Statistica – dott. G.Vacchiano 8
9. 18.2.2008 Statistica – dott. G.Vacchiano 9
Esercizio 1: Roma per toma
Il peso di 3000 forme di formaggio è distribuito normalmente con
media =25 kg e deviazione standard =2.2 kg.
In seguito all’esame su 20 forme ripetuto su 100
campioni diversi, calcolare:
I. Media e deviazione standard della distribuzione della
media campionaria;
II.In quanti campioni ci si deve aspettare che la media sia
compresa tra 25.5 e 26 kg.
Esercizio1:Limitecentrale
10. 18.2.2008 Statistica – dott. G.Vacchiano 10
Esercizio1:Limitecentrale
N= 3000 numerosità popolazione
m= 25 media pop.
s= 2.2 dev.st.pop.
TEOREMA DEL LIMITE CENTRALE:
Se estraggo i volte un campione di n elementi da
una popolazione N e ne faccio ogni volta la media
xn, ottengo una distribuzione normale con:
Mediai = m (media reale della pop.)
Dev.st.i = Errore standard (campione)
Esercizio 1: Roma per toma
11. 18.2.2008 Statistica – dott. G.Vacchiano 11
Esercizio1:Limitecentrale
Esercizio 1: Roma per toma
Estraggo la media da n
campioni, selezionati a
caso dalla popolazione
originaria.
Più campioni estraggo, più
la media delle medie
approssima la media vera.
La distribuzione delle
medie campionarie è
normale.
12. 18.2.2008 Statistica – dott. G.Vacchiano 12
Esercizio1:Limitecentrale
I. DISTRIBUZIONE NORMALE:
VC: peso medio di ciascuno dei possibili campioni (100
in questo problema, ma sono sufficienti) di n=20
elementi della popolazione di N=3000 forme.
m = 25 kg
2.2
0.49 kg
20
SE
n
s
Esercizio 1: Roma per toma
13. 18.2.2008 Statistica – dott. G.Vacchiano 13
Esercizio1:Limitecentrale
Esercizio 1: Roma per toma
m= 25 kg
s= 0.49 kg
II. Prob. associata ad un peso compreso tra 25.5 e 26 kg:
14. 18.2.2008 Statistica – dott. G.Vacchiano 14
Esercizio1:Limitecentrale
Esercizio 1: Roma per toma
15. 18.2.2008 Statistica – dott. G.Vacchiano 15
Esercizio1:Limitecentrale
Esercizio 1: Roma per toma
Le aree sono proporzionali!
16. 18.2.2008 Statistica – dott. G.Vacchiano 16
1. Standardizzazione valori estremi
Esercizio1:Limitecentrale
Esercizio 1: Roma per toma
25.5 25
1.020
0.49
Z
26 25
2.04
0.49
Z
SE SE
m= 0 S.U.
s= 1 S.U.
17. 18.2.2008 Statistica – dott. G.Vacchiano 17
2. Probabilità associate (tabella Z)
Esercizio1:Limitecentrale
Esercizio 1: Roma per toma
m= 0 S.U.
s= 1 S.U.
1
1 0.1538
z
p
2
2 0.0207
z
p
18. 18.2.2008 Statistica – dott. G.Vacchiano 18
3. Calcolo prob. richiesta:
Esercizio1:Limitecentrale
1 2
0.1538 0.0207 0.1331
z z
p
13 campioni
su 100
Esercizio 1: Roma per toma
19. 18.2.2008 Statistica – dott. G.Vacchiano 19
Esercizio 1: Roma per toma
Il peso di 3000 forme di formaggio è distribuito normalmente con
deviazione standard =2.2 kg.
III. Il numero minimo di forme da campionare se si
intende stimare la media (ora ignota) della
popolazione entro 300 g dal valore reale, con
probabilità di errore del 5%.
Esercizio1:Limitecentrale
20. 18.2.2008 Statistica – dott. G.Vacchiano 20
III. Incognita:
Numero di elementi da includere in UN campione per
avere un certo (xi–m) ad un dato livello di probabilità p.
Esercizio1:Limitecentrale
Esercizio 1: Roma per toma
p=5%
21. 18.2.2008 Statistica – dott. G.Vacchiano 21
Esercizio1:Limitecentrale
Esercizio 1: Roma per toma
Le aree sono proporzionali!
22. 18.2.2008 Statistica – dott. G.Vacchiano 22
Esercizio1:Limitecentrale
a=5%
a/2=2.5%
Esercizio 1: Roma per toma
p = 0.95 (una coda)
p = 0.975 (due code)
xi–m = 0.300 kg
23. 18.2.2008 Statistica – dott. G.Vacchiano 23
Esercizio1:Limitecentrale
Esercizio 1: Roma per toma
24. 18.2.2008 Statistica – dott. G.Vacchiano 24
Esercizio1:Limitecentrale
x
Z
n
m
s
2
Z
n
x
s
m
2
1.96 2.2
207 tome
0.300
n
Esercizio 1: Roma per toma
25. 18.2.2008 Statistica – dott. G.Vacchiano 25
PER SOLUTORI ABILI:
Delitto a Forlimpopoli
In Piazza Saffi a Forlimpopoli, nei pressi della fermata dell’autobus, è stata
installata la nuova pensilina. È di ferro inerte il giorno, ma non la notte. Da
mezzanotte all’alba, ogni 60 secondi la pensilina apre le sue fauci, che
rimangono spalancate per A secondi, dove A è distribuito normalmente con
valore atteso =15 secondi dev.standard =16 secondi.
I piccioni di piazza ne sono affascinati. Nottetempo, ogni volta che la pensilina
apre la gola, dalla testa di Saffi un piccione vi vola incontro. Il volo dura 20
secondi.
a) Qual è la probabilità che un piccione sia fagocitato dalla pensilina?
b) Qual è la probabilità che in 5 minuti la pensilina fagociti 2 piccioni?
c) Qual è la probabilità che in 5 minuti nessun piccione incontri la morte?
Esercizio2:DistribuzionebinomialeenormaleZ
31. 18.2.2008 Statistica – dott. G.Vacchiano 31
Premessa al prossimo lab
Chi era William S. Gosset?
(1876-1937)
Il suo posto di lavoro
La sua scoperta
I suoi rapporti con gli
statistici del tempo