Le distribuzioni campionarie
Quando non è conveniente o possibile esaminare l’intera popolazione si ricorre allo studio di un
campione rappresentativo di essa, estendendo attraverso l’inferenza, i risultati del campione
all’intera popolazione.
Definiamo i concetti di:
•Popolazione obiettivo: la totalità degli elementi presi in esame sui quali si vogliono ottenere
informazioni.
•Campione casuale: si ottiene estraendo a sorte da una popolazione, di dimensione N, una
unità per volta. Ogni unità ha la stessa probabilità 1/N di essere estratta. L’insieme delle unità
estratte in questo modo costituisce un campione casuale.
•Campione stratificato proporzionale: in questo caso la popolazione viene suddivisa in
sottopopolazioni disgiunte ed esaustive chiamate strati; all’interno di ognuno di essi viene
effettuato un campionamento casuale semplice. Da ogni strato si calcola la media, chiamata
media di strato; la media pesata delle medie di strato dà la media di popolazione. Anche le
varianze sono calcolate all’interno di ogni strato e opportunamente pesate danno la varianza
stimata della popolazione.
•Campione casuale stratificato con allocazione ottimale: in questo caso si vuole avere un
tasso di campionamento diversificato per ogni strato. In particolare si vuole incrementare la
numerosità negli strati ad elevata variabilità e diminuirla dove invece è meno elevata.
1Cos'è la Statistica - G. Garau, L. Schirru
Statistiche e momenti campionari
* Un parametro è una misura di sintesi che descrive una caratteristica dell’intera popolazione.
Se si vuole studiare una popolazione avente forma nota e funzione di densità ,
ossia con un parametro * incognito, il procedimento da seguire è quello di estrarre un campione e rappresentare o
stimare il parametro con il valore di qualche funzione .
In altri termini si tratta di determinare quale sia la migliore funzione per stimare .
Definiamo a questo punto i concetti di
Statistica**: una statistica è una funzione di variabili casuali osservabili e quindi a sua volta una variabile casuale, che non
contiene alcun parametro incognito.
Momento campionario: Sia x1, x2, …, xn, un campione casuale. Il momento campionario di ordine r, indicato da sarà
definito come:
);( xf
)...,,( 1 nxxt

** In Descrittiva abbiamo definito la statistica come una misura di sintesi che descrive una caratteristica di un campione della popolazione.

'
rM



n
i
r
ir X
n
M
1
' 1
Se r=1 si ha la media campionaria, solitamente indicata con . Presentiamo alcuni esempi:x



n
i
iX
n
X
1
1





n
i
i XX
n
S
1
22
)(
1
1
Media campionaria Varianza campionaria
2Cos'è la Statistica - G. Garau, L. Schirru
Le statistiche campionarie
Le statistiche campionarie sono esempi di statistiche che possono essere utilizzate per stimare i corrispondenti parametri
della popolazione. Si può dimostrare che:
    22 1
vare 
n
XXE XX
 Per i passaggi matematici si rimanda al testo.
Se il valore atteso della media campionaria è uguale alla media della popolazione significa che la media campionaria (la
statistica) è uguale al parametro media da stimare e che la distribuzione è centrata intorno alla media ( ).
Il fatto, invece, che la il valore atteso della varianza campionaria sia uguale alla varianza della popolazione fratto la sua
numerosità, significa che la dispersione dei valori dei valori di intorno a è piccola quando l’ampiezza del campione è
grande.
Questo significa che se l’ampiezza del campione è grande i valori di media campionaria, usati per stimare la media della
popolazione tendono ad essere più concentrati intorno alla stessa media della popolazione rispetto a quanto lo sarebbero
se l’ampiezza fosse piccola. Questo fatto viene spiegato meglio dalla legge dei grandi numeri.
Valore atteso della media campionaria Valore atteso della varianza campionaria


X
3Cos'è la Statistica - G. Garau, L. Schirru
La legge dei grandi numeri
La legge dei grandi numeri dice che, in seguito ad un gran numero di prove nel lancio di una moneta, la differenza tra il
numero di teste ottenuto ed il valore atteso ottenuto moltiplicando 0,5 per il numero di lanci, in termini assoluti è grande,
ma in termini relativi, all’aumentare del numero di lancio (o prove), tale differenza sarà sempre più piccola.
Si può dire che il numero di teste sarà uguale alla metà del numero dei lanci più una quantità piccola che si chiama errore
aleatorio e che sarà grande in valore assoluto, ma piccola in percentuale (rispetto al numero dei lanci effettuati).
Differenze in termini relativi
Nel seguito di questa Unità Didattica vedremo delle altre distribuzioni (distribuzioni campionarie) derivate dalla
distribuzione normale, e per questo facili da studiare, ma estremamente utili per modellare una vasta gamma di fenomeni
empirici. Tali distribuzioni saranno utili in particolare nel prossimo modulo.
4Cos'è la Statistica - G. Garau, L. Schirru
La distribuzione Chi-quadro,
Definizione: La somma dei quadrati di variabili casuali normali standardizzate e indipendenti ha una
distribuzione chi quadro con (n-k) gradi di libertà *. Il grafico di tale distribuzione dipende quindi dai gradi
di libertà (gdl).
* Dove n è la numerosità e k è il numero dei parametri.
2

2

Distribuzione
5Cos'è la Statistica - G. Garau, L. Schirru
Esercizio: Data la distribuzione con 5 gradi di libertà,
trovare il valore di tale che l’area a destra di vale
2

2

2
 05.0
1
Le tavole presentate nell’appendice del libro tabulano l’area per cui, l’area da noi cercata è 0.95=1-0.05, con 5
gradi di libertà.
1
6Cos'è la Statistica - G. Garau, L. Schirru
La distribuzione T di Student
Definizione: Si considera Z avente una distribuzione normale standardizzata e U, una distribuzione ; se Z
e U sono indipendenti allora:
ha una distribuzione T di Student con k gradi di libertà. La distribuzione T di Student, si approssima alla
normale per
2

k
T
kU
Z
~
30n Vedere tavole nell’Appendice del libro.
Distribuzione T di Student
7Cos'è la Statistica - G. Garau, L. Schirru
Esercizio: Data la distribuzione T di Student con 9 gradi di libertà, trovare il valore di tale che
l’area a destra di valet 05.0t
Le tavole presentate nell’appendice del libro tabulano i valori da a t, per cui l’area . L’area da noi cercata è 0.95=1-
0.05, con 9 gradi di libertà.
1
1

8Cos'è la Statistica - G. Garau, L. Schirru
La distribuzione F di Fisher
Definizione: Sia U una Variabile Casuale con m gradi di libertà e sia V una Variabile Casuale con n
gradi di libertà; se U e V sono indipendenti allora la Variabile Casuale F sarà:
2

2

nmF
nV
mU
F ,~
Distribuzione F di Fisher
9Cos'è la Statistica - G. Garau, L. Schirru
Esercizio: Data la distribuzione F di Fisher con
trovare il valore di tale che l’area a destra di vale
25e14 21  
F F 10.0
79.1)25,14(10,0
F
10Cos'è la Statistica - G. Garau, L. Schirru

Le distribuzioni campionarie

  • 1.
    Le distribuzioni campionarie Quandonon è conveniente o possibile esaminare l’intera popolazione si ricorre allo studio di un campione rappresentativo di essa, estendendo attraverso l’inferenza, i risultati del campione all’intera popolazione. Definiamo i concetti di: •Popolazione obiettivo: la totalità degli elementi presi in esame sui quali si vogliono ottenere informazioni. •Campione casuale: si ottiene estraendo a sorte da una popolazione, di dimensione N, una unità per volta. Ogni unità ha la stessa probabilità 1/N di essere estratta. L’insieme delle unità estratte in questo modo costituisce un campione casuale. •Campione stratificato proporzionale: in questo caso la popolazione viene suddivisa in sottopopolazioni disgiunte ed esaustive chiamate strati; all’interno di ognuno di essi viene effettuato un campionamento casuale semplice. Da ogni strato si calcola la media, chiamata media di strato; la media pesata delle medie di strato dà la media di popolazione. Anche le varianze sono calcolate all’interno di ogni strato e opportunamente pesate danno la varianza stimata della popolazione. •Campione casuale stratificato con allocazione ottimale: in questo caso si vuole avere un tasso di campionamento diversificato per ogni strato. In particolare si vuole incrementare la numerosità negli strati ad elevata variabilità e diminuirla dove invece è meno elevata. 1Cos'è la Statistica - G. Garau, L. Schirru
  • 2.
    Statistiche e momenticampionari * Un parametro è una misura di sintesi che descrive una caratteristica dell’intera popolazione. Se si vuole studiare una popolazione avente forma nota e funzione di densità , ossia con un parametro * incognito, il procedimento da seguire è quello di estrarre un campione e rappresentare o stimare il parametro con il valore di qualche funzione . In altri termini si tratta di determinare quale sia la migliore funzione per stimare . Definiamo a questo punto i concetti di Statistica**: una statistica è una funzione di variabili casuali osservabili e quindi a sua volta una variabile casuale, che non contiene alcun parametro incognito. Momento campionario: Sia x1, x2, …, xn, un campione casuale. Il momento campionario di ordine r, indicato da sarà definito come: );( xf )...,,( 1 nxxt  ** In Descrittiva abbiamo definito la statistica come una misura di sintesi che descrive una caratteristica di un campione della popolazione.  ' rM    n i r ir X n M 1 ' 1 Se r=1 si ha la media campionaria, solitamente indicata con . Presentiamo alcuni esempi:x    n i iX n X 1 1      n i i XX n S 1 22 )( 1 1 Media campionaria Varianza campionaria 2Cos'è la Statistica - G. Garau, L. Schirru
  • 3.
    Le statistiche campionarie Lestatistiche campionarie sono esempi di statistiche che possono essere utilizzate per stimare i corrispondenti parametri della popolazione. Si può dimostrare che:     22 1 vare  n XXE XX  Per i passaggi matematici si rimanda al testo. Se il valore atteso della media campionaria è uguale alla media della popolazione significa che la media campionaria (la statistica) è uguale al parametro media da stimare e che la distribuzione è centrata intorno alla media ( ). Il fatto, invece, che la il valore atteso della varianza campionaria sia uguale alla varianza della popolazione fratto la sua numerosità, significa che la dispersione dei valori dei valori di intorno a è piccola quando l’ampiezza del campione è grande. Questo significa che se l’ampiezza del campione è grande i valori di media campionaria, usati per stimare la media della popolazione tendono ad essere più concentrati intorno alla stessa media della popolazione rispetto a quanto lo sarebbero se l’ampiezza fosse piccola. Questo fatto viene spiegato meglio dalla legge dei grandi numeri. Valore atteso della media campionaria Valore atteso della varianza campionaria   X 3Cos'è la Statistica - G. Garau, L. Schirru
  • 4.
    La legge deigrandi numeri La legge dei grandi numeri dice che, in seguito ad un gran numero di prove nel lancio di una moneta, la differenza tra il numero di teste ottenuto ed il valore atteso ottenuto moltiplicando 0,5 per il numero di lanci, in termini assoluti è grande, ma in termini relativi, all’aumentare del numero di lancio (o prove), tale differenza sarà sempre più piccola. Si può dire che il numero di teste sarà uguale alla metà del numero dei lanci più una quantità piccola che si chiama errore aleatorio e che sarà grande in valore assoluto, ma piccola in percentuale (rispetto al numero dei lanci effettuati). Differenze in termini relativi Nel seguito di questa Unità Didattica vedremo delle altre distribuzioni (distribuzioni campionarie) derivate dalla distribuzione normale, e per questo facili da studiare, ma estremamente utili per modellare una vasta gamma di fenomeni empirici. Tali distribuzioni saranno utili in particolare nel prossimo modulo. 4Cos'è la Statistica - G. Garau, L. Schirru
  • 5.
    La distribuzione Chi-quadro, Definizione:La somma dei quadrati di variabili casuali normali standardizzate e indipendenti ha una distribuzione chi quadro con (n-k) gradi di libertà *. Il grafico di tale distribuzione dipende quindi dai gradi di libertà (gdl). * Dove n è la numerosità e k è il numero dei parametri. 2  2  Distribuzione 5Cos'è la Statistica - G. Garau, L. Schirru
  • 6.
    Esercizio: Data ladistribuzione con 5 gradi di libertà, trovare il valore di tale che l’area a destra di vale 2  2  2  05.0 1 Le tavole presentate nell’appendice del libro tabulano l’area per cui, l’area da noi cercata è 0.95=1-0.05, con 5 gradi di libertà. 1 6Cos'è la Statistica - G. Garau, L. Schirru
  • 7.
    La distribuzione Tdi Student Definizione: Si considera Z avente una distribuzione normale standardizzata e U, una distribuzione ; se Z e U sono indipendenti allora: ha una distribuzione T di Student con k gradi di libertà. La distribuzione T di Student, si approssima alla normale per 2  k T kU Z ~ 30n Vedere tavole nell’Appendice del libro. Distribuzione T di Student 7Cos'è la Statistica - G. Garau, L. Schirru
  • 8.
    Esercizio: Data ladistribuzione T di Student con 9 gradi di libertà, trovare il valore di tale che l’area a destra di valet 05.0t Le tavole presentate nell’appendice del libro tabulano i valori da a t, per cui l’area . L’area da noi cercata è 0.95=1- 0.05, con 9 gradi di libertà. 1 1  8Cos'è la Statistica - G. Garau, L. Schirru
  • 9.
    La distribuzione Fdi Fisher Definizione: Sia U una Variabile Casuale con m gradi di libertà e sia V una Variabile Casuale con n gradi di libertà; se U e V sono indipendenti allora la Variabile Casuale F sarà: 2  2  nmF nV mU F ,~ Distribuzione F di Fisher 9Cos'è la Statistica - G. Garau, L. Schirru
  • 10.
    Esercizio: Data ladistribuzione F di Fisher con trovare il valore di tale che l’area a destra di vale 25e14 21   F F 10.0 79.1)25,14(10,0 F 10Cos'è la Statistica - G. Garau, L. Schirru

Editor's Notes

  • #2 Titolo: Le distribuzioni campionarie
  • #3 Titolo: Statistiche e momenti campionari
  • #4 Titolo: Le statistiche campionarie
  • #6 Titolo: La distribuzione Chi-quadro
  • #7 Esercizio sulla distribuzione del Chi-quadro
  • #8 Titolo: La distribuzione T di Student
  • #9 Esercizio sulla T di Student
  • #10 Titolo: La distribuzione F di fisher
  • #11 Esercizio sulla distribuzione F di Fisher