2. Teorema Centrale del Limite
Con Teorema Centrale del Limite si indica in realt`a un insieme di
risultati che garantiscono che la somma di un grande numero di
variabili aleatorie si distribuisca secondo una distribuzione ben
precisa, che viene chiamata normale
Un primo esempio di risultato di questo tipo fu ottenuto dal
matematico Abraham De Moivre (1667-1754). Il primo che invece
colse il teorema in tutta la sua generalit`a fu Pierre-Simon de
Laplace (1749-1827)
3. Teorema Centrale del Limite
I testi in cui per la prima volta furono presentati questi risultati
sono rispettivamente:
“The Doctrine of Chances” (2a edizione, 1738) De Moivre
“Th´eorie Analytique des Probabilit´es” (1a edizione, 1812)
Laplace
5. De Moivre
Come altri matematici precedenti e contemporanei, De Moivre
studi`o il gioco ripetuto del lancio di una moneta. La domanda `e
semplicemente: qual `e la probabilit`a di ottenere k teste in un
lancio di N monete?
Se associamo il numero 0 alla croce e 1 alla testa possiamo
riformulare la domanda cos`ı: qual `e la probabilit`a che la somma di
N lanci di moneta dia k? (passare al concetto di somma sar`a utile
per discutere la parte di Laplace)
6. De Moivre
La risposta a questa domanda era in realt`a gi`a ben nota, ed `e
1
2N
·
N!
(N − k)! k!
Il numero n! cresce molto velocemente al crescere di n, ad esempio
10! = 3628800
20! = 2432902008176640000
7. De Moivre
Il problema `e quindi risolto se si sa calcolare quella frazione. De
Moivre comment`o per`o che effettuare tale calcolo per N molto
grande “non `e possibile senza un lavoro immenso, per non dire che
`e impossibile”
Da questo deriv`o l’esigenza di trovare delle formule
approssimate. In amichevole competizione con il matematico
scozzese James Stirling (1692-1770) riusc`ı a ottenere le formule
che gli servivano, dimostrando che
1
2N
N!
(N − k)! k!
≈
2
√
2πN
e−2(k−N/2)2
N
8. De Moivre
Questa approssimazione migliora sempre di pi`u al crescere di N, il
numero di lanci considerato. Per esempio la probabilit`a di ottenere
7 teste in dieci lanci `e data da
10!
210 · 7! · 3!
=
10 · 9 · 8 · 7 · 6 · 5 · 4 · 3 · 2
210 · (7 · 6 · 5 · 4 · 3 · 2) · (3 · 2)
= 0, 1171875
2
√
2π10
e−2(7−10/2)2
10 =
1
√
5π
e−4
5 = 0, 1133...
9. De Moivre
Per comprendere meglio il livello di accuratezza
dell’approssimazione vediamo alcuni esempi
esatto approssimato
7 da 10 0.117188 0.113372
37 da 100 0.00269793 0.00271659
111 da 200 0.0168638 0.016824
1011 da 2000 0.0158069 0.0158079
10. De Moivre
Per comprendere la potenza del risultato possiamo misurare il
tempo che ci mette un programma di calcolo avanzato per
effettuare le due operazioni. Si vede che al crescere del numero di
lanci il tempo impiegato per effettuare il calcolo esatto cresce
molto rapidamente, mentre quello impiegato per il calcolo
approssimato rimane piccolissimo
11. De Moivre
Possiamo vedere il risultato di De Moivre come l’affermazione che
la distribuzione di probabilit`a che descrive il numero di teste
ottenute in N lanci tende alla distribuzione di probabilit`a definita
dalla funzione
2
√
2πN
e−2(x−N/2)2
N
Quest’ultima appartiene alla classe delle distribuzioni chiamate
normali, riconoscibili per l’andamento funzionale del tipo e−x2
/√
π
12. De Moivre
Questa `e la distribuzione di probabilit`a relativa a 10 lanci:
0 2 4 6 8 10
0.05
0.10
0.15
0.20
0.25
13. De Moivre
E questo `e il grafico della distribuzione normale indicata:
0 2 4 6 8 10
0.05
0.10
0.15
0.20
0.25
15. De Moivre
I punti che descrivono la probabilit`a di un certo esito si dispongono
dunque secondo quella curva, in modo sempre pi`u preciso al
crescere del numero dei lanci
Vedremo con Laplace che per ogni “gioco” (soggetto quest’ultimo
a restrizioni molto deboli) la somma totale dei guadagni tender`a,
nel limite di molte giocate, ad assumere una distribuzione normale
17. Lancio di Dadi
Consideriamo, come esempio introduttivo alla discussione su
Laplace, il gioco ripetuto del lancio di un dado. Siamo interessati a
conoscere la probabilit`a dell’uscita di una data somma, fatto un
certo numero di lanci. Per esempio, nel caso di un unico lancio le
probabilit`a sono naturalmente:
esito probabilit`a
1 1/6
2 1/6
3 1/6
4 1/6
5 1/6
6 1/6
18. Lancio di Dadi
Nel lancio di due dadi la distribuzione di probabilit`a sar`a invece
descritta da questa tabella:
esito probabilit`a
2 1/36
3 1/18
4 1/12
5 1/9
6 5/36
7 1/6
8 5/36
9 1/9
10 1/12
11 1/18
12 1/36
19. Lancio di Dadi
Il calcolo a mano per il caso dei tre dadi comincia gi`a ad essere
impegnativo, e ci si pu`o rendere conto facilmente che l’analogo
calcolo per il gioco dei dadi ripetuto 10 volte comincia a essere
proibitivo (per un computer vale la stessa considerazione per il
caso, diciamo, di mille lanci)
Laplace ci insegner`a per`o che per un numero di lanci abbastanza
elevato possiamo usare un’approssimazione molto simile a quella
trovata da De Moivre per il lancio di tante monete. La probabilit`a
di ottenere come somma totale k, avendo lanciato N dadi, sar`a
approssimabile calcolando la formula:
1
2π · 35/12 · N
e−(k−7/2·N)2
2·35/12·N
20. Lancio di Dadi
Vediamo il confronto tra il calcolo esatto e l’approssimazione nel
caso di 10 dadi:
20 30 40 50 60
0.01
0.02
0.03
0.04
0.05
0.06
0.07
22. Laplace
Secondo alcuni autori quanto trovato da De Moivre `e la prima
versione del Teorema Centrale del Limite. Nel risultato di De
Moivre manca per`o uno dei due aspetti fondamentali di tale
teorema, che sono:
POTENZA DI CALCOLO
UNIVERSALIT`A
Laplace fu invece il primo a comprendere i due aspetti
23. Laplace
Potenza di calcolo
Nella concisa introduzione alla sua Th´eorie Analityque des
Probabilit´es, Laplace scrive:
“...quand les ´even´ements que l’on consid`ere, son en
grand nombre, les expressions auxquelles on est conduit,
se composent d’une si grande multitude de termes et de
facteurs, que leur calcul num´erique devient
impraticable;...”
24. Laplace
Universalit`a
De Moivre riusc`ı a dimostrare che la distribuzione che descrive la
somma degli esiti di un grande numero di lanci di monete si pu`o
approssimare con una opportuna distribuzione normale
Laplace ottenne un risultato simile ma che ampliava moltissimo
quello di De Moivre, e si pu`o affermare senza dubbio che colse la
natura di quello che poi P´olya avrebbe definito “Teorema Centrale
del Limite”
Detto in breve, egli comprese che la somma di un grande numero
di variabili aleatorie indipendenti e identicamente distribuite (cio`e
“tutte uguali”) tende a distribuirsi come un’opportuna gaussiana,
qualunque sia la distribuzione di partenza ad esse comune
25. Laplace
Universalit`a
Quindi l’approssimazione di De Moivre si applica non solo al lancio
di tante monete ma anche ad esempio:
al lancio di tanti dadi (sempre considerando la somma)
alla somma dei risultati di un grande numero di esperimenti
Con una sola ipotesi semplicissima: l’esistenza (ovvero la finitezza)
di due quantit`a caratterizzanti la distribuzione iniziale, cio`e
l’aspettativa (µ) e la varianza (σ2)
26. Laplace
Universalit`a
Osserviamo per esempio il caso della somma di tante variabili
aleatorie distribuite uniformemente con µ = σ2 = 1
0 5 10 15 20 25
0.05
0.10
0.15
0.20
0.25
0.30
0.35
27. Laplace
Universalit`a
Osserviamo per esempio il caso della somma di tante variabili
aleatorie distribuite uniformemente con µ = σ2 = 1
0 5 10 15 20 25
0.05
0.10
0.15
0.20
0.25
0.30
0.35
28. Laplace
Universalit`a
Osserviamo per esempio il caso della somma di tante variabili
aleatorie distribuite uniformemente con µ = σ2 = 1
0 5 10 15 20 25
0.05
0.10
0.15
0.20
0.25
0.30
0.35
29. Laplace
Universalit`a
Osserviamo per esempio il caso della somma di tante variabili
aleatorie distribuite uniformemente con µ = σ2 = 1
0 5 10 15 20 25
0.05
0.10
0.15
0.20
0.25
0.30
0.35
30. Laplace
Universalit`a
Osserviamo per esempio il caso della somma di tante variabili
aleatorie distribuite uniformemente con µ = σ2 = 1
0 5 10 15 20 25
0.05
0.10
0.15
0.20
0.25
0.30
0.35
31. Conclusioni
Universalit`a con certe ipotesi!
La potenza del risultato di Laplace ha portato i suoi successori da
un lato alla ricerca di una classe di distribuzioni per cui il teorema
non vale, dall’altro ad una corsa ad un ulteriore indebolimento delle
ipotesi (ad esempio non identicit`a delle distribuzioni sommate, non
indipendenza)
Anche se molto deboli, le ipotesi ci sono, e le ultime slide saranno
dedicate ad un paio di applicazioni, una fondata ed una opinabile...
32. Queteletism
L’aspetto di universalit`a del Teorema incant`o molti naturalisti.
Poincar´e osserv`o intorno al 1900, sulla tendenza a credere che
tutte o quasi le distribuzioni statistiche siano normali:
“tutti vi credono, gli sperimentatori ritenendola un
teorema di matematica, i matematici ritenendola una
verit`a sperimentale”
Il risultato di Laplace aveva infatti dato la base concettuale per
quella che venne chiamata Ipotesi degli Errori Elementari (Hagen,
Bessel). Si sosteneva che gli errori di misura fossero somma di
tanti piccoli errori elementari, e sfruttando il Teorema Centrale si
concludeva che tutti gli errori di misura dovessero disporsi secondo
una distribuzione normale (chiamata anche curva degli errori)
33. Queteletism
Alcuni studiosi tentarono di esportare queste considerazioni anche
nel mondo della biologia e delle scienze sociali, ovunque insomma
si potesse ritenere che l’effetto in considerazione fosse in un
qualche senso somma di tanti piccoli effetti indipendenti
La scuola di pensiero che presumeva una distribuzione normale
dietro ad ogni ensemble statistico sar`a poi chiamata Queteletism,
dal nome del suo pi`u famoso propagandista Adolphe Quetelet
(1796-1874)
34. Casin`o
Ripetere un numero sufficientemente alto di volte un gioco seppur
di poco sbilanciato porta ad un guadagno sicuro per la parte
favorita (il casin`o in questo caso). In figura la distribuzione di
probabilit`a dei guadagni del casin`o per una (blu) e 400 giocate
(viola)
0 20 40 60 80
0.05
0.10
0.15
0.20
0.25
0.30
0.35
36. Calcolo della Distribuzione
Il Teorema Centrale del Limite `e stato presentato come un potente
strumento di calcolo, e quest’ultima sezione sar`a dedicata
all’esposizione delle nozioni basilari necessarie ad applicarlo alle
situazioni pratiche
Si `e visto che la distribuzione di probabilit`a della somma di un
grande numero di variabili aleatorie identiche si pu`o approssimare
con un’opportuna distribuzione normale. Sar`a ora presentato il
metodo per trovare qual `e la distribuzione normale opportuna
37. Calcolo della Distribuzione
Sia X la variabile aleatoria che stiamo sommando. X si dice
discreta se gli esiti possibili sono numeri interi, e si dice continua se
gli esiti possibili sono numeri reali appartenenti ad un certo
intervallo [A, B]
X discreta `e descritta dall’insieme degli esiti possibili (che per
definizione sono numeri interi) e dalle probabilit`a di ciascun esito:
pk `e la probabilit`a dell’esito k
X continua `e descritta da una funzione di densit`a f (x) tale per cui
b
a f (x) dx `e la probabilit`a che l’uscita sia un numero reale
compreso tra a e b
38. Media & Varianza
Per distribuzioni discrete e continue definiamo le due quantit`a
fondamentali:
µ =
k
k pk
µ =
B
A
x f (x) dx
µ `e detta media o aspettativa e d`a il baricentro della distribuzione
di probabilit`a
σ2
=
k
(k − µ)2
pk
σ2
=
B
A
(x − µ)2
f (x) dx
σ2 `e detta varianza e quantifica la dispersione della distribuzione di
probabilit`a rispetto alla media
39. Formula Fondamentale
La conoscenza di media e varianza `e sufficiente al nostro scopo:
quello cio`e di determinare la distribuzione normale che approssima
la distribuzione di “N volte X”. La distribuzione cercata `e infatti:
1
√
2π · σ2 · N
e
−
(x−µ·N)2
2·σ2·N
40. Esempio: Lancio di 10 Dadi
Cerchiamo la distribuzione normale che approssima la distribuzione
della somma di 10 lanci di dadi. Dobbiamo calcolare media e
varianza di un lancio. (Esiti e probabilit`a sono dati dalla ben nota
tabella riportata in precedenza)
µ =
6
k=1
k pk =
6
k=1
k
1
6
=
1
6
6
k=1
k =
1
6
21 =
7
2
σ2
=
k
(k − µ)2
pk = σ2
=
1
6
k
(k − 7/2)2
=
1
6
35
2
=
35
12
41. Esempio: Lancio di 10 Dadi
Infine, dato che N = 10, applicando la formula fondamentale si
ottiene che la distribuzione approssimante che stiamo cercando `e
data da:
1
2π · 35/12 · 10
e−(x−7/2·10)2
2·35/12·10
Nel caso di distribuzioni continue il procedimento `e del tutto
analogo. Si dovranno solo sostituire, nel calcolo di media e
varianza, le somme pesate sulle probabilit`a con integrali pesati
sulla funzione di densit`a