Teorema Centrale del Limite

Teorema Centrale del Limite
Con Teorema Centrale del Limite si indica in realt`a un insieme di
risultati che garantiscono che la somma di un grande numero di
variabili aleatorie si distribuisca secondo una distribuzione ben
precisa, che viene chiamata normale
Un primo esempio di risultato di questo tipo fu ottenuto dal
matematico Abraham De Moivre (1667-1754). Il primo che invece
colse il teorema in tutta la sua generalit`a fu Pierre-Simon de
Laplace (1749-1827)

Teorema Centrale del Limite
I testi in cui per la prima volta furono presentati questi risultati
sono rispettivamente:
“The Doctrine of Chances” (2a edizione, 1738) De Moivre
“Th´eorie Analytique des Probabilit´es” (1a edizione, 1812)
Laplace

De Moivre
Come altri matematici precedenti e contemporanei, De Moivre
studiò il gioco ripetuto del lancio di una moneta. La domanda è
semplicemente: qual è la probabilità di ottenere k teste in un
lancio di N monete?
Se associamo il numero 0 alla croce e 1 alla testa possiamo
riformulare la domanda cos`ı: qual è la probabilità che la somma di
N lanci di moneta dia k? (passare al concetto di somma sarà utile
per discutere la parte di Laplace)

De Moivre
La risposta a questa domanda era in realtà già ben nota, ed è
1
2N
·
N!
(N − k)! k!
Il numero n! cresce molto velocemente al crescere di n, ad esempio
10! = 3628800
20! = 2432902008176640000

De Moivre
Il problema è quindi risolto se si sa calcolare quella frazione. De
Moivre commentò però che effettuare tale calcolo per N molto
grande “non è possibile senza un lavoro immenso, per non dire che
è impossibile”
Da questo derivò l’esigenza di trovare delle formule
approssimate. In amichevole competizione con il matematico
scozzese James Stirling (1692-1770) riusc`ı a ottenere le formule
che gli servivano, dimostrando che
1
2N
N!
(N − k)! k!
≈
2
√
2πN
e−2(k−N/2)2
N

De Moivre
Questa approssimazione migliora sempre di più al crescere di N, il
numero di lanci considerato. Per esempio la probabilità di ottenere
7 teste in dieci lanci è data da
10!
210 · 7! · 3!
=
10 · 9 · 8 · 7 · 6 · 5 · 4 · 3 · 2
210 · (7 · 6 · 5 · 4 · 3 · 2) · (3 · 2)
= 0, 1171875
2
√
2π10
e−2(7−10/2)2
10 =
1
√
5π
e−4
5 = 0, 1133...

De Moivre
Per comprendere meglio il livello di accuratezza
dell’approssimazione vediamo alcuni esempi
esatto approssimato
7 da 10 0.117188 0.113372
37 da 100 0.00269793 0.00271659
111 da 200 0.0168638 0.016824
1011 da 2000 0.0158069 0.0158079

De Moivre
Per comprendere la potenza del risultato possiamo misurare il
tempo che ci mette un programma di calcolo avanzato per
eﬀettuare le due operazioni. Si vede che al crescere del numero di
lanci il tempo impiegato per eﬀettuare il calcolo esatto cresce
molto rapidamente, mentre quello impiegato per il calcolo
approssimato rimane piccolissimo

De Moivre
Possiamo vedere il risultato di De Moivre come l’affermazione che
la distribuzione di probabilità che descrive il numero di teste
ottenute in N lanci tende alla distribuzione di probabilità definita
dalla funzione
2
√
2πN
e−2(x−N/2)2
N
Quest’ultima appartiene alla classe delle distribuzioni chiamate
normali, riconoscibili per l’andamento funzionale del tipo e−x2
/√
π

De Moivre
Questa `e la distribuzione di probabilit`a relativa a 10 lanci:
0 2 4 6 8 10
0.05
0.10
0.15
0.20
0.25

De Moivre
E questo `e il graﬁco della distribuzione normale indicata:
0 2 4 6 8 10
0.05
0.10
0.15
0.20
0.25

De Moivre
Poniamole ora nello stesso graﬁco:
0 2 4 6 8 10
0.05
0.10
0.15
0.20
0.25

De Moivre
I punti che descrivono la probabilità di un certo esito si dispongono
dunque secondo quella curva, in modo sempre più preciso al
crescere del numero dei lanci
Vedremo con Laplace che per ogni “gioco” (soggetto quest’ultimo
a restrizioni molto deboli) la somma totale dei guadagni tenderà,
nel limite di molte giocate, ad assumere una distribuzione normale

Lancio di Dadi
Consideriamo, come esempio introduttivo alla discussione su
Laplace, il gioco ripetuto del lancio di un dado. Siamo interessati a
conoscere la probabilità dell’uscita di una data somma, fatto un
certo numero di lanci. Per esempio, nel caso di un unico lancio le
probabilità sono naturalmente:
esito probabilità
1 1/6
2 1/6
3 1/6
4 1/6
5 1/6
6 1/6

Lancio di Dadi
Nel lancio di due dadi la distribuzione di probabilità sarà invece
descritta da questa tabella:
esito probabilità
2 1/36
3 1/18
4 1/12
5 1/9
6 5/36
7 1/6
8 5/36
9 1/9
10 1/12
11 1/18
12 1/36

Lancio di Dadi
Il calcolo a mano per il caso dei tre dadi comincia già ad essere
impegnativo, e ci si può rendere conto facilmente che l’analogo
calcolo per il gioco dei dadi ripetuto 10 volte comincia a essere
proibitivo (per un computer vale la stessa considerazione per il
caso, diciamo, di mille lanci)
Laplace ci insegnerà però che per un numero di lanci abbastanza
elevato possiamo usare un’approssimazione molto simile a quella
trovata da De Moivre per il lancio di tante monete. La probabilità
di ottenere come somma totale k, avendo lanciato N dadi, sarà
approssimabile calcolando la formula:
1
2π · 35/12 · N
e−(k−7/2·N)2
2·35/12·N

Lancio di Dadi
Vediamo il confronto tra il calcolo esatto e l’approssimazione nel
caso di 10 dadi:
20 30 40 50 60
0.01
0.02
0.03
0.04
0.05
0.06
0.07

Laplace
Secondo alcuni autori quanto trovato da De Moivre è la prima
versione del Teorema Centrale del Limite. Nel risultato di De
Moivre manca però uno dei due aspetti fondamentali di tale
teorema, che sono:
POTENZA DI CALCOLO
UNIVERSALITÀ
Laplace fu invece il primo a comprendere i due aspetti

Laplace
Potenza di calcolo
Nella concisa introduzione alla sua Théorie Analityque des
Probabilités, Laplace scrive:
“...quand les évenéments que l’on considère, son en
grand nombre, les expressions auxquelles on est conduit,
se composent d’une si grande multitude de termes et de
facteurs, que leur calcul numérique devient
impraticable;...”

Laplace
Universalità
De Moivre riusc`ı a dimostrare che la distribuzione che descrive la
somma degli esiti di un grande numero di lanci di monete si può
approssimare con una opportuna distribuzione normale
Laplace ottenne un risultato simile ma che ampliava moltissimo
quello di De Moivre, e si può affermare senza dubbio che colse la
natura di quello che poi Pólya avrebbe definito “Teorema Centrale
del Limite”
Detto in breve, egli comprese che la somma di un grande numero
di variabili aleatorie indipendenti e identicamente distribuite (cioè
“tutte uguali”) tende a distribuirsi come un’opportuna gaussiana,
qualunque sia la distribuzione di partenza ad esse comune

Laplace
Universalità
Quindi l’approssimazione di De Moivre si applica non solo al lancio
di tante monete ma anche ad esempio:
al lancio di tanti dadi (sempre considerando la somma)
alla somma dei risultati di un grande numero di esperimenti
Con una sola ipotesi semplicissima: l’esistenza (ovvero la finitezza)
di due quantità caratterizzanti la distribuzione iniziale, cioè
l’aspettativa (µ) e la varianza (σ2)

Laplace
Universalit`a
Osserviamo per esempio il caso della somma di tante variabili
aleatorie distribuite uniformemente con µ = σ2 = 1
0 5 10 15 20 25
0.05
0.10
0.15
0.20
0.25
0.30
0.35

Conclusioni
Universalit`a con certe ipotesi!
La potenza del risultato di Laplace ha portato i suoi successori da
un lato alla ricerca di una classe di distribuzioni per cui il teorema
non vale, dall’altro ad una corsa ad un ulteriore indebolimento delle
ipotesi (ad esempio non identicit`a delle distribuzioni sommate, non
indipendenza)
Anche se molto deboli, le ipotesi ci sono, e le ultime slide saranno
dedicate ad un paio di applicazioni, una fondata ed una opinabile...

Queteletism
L’aspetto di universalità del Teorema incantò molti naturalisti.
Poincaré osservò intorno al 1900, sulla tendenza a credere che
tutte o quasi le distribuzioni statistiche siano normali:
“tutti vi credono, gli sperimentatori ritenendola un
teorema di matematica, i matematici ritenendola una
verità sperimentale”
Il risultato di Laplace aveva infatti dato la base concettuale per
quella che venne chiamata Ipotesi degli Errori Elementari (Hagen,
Bessel). Si sosteneva che gli errori di misura fossero somma di
tanti piccoli errori elementari, e sfruttando il Teorema Centrale si
concludeva che tutti gli errori di misura dovessero disporsi secondo
una distribuzione normale (chiamata anche curva degli errori)

Queteletism
Alcuni studiosi tentarono di esportare queste considerazioni anche
nel mondo della biologia e delle scienze sociali, ovunque insomma
si potesse ritenere che l’effetto in considerazione fosse in un
qualche senso somma di tanti piccoli effetti indipendenti
La scuola di pensiero che presumeva una distribuzione normale
dietro ad ogni ensemble statistico sarà poi chiamata Queteletism,
dal nome del suo più famoso propagandista Adolphe Quetelet
(1796-1874)

Casinò
Ripetere un numero sufficientemente alto di volte un gioco seppur
di poco sbilanciato porta ad un guadagno sicuro per la parte
favorita (il casinò in questo caso). In figura la distribuzione di
probabilità dei guadagni del casinò per una (blu) e 400 giocate
(viola)
0 20 40 60 80
0.05
0.10
0.15
0.20
0.25
0.30
0.35

Calcolo della Distribuzione
Il Teorema Centrale del Limite è stato presentato come un potente
strumento di calcolo, e quest’ultima sezione sarà dedicata
all’esposizione delle nozioni basilari necessarie ad applicarlo alle
situazioni pratiche
Si è visto che la distribuzione di probabilità della somma di un
grande numero di variabili aleatorie identiche si può approssimare
con un’opportuna distribuzione normale. Sarà ora presentato il
metodo per trovare qual è la distribuzione normale opportuna

Calcolo della Distribuzione
Sia X la variabile aleatoria che stiamo sommando. X si dice
discreta se gli esiti possibili sono numeri interi, e si dice continua se
gli esiti possibili sono numeri reali appartenenti ad un certo
intervallo [A, B]
X discreta è descritta dall’insieme degli esiti possibili (che per
definizione sono numeri interi) e dalle probabilità di ciascun esito:
pk è la probabilità dell’esito k
X continua è descritta da una funzione di densità f (x) tale per cui
b
a f (x) dx è la probabilità che l’uscita sia un numero reale
compreso tra a e b

Media & Varianza
Per distribuzioni discrete e continue definiamo le due quantità
fondamentali:
µ =
k
k pk
µ =
B
A
x f (x) dx
µ è detta media o aspettativa e dà il baricentro della distribuzione
di probabilità
σ2
=
k
(k − µ)2
pk
σ2
=
B
A
(x − µ)2
f (x) dx
σ2 è detta varianza e quantifica la dispersione della distribuzione di
probabilità rispetto alla media

Formula Fondamentale
La conoscenza di media e varianza è sufficiente al nostro scopo:
quello cioè di determinare la distribuzione normale che approssima
la distribuzione di “N volte X”. La distribuzione cercata è infatti:
1
√
2π · σ2 · N
e
−
(x−µ·N)2
2·σ2·N

Esempio: Lancio di 10 Dadi
Cerchiamo la distribuzione normale che approssima la distribuzione
della somma di 10 lanci di dadi. Dobbiamo calcolare media e
varianza di un lancio. (Esiti e probabilit`a sono dati dalla ben nota
tabella riportata in precedenza)
µ =
6
k=1
k pk =
6
k=1
k
1
6
=
1
6
6
k=1
k =
1
6
21 =
7
2
σ2
=
k
(k − µ)2
pk = σ2
=
1
6
k
(k − 7/2)2
=
1
6
35
2
=
35
12

Esempio: Lancio di 10 Dadi
Infine, dato che N = 10, applicando la formula fondamentale si
ottiene che la distribuzione approssimante che stiamo cercando è
data da:
1
2π · 35/12 · 10
e−(x−7/2·10)2
2·35/12·10
Nel caso di distribuzioni continue il procedimento è del tutto
analogo. Si dovranno solo sostituire, nel calcolo di media e
varianza, le somme pesate sulle probabilità con integrali pesati
sulla funzione di densità

Teorema Centrale del Limite

Recommended

Recommended

More Related Content

Similar to Teorema Centrale del Limite

Similar to Teorema Centrale del Limite (16)

More from SeAllora

More from SeAllora (9)

Teorema Centrale del Limite