Come introdurre la probabilità e la statistica nella scuola superiore? Questa è la presentazione di un percorso didattico che prevede di introdurre la statistica con preciso punto di vista, non esaustivo ma compiuto. Questa presentazione è stata preparata per l'esame di Probabilità e Statistica nel Tirocinio Formativo Attivo 2014-15 dell'Università di Roma Tre
Probabilità e statistica: la scienza della previsione
1. Probabilità e statistica
la scienza della previsione
Romina F. Michelina S., Cristina D. G., Andrea C.
TFA 2014-15 Univ. di Roma
Tre
2. competenze di cittadinanza
Tra le “competenze chiave di cittadinanza” che la nostra scuola
dovrebbe far acquisire agli studenti c'è:
“Comunicare: comprendere messaggi di genere diverso
(quotidiano, letterario, tecnico, scientifico) e di complessità
diversa, trasmessi utilizzando linguaggi diversi (verbale,
matematico, scientifico, simbolico, ecc.) mediante diversi supporti
(cartacei, informatici e multimediali)”
3. sommario
●
Molti fenomeni ci si presentano in modo apparentemente
casuale.
●
Possiamo o capirli meglio (la meccanica del tiro del dado) o
studiarli in modo statistico, cioè ripetere il fenomeno molte volte
cercando di capire le caratteristiche ricorrenti e quelle accidentali.
MA
●
non sempre la statistica, per quanto basata su grandi quantità di
dati, permette di effettuare previsioni attendibili
4. il lancio di un dado
Prevedere il risultato del lancio di un dado è
molto difficile.
Ci si può provare in diversi modi:
●
studiando la fisica del rimbalzo dei dadi (difficile)
●
studiando la probabilità degli eventi possibili
●
studiando la statistica di ripetuti lanci
5. Es.: qual è la probabilità di ottenere 5?
Possiamo studiare gli eventi casuali o
sperimentalmente con il concetto di
frequenza relativa (f(E)) o con il concetto di
probabilità matematica (p(E)) teoricamente.
La legge dei grandi numeri collegherà questi
due concetti tra di loro.
Nell’impostazione classica il valore della
probabilità è calcolato a priori, ossia prima
che l’esperimento avvenga, mentre il valore
della frequenza è un valore a posteriori
6. cos'è la “probabilità matematica”?
Definizione di Laplace:
P(E) = casi favorevoli/casi possibili
7. notazione probabilistica
Facendo un collegamento con la logica,
si possono introdurre le seguenti
notazioni:
Ω l’evento certo;
∅ l’evento impossibile;
A1
A⋃ 2
... A⋃ ⋃ n
unione di eventi
A1
A⋂ 2
… A⋂ ⋂ n
intersezione di eventi
8. alcuni valori notevoli
Osserviamo che i valori della probabilità sono:
0<p(E)<1
p(E)=0 l’evento è impossibile, come estrarre una
pallina nera da un’urna contenente solo palline
rosse;
p(E)=1 l’evento è certo, come l’estrarre una pallina
nera da un’urna contenente solo palline nere;
L’evento è incerto in tutti gli altri casi.
9. probabilità di più eventi
Inoltre due eventi si dicono incompatibili
se non possono presentarsi insieme.
Più eventi si dicono incompatibili se
sono incompatibili a due a due.
Se A,B sono incompatibili, allora
P(A B)=P(A)+P(B)∪
11. cos'è la “frequenza relativa”?
la frequenza relativa di un evento sottoposto
a n esperimenti, effettuati tutti nelle stesse
condizioni, è il rapporto fra il numero delle
volte m che si è verificato e il numero n delle
prove effettuate
f(E)=m/n
12. esempio: testa o croce
Si è lanciata 200 volte una moneta e :
94 volte è uscita T
106 volte è uscita C
f(T) = 94/200=0,47=47%
f(C) =106/200=0,53=53%
13. esempio: testa o croce
Si è lanciata 200 volte una moneta e :
94 volte è uscita T
106 volte è uscita C
f(T) = 94/200=0,47=47%
f(C) =106/200=0,53=53%
osserviamo che f(T)+f(C)=1=100%
28. E con due dadi cosa otterrò?
Supponiamo ora di lanciare in aria due dadi distinti
(uno verde e uno rosso) ognuno dei quali è
perfetto, significando con ciò che ognuna delle 6
facce ha un'uguale probabilità (cioè 1/6) di uscire.
Quali valori si ottengono più spesso?
Se i due dadi sono gettati contemporaneamente (o
di seguito, ciò non importa per i nostri scopi) ci
sono 36 diversi accoppiamenti possibili che hanno
la medesima probabilità di presentarsi.
29. La somma di due dadi
Osserviamo che 7 è la somma più probabile
perché si può ottenere in più modi, rispetto alle
altre.
E’ utile rappresentare i casi con un istogramma
30. la curva a campana
f
eventi
In molti casi come questo, l'istogramma
ha una caratteristica forma a campana
31. la curva a campana
f
eventi
In molti casi come questo, l'istogramma
ha una caratteristica forma a campana
35. Marta: 1.55 m
Anna: 1.62 m
Beatrice: 1.71 m
Clara: 1.49 m
Es. 1: l'altezza degli alunni
36. Marta: 1.55 m
Anna: 1.62 m
Beatrice: 1.71 m
Clara: 1.49 m
Debora: 1.63 m
Es. 1: l'altezza degli alunni
37. Es. 1: l'altezza degli alunni
Marta: 1.55 m
Anna: 1.62 m
Beatrice: 1.71 m
Clara: 1.49 m
Debora: 1.63 m
Enrica: 1.68 m
38. Es. 1: l'altezza degli alunni
Marta: 1.55 m
Anna: 1.62 m
Beatrice: 1.71 m
Clara: 1.49 m
Debora: 1.63 m
Enrica: 1.68 m
… eccetera eccetera
39. Marta: 1.55 m
Anna: 1.62 m
Beatrice: 1.71 m
Clara: 1.49 m
Debora: 1.63 m
Enrica: 1.68 m
… eccetera eccetera
Es. 1: l'altezza degli alunni
40. Marta: 1.55 m
Anna: 1.62 m
Beatrice: 1.71 m
Clara: 1.49 m
Debora: 1.63 m
Enrica: 1.68 m
… eccetera eccetera
Es. 1: l'altezza degli alunni
41. Es. 2: testa o croce
Immaginiamo di lanciare una moneta 1000 volte
e registrare il numero di “testa”.
Poi ripetiamo molte volte questa serie di mille
lanci, e raccogliamo in un istogramma il numero
di “testa” di ciascuna serie di 1000 lanci.
L'istogramma avrà la forma di una “curva di
Gauss”.
43. la curva di Gauss
La curva diventa sempre più chiara
all'aumentare della lunghezza delle serie
10000 lanci
44. la curva di Gauss
La curva diventa sempre più chiara
all'aumentare della lunghezza delle serie
curva di Gauss
(1777-1855)
45. perché è così comune?
Quando un fenomeno è la composizione di tanti “sottofenomeni”
esso viene naturalmente descritto da una curva a campana
(teorema del limite centrale).
il "pallinometro" (clicca)
46. cosa ci dice una curva a campana?
Quando un fenomeno è descritto da una curva
a campana possiamo osservare
due caratteristiche importanti:
47. cosa ci dice una curva a campana?
Quando un fenomeno è descritto da una curva
a campana possiamo osservare
due caratteristiche importanti:
●
la posizione del “picco” della campana
(valore medio)
48. cosa ci dice una curva a campana?
Quando un fenomeno è descritto da una curva
a campana possiamo osservare
due caratteristiche importanti:
●
la posizione del “picco” della campana
(valore medio)
●
la “larghezza della campana”
(deviazione standard)
49. il valore medio
〈 X 〉=
1
N
∑
i
X i
È la posizione del “picco” della campana e corrisponde
al valore più probabile.
50. la deviazione standard
Misura la “larghezza” della campana
e dunque l'intervallo dei valori più probabili (68%)
σ=
√1
N
∑
i
(X i−〈 X 〉)
2
51. la “previsione” di un fenomeno
Conoscendo il valore medio e la deviazione
standard che caratterizzano un fenomeno,
sappiamo dunque quali valori aspettarci da una
certa “popolazione” (ad esempio, gli alunni di
una classe) e quali valori invece possono
essere trascurati in quanto poco probabili.
tante ripetizioni = migliori previsioni
52. Immaginiamo un territorio a rischio sismico, in cui normalmente
non si verificano vittime, però:
ogni 10 anni c'è un terremoto con 10 vittime
ogni 100 anni c'è un terremoto con 100 vittime
ogni 1000 anni c'è un terremoto con 1000 vittime
ogni 10000 anni c'è un terremoto con 10000 vittime
… e così via
Quante vittime ci saranno
nel prossimo terremoto?
il problema dei terremoti
54. l'istogramma dei terremoti
# vittime
# terremoti
Non è una curva a campana!
E' una legge di potenza del
tipo x-A
55. utile: l'istogramma dei terremoti log-log
log # vittime
log # terremoti
Le leggi di potenza in scala logaritmica
diventano rette:
se y = C x-A
allora
log y = - A log x + log C
56. l'analisi statistica
Possiamo calcolare il numero medio di vittime?
Sì, ma dipenderà dalla dimensione del campione!
Infatti:
media su 10 anni ~ 1
media su 100 anni ~ 2
media su 1000 anni ~ 3
...
57. l'analisi statistica
Possiamo calcolare il numero medio di vittime?
Sì, ma dipenderà dalla dimensione del campione!
Possiamo calcolare la deviazione standard?
Sì, ma dipenderà dalla dimensione del campione!
58. spiegazione matematica inter nos
Se la distribuzione statistica è
con α > 0, allora
〈 x〉=∫
0
∞
x P ( x)dx=∫
0
∞
x1−α
dx=∞
se α < 2.
P (x) x∼
−α
59. spiegazione matematica inter nos
Inoltre, se la distribuzione statistica è
P (x) x∼
−α
con α > 0, allora
〈 x
2
〉=∫
0
∞
x
2
P(x) dx=∫
0
∞
x
2−α
dx= ∞
¿
se α < 3. Dunque diverge il secondo momento e la varianza
diventa infinita.
61. è uno scherzo?
No, i terremoti sono proprio così:
Legge di potenza
con esponente
α = 0.772
62. I terremoti non sono “prevedibili”
I terremoti non sono descritti dalle classiche
curve a campana ma da particolari “leggi di
potenza” che
non possiedono valore medio né
deviazione standard!
Dunque non sappiamo cosa aspettarci,
nonostante abbiamo enormi quantità di dati a
disposizione per fare un'analisi statistica.
63. un mondo di “leggi di potenza”
Tanti altri fenomeni si comportano così:
es: i prezzi delle azioni, il reddito, il numero di
rapporti sessuali ...
→ Importante per calcolare le
disuguaglianze sociali, prevenire crisi
finanziarie o epidemie di malattie
sessualmente trasmissibili.
65. attività di laboratorio
- i terremoti
- la borsa
- l'attività sui social network
- eventi atmosferici
- la durata degli allenatori
(molti dati disponibili su web)
66. punti di forza e di debolezza
Difetti
punto di vista limitato sull'argomento
Pregi
Sintesi
Flessibilità
Storytelling
Didattica laboratoriale