Una buona analisi dei dati richiede anche che le caratteristiche principali delle osservazioni siano sintetizzate con opportune misure e che tali misure siano adeguatamente analizzate e interpretate.
Gli indici di posizione sintetizzano la posizione di una distribuzione di frequenza mediante un valore reale rappresentativo della globalità del fenomeno e tale da riassumere gli aspetti ritenuti più importanti.
Di seguito si esaminano le misure di posizione:
MEDIA
MODA
MEDIANA
1. Gli indici di posizione
Quando si considerano dati quantitativi, non è sufficiente presentare
adeguatamente i dati e trarre indicazioni su questi a partire dall’osservazione
di tali rappresentazioni.
Una buona analisi dei dati richiede anche che le caratteristiche principali delle
osservazioni siano sintetizzate con opportune misure e che tali misure siano
adeguatamente analizzate e interpretate.
Gli indici di posizione sintetizzano la posizione di una distribuzione di
frequenza mediante un valore reale rappresentativo della globalità del
fenomeno e tale da riassumere gli aspetti ritenuti più importanti.
Di seguito si esaminano le misure di posizione:
– MEDIA
– MODA
– MEDIANA
Cos’è la Statistica - G. Garau, L. Schirru 1
2. La media
Si dice che M è la media di n dati (xi, … xn,), se il risultato della funzione che delinea il tipo di
media, assume lo stesso valore quando al posto di xi, … xn, si pone M. La media è quella
quantità che, sostituita a ciascuna modalità del carattere, lascia inalterata una proprietà.
Nella media aritmetica la relazione è la somma:
Nella media geometrica è il prodotto:
Nella media armonica la proprietà che rimane inalterata è la somma dei reciproci.
Cos’è la Statistica - G. Garau, L. Schirru 2
3. La media aritmetica
La media aritmetica si calcola facendo la
somma delle modalità e dividendo il totale
per in numero di modalità.
x n M M i
Se però le modalità si ripetono più volte si utilizza la media aritmetica
ponderata, che ci calcola moltiplicando le modalità per le rispettive
frequenze e dividendo il valore ottenuto per il totale delle frequenze.
x n
n
M
i i
x
n
n
i
i
; da cui
1
i i M x f
Utilizzando le
frequenze assolute
Utilizzando le
frequenze relative
i
f f
n
n
e i i
i 1
n
perché la somma delle frequenze relative è uguale ad 1.
Cos’è la Statistica - G. Garau, L. Schirru 3
4. Esempio
La tabella seguente riporta i tempi (in minuti) registrati da 20 operai per la riparazione di una componente meccanica.
Calcolare la media aritmetica:
xi ni
2 3
3 3
4 5
5 4
6 3
8 2
tot 20
Se si usano le frequenze assolute:
89
(2 3) (3 3) (4 5) (5 4) (6 3) (8
2)
x n
i i
n
Se si usano xi ni fi le frequenze relative … occorre prima calcolarle:
2 3 0.15
3 3 0.15
4 5 0.25
5 4 0.2
6 3 0.15
8 2 0.1
N=20 1
n
f i
i
N
4,45
20
(3 4 5 4 3 2)
i
M
M xi fi (2 0,15) (3 0,15) (4 0,25) (5 0,20) (6 0,15) (8 0,10)
0,3 0,45 1 1 0,9 0,8 4,45
Cos’è la Statistica - G. Garau, L. Schirru 4
5. Media per valori raggruppati in classi.
(xi + xi+1] ni
[0 – 2] 40
(2 – 3] 80
(3 – 5] 60
(5 – 7] 20
La distribuzione presenta il tempo di attesa in minuti presso
la fermata Y della metropolitana per un operaio, in 200
giornate lavorative.
Calcolare il tempo medio di attesa.
In questo caso, in cui la distribuzione di frequenze ha le modalità ripartite in classi, la prima operazione da
fare è calcolare il valore centrale (o valore medio) delle singole classi.
(xi + xi+1] ni xc
[0 – 2] 40 1
(2 – 3] 80 2,5
(3 – 5] 60 4
(5 – 7] 20 6
Una volta calcolati i valori centrali (indicati con xc) si procede al calcolo della
media aritmetica ponderata, così come presentato nella precedente slide.
3
600
200
(1 40) (2,5 80) (4 60) (6
20)
(40 80 60 20)
x
n
i i
n
i
M
Cos’è la Statistica - G. Garau, L. Schirru 5
6. La media geometrica
La media geometrica si utilizza quando si vuole calcolare la media di processi di tipo moltiplicativo
(es.: inflazione, remunerazione del capitale, crescita di popolazioni) su vari periodi di tempo.
M g x x
n n
x n
i
i
n
1
1 ...
Se le modalità si ripetono più volte si utilizza la media geometrica ponderata
n
n
i
n
i
n n
n
n
g M x x n x
1
1 1 ... ponderata
M x x n
x i
n
i
f
i
f
n
f
g
1
1
1 1 ... ponderata
Utilizzando le
frequenze assolute
Utilizzando le
frequenze relative
Cos’è la Statistica - G. Garau, L. Schirru 6
7. Esempio
La tabella riporta il tasso di incremento del prodotto interno lordo
(PIL) in una nazione negli anni dal 95 al 2002.
Determinare il tasso di incremento medio.
anni tasso
1995 2%
1996 3%
1997 1%
1998 2%
1999 4%
2000 5%
2001 6%
2002 4%
Utilizzando la formula della media geometrica semplice si ottiene
1
... 8 2 3 1 2 4 5 6 4 8 5760 2,95%
1
n
n
i
i
n
Mg x xn x
Utilizzando la formula della media geometrica ponderata si ottiene
ponderata ... 1 2 3 4 5 6 8 5760 2,95 8 2 2
1
1
1
n
n
i
n
i
n n
n
n
Mg x x x n
Il risultato non cambia. Il tasso di incremento medio è uguale al 2,95%
Cos'è la Statistica - G. Garau, L. Schirru 7
8. La media armonica
La media armonica si utilizza quando le grandezze sono inversamente
proporzionali, ad es. si può calcolare la velocità media di un tragitto,
conoscendo le velocità medie tenute nei vari intervalli spaziali che costituiscono
il tragitto.
i
a
x
n
M
1
n
i
i
a
x
n
M ponderata
Cos'è la Statistica - G. Garau, L. Schirru 8
9. Esempio
Una persona spende per il riscaldamento di tre anni consecutivi sempre la stessa cifra:
2000 euro all’anno, acquistando il combustibile a Euro 0.55 il primo anno, Euro 0.61 il
secondo, Euro 0.68 il terzo. Determinare il costo medio di un litro di combustibile per
l’intero periodo.
Sono stati acquistati:
•il primo anno n = 2000/0.55 = 3636 litri;
•il secondo anno n = 2000/0.61 = 3279 litri;
•il terzo anno n = 2000/0.68 = 2941 litri
Il costo medio al litro per l’intero periodo sarà:
0,6088 euro
3
2000
costo medio
3636 3279 2941
costo totale
totale litri
Questo stesso risultato si ottiene molto più rapidamente con la media armonica del costo al litro:
0,6088 euro
1
0,68
1
0,61
1
0,55
3
costo medio
Cos'è la Statistica - G. Garau, L. Schirru 9
10. Alcune proprietà della media
La media è un operatore lineare per il quale valgono le seguenti proprietà:
PROPRIETA’ DIMOSTRAZIONI
Cos'è la Statistica - G. Garau, L. Schirru 10
11. La moda
• Il valore modale, o moda:
• La classe modale:
Si calcola per i caratteri qualitativi o quantitativi
discreti e corrisponde alla modalità a cui è
associata la massima frequenza.
Si calcola per i caratteri raggruppati in
classi (siano quantitativi discreti o continui).
Se le classi hanno la stessa ampiezza, si
individua la classe modale in corrispondenza
della massima frequenza.
Se le classi hanno la ampiezze diverse, si
assume come classe modale quella con la
massima densità di frequenza.
La moda corrisponde a 4
Cos’è la Statistica - G. Garau, L. Schirru 11
12. La mediana
In una sequenza di dati ordinati dal più piccolo al più grande la mediana, o valore mediano, occupa la posizione
intermedia, nel senso che è quel valore che bipartisce in parti uguali la totalità delle frequenze.
Nel caso di dati quantitativi discreti:
Se n (totale delle osservazioni) è dispari, la mediana
corrisponde all’osservazione di rango (o posizione
( 1)
2
n
Me
Se n (totale delle osservazioni) è pari, sia n=2h,
allora la mediana è, per convenzione, uguale alla
media aritmetica dei due termini in posizione
centrale:
h h x x
Me
2
1 quind i
2
; 1
2
1
n
h
n
h
Nel caso di dati raggruppati in classi
Si individua la classe mediana, quella cui corrisponde il
50% delle frequenze, e poi si ottiene il valore mediano,
interpolando all’interno della classe mediana (si ipotizza
che, all’interno delle classi, vi sia ripartizione uniforme
delle frequenze).
Cos'è la Statistica - G. Garau, L. Schirru 12
13. Esempio
Partendo dalla seguente distribuzione per classi di età, fornire
una adeguata rappresentazione grafica e calcolare la classe
mediana, la classe modale e la media aritmetica:
Trattandosi di dati quantitativi raggruppati in classi l’adeguata rappresentazione
grafica è l’Istogramma, che si può costruire se si hanno a disposizione le densità di
frequenza e le ampiezze di classe, riportati nella seguente tabella.
Con queste informazioni si può ora costruire l’istogramma.
densità di frequenza assoluta.
densità di frequenza relativa
n
i
i
i
i
i
i
f
a
h
a
d
Cos'è la Statistica - G. Garau, L. Schirru 13
14. La media, per dati raggruppati in classi, si calcola utilizzando come xi i valori centrali delle classi, xc:
N.B. Da adesso in poi si utilizzeranno, indifferentemente, i simboli M, ẋ e μ per indicare la media. Il simbolo μ si utilizza
solitamente per indicare il valore medio della popolazione, e il simbolo ẋ per indicare il valore medio di dati
campionari.
Cos'è la Statistica - G. Garau, L. Schirru 14
15. Calcolo della mediana mediante interpolazione.
Per le variabili continue, il raggruppamento in classi delle modalità consente di determinare solo la classe mediana
nella quale ricade l’unità statistica che bipartisce la distribuzione ordinata delle modalità.
Un singolo indice sintetico può essere ottenuto approssimando la funzione di ripartizione attorno alla mediana.
x F
e indicano rispettivamente, il valore superiore e la frequenza cumulata della classe mediana;
Me Me
x F
Me Me
1 e 1 indicano invece, il valore inferiore e la frequenza cumulata della classe mediana.
Cos’è la Statistica - G. Garau, L. Schirru 15
16. Per concludere l’esercizio precedente calcoliamo il valore mediano della distribuzione per classi di
età.
Cos’è la Statistica - G. Garau, L. Schirru 16
17. Altri indici di posizione
Il midrange
Un altro indice di posizione che considera però solo i valori estremi assunti dalla variabile è il midrange, che è
dato dalla media tra la più piccola e la più grande delle osservazioni (modalità) di un insieme di dati.
Si calcola così:
I quartili sono le misure di posizione non centrale più ampiamente usate. Vengono impiegati in particolar modo
quando si sintetizzano o si descrivono le caratteristiche di ampi insiemi di dati quantitativi. Mentre la mediana è un
valore che divide a metà la serie ordinata delle osservazioni, i quartili dividono i dati ordinati in quattro parti. Altri
quantili usati di frequenza sono i decili, che dividono i dati ordinati in dieci parti, e i percentili, che dividono i dati
ordinati in cento parti.
Il primo quartile, Q1 è il valore tale che il 25% delle osservazioni è più piccolo di Q1 e il 75% è più grande di Q1.
Il terzo quartile, Q3 è il valore tale che il 75% delle osservazioni è più piccolo di Q3 e il 25% delle osservazioni è più grande
di Q3.
Cos’è la Statistica - G. Garau, L. Schirru 17
Editor's Notes
Titolo: Gli indici di posizione.
Aggiungere definizioni delle parole in grassetto come approfondimento.
Titolo: La media
Titolo: La media aritmetica
Titolo: Esempio di calcolo della media aritmetica ponderata
Esempio di calcolo della media aritmetica con valori raggruppati in classi.
Titolo: La media geometrica
Titolo: Esempio di calcolo della media geometrica, semplice e ponderata
Titolo: La media armonica.
Titolo: Esempio di calcolo della media armonica
Titolo: Alcune proprietà della media.
Titolo: Il valore modale.
Titolo: La Mediana
Titolo: Esempio di calcolo della mediana
Seconda schermata dell’esempio precedente.
Titolo: Calcolo della mediana mediante interpolazione.