Slide del corso di statistica sociale del Prof. Giorgio Garau, per la laurea in Assistente sociale. Indici di posizione, variabilità e mutua variabilità: concentrazione ed eterogeneità.
Il ruolo della statistica nell'informazione a cura di Lucia Schirru
2. Programma
Presentazione del corso di statistica sociale
Il ruolo della statistica nell’informazione
Indici di posizione e misure di variabilità (ripasso)
Indicatori di mutua variabilità
• concentrazione
• eterogeneità
Comunicazione efficace
Statistica sociale 2
3. Suddivisione in settimane di corso
Programma date lezioni
Presentazione del corso di statistica sociale mercoledì 8 ottobre
Indici di posizione e misure di variabilità giovedì 9 ottobre
Concentrazione mercoledì 15 e giovedì 16 ottobre
Eterogeneità mercoledì 22 ottobre
Esercitazione in aula giovedì 23 ottobre
Il ruolo della statistica nell’informazione mercoledì 29 e giovedì 30 ottobre
Statistica sociale 3
4. Statistica
Sociale
Lucia Schirru
Valutazione e implementazione strategica di politiche
@luciaschirr
u
5. Il ruolo della statistica nell’informazione
Alcuni esempi di utilizzo della statistica:
Nel lavoro quotidiano dell’assistente sociale
Il Data journalism (mappe e grafici interattivi)
La comunicazione sul web: blog e social media
Statistica sociale 5
6. L’Assistente sociale
Attività lavorativa quotidiana:
elaborazione dati per predisporre report, tabelle di sintesi dei
servizi offerti, somme spese per destinazione d’uso, conoscenza
delle caratteristiche della popolazione e così via
Relazione con le parti sociali e con i mezzi di
comunicazione:
leggere e interpretare i bisogni della comunità in cui opera e
cogliere le possibilità offerte dalle politiche locali, regionali e
nazionali.
Statistica sociale 6
13. Per poter comunicare correttamente
bisogna avere delle basi di statistica
alcune nozioni di partenza
Statistica sociale 13
14. Indici di posizione e misure di variabilità
• Media
• Moda
• Mediana
• Varianza e scarto quadratico semplice
Statistica sociale 14
15. Gli indici di posizione
La rappresentazione grafica dei fenomeni non è sufficiente, una buona
analisi dei dati richiede anche che le caratteristiche principali delle
osservazioni siano sintetizzate con opportune misure e che tali misure
siano adeguatamente analizzate e interpretate.
Gli indici di posizione sintetizzano la posizione di una distribuzione di
frequenza mediante un valore reale rappresentativo della globalità del
fenomeno e tale da riassumere gli aspetti ritenuti più importanti.
Esaminano le misure di posizione:
MEDIA
MODA
MEDIANA
Statistica sociale 15
16. La media
Si dice che M è la media di n dati (xi, … xn,), se il risultato della funzione che delinea il tipo di media, assume lo
stesso valore quando al posto di xi, … xn, si pone M. La media è quella quantità che, sostituita a ciascuna
modalità del carattere, lascia inalterata una proprietà.
Nella media aritmetica la relazione è la somma:
Statistica sociale 16
17. La media aritmetica
La media aritmetica si calcola facendo la somma
delle modalità e dividendo il totale per in numero
di modalità.
x
x n M M i
Se però le modalità si ripetono più volte si utilizza la media aritmetica ponderata, che si calcola
moltiplicando le modalità per le rispettive frequenze e dividendo il valore ottenuto per il totale delle
frequenze.
x n
n
M
i i
n
n
i
i
; da cui
1
i i M x f
Utilizzando le
frequenze assolute
Utilizzando le
frequenze relative
i
f f
n
n
e i i
i 1
n
perché la somma delle frequenze relative è uguale ad 1.
Statistica sociale 17
18. Esempio
La tabella seguente riporta i tempi (in minuti) registrati da 20 operai per la riparazione di una componente
meccanica. Calcolare la media aritmetica:
xi ni
2 3
3 3
4 5
5 4
6 3
8 2
tot 20
Se si usano le frequenze assolute:
89
(2 3) (3 3) (4 5) (5 4) (6 3) (8
2)
x n
i i
n
Se si usano x le frequenze relative … occorre prima calcolarle: i ni fi
2 3 0.15
3 3 0.15
4 5 0.25
5 4 0.2
6 3 0.15
8 2 0.1
N=20 1
n
f i
i
N
4,45
20
(3 4 5 4 3 2)
i
M
M xi fi (2 0,15) (3 0,15) (4 0,25) (5 0,20) (6 0,15) (8 0,10)
0,3 0,45 1 1 0,9 0,8 4,45
Statistica sociale 18
19. Media per valori raggruppati in classi.
(xi + xi+1] ni
[0 – 2] 40
(2 – 3] 80
(3 – 5] 60
(5 – 7] 20
La distribuzione presenta il tempo di attesa di un operaio
(in minuti), presso la fermata Y della metropolitana, in 200
giornate lavorative.
Calcolare il tempo medio di attesa.
In questo caso, in cui la distribuzione di frequenze ha le modalità ripartite in classi, la prima operazione da fare è
calcolare il valore centrale (o valore medio) delle singole classi.
(xi + xi+1] ni xc
[0 – 2] 40 1
(2 – 3] 80 2,5
(3 – 5] 60 4
(5 – 7] 20 6
Una volta calcolati i valori centrali (indicati con xc) si procede al calcolo della
media aritmetica ponderata, così come presentato nella precedente slide.
3
600
200
(1 40) (2,5 80) (4 60) (6
20)
(40 80 60 20)
x
n
i i
n
i
M
Statistica sociale 19
20. Alcune proprietà della media
La media è un operatore lineare per il quale valgono le seguenti proprietà:
PROPRIETA’ DIMOSTRAZIONI
Statistica sociale 20
21. La moda
Il valore modale, o moda:
La classe modale:
Si calcola per i caratteri qualitativi o quantitativi discreti
e corrisponde alla modalità a cui è associata la
massima frequenza.
Si calcola per i caratteri raggruppati in classi
(siano quantitativi discreti o continui).
Se le classi hanno la stessa ampiezza, si individua
la classe modale in corrispondenza della massima
frequenza.
Se le classi hanno la ampiezze diverse, si
assume come classe modale quella con la
massima densità di frequenza.
La moda corrisponde a 4
Statistica sociale 21
22. La mediana
In una sequenza di dati ordinati dal più piccolo al più grande la mediana, o valore mediano, occupa la posizione intermedia, nel
senso che è quel valore che bipartisce in parti uguali la totalità delle frequenze.
Nel caso di dati quantitativi discreti:
Se n (totale delle osservazioni) è dispari, la mediana
corrisponde all’osservazione di rango (o posizione
( 1)
2
n
Me
Se n (totale delle osservazioni) è pari, sia n=2h, allora la
mediana è, per convenzione, uguale alla media aritmetica dei
due termini in posizione centrale:
h h x x
Me
2
1 quind i
2
; 1
2
1
n
h
n
h
Nel caso di dati raggruppati in classi
Si individua la classe mediana, quella cui corrisponde il 50%
delle frequenze, e poi si ottiene il valore mediano, interpolando
all’interno della classe mediana (si ipotizza che, all’interno delle
classi, vi sia ripartizione uniforme delle frequenze).
Statistica sociale 22
23. Esempio
Partendo dalla seguente distribuzione per classi di età, fornire una
adeguata rappresentazione grafica e calcolare la classe mediana, la
classe modale e la media aritmetica:
Trattandosi di dati quantitativi raggruppati in classi l’adeguata rappresentazione grafica è
l’Istogramma, che si può costruire se si hanno a disposizione le densità di frequenza e le
ampiezze di classe, riportati nella seguente tabella.
Con queste informazioni si può ora costruire l’istogramma.
densità di frequenza assoluta.
densità di frequenza relativa
n
i
i
i
i
i
i
f
a
h
a
d
Statistica sociale 23
24. La media, per dati raggruppati in classi, si calcola utilizzando come xi i valori centrali delle classi, xc:
N.B. Da adesso in poi si utilizzeranno, indifferentemente, i simboli M, ẋ e μ per indicare la media. Il simbolo μ si utilizza solitamente per indicare il
valore medio della popolazione, e il simbolo ẋ per indicare il valore medio di dati campionari.
Statistica sociale 24
25. Calcolo della mediana mediante interpolazione.
Per le variabili continue, il raggruppamento in classi delle modalità consente di determinare solo la classe mediana nella quale ricade
l’unità statistica che bipartisce la distribuzione ordinata delle modalità.
Un singolo indice sintetico può essere ottenuto approssimando la funzione di ripartizione attorno alla mediana.
x F
e indicano rispettivamente, il valore superiore e la frequenza cumulata della classe mediana;
Me Me
x F
Me Me
1 e 1 indicano invece, il valore inferiore e la frequenza cumulata della classe mediana.
Statistica sociale 25
26. Per concludere l’esercizio precedente calcoliamo il valore mediano della distribuzione per classi di età.
Statistica sociale 26
27. Le misure di variabilità
Una caratteristica importante di una distribuzione statistica è la sua variabilità. La variabilità è, infatti, la quantità di
dispersione presente nei dati. Come gli indici di posizione, anche gli indici di dispersione o variabilità servono per
descrivere sinteticamente (o caratterizzare) le distribuzioni statistiche quantitative (per le variabili qualitative si usano gli
indici di diversità).
Dati due insiemi di dati, questi possono differire sia
nella posizione del valore centrale (media) che nella
variabilità; oppure, come mostrato in figura,
possono essere caratterizzati dalla stessa
variabilità, ma da diverso valore centrale;
o ancora, come mostra questa figura, possono
avere lo stesso valore centrale, ma avere una
diversa variabilità
Statistica sociale 27
28. Il range o campo di variazione
Il range è la differenza tra l’osservazione più grande e quella più piccola in un insieme di dati. E’ importante sottolineare
che il range deve assumere sempre valori maggiori di zero. Quindi dobbiamo considerare il valore assoluto.
Sebbene il range sia una misura della dispersione totale, non tiene conto di come le osservazioni si
distribuiscano o si concentrino intorno a una misura di tendenza centrale, come ad esempio la media.
Presentiamo perciò altre misure di variabilità più appropriate.
Statistica sociale 28
29. La varianza e lo scarto quadratico medio.
Si considerino perciò due misure della variabilità, la varianza (σ2) e lo scarto quadratico medio (σ,
radice quadrata della varianza), che sintetizzano la dispersione dei valori osservati attorno alla loro
media
Una difficoltà nella interpretazione della varianza deriva dal fatto che essa è espressa nell’unità di misura del
fenomeno elevato al quadrato.
Per questo motivo si usa lo scarto quadratico medio, o deviazione standard che è così definito
Calcolato utilizzando le
frequenze assolute
Nel caso in cui le
modalità si ripetano più
volte (media
ponderata)
Calcolato utilizzando le
frequenze relative
Statistica sociale 29
30. Esempio
Si confrontino le due distribuzioni di voti conseguiti dagli studenti A e B. Cosa si può dedurre?
Se si confrontano queste distribuzioni per il valore assunto
dalla media, si noterà che entrambe assumono come valore
medio 3.5; si dovrebbe quindi concludere che le distribuzioni
sono identiche.
La rappresentazione grafica, fornita in figura, indica però,
che la distribuzione B è più dispersa
della distribuzione A, ma non fornisce una misura della
distanza tra le due dispersioni.
Tale misura è fornita dagli indicatori di variabilità.
VOTI
Range A = |1-6| =5
Range B = |1-6| =5
Anche il Range delle due distribuzioni coincide, per cui è necessario calcolare la varianza e lo
scarto quadratico medio per verificare l’effettiva differenza tra le due distribuzioni.
Statistica sociale 30
31. Calcolo della varianza e dello scarto quadratico medio
Per comodità si riportano tutti i dati in tabella
Sommando i quadrati degli scarti dalla media (pesati per le rispettive frequenze) si ottiene il valore della varianza.
Per la distribuzione A corrisponde a 0.8502 Per la distribuzione B corrisponde a 2.25.
Il valore dello scarto quadratico medio è pari a: 0.9221 per la distribuzione A mentre per la distribuzione B è pari a
1.5.
Questo significa che, come già si intuiva graficamente, nella Classe B i voti sono maggiormente dispersi
intorno alla media.
Statistica sociale 31
32. Il coefficiente di variazione
La varianza e lo scarto quadratico medio sono indici assoluti per cui è opportuno
introdurre indici relativi o normalizzati.
Un indice relativo molto usato, purché la media sia maggiore di zero (M > 0), è il rapporto tra lo
scarto quadratico medio σ e la media aritmetica M.
Si tratta del coefficiente di variazione CV.
Statistica sociale 32
33. Gli indici di mutua variabilità
Variabili quantitative: indice di concentrazione
Variabili qualitative: indice di eterogeneità
Statistica sociale 33
38. Gli indici di concentrazione
La concentrazione è una misura della mutua variabilità, cioè della variabilità tra ogni possibile
modalità di una variabile e tutte le altre.
L’analisi di concentrazione si può applicare alle variabili quantitative (es. reddito e popolazione)
perché queste variabili sono “trasferibili” da un possessore ad un altro (es. persona, nazione)
il totale posseduto da n unità statistiche.
T
yi
n
i
1
Si indica con
La concentrazione studia il modo in cui l’ammontare totale T si distribuisce fra le n classi.
Si possono considerare due situazioni estreme
- concentrazione minima (equidistribuzione):
le n unità statistiche possiedono uguale quantità
della variabile.
-concentrazione massima:
una unità possiede il totale e le altre n−1
possiedono un ammontare nullo della variabile.
y
1
n
y
T
n
y
n
i
i
i
y
T
n
y i n
0 ( 1, ... 1)
i
Statistica sociale 38
39. La rappresentazione grafica: Lorenz e Gini
Si consideri una distribuzione unitaria i cui termini
sono non negativi e disposti in ordine crescente:
Prendendo le prime unità (i), che saranno le più
povere e confrontando ciò che esse possiedono
con ciò che ad esse spetterebbe in una situazione
di equidistribuzione, in cui ai = μ (ogni unità
possiede esattamente il valore medio)
Se si divide per l’ammontare complessivo del carattere, An
numero delle unità
unità totali
Pi
si ottiene
Dove:
a a ai a
n
0 ... ...
*
1 2
a a i
A ... e A ...
i 1
i i
An a1 ... ai ...an n An
*
A
i
i
A
P
A
A
n
i
i
n
Q
Qi = % del carattere posseduto dalle prime i unità.
i
n
i
n
Ai A
n
Vale la relazione: Che può essere così trasformata:
*
n
i
media sino ad i media generale
Qi è tanto più vicino a Pi quanto più si è prossimi alla situazione di equidistribuzione
Statistica sociale 39
40. Esempio 1: Costruzione di una Spezzata di Lorenz per
distribuzioni unitarie.
La tabella riporta la Popolazione del Lazio
suddivisa per provincia di residenza (1990)
Riportando in un grafico i valori di Pi e Qi si ottiene la
spezzata di Lorenz.
Sulla bisettrice si trovano i punti tali che pi = qi.
-L’area tra la bisettrice e la spezzata di Lorenz è la
curva di concentrazione.
-Interpretazione dell’area: più è grande, maggiore è la
concentrazione.
- Nelle 3 province più piccole, ad esempio, risiede il
17.4% contro il 60% (equidistribuzione).
Statistica sociale 40
41. Concentrazione: esercizio
41
Concentrazione della popolazione tra le 5 province del Lazio
0,174
Statistica sociale
42. Esempio 2:
Costruzione della spezzata di Lorenz per distribuzioni in classi
Si consideri ora il caso in cui il carattere
(trasferibile) sia ripartito in classi:
è cioè noto l’ammontare xi del carattere
posseduto congiuntamente dalle ni unità che
appartengono alla classe i.
Le aziende della prima classe (cioè il
15.8% delle aziende totali) contribuiscono
solo al 1.58% del fatturato totale.
Statistica sociale 42
43. L’indice di concentrazione per distribuzioni unitarie
Oltre alla rappresentazione grafica è necessario utilizzare un indicatore per costruire della concentrazione e
in questo caso pare naturale una misura dell’area compresa tra la retta di equidistribuzione e la spezzata di
Lorenz.
Nel caso di distribuzioni unitarie l’area può essere scomposta nella somma di n trapezi, in particolare
l’i−esimo trapezio ha basi pari a Pi−1 − Qi−1 e Pi − Qi e altezza costante pari a 1/n.
1 1
1 1
Effettuando i vari passaggi si ottiene la seguente
formula:
g
Utilizzando i dati dell’Esempio 1 si costruisce l’indice
di concentrazione della popolazione del Lazio.
Questo valore indica un
grado di concentrazione
molto elevato, pari al 72%
della concentrazione
massima.
2
Area : (( ) ( ))
somma delle due basi
altezza
i i i i i
n
S P Q P Q
( )
1
2
1
1
i
n
i
Pi Q
n
Statistica sociale 43
44. Concentrazione: esercizio
44
A partire dai dati della popolazione e dei redditi dichiarati per comune nel 2013,
si confronti la distribuzione delle 8 province sarde e si valuti il livello di
concentrazione delle due variabili.
I dati della popolazione sono stati estratti dall’archivio Istat (http://demo.istat.it/)
I dati sui redditi dichiarati invece sono stati presi dal sito del Ministero delle Finanze
(http://www1.finanze.gov.it/pagina_dichiarazioni/dichiarazioni.html)
Statistica sociale
45. Concentrazione: esercizio
A titolo di esempio si riporta la tabella costruita per la provincia di Carbonia Iglesias in cui si presentano i vari
passaggi per il calcolo dell’indice di concentrazione
Statistica sociale
45
Carbonia Iglesias ai Ai Pi Qi Pi-Qi
1 Piscinas 880 880 0,04348 0,00688 0,03660
2 Villaperuccio 1.100 1980 0,08696 0,01547 0,07148
3 Tratalias 1.105 3085 0,13043 0,02411 0,10633
4 Buggerru 1.108 4193 0,17391 0,03277 0,14114
5 Masainas 1.342 5535 0,21739 0,04326 0,17413
6 Perdaxius 1.475 7010 0,26087 0,05478 0,20609
7Musei 1.541 8551 0,30435 0,06683 0,23752
8 Nuxis 1.614 10165 0,34783 0,07944 0,26839
9 Giba 2.097 12262 0,39130 0,09583 0,29548
10 Sant'Anna Arresi 2.703 14965 0,43478 0,11695 0,31783
11 Calasetta 2.810 17775 0,47826 0,13891 0,33935
12 Fluminimaggiore 2.957 20732 0,52174 0,16202 0,35972
13 Narcao 3.321 24053 0,56522 0,18798 0,37724
14 Santadi 3.550 27603 0,60870 0,21572 0,39298
15 Villamassargia 3.663 31266 0,65217 0,24435 0,40783
16 Gonnesa 5.120 36386 0,69565 0,28436 0,41129
17 Portoscuso 5.239 41625 0,73913 0,32530 0,41383
18 San Giovanni Suergiu 6.097 47722 0,78261 0,37295 0,40966
19 Carloforte 6.237 53959 0,82609 0,42169 0,40439
20 Domusnovas 6.353 60312 0,86957 0,47134 0,39822
21 Sant'Antioco 11.430 71742 0,91304 0,56067 0,35238
22 Iglesias 27.532 99274 0,95652 0,77583 0,18069
23 Carbonia 28.684 127958 1,00000 1,00000 0,00000
Totale 127.958 0,57
48. Concentrazione: province a confronto
48
Indice di concentrazione Popolazione Reddito
Sassari 0,76 0,81
Nuoro 0,63 0,63
Cagliari 0,67 0,73
Oristano 0,61 0,66
Olbia Tempio 0,59 0,63
Ogliastra 0,41 0,46
Medio Campidano 0,57 0,58
Carbonia Iglesias 0,57 0,63
Statistica sociale
49. L’indice di concentrazione per distribuzioni in classi
Nel caso di distribuzioni in classi si avrà invece
un’area, scomposta in un numero di trapezi uguale
al numero delle classi considerate. L’altezza non
sarà più costante ma sarà uguale a
S sarà quindi uguale a:
Riprendendo i dati del secondo esempio:
k
1
S [(PN i QN i ) (P Q )] f
i
2
1
( ) ( )
B1 B2
PN(i) PN(i1) fi
N ( i 1) N ( i 1)
i
In questo secondo caso la concentrazione è pari al 55% della concentrazione massima.
Statistica sociale 49
50. Concentrazione dei redditi
Statistica sociale 50
Analisi statistiche - Dichiarazioni 2013 - Anno d'imposta 2012
Tipo di imposta : IRPEF
Modello : Persone fisiche totali
Tipologia contribuente : Tutte le tipologie di contribuenti
Tematica : Caratteristiche dei contribuenti
Classificazione : Classi di reddito complessivo in euro
Data ultimo aggiornamento : 9 Luglio 2014
2012
Classi di reddito complessivo in euro
Numero contribuenti
Frequenza Percentuale
minore di -1.000 166.984 0,40
da -1.000 a 0 48.830 0,12 fi
zero 883.388 2,13 0,02
da 0 a 1.000 2.022.386 4,88 0,05
da 1.000 a 1.500 597.557 1,44 0,01
da 1.500 a 2.000 550.503 1,33 0,01
da 2.000 a 2.500 496.058 1,20 0,01
da 2.500 a 3.000 453.497 1,10 0,01
da 3.000 a 3.500 404.167 0,98 0,01
da 3.500 a 4.000 399.952 0,97 0,01
da 4.000 a 5.000 784.346 1,89 0,02
da 5.000 a 6.000 774.468 1,87 0,02
da 6.000 a 7.500 3.178.332 7,67 0,08
da 7.500 a 10.000 3.086.003 7,45 0,07
da 10.000 a 12.000 2.473.990 5,97 0,06
da 12.000 a 15.000 3.592.400 8,67 0,09
da 15.000 a 20.000 6.486.667 15,66 0,16
da 20.000 a 26.000 6.000.649 14,49 0,15
da 26.000 a 29.000 2.036.649 4,92 0,05
da 29.000 a 35.000 2.589.189 6,25 0,06
da 35.000 a 40.000 1.219.016 2,94 0,03
da 40.000 a 50.000 1.216.056 2,94 0,03
da 50.000 a 55.000 340.568 0,82 0,01
da 55.000 a 60.000 259.554 0,63 0,01
da 60.000 a 70.000 375.101 0,91 0,01
da 70.000 a 75.000 144.318 0,35 0,00
da 75.000 a 80.000 120.603 0,29 0,00
da 80.000 a 90.000 178.398 0,43 0,00
da 90.000 a 100.000 122.829 0,30 0,00
da 100.000 a 120.000 151.250 0,37 0,00
da 120.000 a 150.000 109.978 0,27 0,00
da 150.000 a 200.000 74.969 0,18 0,00
da 200.000 a 300.000 45.259 0,11 0,00
oltre 300.000 30.240 0,07 0,00
TOTALE 41.414.154 100,00
51. Concentrazione dei redditi
Statistica sociale 51
Classi di reddito complessivo
in euro
Numero contribuenti
Frequenza fi xc ai Ai Pi Pi Qi Pi-Qi (A) Pi-1 - Qi-1 (B) (A+B)*fi
zero 883.388 0,02 - - 0 883.388 0,0214 - 0,021442 0 0,00046
da 0 a 1.000 2.022.386 0,05 500 1.011.193.000 1.011.193.000 2.905.774 0,0705 0,001262 0,069269 0,021442 0,00445
da 1.000 a 1.500 597.557 0,01 1.250 746.946.250 1.758.139.250 3.503.331 0,0850 0,002195 0,082841 0,069269 0,00221
da 1.500 a 2.000 550.503 0,01 1.750 963.380.250 2.721.519.500 4.053.834 0,0984 0,003398 0,095000 0,082841 0,00238
da 2.000 a 2.500 496.058 0,01 2.250 1.116.130.500 3.837.650.000 4.549.892 0,1104 0,004791 0,105648 0,095000 0,00242
da 2.500 a 3.000 453.497 0,01 2.750 1.247.116.750 5.084.766.750 5.003.389 0,1214 0,006348 0,115098 0,105648 0,00243
da 3.000 a 3.500 404.167 0,01 3.250 1.313.542.750 6.398.309.500 5.407.556 0,1313 0,007988 0,123269 0,115098 0,00234
da 3.500 a 4.000 399.952 0,01 3.750 1.499.820.000 7.898.129.500 5.807.508 0,1410 0,009860 0,131104 0,123269 0,00247
da 4.000 a 5.000 784.346 0,02 4.500 3.529.557.000 11.427.686.500 6.591.854 0,1600 0,014267 0,145736 0,131104 0,00527
da 5.000 a 6.000 774.468 0,02 5.500 4.259.574.000 15.687.260.500 7.366.322 0,1788 0,019584 0,159217 0,145736 0,00573
da 6.000 a 7.500 3.178.332 0,08 6.750 21.453.741.000 37.141.001.500 10.544.654 0,2559 0,046367 0,209581 0,159217 0,02845
da 7.500 a 10.000 3.086.003 0,07 8.750 27.002.526.250 64.143.527.750 13.630.657 0,3309 0,080078 0,250777 0,209581 0,03448
da 10.000 a 12.000 2.473.990 0,06 11.000 27.213.890.000 91.357.417.750 16.104.647 0,3909 0,114052 0,276853 0,250777 0,03168
da 12.000 a 15.000 3.592.400 0,09 13.500 48.497.400.000 139.854.817.750 19.697.047 0,4781 0,174597 0,303506 0,276853 0,05061
da 15.000 a 20.000 6.486.667 0,16 17.500 113.516.672.500 253.371.490.250 26.183.714 0,6356 0,316313 0,319240 0,303506 0,09805
da 20.000 a 26.000 6.000.649 0,15 23.000 138.014.927.000 391.386.417.250 32.184.363 0,7812 0,488613 0,292592 0,319240 0,08911
da 26.000 a 29.000 2.036.649 0,05 27.500 56.007.847.500 447.394.264.750 34.221.012 0,8306 0,558534 0,272106 0,292592 0,02792
da 29.000 a 35.000 2.589.189 0,06 32.000 82.854.048.000 530.248.312.750 36.810.201 0,8935 0,661971 0,231517 0,272106 0,03165
da 35.000 a 40.000 1.219.016 0,03 37.500 45.713.100.000 575.961.412.750 38.029.217 0,9231 0,719040 0,204037 0,231517 0,01289
da 40.000 a 50.000 1.216.056 0,03 45.000 54.722.520.000 630.683.932.750 39.245.273 0,9526 0,787356 0,165237 0,204037 0,01090
da 50.000 a 55.000 340.568 0,01 52.500 17.879.820.000 648.563.752.750 39.585.841 0,9609 0,809678 0,151183 0,165237 0,00262
da 55.000 a 60.000 259.554 0,01 57.500 14.924.355.000 663.488.107.750 39.845.395 0,9672 0,828309 0,138851 0,151183 0,00183
da 60.000 a 70.000 375.101 0,01 65.000 24.381.565.000 687.869.672.750 40.220.496 0,9763 0,858748 0,117517 0,138851 0,00233
da 70.000 a 75.000 144.318 0,00 72.500 10.463.055.000 698.332.727.750 40.364.814 0,9798 0,871810 0,107958 0,117517 0,00079
da 75.000 a 80.000 120.603 0,00 77.500 9.346.732.500 707.679.460.250 40.485.417 0,9827 0,883479 0,099217 0,107958 0,00061
da 80.000 a 90.000 178.398 0,00 85.000 15.163.830.000 722.843.290.250 40.663.815 0,9870 0,902409 0,084616 0,099217 0,00080
da 90.000 a 100.000 122.829 0,00 95.000 11.668.755.000 734.512.045.250 40.786.644 0,9900 0,916977 0,073030 0,084616 0,00047
da 100.000 a 120.000 151.250 0,00 110.000 16.637.500.000 751.149.545.250 40.937.894 0,9937 0,937747 0,055931 0,073030 0,00047
da 120.000 a 150.000 109.978 0,00 135.000 14.847.030.000 765.996.575.250 41.047.872 0,9963 0,956283 0,040065 0,055931 0,00026
da 150.000 a 200.000 74.969 0,00 175.000 13.119.575.000 779.116.150.250 41.122.841 0,9982 0,972661 0,025506 0,040065 0,00012
da 200.000 a 300.000 45.259 0,00 250.000 11.314.750.000 790.430.900.250 41.168.100 0,9993 0,986787 0,012479 0,025506 0,00004
oltre 300.000 30.240 0,00 350.000 10.584.000.000 801.014.900.250 41.198.340 1,0000 1,000000 - 0,012479 0,00001
41.198.340 0,456
52. Statistica sociale 52
Eterogeneità
L’indice di eterogeneità si applica in caso di variabili qualitative, che non possono essere
trasferite tra soggetti. Es. qualifica funzionale, livello retributivo, valutazioni di merito,
ecc.
56. Nella tabella che segue si riportano le caratteristiche degli addetti di un'azienda.
Calcolare l'indice di eterogeneità della qualifica funzionale e del regime di impiego.
56
Eterogeneità: esercizi
ID Stipendio Età Anni servizioQualifica funzionale Regime di impiego
1 2650 40 15 Operaio Tempo pieno
2 2600 43 5 Operaio Part time
3 2050 35 6 Impiegato Tempo pieno
4 3500 27 6 Dirigente Part time
5 1400 36 3 Dirigente Collaboratori esterni
6 2400 30 12 Impiegato Tempo pieno
7 1900 41 13 Operaio Tempo pieno
8 2100 35 4 Impiegato Tempo pieno
9 2100 27 7 Operaio Tempo pieno
10 3050 38 18 Dirigente Tempo pieno
11 2800 38 20 Operaio Collaboratori esterni
12 2950 41 11 Operaio Collaboratori esterni
13 1900 36 4 Dirigente Collaboratori esterni
14 1650 29 11 Impiegato Collaboratori esterni
15 2550 40 4 Impiegato Collaboratori esterni
16 2000 23 10 Impiegato Tempo pieno
17 2150 26 8 Operaio Collaboratori esterni
18 2900 41 9 Dirigente Tempo pieno
19 2450 35 12 Operaio Collaboratori esterni
20 1950 31 8 Dirigente Collaboratori esterni
Statistica sociale
57. 57
Eterogeneità: esercizi
Qualifica funzionale ni fi fi^2
Dirigente 6 0,3 0,09
Impiegato 6 0,3 0,09
Operaio 8 0,4 0,16
Totale addetti 20 1 0,34
indice di eterogeneità 0,66
G (max) 0,67
Indice di eterogeneità normalizzato 0,99
Regime d’impiego ni fi fi^2
Collaboratori esterni 9 0,45 0,2025
Part time 2 0,1 0,01
Tempo pieno 9 0,45 0,2025
Totale addetti 20 1 0,415
indice di eterogeneità 0,59
G (max) 0,67
Indice di eterogeneità normalizzato 0,8775
Statistica sociale
58. Esercizio completo con indici di posizione, di variabilità e di mutua variabilità
58
Statistica sociale
59. Comunicazione efficace.
L’utilizzo della statistica nei nuovi media e nei
social network
Il Data journalism (mappe e grafici interattivi)
La comunicazione sul web: blog e social media
Statistica sociale 59
Editor's Notes
Discutere assieme dell’utilità della statistica nella vita quotidiana. Oltre al lavoro la statistica è parte della vita quotidiana perché ogni giorno e sempre di più da quando siamo in crisi ci bombardano di statistiche, non sempre veritiere. Bisogna inoltre tener conto che i nuovi strumenti di comunicazione prevedono che se ne faccia un uso anche maggiore. Se vuoi comunicare devi conoscere le metriche per farlo, fare le analisi dei trend, valutare le caratteristiche del target di utenti scelto e così via. Tutte cose che si fanno con strumenti informatici.
Esempi di uso dei dati nell’informazione. Mappe e grafici interattivi da usare sul web
Un esempio di approfondimento giornalistico, supportato dalle analisi dei dati. In questo caso il mezzo è il quotidiano cartaceo
Uno strumento sempre più in voga e di utilizzo molteplice sono le infografiche, ma anche le mappe interattive che vengono utilizzate sia in ambito statistico ma anche nella comunicazione quotidiana. Sono strumenti marketing ad esempio
Un’inchiesta fatta con lo strumento del webdoc sul sovraffollamento nelle carceri italiane
Quanti beni sono stati confiscati alle mafie? Dove sono? Inchiesta di Dataninja sponsorizzata da un editore
Altri esempi di utilizzo dei dati per scopi divulgativi e informativi
Queste sono le basi di conoscenza che deve possedere. Essere in grado di utilizzare degli indicatori di sintesi e di rappresentare dei fenomeni.
Gli indici di posizione.
Titolo: La media
Titolo: La media aritmetica
Titolo: Esempio di calcolo della media aritmetica ponderata
Esempio di calcolo della media aritmetica con valori raggruppati in classi.
Titolo: Alcune proprietà della media.
Titolo: Il valore modale.
Titolo: La Mediana
Titolo: Esempio di calcolo della mediana
Seconda schermata dell’esempio precedente.
Titolo: Calcolo della mediana mediante interpolazione.
Titolo: Esempio: calcolo del valore mediano
Titolo: Le misure di variabilità
Le misure di variabilità: il range
Le misure di variabilità: la varianza e lo scarto quadratico medio.
Titolo: Esempio di calcolo degli indici di variabilità.
Titolo: Esempio di calcolo della varianza e dello scarto quadratico medio.
Titolo: La rappresentazione grafica, Lorenz e Gini
Titolo: Esempio 1: Costruzione di una spezzata di Lorenz (per distribuzioni unitarie).
Se ci fosse equidistribuzione al valore 0,6 di Pi corrisponderebbe 0,6 di Qi e non 0,174, come invece succede nel caso indicato nella slide, in cui è evidente che il fenomeno è concentrato e non equidistribuito.
L’indice di concentrazione dirà in quale misura il fenomeno è concentrato.
Titolo: Esempio 2: Costruzione di una spezzata di Lorenz (per distribuzioni in classi)
Titolo: L’indice di concentrazione per distribuzioni unitarie
Carbonia Iglesias è tra le province più piccole e i dati sono rappresentabili in una slide.
Un’analisi grafica mette in evidenza che la provincia con il più basso livello di concentrazione della popolazione è l’Ogliastra, viceversa Sassari ha la concentrazione maggiore. Le posizioni intermedie non sono valutabili graficamente perché le curve si sovrappongono, c’è quindi bisogno di calcolare un indice di concentrazione.
Anche in riferimento al reddito si passa dall’Ogliastra a Sassari passando per tutte le altre province, ma per stilare una graduatoria occorre costruire un indicatore di concentrazione
Confrontando la concentrazione della popolazione residente per comune nelle 8 province sarde nel 2013 con la concentrazione dei redditi dichiarati lo stesso anno dai contribuenti si ottengono gli indicatori in tabella. Il reddito è ben più concentrato della popolazione in tutte le province ad esclusione di Nuoro.
Il confronto della concentrazione della popolazione tra il 2003 e il 2013 ha messo in evidenza delle leggere variazioni, ma non significative. La concentrazione del reddito non si può confrontare col passato per mancanza di informazioni.
Mettere a disposizione i dati con i calcoli
Titolo: L’indice di concentrazione per distribuzioni in classi
Dati di partenza del file di excel. Fonte Ministero delle finanze