Your SlideShare is downloading. ×
0
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

# Gli Strumenti del Pensiero - 2

425

Published on

* Mentire coi numeri …

* Mentire coi numeri

Massimo Redaelli

Seconda lezione del corso "Gli Strumenti del Pensiero", all'interno dell'Università dell'Età della Ragione organizzata nel 2011 dal Circolo di Milano dell'UAAR

Published in: Education
0 Comments
0 Likes
Statistics
Notes
• Full Name
Comment goes here.

Are you sure you want to Yes No
Your message goes here
• Be the first to comment

• Be the first to like this

No Downloads
Views
Total Views
425
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
9
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

### Transcript

• 1. Mentire coi numeri Massimo Redaelli Universit` dell’Et` della Ragione a a UAAR Milano milano@uaar.it www.uaar.it/milano 13 Febbraio 2011Educaf´ – Politecnico di Milano e
• 2. Mentire coi numeri When you can measure what you are speaking about, Massimo Redaelli and express it in numbers, you know something aboutQualit` dei a it; but when you cannot measure it, when you cannotsingoli dati express it in numbers, your knowledge is of a meagerTipi dimisurazioniProblemi nelle and unsatisfactory kind. (Lord Kelvin, Electrical Unitsmisurazioni of Measurement (1883))Qualit` acomplessivadei dati So here we are, awash in a sea of numbers [. . . ]Qualit`adell’analisi Measurement is no diﬀerent from any of the otherCorrelazione ecausazione trappings of modern society. We can be its master orAltri errori we can be its slave [. . . ] This means knowing whereQualit` della apresentazione they come from [. . . ], knowing what they mean, whatScelta dellestatistiche they don’t mean, how they lead us, and how they canGraﬁcaFattori“psicologici” mislead us. (Henshaw 2006)Bibliograﬁa
• 3. Il fascino dei numeri Mentire coi numeri Massimo RedaelliQualit` dei asingoli datiTipi dimisurazioniProblemi nellemisurazioniQualit` acomplessivadei datiQualit`adell’analisiCorrelazione ecausazioneAltri erroriQualit` della apresentazioneScelta dellestatisticheGraﬁcaFattori“psicologici”Bibliograﬁa Borotalco Roberts
• 4. E della “brain science” Mentire coi numeri Massimo Fatto, dichiarato vero. Quattro spiegazioni: RedaelliQualit` dei a Giusta, senza neuro Giusta, neurosingoli datiTipi di Inutile, senza neuro Inutile, neuromisurazioniProblemi nellemisurazioni Valutare quanto ` soddisfacente ogni spiegazione: eQualit` acomplessivadei dati −3 −2 −1 0 1 2 3Qualit`adell’analisi Insoddisfacente SoddisfacenteCorrelazione ecausazioneAltri erroriQualit` della a Risultato (Legrenzi e Umilt` 2009, pag. 70): apresentazioneScelta dellestatistiche giuste arricchite = giusteGraﬁcaFattori“psicologici” inutili arricchite > inutiliBibliograﬁa
• 5. Riassunto Mentire coi numeri 1 Qualit` dei singoli dati a Massimo Redaelli Tipi di misurazioniQualit` dei a Problemi nelle misurazionisingoli datiTipi dimisurazioni 2 Qualit` complessiva dei dati aProblemi nellemisurazioni 3 Qualit` dell’analisi aQualit` acomplessiva Correlazione e causazionedei dati Altri erroriQualit`adell’analisiCorrelazione ecausazione 4 Qualit` della presentazione aAltri errori Scelta delle statisticheQualit` della apresentazione GraﬁcaScelta dellestatistiche Fattori “psicologici”GraﬁcaFattori“psicologici” 5 BibliograﬁaBibliograﬁa
• 6. Un caso esemplare Mentire coi numeri Massimo RedaelliQualit` dei a Test di soddisfazione su 30 donne dopo 4 settimane d’uso:singoli datiTipi dimisurazioni Il colorito ` pi` chiaro (78%) e uProblemi nellemisurazioni La pelle ` lenita e pi` liscia (88%) e uQualit` acomplessiva Test d’eﬃcacia su 30 donne tra 8 settimane d’uso:dei datiQualit`a Riduzione della taglio delle macchie : −15%dell’analisiCorrelazione e Aumentazione della radiosit` del colorito : +15% acausazioneAltri errori (Essenza Fiore Di Luminosit` Immortelle) aQualit` della apresentazioneScelta dellestatisticheGraﬁcaFattori“psicologici”Bibliograﬁa
• 7. Mentire coi numeri Massimo RedaelliQualit` dei asingoli datiTipi dimisurazioniProblemi nelle Section 1misurazioniQualit` acomplessivadei dati Qualit` dei singoli dati aQualit`adell’analisiCorrelazione ecausazioneAltri erroriQualit` della apresentazioneScelta dellestatisticheGraﬁcaFattori“psicologici”Bibliograﬁa
• 8. Riassunto Mentire coi numeri 1 Qualit` dei singoli dati a Massimo Redaelli Tipi di misurazioniQualit` dei a Problemi nelle misurazionisingoli datiTipi dimisurazioni 2 Qualit` complessiva dei dati aProblemi nellemisurazioni 3 Qualit` dell’analisi aQualit` acomplessiva Correlazione e causazionedei dati Altri erroriQualit`adell’analisiCorrelazione ecausazione 4 Qualit` della presentazione aAltri errori Scelta delle statisticheQualit` della apresentazione GraﬁcaScelta dellestatistiche Fattori “psicologici”GraﬁcaFattori“psicologici” 5 BibliograﬁaBibliograﬁa
• 9. Alcuni numeri sono pi` numeri di altri u Mentire coi numeri Massimo RedaelliQualit` dei asingoli datiTipi dimisurazioni Diabete di tipo 1 e tipo 2Problemi nellemisurazioni Tumore di stadio 1, 2, 3 e 4Qualit` acomplessiva Anno 1, 2, 3, . . .dei datiQualit`a Alto 1 metro, 2 metri, . . .dell’analisiCorrelazione ecausazione Si veda (Henshaw 2006).Altri erroriQualit` della apresentazioneScelta dellestatisticheGraﬁcaFattori“psicologici”Bibliograﬁa
• 10. Scale nominali Mentire coi numeri Massimo RedaelliQualit` dei asingoli dati Sono pure etichette, senza relazioni tra loro.Tipi dimisurazioniProblemi nelle Esempi:misurazioniQualit` a Diabete di tipo 1 e tipo 2complessivadei dati Uomo, donnaQualit`adell’analisi Classiﬁcazioni DSMCorrelazione ecausazioneAltri errori ...Qualit` della apresentazioneScelta dellestatisticheGraﬁcaFattori“psicologici”Bibliograﬁa
• 11. Scale ordinali Mentire coi numeri Massimo Redaelli Sono pure etichette, ma con un ordinamento naturale (pi`, uQualit` dei asingoli dati meno).Tipi dimisurazioniProblemi nelle Esempi:misurazioniQualit` a Tumore di stadio 1, 2, 3 e 4complessivadei dati Bambino, adulto, anzianoQualit`adell’analisi Quasi tutte le classiﬁcheCorrelazione ecausazione QIAltri erroriQualit` della a ...presentazioneScelta delle La distanza tra uno stadio e l’altro non ` deﬁnita. estatisticheGraﬁcaFattori“psicologici”Bibliograﬁa
• 12. Rozza ma, in pratica, pesante! Mentire coi numeri Classiﬁca delle Universit`: a Massimo Redaelli Grande business editoriale (Henshaw 2006, pag. 42)Qualit` dei a Importanza nelle politiche universitarie (fondi)singoli datiTipi dimisurazioni Stelle Michelin: passando da due a tre stelle, incremento delProblemi nellemisurazioni 60% degli aﬀari (La C`te d’Or, in Henshaw 2006, pag. 40) oQualit` acomplessiva QI, SAT, . . . :dei datiQualit`a Miliardi spesi dalle scuole e dalle aziendedell’analisiCorrelazione ecausazione Legislazioni (pena di morte)Altri errori NCLB: in Mississippi i test sono cos` semplici che il 90% ` ı eQualit` della apresentazione proﬁcient – ma coi test nazionali si scende a 18% (PearsonScelta dellestatistiche 2010, pag. 9)GraﬁcaFattori“psicologici” Partiti in politica: sempre in ﬁla da destra a sinistraBibliograﬁa (Gigerenzer 2007, pag. 141)
• 13. Scale intervallo Mentire coi numeri Massimo Redaelli Ha senso parlare di diﬀerenza tra i valori.Qualit` dei asingoli dati Esempi:Tipi dimisurazioniProblemi nelle Anno 1, 2, 3, . . .misurazioniQualit` a Temperatura in celsiuscomplessivadei dati ...Qualit`adell’analisi Ma non c’` uno zero ﬁsso – e quindi non si pu` parlare di e oCorrelazione ecausazione doppio, met`. aAltri erroriQualit` della apresentazione La pelliccia di cincill` ` trenta volte pi` morbida dei capelli ae uScelta dellestatistiche umani (Wikipedia)GraﬁcaFattori“psicologici”Bibliograﬁa
• 14. Scale rapporto Mentire coi numeri Massimo Redaelli “Vere” misurazioni.Qualit` dei asingoli dati Esempi:Tipi dimisurazioniProblemi nelle Alto 1 metro, 2 metri, . . . (metro)misurazioniQualit` a velocit` (tachimetro) acomplessivadei dati tempo (cronometro)Qualit`adell’analisi temperatura in kelvin (termometro)Correlazione ecausazioneAltri errori ...Qualit` della a ` lungo il doppio; ci mette la met`; . . . E apresentazione ExScelta dellestatisticheGraﬁcaFattori“psicologici”Bibliograﬁa
• 15. Un graﬁco Mentire coi numeri Massimo RedaelliQualit` dei asingoli datiTipi dimisurazioniProblemi nellemisurazioniQualit` acomplessivadei datiQualit`adell’analisiCorrelazione ecausazioneAltri erroriQualit` della apresentazioneScelta dellestatistiche Shampoo ClearGraﬁcaFattori“psicologici”Bibliograﬁa
• 16. Riassunto Mentire coi numeri 1 Qualit` dei singoli dati a Massimo Redaelli Tipi di misurazioniQualit` dei a Problemi nelle misurazionisingoli datiTipi dimisurazioni 2 Qualit` complessiva dei dati aProblemi nellemisurazioni 3 Qualit` dell’analisi aQualit` acomplessiva Correlazione e causazionedei dati Altri erroriQualit`adell’analisiCorrelazione ecausazione 4 Qualit` della presentazione aAltri errori Scelta delle statisticheQualit` della apresentazione GraﬁcaScelta dellestatistiche Fattori “psicologici”GraﬁcaFattori“psicologici” 5 BibliograﬁaBibliograﬁa
• 17. Sincerit` a Mentire coi numeri Massimo Redaelli Siti “romantici” online. Nei proﬁli (Levitt e Dubner 2006,Qualit` dei a pag. 80):singoli datiTipi di il 70% delle donne e il 67% degli uomini belli sopra lamisurazioniProblemi nelle media;misurazioniQualit` a il 4% dichiara di guadagnare pi` di 200 000 \$ all’anno ucomplessivadei dati (contro l’1% media navigatori)Qualit`adell’analisi uomini e donne 2 cm in media pi` alti della media uCorrelazione ecausazione nazionaleAltri erroriQualit` della a donne pesano 8 kg meno della media nazionalepresentazioneScelta delle Anche gli utenti milanesi di GayRomeo dichiarano unastatisticheGraﬁca “dotazione” media che non ` media. Ex eFattori“psicologici”Bibliograﬁa
• 18. E anche se sinceri. . . Mentire coi numeri Massimo La gente pu` non capire o Redaelli “Regulation of corporate proﬁts?” Donne nere del sudQualit` dei asingoli dati molto contrarie (Pearson 2010, pag. 52)Tipi dimisurazioniProblemi nelle La gente sbaglia in buona fedemisurazioniQualit` a Aﬃdabilit` dei testimoni acomplessivadei dati Bias cognitivi di tutti i tipi (nelle prossime due lezioni)Qualit`adell’analisi Conﬁrmation biasCorrelazione ecausazione Inﬂuenzabilit` aAltri erroriQualit` della a Sovrastima delle proprie capacit` apresentazioneScelta dellestatistiche ...Graﬁca ExFattori“psicologici”Bibliograﬁa
• 19. Misurazione in Psicologia Mentire coi numeri Massimo RedaelliQualit` dei asingoli dati Even what is often regarded ad a good result – aTipi dimisurazioni correlation of 0.3 – leaves 90 per cent of the criterionProblemi nellemisurazioni variance unxeplained. (Kline 1998, pag. 37)Qualit` acomplessivadei dati The results from personality tests have to be treatedQualit`a with extreme caution. Personality inventory [. . . ] aredell’analisiCorrelazione e unlikely to be accurate and valid for many reasons.causazioneAltri errori (Kline 1998, pag. 160)Qualit` della apresentazioneScelta dellestatisticheGraﬁcaFattori“psicologici”Bibliograﬁa
• 20. Mentire coi numeri Massimo RedaelliQualit` dei asingoli datiTipi dimisurazioniProblemi nelle Section 2misurazioniQualit` acomplessivadei dati Qualit` complessiva dei dati aQualit`adell’analisiCorrelazione ecausazioneAltri erroriQualit` della apresentazioneScelta dellestatisticheGraﬁcaFattori“psicologici”Bibliograﬁa
• 21. Rappresentativit` a Mentire coi numeri Massimo RedaelliQualit` dei a 1936, elezioni presidenziali USAsingoli datiTipi dimisurazioni Literary Digest: sondaggioProblemi nellemisurazioni telefonicoQualit` acomplessiva tra i suoi abbonati.dei datiQualit`a Landon (repubblicano) era in vantaggio su Rooseveltdell’analisiCorrelazione e (democratico), con pi` del doppio delle preferenze. ucausazioneAltri erroriQualit` della apresentazioneScelta dellestatisticheGraﬁcaFattori“psicologici”Bibliograﬁa
• 22. Rappresentativit` a Mentire coi numeri Massimo RedaelliQualit` dei a 1936, elezioni presidenziali USAsingoli datiTipi dimisurazioni Literary Digest: sondaggioProblemi nellemisurazioni telefonicoQualit` acomplessiva tra i suoi abbonati.dei datiQualit`a Landon (repubblicano) era in vantaggio su Rooseveltdell’analisiCorrelazione e (democratico), con pi` del doppio delle preferenze. ucausazioneAltri erroriQualit` della a Peccato che poi ha perso (“landslide”). (Huﬀ 1993)presentazioneScelta dellestatisticheGraﬁcaFattori“psicologici”Bibliograﬁa
• 23. Numerosit` a Mentire coi numeri Massimo RedaelliQualit` dei asingoli dati Dentifricio Doakes’: riduce le carie del 23%.Tipi dimisurazioniProblemi nelle Gruppo di persone:misurazioniQualit` a prima sei mesi con altro dentifricio: quante carie?complessivadei dati poi Doakes, altri sei mesi: quante carie?Qualit`adell’analisiCorrelazione ecausazioneAltri erroriQualit` della apresentazioneScelta dellestatisticheGraﬁcaFattori“psicologici”Bibliograﬁa
• 24. Numerosit` a Mentire coi numeri Massimo RedaelliQualit` dei asingoli dati Dentifricio Doakes’: riduce le carie del 23%.Tipi dimisurazioniProblemi nelle Gruppo di persone:misurazioniQualit` a prima sei mesi con altro dentifricio: quante carie?complessivadei dati poi Doakes, altri sei mesi: quante carie?Qualit`adell’analisiCorrelazione e OK, ma gruppo? 10 persone. . . (Huﬀ 1993).causazioneAltri errori ExQualit` della apresentazioneScelta dellestatisticheGraﬁcaFattori“psicologici”Bibliograﬁa
• 25. Mentire coi numeri Massimo RedaelliQualit` dei asingoli datiTipi dimisurazioniProblemi nelle Section 3misurazioniQualit` acomplessivadei dati Qualit` dell’analisi aQualit`adell’analisiCorrelazione ecausazioneAltri erroriQualit` della apresentazioneScelta dellestatisticheGraﬁcaFattori“psicologici”Bibliograﬁa
• 26. Riassunto Mentire coi numeri 1 Qualit` dei singoli dati a Massimo Redaelli Tipi di misurazioniQualit` dei a Problemi nelle misurazionisingoli datiTipi dimisurazioni 2 Qualit` complessiva dei dati aProblemi nellemisurazioni 3 Qualit` dell’analisi aQualit` acomplessiva Correlazione e causazionedei dati Altri erroriQualit`adell’analisiCorrelazione ecausazione 4 Qualit` della presentazione aAltri errori Scelta delle statisticheQualit` della apresentazione GraﬁcaScelta dellestatistiche Fattori “psicologici”GraﬁcaFattori“psicologici” 5 BibliograﬁaBibliograﬁa
• 27. Zecche salubri Mentire coi numeri Massimo Nuove Ebridi (Vanuatu – Paciﬁco del Sud) Redaelli Fatti:Qualit` dei asingoli dati Chi ha la febbre non ha mai le zeccheTipi dimisurazioniProblemi nelle I sani di solito le hannomisurazioniQualit` a Conclusione: le zecche proteggono dalle malattie.complessivadei dati (Huﬀ 1993)Qualit`adell’analisiCorrelazione ecausazioneAltri erroriQualit` della apresentazione Febbre No zeccheScelta dellestatisticheGraﬁcaFattori“psicologici”Bibliograﬁa
• 28. Zecche salubri Mentire coi numeri Massimo Nuove Ebridi (Vanuatu – Paciﬁco del Sud) Redaelli Fatti:Qualit` dei asingoli dati Chi ha la febbre non ha mai le zeccheTipi dimisurazioniProblemi nelle I sani di solito le hannomisurazioniQualit` a Conclusione: le zecche proteggono dalle malattie.complessivadei dati (Huﬀ 1993)Qualit`adell’analisiCorrelazione ecausazioneAltri erroriQualit` della apresentazione Febbre No zeccheScelta dellestatisticheGraﬁcaFattori“psicologici”Bibliograﬁa
• 29. Zecche salubri Mentire coi numeri Massimo Nuove Ebridi (Vanuatu – Paciﬁco del Sud) Redaelli Fatti:Qualit` dei asingoli dati Chi ha la febbre non ha mai le zeccheTipi dimisurazioniProblemi nelle I sani di solito le hannomisurazioniQualit` a Conclusione: le zecche proteggono dalle malattie.complessivadei dati (Huﬀ 1993)Qualit`adell’analisiCorrelazione ecausazioneAltri erroriQualit` della apresentazione Febbre No zeccheScelta dellestatisticheGraﬁcaFattori“psicologici”Bibliograﬁa
• 30. O tempora! (1) Mentire coi numeri Massimo RedaelliQualit` dei a Correlazione positiva tra tempo sui videogiochi ed aggressivit`. asingoli datiTipi dimisurazioniProblemi nellemisurazioniQualit` acomplessivadei dati Videogiochi Aggressivit` aQualit`adell’analisiCorrelazione ecausazioneAltri erroriQualit` della apresentazioneScelta dellestatisticheGraﬁcaFattori“psicologici”Bibliograﬁa
• 31. O tempora! (1) Mentire coi numeri Massimo RedaelliQualit` dei a Correlazione positiva tra tempo sui videogiochi ed aggressivit`. asingoli datiTipi dimisurazioniProblemi nellemisurazioniQualit` acomplessivadei dati Videogiochi Aggressivit` aQualit`adell’analisiCorrelazione ecausazioneAltri erroriQualit` della apresentazioneScelta dellestatisticheGraﬁcaFattori“psicologici”Bibliograﬁa
• 32. O tempora! (1) Mentire coi numeri Massimo RedaelliQualit` dei a Correlazione positiva tra tempo sui videogiochi ed aggressivit`. asingoli datiTipi dimisurazioniProblemi nellemisurazioniQualit` acomplessivadei dati Videogiochi Aggressivit` aQualit`adell’analisiCorrelazione ecausazioneAltri erroriQualit` della apresentazioneScelta dellestatisticheGraﬁcaFattori“psicologici”Bibliograﬁa
• 33. O tempora! (2) Mentire coi numeri Massimo RedaelliQualit` dei asingoli dati Correlazione negativa tra fumo e voti scolastici (Huﬀ 1993).Tipi dimisurazioniProblemi nellemisurazioniQualit` acomplessivadei dati Fumo Cattivi votiQualit`adell’analisiCorrelazione ecausazioneAltri erroriQualit` della apresentazioneScelta dellestatisticheGraﬁcaFattori“psicologici”Bibliograﬁa
• 34. O tempora! (2) Mentire coi numeri Massimo RedaelliQualit` dei asingoli dati Correlazione negativa tra fumo e voti scolastici (Huﬀ 1993).Tipi dimisurazioniProblemi nellemisurazioniQualit` acomplessivadei dati Fumo Cattivi votiQualit`adell’analisiCorrelazione ecausazioneAltri erroriQualit` della apresentazioneScelta dellestatisticheGraﬁcaFattori“psicologici”Bibliograﬁa
• 35. O tempora! (2) Mentire coi numeri Massimo Redaelli Correlazione negativa tra fumo e voti scolastici (Huﬀ 1993).Qualit` dei asingoli datiTipi dimisurazioniProblemi nellemisurazioni Socialit` aQualit` acomplessivadei datiQualit`adell’analisiCorrelazione ecausazione Fumo Cattivi votiAltri erroriQualit` della apresentazioneScelta dellestatisticheGraﬁcaFattori“psicologici”Bibliograﬁa
• 36. Nomen omen Mentire coi numeri Massimo RedaelliQualit` dei a Persone con nomi “molto neri” (DeShawn) guadagnano insingoli datiTipi di media pi` di persone con nomi “bianchi” (William) (Levitt e umisurazioniProblemi nelle Dubner 2006, pag. 183).misurazioniQualit` acomplessivadei datiQualit`a Nome Bassodell’analisi nero stipendioCorrelazione ecausazioneAltri erroriQualit` della apresentazioneScelta dellestatisticheGraﬁcaFattori“psicologici”Bibliograﬁa
• 37. Nomen omen Mentire coi numeri Massimo RedaelliQualit` dei a Persone con nomi “molto neri” (DeShawn) guadagnano insingoli datiTipi di media pi` di persone con nomi “bianchi” (William) (Levitt e umisurazioniProblemi nelle Dubner 2006, pag. 183).misurazioniQualit` acomplessivadei datiQualit`a Nome Bassodell’analisi nero stipendioCorrelazione ecausazioneAltri erroriQualit` della apresentazioneScelta dellestatisticheGraﬁcaFattori“psicologici”Bibliograﬁa
• 38. Nomen omen Mentire coi numeri Massimo Persone con nomi “molto neri” (DeShawn) guadagnano in Redaelli media pi` di persone con nomi “bianchi” (William) (Levitt e uQualit` dei a Dubner 2006, pag. 183).singoli datiTipi dimisurazioniProblemi nellemisurazioni BassaQualit` acomplessiva culturadei dati genitoriQualit`adell’analisiCorrelazione ecausazioneAltri errori Nome BassoQualit` della apresentazione nero stipendioScelta dellestatisticheGraﬁcaFattori“psicologici”Bibliograﬁa
• 39. WTF Mentire coi numeri Massimo RedaelliQualit` dei a Stipendio dei preti presbiteriani del Massachussets e costo delsingoli dati rum all’Avana (Huﬀ 1993).Tipi dimisurazioniProblemi nellemisurazioniQualit` acomplessivadei datiQualit`a Stipendio preti Costo Rhumdell’analisiCorrelazione ecausazioneAltri erroriQualit` della apresentazioneScelta dellestatisticheGraﬁcaFattori“psicologici”Bibliograﬁa
• 40. WTF Mentire coi numeri Massimo RedaelliQualit` dei a Stipendio dei preti presbiteriani del Massachussets e costo delsingoli dati rum all’Avana (Huﬀ 1993).Tipi dimisurazioniProblemi nellemisurazioniQualit` acomplessivadei dati ?Qualit`a Stipendio preti Costo Rhumdell’analisiCorrelazione ecausazioneAltri erroriQualit` della apresentazioneScelta dellestatisticheGraﬁcaFattori“psicologici”Bibliograﬁa
• 41. Riassunto Mentire coi numeri 1 Qualit` dei singoli dati a Massimo Redaelli Tipi di misurazioniQualit` dei a Problemi nelle misurazionisingoli datiTipi dimisurazioni 2 Qualit` complessiva dei dati aProblemi nellemisurazioni 3 Qualit` dell’analisi aQualit` acomplessiva Correlazione e causazionedei dati Altri erroriQualit`adell’analisiCorrelazione ecausazione 4 Qualit` della presentazione aAltri errori Scelta delle statisticheQualit` della apresentazione GraﬁcaScelta dellestatistiche Fattori “psicologici”GraﬁcaFattori“psicologici” 5 BibliograﬁaBibliograﬁa
• 42. Incidenti stradali Mentire coi numeri Massimo RedaelliQualit` dei asingoli dati Sulle autostrade accadono quattro volte pi` incidenti alle 19:00 uTipi dimisurazioni che non alle 7:00.(Huﬀ 1993)Problemi nellemisurazioni “Viaggia di mattina! Hai quattro volte meno probabilit` di fare aQualit` acomplessiva un incidente”.dei datiQualit`adell’analisiCorrelazione ecausazioneAltri erroriQualit` della apresentazioneScelta dellestatisticheGraﬁcaFattori“psicologici”Bibliograﬁa
• 43. Incidenti stradali Mentire coi numeri Massimo RedaelliQualit` dei asingoli dati Sulle autostrade accadono quattro volte pi` incidenti alle 19:00 uTipi dimisurazioni che non alle 7:00.(Huﬀ 1993)Problemi nellemisurazioni “Viaggia di mattina! Hai quattro volte meno probabilit` di fare aQualit` acomplessiva un incidente”.dei datiQualit`adell’analisi Mutatis mutandis, ` meglio guidare quando c’` la nebbia e eCorrelazione ecausazione poich´ la maggior parte degli incidenti avvengono quando la eAltri errori nebbia non c’`. eQualit` della apresentazioneScelta dellestatisticheGraﬁcaFattori“psicologici”Bibliograﬁa
• 44. O.J. Mentire coi numeri Massimo RedaelliQualit` dei asingoli dati Avvocato di O.J. Simpson (Pearson 2010, pag. 182):Tipi dimisurazioniProblemi nelle solo 1 su 1000 degli uomini che picchiano la propria mogliemisurazioni la uccidono.Qualit` acomplessivadei dati quindi la probabilit` che O.J. Simpson abbia ucciso sua aQualit`a moglie ` 1 su 1000. edell’analisiCorrelazione ecausazioneAltri erroriQualit` della apresentazioneScelta dellestatisticheGraﬁcaFattori“psicologici”Bibliograﬁa
• 45. O.J. Mentire coi numeri Massimo RedaelliQualit` dei asingoli dati Avvocato di O.J. Simpson (Pearson 2010, pag. 182):Tipi dimisurazioniProblemi nelle solo 1 su 1000 degli uomini che picchiano la propria mogliemisurazioni la uccidono.Qualit` acomplessivadei dati quindi la probabilit` che O.J. Simpson abbia ucciso sua aQualit`a moglie ` 1 su 1000. edell’analisiCorrelazione e Ma la percentuale degli uomini che uccidono la propria mogliecausazioneAltri errori senza averla mai picchiata ` molto pi` bassa. . . e uQualit` della apresentazioneScelta dellestatisticheGraﬁcaFattori“psicologici”Bibliograﬁa
• 46. Percentuali in libert` a Mentire coi numeri Massimo RedaelliQualit` dei a I consumatori di un certo alimento hanno il 40% di probabilit` asingoli datiTipi di in pi` di sviluppare una malattia. umisurazioniProblemi nellemisurazioni Paura!Qualit` acomplessivadei datiQualit`adell’analisiCorrelazione ecausazioneAltri erroriQualit` della apresentazioneScelta dellestatisticheGraﬁcaFattori“psicologici”Bibliograﬁa
• 47. Percentuali in libert` a Mentire coi numeri Massimo RedaelliQualit` dei a I consumatori di un certo alimento hanno il 40% di probabilit` asingoli datiTipi di in pi` di sviluppare una malattia. umisurazioniProblemi nellemisurazioni Paura!Qualit` acomplessivadei dati Ma se i dati fossero che si ammalanoQualit`a 1.4 persone su 10 000 000, che mangiano l’alimento;dell’analisiCorrelazione ecausazione 1.0 persone su 10 000 000, che non mangiano l’alimento.Altri errori ExQualit` della apresentazioneScelta dellestatisticheGraﬁcaFattori“psicologici”Bibliograﬁa
• 48. In the navy! Mentire coi numeri Massimo RedaelliQualit` dei a Vecchia pubblicit` della Marina americana: asingoli datiTipi dimisurazioni durante la guerra Ispano-america, il tasso di mortalit` dei aProblemi nellemisurazioni marinai era dello 0.9%Qualit` acomplessiva stesso periodo, quello a New York era quasi doppio, l’1.6%dei datiQualit`a Conclusione: bene arruolarsi per vivere pi` a lungo! udell’analisiCorrelazione ecausazioneAltri erroriQualit` della apresentazioneScelta dellestatisticheGraﬁcaFattori“psicologici”Bibliograﬁa
• 49. In the navy! Mentire coi numeri Massimo RedaelliQualit` dei a Vecchia pubblicit` della Marina americana: asingoli datiTipi dimisurazioni durante la guerra Ispano-america, il tasso di mortalit` dei aProblemi nellemisurazioni marinai era dello 0.9%Qualit` acomplessiva stesso periodo, quello a New York era quasi doppio, l’1.6%dei datiQualit`a Conclusione: bene arruolarsi per vivere pi` a lungo! udell’analisiCorrelazione ecausazione Peccato che in marina ci vanno solo ventenni in buona salute.Altri errori ExQualit` della apresentazioneScelta dellestatisticheGraﬁcaFattori“psicologici”Bibliograﬁa
• 50. Enter Bayes Mentire coi numeri Massimo Redaelli Malattia M, e test T che la diagnostica.Qualit` dei asingoli dati Due possibili errori:Tipi dimisurazioni Quanti malati risultano sani? P[TS |M]Problemi nellemisurazioniQualit` a Quanti sani risultano malati? P[TM |S]complessivadei dati Supponiamo che siaQualit`adell’analisi P[TS |M] = 0.1 e P[TM |S] = 0.125Correlazione ecausazioneAltri errori e quindi P[TM |M] = 0.9 e P[TS |S] = 0.875Qualit` della apresentazione Buon test? (Bernardo e Smith 2000, pag. 44)Scelta dellestatisticheGraﬁcaFattori“psicologici”Bibliograﬁa
• 51. Teorema di Bayes Mentire coi numeri Massimo P[TM |M] · P[M] P[TM |M] · P[M Redaelli P[M|TM ] = = P[TM |M] · P[M] + P[TM |S] · P[S] P[TM ]Qualit` dei asingoli datiTipi dimisurazioniProblemi nellemisurazioniQualit` acomplessivadei datiQualit`adell’analisiCorrelazione ecausazioneAltri erroriQualit` della apresentazioneScelta dellestatisticheGraﬁcaFattori Ad esempio, se prendiamo P[M] = 0.1 (solo il 10% della“psicologici” popolazione ha la malattia), la probabilit` di essere davvero aBibliograﬁa malato quando il test dice di essere malato ` solo del 40%! e
• 52. Mentire coi numeri Massimo RedaelliQualit` dei asingoli datiTipi dimisurazioniProblemi nelle Section 4misurazioniQualit` acomplessivadei dati Qualit` della presentazione aQualit`adell’analisiCorrelazione ecausazioneAltri erroriQualit` della apresentazioneScelta dellestatisticheGraﬁcaFattori“psicologici”Bibliograﬁa
• 53. Riassunto Mentire coi numeri 1 Qualit` dei singoli dati a Massimo Redaelli Tipi di misurazioniQualit` dei a Problemi nelle misurazionisingoli datiTipi dimisurazioni 2 Qualit` complessiva dei dati aProblemi nellemisurazioni 3 Qualit` dell’analisi aQualit` acomplessiva Correlazione e causazionedei dati Altri erroriQualit`adell’analisiCorrelazione ecausazione 4 Qualit` della presentazione aAltri errori Scelta delle statisticheQualit` della apresentazione GraﬁcaScelta dellestatistiche Fattori “psicologici”GraﬁcaFattori“psicologici” 5 BibliograﬁaBibliograﬁa
• 54. Medie Mentire coi numeri Massimo Redaelli 12Qualit` dei a 10singoli datiTipi dimisurazioni 7Problemi nellemisurazioni 5Qualit` acomplessivadei dati 2 1 1Qualit`adell’analisiCorrelazione ecausazione 100 110 118 125 135 142 1400Altri erroriQualit` della apresentazione Media ≈ 158Scelta dellestatistiche Moda = 135GraﬁcaFattori“psicologici” Mediana = 125Bibliograﬁa
• 55. Scelte (s)comode Mentire coi numeri Massimo RedaelliQualit` dei asingoli datiTipi di La media ` molto sensibile agli outliers. emisurazioniProblemi nellemisurazioni Per esempioQualit` acomplessiva Bush parlava del risparmio ﬁscale medio con la mediadei datiQualit`a l’opposizione con la medianadell’analisiCorrelazione e (Pearson 2010, pag. 107)causazioneAltri erroriQualit` della apresentazioneScelta dellestatisticheGraﬁcaFattori“psicologici”Bibliograﬁa
• 56. Dispersione Mentire coi numeri Massimo 9 Redaelli 7 7 σ = 10.64Qualit` dei asingoli dati 5 5Tipi dimisurazioniProblemi nellemisurazioni 1 1Qualit` acomplessivadei dati 100 110 120 125 130 140 150Qualit`a 8 8dell’analisi σ = 19.14Correlazione ecausazione 5 5Altri errori 4 4Qualit` della apresentazioneScelta delle 1statisticheGraﬁcaFattori“psicologici” 100 110 120 125 130 140 150Bibliograﬁa
• 57. Politici scioccati Mentire coi numeri Massimo RedaelliQualit` dei asingoli datiTipi di Mervyn King, governatore della banca d’Inghilterra, hamisurazioniProblemi nelle cambiato presentazione della stima dell’inﬂazione per l’annomisurazioniQualit` a successivo mettendo invece di un numero solo (1.2) un rangecomplessivadei dati (0.8–1.5).Qualit`adell’analisi Molti politici scioccati.Correlazione ecausazione Epper` reputazione ` molto salita (Gigerenzer 2007, pag. 216). o eAltri erroriQualit` della apresentazioneScelta dellestatisticheGraﬁcaFattori“psicologici”Bibliograﬁa
• 58. Genitori scioccati Mentire coi numeri Massimo Redaelli “Norme di Gesell”Qualit` dei a Un bambino impara a:singoli datiTipi di stare seduto a sei mesi;misurazioniProblemi nellemisurazioni ...Qualit` acomplessiva Risultato: se mio ﬁglio a sei mesi non sta seduto, dev’esseredei dati malato/ritardato! (Huﬀ 1993)Qualit`adell’analisiCorrelazione ecausazioneAltri erroriQualit` della apresentazioneScelta dellestatisticheGraﬁcaFattori“psicologici”Bibliograﬁa
• 59. Genitori scioccati Mentire coi numeri Massimo Redaelli “Norme di Gesell”Qualit` dei a Un bambino impara a:singoli datiTipi di stare seduto a sei mesi;misurazioniProblemi nellemisurazioni ...Qualit` acomplessiva Risultato: se mio ﬁglio a sei mesi non sta seduto, dev’esseredei dati malato/ritardato! (Huﬀ 1993)Qualit`adell’analisi Meglio sarebbe stato direCorrelazione ecausazioneAltri errori la maggior parte dei bambini impara a stare sedutaQualit` della a tra i quattro e gli otto mesipresentazioneScelta dellestatisticheGraﬁca Oppure: (6 ± 2)mesi.Fattori“psicologici”Bibliograﬁa
• 60. Variazioni percentuali Mentire coi numeri Aiuti economici statali ricevuti da: Massimo Redaelli 14 142 710 persone su 258 137 000 (il 5.5% dellaQualit` dei a popolazione totale) nel 1993singoli datiTipi di 5 776 849 persone (il 2.1% della popolazione totale) nelmisurazioniProblemi nellemisurazioni 2000Qualit` a Che diminuzione c’` stata? ecomplessivadei dati 14 142 710 − 5 776 849 = 59%Qualit`adell’analisi 14 142 710Correlazione e 5 776 849causazione = 41%Altri errori 14 142 710Qualit` della apresentazione 5.5% − 2.1% = 3.4%Scelta delle 5.5% − 2.1%statisticheGraﬁca = 62%Fattori 5.5%“psicologici” ExBibliograﬁa
• 61. Punti di vista Mentire coi numeri Massimo Redaelli Istat Nel mese di marzo 2010, sulla base degli elementi ﬁnoraQualit` dei a disponibili, l’indice della produzione industrialesingoli datiTipi di destagionalizzato, con base 2005 = 100, ha registrato unamisurazioniProblemi nellemisurazioni diminuzione dello 0.1 per cento rispetto a febbraio 2010Qualit` acomplessivadei datiQualit`adell’analisiCorrelazione ecausazioneAltri erroriQualit` della apresentazioneScelta dellestatisticheGraﬁca (10 Maggio 2010)Fattori“psicologici”Bibliograﬁa
• 62. Punti di vista Mentire coi numeri Massimo Redaelli Istat Nel mese di marzo 2010, sulla base degli elementi ﬁnoraQualit` dei a disponibili, l’indice della produzione industrialesingoli datiTipi di destagionalizzato, con base 2005 = 100, ha registrato unamisurazioniProblemi nellemisurazioni diminuzione dello 0.1 per cento rispetto a febbraio 2010Qualit` a TG1 Forte aumento della produzione industriale italiana che acomplessivadei dati marzo ` cresciuta del 6.4 per cento, lo comunica l’Istat eQualit`a speciﬁcando che si tratta del dato migliore dal 2006.dell’analisiCorrelazione ecausazione Complessivamente nel primo trimestre 2010 la produzioneAltri errori ` aumentata del 3.1 per cento, rispetto allo stesso periodo eQualit` della apresentazione del 2009Scelta dellestatisticheGraﬁca (10 Maggio 2010)Fattori“psicologici”Bibliograﬁa
• 63. I dati Mentire coi numeri Massimo RedaelliQualit` dei asingoli datiTipi dimisurazioniProblemi nellemisurazioniQualit` acomplessivadei datiQualit`adell’analisiCorrelazione ecausazioneAltri erroriQualit` della apresentazioneScelta dellestatisticheGraﬁcaFattori“psicologici”Bibliograﬁa
• 64. Riassunto Mentire coi numeri 1 Qualit` dei singoli dati a Massimo Redaelli Tipi di misurazioniQualit` dei a Problemi nelle misurazionisingoli datiTipi dimisurazioni 2 Qualit` complessiva dei dati aProblemi nellemisurazioni 3 Qualit` dell’analisi aQualit` acomplessiva Correlazione e causazionedei dati Altri erroriQualit`adell’analisiCorrelazione ecausazione 4 Qualit` della presentazione aAltri errori Scelta delle statisticheQualit` della apresentazione GraﬁcaScelta dellestatistiche Fattori “psicologici”GraﬁcaFattori“psicologici” 5 BibliograﬁaBibliograﬁa
• 65. Creare crescita Mentire coi numeri Massimo Guardate come si guadagna! RedaelliQualit` dei asingoli datiTipi dimisurazioniProblemi nelle 20 480misurazioniQualit` acomplessivadei datiQualit`adell’analisiCorrelazione ecausazioneAltri errori 20 000Qualit` della apresentazioneScelta dellestatistiche 1 2 3 4 5 6 7GraﬁcaFattori“psicologici”Bibliograﬁa
• 66. Creare crescita Mentire coi numeri Uhm, epper`. . . o Massimo RedaelliQualit` dei asingoli datiTipi dimisurazioniProblemi nellemisurazioniQualit` acomplessivadei datiQualit`adell’analisi 20 000Correlazione ecausazioneAltri erroriQualit` della apresentazioneScelta dellestatisticheGraﬁcaFattori 0 1 2 3 4 5 6 7“psicologici”Bibliograﬁa
• 67. Difterite Mentire coi numeri Massimo Si pu` vedere cos` o ı: RedaelliQualit` dei asingoli datiTipi dimisurazioniProblemi nellemisurazioniQualit` acomplessivadei datiQualit`adell’analisiCorrelazione ecausazioneAltri erroriQualit` della apresentazioneScelta dellestatisticheGraﬁcaFattori“psicologici”Bibliograﬁa
• 68. Difterite Mentire coi numeri Oppure cos` ı: Massimo RedaelliQualit` dei asingoli datiTipi dimisurazioniProblemi nellemisurazioniQualit` acomplessivadei datiQualit`adell’analisiCorrelazione ecausazioneAltri erroriQualit` della apresentazioneScelta dellestatisticheGraﬁcaFattori“psicologici” Da Vital Statistics of the United States, riportato inBibliograﬁa http://www.whale.to/a/bystrianyk3.html.
• 69. Riferimenti ﬂuttuanti Mentire coi numeri Massimo RedaelliQualit` dei asingoli datiTipi dimisurazioniProblemi nellemisurazioniQualit` acomplessivadei datiQualit`adell’analisiCorrelazione ecausazioneAltri erroriQualit` della apresentazioneScelta dellestatisticheGraﬁcaFattori“psicologici”Bibliograﬁa Citato in Tufte 2001, pag. 54
• 70. Sproporzioni Mentire coi numeri Massimo RedaelliQualit` dei asingoli datiTipi dimisurazioniProblemi nellemisurazioniQualit` acomplessivadei datiQualit`adell’analisiCorrelazione ecausazioneAltri erroriQualit` della apresentazioneScelta dellestatisticheGraﬁcaFattori“psicologici”Bibliograﬁa Citato in Tufte 2001, pag. 62
• 71. Tuttifrutti Mentire coi numeri Massimo RedaelliQualit` dei asingoli datiTipi dimisurazioniProblemi nellemisurazioniQualit` acomplessivadei datiQualit`adell’analisiCorrelazione ecausazioneAltri erroriQualit` della apresentazioneScelta dellestatisticheGraﬁcaFattori“psicologici”Bibliograﬁa Citato in Tufte 2001, pag. 66
• 72. Riassunto Mentire coi numeri 1 Qualit` dei singoli dati a Massimo Redaelli Tipi di misurazioniQualit` dei a Problemi nelle misurazionisingoli datiTipi dimisurazioni 2 Qualit` complessiva dei dati aProblemi nellemisurazioni 3 Qualit` dell’analisi aQualit` acomplessiva Correlazione e causazionedei dati Altri erroriQualit`adell’analisiCorrelazione ecausazione 4 Qualit` della presentazione aAltri errori Scelta delle statisticheQualit` della apresentazione GraﬁcaScelta dellestatistiche Fattori “psicologici”GraﬁcaFattori“psicologici” 5 BibliograﬁaBibliograﬁa
• 73. Framing Mentire coi numeri Massimo RedaelliQualit` dei a Medico a pazienti:singoli datiTipi dimisurazioni Probabilit` di morire nell’intervento: 10% aProblemi nellemisurazioni Probabilit` di sopravvivere all’intervento: 90% aQualit` acomplessiva Quali pazienti si fanno operare pi` spesso? udei datiQualit`adell’analisiCorrelazione ecausazioneAltri erroriQualit` della apresentazioneScelta dellestatisticheGraﬁcaFattori“psicologici”Bibliograﬁa
• 74. Framing Mentire coi numeri Massimo RedaelliQualit` dei a Medico a pazienti:singoli datiTipi dimisurazioni Probabilit` di morire nell’intervento: 10% aProblemi nellemisurazioni Probabilit` di sopravvivere all’intervento: 90% aQualit` acomplessiva Quali pazienti si fanno operare pi` spesso? udei datiQualit`adell’analisi Prenda il bicchiere mezzo vuoto. (Gigerenzer 2007, pag. 99)Correlazione ecausazioneAltri errori Ma di questo si parler` nelle prossime due lezioni. aQualit` della apresentazioneScelta dellestatisticheGraﬁcaFattori“psicologici”Bibliograﬁa
• 75. Mentire coi numeri Massimo RedaelliQualit` dei asingoli datiTipi dimisurazioniProblemi nelle Section 5misurazioniQualit` acomplessivadei dati BibliograﬁaQualit`adell’analisiCorrelazione ecausazioneAltri erroriQualit` della apresentazioneScelta dellestatisticheGraﬁcaFattori“psicologici”Bibliograﬁa
• 76. Bibliograﬁa Mentire coi numeri Massimo Redaelli Bernardo, Jos´ M. e Adrian F. M. Smith (2000). Bayesian eQualit` dei asingoli dati Statistics. Wiley Series in Probability and Statistics. John WileyTipi dimisurazioni & Sons.Problemi nellemisurazioni Gigerenzer, Gerd (2007). Gut Feelings. Short Cuts to BetterQualit` acomplessiva Decision Making. London: Penguin Books.dei dati Henshaw, John M. (2006). Does Measurement Measure Up?Qualit`adell’analisi How Numbers Reveal & Conceal the Truth. Baltimore: TheCorrelazione ecausazione John Hopkins University Press.Altri errori Huﬀ, Darrell (1993). How to Lie With Statistics. W. W. NortonQualit` della apresentazione & Company. isbn: 0393310728.Scelta dellestatisticheGraﬁcaFattori“psicologici”Bibliograﬁa
• 77. Bibliograﬁa Mentire coi numeri Massimo Redaelli Kline, Paul (1998). The New Psychometrics. Science,Qualit` dei asingoli dati Psychology and Measurement. London: Routledge.Tipi dimisurazioni Legrenzi, Paolo e Carlo Umilt` (2009). Neuro-Mania. Il cervello aProblemi nellemisurazioni non spiega chi siamo. Bologna: il Mulino.Qualit` acomplessiva Levitt, Steven D. e Stephen J. Dubner (2006). Freakonomics.dei dati London: Penguin Books.Qualit`adell’analisi Pearson, Robert W. (2010). Statistical Persuasion. LosCorrelazione ecausazione Angeles: Sage.Altri errori Tufte, Edward R. (2001). The Visual Display of QuantitativeQualit` della apresentazione Information. Cheshire, connecticut: Graphics Press.Scelta dellestatisticheGraﬁcaFattori“psicologici”Bibliograﬁa