SlideShare a Scribd company logo
1 of 18
Download to read offline
BIG DATA
www.fordatascientist.org
Enfap Emilia Romagna
Ravenna febbraio 2019
CORRELAZIONI
CHE COSA
E’ UNA
CORRELA-
ZIONE?
E’ una relazione tra due
variabili, tale che a valori
più o meno distanti dalla
media di una
corrispondano valori più o
meno distante dalla
media della seconda,
seguendo una certa
regolarità
Coefficiente di correlazione di Pearson
Coefficiente di correlazione
Il coefficiente di correlazione r indica la direzione della
correlazione:
● un valore di −1 indica una perfetta correlazione
negativa;
● un valore di 0 indica totale assenza di correlazione;
● un valore di +1 indica una perfetta correlazione positiva.
Coefficiente di correlazione
COME SCOPRIRE SE
UNA DONNA E’
INCINTA SENZA
CHEDERGLIELO?
FACILE !!!
?
Donne iscritte nel
registro dei regali per
i bambini piccoli
Analizzando i dati raccolti, sono emerse alcune relazioni tra le persone
iscritte nel registro e i loro acquisti. Molta gente compra lozioni per la
pulizia della pelle, ma molte donne iscritte nel registro iniziano a
comprare grandi quantità di lozione non profumata all'inizio del
secondo trimestre. A volte nelle prime 20 settimane le donne incinte
acquistano grandi quantità di integratori di calcio, magnesio e zinco.
Molti acquirenti acquistano sapone e batuffoli di cotone, ma quando
qualcuno improvvisamente inizia a comprare grandi quantità di sapone
non profumato e sacchi di batuffoli di cotone, oltre a disinfettanti per le
mani e salviette, allora siamo vicini al grande evento.
Che cosa acquista una donna incinta ?
…….. attenti alle gaffe
Coefficiente di correlazione per ranghi di Spearman
dove r è l’ordinamento della
variabile X e s è l’ordinamento
della variabile Y
Da le serie X e Y, il coefficiente
per ranghi di Spearman è dato
da:
l neonato, per la sua peculiare
condizione immunitaria, è
particolarmente predisposto alle
infezioni.
Nel mondo si verificano
annualmente 5 milioni di morti in
epoca neonatale: oltre il 40% di
queste è dovuto a infezioni, che
costituiscono pertanto una causa
importante, se non la più
importante, di morbilità e mortalità
nei primi trenta giorni di vita.
Un team IBM e Univ. Ontario coordinati dalla dott.ssa McGregor
ha sperimentato un sw che analizza 16 parametri diversi di neonati
prematuri generando 1250 data point al secondo prevedendo,
attraverso la loro correlazione, una infezione 24 ore prima della
comparsa di sintomi evidenti. E’ stato scoperto (contro la logica
medica) che la stabilizzazione dei parametri vitali dei prematuri
precede spesso una infezione grave. I dati suggeriscono una
correlazione e non un rapporto di causalità. Per fare emergere
questa associazione si sono dovuti applicare metodi statistici a
un’enorme quantità di dati.
TRADUZIONE AUTOMATICA
REGOLE
GRAMMATICALI
DIZIONARIO
BILINGUE
SiSTEMA DI
TRADUZIONE
AUTOMATICO
Molto limitato
IBM 1966
TRADUZIONE AUTOMATICA
SITI BILINGUE
95 miliardi di
frasi in inglese
tradotte in un
lingua
Molto potente
DIBATTITI
PARLAMENTARI
NAZIONI UNITE
UNIONE
EUROPEA
Algoritmo di
traduzione
GOOGLE 2006
Attenzione alle correlazioni spurie
Vendite di gelati e attacchi di squali Vendite di gelati e numero di abitanti
Attenzione alle correlazioni spurie
Gelati e
temperature

More Related Content

More from Studiabo

Strutture dati 02-strutturecontrollo-funzionibuiltin
Strutture dati 02-strutturecontrollo-funzionibuiltinStrutture dati 02-strutturecontrollo-funzionibuiltin
Strutture dati 02-strutturecontrollo-funzionibuiltinStudiabo
 
Strutture dati 01-numeristringhe
Strutture dati 01-numeristringheStrutture dati 01-numeristringhe
Strutture dati 01-numeristringheStudiabo
 
Strutture dati 00-corso2018-2019
Strutture dati 00-corso2018-2019Strutture dati 00-corso2018-2019
Strutture dati 00-corso2018-2019Studiabo
 
Pres ulisse acciaio-ottobre2018
Pres ulisse acciaio-ottobre2018Pres ulisse acciaio-ottobre2018
Pres ulisse acciaio-ottobre2018Studiabo
 
Strutture dati 08-reshape
Strutture dati 08-reshapeStrutture dati 08-reshape
Strutture dati 08-reshapeStudiabo
 
Pres ulisse acciaio-aprile2018
Pres ulisse acciaio-aprile2018Pres ulisse acciaio-aprile2018
Pres ulisse acciaio-aprile2018Studiabo
 
Strutture dati 02-strutturecontrollo-funzionibuiltin
Strutture dati 02-strutturecontrollo-funzionibuiltinStrutture dati 02-strutturecontrollo-funzionibuiltin
Strutture dati 02-strutturecontrollo-funzionibuiltinStudiabo
 
Strutture dati 07-multiindex
Strutture dati 07-multiindexStrutture dati 07-multiindex
Strutture dati 07-multiindexStudiabo
 
Strutture dati 05-numpypandas
Strutture dati 05-numpypandasStrutture dati 05-numpypandas
Strutture dati 05-numpypandasStudiabo
 
Strutture dati 06-dataframe
Strutture dati 06-dataframeStrutture dati 06-dataframe
Strutture dati 06-dataframeStudiabo
 
Strutture dati 04-funzionicustom-classioggetti
Strutture dati 04-funzionicustom-classioggettiStrutture dati 04-funzionicustom-classioggetti
Strutture dati 04-funzionicustom-classioggettiStudiabo
 
Strutture dati 03-stutturedatibuiltin
Strutture dati 03-stutturedatibuiltinStrutture dati 03-stutturedatibuiltin
Strutture dati 03-stutturedatibuiltinStudiabo
 
Strutture dati 01-numeristringhe
Strutture dati 01-numeristringheStrutture dati 01-numeristringhe
Strutture dati 01-numeristringheStudiabo
 
Strutture dati 00-corso2018
Strutture dati 00-corso2018Strutture dati 00-corso2018
Strutture dati 00-corso2018Studiabo
 
Data mining 00-corso2017
Data mining 00-corso2017Data mining 00-corso2017
Data mining 00-corso2017Studiabo
 
Data mining 06-dataframe
Data mining 06-dataframeData mining 06-dataframe
Data mining 06-dataframeStudiabo
 
Data mining 05-numpypandas
Data mining 05-numpypandasData mining 05-numpypandas
Data mining 05-numpypandasStudiabo
 
Data mining 04-funzionicustom-classioggetti
Data mining 04-funzionicustom-classioggettiData mining 04-funzionicustom-classioggetti
Data mining 04-funzionicustom-classioggettiStudiabo
 
Data mining 03-stutturedatibuiltin
Data mining 03-stutturedatibuiltinData mining 03-stutturedatibuiltin
Data mining 03-stutturedatibuiltinStudiabo
 
Data mining 02-strutturecontrollo-funzionibuiltin
Data mining 02-strutturecontrollo-funzionibuiltinData mining 02-strutturecontrollo-funzionibuiltin
Data mining 02-strutturecontrollo-funzionibuiltinStudiabo
 

More from Studiabo (20)

Strutture dati 02-strutturecontrollo-funzionibuiltin
Strutture dati 02-strutturecontrollo-funzionibuiltinStrutture dati 02-strutturecontrollo-funzionibuiltin
Strutture dati 02-strutturecontrollo-funzionibuiltin
 
Strutture dati 01-numeristringhe
Strutture dati 01-numeristringheStrutture dati 01-numeristringhe
Strutture dati 01-numeristringhe
 
Strutture dati 00-corso2018-2019
Strutture dati 00-corso2018-2019Strutture dati 00-corso2018-2019
Strutture dati 00-corso2018-2019
 
Pres ulisse acciaio-ottobre2018
Pres ulisse acciaio-ottobre2018Pres ulisse acciaio-ottobre2018
Pres ulisse acciaio-ottobre2018
 
Strutture dati 08-reshape
Strutture dati 08-reshapeStrutture dati 08-reshape
Strutture dati 08-reshape
 
Pres ulisse acciaio-aprile2018
Pres ulisse acciaio-aprile2018Pres ulisse acciaio-aprile2018
Pres ulisse acciaio-aprile2018
 
Strutture dati 02-strutturecontrollo-funzionibuiltin
Strutture dati 02-strutturecontrollo-funzionibuiltinStrutture dati 02-strutturecontrollo-funzionibuiltin
Strutture dati 02-strutturecontrollo-funzionibuiltin
 
Strutture dati 07-multiindex
Strutture dati 07-multiindexStrutture dati 07-multiindex
Strutture dati 07-multiindex
 
Strutture dati 05-numpypandas
Strutture dati 05-numpypandasStrutture dati 05-numpypandas
Strutture dati 05-numpypandas
 
Strutture dati 06-dataframe
Strutture dati 06-dataframeStrutture dati 06-dataframe
Strutture dati 06-dataframe
 
Strutture dati 04-funzionicustom-classioggetti
Strutture dati 04-funzionicustom-classioggettiStrutture dati 04-funzionicustom-classioggetti
Strutture dati 04-funzionicustom-classioggetti
 
Strutture dati 03-stutturedatibuiltin
Strutture dati 03-stutturedatibuiltinStrutture dati 03-stutturedatibuiltin
Strutture dati 03-stutturedatibuiltin
 
Strutture dati 01-numeristringhe
Strutture dati 01-numeristringheStrutture dati 01-numeristringhe
Strutture dati 01-numeristringhe
 
Strutture dati 00-corso2018
Strutture dati 00-corso2018Strutture dati 00-corso2018
Strutture dati 00-corso2018
 
Data mining 00-corso2017
Data mining 00-corso2017Data mining 00-corso2017
Data mining 00-corso2017
 
Data mining 06-dataframe
Data mining 06-dataframeData mining 06-dataframe
Data mining 06-dataframe
 
Data mining 05-numpypandas
Data mining 05-numpypandasData mining 05-numpypandas
Data mining 05-numpypandas
 
Data mining 04-funzionicustom-classioggetti
Data mining 04-funzionicustom-classioggettiData mining 04-funzionicustom-classioggetti
Data mining 04-funzionicustom-classioggetti
 
Data mining 03-stutturedatibuiltin
Data mining 03-stutturedatibuiltinData mining 03-stutturedatibuiltin
Data mining 03-stutturedatibuiltin
 
Data mining 02-strutturecontrollo-funzionibuiltin
Data mining 02-strutturecontrollo-funzionibuiltinData mining 02-strutturecontrollo-funzionibuiltin
Data mining 02-strutturecontrollo-funzionibuiltin
 

Recently uploaded

Presentazioni Efficaci e lezioni di Educazione Civica
Presentazioni Efficaci e lezioni di Educazione CivicaPresentazioni Efficaci e lezioni di Educazione Civica
Presentazioni Efficaci e lezioni di Educazione CivicaSalvatore Cianciabella
 
Lorenzo D'Emidio_Vita di Cristoforo Colombo.pptx
Lorenzo D'Emidio_Vita di Cristoforo Colombo.pptxLorenzo D'Emidio_Vita di Cristoforo Colombo.pptx
Lorenzo D'Emidio_Vita di Cristoforo Colombo.pptxlorenzodemidio01
 
Lorenzo D'Emidio_Francesco Petrarca.pptx
Lorenzo D'Emidio_Francesco Petrarca.pptxLorenzo D'Emidio_Francesco Petrarca.pptx
Lorenzo D'Emidio_Francesco Petrarca.pptxlorenzodemidio01
 
Lorenzo D'Emidio_Vita e opere di Aristotele.pptx
Lorenzo D'Emidio_Vita e opere di Aristotele.pptxLorenzo D'Emidio_Vita e opere di Aristotele.pptx
Lorenzo D'Emidio_Vita e opere di Aristotele.pptxlorenzodemidio01
 
Lorenzo D'Emidio- Lavoro sulla Bioarchittetura.pptx
Lorenzo D'Emidio- Lavoro sulla Bioarchittetura.pptxLorenzo D'Emidio- Lavoro sulla Bioarchittetura.pptx
Lorenzo D'Emidio- Lavoro sulla Bioarchittetura.pptxlorenzodemidio01
 
Confronto tra Sparta e Atene classiche.ppt
Confronto tra Sparta e Atene classiche.pptConfronto tra Sparta e Atene classiche.ppt
Confronto tra Sparta e Atene classiche.pptcarlottagalassi
 
Quadrilateri e isometrie studente di liceo
Quadrilateri e isometrie studente di liceoQuadrilateri e isometrie studente di liceo
Quadrilateri e isometrie studente di liceoyanmeng831
 

Recently uploaded (7)

Presentazioni Efficaci e lezioni di Educazione Civica
Presentazioni Efficaci e lezioni di Educazione CivicaPresentazioni Efficaci e lezioni di Educazione Civica
Presentazioni Efficaci e lezioni di Educazione Civica
 
Lorenzo D'Emidio_Vita di Cristoforo Colombo.pptx
Lorenzo D'Emidio_Vita di Cristoforo Colombo.pptxLorenzo D'Emidio_Vita di Cristoforo Colombo.pptx
Lorenzo D'Emidio_Vita di Cristoforo Colombo.pptx
 
Lorenzo D'Emidio_Francesco Petrarca.pptx
Lorenzo D'Emidio_Francesco Petrarca.pptxLorenzo D'Emidio_Francesco Petrarca.pptx
Lorenzo D'Emidio_Francesco Petrarca.pptx
 
Lorenzo D'Emidio_Vita e opere di Aristotele.pptx
Lorenzo D'Emidio_Vita e opere di Aristotele.pptxLorenzo D'Emidio_Vita e opere di Aristotele.pptx
Lorenzo D'Emidio_Vita e opere di Aristotele.pptx
 
Lorenzo D'Emidio- Lavoro sulla Bioarchittetura.pptx
Lorenzo D'Emidio- Lavoro sulla Bioarchittetura.pptxLorenzo D'Emidio- Lavoro sulla Bioarchittetura.pptx
Lorenzo D'Emidio- Lavoro sulla Bioarchittetura.pptx
 
Confronto tra Sparta e Atene classiche.ppt
Confronto tra Sparta e Atene classiche.pptConfronto tra Sparta e Atene classiche.ppt
Confronto tra Sparta e Atene classiche.ppt
 
Quadrilateri e isometrie studente di liceo
Quadrilateri e isometrie studente di liceoQuadrilateri e isometrie studente di liceo
Quadrilateri e isometrie studente di liceo
 

Big data correlazioni

  • 1. BIG DATA www.fordatascientist.org Enfap Emilia Romagna Ravenna febbraio 2019 CORRELAZIONI
  • 2. CHE COSA E’ UNA CORRELA- ZIONE? E’ una relazione tra due variabili, tale che a valori più o meno distanti dalla media di una corrispondano valori più o meno distante dalla media della seconda, seguendo una certa regolarità
  • 4. Coefficiente di correlazione Il coefficiente di correlazione r indica la direzione della correlazione: ● un valore di −1 indica una perfetta correlazione negativa; ● un valore di 0 indica totale assenza di correlazione; ● un valore di +1 indica una perfetta correlazione positiva.
  • 6. COME SCOPRIRE SE UNA DONNA E’ INCINTA SENZA CHEDERGLIELO? FACILE !!!
  • 7. ?
  • 8.
  • 9. Donne iscritte nel registro dei regali per i bambini piccoli
  • 10. Analizzando i dati raccolti, sono emerse alcune relazioni tra le persone iscritte nel registro e i loro acquisti. Molta gente compra lozioni per la pulizia della pelle, ma molte donne iscritte nel registro iniziano a comprare grandi quantità di lozione non profumata all'inizio del secondo trimestre. A volte nelle prime 20 settimane le donne incinte acquistano grandi quantità di integratori di calcio, magnesio e zinco. Molti acquirenti acquistano sapone e batuffoli di cotone, ma quando qualcuno improvvisamente inizia a comprare grandi quantità di sapone non profumato e sacchi di batuffoli di cotone, oltre a disinfettanti per le mani e salviette, allora siamo vicini al grande evento. Che cosa acquista una donna incinta ?
  • 12. Coefficiente di correlazione per ranghi di Spearman dove r è l’ordinamento della variabile X e s è l’ordinamento della variabile Y Da le serie X e Y, il coefficiente per ranghi di Spearman è dato da:
  • 13. l neonato, per la sua peculiare condizione immunitaria, è particolarmente predisposto alle infezioni. Nel mondo si verificano annualmente 5 milioni di morti in epoca neonatale: oltre il 40% di queste è dovuto a infezioni, che costituiscono pertanto una causa importante, se non la più importante, di morbilità e mortalità nei primi trenta giorni di vita.
  • 14. Un team IBM e Univ. Ontario coordinati dalla dott.ssa McGregor ha sperimentato un sw che analizza 16 parametri diversi di neonati prematuri generando 1250 data point al secondo prevedendo, attraverso la loro correlazione, una infezione 24 ore prima della comparsa di sintomi evidenti. E’ stato scoperto (contro la logica medica) che la stabilizzazione dei parametri vitali dei prematuri precede spesso una infezione grave. I dati suggeriscono una correlazione e non un rapporto di causalità. Per fare emergere questa associazione si sono dovuti applicare metodi statistici a un’enorme quantità di dati.
  • 16. TRADUZIONE AUTOMATICA SITI BILINGUE 95 miliardi di frasi in inglese tradotte in un lingua Molto potente DIBATTITI PARLAMENTARI NAZIONI UNITE UNIONE EUROPEA Algoritmo di traduzione GOOGLE 2006
  • 17. Attenzione alle correlazioni spurie Vendite di gelati e attacchi di squali Vendite di gelati e numero di abitanti
  • 18. Attenzione alle correlazioni spurie Gelati e temperature