Ciro Cattuto - Data Science: dati, modelli, decisioni - Digital for Business
1. DATA SCIENCE:
DATI, MODELLI, DECISIONI
Ciro Cattuto
ISI Foundation, Torino
@ciro
Digital Festival, 7 maggio 2013
BIG DATA – SCENARIO E TECNOLOGIA ABILITANTE
3. il quarto paradigma
“The new model is for the data to be captured by instruments or
generated by simulations before being processed by software and
for the resulting information or knowledge to be stored in
computers. Scientists only get to look at their data fairly late in this
pipeline. The techniques and technologies for such data-intensive
science are so different that it is worth distinguishing data-intensive
science from computational science as a new, fourth paradigm for
scientific exploration.”
- Jim Gray, 2007
1. empirico
2. teorico
3. computazionale
4. nuovi paradigmi decisionali
“Data-intensive science, if done right, will mean more
paradigm shifts of scientific theory, happening faster,
because we can rapidly assess our worldview against the
‘objective reality’ we can so powerfully measure.”
- John Wilbanks (Creative Commons), 2007
10. ✓ grande numero di componenti
✓ interazioni fra componenti
✓ strutture gerarchiche multi-scala
✓ interazione fra scale diverse
✓ auto-organizzazione (no blueprint)
✓ proprietà emergenti
✓ “complesso” è più che “complicato”
infrastructural + social
A. Koblin
P. Butler
11. ✓ grande numero di componenti
✓ interazioni fra componenti
✓ strutture gerarchiche multi-scala
✓ interazione fra scale diverse
✓ auto-organizzazione (no blueprint)
✓ proprietà emergenti
✓ “complesso” è più che “complicato”
infrastructural + social
A. Koblin
P. Butler
★ la fine del pensiero lineare
★ interdipendenza e rischio sistemico
★ il problema dell’inferenza causale
15. tracce digitali
prospettiva storica
orizzonte temporale limitato
riproducibilità limitata
contesto limitato
privacy e protezione dati
disponibili come effetto collaterale di attività ordinarie
alto livello di copertura, accesso alle grandi scale
possibilità di elaborazione automatica
16. tracce digitali
prospettiva storica
orizzonte temporale limitato
riproducibilità limitata
contesto limitato
privacy e protezione dati
disponibili come effetto collaterale di attività ordinarie
alto livello di copertura, accesso alle grandi scale
possibilità di elaborazione automatica
natura fondazionale
dell’accesso alle tracce digitali di comportamenti umani
17. il nuovo ruolo dei dati
http://www.weforum.org/issues/rethinking-personal-data
18. il nuovo ruolo dei dati
http://www.weforum.org/issues/rethinking-personal-data
19. metodologia
tracce digitali di comportamento
come evidenza di primo ordine
per decisioni globali
data-
driven
modeling
machine learning
data mining
natural language processing
scalable computational infrastructures ICT
data-driven decision & policy making
20. metodologia
tracce digitali di comportamento
come evidenza di primo ordine
per decisioni globali
data-
driven
modeling
machine learning
data mining
natural language processing
scalable computational infrastructures ICT
data-driven decision & policy making
valore?
21.
22. If we are going to really capitalize on big data,
we need to get human insight at machine scale.