2. Sommario
I “Big Data” sono basi di dati tanto grandi e complesse
da richiedere strumenti di processamento e gestione
non convenzionali;
Il trattamento adeguato di queste immense miniere di
dati, attraverso tecnologie di calcolo e software
avanzati, promette di far sgorgare preziose sorgenti di
nuova conoscenza;
Esiste il fondato rischio che un eccesso di confidenza
nei numeri e nelle elaborazioni analitiche e statistiche
possa uccidere il pensiero teoretico (che ha trovato
un’armonizzazione ideale con l’osservazione della
realtà nel metodo scientifico galileiano;
I Big Data suggeriscono nuove teorie, ma è ancora
l’intuizione (“Right Brain”) che le riconosce.
2
4. Information Overload (“il troppo stroppia”)
La quantità di informazione (tecnica, scientifica,
letteraria, ecc.) prodotta negli ultimi venti anni della
storia dell’umanità, è uguale a quella accumulata in
tutti i millenni precedenti. Nei prossimi dieci anni
questa quantità verrà a raddoppiarsi ulteriormente.
4
5. La torre di Babele (Etemenanki)
Confusione delle
lingue
(specializzazione)
Unità del sapere
perduta
Manca una chiave
unificatrice (la
Teoria?)
5
6. Medioevo digitale prossimo venturo?
Obsolescenza dei supporti
di memoria
Obsolescenza dei formati
digitali
Avremo bisogno di una
nuova stele di Rosetta?
6
8. Big Data: la grande illusione
Perchè non trarre vantaggio dall’enorme mole
d’informazione (dati, testi, immagini, etc.) a
nostra disposizione?
Perchè non trasformare questa immensa
miniera di dati in una miniera aurea di
vantaggio competitivo per le aziende?
Perchè non fondare un management basato
sull’evidenza piuttosto che sull’intuizione?
Perchè infine non basare le nostre strategie
aziendali sui dati (“Data –driven Strategies”)?
8
9. Big Data: l’entità della sfida
Nel 2012, ogni giorno sono stati creati
2,5 x 10^18 byte (2,5 exabytes) di nuovi dati
Sorgenti di nuovi dati:
Archivi digitali pubblici e privati
Reti di dispositivi mobili,
Reti wireless di sensori
“Internet delle cose” (RFID)
Social networks (Facebook: 40 miliardi di foto)
You Tube
9
10. Big Data: due possibili approcci
Approccio “Forza Bruta”)
Massively Parallel
Processing Databases;
Stastistical processing;
Data Fusion .
Approccio “intelligente”
Natural Language
Processing;
Open Source
Intelligence;
Text mining;
Semantic Search Engines
(WEB 3.0);
Pattern Recognition
Techniches.
10
11. Big Data: scettici, critici e detrattori
“ Computer are useless. They can only give you
answers” – Pablo Picasso
I Big Data possono fornirci risposte. Ma a
quali domande?
“Big Data won’t guarantee good decisions” –
Harward Business Review
Pareto ed il suo pricipio (“Vital Few, Trivial
Many” o Regola dell’ 80/20)
“In the information society, nobody thinks.
We expected to banish paper, but we actually
banished thought” – Michael Crichton
“Data‐driven or ideas‐driven strategies?”
11
20. Conclusioni
Nonostante gli enormi progressi dell’informatica ed il
suo pervasivo ingresso nella vita di tutti i giorni, il
bilancio attuale non può considerarsi completamente
positivo;
“Information overload”, iperspecializzazione e
obsolescenza incombono e minacciano il “digital
chaos”;
Un uso intelligente dei Big Data, reso possibile dal
progresso informatico e dall’evoluzione dei sistemi
(“Large & Complex Systems”), apre nuove frontiere nel
campo della ricerca, dell’impresa e del management;
Esiste tuttavia il rischio fondato di un eccesso di
confidenza nel potere dei dati e dei numeri, che
potrebbe ulteriormente minacciare la sopravvivenza
del pensiero teoretico (le idee) nella nostra società.
20