2. Cosa si intende per Big Data?
Si parla di Big Data quando si ha un dataset grande da richiedere
strumenti non convenzionali per estrapolare, gestire e processare
informazioni in tutte le fasi del processo: dall’acquisizione, alla
curation, passando per condivisione analisi e visualizzazione.
4. Prima caratteristica: Volume
Nell’anno 2000 un comune pc doveva avere 10 gb di ROM
Al giorno d’oggi Facebook gestisce 500 Tb di nuovi dati
ogni giorno
Si stima che a breve un volo di linea negli stati uniti
genererà 240 Tb di dati di volo
5. Seconda caratteristica: Velocità
Gli algoritmi per il trading delle azioni in borsa riflettono i
cambiamenti del mercato azionario in microsecondi
Infrastrutture e sensori generano grandi quantità di dati in
tempo reale
I sistemi di gioco online supportano milioni di giocatori, i
quali producono a loro volta diversi input al secondo.
6. Terza caratteristica: Varietà
I Big data non sono solo numeri, date e parole. Per Big Data si
intendono anche dati geospaziali, dati 3D, audio e video, e testi non
stutturati (file di log e social media)
Il tradizionale sistema di database era programmato per una piccola
quantità di dati strutturati, con pochi update (o in un numero
previsto), e con una consistente struttura dei dati
7. Altre due V
qualità dei dati
intesa come
valore
informativo che si
riesce ad estrarre
Veridicità
Si riferisce alla
possibilità di
inconsistenza dei
dati
Variabilità
8. Differenza tra dato e informazione
Dato è una descrizione elementare, spesso codificata, di
una cosa, di una transazione, di un avvenimento o di
altro. L'elaborazione dei dati può portare alla conoscenza
di un'informazione.
Informazione: il risultato derivante dall’interpretazione di
un insieme di dati, che è finalizzata all’apportare un
incremento delle conoscenze di un soggetto
9. Come vengono interpretati i dati?
Apro l’ombrello
Ho l’ombrello se non lo apro, mi
bagno
Piove
Ho un ombrello
10. E’ un processo con il quale si analizza una
moltitudine di dati con lo scopo di trarre
informazioni. Attualmente ha una duplice
valenza: estrazione e esplorazione
11. Estrazione
Estrazione, con tecniche analitiche all'avanguardia, di
informazione implicita, nascosta, da dati già strutturati,
per renderla disponibile e direttamente utilizzabile
12. Esplorazione
Esplorazione ed analisi, eseguita in modo
automatico o semiautomatico, su grandi quantità
di dati allo scopo di scoprire pattern (schemi)
significativi.
13. The Internet in real time
In the 10 second you have been in
this page, approximately 245740 GB
of data was transfered over the
internet
14. Dopo 20 minuti
In the 1300 seconds you have been
on this page approximately
28.556.110 GB of data was
transfered over the internet
15. Le aziende e l’interesse per i Big Data
Lo scopo principale è
quello di massimizzare i
profitti attraverso
l’ottimizzazione dei
processi e l’offerta di nuovi
servizi
17. Spotify è un’azienda che fa un grande utilizzo dei Big data. Gli
utenti di Spotify creano più 600 Gigabyte di dati al giorno e più 150
Gigabyte di dati al giorno tramite diversi servizi. Attualmente
l’azienda è in possesso di 28 petabyte, distribuite su 4 data center
in tutto il mondo .
18. Utilizzi principali dei Big Data
Esperienza per l’utente
Tramite l’analisi dei dati
vengono analizzati le
preferenze di ogni utente
e così poi costruiti dei
«cluster» di generi e
sottogeneri musicali che
suggeriscono la musica
preferita.
Esperienza per l’autore
Gli artisti nel loro profilo
hanno a disposizione una
«dashboard» che
permette di scoprire
quale brano piace di più e
a chi: per genere età, e
luogo
19. …altri utilizzi
Viene inoltre sfruttata l’enorme quantità di dati di
ascolto della base utenti di più di 60 milioni di
ascoltatori per indovinare i vincitori dei prossimi
Grammy Awards
Ci avrà mai azzeccato?
22. Destinatari: Grandi Aziende
Di recente Amazon ha aggiunto il servizio «Amazon web Services» in modo di
riuscire ad offrire strumenti per supportare:
Raccolta
L’archiviazione
Il calcolo
La condivisione di dati
Esempi di aziende che utilizzano questa piattaforma sono Netflix, Dropbox e Yelp
23. Destinatari: Amazon stesso
Infine Amazon utilizza i Big Data per:
Monitorare tracciare e proteggere i suoi 1,5 miliardi di
articoli in vendita distribuiti tra i 200 centri logisti in tutto
il mondo
Memorizzare i dati dei cataloghi che ricevono più di 50
milioni di aggiornamenti alla settimana
24. Twitter e IBM hanno annunciato una partnership
nell’analisi dei Big Data per social media. L’obbiettivo
comune è quello di trasformare i tweet in «business
insigths» immediatamente spendibili.
25. Big Data: servizio o merce?
IBM e Twitter offrono alle imprese un vantaggio senza
precedenti, permettendo loro di migliorare le decisioni
aziendali grazie alla combinazione dell’ampia ed esclusiva
panoramica offerta da Twitter sulle opinioni del mondo,
unitamente alla potenza di analisi IBM nel generare
informazioni immediatamente utilizzabili.
27. La Privacy e i Big Data
Il dato personale è una merce di grande valore economico e
individuale, pertanto va tutelato da furti e da utilizzi generalmente
poco etici
28. Edward Snowden e Data Leaks
Edward Snowden è noto per aver rivelato
pubblicamente dettagli informazioni di diversi
programmi di sorveglianza di massa del governo
statunitense e britannico, fino ad allora tenuti
segreti. Snowden ha affermato che le rivelazioni
costituiscono uno sforzo "per informare il pubblico su
ciò che viene fatto in loro nome e quello che è fatto
contro di loro".