Data Driven Innovation:
sfide e opportunità
Paolo Atzeni
Dipartimento di Ingegneria
Università Roma Tre
Dati e Big Data
• Perché ci interessano?
George H.L. Mallory (Mobberley, 1886 – Everest, 1924)
20/05/2016 2
Big data: i dati sono proprio tanti
• Quanti dati ci sono al mondo?
(fonte: IDC)
– 160 Exabyte, 2006 (1EB = 1018B)
– 4.4 Zettabyte, 2013 (1ZB = 1021B)
– 44 Zettabyte previsti nel 2020
• Zettabyte: 1,000,000,000,000,000,000,000 byte
– Un miliardo di dischi da 1TB, se li mettiamo uno sull'altro (e
ognuno è alto 1cm) abbiamo una pila alta 10mila km
• Quanti dati sono prodotti in un giorno?
– Facebook (ricerche varie su Internet): 500 TB
20/05/2016 3
Le quattro V dei Big Data
• Volume
• Velocity
• Variety
• Veracity
20/05/2016 4
Le cinque V dei Big Data
• Volume
• Velocity
• Variety
• Veracity
• Value
• "Data is not information, information is not knowledge,
knowledge is not understanding, understanding is not wisdom"
(Cliff Stoll)
20/05/2016 5
20/05/2016 6
Dati e informazioni
• Interessano alle persone curiose
• Mi hanno sempre affascinato, fin da quando ero bambino …
La mia prima fonte di informazioni (1962-63)
20/05/2016 7
Le prime informazioni che ho memorizzato
20/05/2016 8
E ho continuato così per anni
20/05/2016 9
I dati nello sport
• I dati che io raccoglievo non servivano a niente, se non alla mia
curiosità (e alla mia mente contorta …)
• Negli anni, le statistiche si sono sempre più diffuse nello sport e
hanno superato il livello della curiosità e raggiunto quello del
valore:
– Moneyball, libro e film
20/05/2016 10
Moneyball
• Le squadre di baseball, fino al 2002,
utilizzavano, per valutare i giocatori, alcune
statistiche (batting average, RBI, stolen
bases)
• Il protagonista intuisce (e verifca
analiticamente) che altre statistiche (slugging
percentage, on-base percentage) sono più
strettamente correlate al risultato e ingaggia
giocatori meno costosi, ottenendo risultati
straordinari spendendo poco
• Morale:
– I dati si possono utilizzare, ma si deve
sapere quali e come
20/05/2016 11
Qualche anno dopo
• Sono diventato professore (di basi di dati, e quindi i dati sono
almeno serviti a darmi da vivere … )
• Nel 1998 ho organizzato un convegno (WebDB) e con la
pubblicazione degli atti con una prestigiosa casa editrice
• Uno degli autori, un giovane dottorando di Stanford, era in
ritardo con il suo contributo e lo ho sollecitato
20/05/2016 12
20/05/2016 13
• "A company":
– Google!
• Morale:
– Algoritmi e dati possono avere valore, molto valore, ma si
deve saperlo cogliere
Il valore dei dati
• Capacità di utilizzo e di analisi
• Interpretazione:
– eterogeneità di formato, supporto, convenzioni, ...
20/05/2016 14
Supporto e codifica
• Quipu (Inca), da un museo di Lima
20/05/2016 15
20/05/2016 16
Interpretazione dei dati
• che cosa significano questi numeri?
• cartelli stradali (in Finlandia, ad esempio); sono orari
• ma la differenza?
• senza "interpretazione," il dato serve a ben poco
Lun-Ven Sabato Festivo
Il mio tempo è finito, vi ho annoiato ...
• Diamo spazio ai protagonisti veri dell'evento e parliamo davvero
di big data (non solo di dati)
• Ascolteremo tante cose interessanti
– tecniche, metodologiche, interdisciplinari
• Ne aggiungo una importante:
– La gestione dei dati e dei Big data richiede competenze
variegate e interdisciplinari, fra cui quelle fondate su solide
basi tecniche
– Le aziende lamentano mancanza di competenze
– Le università possono contribuire e molto (e con una visione
a lungo termine, più di altri soggetti)
20/05/2016 17
Percorso Big Data
• Nel Corso di Laurea Magistrale in Ingegneria Informatica dell’Università Roma Tre
• Tematiche:
– tecnologie avanzate per le basi di dati
– intelligenza artificiale
– machine learning
– architetture e le tecnologie per i big data
– analisi dell’informazione su Web
– sicurezza dei sistemi informatici
– sviluppo di applicazioni mobili
– strumenti per la visualizzazione dell’informazione
• Alcuni corsi in inglese con docenti internazionali di elevata qualificazione
• Tutti i corsi prevedono esercitazioni pratiche svolte in laboratori all’avanguardia.
• Le aziende più qualificate del settore contribuiscono con progetti congiunti e seminari
• Le attività didattiche si svolgono in un campus organizzato e piacevole
• Gli studenti hanno a disposizione una nuova biblioteca ed ampi spazi per lo studio.
• La mensa universitaria è efficiente e vicina, così come gli impianti sportivi.
20/05/2016 18
Un appello
• Gli investimenti in tecnologia e in formazione, a medio e lungo
termine, hanno un ritorno incalcolabile, ma le discontinuità
generano danno enormi.
• Le Università del nostro paese (che hanno potenzialità
indiscusse, come testimoniato dagli apprezzamenti che molti di
noi ricevono in sedi internazionali) sono state oggetto di tagli
pesanti negli ultimi anni (potrei mostrarvi i dati …)
• La conseguenza principale è stata l’impossibilità di assumere
giovani e questo avrà gravi conseguenze fra qualche anno se
non si pone rimedio. Stiamo perdendo una
generazione: abbiamo pochissimi docenti sotto i quarant’anni.
• L'opinione pubblica sembra non essere consapevole dei rischi
che il paese corre, aiutateci a farlo capire!
20/05/2016 19
Buon convegno!
Ringraziamenti
20/05/2016 20

Data Driven Innovation: sfide e opportunità

  • 1.
    Data Driven Innovation: sfidee opportunità Paolo Atzeni Dipartimento di Ingegneria Università Roma Tre
  • 2.
    Dati e BigData • Perché ci interessano? George H.L. Mallory (Mobberley, 1886 – Everest, 1924) 20/05/2016 2
  • 3.
    Big data: idati sono proprio tanti • Quanti dati ci sono al mondo? (fonte: IDC) – 160 Exabyte, 2006 (1EB = 1018B) – 4.4 Zettabyte, 2013 (1ZB = 1021B) – 44 Zettabyte previsti nel 2020 • Zettabyte: 1,000,000,000,000,000,000,000 byte – Un miliardo di dischi da 1TB, se li mettiamo uno sull'altro (e ognuno è alto 1cm) abbiamo una pila alta 10mila km • Quanti dati sono prodotti in un giorno? – Facebook (ricerche varie su Internet): 500 TB 20/05/2016 3
  • 4.
    Le quattro Vdei Big Data • Volume • Velocity • Variety • Veracity 20/05/2016 4
  • 5.
    Le cinque Vdei Big Data • Volume • Velocity • Variety • Veracity • Value • "Data is not information, information is not knowledge, knowledge is not understanding, understanding is not wisdom" (Cliff Stoll) 20/05/2016 5
  • 6.
    20/05/2016 6 Dati einformazioni • Interessano alle persone curiose • Mi hanno sempre affascinato, fin da quando ero bambino …
  • 7.
    La mia primafonte di informazioni (1962-63) 20/05/2016 7
  • 8.
    Le prime informazioniche ho memorizzato 20/05/2016 8
  • 9.
    E ho continuatocosì per anni 20/05/2016 9
  • 10.
    I dati nellosport • I dati che io raccoglievo non servivano a niente, se non alla mia curiosità (e alla mia mente contorta …) • Negli anni, le statistiche si sono sempre più diffuse nello sport e hanno superato il livello della curiosità e raggiunto quello del valore: – Moneyball, libro e film 20/05/2016 10
  • 11.
    Moneyball • Le squadredi baseball, fino al 2002, utilizzavano, per valutare i giocatori, alcune statistiche (batting average, RBI, stolen bases) • Il protagonista intuisce (e verifca analiticamente) che altre statistiche (slugging percentage, on-base percentage) sono più strettamente correlate al risultato e ingaggia giocatori meno costosi, ottenendo risultati straordinari spendendo poco • Morale: – I dati si possono utilizzare, ma si deve sapere quali e come 20/05/2016 11
  • 12.
    Qualche anno dopo •Sono diventato professore (di basi di dati, e quindi i dati sono almeno serviti a darmi da vivere … ) • Nel 1998 ho organizzato un convegno (WebDB) e con la pubblicazione degli atti con una prestigiosa casa editrice • Uno degli autori, un giovane dottorando di Stanford, era in ritardo con il suo contributo e lo ho sollecitato 20/05/2016 12
  • 13.
    20/05/2016 13 • "Acompany": – Google! • Morale: – Algoritmi e dati possono avere valore, molto valore, ma si deve saperlo cogliere
  • 14.
    Il valore deidati • Capacità di utilizzo e di analisi • Interpretazione: – eterogeneità di formato, supporto, convenzioni, ... 20/05/2016 14
  • 15.
    Supporto e codifica •Quipu (Inca), da un museo di Lima 20/05/2016 15
  • 16.
    20/05/2016 16 Interpretazione deidati • che cosa significano questi numeri? • cartelli stradali (in Finlandia, ad esempio); sono orari • ma la differenza? • senza "interpretazione," il dato serve a ben poco Lun-Ven Sabato Festivo
  • 17.
    Il mio tempoè finito, vi ho annoiato ... • Diamo spazio ai protagonisti veri dell'evento e parliamo davvero di big data (non solo di dati) • Ascolteremo tante cose interessanti – tecniche, metodologiche, interdisciplinari • Ne aggiungo una importante: – La gestione dei dati e dei Big data richiede competenze variegate e interdisciplinari, fra cui quelle fondate su solide basi tecniche – Le aziende lamentano mancanza di competenze – Le università possono contribuire e molto (e con una visione a lungo termine, più di altri soggetti) 20/05/2016 17
  • 18.
    Percorso Big Data •Nel Corso di Laurea Magistrale in Ingegneria Informatica dell’Università Roma Tre • Tematiche: – tecnologie avanzate per le basi di dati – intelligenza artificiale – machine learning – architetture e le tecnologie per i big data – analisi dell’informazione su Web – sicurezza dei sistemi informatici – sviluppo di applicazioni mobili – strumenti per la visualizzazione dell’informazione • Alcuni corsi in inglese con docenti internazionali di elevata qualificazione • Tutti i corsi prevedono esercitazioni pratiche svolte in laboratori all’avanguardia. • Le aziende più qualificate del settore contribuiscono con progetti congiunti e seminari • Le attività didattiche si svolgono in un campus organizzato e piacevole • Gli studenti hanno a disposizione una nuova biblioteca ed ampi spazi per lo studio. • La mensa universitaria è efficiente e vicina, così come gli impianti sportivi. 20/05/2016 18
  • 19.
    Un appello • Gliinvestimenti in tecnologia e in formazione, a medio e lungo termine, hanno un ritorno incalcolabile, ma le discontinuità generano danno enormi. • Le Università del nostro paese (che hanno potenzialità indiscusse, come testimoniato dagli apprezzamenti che molti di noi ricevono in sedi internazionali) sono state oggetto di tagli pesanti negli ultimi anni (potrei mostrarvi i dati …) • La conseguenza principale è stata l’impossibilità di assumere giovani e questo avrà gravi conseguenze fra qualche anno se non si pone rimedio. Stiamo perdendo una generazione: abbiamo pochissimi docenti sotto i quarant’anni. • L'opinione pubblica sembra non essere consapevole dei rischi che il paese corre, aiutateci a farlo capire! 20/05/2016 19
  • 20.