+ focus Tecnologia 9GIORNALEdelPOPOLO
MERCOLEDÌ 18 NOVEMBRE 2015
Anche a chi non si intende di tec-
nologia sarà capitato almeno una
volta nel corso degli ultimi anni
di sentire parlare di un nuovo tipo
di dati che, se messi assieme, sono
in grado di dispensare una grande
quantità di informazioni sull’in-
dividuo che ha fornito quei dati.
Si tratta dei cosiddetti Big Data, in
sostanza “grandi dati”, chiamati
così per la loro dimensione e com-
plessità.
Questi dati provengono da sva-
riate fonti, come i sensori che rac-
colgono i dati del traffico, i cellu-
lari, le immagini messe online, la
condivisione di materiale sui so-
cial network. E l’elenco potrebbe
continuare all’infinito.
Il trattamento di questi dati,
però, se da un lato mette in perico-
lo la nostra privacy perché ci espo-
ne a un controllo (e chissà da parte
di chi, è lecito chiedersi), dall’altro
permette di creare anche nuove
forme di valore e di migliorare il
nostro modo di vivere. Per capire
di che cosa si tratta e quali impli-
cazioni stanno dietro al trattamen-
to di questi “grandi dati” abbiamo
parlato con Alessandro Lomi,
condirettore dell’istituto dell’U-
SI che si occupa della scienza dei
dati, l’Istituto Interdisciplinare di
Data Science.
Cosa si intende per Big Data?
Non esiste una definizione uni-
voca, ce ne sono diverse. Una piut-
tosto semplice è che si definisco-
no grandi tutti quei dati che non
possono essere esaminati da un
solo computer, per quanto potente.
Comunque, la tecnologia è sempre
coinvolta perché è proprio essa che
decide di giorno in giorno ciò che
è grande e ciò che invece non lo è.
Dunque possiamo dire che la defi-
nizione di Big Data è una definizio-
ne dinamica che evolve seguendo
la tecnologia.
Chi o che cosa produce questi
dati?
Oggi i social media sono un’in-
credibile miniera di dati che non
si poteva immaginare solo poco
tempo fa. Le informazioni prodot-
te, inoltre, sono molto dettagliate e
precise. Ma ci sono anche altri set-
tori che producono grandi quantità
di dati, ad esempio quello sanitario
o le città. Queste ultime illustrano
anche il problema del trattamento
dei dati: nelle città, infatti, si pro-
ducono dati enormi ma difformi e
difficili da trattare.
Che cosa c’è di diverso rispetto
alla produzione di dati nel pas-
sato?
Una caratteristica importan-
te è che i Big Data, al contrario di
quanto si fa con il materiale di una
ricerca, non sono raccolti e ana-
lizzati per uno scopo specifico. I
dati non rispondono a un obiettivo
particolare di ricerca, ma vengono
utilizzati per vari scopi individuati
successivamente. Un’altra diffe-
renza rispetto al passato è data dal
fatto che un progetto tradizionale
di raccolta di dati è soggetto all’ap-
provazione dei soggetti che forni-
scono i dati. Per molti grandi dati
invece, come ad esempio quelli de-
rivanti dai social media, non è così.
Come viene gestita questa mole
di dati?
Innanzitutto, bisogna chiarire il
rapporto tra produttori e consuma-
tori di dati: noi tutti siamo contem-
poraneamente sia produttori che
consumatori.
Ma spesso non sappiamo chi
accede a dati che ci riguardano
e soprattutto cosa se ne fa…
Uno dei problemi è costituito
dal fatto che la produzione di dati
è generale, ma l’accesso ad essi
è selettivo. Per fare l’esempio di
una città, i dati che vengono pro-
dotti possono essere utilizzati sia
dai cittadini che dal Governo per
prendere delle decisioni. Ma se si
prende come esempio una perso-
na, si vede come i Big Data permet-
tono di rivelare le sue preferenze
in maniera molto dettagliata, cosa
che in passato era impensabile.
Ed è qui che subentra il proble-
ma della selettività dell’accesso ai
dati stessi: una volta che essi ven-
gono conservati bisogna chiarire
chi e perché può accedervi.
Questo aspetto fa parte dei lati
oscuri dei Big Data e potrebbe
creare timore tra gli utenti, so-
prattutto in termini di tutela
della privacy…
Sono gli obiettivi dell’utilizzo dei
dati che definiscono cosa è buono
da ciò che non lo è. Il problema è
il consenso: innanzitutto, l’utente
affronta uno scambio tra conve-
nienza e privacy. Si può scegliere
tra l’avere un accesso tecnologico
istantaneo e costante a scapito del-
la privacy. Oppure, si può scegliere
di limitare l’uso della tecnologia
in favore di una maggiore privacy
(ad esempio se scelgo di mettere
password diverse per ogni nuo-
vo accesso a un portale online). Il
vero limite nella diffusione della
tecnologia che produce questi dati
sta nella fiducia che l’utente ha
sull’uso dei dati stessi. È un proble-
ma che la nostra società sta affron-
tando oggi per la prima volta. Non
ci sono soluzioni preconfezionate
ed è anche per questo motivo che
i settori dell’etica dei dati e della
legislazione sono così importanti.
I segnali che vengono dalla socie-
tà sono ambigui: ad esempio su
Instagram (il social network che
permette agli utenti di scattare fo-
tografie e condividerle sul proprio
profilo, ndr) ogni giorno vengono
pubblicate trentamila fotografie al
minuto, si tratta di un patrimonio
documentario che l’umanità non
ha mai avuto modo di produrre.
Questo permetterà a un antropolo-
go del futuro di avere un’idea di noi
estremamente ricca e precisa.
E se entra in gioco l’uso delle in-
formazioni ricavate dai dati per
scopi di sicurezza?
La sicurezza in questo caso è
un’arma a doppio taglio: se voglio
avere più sicurezza devo cedere
informazioni, dopodiché bisogna
che mi venga garantita la sicurezza
di queste informazioni, cioè sapere
chi ne ha accesso. Ci sono casi di
successo, come quello della crimi-
nologia algoritmica, che può deter-
minare con buona accuratezza le
possibilità di osservare crimini in
certe aree di una città o di un Pa-
ese. L’uso dei dati per questi scopi
viene già messo in atto in Inghil-
terra, dove lo spiegamento di forze
di polizia è fatto in modo selettivo,
concentrandolo in luoghi e mo-
menti ritenuti a rischio. Comun-
que, nonostante i dati servano an-
che per generare sicurezza, l’utente
deve poter scegliere se cederli o no
e per questo motivo è necessario
salvaguardare gli aspetti etici. Ci
sono limiti a quello che la tecnolo-
gia può fare e l’importanza dei co-
mitati etici è fondamentale perché
interpretano il significato che i dati
hanno per la popolazione e le pau-
re che ne possono derivare.
Da Amazon a Netflix, passando dalle città intelligenti
Vista la loro natura eterogenea, i Big
Data possono essere utilizzati in diversi
settori.
Editoria
Se si potesse prevedere il prossimo
bestseller? È l’idea di Alex White, che ha
fondato la startup Next Big Book. Infatti,
rilevando le vendite, le iniziative pro-
mozionali, la presenza sui social media
e le tendenze della Rete, si potrebbe ot-
tenere una maggiore prevedibilità delle
vendite. Sempre nel campo dell’edito-
ria, Amazon, attraverso la raccolta di
dati dei suoi 152 milioni di consumato-
ri, è in grado di costruire un sistema di
raccomandazione personalizzato dei
prodotti. Una direzione simile è quella
che potrebbero prendere le testate gior-
nalistiche. Una personalizzazione dei
contenutidiletturaonlinepotrebbenon
essere più un miraggio.
Sanità
Questo mare di dati rappresenta per
gli scienziati un’opportunità unica. I dati
potrebbero servire infatti per prendere
decisioni più informate, o permettere di
sviluppare diagnosi e trattamenti più ap-
profonditi, con un miglioramento della
qualità delle cure e una riduzione dei co-
sti. Per esempio, analizzando le caratte-
ristichedelpaziente,icostiegliesitidelle
cure,èpossibileidentificareiltrattamen-
to migliore dal punto di vista economico
eclinico.Sulargascala,invece,sipotreb-
be monitorare l’andamento e la diffusio-
ne di una malattia per formulare previ-
sioni e fissare interventi di prevenzione.
Serie tv
Netflix, il gigante della distribuzione
di prodotti mediali sbarcato di recente
in Italia, può vantare un’ampia cono-
scenza delle abitudini dei suoi 25 milio-
ni di utenti. Netflix, infatti, è in grado di
sapere non solo cosa stiamo guardando
ma anche dove, quando e con quale di-
spositivo. La serie tv “House of Cards”
rappresenta un caso interessante. L’os-
servazione delle abitudini di coloro che
hannoriguardatolaminiseriedellaBBC
degli anni novanta hanno evidenziato
che sono stati gli stessi che nel tempo
hanno scaricato e guardato film con
Kevin Spacey e diretti da David Fincher.
Quindi, hanno concluso a Netflix, un
remake del dramma BBC con Spacey e
Fincher sarebbe potuto essere un suc-
cesso assicurato. E così è stato.
Risorse umane
IBigDatasonoutilizzatidalleaziende
soprattutto a fini commerciali e di mar-
keting, per conoscere meglio il cliente,
i concorrenti, il mercato e i trend. Ma si
può lavorare anche sull’efficienza inter-
na. Un esempio? Credit Suisse ha deciso
di sfruttare la mole di informazioni pro-
veniente dai propri dipendenti per mi-
gliorarelavitainaziendaeaumentarela
produttività. L’istituto di credito è stato
così in grado di ridurre le dimissioni in-
desiderate e di ricoprire il 65% delle po-
sizioni senior con collaboratori interni.
Smart City
Tra i modelli di riferimento per la rac-
colta e la gestione dei Big Data ci sono
senza dubbio le metropoli. Un esempio
interessanteprovienedaChicago.Attra-
verso un sistema costituito da circa 500
sensori installati nel corso di tre anni, la
città sarà in grado di implementare si-
stemi di controllo del traffico, di gestio-
ne della manutenzione, dei lavori pub-
blici, della distribuzione dell’energia e
di monitoraggio delle attività criminali.
Un istituto all’USI
L’Istituto Interdisciplinare di Data
Science è nato da un lungo lavoro
preparatorio durato più di un anno.
Il consiglio dell’USI lo ha approvato
alla fine del 2014, mentre le attività
sono iniziate già a partire dai mesi
di marzo e aprile 2015. L’Istituto
è diretto da Alessandro Lomi e
Antonietta Mira, insieme a loro ci
sono sei ricercatori Post-doc e alcu-
ni ricercatori universitari. L’idea è
quella di un istituto interdisciplina-
re, non ancorato a nessuna Facoltà.
L’obiettivo è diventare un punto di
riferimento dove diverse compe-
tenze ed approcci possano combi-
narsi, sviluppandosi ulteriormente
attraverso progetti di ricerca in-
terdisciplinari, utili alla diffusio-
ne della Data Science non solo nel
mondo accademico, ma anche nel-
la società e nell’economia. Potendo
contare sulle solide competenze già
presenti sia all’USI che nel contesto
della Svizzera italiana, il nuovo isti-
tuto svilupperà tecniche di analisi
dell’informazione tratte da discipli-
ne quali la statistica, l’informatica,
l’economia, le scienze della comu-
nicazione, l’urbanistica, la fisica e
le tecnologie dell’informazione, av-
valendosi di metodi analitici e com-
putazionali d’avanguardia applica-
bili in modo efficiente a campioni di
dati di grandi dimensioni. Proprio
per favorire un legame diretto tra
la ricerca accademica e il contesto
economico, sensibilizzando il ter-
ritorio alla reale rilevanza di questi
temi, l’Istituto ha organizzato un
ciclo di incontri pubblici intitolato
“Dati e Società: opportunità e pau-
re”. Durante gli incontri, saranno
chiamati ad intervenire alcuni tra i
principali esponenti di questo cam-
po di ricerca. I prossimi appunta-
menti sono con Luciano Pietronero
il primo dicembre; con Francesco
Sacco il 19 gennaio; con Alberto
Sanna il 2 febbraio e con Silvia Fi-
gini il 12 aprile. Altre conferenze
sono in programma con Michael
Bronstein il 19 novembre e Nicola
Perra il 27 novembre.
Anche a Lugano un polo di Data Science.
Gli àmbiti di utilizzo dei Big Data sono tanti e molto diversi tra loro
Chicago è un esempio di Smart City.
Troppi dati per un solo computer...
Quando le tracce che lasciamo navigando in internet si trasformano in preziose informazioni
Big Data, la sfida tra sicurezza e privacy
Provengono dai nostri dispositivi elettronici ma non solo, e rivelano
moltissimo dei gusti e delle abitudini di ognuno di noi. Alessandro
Lomi, esperto del fenomeno, ci spiega di cosa si tratta.
PAGINA A CURA DI
Chiara Tomasini E Martina Salvini

Approfondimento sui Big Data

  • 1.
    + focus Tecnologia9GIORNALEdelPOPOLO MERCOLEDÌ 18 NOVEMBRE 2015 Anche a chi non si intende di tec- nologia sarà capitato almeno una volta nel corso degli ultimi anni di sentire parlare di un nuovo tipo di dati che, se messi assieme, sono in grado di dispensare una grande quantità di informazioni sull’in- dividuo che ha fornito quei dati. Si tratta dei cosiddetti Big Data, in sostanza “grandi dati”, chiamati così per la loro dimensione e com- plessità. Questi dati provengono da sva- riate fonti, come i sensori che rac- colgono i dati del traffico, i cellu- lari, le immagini messe online, la condivisione di materiale sui so- cial network. E l’elenco potrebbe continuare all’infinito. Il trattamento di questi dati, però, se da un lato mette in perico- lo la nostra privacy perché ci espo- ne a un controllo (e chissà da parte di chi, è lecito chiedersi), dall’altro permette di creare anche nuove forme di valore e di migliorare il nostro modo di vivere. Per capire di che cosa si tratta e quali impli- cazioni stanno dietro al trattamen- to di questi “grandi dati” abbiamo parlato con Alessandro Lomi, condirettore dell’istituto dell’U- SI che si occupa della scienza dei dati, l’Istituto Interdisciplinare di Data Science. Cosa si intende per Big Data? Non esiste una definizione uni- voca, ce ne sono diverse. Una piut- tosto semplice è che si definisco- no grandi tutti quei dati che non possono essere esaminati da un solo computer, per quanto potente. Comunque, la tecnologia è sempre coinvolta perché è proprio essa che decide di giorno in giorno ciò che è grande e ciò che invece non lo è. Dunque possiamo dire che la defi- nizione di Big Data è una definizio- ne dinamica che evolve seguendo la tecnologia. Chi o che cosa produce questi dati? Oggi i social media sono un’in- credibile miniera di dati che non si poteva immaginare solo poco tempo fa. Le informazioni prodot- te, inoltre, sono molto dettagliate e precise. Ma ci sono anche altri set- tori che producono grandi quantità di dati, ad esempio quello sanitario o le città. Queste ultime illustrano anche il problema del trattamento dei dati: nelle città, infatti, si pro- ducono dati enormi ma difformi e difficili da trattare. Che cosa c’è di diverso rispetto alla produzione di dati nel pas- sato? Una caratteristica importan- te è che i Big Data, al contrario di quanto si fa con il materiale di una ricerca, non sono raccolti e ana- lizzati per uno scopo specifico. I dati non rispondono a un obiettivo particolare di ricerca, ma vengono utilizzati per vari scopi individuati successivamente. Un’altra diffe- renza rispetto al passato è data dal fatto che un progetto tradizionale di raccolta di dati è soggetto all’ap- provazione dei soggetti che forni- scono i dati. Per molti grandi dati invece, come ad esempio quelli de- rivanti dai social media, non è così. Come viene gestita questa mole di dati? Innanzitutto, bisogna chiarire il rapporto tra produttori e consuma- tori di dati: noi tutti siamo contem- poraneamente sia produttori che consumatori. Ma spesso non sappiamo chi accede a dati che ci riguardano e soprattutto cosa se ne fa… Uno dei problemi è costituito dal fatto che la produzione di dati è generale, ma l’accesso ad essi è selettivo. Per fare l’esempio di una città, i dati che vengono pro- dotti possono essere utilizzati sia dai cittadini che dal Governo per prendere delle decisioni. Ma se si prende come esempio una perso- na, si vede come i Big Data permet- tono di rivelare le sue preferenze in maniera molto dettagliata, cosa che in passato era impensabile. Ed è qui che subentra il proble- ma della selettività dell’accesso ai dati stessi: una volta che essi ven- gono conservati bisogna chiarire chi e perché può accedervi. Questo aspetto fa parte dei lati oscuri dei Big Data e potrebbe creare timore tra gli utenti, so- prattutto in termini di tutela della privacy… Sono gli obiettivi dell’utilizzo dei dati che definiscono cosa è buono da ciò che non lo è. Il problema è il consenso: innanzitutto, l’utente affronta uno scambio tra conve- nienza e privacy. Si può scegliere tra l’avere un accesso tecnologico istantaneo e costante a scapito del- la privacy. Oppure, si può scegliere di limitare l’uso della tecnologia in favore di una maggiore privacy (ad esempio se scelgo di mettere password diverse per ogni nuo- vo accesso a un portale online). Il vero limite nella diffusione della tecnologia che produce questi dati sta nella fiducia che l’utente ha sull’uso dei dati stessi. È un proble- ma che la nostra società sta affron- tando oggi per la prima volta. Non ci sono soluzioni preconfezionate ed è anche per questo motivo che i settori dell’etica dei dati e della legislazione sono così importanti. I segnali che vengono dalla socie- tà sono ambigui: ad esempio su Instagram (il social network che permette agli utenti di scattare fo- tografie e condividerle sul proprio profilo, ndr) ogni giorno vengono pubblicate trentamila fotografie al minuto, si tratta di un patrimonio documentario che l’umanità non ha mai avuto modo di produrre. Questo permetterà a un antropolo- go del futuro di avere un’idea di noi estremamente ricca e precisa. E se entra in gioco l’uso delle in- formazioni ricavate dai dati per scopi di sicurezza? La sicurezza in questo caso è un’arma a doppio taglio: se voglio avere più sicurezza devo cedere informazioni, dopodiché bisogna che mi venga garantita la sicurezza di queste informazioni, cioè sapere chi ne ha accesso. Ci sono casi di successo, come quello della crimi- nologia algoritmica, che può deter- minare con buona accuratezza le possibilità di osservare crimini in certe aree di una città o di un Pa- ese. L’uso dei dati per questi scopi viene già messo in atto in Inghil- terra, dove lo spiegamento di forze di polizia è fatto in modo selettivo, concentrandolo in luoghi e mo- menti ritenuti a rischio. Comun- que, nonostante i dati servano an- che per generare sicurezza, l’utente deve poter scegliere se cederli o no e per questo motivo è necessario salvaguardare gli aspetti etici. Ci sono limiti a quello che la tecnolo- gia può fare e l’importanza dei co- mitati etici è fondamentale perché interpretano il significato che i dati hanno per la popolazione e le pau- re che ne possono derivare. Da Amazon a Netflix, passando dalle città intelligenti Vista la loro natura eterogenea, i Big Data possono essere utilizzati in diversi settori. Editoria Se si potesse prevedere il prossimo bestseller? È l’idea di Alex White, che ha fondato la startup Next Big Book. Infatti, rilevando le vendite, le iniziative pro- mozionali, la presenza sui social media e le tendenze della Rete, si potrebbe ot- tenere una maggiore prevedibilità delle vendite. Sempre nel campo dell’edito- ria, Amazon, attraverso la raccolta di dati dei suoi 152 milioni di consumato- ri, è in grado di costruire un sistema di raccomandazione personalizzato dei prodotti. Una direzione simile è quella che potrebbero prendere le testate gior- nalistiche. Una personalizzazione dei contenutidiletturaonlinepotrebbenon essere più un miraggio. Sanità Questo mare di dati rappresenta per gli scienziati un’opportunità unica. I dati potrebbero servire infatti per prendere decisioni più informate, o permettere di sviluppare diagnosi e trattamenti più ap- profonditi, con un miglioramento della qualità delle cure e una riduzione dei co- sti. Per esempio, analizzando le caratte- ristichedelpaziente,icostiegliesitidelle cure,èpossibileidentificareiltrattamen- to migliore dal punto di vista economico eclinico.Sulargascala,invece,sipotreb- be monitorare l’andamento e la diffusio- ne di una malattia per formulare previ- sioni e fissare interventi di prevenzione. Serie tv Netflix, il gigante della distribuzione di prodotti mediali sbarcato di recente in Italia, può vantare un’ampia cono- scenza delle abitudini dei suoi 25 milio- ni di utenti. Netflix, infatti, è in grado di sapere non solo cosa stiamo guardando ma anche dove, quando e con quale di- spositivo. La serie tv “House of Cards” rappresenta un caso interessante. L’os- servazione delle abitudini di coloro che hannoriguardatolaminiseriedellaBBC degli anni novanta hanno evidenziato che sono stati gli stessi che nel tempo hanno scaricato e guardato film con Kevin Spacey e diretti da David Fincher. Quindi, hanno concluso a Netflix, un remake del dramma BBC con Spacey e Fincher sarebbe potuto essere un suc- cesso assicurato. E così è stato. Risorse umane IBigDatasonoutilizzatidalleaziende soprattutto a fini commerciali e di mar- keting, per conoscere meglio il cliente, i concorrenti, il mercato e i trend. Ma si può lavorare anche sull’efficienza inter- na. Un esempio? Credit Suisse ha deciso di sfruttare la mole di informazioni pro- veniente dai propri dipendenti per mi- gliorarelavitainaziendaeaumentarela produttività. L’istituto di credito è stato così in grado di ridurre le dimissioni in- desiderate e di ricoprire il 65% delle po- sizioni senior con collaboratori interni. Smart City Tra i modelli di riferimento per la rac- colta e la gestione dei Big Data ci sono senza dubbio le metropoli. Un esempio interessanteprovienedaChicago.Attra- verso un sistema costituito da circa 500 sensori installati nel corso di tre anni, la città sarà in grado di implementare si- stemi di controllo del traffico, di gestio- ne della manutenzione, dei lavori pub- blici, della distribuzione dell’energia e di monitoraggio delle attività criminali. Un istituto all’USI L’Istituto Interdisciplinare di Data Science è nato da un lungo lavoro preparatorio durato più di un anno. Il consiglio dell’USI lo ha approvato alla fine del 2014, mentre le attività sono iniziate già a partire dai mesi di marzo e aprile 2015. L’Istituto è diretto da Alessandro Lomi e Antonietta Mira, insieme a loro ci sono sei ricercatori Post-doc e alcu- ni ricercatori universitari. L’idea è quella di un istituto interdisciplina- re, non ancorato a nessuna Facoltà. L’obiettivo è diventare un punto di riferimento dove diverse compe- tenze ed approcci possano combi- narsi, sviluppandosi ulteriormente attraverso progetti di ricerca in- terdisciplinari, utili alla diffusio- ne della Data Science non solo nel mondo accademico, ma anche nel- la società e nell’economia. Potendo contare sulle solide competenze già presenti sia all’USI che nel contesto della Svizzera italiana, il nuovo isti- tuto svilupperà tecniche di analisi dell’informazione tratte da discipli- ne quali la statistica, l’informatica, l’economia, le scienze della comu- nicazione, l’urbanistica, la fisica e le tecnologie dell’informazione, av- valendosi di metodi analitici e com- putazionali d’avanguardia applica- bili in modo efficiente a campioni di dati di grandi dimensioni. Proprio per favorire un legame diretto tra la ricerca accademica e il contesto economico, sensibilizzando il ter- ritorio alla reale rilevanza di questi temi, l’Istituto ha organizzato un ciclo di incontri pubblici intitolato “Dati e Società: opportunità e pau- re”. Durante gli incontri, saranno chiamati ad intervenire alcuni tra i principali esponenti di questo cam- po di ricerca. I prossimi appunta- menti sono con Luciano Pietronero il primo dicembre; con Francesco Sacco il 19 gennaio; con Alberto Sanna il 2 febbraio e con Silvia Fi- gini il 12 aprile. Altre conferenze sono in programma con Michael Bronstein il 19 novembre e Nicola Perra il 27 novembre. Anche a Lugano un polo di Data Science. Gli àmbiti di utilizzo dei Big Data sono tanti e molto diversi tra loro Chicago è un esempio di Smart City. Troppi dati per un solo computer... Quando le tracce che lasciamo navigando in internet si trasformano in preziose informazioni Big Data, la sfida tra sicurezza e privacy Provengono dai nostri dispositivi elettronici ma non solo, e rivelano moltissimo dei gusti e delle abitudini di ognuno di noi. Alessandro Lomi, esperto del fenomeno, ci spiega di cosa si tratta. PAGINA A CURA DI Chiara Tomasini E Martina Salvini