SlideShare a Scribd company logo
La visualizzazione dei Big Data:
opportunità e sfide
Stefano De Francisci
27 maggio 2015
Sommario
La visualizzazione dei Big Data, Stefano De Francisci – Forum PA, 27 maggio 2015
Complessità e rappresentazione grafica
“The world is complex, dynamic, multidimensional;
the paper is static, flat.
on mere flatland?”
E. Tufte, Envisioning Information, 1990
La visualizzazione dei Big Data, Stefano De Francisci – Forum PA, 27 maggio 2015
How are we to represent
the rich visual world
of experience and
measurement
Big data ”refers to datasets whose size is beyond the
ability of typical database software tools to capture,
store, manage, and analyze.”
[McKinsey Global Institute, June 2011]
Big Data
Volume: dimensione
effettiva del dataset
Velocità: velocità di
generazione dei dati (analisi
dei dati in tempo reale o
quasi)
Varietà: varie tipologie di
dati, provenienti da fonti
diverse (strutturate e non)
Una definizione
Veracity
Viscosity
Value
Validity
Volatility
Variability
La visualizzazione dei Big Data, Stefano De Francisci – Forum PA, 27 maggio 2015
Quanti dati nel mondo digitale?
Se una lettera dell’alfabeto
corrisponde a un Byte… uno
Zettabyte corrisponde ad
almeno 323 mila miliardi di
volumi di Guerra e Pace…
…una pallina a 500
transatlantici pieni di
palline…
… e un gigabyte di
musica (960 minuti)…
a 2 miliardi di anni di
musica
La visualizzazione dei Big Data, Stefano De Francisci – Forum PA, 27 maggio 2015
http://www.dailyinfographic.com/2016-the-year-of-the-zettabyte-infographic
http://content.monetate.com/h/i/12311844-the-retailer-s-guide-to-big-data
Target population
Nuova opportunità
Big Data come fonte
addizionale alle fonti
tradizionali della
statistica ufficiale
Direct
Surveys
Adm.ve
registers
Official
Statistics
BIG
DATA
Nuova sfida
Andare oltre lo stadio
sperimentale ed entrare
nell’età della maturità
BIG
DATA
Big Data e statistica ufficiale
La visualizzazione dei Big Data, Stefano De Francisci – Forum PA, 27 maggio 2015
Commercial or
transactional
Opinion
Data exhaust
Behaviour data
Crowd-sourced
data
Sensor data
Machine-
generated data
Human-sourced
information
Process-
mediated data
Internet of
Things
Social Networks
Traditional Business
systems
Click stream
RFID
Smart meter
Customer data
Text data
Machine data
Location
based data
Mobile data
Unstructured data
Data at rest
Data in motion
Streaming
data
Quali fonti di Big Data possono
giocare un ruolo significativo
nella statistica ufficiale?
Un accenno alle fonti
La visualizzazione dei Big Data, Stefano De Francisci – Forum PA, 27 maggio 2015
Sensori e macchine utilizzati per misurare e
registrare eventi e situazioni nel mondo fisico
• Satellite imaging
• Road & traffic sensors
Social Networks
Traditional Business systems
Internet of Things
Machine-generated
data
La visualizzazione dei Big Data, Stefano De Francisci – Forum PA, 27 maggio 2015
Dati prodotti tramite
l’interazione umana con
dispositivi digitali (anche
mobili):
• Blog posts
• Twitter messages
• User-generated maps
Dati raccolti da
sistemi tradizionali
in modalità passiva:
• Medical records
• Commercial transactions
• Banking/stock records
• Climate & environmental sensors
• Logs & Web Logs
Interazione
visuale
Visualizzatore
Analista
Utilizzatore
Making
decisions
Dati
grezzi
Rappresentazione
visuale
Pattern
visuali
Presentazione
grafica
Infografica
Problem-
solving
Sense-
Making
Sintesi
visuale
Esplorazione
visuale
Dashboard
Il processo cognitivo visivo
Storytelling
Interazione visuale
Interazione
visuale
Analisi
visuale
Esplorazione
La visualizzazione dei Big Data, Stefano De Francisci – Forum PA, 27 maggio 2015
Extreme-scale
Dimensioni
Combinazione di analisi e
visualizzazione
Livello del coinvolgimento
umano
Data in many forms
Strutturati, non-strutturati,
testi, dati multimediali
Data in motion
Analisi dei dati in streaming
per consentire decisioni in
frazioni di secondo
Data at scale
Da Petabyte (1015) a
Exabyte (1018)
Complex Information Spaces
Elementi critici
nell'applicazione
dell’analisi visuale di dati
a scala estrema e in
spazi di informazione
complessa
(a) difficile confronto
sulla base dei dati
grezzi,
(b) Necessità di
combinare tipi diversi
di dati
Quando i dati diventano… big
La visualizzazione dei Big Data, Stefano De Francisci – Forum PA, 27 maggio 2015
Per sostenere l'intero ciclo di vita dei
Big Data, un buon sistema di analisi
visiva deve combinare i vantaggi
dell'analisi automatica con tecniche
interattive per esplorare i dati.
Dietro questa caratteristica tecnica c’è
lo scopo più profondo di integrare la
capacità di analisi di un computer
con la capacità dell'analisi umana.
Volume, velocity, variety
Mappare dati complessi in più
semplici forme visuali di
conoscenza
• Definizione appropriata in fase di
progettazione
• Raggiungimento di un corretto peso e
bilanciamento delle due componenti
Analisi automatica e interazione visuale
La visualizzazione dei Big Data, Stefano De Francisci – Forum PA, 27 maggio 2015
Remco Chang – Fields Institute 15
Enfasi su… Metodo Riferimento
Data reduction
Big Data  Medium Data  Small Data+ R
Wickham
Visual
interaction
Nuovi pattern di rappresentazione grafica + Interazione
Carpendale
HCP
Divide et impera + Calcolo parallelo
Bowei Xi
Filtering Filtering
Interaction
StarGlyphs + Parallel coordinates
Tre scuole di pensiero
La visualizzazione dei Big Data, Stefano De Francisci – Forum PA, 27 maggio 2015
L’analisi automatizzata dei Big Data riguarda lo
"sviluppo di metodi e tecniche per dare un
senso di dati" [Fayyad]
Caratteristiche
“estreme” dei
Big Data
Report semplici
Approssimazione
descrittiva o modelli dei
processi che hanno
generato i dati
Modelli predittivi per la
stima di casi futuri
Metodi specifici di data
mining per la scoperta
ed estrazione di
conoscenza
Più astratte
Sintetiche
Chiare
Utili
Enormi
A basso
livello
Analisi automatica
La visualizzazione dei Big Data, Stefano De Francisci – Forum PA, 27 maggio 2015
Nel contesto di Big Data possono essere adottate alcune categorie essenziali
dell’interazione come base di ragionamento analitico [Yi – et al.]
• Select (contrassegna qualcosa come interessante)
• Explore (mostrami qualcos’altro)
• Reconfigure (mostrami una differente disposizione)
• Encode (mostrami una differente rappresentazione)
• Abstract/elaborate (mostrami più o meno dettagli)
• Filter (mostrami qualcosa sotto certe condizioni)
• Connect (mostrami I concetti collegati)
http://www.cs.tufts.edu/comp/250VA/papers/yi2007toward.pdf
Visualizzazione interattiva
La visualizzazione dei Big Data, Stefano De Francisci – Forum PA, 27 maggio 2015
Filter (show
me something
conditionally)
Abstract/
elaborate
(show me
more or less
detail)
Explore
(show me
something
else)
Select (mark
something as
interesting)
La visualizzazione dei Big Data, Stefano De Francisci – Forum PA, 27 maggio 2015
3. Internet of Things (machine-generated data)
Data from sensors
Fixed sensors
Home automation
Weather/pollution sensors
Traffic sensors/webcam
Scientific sensors
Security videos/images
Mobile sensors (tracking)
Mobile phone location
Cars
Satellite images
Data from computer systems
Logs
Web logs
1. Social Networks (human-sourced information)
Social Networks
Blogs and comments
Personal documents
Pictures: Instagram, Flickr, Picasa
Videos: Youtube etc.
Internet searches
Mobile data content: text messages
User-generated maps
E-Mail
2. Traditional Business systems (process-mediated
data)
Data produced by Public Agencies
Medical records
Data produced by businesses
Commercial transactions
Banking/stock records
E-commerce
Credit cards
La classificazione Big Data di UNECE
La visualizzazione dei Big Data, Stefano De Francisci – Forum PA, 27 maggio 2015
Human emotion
Social Networks
«This video shows the
mood in the U.S., as
inferred using over 300
million tweets, over the
course of the day. The
maps are represented
using density-preserving
cartograms»
https://www.youtube.com/watch?v=ujcrJZRSGkg
La visualizzazione dei Big Data, Stefano De Francisci – Forum PA, 27 maggio 2015
Tweetcatcha
Social Networks
«TweetCatcha
seeks to uncover
the organic nature
of news as it travels
through Twitter over
time, by examining
the movement of
NY Times articles
through Twitter»
La visualizzazione dei Big Data, Stefano De Francisci – Forum PA, 27 maggio 2015
http://a.parsons.edu/~drumb588/tweetcatcha/
Human disease network
Medical records
«The diseasome website is a
disease/disorder relationships
explorer and a sample of an
innovative map-oriented
scientific work. Built by a team of
researchers and engineers, it
uses the Human Disease
Network dataset and allows
intuitive knowledge discovery by
mapping its complexity»
La visualizzazione dei Big Data, Stefano De Francisci – Forum PA, 27 maggio 2015
http://diseasome.eu/map.html
Urban Mobs
Mobile phone location
http://www.urbanmobs.fr/fr/france/
«Cette visualisation représente la
quantité de SMS envoyés le soir de
la fête de la musique (21 juin 2008).
On peut découvrir à partir de 17h une
forte activité aux alentours du Parc
des Princes que nous pouvons
mettre en parallèle avec le concert
de Tokio Hotel ce soir là. On
remarque ensuite un autre foyer
d'activité à l'hippodrome d'Auteuil
correspondant au concert organisé
par France 2»
La visualizzazione dei Big Data, Stefano De Francisci – Forum PA, 27 maggio 2015
Weekly consumption per hour of day over a year (IE)
winter
summer
mid-seasons
Tool:
Processing
Visualization of Irish Data
Fixed sensors
La visualizzazione dei Big Data, Stefano De Francisci – Forum PA, 27 maggio 2015
Source: International collaboration project on The Role of Big Data in the Modernisation of Statistical
Production (overseen by the High-Level Group for the Modernisation of Statistical Production and Services)
Tool:
Pentaho
Visualization of Canadian Data
Fixed sensors
La visualizzazione dei Big Data, Stefano De Francisci – Forum PA, 27 maggio 2015
Hourly consumption per day on a single month
Source: International collaboration project on The Role of Big Data in the Modernisation of Statistical
Production (overseen by the High-Level Group for the Modernisation of Statistical Production and Services)
http://blog.profitbricks.com/39-data-
visualization-tools-for-big-data/
http://www.visualisingdata.com/ http://www.dailyinfographic.com/
Risorse in rete. Esempi
http://blogopole.observatoire-
presidentielle.fr/
http://www.dailyinfograp
hic.com/2016-the-year-
of-the-zettabyte-
infographic
http://content.monetate.com/
h/i/12311844-the-retailer-s-
guide-to-big-data
La visualizzazione dei Big Data, Stefano De Francisci – Forum PA, 27 maggio 2015

More Related Content

What's hot

Business Intelligence, Analytics e Big Data: una guida per capire e orientarsi
Business Intelligence, Analytics e Big Data: una guida per capire e orientarsiBusiness Intelligence, Analytics e Big Data: una guida per capire e orientarsi
Business Intelligence, Analytics e Big Data: una guida per capire e orientarsi
SMAU
 
M. Scannapieco - Big Data e Open Data: Istruzioni (o quasi) per l’Uso
M. Scannapieco - Big Data e Open Data:  Istruzioni (o quasi) per l’Uso  M. Scannapieco - Big Data e Open Data:  Istruzioni (o quasi) per l’Uso
M. Scannapieco - Big Data e Open Data: Istruzioni (o quasi) per l’Uso
Istituto nazionale di statistica
 
Business Intelligence & Big Data per il Retail
Business Intelligence & Big Data per il RetailBusiness Intelligence & Big Data per il Retail
Business Intelligence & Big Data per il Retail
Roberto Butinar
 

What's hot (20)

Big data e business intelligence
Big data e business intelligenceBig data e business intelligence
Big data e business intelligence
 
La salute e i big data
La salute e i big dataLa salute e i big data
La salute e i big data
 
Le tecnologie dei Big Data
Le tecnologie dei Big DataLe tecnologie dei Big Data
Le tecnologie dei Big Data
 
Introduzione ai Big Data e alla scienza dei dati
Introduzione ai Big Data e alla scienza dei datiIntroduzione ai Big Data e alla scienza dei dati
Introduzione ai Big Data e alla scienza dei dati
 
Business Intelligence, Analytics e Big Data: una guida per capire e orientarsi
Business Intelligence, Analytics e Big Data: una guida per capire e orientarsiBusiness Intelligence, Analytics e Big Data: una guida per capire e orientarsi
Business Intelligence, Analytics e Big Data: una guida per capire e orientarsi
 
Big Data - Breve panoramica
Big Data - Breve panoramicaBig Data - Breve panoramica
Big Data - Breve panoramica
 
Big data e pubblica amministrazione
Big data e pubblica amministrazioneBig data e pubblica amministrazione
Big data e pubblica amministrazione
 
Big data-simonetta
Big data-simonettaBig data-simonetta
Big data-simonetta
 
Introduzione ai Big Data e alla scienza dei dati
Introduzione ai Big Data e alla scienza dei datiIntroduzione ai Big Data e alla scienza dei dati
Introduzione ai Big Data e alla scienza dei dati
 
Big data
Big dataBig data
Big data
 
Big Data
Big DataBig Data
Big Data
 
Appunti di big data
Appunti di big dataAppunti di big data
Appunti di big data
 
Poliglottismo tecnologico & innovazione: un matrimonio perfetto? Esperienze d...
Poliglottismo tecnologico & innovazione: un matrimonio perfetto? Esperienze d...Poliglottismo tecnologico & innovazione: un matrimonio perfetto? Esperienze d...
Poliglottismo tecnologico & innovazione: un matrimonio perfetto? Esperienze d...
 
Data Governance at work
Data Governance at workData Governance at work
Data Governance at work
 
M. Scannapieco - Big Data e Open Data: Istruzioni (o quasi) per l’Uso
M. Scannapieco - Big Data e Open Data:  Istruzioni (o quasi) per l’Uso  M. Scannapieco - Big Data e Open Data:  Istruzioni (o quasi) per l’Uso
M. Scannapieco - Big Data e Open Data: Istruzioni (o quasi) per l’Uso
 
Introduzione ai Big Data e alla scienza dei dati - I formati dati
Introduzione ai Big Data e alla scienza dei dati - I formati datiIntroduzione ai Big Data e alla scienza dei dati - I formati dati
Introduzione ai Big Data e alla scienza dei dati - I formati dati
 
Data Driven UX - From Social networks to target audience
Data Driven UX - From Social networks to target audienceData Driven UX - From Social networks to target audience
Data Driven UX - From Social networks to target audience
 
Big Data 2014: Marketing & Social Media
Big Data 2014: Marketing & Social MediaBig Data 2014: Marketing & Social Media
Big Data 2014: Marketing & Social Media
 
Business Intelligence & Big Data per il Retail
Business Intelligence & Big Data per il RetailBusiness Intelligence & Big Data per il Retail
Business Intelligence & Big Data per il Retail
 
Big Data: Analisi del Sentiment
Big Data: Analisi del SentimentBig Data: Analisi del Sentiment
Big Data: Analisi del Sentiment
 

Similar to La visualizzazione dei Big Data: opportunità e sfide - di Stefano De Francisci

Open Data 4 Startups
Open Data 4 StartupsOpen Data 4 Startups
Open Data 4 Startups
mzaglio
 
130 FN 90 Febbraio 2017 - Tavola Rotonda L'analisi tanto attesa - Fieldbus & ...
130 FN 90 Febbraio 2017 - Tavola Rotonda L'analisi tanto attesa - Fieldbus & ...130 FN 90 Febbraio 2017 - Tavola Rotonda L'analisi tanto attesa - Fieldbus & ...
130 FN 90 Febbraio 2017 - Tavola Rotonda L'analisi tanto attesa - Fieldbus & ...
Cristian Randieri PhD
 
Aggregatore di Open Data del territorio fiorentino e toscano
Aggregatore di Open Data del territorio fiorentino e toscano Aggregatore di Open Data del territorio fiorentino e toscano
Aggregatore di Open Data del territorio fiorentino e toscano
Paolo Nesi
 

Similar to La visualizzazione dei Big Data: opportunità e sfide - di Stefano De Francisci (20)

Dagli Open ai big data nel comune di Firenze
Dagli Open ai big data nel comune di FirenzeDagli Open ai big data nel comune di Firenze
Dagli Open ai big data nel comune di Firenze
 
Marco Broccoli, Fabrizio De Fausti Big data for official statistics: nuovi s...
Marco Broccoli, Fabrizio De Fausti  Big data for official statistics: nuovi s...Marco Broccoli, Fabrizio De Fausti  Big data for official statistics: nuovi s...
Marco Broccoli, Fabrizio De Fausti Big data for official statistics: nuovi s...
 
Verso una Spatial Data Science Seminario 29-11-2017
Verso una Spatial Data Science Seminario 29-11-2017Verso una Spatial Data Science Seminario 29-11-2017
Verso una Spatial Data Science Seminario 29-11-2017
 
Big data analytics vaccari oct2013
Big data analytics vaccari oct2013Big data analytics vaccari oct2013
Big data analytics vaccari oct2013
 
Big Data @ Singularity University Milan
Big Data @ Singularity University MilanBig Data @ Singularity University Milan
Big Data @ Singularity University Milan
 
Data Journalism: strumenti operativi | Bologna, 9 giugno 2014
Data Journalism: strumenti operativi | Bologna, 9 giugno 2014Data Journalism: strumenti operativi | Bologna, 9 giugno 2014
Data Journalism: strumenti operativi | Bologna, 9 giugno 2014
 
Open Data 4 Startups
Open Data 4 StartupsOpen Data 4 Startups
Open Data 4 Startups
 
Smart Cities e Città Metropolitane
Smart Cities e Città MetropolitaneSmart Cities e Città Metropolitane
Smart Cities e Città Metropolitane
 
Guida galattica per i data journalists
Guida galattica per i data journalistsGuida galattica per i data journalists
Guida galattica per i data journalists
 
Smart Data Platform: dagli open data all'Internet Of Things
Smart Data Platform: dagli open data all'Internet Of ThingsSmart Data Platform: dagli open data all'Internet Of Things
Smart Data Platform: dagli open data all'Internet Of Things
 
Informatica Presente e Futuro
Informatica Presente e FuturoInformatica Presente e Futuro
Informatica Presente e Futuro
 
Big Data per Madee 7 at Digital Accademia
Big Data per Madee 7 at Digital AccademiaBig Data per Madee 7 at Digital Accademia
Big Data per Madee 7 at Digital Accademia
 
Introduzione al data journalism | Roma, 7 giugno 2014
Introduzione al data journalism | Roma, 7 giugno 2014Introduzione al data journalism | Roma, 7 giugno 2014
Introduzione al data journalism | Roma, 7 giugno 2014
 
130 FN 90 Febbraio 2017 - Tavola Rotonda L'analisi tanto attesa - Fieldbus & ...
130 FN 90 Febbraio 2017 - Tavola Rotonda L'analisi tanto attesa - Fieldbus & ...130 FN 90 Febbraio 2017 - Tavola Rotonda L'analisi tanto attesa - Fieldbus & ...
130 FN 90 Febbraio 2017 - Tavola Rotonda L'analisi tanto attesa - Fieldbus & ...
 
OpenCoesione DJD 2012 - Elaborazione, visualizzazione e diffusione dei dati s...
OpenCoesione DJD 2012 - Elaborazione, visualizzazione e diffusione dei dati s...OpenCoesione DJD 2012 - Elaborazione, visualizzazione e diffusione dei dati s...
OpenCoesione DJD 2012 - Elaborazione, visualizzazione e diffusione dei dati s...
 
Aggregatore di Open Data del territorio fiorentino e toscano
Aggregatore di Open Data del territorio fiorentino e toscano Aggregatore di Open Data del territorio fiorentino e toscano
Aggregatore di Open Data del territorio fiorentino e toscano
 
Going DIP: Document, Information & Process management per l’impresa digitale
Going DIP: Document, Information & Process management per l’impresa digitaleGoing DIP: Document, Information & Process management per l’impresa digitale
Going DIP: Document, Information & Process management per l’impresa digitale
 
Data Analytics per Manager
Data Analytics per ManagerData Analytics per Manager
Data Analytics per Manager
 
15.09.08 ODTCorsoTN+BZ+Regione
15.09.08 ODTCorsoTN+BZ+Regione15.09.08 ODTCorsoTN+BZ+Regione
15.09.08 ODTCorsoTN+BZ+Regione
 
Pubblica amministrazione: Smart Data e produzione di servizi pubblici innovat...
Pubblica amministrazione: Smart Data e produzione di servizi pubblici innovat...Pubblica amministrazione: Smart Data e produzione di servizi pubblici innovat...
Pubblica amministrazione: Smart Data e produzione di servizi pubblici innovat...
 

More from Istituto nazionale di statistica

More from Istituto nazionale di statistica (20)

Censimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profitCensimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profit
 
Censimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profitCensimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profit
 
Censimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profitCensimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profit
 
Censimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profitCensimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profit
 
Censimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profitCensimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profit
 
Censimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profitCensimenti Permanenti Istituzioni non profit
Censimenti Permanenti Istituzioni non profit
 
Censimento Permanente Istituzioni Pubbliche
Censimento Permanente Istituzioni PubblicheCensimento Permanente Istituzioni Pubbliche
Censimento Permanente Istituzioni Pubbliche
 
Censimento Permanente Istituzioni Pubbliche
Censimento Permanente Istituzioni PubblicheCensimento Permanente Istituzioni Pubbliche
Censimento Permanente Istituzioni Pubbliche
 
Censimento Permanente Istituzioni Pubbliche
Censimento Permanente Istituzioni PubblicheCensimento Permanente Istituzioni Pubbliche
Censimento Permanente Istituzioni Pubbliche
 
Censimento Permanente Istituzioni Pubbliche
Censimento Permanente Istituzioni PubblicheCensimento Permanente Istituzioni Pubbliche
Censimento Permanente Istituzioni Pubbliche
 
14a Conferenza Nazionale di Statisticacnstatistica14
14a Conferenza Nazionale di Statisticacnstatistica1414a Conferenza Nazionale di Statisticacnstatistica14
14a Conferenza Nazionale di Statisticacnstatistica14
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 

La visualizzazione dei Big Data: opportunità e sfide - di Stefano De Francisci

  • 1. La visualizzazione dei Big Data: opportunità e sfide Stefano De Francisci 27 maggio 2015
  • 2. Sommario La visualizzazione dei Big Data, Stefano De Francisci – Forum PA, 27 maggio 2015
  • 3. Complessità e rappresentazione grafica “The world is complex, dynamic, multidimensional; the paper is static, flat. on mere flatland?” E. Tufte, Envisioning Information, 1990 La visualizzazione dei Big Data, Stefano De Francisci – Forum PA, 27 maggio 2015 How are we to represent the rich visual world of experience and measurement
  • 4. Big data ”refers to datasets whose size is beyond the ability of typical database software tools to capture, store, manage, and analyze.” [McKinsey Global Institute, June 2011] Big Data Volume: dimensione effettiva del dataset Velocità: velocità di generazione dei dati (analisi dei dati in tempo reale o quasi) Varietà: varie tipologie di dati, provenienti da fonti diverse (strutturate e non) Una definizione Veracity Viscosity Value Validity Volatility Variability La visualizzazione dei Big Data, Stefano De Francisci – Forum PA, 27 maggio 2015
  • 5. Quanti dati nel mondo digitale? Se una lettera dell’alfabeto corrisponde a un Byte… uno Zettabyte corrisponde ad almeno 323 mila miliardi di volumi di Guerra e Pace… …una pallina a 500 transatlantici pieni di palline… … e un gigabyte di musica (960 minuti)… a 2 miliardi di anni di musica La visualizzazione dei Big Data, Stefano De Francisci – Forum PA, 27 maggio 2015 http://www.dailyinfographic.com/2016-the-year-of-the-zettabyte-infographic http://content.monetate.com/h/i/12311844-the-retailer-s-guide-to-big-data
  • 6. Target population Nuova opportunità Big Data come fonte addizionale alle fonti tradizionali della statistica ufficiale Direct Surveys Adm.ve registers Official Statistics BIG DATA Nuova sfida Andare oltre lo stadio sperimentale ed entrare nell’età della maturità BIG DATA Big Data e statistica ufficiale La visualizzazione dei Big Data, Stefano De Francisci – Forum PA, 27 maggio 2015
  • 7. Commercial or transactional Opinion Data exhaust Behaviour data Crowd-sourced data Sensor data Machine- generated data Human-sourced information Process- mediated data Internet of Things Social Networks Traditional Business systems Click stream RFID Smart meter Customer data Text data Machine data Location based data Mobile data Unstructured data Data at rest Data in motion Streaming data Quali fonti di Big Data possono giocare un ruolo significativo nella statistica ufficiale? Un accenno alle fonti La visualizzazione dei Big Data, Stefano De Francisci – Forum PA, 27 maggio 2015
  • 8. Sensori e macchine utilizzati per misurare e registrare eventi e situazioni nel mondo fisico • Satellite imaging • Road & traffic sensors Social Networks Traditional Business systems Internet of Things Machine-generated data La visualizzazione dei Big Data, Stefano De Francisci – Forum PA, 27 maggio 2015 Dati prodotti tramite l’interazione umana con dispositivi digitali (anche mobili): • Blog posts • Twitter messages • User-generated maps Dati raccolti da sistemi tradizionali in modalità passiva: • Medical records • Commercial transactions • Banking/stock records • Climate & environmental sensors • Logs & Web Logs
  • 9. Interazione visuale Visualizzatore Analista Utilizzatore Making decisions Dati grezzi Rappresentazione visuale Pattern visuali Presentazione grafica Infografica Problem- solving Sense- Making Sintesi visuale Esplorazione visuale Dashboard Il processo cognitivo visivo Storytelling Interazione visuale Interazione visuale Analisi visuale Esplorazione La visualizzazione dei Big Data, Stefano De Francisci – Forum PA, 27 maggio 2015
  • 10. Extreme-scale Dimensioni Combinazione di analisi e visualizzazione Livello del coinvolgimento umano Data in many forms Strutturati, non-strutturati, testi, dati multimediali Data in motion Analisi dei dati in streaming per consentire decisioni in frazioni di secondo Data at scale Da Petabyte (1015) a Exabyte (1018) Complex Information Spaces Elementi critici nell'applicazione dell’analisi visuale di dati a scala estrema e in spazi di informazione complessa (a) difficile confronto sulla base dei dati grezzi, (b) Necessità di combinare tipi diversi di dati Quando i dati diventano… big La visualizzazione dei Big Data, Stefano De Francisci – Forum PA, 27 maggio 2015
  • 11. Per sostenere l'intero ciclo di vita dei Big Data, un buon sistema di analisi visiva deve combinare i vantaggi dell'analisi automatica con tecniche interattive per esplorare i dati. Dietro questa caratteristica tecnica c’è lo scopo più profondo di integrare la capacità di analisi di un computer con la capacità dell'analisi umana. Volume, velocity, variety Mappare dati complessi in più semplici forme visuali di conoscenza • Definizione appropriata in fase di progettazione • Raggiungimento di un corretto peso e bilanciamento delle due componenti Analisi automatica e interazione visuale La visualizzazione dei Big Data, Stefano De Francisci – Forum PA, 27 maggio 2015
  • 12. Remco Chang – Fields Institute 15 Enfasi su… Metodo Riferimento Data reduction Big Data  Medium Data  Small Data+ R Wickham Visual interaction Nuovi pattern di rappresentazione grafica + Interazione Carpendale HCP Divide et impera + Calcolo parallelo Bowei Xi Filtering Filtering Interaction StarGlyphs + Parallel coordinates Tre scuole di pensiero La visualizzazione dei Big Data, Stefano De Francisci – Forum PA, 27 maggio 2015
  • 13. L’analisi automatizzata dei Big Data riguarda lo "sviluppo di metodi e tecniche per dare un senso di dati" [Fayyad] Caratteristiche “estreme” dei Big Data Report semplici Approssimazione descrittiva o modelli dei processi che hanno generato i dati Modelli predittivi per la stima di casi futuri Metodi specifici di data mining per la scoperta ed estrazione di conoscenza Più astratte Sintetiche Chiare Utili Enormi A basso livello Analisi automatica La visualizzazione dei Big Data, Stefano De Francisci – Forum PA, 27 maggio 2015
  • 14. Nel contesto di Big Data possono essere adottate alcune categorie essenziali dell’interazione come base di ragionamento analitico [Yi – et al.] • Select (contrassegna qualcosa come interessante) • Explore (mostrami qualcos’altro) • Reconfigure (mostrami una differente disposizione) • Encode (mostrami una differente rappresentazione) • Abstract/elaborate (mostrami più o meno dettagli) • Filter (mostrami qualcosa sotto certe condizioni) • Connect (mostrami I concetti collegati) http://www.cs.tufts.edu/comp/250VA/papers/yi2007toward.pdf Visualizzazione interattiva La visualizzazione dei Big Data, Stefano De Francisci – Forum PA, 27 maggio 2015
  • 15. Filter (show me something conditionally) Abstract/ elaborate (show me more or less detail) Explore (show me something else) Select (mark something as interesting) La visualizzazione dei Big Data, Stefano De Francisci – Forum PA, 27 maggio 2015
  • 16. 3. Internet of Things (machine-generated data) Data from sensors Fixed sensors Home automation Weather/pollution sensors Traffic sensors/webcam Scientific sensors Security videos/images Mobile sensors (tracking) Mobile phone location Cars Satellite images Data from computer systems Logs Web logs 1. Social Networks (human-sourced information) Social Networks Blogs and comments Personal documents Pictures: Instagram, Flickr, Picasa Videos: Youtube etc. Internet searches Mobile data content: text messages User-generated maps E-Mail 2. Traditional Business systems (process-mediated data) Data produced by Public Agencies Medical records Data produced by businesses Commercial transactions Banking/stock records E-commerce Credit cards La classificazione Big Data di UNECE La visualizzazione dei Big Data, Stefano De Francisci – Forum PA, 27 maggio 2015
  • 17. Human emotion Social Networks «This video shows the mood in the U.S., as inferred using over 300 million tweets, over the course of the day. The maps are represented using density-preserving cartograms» https://www.youtube.com/watch?v=ujcrJZRSGkg La visualizzazione dei Big Data, Stefano De Francisci – Forum PA, 27 maggio 2015
  • 18. Tweetcatcha Social Networks «TweetCatcha seeks to uncover the organic nature of news as it travels through Twitter over time, by examining the movement of NY Times articles through Twitter» La visualizzazione dei Big Data, Stefano De Francisci – Forum PA, 27 maggio 2015 http://a.parsons.edu/~drumb588/tweetcatcha/
  • 19. Human disease network Medical records «The diseasome website is a disease/disorder relationships explorer and a sample of an innovative map-oriented scientific work. Built by a team of researchers and engineers, it uses the Human Disease Network dataset and allows intuitive knowledge discovery by mapping its complexity» La visualizzazione dei Big Data, Stefano De Francisci – Forum PA, 27 maggio 2015 http://diseasome.eu/map.html
  • 20. Urban Mobs Mobile phone location http://www.urbanmobs.fr/fr/france/ «Cette visualisation représente la quantité de SMS envoyés le soir de la fête de la musique (21 juin 2008). On peut découvrir à partir de 17h une forte activité aux alentours du Parc des Princes que nous pouvons mettre en parallèle avec le concert de Tokio Hotel ce soir là. On remarque ensuite un autre foyer d'activité à l'hippodrome d'Auteuil correspondant au concert organisé par France 2» La visualizzazione dei Big Data, Stefano De Francisci – Forum PA, 27 maggio 2015
  • 21. Weekly consumption per hour of day over a year (IE) winter summer mid-seasons Tool: Processing Visualization of Irish Data Fixed sensors La visualizzazione dei Big Data, Stefano De Francisci – Forum PA, 27 maggio 2015 Source: International collaboration project on The Role of Big Data in the Modernisation of Statistical Production (overseen by the High-Level Group for the Modernisation of Statistical Production and Services)
  • 22. Tool: Pentaho Visualization of Canadian Data Fixed sensors La visualizzazione dei Big Data, Stefano De Francisci – Forum PA, 27 maggio 2015 Hourly consumption per day on a single month Source: International collaboration project on The Role of Big Data in the Modernisation of Statistical Production (overseen by the High-Level Group for the Modernisation of Statistical Production and Services)
  • 23. http://blog.profitbricks.com/39-data- visualization-tools-for-big-data/ http://www.visualisingdata.com/ http://www.dailyinfographic.com/ Risorse in rete. Esempi http://blogopole.observatoire- presidentielle.fr/ http://www.dailyinfograp hic.com/2016-the-year- of-the-zettabyte- infographic http://content.monetate.com/ h/i/12311844-the-retailer-s- guide-to-big-data La visualizzazione dei Big Data, Stefano De Francisci – Forum PA, 27 maggio 2015