2. “Big Data”
● Tante definizioni
● Un solo concetto semplice
● Grandi quantità di dati strutturati e non strutturati da
organizzare ed analizzare
● Da qualche gigabyte ai terabyte, ai petabyte fino agli zettabyte e
yottabyte
5. Esempi estremi di “Big Data”
● Il sistema di generazione dati della Climate Corporation - migliaia di server
per rielaborare periodicamente decenni di dati storici e generare 10.000
possibili scenari relativi al tempo per ogni collocazione geografica e
grandezza, si traduce in oltre 10 trilioni di dati relativi a possibili scenari (ad
esempio, un valore atteso di pioggia in un luogo specifico e in un momento
specifico) che possono essere utilizzati per determinare l’ammontare del
premio assicurativo e per l’analisi dei rischi, per un totale di oltre 50 terabyte
di dati presenti nei sistemi di raccolta in un qualsiasi momento.
● La Sloan Digital Sky Survey (SDSS) ha iniziato a raccogliere dati astronomici
nel 2000 ed è riuscita a raccogliere nelle prime settimane di attività più dati
di quanti ne siano mai stati raccolti nella storia dell’astronomia. Lavorando
ad un ritmo di circa 200 GB per notte, SDSS ha accumulato già più di 140
terabyte di informazioni.
● In totale i quattro rivelatori principali del Large Hadron Collider (LHC) di
Ginevra hanno prodotto 13 petabyte di dati nel 2010 (13.000 terabyte)
6. Overview
● Cosa intendiamo per “Big Data”?
● Un’industria in crescita
● Esempi da vendors
● La visione universitaria
● Problematiche legali
● Discussioni
7. Cosa intendiamo per “Big Data”?
● McKinsey & Company nel suo report di giugno 2011 indica che il
termine “Big Data” si riferisce a quei database la cui dimensione è al
di là della capacità di gestione dei normali strumenti software per
database. Questa definizione è volutamente soggettiva e incorpora
una definizione in evoluzione di quanto debba essere grande un set di
dati per poter essere considerato big data ...
● SAS/CEBR report (aprile 2012): “La quantità di dati continua a
crescere in modo esponenziale, generata da Internet, dai social media,
dal cloud computing e dai dispositivi mobili, si pone quindi una sfida
ed un'opportunità per le organizzazioni – come gestire, analizzare ed
utilizzare la sempre maggiore quantità di dati generati”.
● Big Data è un concetto aperto e la definizione variabile, dipende dalla
potenza a diposizione ma anche una quantità di dati relativamente
piccola può creare problemi di gestione
8. Dove è possibile reperire i “Big Data”?
● Da dove arrivano?
● Dati strutturati e non strutturati
● Quanto costano la gestione e raccolta di questi dati?
● É necessaria una nuova infrastruttura IT?
● Occorre un progetto di analisi e obiettivi da raggiungere
9. Dati Interni
● Ogni organizzazione produce un grande numero di dati o vi ha
accesso.
● Questi dati sono molto spesso trascurati, conservati ma non utilizzati
oppure semplicemente cancellati e persi.
● Dati macchina, e-mail, documenti, processi, sensori, traffico web ecc.
10. Il mondo digitale
● Il mondo dei dispositivi mobili e dei social network genera un numero
sempre maggiore di nuovi dati personali e le stesse opinioni degli
utenti possono fornire indicazioni che prima non erano
semplicemente disponibili
11. Cosa si intende per Big Data? – Le tre “V”
● Volume – il volume dei dati è sempre più grande
● I dati globali digitali sono arrivati fino a 1.227 exabyte nel 2010 e si prevede di
raggiungere 7.910 exabyte nel 2015. Secondo una stima, se solo un exabyte di dati fosse
salvato su DVD sarebbero necessari 13513 Boeing 747 per il trasporto di tutti i DVD
utilizzati.
● Velocità – aumento della velocità di creazione, acquisizione e condivisione dei dati
● A partire dal 2000 fino al 2010, la Sloan Digital Sky Survey ha raccolto 140 terabytes di
informazioni. Nel 2016, il suo erede sarà in grado di raccogliere lo stesso quantitativo di
informazioni ogni cinque anni
● Varietà – proliferazione di tipologie diverse di dati
● 80-85% dei dati a livello globale sono considerati attualmente non strutturati.
● Ad esempio, lo possono essere i dati relativi al traffico o alla geolocalizzazione tratti da
telecomunicazioni, blog, RFID e dati derivanti da sensori, gli spostamenti dei veicoli o
dati relativi alla posizione degli aeromobili, i dati relativi alle condizioni meteo, alle
transazioni finanziarie, alle statistiche di vendita, analisi delle parole chiave etc.
● Valore, Visione – non limitiamo il concetto alla terminologia
12. Cloud Computing
● Il “Cloud computing” permette l’accesso, la riorganizzazione e l’utilizzo del
“Big Data” fornendo un accesso virtualmente illimitato ed economico a
risorse hardware e software e ad uno spazio di archiviazione praticamente
illimitato ed utilizzabile in modo elastico
● Progetti di analisi dei dati possono essere usati separatamente ed
indipendentemente dal nucleo centrale delle funzioni e dei sistemi aziendali e
non appesantire i sistemi aziendali
● Opportunità e problemi dell’uso del Cloud, non più silos ma unico database
13. Cosa può essere fatto con i “Big Data”
● Data Mining e Data Extraction
● Analisi e Visualizzazione dei dati
● Infinite possibilità di raccolta dati e business intelligence
● Identificazione trend, rischi, errori, sprechi
● Monitoraggio in tempo reale
● Dati oggettivi
● Nuove opportunità di business
14. Alcuni esempi…
● Fashion - percezione del brand - “sentiment” degli utenti – studio dei trend -
logistica - contraffazione – analisi concorrenti
● Automotive – analisi dati sensori di bordo, manutenzione predittiva,
assistenza, correzione errori, prevenzioni incidenti, assistenza alla guida,
logistica prodotti e ricambi, studio garanzie prodotti
● Life Science – studi osservazionali utilizzo farmaci, studio trend
epidemiologici popolazione, studio parametri esclusione per studi clinici,
studio necessità popolazione, identificazione frodi
● Retail – Dati utente su consumi e budget di spesa, analisi uso siti ed e-
commerce, preferenze di acquisto, interazione tramite strumenti portatili
utenti, personalizzazione esperienza d’acquisto, smart carts, apps e rfid codes
sui prodotti, suggerimenti e promozioni in tempo reale, strumenti di
comparazione prezzi, geolocalizzazione
15. Ulteriori esempi
● Banche – connessione dati operazioni e iniziative retail, studio dei portafogli,
studio sentiment clienti, servizi valore aggiunto clienti, controllo e
prevenzione frodi
● Logistica – integrazione con dati retail, consumi e preferenze, dati
promozioni e interventi in garanzia , ottimizzazione consegna e magazzino,
logistica real time e consegne nello stesso giorno, dati di spedizione, viaggio,
consegna in tempo reale
● Advertising e Marketing – studio sentiment social network, modello
comunicazione mirata al singolo utente, uso di strumenti per analisi
semantica, linguaggio naturale e studio di cluster informativi
● Assicurazioni – personalizzazione polizze e coperture a secondo del
comportamento utente, studio storia veicolo, analisi rischi reali bene
assicurato, individuazione frodi, dati ambientali per calcolo rischio
16. Problematiche legali
1
● Chi possiede i “Big Data”?
● Creazione e gestione del database
● Direttiva relativa al settore degli Open Data pubblici
● Dati generati dagli utenti
● Dati organizzati e strutturati
● Dati non strutturati
● Dati estratti ed analizzati
● Diritti dei fornitori di strumenti relativi a “Big Data”
17. Problematiche legali
2
● Tutti diventeremo dei “big brother”?
● Nuova proposta di regolamento UE per il trattamento dei dati personali
(privacy by design, diritto all’oblio)
● Nuove tipologie di consenso, data portability, trasferimento all’estero
● Come rispettare il diritto di accesso e cancellazione?
● Dati personali persi all’interno dei “Big Data”
● Dati estratti dall’associazione di informazioni
● Data Breach Notification
● Incidente Target (previsione gravidanza)
18. Problematiche legali
3
● I limiti del copyright
● “Big Data”ed il principio dell’esaurimento
● Eccezioni al diritto d’autore
● Necessità di licenze per analizzare materiale protetto
● L’analisi dei dati può essere considerata utilizzo dei contenuti? Copia?
● Proposte di liberalizzazione per attività e strumenti analitici
● “Big Data” un nuovo strumento contro la pirateria?
● Proteggibilità del database e dei risultati delle analisi
19. Problematiche legali
4
● Sicurezza e protezione dei dati, necessità di garanzie
● Aspetti Antitrust
● Rapporti con licenze open source
● Uso dei dati in ambito contenzioso
● Aumento delle garanzie e delle responsabilità
● Mercati regolamentati (borsa, finanza, banche, pubblicità, assicurazioni)
20. Thank you
Avv Roberto Camilli
+39 02 30 35 60 00
roberto.camilli@twobirds.com
Bird & Bird is an international legal practice comprising Bird & Bird LLP and its affiliated and associated businesses.
Bird & Bird LLP is a limited liability partnership, registered in England and Wales with registered number OC340318 and is authorised and regulated by the
Solicitors Regulation Authority. Its registered office and principal place of business is at 15 Fetter Lane, London EC4A 1JP. A list of members of Bird & Bird LLP and
of any non-members who are designated as partners, and of their respective professional qualifications, is open to inspection at that address.
twobirds.com