SlideShare a Scribd company logo
1 of 32
Download to read offline
Big Data is now: tomorrow is too late!
Evento organizzato da ImoLug e FABLAB Imola – Relatore Franco Tampieri
?
?
?
?
?
?
?? ?
?
?
Prima di iniziare...
●
Nome: Franco Tampieri
●
ETA’: 41
●
BIO:
– Senior C# Developer
– Python Senior Developer
– Odoo Senior Developer
– Linux Senior DevOps
– OpenSource Technology Evangelist
Avvertenze...
●
Le valutazioni che proporrò non fanno alcun riferimento se
non puramente casuale e fantastico a cospirazioni
massoniche, interplanetarie etc. etc. etc.
●
Non è stato maltrattato nessun analista o programmatore
e le immagini che verranno proposte sono soltanto frutto
della immaginazione dell’autore
●
La consultazione privata di questa presentazione non
causerà la morte di nessun gattino
… … ...
Una immagine vale molto più di 1000 parole...
Iniziamo dalla base...
●
Esistono “cose” che sono così “enormi” che possono
avere implicazioni per ognuno di noi, che lo vogliamo o
meno…
Cit. Bernard Marr
●
I “Big Data” sono una di quelle cose che stanno
completamente rivoluzionando il modo di fare business,
ma però, sta impattando anche molte parti della nostra vita
quotidiana
Iniziamo dalla base...
Cosa intendiamo col termine “Big Data”?
●
Tutto quello che facciamo e che lascia una traccia digitale,
che aumenta continuamente con il passare del tempo e
che è possibile analizzare
●
Metodologie, Strumenti e Architetture specializzate per
l’analisi di dati di gradi dimensioni e varietà
Iniziamo dalla base...
...”Dall’alba della
civilizzazione al 2003, il
genere umano ha generato 5
exabytes di dati. Adesso
produciamo 5 exabyte di dati
ogni 2 giorni ed il ritmo sta
aumentando”…
Cit. Eric Schmidt, Executive
Chairman, Google
Approfondiamo...
Quali sono questi dati che mettiamo a disposizione e che
si rivelano così tanto importanti?
●
Attività
●
Conversazioni
●
Foto e Video
●
Sensori
●
IoT / Industrial 4.0
Approfondiamo...
Attività
●
Ascoltare musica
●
Leggere ebooks
●
Utilizzare smartphone
●
Web browser
●
Fare acquisti OnLine
Approfondiamo...
Conversazioni
●
Emails
●
Chat (Facebook, Twitter)
●
Voice conversation
Approfondiamo...
Foto e Video
●
Foto (Facebook, Instagram)
●
Video (Facebook, Youtube, Vimeo)
Approfondiamo...
Sensori
●
GPS
●
Accellerometri
Approfondiamo...
IoT / Industrial 4.0
●
SmartTv (Samsung, LG)
●
Cloud services (IFTTT)
Approfondiamo...
Datifichiamo...
Fino a qualche anno fa, direi 2009 / 2010 la datificazione
dei “Big Data” veniva classificata con 3 proprietà principali
definite le 3 “V”:
●
Volume
●
Velocità
●
Varietà
Datifichiamo...
Da circa 2 anni a questa parte possiamo aggiungere una
ulteriore proprietà per la datificazione dei “Big Data”: la
Veridicità
Inoltre la somma delle 4 V e l’insieme delle possibili analisi
di questi dati ne determinano la proprietà globale che è il
Valore
I Big Data le 4 + 1 V...
●
Volume: Quantità dei dati
●
Velocità: Velocità di generazione dei dati
●
Varietà: Tipologia dei dati
●
Veridicità: L’affidabilità dei dati
●
Valore = F*(Volume + Velocità + Varietà + Veridicità)
* è una trasformata che include Metodologie, Strumenti e
Architetture atte all’elaborazione di questi tipi di dato
Finamente ecco i BIG DATA
Come si memorizzano i BIG DATA
Come si memorizzano i BIG DATA
●
Punto 1: Analisi
– Analisi delle caratteristiche dei dati in possesso
– Eliminazione dei dati ridondanti
– Valutare l’uso e l’eventuale ruolo di Database
NoSQL
Come si memorizzano i BIG DATA
●
Punto 2: Tipizzazione
– Chiave:Valore
– Grafico
– Documenti
Come si memorizzano i BIG DATA
●
Punto 3: Scelta del data store
– Storage Distribuito / Rindondato / Estensibile
– Supporto poliglottico
– Supporto Flessibile dei metadati e possibilità di gestire dati di
varia natura*
*Purtroppo I RDBMS in questo frangente possono essere un
limite e spesso soluzioni specializzate come sistemi di storage
di dati telemetrici (Influxdb, elastic search) o filesystem come
HDFS (Hadoop) sono soluzioni più valide
Come si preparano i BIG DATA
●
Preparazione
– Mappatura dei dati verso il Framework di Analisi
– Collegare ed estrarre le informazioni dallo storage
Come si preparano i BIG DATA
Come si processano i BIG DATA
●
Elaborazione
– Trasformazione dei dati per essere processati
– Suddivisione dei dati per distribuirne il processo
– Controllo dei processi per ottenere il risultato finale
Come si processano i BIG DATA
Come si processano i BIG DATA
●
Analisi e Presentazione
– Raccolta dei dati finali ed elaborazione in grafici, tabelle
pivot e dashboard per la Business Intelligence
Come si presentano i BIG DATA
Infine ecco il VALORE dei BIG DATA
Datificazione:
●
Attività
●
Conversazioni
●
Foto
●
Video
●
...
Analisi:
●
Text Analytics
●
Sentiment
Analysis
●
Face recognition
●
Voice analytics
●
Moviment
analytics
●
…
●
Volume
●
Velocità
●
Varietà
●
Veridicità
VALORE
Strumenti per i BIG DATA
●
Framework: Hadoop (HDFS e MapReduce)
●
Strumenti di Analisi:
– Python: scikit-learn, nltk, spyder, jupyter notebooks
– Pentaho BI
DOMANDE ?
Contatti:
Franco Tampieri
https://www.linkedin.com/in/francotampieri

More Related Content

What's hot

Big Data, Open Data e AppsforItaly: i dati come conversazione importano alle ...
Big Data, Open Data e AppsforItaly: i dati come conversazione importano alle ...Big Data, Open Data e AppsforItaly: i dati come conversazione importano alle ...
Big Data, Open Data e AppsforItaly: i dati come conversazione importano alle ...Matteo Brunati
 
Le opportunita dei Big Data - Palazzolo Digital Festival 2013 (PDF13)
Le opportunita dei Big Data - Palazzolo Digital Festival 2013 (PDF13)Le opportunita dei Big Data - Palazzolo Digital Festival 2013 (PDF13)
Le opportunita dei Big Data - Palazzolo Digital Festival 2013 (PDF13)Vincenzo Manzoni
 
Gestione dei big data: Web 3.0, motori semantici, soft computing
Gestione dei big data: Web 3.0, motori semantici, soft computing Gestione dei big data: Web 3.0, motori semantici, soft computing
Gestione dei big data: Web 3.0, motori semantici, soft computing Valerio Eletti
 
Big Data - Breve panoramica
Big Data - Breve panoramicaBig Data - Breve panoramica
Big Data - Breve panoramicaLuca Naso
 
Big data e business intelligence
Big data e business intelligenceBig data e business intelligence
Big data e business intelligenceMarco Pozzan
 
Big data e pubblica amministrazione
Big data e pubblica amministrazioneBig data e pubblica amministrazione
Big data e pubblica amministrazioneGianfranco Andriola
 
Poliglottismo tecnologico & innovazione: un matrimonio perfetto? Esperienze d...
Poliglottismo tecnologico & innovazione: un matrimonio perfetto? Esperienze d...Poliglottismo tecnologico & innovazione: un matrimonio perfetto? Esperienze d...
Poliglottismo tecnologico & innovazione: un matrimonio perfetto? Esperienze d...Data Driven Innovation
 
Reinventing experience: dai dati alla progettazione
Reinventing experience: dai dati alla progettazioneReinventing experience: dai dati alla progettazione
Reinventing experience: dai dati alla progettazioneData Driven Innovation
 
Le tecnologie dei Big Data
Le tecnologie dei Big DataLe tecnologie dei Big Data
Le tecnologie dei Big DataVincenzo Manzoni
 
Introduzione ai Big Data e alla scienza dei dati
Introduzione ai Big Data e alla scienza dei datiIntroduzione ai Big Data e alla scienza dei dati
Introduzione ai Big Data e alla scienza dei datiVincenzo Manzoni
 
Big Data 2014: Marketing & Social Media
Big Data 2014: Marketing & Social MediaBig Data 2014: Marketing & Social Media
Big Data 2014: Marketing & Social MediaValerio Torriero
 
Business Intelligence, Analytics e Big Data: una guida per capire e orientarsi
Business Intelligence, Analytics e Big Data: una guida per capire e orientarsiBusiness Intelligence, Analytics e Big Data: una guida per capire e orientarsi
Business Intelligence, Analytics e Big Data: una guida per capire e orientarsiSMAU
 
Digital Transformation: Big Data, User Targeting ed Etica - Project Work Mast...
Digital Transformation: Big Data, User Targeting ed Etica - Project Work Mast...Digital Transformation: Big Data, User Targeting ed Etica - Project Work Mast...
Digital Transformation: Big Data, User Targeting ed Etica - Project Work Mast...Free Your Talent
 
Introduzione ai Big Data e alla scienza dei dati
Introduzione ai Big Data e alla scienza dei datiIntroduzione ai Big Data e alla scienza dei dati
Introduzione ai Big Data e alla scienza dei datiVincenzo Manzoni
 
M. Scannapieco - Big Data e Open Data: Istruzioni (o quasi) per l’Uso
M. Scannapieco - Big Data e Open Data:  Istruzioni (o quasi) per l’Uso  M. Scannapieco - Big Data e Open Data:  Istruzioni (o quasi) per l’Uso
M. Scannapieco - Big Data e Open Data: Istruzioni (o quasi) per l’Uso Istituto nazionale di statistica
 

What's hot (20)

Big Data, Open Data e AppsforItaly: i dati come conversazione importano alle ...
Big Data, Open Data e AppsforItaly: i dati come conversazione importano alle ...Big Data, Open Data e AppsforItaly: i dati come conversazione importano alle ...
Big Data, Open Data e AppsforItaly: i dati come conversazione importano alle ...
 
Le opportunita dei Big Data - Palazzolo Digital Festival 2013 (PDF13)
Le opportunita dei Big Data - Palazzolo Digital Festival 2013 (PDF13)Le opportunita dei Big Data - Palazzolo Digital Festival 2013 (PDF13)
Le opportunita dei Big Data - Palazzolo Digital Festival 2013 (PDF13)
 
Gestione dei big data: Web 3.0, motori semantici, soft computing
Gestione dei big data: Web 3.0, motori semantici, soft computing Gestione dei big data: Web 3.0, motori semantici, soft computing
Gestione dei big data: Web 3.0, motori semantici, soft computing
 
Big Data
Big DataBig Data
Big Data
 
Big data
Big dataBig data
Big data
 
Big Data - Breve panoramica
Big Data - Breve panoramicaBig Data - Breve panoramica
Big Data - Breve panoramica
 
Big data e business intelligence
Big data e business intelligenceBig data e business intelligence
Big data e business intelligence
 
Big data e pubblica amministrazione
Big data e pubblica amministrazioneBig data e pubblica amministrazione
Big data e pubblica amministrazione
 
Poliglottismo tecnologico & innovazione: un matrimonio perfetto? Esperienze d...
Poliglottismo tecnologico & innovazione: un matrimonio perfetto? Esperienze d...Poliglottismo tecnologico & innovazione: un matrimonio perfetto? Esperienze d...
Poliglottismo tecnologico & innovazione: un matrimonio perfetto? Esperienze d...
 
Reinventing experience: dai dati alla progettazione
Reinventing experience: dai dati alla progettazioneReinventing experience: dai dati alla progettazione
Reinventing experience: dai dati alla progettazione
 
Le tecnologie dei Big Data
Le tecnologie dei Big DataLe tecnologie dei Big Data
Le tecnologie dei Big Data
 
Introduzione ai Big Data e alla scienza dei dati
Introduzione ai Big Data e alla scienza dei datiIntroduzione ai Big Data e alla scienza dei dati
Introduzione ai Big Data e alla scienza dei dati
 
Big Data 2014: Marketing & Social Media
Big Data 2014: Marketing & Social MediaBig Data 2014: Marketing & Social Media
Big Data 2014: Marketing & Social Media
 
Business Intelligence, Analytics e Big Data: una guida per capire e orientarsi
Business Intelligence, Analytics e Big Data: una guida per capire e orientarsiBusiness Intelligence, Analytics e Big Data: una guida per capire e orientarsi
Business Intelligence, Analytics e Big Data: una guida per capire e orientarsi
 
Digital Transformation: Big Data, User Targeting ed Etica - Project Work Mast...
Digital Transformation: Big Data, User Targeting ed Etica - Project Work Mast...Digital Transformation: Big Data, User Targeting ed Etica - Project Work Mast...
Digital Transformation: Big Data, User Targeting ed Etica - Project Work Mast...
 
Data Governance at work
Data Governance at workData Governance at work
Data Governance at work
 
Introduzione ai Big Data e alla scienza dei dati
Introduzione ai Big Data e alla scienza dei datiIntroduzione ai Big Data e alla scienza dei dati
Introduzione ai Big Data e alla scienza dei dati
 
Open data
Open dataOpen data
Open data
 
M. Scannapieco - Big Data e Open Data: Istruzioni (o quasi) per l’Uso
M. Scannapieco - Big Data e Open Data:  Istruzioni (o quasi) per l’Uso  M. Scannapieco - Big Data e Open Data:  Istruzioni (o quasi) per l’Uso
M. Scannapieco - Big Data e Open Data: Istruzioni (o quasi) per l’Uso
 
Big data e Business Intelligence | presentazione open day @Fondazione Kennedy...
Big data e Business Intelligence | presentazione open day @Fondazione Kennedy...Big data e Business Intelligence | presentazione open day @Fondazione Kennedy...
Big data e Business Intelligence | presentazione open day @Fondazione Kennedy...
 

Similar to Big data

Data Driven Innovation: sfide e opportunità
Data Driven Innovation: sfide e opportunitàData Driven Innovation: sfide e opportunità
Data Driven Innovation: sfide e opportunitàData Driven Innovation
 
02 - VMUGIT - Lecce 2018 - Enrico Signoretti, OpenIO
02 - VMUGIT - Lecce 2018 - Enrico Signoretti, OpenIO02 - VMUGIT - Lecce 2018 - Enrico Signoretti, OpenIO
02 - VMUGIT - Lecce 2018 - Enrico Signoretti, OpenIOVMUG IT
 
Its allaboudatadiversity2019rev1.2
Its allaboudatadiversity2019rev1.2Its allaboudatadiversity2019rev1.2
Its allaboudatadiversity2019rev1.2Stefano Gatti
 
Data Analysis & Machine Learning
Data Analysis & Machine LearningData Analysis & Machine Learning
Data Analysis & Machine LearningCaffeina
 
Cicerus - una piattaforma per lo sviluppo di chatbot
Cicerus - una piattaforma per lo sviluppo di chatbotCicerus - una piattaforma per lo sviluppo di chatbot
Cicerus - una piattaforma per lo sviluppo di chatbotPaolo Montrasio
 
Big data & opendata
Big data & opendataBig data & opendata
Big data & opendataDatiGovIT
 
Lorenzo Diaco, CEO di @Publytics – “Navigare nell’era del Cookieless: strateg...
Lorenzo Diaco, CEO di @Publytics – “Navigare nell’era del Cookieless: strateg...Lorenzo Diaco, CEO di @Publytics – “Navigare nell’era del Cookieless: strateg...
Lorenzo Diaco, CEO di @Publytics – “Navigare nell’era del Cookieless: strateg...Associazione Digital Days
 
Come farsi capire dagli Informatici (Smau Roma 2013)
Come farsi capire dagli Informatici (Smau Roma 2013)Come farsi capire dagli Informatici (Smau Roma 2013)
Come farsi capire dagli Informatici (Smau Roma 2013)Walter Vannini
 
La gestione logica dei dati come chiave del successo per Data Scientist e Bus...
La gestione logica dei dati come chiave del successo per Data Scientist e Bus...La gestione logica dei dati come chiave del successo per Data Scientist e Bus...
La gestione logica dei dati come chiave del successo per Data Scientist e Bus...Denodo
 
Linux day 2008
Linux day 2008Linux day 2008
Linux day 2008digital2b
 
Datarace: IoT e Big Data (Italian)
Datarace: IoT e Big Data (Italian)Datarace: IoT e Big Data (Italian)
Datarace: IoT e Big Data (Italian)Davide Mauri
 
Data mining, business intelligence e dintorni
Data mining, business intelligence e dintorniData mining, business intelligence e dintorni
Data mining, business intelligence e dintorniMaurizio Girometti
 
One - L'assistente vocale fai da te
One - L'assistente vocale fai da teOne - L'assistente vocale fai da te
One - L'assistente vocale fai da teClaudio Cama
 
IoT Saturday PN 2019 - S8-6 Francesco Not
IoT Saturday PN 2019 - S8-6 Francesco NotIoT Saturday PN 2019 - S8-6 Francesco Not
IoT Saturday PN 2019 - S8-6 Francesco NotFrancesco Not
 
Cloud, IoT and Big Data
Cloud, IoT and Big DataCloud, IoT and Big Data
Cloud, IoT and Big DataSolidQIT
 
Industrial iot: dalle parole ai fatti
Industrial iot: dalle parole ai fatti Industrial iot: dalle parole ai fatti
Industrial iot: dalle parole ai fatti Riccardo Zamana
 

Similar to Big data (20)

Data Driven Innovation: sfide e opportunità
Data Driven Innovation: sfide e opportunitàData Driven Innovation: sfide e opportunità
Data Driven Innovation: sfide e opportunità
 
IoT e l'integrazione cloud edge
IoT e l'integrazione cloud edgeIoT e l'integrazione cloud edge
IoT e l'integrazione cloud edge
 
02 - VMUGIT - Lecce 2018 - Enrico Signoretti, OpenIO
02 - VMUGIT - Lecce 2018 - Enrico Signoretti, OpenIO02 - VMUGIT - Lecce 2018 - Enrico Signoretti, OpenIO
02 - VMUGIT - Lecce 2018 - Enrico Signoretti, OpenIO
 
Its allaboudatadiversity2019rev1.2
Its allaboudatadiversity2019rev1.2Its allaboudatadiversity2019rev1.2
Its allaboudatadiversity2019rev1.2
 
Data Analysis & Machine Learning
Data Analysis & Machine LearningData Analysis & Machine Learning
Data Analysis & Machine Learning
 
Cicerus - una piattaforma per lo sviluppo di chatbot
Cicerus - una piattaforma per lo sviluppo di chatbotCicerus - una piattaforma per lo sviluppo di chatbot
Cicerus - una piattaforma per lo sviluppo di chatbot
 
Il mondo dei Big Data
Il mondo dei Big DataIl mondo dei Big Data
Il mondo dei Big Data
 
Big data & opendata
Big data & opendataBig data & opendata
Big data & opendata
 
Lorenzo Diaco, CEO di @Publytics – “Navigare nell’era del Cookieless: strateg...
Lorenzo Diaco, CEO di @Publytics – “Navigare nell’era del Cookieless: strateg...Lorenzo Diaco, CEO di @Publytics – “Navigare nell’era del Cookieless: strateg...
Lorenzo Diaco, CEO di @Publytics – “Navigare nell’era del Cookieless: strateg...
 
_ABIlab-BigData-Finale
_ABIlab-BigData-Finale_ABIlab-BigData-Finale
_ABIlab-BigData-Finale
 
Come farsi capire dagli Informatici (Smau Roma 2013)
Come farsi capire dagli Informatici (Smau Roma 2013)Come farsi capire dagli Informatici (Smau Roma 2013)
Come farsi capire dagli Informatici (Smau Roma 2013)
 
La gestione logica dei dati come chiave del successo per Data Scientist e Bus...
La gestione logica dei dati come chiave del successo per Data Scientist e Bus...La gestione logica dei dati come chiave del successo per Data Scientist e Bus...
La gestione logica dei dati come chiave del successo per Data Scientist e Bus...
 
Linux day 2008
Linux day 2008Linux day 2008
Linux day 2008
 
Datarace: IoT e Big Data (Italian)
Datarace: IoT e Big Data (Italian)Datarace: IoT e Big Data (Italian)
Datarace: IoT e Big Data (Italian)
 
Data mining, business intelligence e dintorni
Data mining, business intelligence e dintorniData mining, business intelligence e dintorni
Data mining, business intelligence e dintorni
 
One - L'assistente vocale fai da te
One - L'assistente vocale fai da teOne - L'assistente vocale fai da te
One - L'assistente vocale fai da te
 
IoT Saturday PN 2019 - S8-6 Francesco Not
IoT Saturday PN 2019 - S8-6 Francesco NotIoT Saturday PN 2019 - S8-6 Francesco Not
IoT Saturday PN 2019 - S8-6 Francesco Not
 
Cloud, IoT and Big Data
Cloud, IoT and Big DataCloud, IoT and Big Data
Cloud, IoT and Big Data
 
Privacy in enigmate
Privacy in enigmatePrivacy in enigmate
Privacy in enigmate
 
Industrial iot: dalle parole ai fatti
Industrial iot: dalle parole ai fatti Industrial iot: dalle parole ai fatti
Industrial iot: dalle parole ai fatti
 

Big data

  • 1. Big Data is now: tomorrow is too late! Evento organizzato da ImoLug e FABLAB Imola – Relatore Franco Tampieri ? ? ? ? ? ? ?? ? ? ?
  • 2. Prima di iniziare... ● Nome: Franco Tampieri ● ETA’: 41 ● BIO: – Senior C# Developer – Python Senior Developer – Odoo Senior Developer – Linux Senior DevOps – OpenSource Technology Evangelist
  • 3. Avvertenze... ● Le valutazioni che proporrò non fanno alcun riferimento se non puramente casuale e fantastico a cospirazioni massoniche, interplanetarie etc. etc. etc. ● Non è stato maltrattato nessun analista o programmatore e le immagini che verranno proposte sono soltanto frutto della immaginazione dell’autore ● La consultazione privata di questa presentazione non causerà la morte di nessun gattino
  • 5. Una immagine vale molto più di 1000 parole...
  • 6. Iniziamo dalla base... ● Esistono “cose” che sono così “enormi” che possono avere implicazioni per ognuno di noi, che lo vogliamo o meno… Cit. Bernard Marr ● I “Big Data” sono una di quelle cose che stanno completamente rivoluzionando il modo di fare business, ma però, sta impattando anche molte parti della nostra vita quotidiana
  • 7. Iniziamo dalla base... Cosa intendiamo col termine “Big Data”? ● Tutto quello che facciamo e che lascia una traccia digitale, che aumenta continuamente con il passare del tempo e che è possibile analizzare ● Metodologie, Strumenti e Architetture specializzate per l’analisi di dati di gradi dimensioni e varietà
  • 8. Iniziamo dalla base... ...”Dall’alba della civilizzazione al 2003, il genere umano ha generato 5 exabytes di dati. Adesso produciamo 5 exabyte di dati ogni 2 giorni ed il ritmo sta aumentando”… Cit. Eric Schmidt, Executive Chairman, Google
  • 9. Approfondiamo... Quali sono questi dati che mettiamo a disposizione e che si rivelano così tanto importanti? ● Attività ● Conversazioni ● Foto e Video ● Sensori ● IoT / Industrial 4.0
  • 10. Approfondiamo... Attività ● Ascoltare musica ● Leggere ebooks ● Utilizzare smartphone ● Web browser ● Fare acquisti OnLine
  • 12. Approfondiamo... Foto e Video ● Foto (Facebook, Instagram) ● Video (Facebook, Youtube, Vimeo)
  • 14. Approfondiamo... IoT / Industrial 4.0 ● SmartTv (Samsung, LG) ● Cloud services (IFTTT)
  • 16. Datifichiamo... Fino a qualche anno fa, direi 2009 / 2010 la datificazione dei “Big Data” veniva classificata con 3 proprietà principali definite le 3 “V”: ● Volume ● Velocità ● Varietà
  • 17. Datifichiamo... Da circa 2 anni a questa parte possiamo aggiungere una ulteriore proprietà per la datificazione dei “Big Data”: la Veridicità Inoltre la somma delle 4 V e l’insieme delle possibili analisi di questi dati ne determinano la proprietà globale che è il Valore
  • 18. I Big Data le 4 + 1 V... ● Volume: Quantità dei dati ● Velocità: Velocità di generazione dei dati ● Varietà: Tipologia dei dati ● Veridicità: L’affidabilità dei dati ● Valore = F*(Volume + Velocità + Varietà + Veridicità) * è una trasformata che include Metodologie, Strumenti e Architetture atte all’elaborazione di questi tipi di dato
  • 19. Finamente ecco i BIG DATA
  • 20. Come si memorizzano i BIG DATA
  • 21. Come si memorizzano i BIG DATA ● Punto 1: Analisi – Analisi delle caratteristiche dei dati in possesso – Eliminazione dei dati ridondanti – Valutare l’uso e l’eventuale ruolo di Database NoSQL
  • 22. Come si memorizzano i BIG DATA ● Punto 2: Tipizzazione – Chiave:Valore – Grafico – Documenti
  • 23. Come si memorizzano i BIG DATA ● Punto 3: Scelta del data store – Storage Distribuito / Rindondato / Estensibile – Supporto poliglottico – Supporto Flessibile dei metadati e possibilità di gestire dati di varia natura* *Purtroppo I RDBMS in questo frangente possono essere un limite e spesso soluzioni specializzate come sistemi di storage di dati telemetrici (Influxdb, elastic search) o filesystem come HDFS (Hadoop) sono soluzioni più valide
  • 24. Come si preparano i BIG DATA
  • 25. ● Preparazione – Mappatura dei dati verso il Framework di Analisi – Collegare ed estrarre le informazioni dallo storage Come si preparano i BIG DATA
  • 26. Come si processano i BIG DATA
  • 27. ● Elaborazione – Trasformazione dei dati per essere processati – Suddivisione dei dati per distribuirne il processo – Controllo dei processi per ottenere il risultato finale Come si processano i BIG DATA
  • 28. Come si processano i BIG DATA
  • 29. ● Analisi e Presentazione – Raccolta dei dati finali ed elaborazione in grafici, tabelle pivot e dashboard per la Business Intelligence Come si presentano i BIG DATA
  • 30. Infine ecco il VALORE dei BIG DATA Datificazione: ● Attività ● Conversazioni ● Foto ● Video ● ... Analisi: ● Text Analytics ● Sentiment Analysis ● Face recognition ● Voice analytics ● Moviment analytics ● … ● Volume ● Velocità ● Varietà ● Veridicità VALORE
  • 31. Strumenti per i BIG DATA ● Framework: Hadoop (HDFS e MapReduce) ● Strumenti di Analisi: – Python: scikit-learn, nltk, spyder, jupyter notebooks – Pentaho BI