Your SlideShare is downloading. ×
Big Data  & Data Mining
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

Big Data & Data Mining

715
views

Published on

Big Data and Data Mining

Big Data and Data Mining

Published in: Social Media

0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
715
On Slideshare
0
From Embeds
0
Number of Embeds
2
Actions
Shares
0
Downloads
33
Comments
0
Likes
1
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. Big Data & Data Mining Il potere dei dati
  • 2. Cosa significa Big Data? Big data è il termine per descrivere una raccolta di dataset così grande e complessa da richiedere strumenti differenti da quelli tradizionali, in tutte le fasi del processo: dall'acquisizione, alla curation, passando per condivisione, analisi e visualizzazione. (Wikipedia)
  • 3. ...e Data Mining? Il data mining è l'insieme di tecniche e metodologie che hanno per oggetto l'estrazione di un sapere o di una conoscenza a partire da grandi quantità di dati e l'utilizzo scientifico, industriale o operativo di questo sapere. (Wikipedia)
  • 4. Perchè tutto questo interesse ai Data?
  • 5. Da dove arrivano tutti questi dati? Basta pensare che ogni 60 secondi su facebook vengono generati 350GB di dati, tra post, mi piace, foto e video, o che in tutto il mondo si caricano circa 72 ore di video su YouTube ogni minuto che passa.
  • 6. Every Second on the Internet www.onesecond.designly.com
  • 7. Non solo Social ➔ Archivi di documenti scannerizzati ➔ Documenti elettronici ➔ Media (immagini, video, audio, flash, live stream, ecc…) ➔ Web (dati governativi, meteo, censuari, wikipedia, ecc…) ➔ Applicazioni di business (CRM, ERP, portali intranet, ecc…) ➔ Data Storage (SQL, Hadoop, file systems, ecc…) ➔ Log di sistema (da server, dispositivi mobili, ecc…) ➔ Data da Sensori (pubblici e privati)
  • 8. Non solo Social
  • 9. Dati o informazioni? Dato e Informazione non sono sinonimi!
  • 10. Dati o informazioni? Il dato è un elemento conosciuto, un’informazione grezza o elementare ed è solitamente costituito da simboli che devono essere elaborati. L’informazione è il risultato derivante dall’interpretazione di un insieme di dati, che è finalizzata all’apportare un incremento delle conoscenze di un soggetto.
  • 11. ..e se i Data sono Big? Non basta più la ricerca e l’analisi statistica classica ma necessitiamo del data mining. Che cosa "non è" data mining? ● Cercare un numero di telefono nell'elenco; ● Fare una ricerca in Internet su "vacanze a Chioggia". Che cosa "è" data mining? ● Scoprire che alcuni cognomi sono molto comuni in certe aree dell'Italia; ● Fare una ricerca nel web su una parola chiave e classificare i documenti trovati secondo un criterio semantico; ● Scoprire le relazioni tra tipi di clienti e certi prodotti o campagne pubblicitarie.
  • 12. Chi trova un (Big) Data... I Big Data sono fondamentale per la creazione di nuovo business, contribuiscono a migliorare efficienza, qualità, prodotti e servizi personalizzati, producendo livelli più elevati di soddisfazione ed esperienza del cliente.
  • 13. ..trova un tesoro! Le aziende, ma non solo, devono imparare ad utilizzare pienamente le loro risorse di dati. L’aumento del volume, velocità e varietà dei dati spesso supera le capacità delle aziende di gestirli ed elaborarli con efficacia nei tempi utili. Una complessità che rende difficile far fronte alle sempre più urgenti e crescenti esigenze del business.
  • 14. 3V + 1 Volume, Velocità e Varietà sono le proprietà dei Big Data. Alcune organizzazioni utilizzano una quarta V per indicare la Veridicità dei dati, ossia la qualità dei dati intesa come il valore informativo che si riesce ad estrarre.
  • 15. È utile avere molti dati? 1872 - Il cavallo di Eadweard Muybridge
  • 16. Petabyte Age Giugno 2008 - Wired proclama la morte del metodo scientifico. ● L’ingente quantità di dati prodotta induce ad analizzarli matematicamente prima di contestualizzarli. ● Da ricerca delle cause a ricerca delle connessioni. ● “What can science learn from Google?”
  • 17. NoSQL e Hadoop
  • 18. NoSQL e Hadoop Hadoop è usato anche da: AOL, Ebay, Facebook, IBM, ImageShack, Joost, Linkedin, Spotify, The New York Times e Twitter. Yahoo! è il più grande contributore a questo progetto, e ne fa fortemente uso.
  • 19. Chi è interessato dai Big Data? ● AZIENDE Devono estrarre informazioni utili da enormi quantità di dati non strutturati, eterogenei, dinamici (Big Data). ● PRIVATO A noi rimane il dilemma di come bilanciare l’accesso ai servizi con la cessione di informazioni personali. ● PUBBLICO Come collettività dovremmo iniziare a interrogarci su come evitare un uso improprio e discriminatorio delle informazioni che ci riguardano.
  • 20. Big Data e Imprese Dei più importanti responsabili marketing del mondo, 80% Non valuta i feedback provenienti dai social media. 63% Non utilizza analisi di marketing per prendere decisioni. http://goo.gl/JiYBKO
  • 21. Tweet sulle patatine in California? Walmart ne rifornisce i supermercati Big Data e Imprese
  • 22. La Swedish Tax Agency, grazie all’incrocio delle informazioni sui contribuenti, riesce a inviare ai cittadini un modulo delle imposte già compilato. Ai contribuenti spetta così il solo onere di confermare o modificare le informazioni via web o SMS. Big Data e Pubblico
  • 23. L’agenzia per il lavoro tedesca, analizzando i dati storici sull’impiego e sugli investimenti effettuati, è riuscita a segmentare la popolazione dei disoccupati per offrire interventi mirati ed efficienti. Questa azione si è tradotta in un risparmio di 10 miliardi di euro all’anno per il pubblico e nella riduzione del tempo impiegato dal cittadino per ottenere un lavoro. Big Data e Pubblico
  • 24. Big Data e Pubblico Il dipartimento di polizia di Los Angeles sta utilizzando PredPol, un sistema che sulla base delle serie storiche dei reati, divide le aree da pattugliare in zone, calcola la distribuzione e la frequenza dei reati, e poi indica quelle da sorvegliare. L’applicazione del modello matematico ha portato a un calo dei reati del 13%. A Santa Cruz lo stesso metodo ha ridotto i furti del 27%.
  • 25. Big Data e Persone Se invece fosti interessati a migliorare la vostra forma fisica, Nike+, dal 2006, propone una serie di device, orologi e bracciali intelligenti, per registrare i chilometri percorsi, i battiti cardiaci e le calorie consumate, ed analizzare i dati raccolti sul sito web o sullo smartphone. Tecnologie fino a qualche anno fa a disposizione dei soli atleti professionisti, rappresentano i primi esempi di wearable computing.
  • 26. Rischi Il dato personale è una moneta di scambio che necessita di un controllo vigile, per evitare che aziende senza grossi scrupoli lo utilizzino per inferenze predittive di tipo prettamente commerciale o generalmente poco nobili.
  • 27. Rischi Target e la pubblicità mirata
  • 28. Rischi Kevin Johnson, insolvente a sua insaputa
  • 29. Rischi Il vero problema, quindi, è: ● definire limiti che assicurino il corretto uso delle informazioni ● permettere all’utente di conoscere in base a quali analisi vengano negati dei servizi ● fare trasparenza su quali informazioni siano in mano a ciascuna azienda
  • 30. Conclusioni ● Il fenomeno dei Big Data, pur rimanendo una novità per molti, presenta potenziali utilizzi in ogni campo; ● La tecnologia si sta evolvendo apposta per facilitare l’ analisi e la ricerca sui grandi dati; ● Il cittadino deve valutare i servizi a cui può avere accesso sacrificando parte della privacy; ● Lo stato deve vigilare sugli abusi a cui può condurre la divulgazione di informazioni personali; ● Chi sfrutta i Big Data, ne trae profitto, a tutti i livelli.

×