Your SlideShare is downloading. ×
Big Data e Social Media (Prima Parte)
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×

Introducing the official SlideShare app

Stunning, full-screen experience for iPhone and Android

Text the download link to your phone

Standard text messaging rates apply

Big Data e Social Media (Prima Parte)

532
views

Published on

Slide del Seminario del 09 luglio 2013, presso WCAP di Roma

Slide del Seminario del 09 luglio 2013, presso WCAP di Roma

Published in: Technology

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
532
On Slideshare
0
From Embeds
0
Number of Embeds
2
Actions
Shares
0
Downloads
0
Comments
0
Likes
0
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. “Big Data e Social Media” Seminario di Approfondimento del 09 luglio 2013 www.startithub.com
  • 2. Presentazione Progetto StartITHub ● Consulenza per l'Innovazione ● Approccio Multidisciplinare ● Cultura dell'innovazione ● Diffondere un “Lessico del cambiamento” ● Professionisti per l'Innovazione www.startithub.com
  • 3. Big Data e Social Media PARTE PRIMA Web Intelligence e Big Data www.startithub.com
  • 4. Big Data e Social Media Tecniche di IA e approccio predittivo su scala web ● Online Ad: predire interessi e intenzioni ● Consumer sentiment e comportamenti ● Intercettare eventi e prevederne l'impatto ● Categorizzare e riconoscere luoghi, facce, persone ● Personalizzazione dei risultati www.startithub.com
  • 5. Big Data e Social Media Big Data Analytics ● Integrare la Social Intelligence con la Business Intelligence ● Mix di dati privati e web data ● Sales and marketing ● Intelligent supply chain ● Predictive VS Reactive ● Data driven business models and processes www.startithub.com
  • 6. Big Data e Social Media www.startithub.com Indicizzazione dei contenuti sul Web: sito1.com sito2.com sito3.com È necessario ordinare le singole parole presenti nei siti, suddividendole per numero di occorrenza per documento: N documenti, P parole, M parole per doc. Complessità dell'algoritmo: O (N*M log P) Pseudocode: def createIndex (D): for d in D: for p in d: i = index.lookup(p) if i < 0 : index.add(p) else index.inc(p) ... .... .... ....
  • 7. Big Data e Social Media Business Intelligence tradizionale www.startithub.com Database DataWareHouse Statistics
  • 8. Big Data e Social Media Perchè Google, Facebook, LinkedIn, Amazon … non utilizzano i DataBase tradizionali per gestire i Big Data? ● necessità di massimizzare il parallelismo computazionale ● impiego di paradigmi NoSql: Map-Reduce www.startithub.com
  • 9. Big Data e Social Media Calcolo del PageRank di una pagina Web ● É sufficiente il numero di hyperlinks per determinare il PageRank di una pagina? ● poichè un utente può visitare una pagina ciclando sul grafo costituito dagli hyperlinks, il PageRank deve essere computato continuamente, iterativamente e in parallelo ● Il PageRank è una proprietà globale del grafo www.startithub.com
  • 10. Big Data e Social Media Ricerca e indicizzazione dei dati enterprise “privati” ● Email, documenti di testo vari, immagini... ● SQL non gestisce i dati “non strutturati” ● necessità di collegare tra loro dati strutturati e non strutturati ● ricercare e indicizzare liste di “oggetti” www.startithub.com
  • 11. Big Data e Social Media www.startithub.com Limiti di Ricerca e Indicizzazione su “Dati Strutturati” ● Confronti puntuali VS confronti parziali e “imprecisi” ad es: Elisa di Rivombrosa o Marisa di Cimarosa ● Complesse istruzioni SQL e dipendenza dagli schema ● Difficile Interoperabilità tra DB con schema differenti ● Problemi ad integrare dati strutturati e non strutturati
  • 12. Big Data e Social Media Ricercare VS Vedere ● Riconoscere oggetti, immagini e attività ● Visualizzare una scena ● “farsi un'idea” di un testo, evento, situazione ● Classificazione / clustering ● Desumere il contesto e riassumere l'argomento ● Correlare le ricerche in base alla loro rilevanza www.startithub.com
  • 13. Big Data e Social Media Esempi di ricerca “predittiva” ● Raggrupare i “tweets” simili senza confrontare tra loro tutte le possibili coppie ● Individuare diverse versioni dello stesso documento ● Individuare pattern nelle serie storiche ● Riconoscere l'identità di persone sulla base di diversi input www.startithub.com
  • 14. Big Data e Social Media Online Advertising ● Quando e dove pubblicare un Ad? ● Massimizzare l'efficacia di una campagna pubblicitaria, stimando in tempo reale i feedback degli utenti ● Estrarre le informazioni rilevanti, separandole dal “rumore” ● Individuare le intenzioni di acquisto dei consumatori www.startithub.com
  • 15. Big Data e Social Media Analisi del Linguaggio e Statistica ● Individuare l'argomento di una conversazione da stralci di comunicazioni: es: di cosa stanno parlando le persone su Twitter, FB, quali persone hanno interessi comuni,... ● Rilevare la “semantica latente” di un contenuto ● Documenti simili contengono keywords simili? www.startithub.com
  • 16. Big Data e Social Media Machine Learning Come distinguo un visitatore da un acquirente sulla base della query di ricerca? ● Keywords: “fiore”, “rosso”, “economico”, “regalo” ● Analizzare i dati storici individuando le correlazioni tra keywords che coincidono con un acquisto www.startithub.com
  • 17. Big Data e Social Media www.startithub.com FIORE ROSSO ECONOMICO REGALO ACQUISTO? Y N Y Y Y N Y Y N N Y N Y N Y N N Y Y Y .... ... .... .... .... Machine Learning
  • 18. Big Data e Social Media ● devo calcolare tutte le possibili combinazioni per un numero potenzialmente elevato di keyword, ma: ● pur supponendo di avere a disposizione capacità computazionale infinita, è molto probabile che per alcune combinazioni di keyword potrei non avere a disposizione un data set di riferimento (una storia passata) ● es: per la combinazione di key “rose, rosse, regalo, map-reduce” potrei verosimilmente non avere dati disponibili per calcolare la tabella delle combinazioni. ● ci viene in aiuto il teorema di Bayes sulle probabilità condizionate, il quale ci consente di stimare la probabilità della presenza di un buyer, condizionata alla sola presenza della keyword “regalo”, a prescindere da quella delle altre keywords www.startithub.com
  • 19. Big Data e Social Media Domanda: la presenza della parola “like” all'interno di una frase si traduce automaticamente in un giudizio positivo? www.startithub.com
  • 20. Big Data e Social Media Contattaci www.startithub.com