SlideShare a Scribd company logo
1 of 49
Download to read offline
Milano, 28-29 novembre 2014 
Real-time discovery e sentiment 
analysis su Twitter: BlogmeterNow 
! 
! 
Vittorio Di Tomaso! 
@BlogMeter! 
vittorio.ditomaso@blogmeter.it! 
© Blogmeter 2014 I www.blogmeter.it
Blogmeter 2014 | www.blogmeter.it 
2 
Leader in Italia nella social media intelligence! 
500+ 
progetti realizzati 
100+ 
clienti 
3 
sedi: Milano, 
Roma e Torino 
Tecnologie d’avanguardia per la social intelligence! 
4 miliardi 
post e interazioni 
social misurate l’anno 
20 mila 
topic di classificazione 
configurati 
7 mila 
profili aziendali social 
analizzati giornalmente 
15 mila 
entrate lessicali x 
sentiment automatico 
Chi siamo
Blogmeter Social Toolbox per l’analisi e la gestione dei social media! 
Blogmeter 2014 | www.blogmeter.it 
3 
3! 
ANALISI & REPORTING! 
Servizio di analisi e reportistica quali-quantitativa 
sulla reputazione online 
e/o di tracking dell’efficacia delle 
campagne di marketing! 
INFOGRAFICHE! 
Una sintesi grafica delle attività social 
relative a una trasmissione tv o 
iniziativa di marketing! 
Analisi dati e formazione! 
ACADEMY! 
Formazione direzionale relativa 
all’introduzione dei social in azienda, 
best practice da seguire, fino alla 
strutturazione di ! 
un’attività di monitoraggio! 
Analizza la tua ! 
reputazione ! 
sui social media! 
Misura l’impatto delle! 
trasmissioni televisive ! 
su Facebook e Twitter! 
Analizza le performance! 
dei profili aziendali su! 
Facebook e Twitter.! 
Gestisci il tuo social! 
customer care e crm! 
Offerta
Blogmeter 2014 | www.blogmeter.it 
4 
Agenda 
COSA FACCIAMO! PERCHE’ LO FACCIAMO! COME LO FACCIAMO!
Blogmeter 2014 | www.blogmeter.it 
5 
Cosa facciamo!
Cosa facciamo 
Blogmeter 2014 | www.blogmeter.it 
6 
Analizziamo in real time conversazioni e 
interazioni sui media sociali! 
Ingestion! 
Content 
Analysis! 
Sentiment 
Analysis! 
Indexing! Delivery!
Data Acquisition 
Blogmeter 2014 | www.blogmeter.it 
7 
Circa 25k “item” al minuto (post e interazioni) da tutte le 
fonti sociali, acquisiti 24x7 utilizzando scraper specifici, 
API pubbliche e servizi commerciali! 
Ingestion! 
Content 
Analysis! 
Sentiment 
Analysis! 
Indexing! Delivery!
Data Analysis 
Blogmeter 2014 | www.blogmeter.it 
8 
Analisi semantica (Ontology Based Natural Language 
Processing) per la classificazione dei documenti in 
topic di interesse e per la sentiment analysis ! 
! 
[4k/minuto circa contengono testo]! 
Ingestion! 
Content 
Analysis! 
Sentiment 
Analysis! 
Indexing! Delivery!
Indicizzazione 
Blogmeter 2014 | www.blogmeter.it 
9 
Utilizzo congiunto di tecnologie relazionali 
(PostreSQL) e non relazionali (Redis, Lucene) per lo 
storage e l’indicizzazione dei documenti! 
Ingestion! 
Content 
Analysis! 
Sentiment 
Analysis! 
Indexing! Delivery!
Delivery 
Blogmeter 2014 | www.blogmeter.it 
10 
Applicazioni di analisi dei dati, di discovery e di alerting! 
Ingestion! 
Content 
Analysis! 
Sentiment 
Analysis! 
Indexing! Delivery!
Blogmeter 2014 | www.blogmeter.it 
11 
Perché lo facciamo?!
Blogmeter 2014 | www.blogmeter.it 
12 
Cos’è il Real Time Marketing? 
«Il Real Time Marketing è un approccio al mercato 
che fa leva sulla capacità aziendale di rispondere 
tempestivamente ad eventi e stimoli esterni, siano 
essi prevedibili o meno»!
Blogmeter 2014 | www.blogmeter.it 
13 
Cos’è il Real Time Marketing?
Blogmeter 2014 | www.blogmeter.it 
14 
Planned – Reactive (1/4): Geolocation
Blogmeter 2014 | www.blogmeter.it 
15 
Planned – Reactive (2/4): Geolocation
Blogmeter 2014 | www.blogmeter.it 
16 
Planned – Reactive (3/4): NFC/iBeacon 
https://www.youtube.com/watch?v=3QFrZjvp2E0#t=28
Blogmeter 2014 | www.blogmeter.it 
17 
Planned – Reactive (4/4): Predictive Analytics 
Software per prevedere un bisogno del consumatore, sulla base dell’analisi di dati relativi 
ai suoi comportamenti o a quelli di categorie similari di persone. ! 
!
Blogmeter 2014 | www.blogmeter.it 
18 
Planned - Proactive
Blogmeter 2014 | www.blogmeter.it 
19 
Unplanned - Reactive
Blogmeter 2014 | www.blogmeter.it 
20 
Unplanned - Reactive
Blogmeter 2014 | www.blogmeter.it 
21 
Come prepararsi al! 
Real Time Marketing!
Blogmeter 2014 | www.blogmeter.it 
22 
Il flusso: organizzazione e tool 
Obiettivi e 
KPI RTM! 
Preparare 
contenuti! 
Definire i 
ruoli! 
Definire i 
processi! 
Too!l 
Prevedere il 
peggio! 
Testare il 
Tool! 
Live! 
Tool! 
Tool!
BlogmeterNow abilita il monitoraggio costante e in tempo reale delle conversazioni online presenti su 
Twitter al fine di scoprire nuovi contenuti rilevanti, utili sia ai fini di protezione aziendale che per attività 
di real time marketing e communication.! 
Conversation 
Blogmeter 2014 | www.blogmeter.it 
23 
Conversation 
Trend with 
sentiment! 
KPIs! 
Most 
Engaging 
Tweets with 
sentiment & 
emotions! 
Most 
Mentioned 
Hashtag! 
Most 
mentioned 
Accounts! 
All tweets! 
Blogmeter Now
Blogmeter 2014 | www.blogmeter.it 
24 
Come lo facciamo!
Blogmeter 2014 | www.blogmeter.it 
25 
Come lo facciamo 
Normalization! 
Unique Indentifier! 
Full Text Indexing! 
Semantic 
Annotation 
Indexing! 
Metadata 
Extraction! 
Semantic 
Annotation! 
Sentiment 
Analysis! 
Language Detection! 
1! 
Ingest! 
2! 
Enrich! 
3! 
Index! 
User & Location! 
Ontology Based Natural 
Language Processing 
Components! 
Named Entities! 
Topics! 
Polarity! 
Emotions!
Scheduling 
& Config 
Blogmeter 2014 | www.blogmeter.it 
• 300 core 
• 1.2T RAM 
• 29T Disk 
26 
Come lo facciamo 
User Services 
Business Layer 
Processing Layer 
Data Storage 
Security 
Kestrel 
Physical 
Layer
Dipendono dalla 
• Item 
• Metadata Linguist 
Blogmeter 2014 | www.blogmeter.it 
27 
Architettura semantica 
Processing layer 
Analysis pipeline 
Primary 
index 
Risorse 
linguistiche 
Metadata 
extractor 
• Item 
full text 
analyzer 
analyzer 
Semantic 
Analyzer 
Primary 
index 
• Item 
• Metadata 
• Token 
• Item 
• Metadata 
• Token 
• El. linguistici 
• Item 
• Metadata 
• Token 
• El. Linguistici 
• Sentiment 
(opinioni) 
• Classificazione 
• Vocabolario Morfologico 
• Gazetteer ( liste di nomi, 
persone, sigle, etc…) 
Configurazione del 
dominio di conoscenza 
(regole semantiche ) 
Regole di identificazione 
e isolamento dei token 
lingua 
Dipendono dalla lingua e 
dal dominio applicativo 
Regole di estrazione 
dei metadati 
( dipendenti dalla struttura dei 
dati in analisi) 
Possibili 
configurazioni 
Full text search 
Intelligent search 
Semantic search Metriche 
Staging 
area
Blogmeter 2014 | www.blogmeter.it 
28 
Cosa stiamo imparando!
Cosa stiamo imparando 
Blogmeter 2014 | www.blogmeter.it 
29 
Da una architettura di ingestion, analisi e 
delivery che aggiorna i dati nel corso delle 6/12 
ore successive a una architettura di ingestion, 
analisi e delivery real time!
Blogmeter 2014 | www.blogmeter.it 
30 
La modifica architetturale non è stata indolore.! 
! 
Analizzare linguaggio naturale è 
computazionalmente complesso, farlo in real 
time lo è ancora di più! 
Impatti
Perché complesso 
Blogmeter 2014 | www.blogmeter.it 
31 
1. Analisi diverse su ontologie di classificazione 
diverse! 
2. Non possiamo prevedere come un item dovrà 
essere classificato e con quale set di componenti 
linguistici (lessici, regole di sentiment, ontologie)! 
3. Lavoriamo su uno stream real time che non si 
ferma ad aspettarci…!
Obiettivi 
Blogmeter 2014 | www.blogmeter.it 
32 
1. Evitare di fare due volte lo stesso lavoro (gli 
stream contengono molti item duplicati, non 
possiamo analizzarli più volte)! 
2. Evitare di applicare processori 
computazionalmente complessi quando non 
sono richiesti!
Soluzione: eliminare duplicati in maniera efficiente 
Blogmeter 2014 | www.blogmeter.it 
33 
Abbiamo dedicato particolare attenzione a 
definire un approccio per limitare la quantità di 
duplicati e per garantire una identificabilità 
univoca di tutti i documenti!
Stream 
(Provider) 
Blogmeter 2014 | www.blogmeter.it 
34 
Soluzione: eliminare duplicati in maniera efficiente 
Stream 
(API) 
Search 
Dupicate 
Detector 
-­‐ 
Unique 
ID 
Dupicate 
Detector 
-­‐ 
Unique 
ID 
Analysis 
Analysis 
Storage
Soluzione: routing intelligente dei documenti 
Blogmeter 2014 | www.blogmeter.it 
35 
Semantic routing su un’architettura in cui il flusso 
delle informazioni tra i processori può essere descritto 
come un grafo aciclico direzionato!
Blogmeter 2014 | www.blogmeter.it 
36 
Data Processing Network (esempio) 
NLP 
auto_it 
data stream lang lang reco 
domain 
classifier 
author 
gender 
reco 
loc reco 
topic 
reco 
lang 
NLP 
mood IT 
NLP 
mood 
EN 
NLP 
mood es 
domain 
NLP 
telco_it 
NLP 
fashion_en 
persister 
NE Reco 
Attivazione intelligente dei 
processori: si adatta 
all’informazione disponibile 
azzerando il lavoro inutile!
Blogmeter 2014 | www.blogmeter.it 
37 
Vantaggi e risultati raggiunti 
Il lavoro su documenti duplicati è ridotto a 0, con conseguente 
risparmio di cicli di CPU e di spazio sullo storage 
La pipeline di analisi semantica si autoconfigura attivando il 
flusso giusto per classificare correttamente il documento a 
seconda dell’obiettivo! 
Il troughput è molto elevato e ci consente di catturare i picchi 
prevedibili (e anche molti non prevedibili)! 
La scabilità orizzontale è garantita da un meccanismo che 
consente di deployare in maniera “semplice” nuovi nodi di 
analisi!
Blogmeter 2014 | www.blogmeter.it 
38 
Case studies!
Virus – Rai 2 
Blogmeter 2014 | www.blogmeter.it 
39 
VIRUS il contagio delle idee! 
Seconda edizione del talk show politico di RAI 2 
condotto da Nicola Porro.! 
! 
Blogmeter Now! 
Durante la trasmissione Blogmeter Now rileva in 
tempo reale le conversazioni su Twitter relative 
alla trasmissione. In particolare: ! 
• i temi del dibattito! 
• gli ospiti! 
• i tweet più virali! 
• l‘uso degli hashtag lanciati a inizio trasmissione per 
schierarsi con uno degli ospiti (es: 
#haragionedemagistris #haragionesallusti)! 
! 
Social Listening! 
Durante la settimana aiutiamo gli autori di VIRUS a 
comprendere le opinioni della rete sui temi della 
puntata:! 
• volume delle conversazioni! 
• sentiment sui politici! 
• viralità dei messaggi! 
!
Blogmeter 2014 | www.blogmeter.it 
40 
Italian MTV Awards 2014! 
L’evento live più importante di MTV Italia con la 
premiazione dei migliori artisti dell’anno! 
! 
Blogmeter Now! 
Durante la trasmissione Blogmeter Now è 
servito a: ! 
• Real Time Polling per individuare l’artista 
più votato dal pubblico su Twitter (due 
categorie: Best Live Performance e Best 
Dance Crew) con un effetto diretto sullo 
show: dopo un minuto dalla votazione i 
vincitori sono stati premiati sul palco! 
• Monitoraggio in real time dei tweet dedicati 
all’evento per capire i momenti più caldi! 
• Raccolta di tutte informazioni necessarie a 
creare un’infografica utile per la successiva 
comunicazione esterna! 
! 
! 
Italia MTV Awards
TIM Stadium 
Blogmeter 2014 | www.blogmeter.it 
41 
! 
TIM Stadium! 
E’ il portale di TIM per vivere le partite della 
Serie A con il supporto di dati numerici. ! 
Si tratta di dati che provengono sia dai campi 
di gioco (tiri, gol, tattica, ecc…) che dal web: 
questi ultimi sono forniti da Blogmeter Now.! 
! 
Blogmeter Now! 
Tutti i flussi di tweet relativi alle partite di 
calcio sono elaborati da Blogmeter Now. La 
delivery verso la piattaforma TIM Strudium è 
attraverso API. TIM Stadium che rende 
disponibili nella sua interfaccia:! 
• i volumi di tweet! 
• il sentiment (positivo/negativo) dei tweet! 
• il flusso dei tweet! 
• i tweet più retwittati! 
• gli hashtag più usati! 
• i profili Twitter più citati!
Obiettivo: Comprendere in real-time come si 
muovono i cittadini nel territorio e ad individuare 
attraverso l'analisi dei contenuti che arrivano 
dalle rete sociali eventuali problemi! 
! 
! 
! 
Blogmeter 2014 | www.blogmeter.it 
42 
ProActive 
PROtezione del territorio con infrAttrutture ICT avanzate, cittadinanza attiVa, e rEti sociali! 
PROPONENTI! 
• WebRatio - MPMI (coord)! 
• Polimi - OdR! 
• Cefriel - OdR! 
• Vodafone - GI! 
• Gulliver ! MPMI! 
• Blogmeter - MPMI! 
• Pipetech - MPMI! 
• LSI-Lastem- MPMI! 
• MM - Utilities! 
• TEA - Utilities ! 
PA COINVOLTE! 
• ARPA Lombardia ! 
• Protezione Civile! 
• Comune di Bergamo, Milano, Como e Mantova (pending)! 
Bando Smart Cities; ! 
Programma Operativo Regionale (POR) per la Competitività; ! 
Fondo europeo di sviluppo regionale (FESR).! 
! 
AMBITO! 
a. Sostenibilità ambientale! 
SETTORI ! 
a.1 sicurezza del territorio! 
a.2 mobilità urbana! 
a.4 gestione risorse idriche !! 
SPESE AMMISSIBILI! 
RI & SS 5.000.000,00 euro! 
CONTRIBUTO BANDO SC ! 
RI & SS 2.000.000,00 euro! 
! 
! 
!
Blogmeter 2014 | www.blogmeter.it 
43 
Un’ultima cosa: Eventi su Twitter!
Blogmeter 2014 | www.blogmeter.it 
44 
Eventi su twitter 
Abbiamo dati con sufficiente 
ampiezza e profondità 
storica ! 
Siamo in grado di studiare la 
forma delle curve di 
conversazioni che possono 
nascere in relazione ad un 
certo evento! 
http://blog.wolframalpha.com/2013/06/10/using-formulas-for-everything-from-a-complex- 
analysis-class-to-political-cartoons-to-music-album-covers/
Che cosa ci dicono i dati? 
Blogmeter 2014 | www.blogmeter.it 
45 
1. A parità di volume, le serie temporali di post 
possono avere forme molto diverse, suggerendo 
atteggiamenti profondamente differenti da parte 
degli utenti Twitter.! 
2. Diversamente dal semplice conteggio dei volumi, 
l’analisi della forma ci fornisce delle misure più 
significative del fenomeno. ! 
3. Oltre a essere un’analisi interessante, ci fornisce 
gli strumenti per il nostro capacity planning !
Alluvione di Genova, andamento tweet 
Blogmeter 2014 | www.blogmeter.it 
46 
9 ottobre! 
Post totali: 807k! 
Post negativi: 140k! 
Comportamento: picchi! 
10 ottobre! 
Post totali: 863k! 
Post negativi: 147k! 
Comportamento: piatto! 
15 novembre! 
Post totali: 751k! 
Post negativi: 116k! 
Comportamento: piatto! 
16 novembre! 
Post totali: 738k! 
Post negativi: 128k! 
Comportamento: picchi!
Diverse trasmissioni di intrattenimento 
Blogmeter 2014 | www.blogmeter.it 
47 
22 
novembre: 
Lazio 
– 
Juventus 
(#) 
23 
novembre: 
Milan 
– 
Inter 
(#) 
23 
oEobre: 
X 
Factor 
(#) 
22 
novembre: 
Che 
Tempo 
Che 
Fa 
(#)
Recap: una tassonomia delle curve di reazione 
Blogmeter 2014 | www.blogmeter.it 
48 
Serie di Tweet! 
Uniformi! Picchi! 
Notizie/aggiornamenti! 
Intrattentimento/ 
episodi! 
Maggiore 
coinvolgimento iniziale! 
Coinvolgimento 
continuativo!
Dal 2007 Blogmeter ha supportato 100+ aziende e agenzie nell'ascolto del 
web e nell'analisi delle performance sui social media, realizzando più di 500 
Blogmeter 2014 | www.blogmeter.it 
49 
+39 0249526400 
marketing@blogmeter.it 
www.blogmeter.it 
Milano | Roma | Torino 
Grazie per 
l’attenzione! 
progetti. 
Aspettiamo i vostri CV! 
@Blogmeter 
facebook.com/Blogmeter 
Consulta le nostre ricerche 
Guarda le nostre infografiche

More Related Content

Similar to Real-time discovery e sentiment analysis su Twitter: BlogmeterNow - Vittorio Di Tomaso - Codemotion Milan 2014

Smau milano 2013 mirko soffia
Smau milano 2013 mirko soffiaSmau milano 2013 mirko soffia
Smau milano 2013 mirko soffia
SMAU
 
Intelligenza artificiale. Possibili scenari del lavoro futuro - di Fabrizio B...
Intelligenza artificiale. Possibili scenari del lavoro futuro - di Fabrizio B...Intelligenza artificiale. Possibili scenari del lavoro futuro - di Fabrizio B...
Intelligenza artificiale. Possibili scenari del lavoro futuro - di Fabrizio B...
Ismel - Istituto per la Memoria e la Cultura del Lavoro, dell'Impresa e dei Diritti Sociali
 

Similar to Real-time discovery e sentiment analysis su Twitter: BlogmeterNow - Vittorio Di Tomaso - Codemotion Milan 2014 (20)

La rivoluzione dei Microservizi
La rivoluzione dei MicroserviziLa rivoluzione dei Microservizi
La rivoluzione dei Microservizi
 
Smart api
Smart apiSmart api
Smart api
 
DS4Biz - Data Science for Business
DS4Biz - Data Science for BusinessDS4Biz - Data Science for Business
DS4Biz - Data Science for Business
 
Extrapola corporate web reputation 2017
Extrapola corporate web reputation 2017Extrapola corporate web reputation 2017
Extrapola corporate web reputation 2017
 
Celi @TOSM Pitch Day Smart Enterprise
Celi @TOSM Pitch Day Smart EnterpriseCeli @TOSM Pitch Day Smart Enterprise
Celi @TOSM Pitch Day Smart Enterprise
 
Smau Milano 2016 - Clouditalia Telecomunicazioni
Smau Milano 2016 - Clouditalia TelecomunicazioniSmau Milano 2016 - Clouditalia Telecomunicazioni
Smau Milano 2016 - Clouditalia Telecomunicazioni
 
Trend Analysis sui Social Network - I risultati del progetto SenTaClAus
Trend Analysis sui Social Network - I risultati del progetto SenTaClAusTrend Analysis sui Social Network - I risultati del progetto SenTaClAus
Trend Analysis sui Social Network - I risultati del progetto SenTaClAus
 
IL RUOLO DELLA TECNOLOGIA NELLA PROFESSIONE PSICOLOGICA: Sfide Aperte e Nuove...
IL RUOLO DELLA TECNOLOGIA NELLA PROFESSIONE PSICOLOGICA: Sfide Aperte e Nuove...IL RUOLO DELLA TECNOLOGIA NELLA PROFESSIONE PSICOLOGICA: Sfide Aperte e Nuove...
IL RUOLO DELLA TECNOLOGIA NELLA PROFESSIONE PSICOLOGICA: Sfide Aperte e Nuove...
 
Intelligenza artificiale nel mondo front-end - CodeGen2021
Intelligenza artificiale nel mondo front-end - CodeGen2021Intelligenza artificiale nel mondo front-end - CodeGen2021
Intelligenza artificiale nel mondo front-end - CodeGen2021
 
Webinar: "Conosci la Performance Intelligence?" a cura d A. Szambelan
Webinar: "Conosci la Performance Intelligence?" a cura d A. SzambelanWebinar: "Conosci la Performance Intelligence?" a cura d A. Szambelan
Webinar: "Conosci la Performance Intelligence?" a cura d A. Szambelan
 
La Business Intelligence per le PMI - Vantaggi ed un minimo di contesto
La Business Intelligence per le PMI - Vantaggi ed un minimo di contestoLa Business Intelligence per le PMI - Vantaggi ed un minimo di contesto
La Business Intelligence per le PMI - Vantaggi ed un minimo di contesto
 
Extreme - Web & Social Media monitoring and analysis - Company Presentation
Extreme - Web & Social Media monitoring and analysis - Company PresentationExtreme - Web & Social Media monitoring and analysis - Company Presentation
Extreme - Web & Social Media monitoring and analysis - Company Presentation
 
Smau milano 2013 mirko soffia
Smau milano 2013 mirko soffiaSmau milano 2013 mirko soffia
Smau milano 2013 mirko soffia
 
Francesco Liguori, Giuliano Liguori | Il Project Manager ai tempi dell'IA
Francesco Liguori, Giuliano Liguori | Il Project Manager ai tempi dell'IAFrancesco Liguori, Giuliano Liguori | Il Project Manager ai tempi dell'IA
Francesco Liguori, Giuliano Liguori | Il Project Manager ai tempi dell'IA
 
ASOC ETC Italia-Francia Marittimo - Selezione progetto
ASOC ETC Italia-Francia Marittimo - Selezione progettoASOC ETC Italia-Francia Marittimo - Selezione progetto
ASOC ETC Italia-Francia Marittimo - Selezione progetto
 
Intelligenza artificiale. Possibili scenari del lavoro futuro - di Fabrizio B...
Intelligenza artificiale. Possibili scenari del lavoro futuro - di Fabrizio B...Intelligenza artificiale. Possibili scenari del lavoro futuro - di Fabrizio B...
Intelligenza artificiale. Possibili scenari del lavoro futuro - di Fabrizio B...
 
Webdistilled (2014-Edition)
Webdistilled (2014-Edition)Webdistilled (2014-Edition)
Webdistilled (2014-Edition)
 
Intelligenza Artificiale per creare contenuti con testo immagine video
Intelligenza Artificiale per creare contenuti con testo immagine videoIntelligenza Artificiale per creare contenuti con testo immagine video
Intelligenza Artificiale per creare contenuti con testo immagine video
 
La gestione di NBN e DOI in OJS
La gestione di NBN e DOI in OJSLa gestione di NBN e DOI in OJS
La gestione di NBN e DOI in OJS
 
Curriculum Vitae Morello Orfeo
Curriculum Vitae   Morello OrfeoCurriculum Vitae   Morello Orfeo
Curriculum Vitae Morello Orfeo
 

More from Codemotion

More from Codemotion (20)

Fuzz-testing: A hacker's approach to making your code more secure | Pascal Ze...
Fuzz-testing: A hacker's approach to making your code more secure | Pascal Ze...Fuzz-testing: A hacker's approach to making your code more secure | Pascal Ze...
Fuzz-testing: A hacker's approach to making your code more secure | Pascal Ze...
 
Pompili - From hero to_zero: The FatalNoise neverending story
Pompili - From hero to_zero: The FatalNoise neverending storyPompili - From hero to_zero: The FatalNoise neverending story
Pompili - From hero to_zero: The FatalNoise neverending story
 
Pastore - Commodore 65 - La storia
Pastore - Commodore 65 - La storiaPastore - Commodore 65 - La storia
Pastore - Commodore 65 - La storia
 
Pennisi - Essere Richard Altwasser
Pennisi - Essere Richard AltwasserPennisi - Essere Richard Altwasser
Pennisi - Essere Richard Altwasser
 
Michel Schudel - Let's build a blockchain... in 40 minutes! - Codemotion Amst...
Michel Schudel - Let's build a blockchain... in 40 minutes! - Codemotion Amst...Michel Schudel - Let's build a blockchain... in 40 minutes! - Codemotion Amst...
Michel Schudel - Let's build a blockchain... in 40 minutes! - Codemotion Amst...
 
Richard Süselbeck - Building your own ride share app - Codemotion Amsterdam 2019
Richard Süselbeck - Building your own ride share app - Codemotion Amsterdam 2019Richard Süselbeck - Building your own ride share app - Codemotion Amsterdam 2019
Richard Süselbeck - Building your own ride share app - Codemotion Amsterdam 2019
 
Eward Driehuis - What we learned from 20.000 attacks - Codemotion Amsterdam 2019
Eward Driehuis - What we learned from 20.000 attacks - Codemotion Amsterdam 2019Eward Driehuis - What we learned from 20.000 attacks - Codemotion Amsterdam 2019
Eward Driehuis - What we learned from 20.000 attacks - Codemotion Amsterdam 2019
 
Francesco Baldassarri - Deliver Data at Scale - Codemotion Amsterdam 2019 -
Francesco Baldassarri  - Deliver Data at Scale - Codemotion Amsterdam 2019 - Francesco Baldassarri  - Deliver Data at Scale - Codemotion Amsterdam 2019 -
Francesco Baldassarri - Deliver Data at Scale - Codemotion Amsterdam 2019 -
 
Martin Förtsch, Thomas Endres - Stereoscopic Style Transfer AI - Codemotion A...
Martin Förtsch, Thomas Endres - Stereoscopic Style Transfer AI - Codemotion A...Martin Förtsch, Thomas Endres - Stereoscopic Style Transfer AI - Codemotion A...
Martin Förtsch, Thomas Endres - Stereoscopic Style Transfer AI - Codemotion A...
 
Melanie Rieback, Klaus Kursawe - Blockchain Security: Melting the "Silver Bul...
Melanie Rieback, Klaus Kursawe - Blockchain Security: Melting the "Silver Bul...Melanie Rieback, Klaus Kursawe - Blockchain Security: Melting the "Silver Bul...
Melanie Rieback, Klaus Kursawe - Blockchain Security: Melting the "Silver Bul...
 
Angelo van der Sijpt - How well do you know your network stack? - Codemotion ...
Angelo van der Sijpt - How well do you know your network stack? - Codemotion ...Angelo van der Sijpt - How well do you know your network stack? - Codemotion ...
Angelo van der Sijpt - How well do you know your network stack? - Codemotion ...
 
Lars Wolff - Performance Testing for DevOps in the Cloud - Codemotion Amsterd...
Lars Wolff - Performance Testing for DevOps in the Cloud - Codemotion Amsterd...Lars Wolff - Performance Testing for DevOps in the Cloud - Codemotion Amsterd...
Lars Wolff - Performance Testing for DevOps in the Cloud - Codemotion Amsterd...
 
Sascha Wolter - Conversational AI Demystified - Codemotion Amsterdam 2019
Sascha Wolter - Conversational AI Demystified - Codemotion Amsterdam 2019Sascha Wolter - Conversational AI Demystified - Codemotion Amsterdam 2019
Sascha Wolter - Conversational AI Demystified - Codemotion Amsterdam 2019
 
Michele Tonutti - Scaling is caring - Codemotion Amsterdam 2019
Michele Tonutti - Scaling is caring - Codemotion Amsterdam 2019Michele Tonutti - Scaling is caring - Codemotion Amsterdam 2019
Michele Tonutti - Scaling is caring - Codemotion Amsterdam 2019
 
Pat Hermens - From 100 to 1,000+ deployments a day - Codemotion Amsterdam 2019
Pat Hermens - From 100 to 1,000+ deployments a day - Codemotion Amsterdam 2019Pat Hermens - From 100 to 1,000+ deployments a day - Codemotion Amsterdam 2019
Pat Hermens - From 100 to 1,000+ deployments a day - Codemotion Amsterdam 2019
 
James Birnie - Using Many Worlds of Compute Power with Quantum - Codemotion A...
James Birnie - Using Many Worlds of Compute Power with Quantum - Codemotion A...James Birnie - Using Many Worlds of Compute Power with Quantum - Codemotion A...
James Birnie - Using Many Worlds of Compute Power with Quantum - Codemotion A...
 
Don Goodman-Wilson - Chinese food, motor scooters, and open source developmen...
Don Goodman-Wilson - Chinese food, motor scooters, and open source developmen...Don Goodman-Wilson - Chinese food, motor scooters, and open source developmen...
Don Goodman-Wilson - Chinese food, motor scooters, and open source developmen...
 
Pieter Omvlee - The story behind Sketch - Codemotion Amsterdam 2019
Pieter Omvlee - The story behind Sketch - Codemotion Amsterdam 2019Pieter Omvlee - The story behind Sketch - Codemotion Amsterdam 2019
Pieter Omvlee - The story behind Sketch - Codemotion Amsterdam 2019
 
Dave Farley - Taking Back “Software Engineering” - Codemotion Amsterdam 2019
Dave Farley - Taking Back “Software Engineering” - Codemotion Amsterdam 2019Dave Farley - Taking Back “Software Engineering” - Codemotion Amsterdam 2019
Dave Farley - Taking Back “Software Engineering” - Codemotion Amsterdam 2019
 
Joshua Hoffman - Should the CTO be Coding? - Codemotion Amsterdam 2019
Joshua Hoffman - Should the CTO be Coding? - Codemotion Amsterdam 2019Joshua Hoffman - Should the CTO be Coding? - Codemotion Amsterdam 2019
Joshua Hoffman - Should the CTO be Coding? - Codemotion Amsterdam 2019
 

Real-time discovery e sentiment analysis su Twitter: BlogmeterNow - Vittorio Di Tomaso - Codemotion Milan 2014

  • 1. Milano, 28-29 novembre 2014 Real-time discovery e sentiment analysis su Twitter: BlogmeterNow ! ! Vittorio Di Tomaso! @BlogMeter! vittorio.ditomaso@blogmeter.it! © Blogmeter 2014 I www.blogmeter.it
  • 2. Blogmeter 2014 | www.blogmeter.it 2 Leader in Italia nella social media intelligence! 500+ progetti realizzati 100+ clienti 3 sedi: Milano, Roma e Torino Tecnologie d’avanguardia per la social intelligence! 4 miliardi post e interazioni social misurate l’anno 20 mila topic di classificazione configurati 7 mila profili aziendali social analizzati giornalmente 15 mila entrate lessicali x sentiment automatico Chi siamo
  • 3. Blogmeter Social Toolbox per l’analisi e la gestione dei social media! Blogmeter 2014 | www.blogmeter.it 3 3! ANALISI & REPORTING! Servizio di analisi e reportistica quali-quantitativa sulla reputazione online e/o di tracking dell’efficacia delle campagne di marketing! INFOGRAFICHE! Una sintesi grafica delle attività social relative a una trasmissione tv o iniziativa di marketing! Analisi dati e formazione! ACADEMY! Formazione direzionale relativa all’introduzione dei social in azienda, best practice da seguire, fino alla strutturazione di ! un’attività di monitoraggio! Analizza la tua ! reputazione ! sui social media! Misura l’impatto delle! trasmissioni televisive ! su Facebook e Twitter! Analizza le performance! dei profili aziendali su! Facebook e Twitter.! Gestisci il tuo social! customer care e crm! Offerta
  • 4. Blogmeter 2014 | www.blogmeter.it 4 Agenda COSA FACCIAMO! PERCHE’ LO FACCIAMO! COME LO FACCIAMO!
  • 5. Blogmeter 2014 | www.blogmeter.it 5 Cosa facciamo!
  • 6. Cosa facciamo Blogmeter 2014 | www.blogmeter.it 6 Analizziamo in real time conversazioni e interazioni sui media sociali! Ingestion! Content Analysis! Sentiment Analysis! Indexing! Delivery!
  • 7. Data Acquisition Blogmeter 2014 | www.blogmeter.it 7 Circa 25k “item” al minuto (post e interazioni) da tutte le fonti sociali, acquisiti 24x7 utilizzando scraper specifici, API pubbliche e servizi commerciali! Ingestion! Content Analysis! Sentiment Analysis! Indexing! Delivery!
  • 8. Data Analysis Blogmeter 2014 | www.blogmeter.it 8 Analisi semantica (Ontology Based Natural Language Processing) per la classificazione dei documenti in topic di interesse e per la sentiment analysis ! ! [4k/minuto circa contengono testo]! Ingestion! Content Analysis! Sentiment Analysis! Indexing! Delivery!
  • 9. Indicizzazione Blogmeter 2014 | www.blogmeter.it 9 Utilizzo congiunto di tecnologie relazionali (PostreSQL) e non relazionali (Redis, Lucene) per lo storage e l’indicizzazione dei documenti! Ingestion! Content Analysis! Sentiment Analysis! Indexing! Delivery!
  • 10. Delivery Blogmeter 2014 | www.blogmeter.it 10 Applicazioni di analisi dei dati, di discovery e di alerting! Ingestion! Content Analysis! Sentiment Analysis! Indexing! Delivery!
  • 11. Blogmeter 2014 | www.blogmeter.it 11 Perché lo facciamo?!
  • 12. Blogmeter 2014 | www.blogmeter.it 12 Cos’è il Real Time Marketing? «Il Real Time Marketing è un approccio al mercato che fa leva sulla capacità aziendale di rispondere tempestivamente ad eventi e stimoli esterni, siano essi prevedibili o meno»!
  • 13. Blogmeter 2014 | www.blogmeter.it 13 Cos’è il Real Time Marketing?
  • 14. Blogmeter 2014 | www.blogmeter.it 14 Planned – Reactive (1/4): Geolocation
  • 15. Blogmeter 2014 | www.blogmeter.it 15 Planned – Reactive (2/4): Geolocation
  • 16. Blogmeter 2014 | www.blogmeter.it 16 Planned – Reactive (3/4): NFC/iBeacon https://www.youtube.com/watch?v=3QFrZjvp2E0#t=28
  • 17. Blogmeter 2014 | www.blogmeter.it 17 Planned – Reactive (4/4): Predictive Analytics Software per prevedere un bisogno del consumatore, sulla base dell’analisi di dati relativi ai suoi comportamenti o a quelli di categorie similari di persone. ! !
  • 18. Blogmeter 2014 | www.blogmeter.it 18 Planned - Proactive
  • 19. Blogmeter 2014 | www.blogmeter.it 19 Unplanned - Reactive
  • 20. Blogmeter 2014 | www.blogmeter.it 20 Unplanned - Reactive
  • 21. Blogmeter 2014 | www.blogmeter.it 21 Come prepararsi al! Real Time Marketing!
  • 22. Blogmeter 2014 | www.blogmeter.it 22 Il flusso: organizzazione e tool Obiettivi e KPI RTM! Preparare contenuti! Definire i ruoli! Definire i processi! Too!l Prevedere il peggio! Testare il Tool! Live! Tool! Tool!
  • 23. BlogmeterNow abilita il monitoraggio costante e in tempo reale delle conversazioni online presenti su Twitter al fine di scoprire nuovi contenuti rilevanti, utili sia ai fini di protezione aziendale che per attività di real time marketing e communication.! Conversation Blogmeter 2014 | www.blogmeter.it 23 Conversation Trend with sentiment! KPIs! Most Engaging Tweets with sentiment & emotions! Most Mentioned Hashtag! Most mentioned Accounts! All tweets! Blogmeter Now
  • 24. Blogmeter 2014 | www.blogmeter.it 24 Come lo facciamo!
  • 25. Blogmeter 2014 | www.blogmeter.it 25 Come lo facciamo Normalization! Unique Indentifier! Full Text Indexing! Semantic Annotation Indexing! Metadata Extraction! Semantic Annotation! Sentiment Analysis! Language Detection! 1! Ingest! 2! Enrich! 3! Index! User & Location! Ontology Based Natural Language Processing Components! Named Entities! Topics! Polarity! Emotions!
  • 26. Scheduling & Config Blogmeter 2014 | www.blogmeter.it • 300 core • 1.2T RAM • 29T Disk 26 Come lo facciamo User Services Business Layer Processing Layer Data Storage Security Kestrel Physical Layer
  • 27. Dipendono dalla • Item • Metadata Linguist Blogmeter 2014 | www.blogmeter.it 27 Architettura semantica Processing layer Analysis pipeline Primary index Risorse linguistiche Metadata extractor • Item full text analyzer analyzer Semantic Analyzer Primary index • Item • Metadata • Token • Item • Metadata • Token • El. linguistici • Item • Metadata • Token • El. Linguistici • Sentiment (opinioni) • Classificazione • Vocabolario Morfologico • Gazetteer ( liste di nomi, persone, sigle, etc…) Configurazione del dominio di conoscenza (regole semantiche ) Regole di identificazione e isolamento dei token lingua Dipendono dalla lingua e dal dominio applicativo Regole di estrazione dei metadati ( dipendenti dalla struttura dei dati in analisi) Possibili configurazioni Full text search Intelligent search Semantic search Metriche Staging area
  • 28. Blogmeter 2014 | www.blogmeter.it 28 Cosa stiamo imparando!
  • 29. Cosa stiamo imparando Blogmeter 2014 | www.blogmeter.it 29 Da una architettura di ingestion, analisi e delivery che aggiorna i dati nel corso delle 6/12 ore successive a una architettura di ingestion, analisi e delivery real time!
  • 30. Blogmeter 2014 | www.blogmeter.it 30 La modifica architetturale non è stata indolore.! ! Analizzare linguaggio naturale è computazionalmente complesso, farlo in real time lo è ancora di più! Impatti
  • 31. Perché complesso Blogmeter 2014 | www.blogmeter.it 31 1. Analisi diverse su ontologie di classificazione diverse! 2. Non possiamo prevedere come un item dovrà essere classificato e con quale set di componenti linguistici (lessici, regole di sentiment, ontologie)! 3. Lavoriamo su uno stream real time che non si ferma ad aspettarci…!
  • 32. Obiettivi Blogmeter 2014 | www.blogmeter.it 32 1. Evitare di fare due volte lo stesso lavoro (gli stream contengono molti item duplicati, non possiamo analizzarli più volte)! 2. Evitare di applicare processori computazionalmente complessi quando non sono richiesti!
  • 33. Soluzione: eliminare duplicati in maniera efficiente Blogmeter 2014 | www.blogmeter.it 33 Abbiamo dedicato particolare attenzione a definire un approccio per limitare la quantità di duplicati e per garantire una identificabilità univoca di tutti i documenti!
  • 34. Stream (Provider) Blogmeter 2014 | www.blogmeter.it 34 Soluzione: eliminare duplicati in maniera efficiente Stream (API) Search Dupicate Detector -­‐ Unique ID Dupicate Detector -­‐ Unique ID Analysis Analysis Storage
  • 35. Soluzione: routing intelligente dei documenti Blogmeter 2014 | www.blogmeter.it 35 Semantic routing su un’architettura in cui il flusso delle informazioni tra i processori può essere descritto come un grafo aciclico direzionato!
  • 36. Blogmeter 2014 | www.blogmeter.it 36 Data Processing Network (esempio) NLP auto_it data stream lang lang reco domain classifier author gender reco loc reco topic reco lang NLP mood IT NLP mood EN NLP mood es domain NLP telco_it NLP fashion_en persister NE Reco Attivazione intelligente dei processori: si adatta all’informazione disponibile azzerando il lavoro inutile!
  • 37. Blogmeter 2014 | www.blogmeter.it 37 Vantaggi e risultati raggiunti Il lavoro su documenti duplicati è ridotto a 0, con conseguente risparmio di cicli di CPU e di spazio sullo storage La pipeline di analisi semantica si autoconfigura attivando il flusso giusto per classificare correttamente il documento a seconda dell’obiettivo! Il troughput è molto elevato e ci consente di catturare i picchi prevedibili (e anche molti non prevedibili)! La scabilità orizzontale è garantita da un meccanismo che consente di deployare in maniera “semplice” nuovi nodi di analisi!
  • 38. Blogmeter 2014 | www.blogmeter.it 38 Case studies!
  • 39. Virus – Rai 2 Blogmeter 2014 | www.blogmeter.it 39 VIRUS il contagio delle idee! Seconda edizione del talk show politico di RAI 2 condotto da Nicola Porro.! ! Blogmeter Now! Durante la trasmissione Blogmeter Now rileva in tempo reale le conversazioni su Twitter relative alla trasmissione. In particolare: ! • i temi del dibattito! • gli ospiti! • i tweet più virali! • l‘uso degli hashtag lanciati a inizio trasmissione per schierarsi con uno degli ospiti (es: #haragionedemagistris #haragionesallusti)! ! Social Listening! Durante la settimana aiutiamo gli autori di VIRUS a comprendere le opinioni della rete sui temi della puntata:! • volume delle conversazioni! • sentiment sui politici! • viralità dei messaggi! !
  • 40. Blogmeter 2014 | www.blogmeter.it 40 Italian MTV Awards 2014! L’evento live più importante di MTV Italia con la premiazione dei migliori artisti dell’anno! ! Blogmeter Now! Durante la trasmissione Blogmeter Now è servito a: ! • Real Time Polling per individuare l’artista più votato dal pubblico su Twitter (due categorie: Best Live Performance e Best Dance Crew) con un effetto diretto sullo show: dopo un minuto dalla votazione i vincitori sono stati premiati sul palco! • Monitoraggio in real time dei tweet dedicati all’evento per capire i momenti più caldi! • Raccolta di tutte informazioni necessarie a creare un’infografica utile per la successiva comunicazione esterna! ! ! Italia MTV Awards
  • 41. TIM Stadium Blogmeter 2014 | www.blogmeter.it 41 ! TIM Stadium! E’ il portale di TIM per vivere le partite della Serie A con il supporto di dati numerici. ! Si tratta di dati che provengono sia dai campi di gioco (tiri, gol, tattica, ecc…) che dal web: questi ultimi sono forniti da Blogmeter Now.! ! Blogmeter Now! Tutti i flussi di tweet relativi alle partite di calcio sono elaborati da Blogmeter Now. La delivery verso la piattaforma TIM Strudium è attraverso API. TIM Stadium che rende disponibili nella sua interfaccia:! • i volumi di tweet! • il sentiment (positivo/negativo) dei tweet! • il flusso dei tweet! • i tweet più retwittati! • gli hashtag più usati! • i profili Twitter più citati!
  • 42. Obiettivo: Comprendere in real-time come si muovono i cittadini nel territorio e ad individuare attraverso l'analisi dei contenuti che arrivano dalle rete sociali eventuali problemi! ! ! ! Blogmeter 2014 | www.blogmeter.it 42 ProActive PROtezione del territorio con infrAttrutture ICT avanzate, cittadinanza attiVa, e rEti sociali! PROPONENTI! • WebRatio - MPMI (coord)! • Polimi - OdR! • Cefriel - OdR! • Vodafone - GI! • Gulliver ! MPMI! • Blogmeter - MPMI! • Pipetech - MPMI! • LSI-Lastem- MPMI! • MM - Utilities! • TEA - Utilities ! PA COINVOLTE! • ARPA Lombardia ! • Protezione Civile! • Comune di Bergamo, Milano, Como e Mantova (pending)! Bando Smart Cities; ! Programma Operativo Regionale (POR) per la Competitività; ! Fondo europeo di sviluppo regionale (FESR).! ! AMBITO! a. Sostenibilità ambientale! SETTORI ! a.1 sicurezza del territorio! a.2 mobilità urbana! a.4 gestione risorse idriche !! SPESE AMMISSIBILI! RI & SS 5.000.000,00 euro! CONTRIBUTO BANDO SC ! RI & SS 2.000.000,00 euro! ! ! !
  • 43. Blogmeter 2014 | www.blogmeter.it 43 Un’ultima cosa: Eventi su Twitter!
  • 44. Blogmeter 2014 | www.blogmeter.it 44 Eventi su twitter Abbiamo dati con sufficiente ampiezza e profondità storica ! Siamo in grado di studiare la forma delle curve di conversazioni che possono nascere in relazione ad un certo evento! http://blog.wolframalpha.com/2013/06/10/using-formulas-for-everything-from-a-complex- analysis-class-to-political-cartoons-to-music-album-covers/
  • 45. Che cosa ci dicono i dati? Blogmeter 2014 | www.blogmeter.it 45 1. A parità di volume, le serie temporali di post possono avere forme molto diverse, suggerendo atteggiamenti profondamente differenti da parte degli utenti Twitter.! 2. Diversamente dal semplice conteggio dei volumi, l’analisi della forma ci fornisce delle misure più significative del fenomeno. ! 3. Oltre a essere un’analisi interessante, ci fornisce gli strumenti per il nostro capacity planning !
  • 46. Alluvione di Genova, andamento tweet Blogmeter 2014 | www.blogmeter.it 46 9 ottobre! Post totali: 807k! Post negativi: 140k! Comportamento: picchi! 10 ottobre! Post totali: 863k! Post negativi: 147k! Comportamento: piatto! 15 novembre! Post totali: 751k! Post negativi: 116k! Comportamento: piatto! 16 novembre! Post totali: 738k! Post negativi: 128k! Comportamento: picchi!
  • 47. Diverse trasmissioni di intrattenimento Blogmeter 2014 | www.blogmeter.it 47 22 novembre: Lazio – Juventus (#) 23 novembre: Milan – Inter (#) 23 oEobre: X Factor (#) 22 novembre: Che Tempo Che Fa (#)
  • 48. Recap: una tassonomia delle curve di reazione Blogmeter 2014 | www.blogmeter.it 48 Serie di Tweet! Uniformi! Picchi! Notizie/aggiornamenti! Intrattentimento/ episodi! Maggiore coinvolgimento iniziale! Coinvolgimento continuativo!
  • 49. Dal 2007 Blogmeter ha supportato 100+ aziende e agenzie nell'ascolto del web e nell'analisi delle performance sui social media, realizzando più di 500 Blogmeter 2014 | www.blogmeter.it 49 +39 0249526400 marketing@blogmeter.it www.blogmeter.it Milano | Roma | Torino Grazie per l’attenzione! progetti. Aspettiamo i vostri CV! @Blogmeter facebook.com/Blogmeter Consulta le nostre ricerche Guarda le nostre infografiche