Sissa presentazione crisci
Upcoming SlideShare
Loading in...5
×
 

Sissa presentazione crisci

on

  • 363 views

Ondata di calore 7-9 aprile 2011:

Ondata di calore 7-9 aprile 2011:
analisi esplorativa del fenomeno
tranite georetrieval effettuato con Twitter API
Dott. Alfonso Crisci

Statistics

Views

Total Views
363
Views on SlideShare
363
Embed Views
0

Actions

Likes
0
Downloads
1
Comments
0

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

Sissa presentazione crisci Sissa presentazione crisci Presentation Transcript

  • Sissa X convegno comunicazione Trieste 24-27 novembre Ondata di calore 7-9 aprile 2011: analisi esplorativa del fenomeno tramite geo-retrieval information effettuato con Twitter API Alfonso Crisci , CNR Ibimet Marco Morabito, Università di Firenze Valerio Capecchi, Consorzio LaMMA Valentina Grasso, Consorzio LaMMAInterim, quondam Galli appropinquabant,arx Romae Capitolium in ingenti pericolo fuit.(Plutarco)
  • ObbiettiviQuesto lavoro ha lobbiettivo di valutare lapotenzialità dei flussi quantitativi dei socialmedia/network legati al rischio sanitarioassociato ad una criticità climatica e valutarel’impatto sociologico di eventi di naturameteo/clima.
  • Lo strumento Twitter http://twitter.com•Twitter è una piattaforma di micro-bloggingcommerciale che permette l instant messaging cioè ilcosidetto “speak & tweet”.•Esistono nella piattaforma vari meccanismi dicondivisione e diffusione del singolo messaggio.•In 140 caratteri un utente può scrivere pubblicamentequello che pensa, vede e dice in forma compatta dadevice fisso o mobile.•L’utente può dichiarare, se vuole, da dove scrive,tramite i servizi twitter di geo-location.•Le conversazione sono archiviabili nel suo account.Sono accessibili e interrogabili tramite specifici serviziweb ( Twitter API).
  • Le capacità Twitter Osama’s End 1-Maggio 2011•Twitter ha delle capacità di diffusionerapida nel tempo, di tipo virale-epidemico,e di conseguenza nello spazio.•I flussi delle conversazione fra utenti neisocial-network hanno ormai un valoreaccertato per evidenziare l’attenzione versoun evento identificabile tramite una/piùparole chiavi presenti nei messaggi. Twitterfornisce anche dei meccanismi perfacilitarne la ricerca e l’acquisizione( TWITTER API).•L’attenzione è un parametro misurabiletramite il volume di scambi nell’unità ditempo.
  • Trending Topics Visualizzazione Geografica•Gli argomenti o gli eventiimportanti possono essereidentificati con parole di massimaricorrenza nei flussi Twitter evengono denominati, come in altrimedia, come Trending Topics.• Il loro baricentro/localizzazionegeografico, grazie agli utenti e perla natura pubblica, può esserevisualizzato in tempo reale assiemealle sue statistiche di traffico grazieall’interrogabilità condizionaledella piattaforma. http://trendsmap.com/
  • Il fenomeno Twitter in Italia•La piattaforma Twitter stacrescendo in Italia anchese meno rispetto ad altripaesi.•I volumi di traffico sono increscita e già suffucienti perpoter effettuare indaginisociologiche utilizzate in varicampi.http://www.slideshare.net/Text100Italy/t100-twitparade100701
  • Ondata di calore 7-9 aprile 2011 Italia•Un ondata di calore è un periodocon T° sopra la norma e persistente.La sua definizione precisa varia infunzione dei contesti geografici.• Rappresenta un serio rischiosanitario specialmente per categoriefragili (anziani, malati cronici,bambini, lavoratori esposti) .•Nell’aprile 2011, nei giorni 7-8-9,l’Italia è stata interessata daun’ondata di calore precoce convalori da record assoluti.•La percezione comune non haseguito le statistiche meteorologichema solo in alcune aree di italia. www.meteogiornale.it
  • Raccolta dati•Temperature massime italiane delle stazioni ITAV per i giorni dal 5-10 aprile2011.•Temperature su griglia da modello (Reanaliys 2 NCEP-DOE) per l’areaeuropea del periodo 5-13 aprile 2011.•I matches twitter tramite Search API che permette di inserire le parole diricerca “AFA,CALDO,SETE”, fino ad una massimo di 1500 occorrenze filtrateper lingua italiana:http://search.twitter.com/search.atom?lang=it&q="afa OR caldo ORsete"&until=2011-04-13&rpp=50&page=100.I dati presi con il servizio Twitter API sono stati relativi al periodo 6-13 aprilee sono comprensivi sia del messaggio testuale che dell’ora di invio. I dati sonostati verificati per escludere quelli di orgine commerciale, e successivamentesi è provveduto a fare le statistiche giornaliere di conteggio.
  • Coerenza temporale numero Tweets giornalieri e temperature•La dinamica dei matches“CALDO o AFA o SETE”Twitter è stata coerentecon quella delletemperature massimeitaliane e ancor più conquelle dell’Italiasettentrionale e delversante adriatico. Il picco di caldodel 9 aprile è statointercettato, così come ilcrollo del giornosuccessivo, sia nel numerodi tweet cercati che delletemperature.
  • Coerenza spaziale del numero tweet giornalieri e temperature medie giornaliere•Le mappe di associazione fra laserie Twitter e i dati del modellodi Reanalisi climatiche fattetramite l’analisi del valore dicorrelazione lineare r per ognipunto griglia nel periodo 6-13aprile, con due livelli disignificatività (s.)Aree rosse -> s. blanda ( p=0.1)Aree bianche -> s. forte 0.05fa emergere un preciso patternspaziale in Italia. Il nord estsopratTutto e il settentrione ingenerale, riteniano siano le areegeografiche di percezionedell’ondata di calore.
  • Conferma della coerenza spaziale tramite osservazioni Dove la T° massima > 28 C° in Italia il 7-8-9 aprile 7 8 9
  • ANALISI TEXT MINING dei CORPUS messaggi per igg NO HEAT (6-11-12-13 apr)/ gg HEAT ( 7-8-9-10 apr) •Utilizzando il package R tm sono state analizzate le associazioni fra le parolepiù frequenti nei messaggi lasciando le parole di ricerca CALDO, AFA, SETE con pari grado di sparsità della Matrice Termini Documento dei due Corpus Twitter relativi ai giorni indicati. HEAT NO-HEAT Aumento e modifica della complessità nell’associazione fra termini sia in termini assoluti che di aggregazione.
  • ANALISI TEXT MINING dei CORPUS messaggi per igg NO HEAT (6-11-12-13 apr)/ gg HEAT ( 7-8-9-10 apr) •Visualizzazione della Wordcloud dei testi tweet package R wordcloud HEAT NO-HEAT E’ interessante notare l’apparizione di termini geografici e stagionali.
  • Variazione densità singole parole NO HEAT N=1798 HEAT N=2039 oggi 6.0% oggi 8.3% 1° sole 5.5% troppo 7.7% 2° troppo 4.1% sole 5.9% 3°Esempio di analisi della variazione di frequenza relativa a singoleparole ad elevato ranking.
  • Conclusioni• Questo lavoro ha evidenziato come l’Audit dei flussi Twitter, e dei social media/network in lingua locale possono essere utilizzati, durante una criticità, come un parametro quantitativo di interesse per la comunità scientifica meteo/climatica. Un orecchio “sociale” importante sul territorio per gli impatti perfettamente integrabile con gli strumenti attualmente utilizzati. Il crossing informativo fra le sorgenti dati può dare risultati anche inattesi.• Anche l’analisi testuale può fornire delle chiavi di lettura integrative di un fenomeno meteo/clima suggerendo quale sia la forma e la reazione, mutuabile dall’espressione scritta dei messaggi che hanno una loro rilevanza, rispetto ad una pressione ambientale da parte di una comunità, che attualmente è solo misurata, in riguardo al disagio termico e al rischio sanitario, con parametri fisici osservati o previsti e statistiche sanitarie.
  • Preludi di Social-Meteorologia ??…….You want to study human behavior; you are interested incommunication, social structure, information dissemination, andcrowd behavior. ……..…………You’re on Twitter, and you’ve watched with your owneyes the types of information cascades and communicationdynamics that form the foundation of your research. Eureka!Twitter presents an unprecedented opportunity to study humanbeings, and its openness and technical hooks allows for thesystematic capture of this with complete transparency.Drew Conway July 28th, 2011 http://www.drewconway.com/zia/?p=2784