LOD are freely usable data without a licence and organized as a graph. This format helps applications to go through them and to get knowledge exactly as a human being. While the available Linked Data sources are increasing in quantity and diversity, their usage is still limited. For this reason SPLOD has been developed. SPLOD is a web application designed to help people query LODs and guide them through the creation and the visualization of their own dataset. It is based on a highly modular architecture that allows to overcome every quality loss of the data. Thanks to a fine-grained guide of faceted search and the readability of natural language interface, users are guided step-by-step in the construction of their own query. Suggestions are provided at each step by minimising syntactic and semantic errors. Through the integration in SPOD, a social platform part of ROUTE-TO-PA, a three-years HORIZON 2020 Europen Funded project, SPLOD provides an intuitive three step wizard for the creation of meaningful and even complex visualizations. The user does not need to know the data schema of the RDF dataset queried and may not be aware of SPARQL and all other Semantic Web technologies.
29. Per chi ?
Utenti comuni
ignari di SPARQL
e del formato dei dati
Perché?
Usare gli standard non è
semplice
Cosa?
Sviluppare SPLOD per
guidare gli utenti
dai dati grezzi alla
visualizzazione per imparare
più di quanto
ci si poteva aspettare. Dove?
È stato integrato in SPOD, un
social network per la
creazione collaborativa di
Open Data, sviluppato presso
l’ISISLab.
37. focus
La parola evidenziata in gialloe
rappresenta l’elementoin base al quale
vengonoriempiti i box e corrisponde al
soggetto delleoperazioni dell’utente.
54. DATA :LOD (Cosa sono? Perché sono utili? Dove sono?)
CONOSCENZA : cometrasformare i LOD in conoscenza
GIUDIZIO :come si può usare quanto appreso?
INFORMAZIONE : SPLOD perusare i LOD e ottenere info
Indice
85. TESTING
PIANIFICAZIONE Training supervisionato
Training non supervisionato
Goal: analisi quantitativa e qualitativa
RECLUTAMENTO 23 studenti del liceo scientifico ‘’ArmandoDiaz’’
Lavoro individuale
Lavoro in team
Complessità incrementale
Problem solving
TASK
86. TESTING Efficienza
ANALISI Task circoscritto e benchiaro
Lavoro individuale
Task # Domanda
Task1 Le categorie dei parchiarcheologici.
Task2 I parchi archeologici cheforniscono servizi di assistenza ai disabili.
Task3 Gli eventi che si tengono duranteun periodo di tempo chetermina entro il 2018.
Task4 Le biblioteche la cuisede haindirizzonella regione Campania.
Task5 Gli eventi ospitati dalla Reggia di Caserta chesi tengono duranteunperiodo di tempo che terminaentro il 2018.
Task6 I musei con categoria arteoppure chefornisce servizi di biblioteca la cui sede ha indirizzo nella provincia di Caserta.
87. TESTING Efficienza
ANALISI Task circoscritto e benchiaro
Lavoro individuale
=
TEMPOMEDIO(min)
TEMPOOTTIMO (min)
2 min
5 ± 2.5min
88. TESTING Efficienza
ANALISI Task circoscritto e benchiaro
Lavoro individuale
=
1.25 valore minimoTEMPOMEDIO(min)
TEMPOOTTIMO (min) 3.75 valore massimo
{
89. Efficacia
TESTING
Task situazione reale
Lavoro in team
Comunicazione solo via chat
Utilizzo di SPLOD persupportare le decisioni
Dati reperiti da ‘‘Cultura Italia’’
Sulla base delle informazioni presenti,
dove posizioneresti un nuovo museo,
di cosa dovrebbe trattare?
ANALISI
90. Efficacia
TESTING
Che nedite di un museo
sulla vita?
Questa categoria è
già presente!
Non trovo nulla che
parli di tradizioni
locali… Valorizziamo la nostra storia:
un museo sui Borboni!!
91. Web Component riutilizzabile
Altamente modulare ed estendibile
Che valorizza i LOD
Superando laloro complessità e bassa qualità
Grazie a metafore familiariall’utente
SPLOD
Editor's Notes
Accedere a risorse collegate, caricate dinamicamente
Inserite all’interno di un’unica interfaccia
Prima ha chiesto di pubblicare i documenti e collegarli tra loro attraverso i link, collegamenti ipertestuali. Con i dati siffatti i motori di ricerca possono indicizzare i documenti, filtrando quelli non inerenti alle keyword inserite nella ricerca, ordinarli secondo dei criteri di ranking.
Ai TED del 2009 Tim Berners Lee ha proposto di non pubblicare dati assemblati in documenti, ma pubblicare i raw data, che possono essere assemblati più e più volte anche in modi non previsti dal produttore.
Se i dati sono memorizzati in un formato esplorabile anche dalle macchine, come un grafo, i motori di ricerca possono fare elaborazioni più intelligenti e restituire direttamente la risposta alle tue domande.
URI: nome univoco anche per le risorse
Per agevolare la ricerca
Salve, sono martina garofalo, insieme continueremo a parlare di SPLOD, analizzando alcune estensioni, la sua integrazione in spod e i primi risultati ottenuti
Quello che vogliamo fare è arrivare nella parte alta della piramide, ma è necessario fare un passo indietro e fare una riflessione sui dati, che ci porterà ad un potenziamento dell’architettura, per poi analizzare conoscenza e giudizio
Il processo descritto dalla mia collega ci ha portato dai dati a delle tabelle di informazione, ma come abbiamo visto i provider sono numerosi, vorremmo poterli utilizzare tutti allo stesso modo
Dobbiamo far fronte all’eterogeneità che può presentarsi in tre sfaccettature
Generalmente le forme più diffuse tramite cui i provider possono fornire i dati sono: endpoint, dump, o esporre delle api
Le diveristà si riscontrano inoltre soprattutto per i vocabolari,
I provider tendono a crearne di proprietari
Facendo un esempio: la venere di milo ha la sua forma originale, ma tanti artisti l’hanno reinterpretato con il proprio stile,per conservare l’informazione che queste versioni si riferiscono però alla stessa, è necessario che siano collegate tra di loro
Ma molto spesso questi link non ci sono
questo non sarebbe un problema catastrofico se si riscontrasse solo su alcune risorse,
Se astraiamo dalla venere, vedremo che il problema reale è che questo fenomeno si riscontra sugli elementi fondanti, base della struttura del sistema
Come i concetti, che possono essere chiamati in diversi dialetti.
È quindi necessario costruire dei moduli ad hoc per ognuno di essi, in modo da arrivare ad un concetto unico che è quello utilizzato da splod
Infine possiamo avere dati in lingue diverse dalla nostra, se i provider sono internazionali potrebbero fornire etichette in più lingue, molto spesso invece non sono fornite affatto
Riflettendo questa eterogeneità sull’architettura, abbiamo esteso la componente che interagisce con i dati
Prevedendo che questa sia una factory, tutte le richieste sono effettuate al query executor che però è una componente astratta, senza implementazione, che ha istanziato la versione corretta che cambierà in base alla tipologia, soprattutto alla struttura e vocabolario dell’endpoint
Richieste effettuate al language manager che però ha istanziato la versione corretta di linguaggioche gestisce non solo la semplice traduzione di termini del dataset, ma attreverso delle strutture molto flessibili consente di tradurre frasi di senso compiuto
Ora che abbiamo potenziato l’architettura…
Vogliamo passare ai livelli più alti della piramide, partendo dalla conoscenza.
Per raggiungerla abbiamo bisogno di un modo più immediato di vedere i dati, rispetto ad una tabella… che può essere molto complessa da analizzare e interiorizzare
Numerosi studiosi in visualizzazione hanno dimostrato che…
Inoltre sappiamo che ricordiamo molto poco di ciò che ascoltiamo e leggiamo, mentre l’esperienza di fare e guardare qualcosa restano impresse
Quindi l’idea è di guidare l’utente dai dati grezzi, alla visualizzazione passando per filtri e operazioni che potrebbero rendere ancora più interessanti i dati
Questo è in effetti lo stesso flusso di lavoro seguito in SPOD
Spod è una piattaforma sociale, sviluppato in isislab presso questa università nell’ambito del progetto route to pa, il cui scopo è valorizzare i dati forniti dalle pubbliche amministrazioni, coinvolgendo attivamente i cittadini
I punto di svolta rispetto ai classici social network sono le discussioni guidate dai dati, infatti tramite la cosiddetta controllet wizard ci consente di ottenere visualizzazioni, chiamate datalet.
È in questo contesto che si inserisce splod, oltre a sfruttare open data (considerati dati a tre stelle) sfrutta linked open data, ovvero dati a 5 stelle
A questo punto ci rendiamo conto che stiamo aggiungendo il giudizio!! Siamo in un social, possiamo lavorare insieme per sfruttare al meglio questi dati e portare ad una idea, cambiamento nel mondo reale
Infatti sono scambiando informazioni e pareri si possono instaurare delle vere e proprie opinioni che si rispecchiano nelle azioni di tutti i giorni
Per comprendere al meglio come si integra SPLOD, analizziamo l’architettura semplificata di spod, i dati possono essere recuperati da numerosi provider, c’è una componente che si occupa di autenticazione e sicurezza, ma la parte più interessante per i nostri scopi è il DEEP
L’intera architettura è fondata sul concetto di web component, cioè piccoli componenti altamente riutilizzabili, il deep è il luogo in cui tutti questi pezzi vengono posizionati, il nostro lavoro è stato quello di inserire una nuova componente
A sua volta composto di tre moduli: il primo è splod nella sua purezza, gli altri due si occupano di filtraggio e visualizzazione proprio come a seguire il flusso di lavoro mostrato precedentemente.
Siamo pronti a ricavare qualche visualizzazione dal dataset creato in precedenza
Ci rendiamo conto che il dataset creato prima era il primo passo dello SPLOD wizard, al secondo passo selezioniamo le colonne di interesse, nella modalità esperto sottostante è possibile applicare filtri, raggruppamenti o addirittura interrogare la tabella
Infine si passa al terzo e ultimo step, il sistema sulla base dei dati, suggerisce la tipologia migliore di grafico, in questo caso ovviamente ci suggerisce una mappa, otteniamo una visualizzazione con la quale è possibile interagire
Al termine dell’implementazione, il sistema è stato sottoposto a testing
Di usabilità. Secondo l’ISO sono tre gli aspetti da valutare:
Per analizzare la soddisfazione dell’utente è stato sottoposto il sistema senza un training preventivo, dopodichè gli è stato chiesto di rispondere a 10 semplici domande secondo il test standard SUS
Il campione era eterogeneo
Avente a che fare con tre contesti differenti
è stata riscontrata la necessità di training per spiegare a grandi linee il funzionamento e la tipologia di dati sottostanti
In ogni caso però quasi tutti hanno trovato il sistema abbastanza intuitivo, le operazioni forniscono in output ciò che ci si aspetta
Nella scala identificata dal sus, abbiamo raggiunto la parte alta della fascia di buona usabilità
Sulla base dei risultati della fase precedente, è stata elaborata una seconda fase di testing può strutturata
È stata condotta una fase di training supervisionato da esperti, poi non supervisionata.
È stata reclutata una classe del liceo scientifico di San nicola la strada che ormai da due anni collabora con SPOD per il progetto scuola lavoro
Gli è stato chiesto di eseguire 6 task, di complessità crescente che vanno dal ricavare le categorie dei parchi archeologici
A task che coinvolgono le operazioni più tecniche e complesse del sistema
dopodichè abbiamo analizzato la differenza tra tempo medio di esecuzione e tempo ottimo, per i task medio semplici il tempo medio è di 5 min con uno scarto pari a 2.5, il tempo ottimo è di circa 2 min
Ovviamente vorremmo un risultato molto vicino ad 1,ci avviciniamo ad esso nel caso migliore, in quello peggiore non ci distanziamo di troppo
Infine gli studenti sono stati divisi in gruppi per risolvere un problema reale: gli è stato chiesto di identificare dove posizionare un nuovo museo e di cosa dovesse parlare
Un gruppo in particolare ci ha stupito, inizialmente pensavano ad un museo sull’origine della vita, ma analizzando i dati hanno notato che questa categoria era già trattata e che invece nulla parlava di tradizioni locali, hanno così deciso di valorizzare la propria storia con un museo sui borboni.
In conclusione splod è…
Che nasconde la complessità grazie a metafore come la query in linguaggio naturale, familiare all’utente