Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
TellMeQuality
Alessio Melandri, Marco Torchiano, Antonio Vetrò
Obiettivo
Strumento per misurare le caratteristiche di
qualità del dato secondo l’ISO/IEC 25024
Criticità
● Diversi formati di input
○ sintatticamente diversi
○ record, item e value semanticamente diversi (e.g.
un reco...
Soluzione proposta
Utilizzare RDF come stele di Rosetta tra formati, ontologie
standard (e all’occorrenza custom) per gest...
Resource
Description
Framework
Lo strumento proposto da W3C per: codifica, scambio e
riutilizzo di dati e metadati struttu...
Vantaggi
● diversi formati riconciliati in un unico formalismo
Vantaggi
● diversi formati riconciliati in un unico formalismo
● metadati associati a livello di dato
Modello per la definizione dei metadati (AGID 2014)
Modello per la definizione dei metadati (AGID 2014)
Vantaggi
● diversi formati riconciliati in un unico formalismo
● metadati associati a livello di dato
● misurazioni tramit...
Vantaggi
● diversi formati riconciliati in un unico formalismo
● metadati associati a livello di dato
● misurazioni tramit...
Shapes Constraint Language (https://www.w3.org/TR/shacl/)
Data Quality Vocabulary (https://www.w3.org/TR/vocab-dqv/)
Possibili svantaggi
● Servono più risorse per gestire triple
Architettura
User journey
1. Alessio vuole analizzare la qualità di una anagrafica in formato CSV
2. Carica il file scelto e delinea i ...
User journey
5. Ora Alessio lancia tutte e sole le misurazioni relative all’accuratezza: è
la metrica che gli interessa in...
Wireframes
Prima bozza della user interface del tool
Caricamento dati e metadati
Wizard per l’inserimento guidato dei metadati
Cabina di guida :-) per lanciare le misurazioni
Manopole nel dettaglio e fortemente granulari
Sintesi dei risultati sulle metriche lanciate
Dettaglio di una famiglia di metriche
Conclusioni
● Acquisizione di coscienza sulla qualità dei propri dati
○ Vedo quali sono gli aspetti più carenti quindi dec...
TellMeQuality
TellMeQuality
TellMeQuality
TellMeQuality
You’ve finished this document.
Download and read it offline.
Upcoming SlideShare
Alessandria - Dati Aperti: alla ricerca di efficienza e trasparenza.
Next
Upcoming SlideShare
Alessandria - Dati Aperti: alla ricerca di efficienza e trasparenza.
Next
Download to read offline and view in fullscreen.

Share

TellMeQuality

Download to read offline

Strumento per misurare le caratteristiche di qualità del dato secondo l'ISO/IEC 25024

TellMeQuality

  1. 1. TellMeQuality Alessio Melandri, Marco Torchiano, Antonio Vetrò
  2. 2. Obiettivo Strumento per misurare le caratteristiche di qualità del dato secondo l’ISO/IEC 25024
  3. 3. Criticità ● Diversi formati di input ○ sintatticamente diversi ○ record, item e value semanticamente diversi (e.g. un record non è sempre la riga di una tabella) ● Caratteristiche inerenti vs dipendenti dal sistema ● Alcune metriche necessitano di metadati di contesto (e.g. I-ACC-1 dipende dal datatype)
  4. 4. Soluzione proposta Utilizzare RDF come stele di Rosetta tra formati, ontologie standard (e all’occorrenza custom) per gestire il flusso dei dati e SPARQL per effettuare le misurazioni
  5. 5. Resource Description Framework Lo strumento proposto da W3C per: codifica, scambio e riutilizzo di dati e metadati strutturati. Consente l'interoperabilità semantica tra applicazioni che condividono informazioni.
  6. 6. Vantaggi ● diversi formati riconciliati in un unico formalismo
  7. 7. Vantaggi ● diversi formati riconciliati in un unico formalismo ● metadati associati a livello di dato
  8. 8. Modello per la definizione dei metadati (AGID 2014)
  9. 9. Modello per la definizione dei metadati (AGID 2014)
  10. 10. Vantaggi ● diversi formati riconciliati in un unico formalismo ● metadati associati a livello di dato ● misurazioni tramite query SPARQL ○ facilmente espandibili anche per misurazioni non ISO/IEC 25024
  11. 11. Vantaggi ● diversi formati riconciliati in un unico formalismo ● metadati associati a livello di dato ● misurazioni tramite query SPARQL ○ facilmente espandibili anche per misurazioni non ISO/IEC 25024 ● dati machine readable e actable tramite l’utilizzo di ontologie standard (SHACL e DQV) ○ eventualmente espandibili
  12. 12. Shapes Constraint Language (https://www.w3.org/TR/shacl/)
  13. 13. Data Quality Vocabulary (https://www.w3.org/TR/vocab-dqv/)
  14. 14. Possibili svantaggi ● Servono più risorse per gestire triple
  15. 15. Architettura
  16. 16. User journey 1. Alessio vuole analizzare la qualità di una anagrafica in formato CSV 2. Carica il file scelto e delinea i metadati (Shape) in SHACL, aiutato da un’interfaccia con suggerimenti e autocompletamenti 3. L’attenzione di Alessio si sposta sull’interfaccia di scheduling, dove trova la lista delle possibili misurazioni di qualità che può compiere. Si accorge che non può lanciare alcune metriche relative all’accuratezza perché i metadati che ha inserito non sono completi 4. Alessio torna nella schermata dei metadati e aggiunge le informazioni mancanti
  17. 17. User journey 5. Ora Alessio lancia tutte e sole le misurazioni relative all’accuratezza: è la metrica che gli interessa in questo studio 6. Nella schermata finale trova una visualizzazione di sintesi dei risultati: il valore che vede non è ottimale 7. Alessio apre il dettaglio e scopre che la qualità degli indirizzi della sua anagrafica è decisamente migliorabile 8. Si scarica allora i risultati in formato JSON e organizza una riunione...
  18. 18. Wireframes Prima bozza della user interface del tool
  19. 19. Caricamento dati e metadati
  20. 20. Wizard per l’inserimento guidato dei metadati
  21. 21. Cabina di guida :-) per lanciare le misurazioni
  22. 22. Manopole nel dettaglio e fortemente granulari
  23. 23. Sintesi dei risultati sulle metriche lanciate
  24. 24. Dettaglio di una famiglia di metriche
  25. 25. Conclusioni ● Acquisizione di coscienza sulla qualità dei propri dati ○ Vedo quali sono gli aspetti più carenti quindi decido dove investire per migliorare ○ Feedback costante: posso versionare la qualità dei dati e legarla allo sviluppo del software ○ Creazione di una certificazione?? ● Architettura modulare ○ A prova di futuro tramite ontologie e moduli facilmente espandibili ○ API REST: l’interfaccia può cambiare in base alle necessità
  • phisaz

    Sep. 1, 2017

Strumento per misurare le caratteristiche di qualità del dato secondo l'ISO/IEC 25024

Views

Total views

813

On Slideshare

0

From embeds

0

Number of embeds

1

Actions

Downloads

11

Shares

0

Comments

0

Likes

1

×