Open data INPS

1,224 views
1,118 views

Published on

Slide che Filippo d'angelo dell'inps ha utilizzato per tenere il seminario online sui dati perti dell'INPS per Dati.gov.it

qui maggiori info: http://www.dati.gov.it/content/terzo-ciclo-di-seminari-online-sui-dati-aperti

Published in: Technology
0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
1,224
On SlideShare
0
From Embeds
0
Number of Embeds
182
Actions
Shares
0
Downloads
17
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide

Open data INPS

  1. 1. OPEN DATA
  2. 2. “STATO DELL’ARTE” “The best way to get value from...L’Europa corre veloce data is to give it away..[..]..Lets join togetherDicembre 2011 - Nuova OpenData Strategy and share our data”Neelie Kroes, Vice-Presidente Commissione europea per l’Agenda digitale. Marzo 2012- ePSI platform Conference Taking re-use to the next level “Practical example of OpenData reuse and grass roots support and experience play an important role here.. [..].. Go out and make the case for OpenData more strongly!”
  3. 3. Le direttive dalla Digital Agenda di Dicembre 2011 Aggiornamento direttive 2003 sul riuso del PSI Rendere accessibili e riutilizzabili i contenuti documentali della PA. Rendere i dati in formato machine readable (RDF, JSON, XML). Creazione di un data portal della commissione europea. Aggiornamento delle direttive dalla ePSI conference 2012 Tutti i dati resi disponibili dal PSI devono poter essere riutilizzabili per usocommerciale e non commerciale. Gli stati membri devono introdurre un sistema di supervisione eregolamentazione al fine di rispettare le direttive UE sul riuso nei tempistabiliti. Lo scopo delle direttive sarà esteso alle informazioni contenute nelledigital libraries, musei e archivi.
  4. 4. IL RIUSO COME CRITERIO OBIETTIVO: “VALUTARE LA “VALUTARE LA QUALITÀQUALITÀ DEI DATASET DEI PROCESSI DI PUBBLICATI” GOVERNANCE” (Open Government) Open Data(Government Data) Tutti le tipologie di dati cheTutti le tipologie di dati di contribuiscono alla interesse pubblico trasparenza delle amministrazioni
  5. 5. COME VALUTA L’UNIONE EUROPEA ? Il riuso negli indicatori di punteggio:Implementazione delle direttive EU Dati delle amministrazioni Locali Sviluppo dei formati Pratiche di riuso Eventi ed attività correlate
  6. 6. QUALEVALUTAZIONE PER ITALIA?
  7. 7. L’ITALIA NON VA MALE ! 8° POSIZIONE
  8. 8. Qualche dettaglio sulla valutazione degli OpenData in Italia Dal punto di vista del punteggio non siamo lontani dai paesi già avviati in materia di open government (UK).Implementazione delle direttive EUSviluppo dei formatiEventi ed attività correlate Cosa migliorare? Rilascio dei dati delle amministrazioni Locali Per migliorare il riuso implementare i Pratiche di riuso formati non basta !
  9. 9. Qualche idea?
  10. 10. La correlazione tra pratiche di riuso e rilascio dei dataset degli enti locali suggerisce di implementare un piano di rilascio OpenData a partire dal modello degli Enti pubblici più importanti.
  11. 11. “Interestingly the INPS data website explicitly refers tothe EU PSI Directive as the reason for publishing data forre-use.” “..continuous dialogue between data holders and re-users is needed, as we are learning how to do this by doing. The INPS data release is a good step forward, and creates appetite for more.”
  12. 12. Liberare i dati
  13. 13. Perchè le linee guida sono importanti ?Il lavoro sugli OpenData è collaborativo.E’ necessario individuare le tappe del processo.E’ necessario che la metodologia sia condivisa.
  14. 14. MA... Quali dati vannoDa dove partire? aperti?E i metadati? Come produrre un dataset di qualità? Come mettere insieme i pezzi?
  15. 15. STOP !!
  16. 16. Il modello INPS
  17. 17. 1- Analisi di dominio e individuazione dei dati 2 - Analisi tipologica dei dati 3 - Preparazione dei dati 4 - Definizione dei formati 5 - Definizione dei metadati 6 - Attribuzione della licenza
  18. 18. ANALISI DI DOMINIO INDIVIDUAZIONE DEI DATI Obiettivo?identificare i contenuti già esposti dall’istituto all’interno delle aree di pubblicazione al fine di identificare i dati. INPS.IT
  19. 19. Individuare subito i dati che possonoessere aperti ... Sottosezioni1.Relazioni annuali2.Bilanci sociali3.Osservatorio statistico4.Statistiche della previdenza5.Rapporto sulla coesione sociale
  20. 20. Ma XLS non è un pò pocoSi, ma.. Abbiamo sempre bisogno di dati grezzi da cui partire La definizione del formato è un processo graduale e in itinere. Possiamo sempre implementare il formato una volta pubblicati i dati.
  21. 21. ANALISI TIPOLOGICA DEI DATI Di che tipo sono i dati (XLS) che abbiamo trovato? Obiettivo?Distinguere in maniera efficace dati grezzi dai dati già manipolati:
  22. 22. Dati GrezziDati Statistici (già manipolati)
  23. 23. PREPARAZIONE DEI DATI Obiettivo?Poichè molte delle fonti dei dati presentano le informazioni in maniera non strutturata è opportuno effettuare un’operazione di pulizia riguardante la struttura delle tabelle e il contenuto delle stesse.
  24. 24. DEFINIZIONE DEI FORMATI Obiettivo? Se in prima battuta cerchiamo dati raw dobbiamo anche pensare di implementare successivamente formati non proprietari come: ★ : testo ( PDF, TXT ) ★ ★ : struttura proprietaria ( XLS ) ★ ★ ★: struttura aperta ( CSV,XML ) ★ ★ ★ ★: struttura con URL e URI ★ ★ ★ ★ ★: Linked Data ( RDF + Link )Livello di apertura
  25. 25. DEFINIZIONE DEI METADATI Obiettivo? Lo step successivo nella creazione degli Open Data è la definizione e la creazione di metadati, cioè informazioni che descrivono uno o un insieme di dati. Tali informazioni rappresentano delle proprietà più significative fissate e consentono la ricerca e il recupero dei dati stessi con lo scopo di migliorarne la visibilità e facilitarne l’accesso. Alcuni importanti standard per i metadati • ISO/IEC 11179 • ISO 15836 Dublin Core •W3C SKOS, W3C RDF/OWL
  26. 26. La creazione e l’implementazione dei metadatirichiede attenzione alle risorse informative che talimetadati devono riflettere. Molta attenzione deveessere data alla qualità, perchè un pessimo metadatoè peggio dell’assenza di metadati.Per tale ragioni sono stati creati opportuni metadatiper descrivere al meglio i dati INPS. Metadati Sintattici Descr ivono il dato attr aver so le sue caratteristiche strutturali, in cui sono comprese le informazioni sul processo di creazione, organizzazione e pubblicazione. Tali metadati non aggiungono informazioni sul contenuto del dataset. • Titolo: titolo dei dati • Data di pubblicazione: Questa informazione riguarda la data di pubblicazione del dato all’interno del portale/minisito OpenData Inps. • Formato: l’estensione del file (.pdf; .xls; .rdf; .doc) • Licenza : il tipo di licenza a cui è legato il dato • Dimensione in byte: la dimensione fisica del dato • Identificativo : numero progressivo univoco del dato • Link: (URL-permanent link-, link annidati, short URL) • Fonte: opzionale, chi ha prodotto il dato (Direzione, altro soggetto)
  27. 27. Metadati Semantici Descrivono il dato attraverso le sue caratteristiche semantiche, ovvero le informazioni sul contenuto. Tali aspetti consentono di individuare univocamente la risorse.• Copertura spaziale: rappresenta il riferimento geografico del dato (coverage=area geografica: Internazionale, Europeo, Nazionale, Regionale, Provinciale, Comunale)• Copertura temporale: rappresenta l’estensione temporale del dato (es. ante 2000, 2001-2005, 2006-2011, 2012-)• Livello di lavorazione del dato: grezzo, statistica, bilancio.• Tags: parole chiave dell’argomento principale• Area di pubblicazione: a sezione in cui viene pubblicato all’interno del portale Inps.it.• Descrizione: un breve abstract del dato• Data di aggiornamento: mostra ogni quanto il dato viene tenuto aggiornato.• Argomento trattato: il soggetto semantico del dato
  28. 28. Dal dato al metadato... Definiamo così nelcomplesso la modalità di fruizione dei dati attraverso le informazioni che li descrivono.
  29. 29. ATTRIBUZIONE DELLA LICENZA Obiettivo? Scegliere una licenza che consenta all’utente un riuso più facile e libero possibileLa IODL 2.0 prevede che l’utente possaliberamente:1-Consultare, estrarre,copiare e pubblicare i dati2-Creare un lavoro derivato integrando diversidataset. ..rispetto alla IODL 1.0? Non prevede l’obbligo dell’utente di pubblicare o condividere i lavori con la stessa licenza. E’ chiesto solo di indicare la fonte!
  30. 30. ....Perchè la semantica? Aiutare gli utentiMettere in relazione i dati
  31. 31. Lavoriamo sui metadati semantici! Cosa possiamo farci? Una volta definiti i metadati semantici, questi sono utilizzati per la creazione delle faccette per il motore di ricerca. Le faccette rappresentano i diversi aspetti o dimensioni attraverso i quali si può descrivere una stessa risorsa.
  32. 32. Motore a faccetteSelezionando una faccetta, si riducono i dataset trovati;selezionandone più di una si opererà una intersezione tra idati, riducendo ancora di più fino a trovare esattamentequanto cercato.
  33. 33. Query expansion La modalità di ricerca Query expansion consente di interrogare il sistema utilizzando il linguaggio naturale, piuttosto che inserire parole chiave che l’utente potrebbe non conoscere. In questo modo il raggiungimento delle risorse sarà notevolmente facilitato per tutte le categorie di utenti (dai più esperti ai meno esperti) Ad esempio: supponiamo che l’utente digiti la query “centri per le cure termali”. Utilizzando la query expansion, nonostante la stringa inserita non sia presente nelle descrizioni dei dati, l’utente sarà indirizzato al dato “Cure forme vie respiratorie - elenco alberghi convenzionati per la stagione termale”.
  34. 34. Arricchire semanticamente i datisignifica stabilire uno standard di qualità dei dataset in vista dei Linked Open Data. Fare linked open data consente di abbattere le barriere fisiche tra i dati. connettere e condividere dataset attraverso standard già implementati
  35. 35. La qualità dei dataset pubblicati costituisce una buona pratica OpenData! Più i dati sono ricchi di informazioni ed esposti in modo preciso maggiore sarà il riuso che se ne potrà fare.
  36. 36. Buona pratica Un esempio applicativo Dati sugli attraversamenti stradali (integrazione) Dati sugli incidenti stradaliDal dato all’informazione
  37. 37. Gli Open Data Linked possono essere facilmente accessibili da persone e applicazioni (via mashup) per i più diversi scopi ma soprattutto...- consentono di passare dal dato all’informazione - IL RIUSO COME CRITERIO DI VALUTAZIONE Riuso nella PA: maggior controllo del territorio con più semplicità Riuso privato: informazioni ai cittadini, maggiore trasparenza Riuso commerciale: sviluppo di applicazioni più intelligenti e integrate
  38. 38. Il modelloOPEN DATAUn modello di qualità per lo sviluppo OpenData in Italia Un modello per le PA locali Grazie a tutti ! Filippo D’Angelo filippo.dangelo@inps.it

×