GetLOD: verso i Linked Open Data geografici
Bologna, 6 Luglio 2012 – Alfredo Abrescia e Stefano Pezzi
GETLOD: VERSO I LINKED OPEN DATA GEOGRAFICI
GetLOD: Obiettivi

Rendere disponibili come Open Data (con particolare
attenzione per il formato RDF/XML e quindi come Linked Open
Data o LOD) dati e metadati gestiti da un’Infrastruttura di Dati
Territoriali
GETLOD: VERSO I LINKED OPEN DATA GEOGRAFICI
GetLOD: Cosa è

Soluzione OPEN e riusabile che:
Si integra alle Infrastrutture di Dati Territoriali grazie agli
standard definiti dall’Open Geospatial Consortium (OGC) WFS e
CS-W.
Consente di pubblicare i dati geografici aperti sia in formato
RDF (Linked Open Data), sia in altri formati di interscambio non
linkabili (Shapefile e GML).
GETLOD: VERSO I LINKED OPEN DATA GEOGRAFICI
GetLOD: Architettura
                                                                                                      LOD Front-end
                                          Download                                      Ricerca



                                                                  CKAN API
                                  JAVA      RDF                                                        LOD Back-end
             Triple server                  dump
                                  API

                                          connettori     catalogazione


                                                                                   dati.regione.it
          TripleStore                        F2R
                                                            mapping file
                                                                             API



                                           www
                    OGC WFS                                    OGC CSW




                                                                                                      GI Middleware
                             OGC server                MD server




                                                                                                     GI Data & Metadata
                         GeoRepository                 MD 19115
GETLOD: VERSO I LINKED OPEN DATA GEOGRAFICI
GetLOD: Wrapper F2R

F2R (Web Feature Service to RDF):
consente di estrarre le triple RDF dai servizi OGC:WFS
consente di accedere al dato in modalità remota e standard
aggancia ai dati, i metadati mediante chiamate ai servizi
OGC:CSW
GETLOD: VERSO I LINKED OPEN DATA GEOGRAFICI
GetLOD: Ontologie

Definire una ontologia che descriva il modello dei dati da
pubblicare
Definire una ontologia che descriva il significato dei metadati
ISO 19115
Individuare i possibili collegamenti con i dataset LOD già
esistenti ed appartenenti alla LOD Cloud
GETLOD: VERSO I LINKED OPEN DATA GEOGRAFICI
GetLOD: Stack tecnologico

Protegè (OWL)
Jena, Sesame (OWL/RDF)
Silk (Interlinking)
OGC-Server (Data access, WFS-CSW)
J2EE (JAX-WS)
CKAN (Catalogo dati open)
Allegrograph (Triple Store - SPARQL)
Sparallax (LOD Browser)
GETLOD: VERSO I LINKED OPEN DATA GEOGRAFICI
GetLOD: Caso applicativo

Edifici e terremoti
GETLOD: VERSO I LINKED OPEN DATA GEOGRAFICI
GetLOD: Caso applicativo
• dal DBTR: estrazione WFS centro storico di Mirandola: 3181 edifici
• da ISIDE (Ingv): estrazione CSV 69 scosse dal 19/05 al 28/06 nell’intorno di 20km
GETLOD: VERSO I LINKED OPEN DATA GEOGRAFICI
Ontologia
 Modellata un’ontologia per gli edifici che riusa ontologie diffuse e standard.
 Per i terremoti utilizzata ontologia SWEET (NASA)
GETLOD: VERSO I LINKED OPEN DATA GEOGRAFICI
Conversione RDF e caricamento in AllegroGraph




I 3.181 edifici e le 69 scosse
sono diventati
quasi 100.000 triplette …
GETLOD: VERSO I LINKED OPEN DATA GEOGRAFICI
Il grafo RDF all’interno del TripleStore




                        Una porzione del grafo attorno al nodo
                        che rappresenta il “Duomo” di Mirandola
GETLOD: VERSO I LINKED OPEN DATA GEOGRAFICI
Il possibile interlink




           Al momento il collegamento al catasto non è
           implementato con un interlink, perché le particelle
           non sono pubblicate dall’AdT, ma con un nodo anonimo.
GETLOD: VERSO I LINKED OPEN DATA GEOGRAFICI
La geometria WGS84 e GeoSPARQL




    La geometria è quella del centroide, ed è replicata sia in W3C WGS84
    che in OGC GeoSPARQL
GETLOD: VERSO I LINKED OPEN DATA GEOGRAFICI
La geometria completa come WFS




La geometria completa non è contenuta nel triple store, ma è raggiungibile attraverso
un link che contiene la richiesta WFS relativa
GETLOD: VERSO I LINKED OPEN DATA GEOGRAFICI
Interrogazioni possibili
 Selezione edifici di tipologia specifica più vicini di X km dagli
epicentri con magnitudine maggiore di M
 Individuazione date sismi più vicini a edifici industriali…
…
Tutte analisi che si possono fare bene (anzi meglio) all’interno di strumenti GIS
desktop e web a disposizione di tutti!

Le cose sarebbero ben diverse se esistessero come LOD anche:
• dati comunali adempimento obblighi L.R. 19/2008 (schede L0, L1 …) che si
riferiscono agli URI degli edifici
• anagrafe comunale degli immobili riferita ai medesimi URI
• DB attività economiche (sempre riferite agli edifici)
• anagrafe residenti
• terremoti da INGV
GETLOD: VERSO I LINKED OPEN DATA GEOGRAFICI
Conclusioni

Pubblicare dati geografici in RDF è utile solo se si punta alle
5 stelle                 ovvero se si creano interlink (o si da' la
possibilità ad altri di crearli).
 Estrema attenzione nella definizione delle ontologie: non
devono essere loro stesse delle isole, ma devono essere
collegate e riutilizzare altre ontologie.
 Il compito più difficile non è pubblicare in RDF, ma
intervenire sui processi di gestione del dato affinché questi
possano essere pubblicati in RDF (identificativi persistenti, ciclo
di vita chiaro, pubblicazione periodica garantita …)
 Il ruolo della PA in questo deve essere centrale.
GETLOD: VERSO I LINKED OPEN DATA GEOGRAFICI
GetLOD


            Grazie per l’attenzione

         Alfredo.Abrescia@planetek.it
           Stefano.Pezzi@sinergis.it

GetLOD, pubblicare gli Open Data Geografici sotto forma di Linked Open Data

  • 1.
    GetLOD: verso iLinked Open Data geografici Bologna, 6 Luglio 2012 – Alfredo Abrescia e Stefano Pezzi
  • 2.
    GETLOD: VERSO ILINKED OPEN DATA GEOGRAFICI GetLOD: Obiettivi Rendere disponibili come Open Data (con particolare attenzione per il formato RDF/XML e quindi come Linked Open Data o LOD) dati e metadati gestiti da un’Infrastruttura di Dati Territoriali
  • 3.
    GETLOD: VERSO ILINKED OPEN DATA GEOGRAFICI GetLOD: Cosa è Soluzione OPEN e riusabile che: Si integra alle Infrastrutture di Dati Territoriali grazie agli standard definiti dall’Open Geospatial Consortium (OGC) WFS e CS-W. Consente di pubblicare i dati geografici aperti sia in formato RDF (Linked Open Data), sia in altri formati di interscambio non linkabili (Shapefile e GML).
  • 4.
    GETLOD: VERSO ILINKED OPEN DATA GEOGRAFICI GetLOD: Architettura LOD Front-end Download Ricerca CKAN API JAVA RDF LOD Back-end Triple server dump API connettori catalogazione dati.regione.it TripleStore F2R mapping file API www OGC WFS OGC CSW GI Middleware OGC server MD server GI Data & Metadata GeoRepository MD 19115
  • 5.
    GETLOD: VERSO ILINKED OPEN DATA GEOGRAFICI GetLOD: Wrapper F2R F2R (Web Feature Service to RDF): consente di estrarre le triple RDF dai servizi OGC:WFS consente di accedere al dato in modalità remota e standard aggancia ai dati, i metadati mediante chiamate ai servizi OGC:CSW
  • 6.
    GETLOD: VERSO ILINKED OPEN DATA GEOGRAFICI GetLOD: Ontologie Definire una ontologia che descriva il modello dei dati da pubblicare Definire una ontologia che descriva il significato dei metadati ISO 19115 Individuare i possibili collegamenti con i dataset LOD già esistenti ed appartenenti alla LOD Cloud
  • 7.
    GETLOD: VERSO ILINKED OPEN DATA GEOGRAFICI GetLOD: Stack tecnologico Protegè (OWL) Jena, Sesame (OWL/RDF) Silk (Interlinking) OGC-Server (Data access, WFS-CSW) J2EE (JAX-WS) CKAN (Catalogo dati open) Allegrograph (Triple Store - SPARQL) Sparallax (LOD Browser)
  • 8.
    GETLOD: VERSO ILINKED OPEN DATA GEOGRAFICI GetLOD: Caso applicativo Edifici e terremoti
  • 9.
    GETLOD: VERSO ILINKED OPEN DATA GEOGRAFICI GetLOD: Caso applicativo • dal DBTR: estrazione WFS centro storico di Mirandola: 3181 edifici • da ISIDE (Ingv): estrazione CSV 69 scosse dal 19/05 al 28/06 nell’intorno di 20km
  • 10.
    GETLOD: VERSO ILINKED OPEN DATA GEOGRAFICI Ontologia Modellata un’ontologia per gli edifici che riusa ontologie diffuse e standard. Per i terremoti utilizzata ontologia SWEET (NASA)
  • 11.
    GETLOD: VERSO ILINKED OPEN DATA GEOGRAFICI Conversione RDF e caricamento in AllegroGraph I 3.181 edifici e le 69 scosse sono diventati quasi 100.000 triplette …
  • 12.
    GETLOD: VERSO ILINKED OPEN DATA GEOGRAFICI Il grafo RDF all’interno del TripleStore Una porzione del grafo attorno al nodo che rappresenta il “Duomo” di Mirandola
  • 13.
    GETLOD: VERSO ILINKED OPEN DATA GEOGRAFICI Il possibile interlink Al momento il collegamento al catasto non è implementato con un interlink, perché le particelle non sono pubblicate dall’AdT, ma con un nodo anonimo.
  • 14.
    GETLOD: VERSO ILINKED OPEN DATA GEOGRAFICI La geometria WGS84 e GeoSPARQL La geometria è quella del centroide, ed è replicata sia in W3C WGS84 che in OGC GeoSPARQL
  • 15.
    GETLOD: VERSO ILINKED OPEN DATA GEOGRAFICI La geometria completa come WFS La geometria completa non è contenuta nel triple store, ma è raggiungibile attraverso un link che contiene la richiesta WFS relativa
  • 16.
    GETLOD: VERSO ILINKED OPEN DATA GEOGRAFICI Interrogazioni possibili  Selezione edifici di tipologia specifica più vicini di X km dagli epicentri con magnitudine maggiore di M  Individuazione date sismi più vicini a edifici industriali… … Tutte analisi che si possono fare bene (anzi meglio) all’interno di strumenti GIS desktop e web a disposizione di tutti! Le cose sarebbero ben diverse se esistessero come LOD anche: • dati comunali adempimento obblighi L.R. 19/2008 (schede L0, L1 …) che si riferiscono agli URI degli edifici • anagrafe comunale degli immobili riferita ai medesimi URI • DB attività economiche (sempre riferite agli edifici) • anagrafe residenti • terremoti da INGV
  • 17.
    GETLOD: VERSO ILINKED OPEN DATA GEOGRAFICI Conclusioni Pubblicare dati geografici in RDF è utile solo se si punta alle 5 stelle ovvero se si creano interlink (o si da' la possibilità ad altri di crearli).  Estrema attenzione nella definizione delle ontologie: non devono essere loro stesse delle isole, ma devono essere collegate e riutilizzare altre ontologie.  Il compito più difficile non è pubblicare in RDF, ma intervenire sui processi di gestione del dato affinché questi possano essere pubblicati in RDF (identificativi persistenti, ciclo di vita chiaro, pubblicazione periodica garantita …)  Il ruolo della PA in questo deve essere centrale.
  • 18.
    GETLOD: VERSO ILINKED OPEN DATA GEOGRAFICI GetLOD Grazie per l’attenzione Alfredo.Abrescia@planetek.it Stefano.Pezzi@sinergis.it