Návrh a realizácia web stránky skriptovacím jazykom PHP vrátane administračné...
Seminar K Datasetom
1. Seminár k datasetom a štandardom
Bratislava, 1.10.2012
Gabriel Lachmann
www.opendata.sk 1
2. Obsah
Štandardy pre sprístupňovanie dátových zdrojov
Formáty
Linked data
Kvalita a hodnotenie dát
Application Programming Interfaces (APIs)
Príklady
www.opendata.sk 2
3. Štandardy pre sprístupňovanie dátových zdrojov
Materiál UV
data.gov.sk
Základná požiadavka:
Aby boli dáta dostupné a strojovo
spracovateľné.
www.opendata.sk 3
16. Formáty
minimálne požiadavky na formáty:
CSV, alebo
XML so schémou
odporúčané formáty Linked data vo formátoch :
Resource Description Framework – RDF,
Web Ontology Language - OWL,
Simple Knowledge Organization System - SKOS.
www.opendata.sk 16
17. Kvalita a hodnotenie dát – 5 Stars
Metodika hodnotenia kvality datasetov by mohla
vychádzať z metodiky 5 Stars (5 hviezdičiek).
Metodika bola definovanova zo strany w3c.
www.opendata.sk 17
18. Kvalita a hodnotenie dát
★ make your stuff available on the web (whatever format)
★★ make it available as structured data (e.g. excel instead of image
scan of a table)
★★★ non-proprietary format (e.g. csv instead of excel)
★★★★ use URLs to identify things, so that people can point at
your stuff
★★★★★ link your data to other people’s data to provide context
www.opendata.sk 18
19. Štruktúra údajov o dátovom zdroji – metadáta
dátum, ku ktorému sú údaje platné
odporúčané: dátum najbližšej aktualizácie
sprístupnenie doplňujúcich informácií:
schémy údajov - pokiaľ schéma údajov (t.j. členenie
dátového zdroja na typy údajov, konkrétne záznamy a
vzťahy medzi týmito entitami) nie je triviálna
popis typov položiek - najmä v prípade, ak sú používané
netypické dátové typy, číselníkové typy, skratky, zložené
dátové typy a pod.
popis formátov v ktorých je dátový zdroj sprístupňovaný -
napr. formáty súborov
popis možných nepravidelností v štruktúre
www.opendata.sk 19
20. Application Programming Interfaces (APIs)
Príamy prístup ku aplikácii spravujúcej dáta
minimálne požiadavky:
RESTful vo formáte XML alebo JSON
odporúčané formáty: ako vyššie ale navyše aj vo
formáte RDF (Turtle, RDF/XML, ...) cez SPARQL
endpoint
Mnohé projekty
www.opendata.sk 20
25. • datasety publikované MV, vizualizované vo forme
Heatmap, choropleth map, grafov...
www.opendata.sk 25
26. • cyklické harvestovanie dát a metadát do datasetov
• získané datasety vizuálne publikovať vo forme máp a grafov:
•heat mapy,
•choropleth mapy,
•grafy.
www.opendata.sk 26