A public agency invited representatives from other agencies and vendors alike for an open work session. Difi inviterte til samlet åpen arbeidssamling med både offentlige etater og konsulentmiljø tilstede.
[NORWEGIAN only] Revisjon av DCAT-AP-NO versjon 1.1
1. Revisjon av Standard for
beskrivelse av datasett og
datakataloger (DCAT-AP-NO)
Oslo den 7. juni 2016:
Åpen arbeidssamling i forkant av høring
Det følgende materialet er Difi sitt innspill
til referansegruppen og eksterne brukere
2. Bakgrunn for revisjonen
• DCAT-AP (EU) er revidert
• Rask revisjon var varslet i første runde
• Økt fokus på deling av data på tvers av
offentlige virksomheter
• Felles datakatalog og “orden i eget hus”
3. Hva ønsker vi å oppnå?
• Bedre utnyttelse av offentlige data
...gjennom å legge til rette for at andre skal kunne
• oppdage
• vurdere
• bruke
…“dine” data
6. Deltagere fra forvaltningen
Dato: 7. juni 2016 Direktoratet for forvaltning og IKT
Etat/organ Representant
BrReg David Norheim (fra kl. 12), Espen Slotvik, Tore Helland
Difi Jens Aabol, Martin Standley, Øystein Åsnes
Kartverket Lars-Inge Arnevik
Lånekassen Gustav Aagesen
SSB Jenny Linnerud
Vegvesenet Morten Løberg
Politidirektoratet Arne Dybdal
(Arkivverket, Hdir, NAV, Oslo kommune, Skatteetaten og SPK har også blitt
invitert, men klarte ikke å allokere stedfortredere til å stille)
7. Øvrige deltagere
Dato: 7. juni 2016 Direktoratet for forvaltning og IKT
Virksomhet Representant
Acando David Skogan, André Torkveen (begge har deltatt i arbeidsgruppen)
EVRY Anngrim Olsvik
(invitasjon gikk ut til tre forbund, ytterligere syv leverandører og fire mediehus)
8. Kjøreplan
Tid Innhold
10:00-10:15 Introduksjon og runde rundt bordet/i salen
10:15-11:45 Gjennomgang av tilnærming og nettoliste, inkludert diskusjon
11:45-12:15 Lunsj
12:15-13:45 Fortsatt gjennomgang og diskusjon
13:45-14:00 Avslutning/pause
14:00-15:00 Lukket møte i referansegruppen
Dato: 7. juni 2016 Direktoratet for forvaltning og IKT
9. Denne samlingen har to formål
1) Vi vil gjerne bidra til å forberede dere til å gi gode
høringsuttalelser
2) Dere kan hjelpe oss med å produsere et godt
høringsdokument
...og et viktig premiss
Der finnes flere hensyn med velbegrunnede behov,
men hvis behovet (eller løsningen) enten ikke er klart
nok eller ikke gir ønsket effekt (i tilstrekkelig bredde)
faller det utenfor DCAT-AP-NO 1.1 sitt scope
Dato: 7. juni 2016 Direktoratet for forvaltning og IKT
11. Gult :
• Rødt : Må holdes internt,
evt. deles med de det gjelder
• Gult : Kan deles innen off. sektor,
men kan IKKE deles åpent
(pga. sikkerhet, personvern
eller immaterielle rettigheter)
• Grønt : Opplysninger som åpenbart
kan publiseres som åpne data
Overordnet klassifisering for tilgjengelig-
gjøring av datasett (fra veileder om åpne data)
Direktoratet for forvaltning og IKT
12. Utgangspunkt
Dato: 7. juni 2016 Direktoratet for forvaltning og IKT
Norge vil basere vår kommende 1.1-profil
på EU sin foreliggende 1.1-profil, dvs.
• Tot. antall klasser, inkl. valgfrie : 24
• Obligatoriske klasser : 10
• Obligatoriske egenskaper : 16
• Anbefalte egenskaper : 18
• Valgfrie egenskaper : 44
13. Kriterier for å introdusere en endring
• Improve the discovery of datasets
• Keep compliance with DCAT
• Ensure simplicity: keep a narrow scope
• Ensure application domain neutrality
• Nasjonale/særnorske endringer
• Skal være basert på felles konkrete behov
• Skal inkludere beskrivelser av alle data
• Bør være forankret i regelverk
Dato: 7. juni 2016 Direktoratet for forvaltning og IKT
Oppdatert
etter møtet
14. Når kan noe regnes som en ‘ordentlig’ plattform?
Direktoratet for forvaltning og IKT
Publisert og kjent
STANDARD
Realisert via tilgjengelige
VERKTØY
Med tilstrekkelig variert
INNHOLD
Delt praksis blant et gitt
BRUKERMILJØ
Systematisk kartlagte
BEHOV
vårt fokus
17. Brukerhistorier (fra funksjonell spek., Skate)
EPOS 1: Oppdage
EPOS 2: Evaluere
EPOS 3: Laste opp datasett (dele beskrivelser)
EPOS 4: Laste opp katalog (gjøre tilgjengelig)
EPOS 5: Analyse og uttrekk
EPOS 6: Registrere (beskrivelser, slik at de kan deles)
EPOS 7: “Orden i eget hus”
EPOS 8: “Orden i egen katalog”
Direktoratet for forvaltning og IKT
18. Alternativer for løsningstilnærming
• Dekket via standard : Del av norsk 1.1-profil
• Med under-alternativer for obligatorisk // anbefalt // valgfri
• Dekket via veileder : Må komme ifa. delt praksis
• I disse tilfellene bør gruppen kanskje også prøve å gi indikator
om hvordan, helst med tidsangivelse (klart nå eller senere)
• Vil ikke bli dekket innenfor kommende rammer
Dato: 7. juni 2016 Direktoratet for forvaltning og IKT
20. Egenskap Engelsk
Endrings-
type Klasse URI Range Beskrivelse
Kardi-
nalitet Status Endring
skjermings-
hjemmel
accessrights
comment
ny/
endret
Datasett
dcatno:accessRights
Comment
skos:Concept
Henvisning til hjemmel (kilde for påstand) i offentlighetsloven,
sikkerhetsloven, beskyttelsesinstruksen eller annet lovverk
som ligger til grunn for vurdering av tilgangsnivå. Egenskapen
er anbefalt dersom «tilgangsnivå» har verdiene «begrenset
offentlighet» eller «unntatt offentlighet»
0..n Anbefalt Ny URI
begrep concept ny Datasett dct:subject skos:Concept
Referanser (URIer) til definisjoner for sentrale begrep som
inngår i datasettet. URIene representere enkeltbegrep.
0..n Anbefalt Ny egenskap
mediatype media type fjernet Distribusjon
dcat:mediaType,
subproperty of
dct:format
dct:MediaType
OrExtent
Referer til distribusjonens medietype dersom denne er
definert i IANA
0..0 Fjernet
Foreslås fjernet.
dct:format dekker
behovet
identifikator identifier endret Datasett dct:identifier
Hovedindentifikator(er) for datasettet, f.eks. URI’en eller
annen identifikator som er globalt unik. I katalogen datasettet
først blir publisert i, kan URI’en for datasettbeskrivelsen
gjenbrukes.
1..n Obligatorisk
Endret kardinalitet fra
0..n til 1..n
tema theme endret Datasett dcat:theme skos:Concept
This property refers to a category of the Dataset. The values
to be used for this property are the URIs of the concepts in
the vocabularies. A Dataset may be associated with multiple
themes. The use of Publication Office "Dataset themes" is
mandatory. Difis "LOS"-vocabulary is recommended.
1..n Obligatorisk
format format endret Distribusjon dct:format
dct:MediaType
OrExtent
Referanse til distribusjonens filformat. Kan gjentas for APIer
og sluttbruker-applikasjoner som leverer data i flere formater
1..n Obligatorisk
Endret kardinalitet fra
0..1 til 1..n. Endret
beskrivelse
orgid
organisation
id
ny Agent dcatno:orgid rdfs:Resource Relasjon til URI for virksomhet 0..1 Valgfri Ny egenskap
skaper ny Datasett dct:creator rdfs:Resource Relasjoner til produsenter 0..n Valgfri Ny egenskap
Rettighets-
haver
ny Datasett dct:rightsHolder rdfs:Resource Relasjoner til rettighetshavere 0..n Valgfri Ny egenskap
er del av / har
del
is part of/has
part
ny Datasett
dct:isPartOf/
dct:hasPart
dct:Dataset
Relasjon mellom to datasett for å angi at det ene datasettet er
en del av det andre og vice versa.
0..n Valgfri Ny egenskap
krever / er
påkrevd av
requires / is
required by
ny Datasett
dct:requires/
dct:isRequiredBy
dct:Dataset
Relasjon mellom to datasett hvor det ene krever at det andre
er til stedet for å kunne brukes riktig. Eksempel. et datasett
kan være bruke kodeverdier som er definert i et annet
datasett.
0..n Valgfri Ny egenskap
erstatter / er
erstattet av
replaces / is
replaced by
ny Datasett
dct:replaces/
dct:isReplacedBy
dct:Dataset
Relasjon mellom to datasett som angir at det første erstatter
det andre og at det andre er erstattet av det første.
0..n Valgfri Ny egenskap
referer til / er
referert av
references /
is referenced
by
ny Datasett
dct:references/
dct:isReferencedBy
dct:Dataset
Relasjon mellom to datasett hvor den første refererer til det
andre av en eller annen grunn. Motsatt så kan man uttrykke
at det andre datasettet blir referert av det første.
0..n Valgfri Ny egenskap
type type endret Datasett dct:type skos:Concept
Referer til type datatasett. Egenskapen er valgfri men når den
brukes er Publication Office's vokabular "dataset types"
obligatorisk
0..1 Valgfri Endret beskrivelse
DCAT-AP-NO: Summarisk oversikt over foreliggende forslag til norsk 1.1-profil
21. Direktoratet for forvaltning og IKT
Temaområder
Identifikator Begrep Skjermings-
hjemmel
Tema
Format og
mediatype
Nye
egenskaper
…og relasjoner
…noe mer?
Oppdatert
etter møtet
22. Identifikator(er)
• Behov: Identifisere og knytte relasjoner mel. datasett
• Alle har nytte av at ethvert datasett har én globalt unik [hoved-]indentifikator.
• Mulige løsninger
• I EU sin AP 1.1 kan datasett har flere helt valgfrie samtidige ID’er (primært
dct:identifier, sekundært adms:identifier). Videre kan ID benyttes til å
enten identifisere seg selv (‘kartotekkortet’) eller det egentlige datasettet (kilden).
Merk at ID deklarert slik typisk benyttes for regulære indeks-oppslag, mens for
lenkede åpne data er egen URI (rdf:ID) nødvendig.
• Vi kan snevre inn og si at for datasett er dct:identifier obligatorisk.
• Difi sitt forslag
• For å redusere unødig variasjon får norsk 1.1-profil obligatorisk datasett-ID.
• Konklusjon
• Ref.gruppen støtter forslaget, det kan godt innstilles til norsk standardprofil (v1.1)
Dato: 7. juni 2016 Direktoratet for forvaltning og IKT
Oppdatert
etter møtet
23. Direktoratet for forvaltning og IKT
Temaområder
Identifikator Begrep Skjermings-
hjemmel
Tema
Format og
mediatype
Nye
egenskaper
…noe mer?
24. Begrep
• Behov: Bedre beskrivelse av datasett
• Noen virksomheter har etablert egen terminologi eller begrepsappart. Flere ønsker å
knytte begreper (fra egen eller andres begrepskatalog) opp mot ulike datasettet.
Slik gjør man det også lettere for andre å finne det primære og relaterte datasett.
• Mulige løsninger
• Én tilnærmingsvariant er å fortsette følge EU sin profil.
• En annen er å gi klassen datasett en ny relasjon kalt ‘begrep’ som gjøre det ønskede
mulig. Valgt tilnærming er at dcat:Dataset får relasjonen dct:subject som anbefalt
ny egenskap til skos:Concept. Hvis det ikke er noe begrep å peke til, benyttes
egenskapen emneord (dcat:keyword) til å beskrive på tilsvarende måte.
• Difi sitt forslag
• For å tilrettelegge for bedre beskrivelse får norsk 1.1-profil den nye relasjonen over.
• Konklusjon
• Ref.gruppen støtter forslaget, det kan godt innstilles til norsk standardprofil (v1.1).
Dato: 7. juni 2016 Direktoratet for forvaltning og IKT
Oppdatert
etter møtet
25. Direktoratet for forvaltning og IKT
Temaområder
Identifikator Begrep Skjermings-
hjemmel
Tema
Format og
mediatype
Nye
egenskaper
…noe mer?
26. Skjermingshjemmel
• Behov: Etablere skjermingshjemmel (via ny relasjon)
• I tilfeller hvor opplysninger er «unntatt offentlighet» eller har «begrenset
offentlighet» trenger man et virkemiddel for å angi dette.
• Mulige løsninger
• I utgangspunktet finns det ikke noen egnet mekanisme, den må etableres.
• dcat:Dataset får relasjonen dcatno:AccessRightsComment som anbefalt
referanse til skos:Concept.
• Difi sitt forslag
• En ny relasjon (og navnerom) innføres i norsk v1.1.
Tidligere diskutert innsamlingshjemmel frafalles (vanskelig affære, ref. jus).
• Konklusjon
• Ref.gruppen støtter forslaget; kan innstilles til norsk standardprofil (v1.1)
Dato: 7. juni 2016 Direktoratet for forvaltning og IKT
Oppdatert
etter møtet
27. Direktoratet for forvaltning og IKT
Temaområder
Identifikator Begrep Skjermings-
hjemmel
Tema
Format og
mediatype
Nye
egenskaper
…noe mer?
28. Tema
• Behov: Bedre beskrivelse av temaområde
• Man må kunne angi/peke til ett eller flere emner fra en gitt temainndeling.
• Mulige løsninger
• Beholde EU sin tilnærming hvor tema er en anbefalt egenskap.
• dcat:Dataset får relasjonen dcat:theme som obligatorisk referanse til
skos:Concept.
• Difi sitt forslag
• For å tilrettelegge for bedre tydelighet løftes/strammes tema fra anbefalt
til obligatorisk.
• Konklusjon
• Ref.gruppen støtter forslaget; kan innstilles til norsk standardprofil (v1.1)
Dato: 7. juni 2016 Direktoratet for forvaltning og IKT
Oppdatert
etter møtet
29. Direktoratet for forvaltning og IKT
Temaområder
Identifikator Begrep Skjermings-
hjemmel
Tema
Format og
mediatype
Nye
egenskaper
…noe mer?
30. Format og mediatype
• Behov: Tydeligere støtte for distribusjonsformater
• Det vil ofte være relevant å eksponere flere tekniske alternativ pr. distribusjon.
• Mulige løsninger
• Fra EU er det anbefalt referanse til maks én fil, API eller endepunkt pr. distribusjon.
• For en distribusjon skal det oppgis ett eller flere dct:format. På denne måten blir
det heller ikke nødvendig å beholde mediatype som valgfri tilleggsegenskap
• Difi sitt forslag
• Det å oppgi hvilke(t) format(er) en distribusjon har endres til obligatorisk egenskap.
Samtidig åpnes det for å ha flere slike. Derfor fjernes også angivelse av mediatype.
• Konklusjon
• Ref.gruppen støtter forslaget; kan innstilles til norsk standardprofil (v1.1)
Dato. 7. juni 2016 Direktoratet for forvaltning og IKT
Oppdatert
etter møtet
31. Direktoratet for forvaltning og IKT
Temaområder
Identifikator Begrep Skjermings-
hjemmel
Tema
Format og
mediatype
Nye
egenskaper
…og relasjoner
…noe mer?
Oppdatert
etter møtet
32. Nye egenskaper …og relasjoner
• Behov: Tydeligere angivelse av flere
• Se beskrivelser på eget ark (summarisk oversikt og modell, foilene 19-20)
• Mulige løsninger
• Se beskrivelser på eget ark (summarisk oversikt og modell, foilene 19-20)
• Difi sitt forslag
• Til sammen blir syv/sju nye egenskaper lagt til som valgfrie opplysninger.
I tillegg får den valgfrie egenskapen dct:type ny beskrivelse, slik at når
denne benyttes blir «dataset types» (fra EU sitt Publication Office sitt
vokabular) obligatorisk.
• Konklusjon
• Ref.gruppen støtter de fleste forslagene, bortsett fra det som er spesifisert
i referatet.
Dato. 7. juni 2016 Direktoratet for forvaltning og IKT
Oppdatert
etter møtet
33. Direktoratet for forvaltning og IKT
Temaområder
Identifikator Begrep Skjermings-
hjemmel
Tema
Format og
mediatype
Nye
egenskaper
…noe mer?
34. Hva mer ønsker gruppen å bidra med?
Dato. 7. juni 2016 Direktoratet for forvaltning og IKT
35. Fremdrift etter i dag
• Høringsforslag går ut fra Difi : 27. juni
• Høringssvar tilbake : 22. august
• Neste referansegruppe-møte : 7. september
• Evt. siste justering, ut til Rådet : 8. september
• Rådsmøte (Standardiseringsrådet) : 15. september
• Publiseringsdato for 1.1-profil : 30. september
Dato. 7. juni 2016 Direktoratet for forvaltning og IKT