1. DATA
SUPPORT
OPEN
Õpimoodul 2.4
RDF sõnastike
kujundamine ja
arendamine
PwC firms help organisations and individuals create the value they’re looking for. We’re a network of firms in 158 countries with close to 180,000 people who are committed to
delivering quality in assurance, tax and advisory services. Tell us what matters to you and find out more by visiting us at www.pwc.com.
PwC refers to the PwC network and/or one or more of its member firms, each of which is a separate legal entity. Please see www.pwc.com/structure for further details.
3. DATASUPPORTOPEN
Õpieesmärgid
Käesoleva õpimooduli lõpuks peaksid teil olema omandatud järgnevad
teadmised:
• Millised on parimad praktikad RDF sõnastiku ning andmemudelite
loomiseks.
• Kust leida RDF sõnastikke taaskasutuseks.
• Kuidas luua oma RDF sõnastikku.
• Kuidas avaldada oma RDF sõnastikku.
• Euroopa Komisjoni ISA programmi poolt arendatud semantiliste
kokkulepete tegemise protsess ja metodoloogia.
Slide 3
4. DATASUPPORTOPEN
Sisu
See moodul sisaldab…
• Samme andmemudelite loomiseks.
• Juhiseid kuidas taaskasutada olemasolevaid sõnastikke ja luua
andmemudeleid.
• Juhiseid kuidas luua uusi klasse ja omadusi RDF-is.
• Juhiseid kuidas ja kus avaldada oma RDF sõnastikku, et seda oleks
teistel võimalik taaskasutada.
Slide 4
5. DATASUPPORTOPEN
RDF Sõnastik
Slide 5
“Sõnastik on andmemudel, mis koosneb klassidest, omadustest ja
seostest, mida on võimalik kasutada andmete ja metaandmete
kirjeldamiseks.”
• RDF sõnastikud on terminite komplektid, mida kasutatakse
asjade kirjeldamiseks.
• Termin on kas klass või omadus.
Objekt-tüüpi omadused ehk seosed
Andme-tüüpi omadused ehk atribuudid
6. DATASUPPORTOPEN
Mis on klassid, seosed ja omadused?
Klass. Konstruktsioon, mis esindab asju päris- ja informatsiooni
maailmas. Näiteks inimene, organisatsiooni ning kontseptsioonid nagu
tervis ja vabadus.
Omadus: seos. Seos kahe klassi vahel; näiteks dokumendi ja selle
avaldanud organisatsiooni vahel (organisatsioon avaldab dokumendi),
või seos kaardi ja kujuteldava geograafilise regiooni vahel (kaart
kujutab geograafilist regiooni). RDF seosed on kodeeritud objekt-tüüpi
omadustena.
Omadus: atribuut. Klassi omadus, mille kohta väidame. Näiteks
organisatsiooni ärinimi või kuupäev ja kellaaeg, millal tähelepanek
tehti.
Slide 6
7. DATASUPPORTOPEN
Klassi, atribuudi ja seose näide
Slide 7
http://.../org/217279
8119
veebisait
http://example.com/site
/1234
Registreeritud
organisatsioon
Aadress
Dahliastraat 24, 2160
Wommelgem“Nike”
Ametlik
aadress
Ärinimi
KlassOmadus
Seos
9. DATASUPPORTOPEN
6 sammu andmemudelite loomiseni
Alustage valdkonna mudeli arendusega jälgides
struktureeritud protsessi ja metodoloogiat.
Analüüsige olemasolevaid termineid ja nende kasutamist, et
maksimeerida nende taaskasutamine.
Kui uusi termineid on võimalik vaadelda olemasolevate terminite
täpsustustena, looge alamklassid ja alamomadused.
Kui uute terminite loomine on vajalik, looge need jälgides
kokkulepitud parimaid praktikaid kasutades.
Avaldage väga stabiilses keskkonnas, mis on püsivana loodud.
Reklaamige RDF skeemi registreerides selle asjakohaste
teenustega.
Slide 9
1
Vaata ka:
https://joinup.ec.europa.eu/community/semic/document/
cookbook-translating-data-models-rdf-schemas
2
3
4
5
6
10. DATASUPPORTOPEN
Alustage valdkonna mudeli arendusega
Slide 10
1
class Domain Model
RegisteredOrganisation
- identifier
- name
- registrationDate
- status
- type
Address
- identifier
- fullAddress
- postcode
ContactPoint
- identifier
- name
- telephone
- email
- fax
- website
Activity
- identifier
- name
Certificate
- identifier
- name
location
organisationCertificate
contactInformation
organisationActivity
11. DATASUPPORTOPEN
Kasutage uuesti juba eksisteerivaid termineid
ja sõnastikke
• Üldised sõnastikud: DCMI, RDFS
• Asjade nimetamiseks: rdfs:label, foaf:name, skos:prefLabel
• Isikute kirjeldamiseks: FOAF, vCard, Core Person Vocabulary
• Projektide kirjeldamiseks: DOAP, ADMS.SW
• Koosvõimevara kirjeldamiseks: ADMS
• Registreeritud organisatsioonide kirjeldamiseks: Registered
Organisation Vocabulary
• Aadressi kirjeldamiseks: vCard, Core Location Vocabulary
• Avalike teenuste kirjeldamiseks: Core Public Service Vocabulary
• Andmekogude kirjeldamiseks: DCAT, DCAT Application Profile,
VoID
Slide 11
2
12. DATASUPPORTOPEN
Rakenduste profiili loomine
• Erinevatel valdkondadel on erinevad nõuded valdkonna spetsiifilistele
tähendustele, näiteks klassifitseerimise põhimõtted.
• Üldised RDF sõnastikud annavad tavaliselt kõige põhilisemad klassid,
mis on vajalikud laienduste lisamiseks, mis võimaldavad lisada spetsiifilisi
alamklassi struktuuri või klassifikatsiooni skeeme.
• Sellistel juhtudel soovitatakse korduvatel kasutajatel defineerida rakenduse
profiile rakenduse domeenile lähedaselt täpsustades (vajadusel)
alamklasse, alamomadusi ja kontrollitud sõnastikke.
• Näiteks,
DCAT Rakenduse profiil andmeportaalide jaoks Euroopas
Registered Organization vocabulary rakenduse profiilina Organization
ontology-le.
Slide 12
Vaata ka:
joinup.ec.europa.eu/asset/dcat_application_profile/home
13. DATASUPPORTOPEN
Taaskasutuse eelised
• Taaskasutus aitab oluliselt kaasa andmete koosvõimele
Kasutades näiteks dcterms:created, siis selle väärtus peaks olema andmed, mis on
esitatud kuupäevana, näiteks 2013-02-21^^xsd:date. Sellisena on andmed koheselt
töödeldavad mitmete masinate jaoks. Kui teie skeem soovitab andmete avaldajatel
kasutada teistsuguseid termineid ja kuupäeva formaate nagu näiteks ex:date "21
February 2013" – vajaksid teie avaldatud andmed täiendavad töötlemist, et muuta
need samasuguseks nagu kõik teised andmed.
• Taaskasutus lisab teie skeemile usaldusväärsust.
See näitab, et see on avaldatud hoolikalt ja professionaalselt ning soosib selle
taaskasutust.
• Taaskasutus in lihtsam ja odavam.
Klasside ja omaduste taaskasutamine hästi defineeritud ning korralikust
sõnastikust aitab ära hoida selle pingutuse uuesti tegemist.
Slide 13
15. DATASUPPORTOPEN
Alamklasside ja alamomaduste loomine
• RDF skeemid ja sõnastikud hõlmavad tihti termineid, mis on
väga üldised.
• Luues alamklasside ja alamomaduste seosed, võivad süsteemid,
mis saavad aru superomadustest ja superklassidest tõlgendada
andmeid isegi kui spetsiifilisemad terminid on tundmatud.
• Ärge looge alamklasse ja alamomadusi lihtsalt selleks, et
kasutada teie oma terminit millekski, mis tegelikult juba
eksisteerib.
Slide 15
3
16. DATASUPPORTOPEN
Alamomaduste loomine – näide
The Registered Organization vocabulary defineerib kolm alamomadust
järgnevalt: companyType, companyStatus and companyActivity.
Slide 16
17. DATASUPPORTOPEN
Alamomaduste defineerimine RDF-is
<rdf:Property rdf:about="rov:companyType">
<rdfs:label xml:lang="en">company type</rdfs:label>
<rdfs:comment xml:lang="en" rdf:parseType="Literal">
This property records the type of company. Familiar types are SA, PLC, LLC,
GmbH etc. Each jurisdiction will have a limited set of recognised company
types and these should be used in a consistent manner using a skos:Concept
as described in the <a href="#skos:Concept">Code</a> Class.
</rdfs:comment>
<rdfs:isDefinedBy rdf:resource="http://www.w3.org/ns/regorg#"/>
<rdfs:range rdf:resource="skos:Concept"/>
<rdfs:subPropertyOf rdf:resource="org:classification" />
<dcterms:identifier>legal:companyType</dcterms:identifier>
</rdf:Property>
Slide 17
18. DATASUPPORTOPEN
Kui uued terminid on vajalikud, looge need
kokkulepitud parimaid praktikaid jälgides
Klassid algavad alati suure tähega ning on alati ainsuses: näiteks
skos:Concept.
Omadused algavad väikese tähega, näiteks rdfs:label.
Objekt-tüüpi omadused peaksid olema tegusõnad, näiteks
org:hasSite.
Andme-tüüpi omadused peaksid olema nimisõnad, näiteks
dcterms:description.
Kasuta uute sõnade alguses suuri tähti kui terminil on rohkem kui
üks sõna (camel case), näiteks foaf:isPrimaryTopicOf.
Slide 18
4
19. DATASUPPORTOPEN
Uue klassi defineerimine - Organisation
<rdf:RDF
xmlns:rdfs=“http://www.w3.org/2000/01/rdf-schema#”
xmlns:org=“htpp://example.org/organisation-schema”>
<rdf:Class rdf:about=“org:Organisation">
<rdfs:label xml:lang="en">Organisation</rdfs:label>
<rdfs:comment xml:lang:”en”>
Legal entity that is registered in an official national or regional
register.
</rdfs:comment>
</rdf:Class>
Slide 19
20. DATASUPPORTOPEN
Uue omaduse defineerimine - registrationNumber
<rdf:RDF
xmlns:rdfs=“http://www.w3.org/2000/01/rdf-schema#”
xmlns:org=“htpp://example.org/organisation-schema”>
<rdf:Property rdf:about=“org:registrationNumber">
<rdfs:label xml:lang="en">registrationNumber</rdfs:label>
<rdfs:comment xml:lang:”en”>
The number that a registered organisation receives upon registration
in the official register.
</rdfs:comment>
</rdf:Class>
Slide 20
21. DATASUPPORTOPEN
Domeeni ja vahemiku piirangute defineerimine
<rdf:RDF
xmlns:rdfs=“http://www.w3.org/2000/01/rdf-schema#”
xmlns:org=“htpp://example.org/organisation-schema”
xmlns:locn=“http://www.w3.org/ns/locn#”>
<rdf:Property rdf:about=“org:isLocated">
<rdfs:label xml:lang="en">isLocated</rdfs:label>
<rdfs:comment xml:lang:”en”>
The official address of the registered organisation’s headquarters.
</rdfs:comment>
<rdfs:domain rdf:resource=“org:Organisation”/>
<rdfs:range rdf:resource=“locn:Address”>
</rdf:Class>
Slide 21
http://example.org/org/1234 org:isLocated http://dbpedia.org/page/Brussels
22. DATASUPPORTOPEN
Avaldage väga stabiilses keskkonnas, mis on püsivana
loodud
• Valige oma RDF skeemi jaoks stabiilne nimi, näiteks (W3C, Purl...)
• Kasutage parimaid praktikaid püsivate Uniform Resource Identifiers
(URI) komplektide loomiseks, nii vormingu kui ka disaini ja halduse
mõttes.
• Examples:
http://www.w3.org/ns/adms
http://purl.org/dc/elements/1.1
Slide 22
5
Vaata ka:
https://joinup.ec.europa.eu/community/semic/document/cookbook-translating-
data-models-rdf-schemas
http://www.slideshare.net/OpenDataSupport/design-and-manage-persitent-uris
23. DATASUPPORTOPEN
Reklaamige RDF skeemi registreerides selle
asjakohaste teenustega.
Kui su RDF skeem on avalikustatud, siis on vajalik, et võimalikult palju inimesi
selle kohta teaksid. Suurema vaatajaskonna saavutamiseks registreerige see
Joinup-is ja Linked Open Vocabularies.
Slide 23
6
Refine the search results via the
faceted search filters.
2
1
3
http://joinup.ec.europa.eu
http://lov.okfn.org
24. DATASUPPORTOPEN
Kokkuvõte
Slide 24
Alustage domeeni mudeli arendusega jälgides struktureeritud protsessi
ja metodoloogiat.
Analüüsige olemasolevaid termineid ja nende kasutamist, et
maksimeerida nende taaskasutamine.
Kui uusi termineid on võimalik vaadelda olemasolevate terminite
täpsustustena, looge alamklassid ja alamomadused.
Kui uute terminite loomine on vajalik, looge need jälgides kokkulepitud
parimaid praktikaid kasutades.
Avaldage väga stabiilses keskkonnas, mis on püsivana loodud.
Reklaamige RDF skeemi registreerides selle asjakohaste teenustega.
Analüüsi
Modelleeri
Avalda
25. DATASUPPORTOPEN
Grupiharjutus ja diskussioon
Slide 25
Moodustage kahestes gruppides RDF-i sõnastiku kirjeldus,
mis esindab elanikku.
Mis on teie arvates peamised barjäärid, mis takistavad
olemasolevat RDF sõnastiku taaskasutamist?
http://www.visualpharm.com
http://www.visualpharm.com
Internetiküsitluse leiad siit!
27. DATASUPPORTOPEN
Viited
Slaid 9:
• Linked Data Cookbook. W3C.
http://www.w3.org/2011/gld/wiki/Linked_Data_Cookbook
Slaidid 10-23:
• ISA Programme. Cookbook for translating Data Models to RDF Schemas.
https://joinup.ec.europa.eu/community/semic/document/cookbook-translating-
data-models-rdf-schemas
Slaidid 16, 18,-21:
• W3C. An organization ontology. http://www.w3.org/TR/vocab-org/
Slaid 23:
• ADMS Brochure. ISA Programme.
https://joinup.ec.europa.eu/elibrary/document/adms-brochure
Slide 27
28. DATASUPPORTOPEN
Täiendavat lugemist
Linked Data Cookbook, W3C Government Linked Data Working
Group,
http://www.w3.org/2011/gld/wiki/Linked_Data_Cookbook
EC, ISA Process and methodology for developing semantic
agreements,
https://joinup.ec.europa.eu/community/core_vocabularies/documen
t/process-and-methodology-developing-semantic-agreements
EC ISA, Cookbook for translating Data Models to RDF Schemas
https://joinup.ec.europa.eu/community/semic/document/cookbook-
translating-data-models-rdf-schemas
Slide 28
29. DATASUPPORTOPEN
Seotud projektid ja algatused
Joinup, http://joinup.ec.europa.eu
Linked Open Vocabularies (LOV), http://lov.okfn.org/
EC ISA, e-Government Core Vocabularies,
https://joinup.ec.europa.eu/community/core_vocabularies/home
W3C Schools – Learn RDF
http://www.w3schools.com/rdf/default.asp
EUCLID, http://euclid-project.eu/
XML Summer School http://xmlsummerschool.com/
Slide 29
30. DATASUPPORTOPEN
Ole osa meie meeskonnast...
Leia meid
Kontakt
Liitu meiega
Jälgi meid
Open Data Support
http://www.slideshare.net/OpenDataSupport
http://www.opendatasupport.euOpen Data Support
http://goo.gl/y9ZZI
@OpenDataSupport contact@opendatasupport.eu
Slide 30