Presentatie over het publiceren van overheidsdata als linked data. Met nadruk op hoe context-afhankelijkheid hierbij gerespecteerd kan blijven.
Gehouden voor een groep mensen van (Bureau) Forum Standaardisatie, Novay, ICTU/eOverheid voor burgers, Information Dynamics en de Vrije Universiteit
NL: Op het Emerce Travel event 2010 sprak ik over de toekomst van search. Hoe de zoekmachines veranderen naar universal search en hoe ze proberen de user intent te pakken te krijgen. Ook ga ik in op hoe je daarmee om moet gaan.
EN: At the Emerce Travel Event 2010 I spoke about the future of search (in Dutch). I talked about Universal Search, how search engines are trying to grab the user intent and how you should handle that.
The basics of semantic search, more than just adding synonyms to a search que...Filip de Geijter
semantic search is more than what people usually think it is : more than just adding synonyms as most of the vendors do. It is about understanding of the context, the content of the text. This explains why it is now becoming important for HR applications.
Strategies in Semantic Marketing in the Online Travel and Tourism IndustryLars Göhler
Presentation on the ITB 2015 on semantic technologies of the travel and tourism industry Find more information at http://www.travel-semantics.com
about IP Sharemedia at: http://www.ip-sharemedia.de
about Quality Management in Travel and tourism: http://quality-in-travel.com
Travel semantics: Use of semantic technologies in online travel and tourism i...Lars Göhler
Semanic technologies are used increasingly in online tourism and travel industry. The presentation held at the ITB Berlin at the 6th of March illustrates some semantic technologies and gives information on their status and perspectives. Main application fields in semantics is management of big data, search engine optimization (seo), advertising, internal search technology, mobile applications and destination management. More on travel semantics: www.travel-semantics.com
The majority of today's business and leisure travel is booked online. The post-booking experience typically leaves travelers with the predicament of gathering together important trip data (flight numbers, hotel address, rental car confirmation number, frequent travel program identification, check-in time, etc.) that is dispersed throughout several booking confirmation emails. Join Andy Denmark, VP of Engineering at TripIt and explore how semantic technology has transformed this unstructured data into a structured travel itinerary and revolutionized the post-booking travel experience. Additional discussion will examine semantic technology and the future of travel, with a focus on the implications for individual travelers and corporate travel programs.
NL: Op het Emerce Travel event 2010 sprak ik over de toekomst van search. Hoe de zoekmachines veranderen naar universal search en hoe ze proberen de user intent te pakken te krijgen. Ook ga ik in op hoe je daarmee om moet gaan.
EN: At the Emerce Travel Event 2010 I spoke about the future of search (in Dutch). I talked about Universal Search, how search engines are trying to grab the user intent and how you should handle that.
The basics of semantic search, more than just adding synonyms to a search que...Filip de Geijter
semantic search is more than what people usually think it is : more than just adding synonyms as most of the vendors do. It is about understanding of the context, the content of the text. This explains why it is now becoming important for HR applications.
Strategies in Semantic Marketing in the Online Travel and Tourism IndustryLars Göhler
Presentation on the ITB 2015 on semantic technologies of the travel and tourism industry Find more information at http://www.travel-semantics.com
about IP Sharemedia at: http://www.ip-sharemedia.de
about Quality Management in Travel and tourism: http://quality-in-travel.com
Travel semantics: Use of semantic technologies in online travel and tourism i...Lars Göhler
Semanic technologies are used increasingly in online tourism and travel industry. The presentation held at the ITB Berlin at the 6th of March illustrates some semantic technologies and gives information on their status and perspectives. Main application fields in semantics is management of big data, search engine optimization (seo), advertising, internal search technology, mobile applications and destination management. More on travel semantics: www.travel-semantics.com
The majority of today's business and leisure travel is booked online. The post-booking experience typically leaves travelers with the predicament of gathering together important trip data (flight numbers, hotel address, rental car confirmation number, frequent travel program identification, check-in time, etc.) that is dispersed throughout several booking confirmation emails. Join Andy Denmark, VP of Engineering at TripIt and explore how semantic technology has transformed this unstructured data into a structured travel itinerary and revolutionized the post-booking travel experience. Additional discussion will examine semantic technology and the future of travel, with a focus on the implications for individual travelers and corporate travel programs.
Ruben Verborgh - Creëren, aanbieden en gebruiken van Connected Data (CC BY-SA...CLICKNL
Presentatie door Ruben Verborgh tijdens het Connected Data Event op 2 december 2014 te Amsterdam. Deze presentatie valt onder de Creative Commons Attribution-ShareAlike 4.0 International licentie (http://creativecommons.org/licenses/by-sa/4.0/).
This PLDN presentation (in Dutch) gives an introduction on the main concepts of Linked Data and of the activities of the open network community Platform Linked Data Netherlands (PLDN). This presentation was used during the Jaarcongres ECP on November 14th at the Fokker Terminal in The Hague at the PLDN information booth.
OSLO | Aan de slag met semantische standaardenRaf Buyle
De Vlaamse overheid zet in op een eenduidige standaard OSLO² voor de uitwisseling van informatie. Via Open Standaarden wisselen overheden en dienstenleveranciers kerninformatie uit tussen de verschillende toepassingen en overstijgen ze de huidige verkokering. Deze sessie geeft een overzicht van hoe de semantiek van OSLO² kernobjecten op de verschillende niveaus gedocumenteerd is en hoe je hiermee aan de slag gaat in je projecten. Vervolgens tonen we stap voor stap hoe je de semantische standaarden integreert in je webservices. Hierbij maken we gebruik van de principes van Linked Data in JSON-services.
Om de intentie achter een zoekopdracht beter te begrijpen hebben zoekmachines context nodig om relevante resultaten te presenteren. Koen behandelt hoe u met behulp van structured data van ‘keywords’ naar ‘entiteiten’ gaat. Op die manier kan een zoekmachine de relevantie van uw content beter doorgronden en waarderen als het beste antwoord voor haar gebruikers.
Tijdens deze sessie neemt Koen u mee hoe u met verschillende methoden en technieken structured data optimaal en op schaal kunt implementeren en de rol van structured data bij semantic SEO, Google Discover en de Google Assistant.
Presentatie van Wout Hofman en John Oldenhuizing over het artikel "ontsluiting van overheidsinformatie" in Informatie, mei 2006. Gegeven voor Advies Overheid.nl, 14 november 2006.
Knowledge Graphs: Concept, mogelijkheden en aandachtspuntenChristophe Debruyne
Kennis en informatie in een bedrijfsorganisatorische context zijn doorgaans versnipperd en verspreid over databases, rekenbladen, documenten, etc. Daarnaast bezitten kenniswerkers ook domeinexpertise die niet in een systeem wordt opgeslagen. Maar wat als men die kennis en informatie wenst te integreren om, bijvoorbeeld, processen te automatiseren of nieuwe inzichten te verwerven?
Knowledge graphs bieden hiervoor een oplossing. In deze presentatie werpt Christophe Debruyne zijn licht op het concept van de knowledge graphs en hun mogelijkheden. Hij behandelt daarvoor de volgende punten:
Wat is een knowledge graph?
Knowledge graphs versus andere initiatieven
Knowledge graphs versus andere AI technieken
Toepassingsgebied van knowledge graphs
Bouwen en onderhouden van een knowledge graph
SAI.be avondseminarie van 16-11-2021
Managing Metadata for Science and Technology Studies: the RISIS caseRinke Hoekstra
Presentation of our paper at the WHISE workshop at ESWC 2016 on requirements for metadata over non-public datasets for the science & technology studies field.
More Related Content
Similar to Publicatie van Linked Open Overheids Data
Ruben Verborgh - Creëren, aanbieden en gebruiken van Connected Data (CC BY-SA...CLICKNL
Presentatie door Ruben Verborgh tijdens het Connected Data Event op 2 december 2014 te Amsterdam. Deze presentatie valt onder de Creative Commons Attribution-ShareAlike 4.0 International licentie (http://creativecommons.org/licenses/by-sa/4.0/).
This PLDN presentation (in Dutch) gives an introduction on the main concepts of Linked Data and of the activities of the open network community Platform Linked Data Netherlands (PLDN). This presentation was used during the Jaarcongres ECP on November 14th at the Fokker Terminal in The Hague at the PLDN information booth.
OSLO | Aan de slag met semantische standaardenRaf Buyle
De Vlaamse overheid zet in op een eenduidige standaard OSLO² voor de uitwisseling van informatie. Via Open Standaarden wisselen overheden en dienstenleveranciers kerninformatie uit tussen de verschillende toepassingen en overstijgen ze de huidige verkokering. Deze sessie geeft een overzicht van hoe de semantiek van OSLO² kernobjecten op de verschillende niveaus gedocumenteerd is en hoe je hiermee aan de slag gaat in je projecten. Vervolgens tonen we stap voor stap hoe je de semantische standaarden integreert in je webservices. Hierbij maken we gebruik van de principes van Linked Data in JSON-services.
Om de intentie achter een zoekopdracht beter te begrijpen hebben zoekmachines context nodig om relevante resultaten te presenteren. Koen behandelt hoe u met behulp van structured data van ‘keywords’ naar ‘entiteiten’ gaat. Op die manier kan een zoekmachine de relevantie van uw content beter doorgronden en waarderen als het beste antwoord voor haar gebruikers.
Tijdens deze sessie neemt Koen u mee hoe u met verschillende methoden en technieken structured data optimaal en op schaal kunt implementeren en de rol van structured data bij semantic SEO, Google Discover en de Google Assistant.
Presentatie van Wout Hofman en John Oldenhuizing over het artikel "ontsluiting van overheidsinformatie" in Informatie, mei 2006. Gegeven voor Advies Overheid.nl, 14 november 2006.
Knowledge Graphs: Concept, mogelijkheden en aandachtspuntenChristophe Debruyne
Kennis en informatie in een bedrijfsorganisatorische context zijn doorgaans versnipperd en verspreid over databases, rekenbladen, documenten, etc. Daarnaast bezitten kenniswerkers ook domeinexpertise die niet in een systeem wordt opgeslagen. Maar wat als men die kennis en informatie wenst te integreren om, bijvoorbeeld, processen te automatiseren of nieuwe inzichten te verwerven?
Knowledge graphs bieden hiervoor een oplossing. In deze presentatie werpt Christophe Debruyne zijn licht op het concept van de knowledge graphs en hun mogelijkheden. Hij behandelt daarvoor de volgende punten:
Wat is een knowledge graph?
Knowledge graphs versus andere initiatieven
Knowledge graphs versus andere AI technieken
Toepassingsgebied van knowledge graphs
Bouwen en onderhouden van een knowledge graph
SAI.be avondseminarie van 16-11-2021
Managing Metadata for Science and Technology Studies: the RISIS caseRinke Hoekstra
Presentation of our paper at the WHISE workshop at ESWC 2016 on requirements for metadata over non-public datasets for the science & technology studies field.
Prov-O-Viz is a visualisation service for provenance graphs expressed using the W3C PROV vocabulary. It uses the Sankey-style visualisation from D3js.
See http://provoviz.org
Linkitup: Link Discovery for Research DataRinke Hoekstra
Linkitup is a Web-based dashboard for enrichment of research output published via industry grade data repository services. It takes metadata entered through Figshare.com and tries to find equivalent terms, categories, persons or entities on the Linked Data cloud and several Web 2.0 services. It extracts references from publications, and tries to find the corresponding Digital Object Identifier (DOI). Linkitup feeds the enriched metadata back as links to the original article in the repository, but also builds a RDF representation of the metadata that can be downloaded separately, or published as research output in its own right. In this paper, we compare Linkitup to the standard workflow of publishing linked data, and show that it significantly lowers the threshold for publishing linked research data.
A Network Analysis of Dutch Regulations - Using the Metalex Document ServerRinke Hoekstra
In this paper we explore the possibilities of using the Linked Data representation of all Dutch regulations stored in the MetaLex Doc- ument Server for the purposes of network analysis over the citation graph between regulations, both at the document level, and at the article level. We show that this is possible using relatively straightforward SPARQL queries, and present preliminary results of the analysis.
A Network Analysis of Dutch Regulations. Rinke Hoekstra. figshare.
http://dx.doi.org/10.6084/m9.figshare.689880
Retrieved 11:12, Oct 07, 2013 (GMT)
This presentation describes the use by Data2Semantics (http://www.data2semantics.org) of the VIVO portal (http://vivoweb.org) for interlinking researchers contributing to projects within the COMMIT programme (http://www.commit-nl.nl).
The Data2Semantics project (COMMIT P23) is all about enriching research data, and making it more reusable for future research. Using Linked Data for this task is a fairly obvious step to make (surprise!). However, there are several shortcomings the current practices in publishing Linked Data, that calls for a slightly
different approach which (hopefully) bridges a gap between Web 2.0 and Web 3.0. I will present a proof-of-concept service (Linkitup) that works on top of existing scientific data repositories, and allows individual researchers to enrich their data with additional (linked) metadata.
Talk about the use of Linked Data in historical research on census data. Has some slides about TabLInker as well (http://github.com/Data2Semantics/TabLinker). Part of the data2semantics project (http://data2semantics.org)
Presentatie voor de Belastingdienst in het kader van een onderzoek naar de (on)mogelijkheden rond het herkennen en extraheren van concepten en hun definities, en het representeren daarvan met Semantic Web standaarden.
1. Publicatie van Linked Open Overheidsdata Rinke Hoekstra Semantic Web Rubik's Cube by dullhunk at flickr under a cc-license. Thanks!
2. Vragen Wat is linked data, en hoe ziet het eruit? Wat heeft de overheid eraan? Op welke manier kan het ontsloten worden? Wat zijn openstaande problemen?
3. De Semantic Web Ideologie Identiteit is het allerbelangrijkst Gedeeltelijkeoplossingenzijnprachtig Layer cake 8/26/10 3
4. Linked Data/Semantic Web Identificatie Uniform Resource Identifier (URI) Globale identifier (NB: persistent!) Heeft de syntactische verschijningsvorm van een URL Vaak: Internationalized Resource Identifier (IRI) Beschrijving Resource DescriptionFramework (RDF) RDF Schema (RDFS) SimpleKnowledgeOrganization System (SKOS) Web OntologyLanguage (OWL) Bevragen RDF Triple stores SPARQL Query Language
5. Hoe ziet RDF eruit? Datamodel is een (directed) graph Elk data-item is een ‘resource’ met een URI als identifier Elke eigenschap is een binaire relatie: ‘triple’ Tussen resources: <subjectURI, predicateURI, objectURI> Tussen een resource en een ‘literal’ <subjectURI, predicateURI, “literalvalue”>
8. Waarom linkeddata? Globaal unieke identifiers Hergebruik van identifiers in andere datasets Op datum niveau(bijv. twee bronnen die iets over ‘Groningen’ zeggen) Op schema niveau(bijv. twee bronnen die elk het zelfde begrip ‘Stad’ gebruiken) In feite dus ‘linked data sets’
11. In 2010? New York Times subject catalog Data.gov.uk Linked Life Data (4 miljard triples) FreeBase is gekocht door Google FaceBook publiceert Open Graph protocol ...
12. Wat heeft de overheid eraan? Uniforme representatietaal voor zowel: Schema informatie (begrippen), als Gegevens (data) Gedistribueerd Wederom zowel schema als gegevens De moeite waard? Bevordert transparantie, herbruikbaarheid etc. Maakt hergebruik zichtbaar (bijv. HTTP requests)
13. Ontsluiten Overheidsdata Laagdrempelig Transparant Herbruikbaar Multi-channel Dezelfde content op verschillende manieren aanbieden Geïntegreerd Ruwe data en begeleidende tekst
14. Tim Berners-Lee: 5-sterren plan ★ Stel informatie beschikbaar op het Web ★★ Stel het beschikbaar als gestructureerde data(bijv. als Excel sheet ipv. een plaatje) ★★★ Gebruik een open formaat(bijv. CSV ipv. Excel) ★★★★ Gebruik een linked-data formaat(URI’s als id, en RDF als formaat) ★★★★★ Verbind je data aan dat van anderen (geef context) Bron: http://inkdroid.org/journal/2010/06/04/the-5-stars-of-open-linked-data/
15. Over de helewereld… Bron: o.a.http://www.slideshare.net/cygri/the-state-of-linked-government-data 15 of XYZ
16. Verenigde Staten Data.gov Nationaleruwe data en geodatacatalogi Data-gov Wiki project bij RPI “Triplifying” tabulaire datasets van Data.gov Generieke services op RDF data Wiki voor het vergaren van meerinformatie over de datasets Demos Data.govverwijstnaarRPI’s RDF (2010) Bron: o.a.http://www.slideshare.net/cygri/the-state-of-linked-government-data
18. VerenigdKoninkrijk Grote hoeveelheidruwe datasets op data.gov.uk Selectieals five-star Linked Data Basis gelegdvoorkwalitatiefgoede Linked Data representatie URI sets Vocabulaires Best Practices Opensourcecatalogus (CKAN) Bron: o.a.http://www.slideshare.net/cygri/the-state-of-linked-government-data
19. Stap: Catalogus Doorzoekbare catalogus van datasets Catalogus verwijst: naar website waar data oorspronkelijk gepubliceerd is, of naar data als bestand Eenvoudig voortborduren op Open Data http://data.overheid.nl (?) http://nl.ckan.net (grassroots) Relatief ‘standaard’ als oplossing ... afgezien van organisatorische problematiek Weinig ‘semantic web’ Slechts downloadbare bestanden Fulltext zoeken, geen ‘echte’ queries Geen integratie met ander materiaal
20. Stap: URI dereferencing Wat is het? “URI als URL” Meest eenvoudige API Een HTTP request op het URI geeft ofwel: Een RDF dump van de resource met het URI, ofwel Een HTML pagina met een beschrijving van de resource Twee mogelijkheden: Afhankelijk van de ‘agent’ (Content negotiation) Extra informatie in de URL
23. SPARQL output <http://linkeddata.few.vu.nl/rechtspraak/uitspraak/BJ3703> a rnl:Uitspraak;rnlrdf:datum_gepubliceerd "24-07-2009"; rnlrdf:datum_uitspraak "22-07-2009"; rnlrdf:indicatie "Eiser wordt verondersteld de verwekker van gedaagde (nu 41 jaar oud) te zijn. Eiser vordert veroordeling van gedaagde tot medewerking aan DNA-onderzoek, ter verkrijging van zekerheid. De rechtbank wijst de vordering niet reeds af omdat de inzet daarvan louter emotioneel is. De rechtbank merkt het recht om te weten of een ander zijn kind is aan als een persoonlijkheidsrecht. Dit recht wordt afgewogen tegen het belang van gedaagde om de kwestie als afgedaan te beschouwen en vrede te hebben met wat zij weet. De vordering wordt afgewezen."; rnlrdf:instantie rnlrdf:Rechtbank_Groningen; rnlrdf:ljn "BJ3703"; rnlrdf:procedure_soort rnlrdf:Eerste_aanleg_-_enkelvoudig; rnlrdf:rechtsgebied_rechtspraak rnlrdf:Handelszaak; rnlrdf:status rnlrdf:gepubliceerd; rnlrdf:zaaknummers "107402 / HA ZA 09-89"; metalex:src "http://www.rechtspraak.nl/ljn.asp?ljn=BJ3703" .
24.
25.
26. Stap: SPARQL Endpoint RESTful service SPARQL queriesgeencodeerd in request URL Normaal gesproken read-only Zeer veel vrijheidsgraden om data uit te vragen SPARQL query language SELECT, DELETE, UPDATE Elke RDF triple store ondersteunt SPARQL Virtuoso, 4Store, OpenRDFSesame, AllegroGraph Nadeel: vereist infrastructuur
27. Stap: RDFa/GRDDL RDFa: RDF annotations Metadata in HTML pagina’s Manier om RDF triples te ‘verstoppen’ in HTML Zichtbaar voor Google en Yahoo crawlers Voordeel: Maakt client-side RDF applicaties mogelijk Niet alle data hoeft in RDF te zijn(bijv. copyright/licensenotice) Kan RDF produceren uit standaard databases ... en dus ontlastend voor de server GRDDL: Gleaning Resource DescriptionsfromDialects of Languages Verwijzing naar transformatie service (bijv. XSLT)
30. Reality check “Triplification” zelf is nietaltijdnuttig Linked Data gaat over syntax, data model, access, maar lost nietautomatisch de lastigeproblemen op standaardclassificatiesysteem; identifier management; data provenance; versiebeheer; context; data discovery “LD removes some technical issues, giving us a better shot at solving the organizational/political ones” (Richard Cyganiak, DERI) Bron: o.a.http://www.slideshare.net/cygri/the-state-of-linked-government-data
32. Openstaande Problemen (NB: “probleem” = nog geen standaard oplossing) Provenance Herkomstinformatie van gegevens Probleem: Individuele RDF triples zijn lastig adresseerbaar Geen standaard vocabulair voor uitdrukken provenance Context Lijkt op provenance, maar geeft interpretatie Waarom een probleem? Het negeren van context leidt tot het op een hoop gooien van mogelijk conflicterende gegevens Versiebeheer & Onderhoud
33. Context als Namespace De eigenaar van het domein van de URI wordt geacht deze te onderhouden Nadeel: Namespaces zijn geheel transparant voor clients Domein/eigenaar alleen te achterhalen door URI parsing, dereferencing, of whoislookup
34. Context in SKOS SKOS: SimpleKnowledgeOrganization System Lichtgewicht taal voor uitdrukken van taxonomische informatie omtrent begrippen skos:Concept skos:broader, skos:narrower, skos:related Elk skos:Concept is gerelateerd aan een skos:ConceptScheme Eenvoudige 1:1 mapping relaties mogelijk tussen concepten uit verschillende schemes Uitgebreidere mappings mogelijk dmv gebruik OWL 2 Eenvoudig en vaak voldoende Lang niet alle Linked Data is uitdrukbaar in SKOS
35. Mapping in SKOS 24 October 2009 Rinke Hoekstra - OWLED 2009 35
36.
37. Mappings as OWL Classes A mapping class: Classifies resources annotated using one vocabulary, and Infers annotations using the other vocabulary … it may be directed 24 October 2009 Rinke Hoekstra - OWLED 2009 37
39. Context als NamedGraph RDF Triple stores zijn eigenlijk Quad stores: <subjectURI, predicateURI, objectURI, graphURI> Hergebruik URI’s van grafen in andere triples: <graphURI, dc:creator, “Rinke Hoekstra”, ...> SPARQL ondersteunt queries op grafen, dus: Provenance kan worden achterhaald Context kan expliciet worden gemaakt Maar: Pragmatische oplossing Nog steeds inconsistenties mogelijk Er is nog geen officiële syntax voor
40. The Construction of Social Reality Searle (1995): Institutional Facts Intentional categories are social constructs, they are subjective, relative to an observer, and they are attributed to brute facts. Brute facts are independent of human agreement Constitutive and regulative rules: X counts as Y in context C
41. Searle’s Rules Constitutive rule Why is counts-as not subsumption? Counts-as is relative to a context Counts-as does not permit substitution, and limits inheritance: Counts-as can connect anti-rigid with rigid classes Bills issued by the Bureau of Engraving and Printing (X) count as money (Y) in the United States (C) Money (Y) is the root of all evil
42. Standard Practice Duality of roles is a well known problem Role as class: “Person plays Student” Distinct classes for role and role player But, rather verbose Role as relation: “Person student_at University” Avoid tautology in definition of the role But, no way to incorporate contextual information Problem: cannot have both at the same time Student equivalentClassstudent_atsome University
43. In short Focus either on relation or class oriented representation Observations Reification makes knowledge about a relation explicit e.g. the context of a role, the thematic roles of an action ... but comes at the cost of the relation itself, and and is rather verbose Question: can’t we have both?
44. Yes, we can Infer the relation from a reification ... instead of the reification from the relation Example: definition of ‘student’ A person (X) counts as a student (Y) if enrolled at some university (C)
45. Subjective Entity and Social Role A subjective entity is defined using counts-as Social roles are subjective entities
47. Example: Propositional Attitudes A propositional attitude is anything held towards some proposition: “Mary believes that John killed Suzan” “Mary holds a belief towards the proposition ‘John killed Suzan’” “‘John killed Suzan’ counts as a belief in the context of Mary”
49. Versiebeheer Eenvoudige oplossing: Voor elke versie een nieuwe graaf Nadeel: Applicaties kunnen afhankelijk zijn van oude versie(bijv. URI dereferencing) Twee URI’s per resource: ‘latestversion’ URI URI met versie-datum erin verwerkt Probleem: versies zijn niet altijd zo eenvoudig