Triply omgeving presentatie UBU.pptx

•Download as PPTX, PDF•

0 likes•5 views

Ruben Schalk

Korte presentatie over linked data en de Triply omgeving

Data & Analytics

December 2021
Ruben Schalk
Linked(Open)Data enTriply
M&A
30-05-2022

“Ik zoek alle informatie over Rembrandt, zoals schilderijen,
boeken en archiefstukken”
Huidige situatie: versnippering

Silo’s...
Collectiebeheer-
systeem
Website
Mauritshuis
Collectiebeheer-
systeem
Website
Stadsarchief
Collectiebeheer-
systeem
Website
WorldCat / TiU-
bibliotheek
“Geef alle informatie over Rembrandt”

“Linked data is een digitale methode
voor het publiceren van gestructureerde gegevens,
zodanig dat deze beschikbaar [en interoperabel]
gemaakt
kunnen worden op het internet en daardoor ook beter
bruikbaar zijn.”
(Wikipedia)
Oplossing: Linked (Open) Data

● gestructureerde gegevens
● publiceren op internet
● beter bruikbaar
● koppelen van gegevens
● semantisch zoeken
● automatisch te interpreteren door computers
Op een rijtje:

subject → predicaat → object
Manier van meningsvol verbinden van data
zodat ook computer het begrijpt
Bouwsteen van LOD: triple

Voorbeeld van triple
Rembrandt
gaat over

Triples
Subject Predicaat Object
Boek Heeft titel Lofrede op Rembrandt
Boek Geschreven door Johannes Immerzeel jr
Boek Gaat over Rembrandt
Boek Publicatiejaar 1852
Archiefstuk Betreft Rembrandt Harmensz. van Rijn
Archiefstuk Betreft Saskia van Uylenburgh

Johannes
Immmerze
el jr
Weddep
ohl
1852
Lofrede op
Rembrandt

DCMI Metadata Terms (dcterms)
EBUCore
Bibliographic Ontology (BIBO)
Schema.org
Metadata-
standaarden
Europeana Data Model (EDM)
CIDOC-CRM
Metadatastandaarden voor verbinden van gegevens
Records in Contexts (RiCO)
RDA

Terminologie-
bronnen
gestructureerde,
gecontroleerde termen,
bv. thesauri, trefwoordenlijsten
Terminologiebronnen
Data beschrijven a.d.h.v. gecontroleerde termen

Bijvoorbeeld:
● thesaurus
● geautoriseerde lijst van personen
● geautoriseerde lijst van plaatsen of organisaties
● gecontroleerde begrippenlijst
Terminologiebronnen:

UBU
KB
Rijksmuseum
Wikidata
Via SPARQL queries/ API calls
Moeten we dat allemaal beheersen? NEE!
Begrip ervan is wel nuttig
Zie bijvoorbeeld de Wikidata query editor:
https://query.wikidata.org/querybuilder/?use
lang=nl

Publiceren van LOD
Collectiebeheer-
systeem
Collectiebeheer-
systeem
Collectiebeheer-
systeem
LOD
LOD LOD
Collectiebeheer-
systeem
Collectiebeheer-
systeem
LOD
LOD
UBU Rijksmuseum KB etc.

Collectiebeheer-
systeem
LOD
Collectiebeheer-
systeem
Collectiebeheer-
systeem
LOD
LOD
Online beschikbaar maken met TRIPLESTORE van

Triplestore: Landing page voor instelling
Gebruikers die toegang hebben tot de
LOD collectie
Alle LOD datasets van deze instelling.
Kunnen zowel collecties als research
data zijn
Snel toegang tot LOD datasets,
opgeslagen SPARQL queries van alle
gebruikers en data stories
Naam van de instelling (in
ons geval dus UBU o.i.d.)

Browser: live LOD data bekijken en
‘doorklikken’: ‘Creator’ brengt je bij
VIAF, UuLink brengt je bij dit item in
onze collectie, etc.
Mogelijkheid om
LOD te bevragen,
analyseren en te
verbinden aan
andere LOD
LOD graphs die in
deze dataset zijn
opgenomen
Bijlagen bij de
LOD, zoals
conversiebestand,
csv van originele
dataset etc.
LOD dataset pagina: toegang tot triples
Instellingen van dataset, zoals
toegangsrechten

Zelf aan de slag
https://uu.triply.cc/ubu/-/overview
Queries:
https://uu.triply.cc/ubu/-/queries

Presentatie gegeven op het KNVI Congres op 9 november 2017 in Nieuwegein. Na een korte intro over Linked Data wordt inzichtelijk gemaakt hoe de Koninklijke Bibliotheek met partners werkt aan het beter verbinden van de digitale informatie die in steeds grotere hoeveelheid beschikbaar komt in de domeinen van bibliotheek, erfgoed en wetenschap. Linked Data technologie speelt hier een belangrijke rol in.

20190611 contactdag erfgoeddatabanken_hergebruik_wikimediaplatformen

PACKED vzw

Contactdag erfgoeddatabanken hergebruik wikimediaplatformen

meemoo, Vlaams instituut voor het archief

Inhoudelijke ontsluiting in het perspectie van zoeken.bibiotheek.be

Rosemie Callewaert

Calis Koen

Vlaamse Vereniging voor Bibliotheek, Archief & Documentatie vzw (VVBAD)

Een semantisch Web voor archieven:bouw bruggen, geen muren

Jacco van Ossenbruggen

Webarchief & Wetenschap (Dutch)

TimelessFuture

In bibliotheken, archieven en musea is een goede registratie van de collectie een absolute voorwaarde voor professioneel collectiebeheer en ontsluiting van de collectie voor het publiek. Maar hoe zorgt u ervoor dat deze registratie efficiënt wordt gepland en uitgevoerd? En welke metadatastandaarden moet u respecteren om vindbaarheid en uitwisselbaarheid te optimaliseren? En welke hulpmiddelen zijn hiervoor beschikbaar? Tijdens deze introductie worden de CEST-richtlijnen voor het beschrijven van erfgoedcollecties nader toegelicht.

Museums & Wikidata - studiedag Rubenianum

PACKED vzw

Open data = duurzame data?

Judith van Gent

Workshop Knowledge Graphs- VOGIN-IP lezing 2022

Joyce van Aalten

Trends, ervaringen en infrastructuur bij de uitbouw van zoeken ontdekomgevi...

Bibnet vzw

Trends en ervaringen zoekomgeving bibliotheekcollecties in Vlaanderen

Rosemie Callewaert

Zoeken.bibliotheek.be verzamelt data en metadata van bibliotheekcollecties in Vlaanderen. Deze gegevensverzameling wordt met indexeer- en mashuptechnieken herordend waardoor ze op hun beurt terug als bron kunnen dienen voor de lokale en provinciale catalogi van Openbare Bibliotheken in Vlaanderen. Om de fysieke en digitale collecties ook buiten de bibliotheekmuren en los van de cataloguszoekinterface te etaleren waar het publiek aanwezig is, wordt gezocht en geëxperimenteerd met nieuwe manieren om bibliotheekcollecties meer zichtbaar te maken op het internet.

Grote hoeveelheden tekst analyseren als data

voginip

ArchiefWiki en de eerste stappen op het semantische web

Tom Cobbaert

Be LinkedRosemie Callewaert

Zoeken in collecties van Openbare BibliothekenRosemie Callewaert

Similar to Triply omgeving presentatie UBU.pptx

Bibliotheekcatalogus & -standaarden bekeken door het web

Bibnet vzw

Bibliotheekstandaarden bekeken door het webRosemie Callewaert

Haalbaarheidsstudie MMLAB en MICTFARO

NDE Termennetwerk

voginip

20190207_collectieontsluiting op_wikimedia_platformen

PACKED vzw

Bibliotheek 2.0

Moqub M

Slavernij Linked Open Data

Roland Cornelissen

Bibliotheekvoorzieningen voor slavisten_2006Geramé Wouters

Slimmer werken met metadata COPE 25 mei 2016

Enno Meijers

Geert-Jan Koot; De catalogus in het perspectief van de kunstbibliografieVlaamse Vereniging voor Bibliotheek, Archief & Documentatie vzw (VVBAD)

Module 2 | CEST-richtlijnen voor beheerders van digitale collecties | Registr...

PACKED vzw

Museums & Wikidata - studiedag Rubenianum

PACKED vzw

Open data = duurzame data?

Judith van Gent

Workshop Knowledge Graphs- VOGIN-IP lezing 2022

Joyce van Aalten

Trends, ervaringen en infrastructuur bij de uitbouw van zoeken ontdekomgevi...

Bibnet vzw

Trends en ervaringen zoekomgeving bibliotheekcollecties in Vlaanderen

Rosemie Callewaert

Grote hoeveelheden tekst analyseren als data

voginip

ArchiefWiki en de eerste stappen op het semantische web

Tom Cobbaert

Be LinkedRosemie Callewaert

Zoeken in collecties van Openbare BibliothekenRosemie Callewaert

Similar to Triply omgeving presentatie UBU.pptx (20)

Bibliotheekcatalogus & -standaarden bekeken door het web

Bibliotheekstandaarden bekeken door het web

Haalbaarheidsstudie MMLAB en MICT

NDE Termennetwerk

20190207_collectieontsluiting op_wikimedia_platformen

Bibliotheek 2.0

Slavernij Linked Open Data

Bibliotheekvoorzieningen voor slavisten_2006

Slimmer werken met metadata COPE 25 mei 2016

Geert-Jan Koot; De catalogus in het perspectief van de kunstbibliografie

Module 2 | CEST-richtlijnen voor beheerders van digitale collecties | Registr...

Museums & Wikidata - studiedag Rubenianum

Open data = duurzame data?

Workshop Knowledge Graphs- VOGIN-IP lezing 2022

Trends, ervaringen en infrastructuur bij de uitbouw van zoeken ontdekomgevi...

Trends en ervaringen zoekomgeving bibliotheekcollecties in Vlaanderen

Grote hoeveelheden tekst analyseren als data

ArchiefWiki en de eerste stappen op het semantische web

Be Linked

Zoeken in collecties van Openbare Bibliotheken

Triply omgeving presentatie UBU.pptx

1. December 2021 Ruben Schalk Linked(Open)Data enTriply M&A 30-05-2022

2. “Ik zoek alle informatie over Rembrandt, zoals schilderijen, boeken en archiefstukken” Huidige situatie: versnippering

9. Titel

10. Silo’s... Collectiebeheer- systeem Website Mauritshuis Collectiebeheer- systeem Website Stadsarchief Collectiebeheer- systeem Website WorldCat / TiU- bibliotheek “Geef alle informatie over Rembrandt”

11. “Linked data is een digitale methode voor het publiceren van gestructureerde gegevens, zodanig dat deze beschikbaar [en interoperabel] gemaakt kunnen worden op het internet en daardoor ook beter bruikbaar zijn.” (Wikipedia) Oplossing: Linked (Open) Data

12. ● gestructureerde gegevens ● publiceren op internet ● beter bruikbaar ● koppelen van gegevens ● semantisch zoeken ● automatisch te interpreteren door computers Op een rijtje:

13. subject → predicaat → object Manier van meningsvol verbinden van data zodat ook computer het begrijpt Bouwsteen van LOD: triple

14. Voorbeeld van triple Rembrandt gaat over

15. Triples Subject Predicaat Object Boek Heeft titel Lofrede op Rembrandt Boek Geschreven door Johannes Immerzeel jr Boek Gaat over Rembrandt Boek Publicatiejaar 1852 Archiefstuk Betreft Rembrandt Harmensz. van Rijn Archiefstuk Betreft Saskia van Uylenburgh

16. Johannes Immmerze el jr Weddep ohl 1852 Lofrede op Rembrandt

17. DCMI Metadata Terms (dcterms) EBUCore Bibliographic Ontology (BIBO) Schema.org Metadata- standaarden Europeana Data Model (EDM) CIDOC-CRM Metadatastandaarden voor verbinden van gegevens Records in Contexts (RiCO) RDA

18. Terminologie- bronnen gestructureerde, gecontroleerde termen, bv. thesauri, trefwoordenlijsten Terminologiebronnen Data beschrijven a.d.h.v. gecontroleerde termen

19. Bijvoorbeeld: ● thesaurus ● geautoriseerde lijst van personen ● geautoriseerde lijst van plaatsen of organisaties ● gecontroleerde begrippenlijst Terminologiebronnen:

20. UBU KB Rijksmuseum Wikidata Via SPARQL queries/ API calls Moeten we dat allemaal beheersen? NEE! Begrip ervan is wel nuttig Zie bijvoorbeeld de Wikidata query editor: https://query.wikidata.org/querybuilder/?use lang=nl

21. Publiceren van LOD Collectiebeheer- systeem Collectiebeheer- systeem Collectiebeheer- systeem LOD LOD LOD Collectiebeheer- systeem Collectiebeheer- systeem LOD LOD UBU Rijksmuseum KB etc.

22. Collectiebeheer- systeem LOD Collectiebeheer- systeem Collectiebeheer- systeem LOD LOD Online beschikbaar maken met TRIPLESTORE van

23. Triplestore: Landing page voor instelling Gebruikers die toegang hebben tot de LOD collectie Alle LOD datasets van deze instelling. Kunnen zowel collecties als research data zijn Snel toegang tot LOD datasets, opgeslagen SPARQL queries van alle gebruikers en data stories Naam van de instelling (in ons geval dus UBU o.i.d.)

24. Browser: live LOD data bekijken en ‘doorklikken’: ‘Creator’ brengt je bij VIAF, UuLink brengt je bij dit item in onze collectie, etc. Mogelijkheid om LOD te bevragen, analyseren en te verbinden aan andere LOD LOD graphs die in deze dataset zijn opgenomen Bijlagen bij de LOD, zoals conversiebestand, csv van originele dataset etc. LOD dataset pagina: toegang tot triples Instellingen van dataset, zoals toegangsrechten

25. Zelf aan de slag https://uu.triply.cc/ubu/-/overview Queries: https://uu.triply.cc/ubu/-/queries

Editor's Notes

We schetsen nu de huidige situatie aan de hand van een voorbeeld: alle informatie over Rembrandt willen vinden.
De meeste mensen gaan via Google zoeken of via Wikipedia. Ze komen dan bijvoorbeeld op dit schilderij van Rembrandt: “De anatomische les van dr. Nicolaes Tulp”, dat bij het Mauritshuis hangt.
Dit zijn de metadata die het Mauritshuis over het schilderij toont op zijn website (afkomstig uit hun collectiebeheersysteem).
Hier een boek over Rembrandt, o.a. aanwezig bij de Tilburgse Universiteitsbibliotheek.
Dit zijn de bibliografische metadata van het boek bij de Tilburgse Universiteit (uit online catalogus).
Ook over Rembrandt: dit archiefstuk bij het Stadsarchief Amsterdam. Het is de akte van ondertrouw van Rembrandt en Saskia Uijlenburg. Die zul je bij het googelen niet zo gemakkelijk vinden, omdat de informatie niet zo verfijnd is ontsloten op de website van het Stadsarchief.
Dit zijn de beschrijvende gegevens die het Stadsarchief van de akte heeft.
En bij de RKD (kennisinstituut over kunstgeschiedenis) is veel achtergrondinformatie te vinden. En verder kun je natuurlijk nog in wikipedia kijken en op allerlei andere plaatsen op het web.
Het probleem is dat de informatie over Rembrandt versnipperd in de verschillende systemen staat. Een gebruiker die alles over Rembrandt wil weten, moet op verschillende websites kijken. Die moet je maar net allemaal kunnen vinden. Ook is het lastig dat iedere website net weer anders werkt en dat de informatie steeds weer anders georganiseerd is. Voor een computer is het nog veel lastiger om alle informatie over een onderwerp (wie, wat, waar, wanneer) bij elkaar te sprokkelen. En het is voor veel toepassingen wel nodig dat een computer dat kan, bijvoorbeeld als je zelf een website of app wilt ontwikkelen over een onderwerp. Of als je er onderzoek naar wilt doen.
Een oplossing is werken met Linked Data. Hier een eenvoudige definitie daarvan. Die is wel erg algemeen.
Maar hoe werkt dat? In Linked Open Data gaat het erom dat de computer de verbanden kan leggen. Daarvoor is het nodig dat alles ondubbelzinnig wordt vastgelegd, op een computerleesbare manier. Een triple is de manier waarop informatie wordt vastgelegd in Linked Data technologie. Het is een “zinnetje” dat steeds uit drie elementen bestaat: subject, predicaat en object.
De informatie wordt uitgedrukt in een soort zinnetje met twee “entiteiten” (een “subject” en een “object”) en een “relatie” daartussen. We beginnen met het boek dat gaat over Rembrandt.
Hier zijn nog wat voorbeelden van triples, nu in tabelvorm weergegeven.
Het wordt ook vaak getekend, waarbij subject en object als cirkel worden getekend en de predicaten als (gerichte) pijlen. In het jargon spreekt men van een ‘graph’ of ‘graaf’.
Daarom gebruiken we metadatastandaarden met vaste velden. Er zijn heel veel soorten metadatastandaarden, voor het beschrijven van allerlei soorten informatie. Dit zijn een paar veelgebruikte standaarden voor het beschrijven van erfgoedobjecten.
Hoe kun je vastleggen dat het om dezelfde persoon gaat en dan ook nog op zo’n manier dat het computer-interpreteerbaar is? Door gebruik te maken van gemeenschappelijke terminologiebronnen. Een terminologiebron bijvoorbeeld een thesaurus, een trefwoordenlijst, een classificatie o.i.d. Hij wordt opgesteld en bijgehouden door deskundigen en wordt daardoor geautoriseerd.
Ieder systeem publiceert de eigen informatie als linked open data, waar dus die identifiers instaan en de relaties zijn vastgelegd. Dat samen vormt een grote “wolk” aan gelinkte informatie. Let wel: die wolk is virtueel, het is geen afzonderlijk systeem waarin alle informatie nog een keer wordt opgeslagen. Deze opzet zorgt ervoor dat iedere instelling zelf de regie houdt over hoe zijn eigen kennis wordt gepubliceerd. Zij hebben immers de expertise over hun eigen collectie, dus zij kunnen ook het beste bepalen hoe dit wordt gepubliceerd.

Triply omgeving presentatie UBU.pptx

Recommended

Recommended

More Related Content

Similar to Triply omgeving presentatie UBU.pptx

Similar to Triply omgeving presentatie UBU.pptx (20)

Triply omgeving presentatie UBU.pptx

Editor's Notes