SlideShare a Scribd company logo
1 of 23
Werken met Wikidata
VOGIN-IP
Hanno Lans 11 mei 2022
Programma
● Wie is wie
● Introductie Wikidata
● Workflow
● Aan de slag met data
● Demo OpenRefine
● Eigen datasets
Kenmerken
● data gebaseerd op referenties
● 97 miljoen items
● vrij bewerkbaar, met revisies en controle
● taalonafhankelijk
● tools
M.C. Termaat
Marie Christine Termaat
Auteursrechtenhub
● groepsgewijs collecties
doornemen met Wikidata als
check
By Niccolò Caranti (Own work) [CC BY-SA 4.0
(http://creativecommons.org/licenses/by-sa/4.0)], via Wikimedia Commons
Wereldculturen
© ErikvanB / Wikimedia Commons CC-BY-SA
Genderverdeling Museum Arnhem
Workflow (dataset voorbereiden)
● Dataset van museumcollectie met alle objecten
● wegfilteren anoniem en onbekend
● filteren op unieke vervaardiger
● namen opschonen
● bepalen persoon/organisatie
Workflow (profielen maken)
● vanuit het soort werk -> beroep (schilderij->kunstschilder)
● vanuit plaats van vervaardiging -> werklocatie
● vanuit creatiedatum -> floruit
Workflow (matching)
● beroepen met Wikidata koppelen (reconcilen)
● werklocaties koppelen
● personen met hulpgegevens koppelen
Workflow (toevoegen aan wikidata)
● bestaande personen verrijken met werken in
collectie, werklocatie en floruit
● nieuwe personen toevoegen
Workflow (monitoring)
● scripts doen toevoegingen
● ontdubbeling en aliassen
● aanvulling geboorte/sterfdata
Monitoring Paleis het Loo
https://www.wikidata.org/wiki/Wikidata:CopyClear/Paleis_Het_Loo
Datasets universiteiten
● album academicum
● lustrumboeken
Dataverbetering
● lijst van hoogleraren met alleen initialen
● N.C.H.E. Zeevenhooven via viaf
● W.F.B. Brinkman in NVTG
Zelf aan de slag
● lijst van hoogleraren met alleen initialen
https://www.wikidata.org/wiki/Wikidata:Wiki-
wetenschappers/onderhoud/Wetenschappers_met_initialen
Toevoegen volledige namen en biografische gegevens
OpenRefine
Stedelijk Museum collectie Grafische vormgeving
Aan de slag met datasets
● welke data handig?
● welke data zelf beschikbaar?
Hanno Lans - hanno@datascape.nl
Dank!

More Related Content

More from voginip

The Dark Side of Science: Misconduct in Biomedical Research
The Dark Side of Science: Misconduct in Biomedical ResearchThe Dark Side of Science: Misconduct in Biomedical Research
The Dark Side of Science: Misconduct in Biomedical Researchvoginip
 
Oude boeken, nieuwe vaardigheden en Wikipedia
Oude boeken, nieuwe vaardigheden en WikipediaOude boeken, nieuwe vaardigheden en Wikipedia
Oude boeken, nieuwe vaardigheden en Wikipediavoginip
 
De kracht van samenwerking: hoe de Universiteitsbibliotheek Gent open kennisc...
De kracht van samenwerking: hoe de Universiteitsbibliotheek Gent open kennisc...De kracht van samenwerking: hoe de Universiteitsbibliotheek Gent open kennisc...
De kracht van samenwerking: hoe de Universiteitsbibliotheek Gent open kennisc...voginip
 
Open yet everywhere in chains: Where next for open knowledge?
Open yet everywhere in chains: Where next for open knowledge?Open yet everywhere in chains: Where next for open knowledge?
Open yet everywhere in chains: Where next for open knowledge?voginip
 
The three layers of a knowledge graph and what it means for authoring, storag...
The three layers of a knowledge graph and what it means for authoring, storag...The three layers of a knowledge graph and what it means for authoring, storag...
The three layers of a knowledge graph and what it means for authoring, storag...voginip
 
Vijf vindbaarheidsproblemen waar een taxonomie de schuld van krijgt (maar nik...
Vijf vindbaarheidsproblemen waar een taxonomie de schuld van krijgt (maar nik...Vijf vindbaarheidsproblemen waar een taxonomie de schuld van krijgt (maar nik...
Vijf vindbaarheidsproblemen waar een taxonomie de schuld van krijgt (maar nik...voginip
 
Why one-size-fits all does not work in Explainable Artificial Intelligence!
Why one-size-fits all does not work in Explainable Artificial Intelligence!Why one-size-fits all does not work in Explainable Artificial Intelligence!
Why one-size-fits all does not work in Explainable Artificial Intelligence!voginip
 
Systematisch zoeken op het web
Systematisch zoeken op het webSystematisch zoeken op het web
Systematisch zoeken op het webvoginip
 
Grote hoeveelheden tekst analyseren als data
Grote hoeveelheden tekst analyseren als dataGrote hoeveelheden tekst analyseren als data
Grote hoeveelheden tekst analyseren als datavoginip
 
Een gereedschapskist voor digitale vaardigheden
Een gereedschapskist voor digitale vaardighedenEen gereedschapskist voor digitale vaardigheden
Een gereedschapskist voor digitale vaardighedenvoginip
 
Een startende éénpitter in informatieland: wat goed ging en wat niet
Een startende éénpitter in informatieland: wat goed ging en wat nietEen startende éénpitter in informatieland: wat goed ging en wat niet
Een startende éénpitter in informatieland: wat goed ging en wat nietvoginip
 
Van de droom van het Semantic Web naar de realiteit van Linked Open
Van de droom van het Semantic Web naar de realiteit van Linked Open Van de droom van het Semantic Web naar de realiteit van Linked Open
Van de droom van het Semantic Web naar de realiteit van Linked Open voginip
 
Minimal viable data reuse
Minimal viable data reuseMinimal viable data reuse
Minimal viable data reusevoginip
 
Records in Contexts – nieuwe metadatastandaard Stadsarchief Amsterdam
Records in Contexts – nieuwe metadatastandaard Stadsarchief AmsterdamRecords in Contexts – nieuwe metadatastandaard Stadsarchief Amsterdam
Records in Contexts – nieuwe metadatastandaard Stadsarchief Amsterdamvoginip
 
Als zoeken te fanatiek wordt: een digitale analyse van het toeslagenschandaal
Als zoeken te fanatiek wordt: een digitale analyse van het toeslagenschandaalAls zoeken te fanatiek wordt: een digitale analyse van het toeslagenschandaal
Als zoeken te fanatiek wordt: een digitale analyse van het toeslagenschandaalvoginip
 
Brecht Castel: OSINT voor factchecken
Brecht Castel: OSINT voor factcheckenBrecht Castel: OSINT voor factchecken
Brecht Castel: OSINT voor factcheckenvoginip
 
Improving search with neural ranking methods
Improving search with neural ranking methodsImproving search with neural ranking methods
Improving search with neural ranking methodsvoginip
 
NDE Termennetwerk
NDE TermennetwerkNDE Termennetwerk
NDE Termennetwerkvoginip
 
Amsterdam2013bradley.ppt
Amsterdam2013bradley.pptAmsterdam2013bradley.ppt
Amsterdam2013bradley.pptvoginip
 
semantischzoeken-2013.ppt
semantischzoeken-2013.pptsemantischzoeken-2013.ppt
semantischzoeken-2013.pptvoginip
 

More from voginip (20)

The Dark Side of Science: Misconduct in Biomedical Research
The Dark Side of Science: Misconduct in Biomedical ResearchThe Dark Side of Science: Misconduct in Biomedical Research
The Dark Side of Science: Misconduct in Biomedical Research
 
Oude boeken, nieuwe vaardigheden en Wikipedia
Oude boeken, nieuwe vaardigheden en WikipediaOude boeken, nieuwe vaardigheden en Wikipedia
Oude boeken, nieuwe vaardigheden en Wikipedia
 
De kracht van samenwerking: hoe de Universiteitsbibliotheek Gent open kennisc...
De kracht van samenwerking: hoe de Universiteitsbibliotheek Gent open kennisc...De kracht van samenwerking: hoe de Universiteitsbibliotheek Gent open kennisc...
De kracht van samenwerking: hoe de Universiteitsbibliotheek Gent open kennisc...
 
Open yet everywhere in chains: Where next for open knowledge?
Open yet everywhere in chains: Where next for open knowledge?Open yet everywhere in chains: Where next for open knowledge?
Open yet everywhere in chains: Where next for open knowledge?
 
The three layers of a knowledge graph and what it means for authoring, storag...
The three layers of a knowledge graph and what it means for authoring, storag...The three layers of a knowledge graph and what it means for authoring, storag...
The three layers of a knowledge graph and what it means for authoring, storag...
 
Vijf vindbaarheidsproblemen waar een taxonomie de schuld van krijgt (maar nik...
Vijf vindbaarheidsproblemen waar een taxonomie de schuld van krijgt (maar nik...Vijf vindbaarheidsproblemen waar een taxonomie de schuld van krijgt (maar nik...
Vijf vindbaarheidsproblemen waar een taxonomie de schuld van krijgt (maar nik...
 
Why one-size-fits all does not work in Explainable Artificial Intelligence!
Why one-size-fits all does not work in Explainable Artificial Intelligence!Why one-size-fits all does not work in Explainable Artificial Intelligence!
Why one-size-fits all does not work in Explainable Artificial Intelligence!
 
Systematisch zoeken op het web
Systematisch zoeken op het webSystematisch zoeken op het web
Systematisch zoeken op het web
 
Grote hoeveelheden tekst analyseren als data
Grote hoeveelheden tekst analyseren als dataGrote hoeveelheden tekst analyseren als data
Grote hoeveelheden tekst analyseren als data
 
Een gereedschapskist voor digitale vaardigheden
Een gereedschapskist voor digitale vaardighedenEen gereedschapskist voor digitale vaardigheden
Een gereedschapskist voor digitale vaardigheden
 
Een startende éénpitter in informatieland: wat goed ging en wat niet
Een startende éénpitter in informatieland: wat goed ging en wat nietEen startende éénpitter in informatieland: wat goed ging en wat niet
Een startende éénpitter in informatieland: wat goed ging en wat niet
 
Van de droom van het Semantic Web naar de realiteit van Linked Open
Van de droom van het Semantic Web naar de realiteit van Linked Open Van de droom van het Semantic Web naar de realiteit van Linked Open
Van de droom van het Semantic Web naar de realiteit van Linked Open
 
Minimal viable data reuse
Minimal viable data reuseMinimal viable data reuse
Minimal viable data reuse
 
Records in Contexts – nieuwe metadatastandaard Stadsarchief Amsterdam
Records in Contexts – nieuwe metadatastandaard Stadsarchief AmsterdamRecords in Contexts – nieuwe metadatastandaard Stadsarchief Amsterdam
Records in Contexts – nieuwe metadatastandaard Stadsarchief Amsterdam
 
Als zoeken te fanatiek wordt: een digitale analyse van het toeslagenschandaal
Als zoeken te fanatiek wordt: een digitale analyse van het toeslagenschandaalAls zoeken te fanatiek wordt: een digitale analyse van het toeslagenschandaal
Als zoeken te fanatiek wordt: een digitale analyse van het toeslagenschandaal
 
Brecht Castel: OSINT voor factchecken
Brecht Castel: OSINT voor factcheckenBrecht Castel: OSINT voor factchecken
Brecht Castel: OSINT voor factchecken
 
Improving search with neural ranking methods
Improving search with neural ranking methodsImproving search with neural ranking methods
Improving search with neural ranking methods
 
NDE Termennetwerk
NDE TermennetwerkNDE Termennetwerk
NDE Termennetwerk
 
Amsterdam2013bradley.ppt
Amsterdam2013bradley.pptAmsterdam2013bradley.ppt
Amsterdam2013bradley.ppt
 
semantischzoeken-2013.ppt
semantischzoeken-2013.pptsemantischzoeken-2013.ppt
semantischzoeken-2013.ppt
 

Werken met Wikidata