Open data Koninklijke Bibliotheekhergebruik op Wikipedia, Commons en WikisourceOlaf Janssen, KB, 8 juni 2013
Ik hoop dat jullie meer inzicht krijgen in …• Open data KB- wat hebben we- waar vind je het- wat mag je ermee• Kansen voor...
Open data KB• Massadigitalisering in volle gang : boeken, kranten, tijdschriften• Beleid KB : “alles open… tenzij” (auteur...
1. Early Dutch Books Online• 11.000 full-text boeken (2,2 M pagina’s) uit 1780-1800• Onderwerpen: geschiedenis, politiek, ...
EarlyDutchBooksOnline.nl  full-text zoeken
Resultaat zoekactie1. Scans (jpg)2. OCR (txt)3. PDF (hele boek)
Resultaat zoekactie1. Scans (jpg)2. OCR (txt)3. PDF (hele boek)
Resultaat zoekactie1. Scans (jpg)2. OCR (txt)3. PDF (hele boek)
Resultaat zoekactie1. Scans (jpg)2. OCR (txt)3. PDF (hele boek)
EDBO zoek- en download-APIhttp://www.kb.nl/banners-apis-en-meer/dataservices-apis/early-dutch-books-online
EDBO gebruiksvoorwaarden• Losse objecten (JPG, PDF, OCR) : Public Domain Mark• Substantiële delen of alles  kb.nl/dataser...
EDBO content voor WikipediaOnderzoeksbron voor artikelen Mosasaurus
EDBO content voor Wikipedia
EDBO content voor Wikipedia
EDBO content voor Wikipedia
EDBO content voor CommonsNaast tekstook veel(verstopte)afbeeldingen!
EDBO content voor Commons
EDBO content voor CommonsNaast tekst ook veel rechtenvrijeafbeeldingen
EDBO content voor CommonsNaast tekst ook veel rechtenvrijeafbeeldingen
EDBO content voor CommonsNaast tekst ook veel rechtenvrijeafbeeldingen
EDBO content voor CommonsNaast tekst ook veel rechtenvrijeafbeeldingen
EDBO content voor CommonsNaast tekst ook veel rechtenvrijeafbeeldingen
EDBO content voor WikiSourceOCR (en scans) vanrechtenvrije (Nederlandse)boeken
EDBO content voor WikiSource
EDBO content voor WikiSource
EDBO content voor WikiSource
2. Staten-Generaal Digitaal (SGD)1. Kamerverslagen - woordelijke verslagen van de 1e+2e Kamer, VerenigdeVergaderingen2. Ka...
statengeneraaldigitaal.nl  full-text zoeken
Resultaat zoekactie1. Scans (jpg)2. OCR (txt)3. PDF
Resultaat zoekactie1. Scans (jpg)2. OCR (txt)3. PDF
Resultaat zoekactie1. Scans (jpg)2. OCR (txt)3. PDF
Resultaat zoekactie1. Scans (jpg)2. OCR (txt)3. PDF
Bulk hergebruik: SGD zoek- en download-APIhttp://www.kb.nl/banners-apis-en-meer/dataservices-apis/staten-generaal-digitaal
SGD gebruiksvoorwaarden• Losse objecten (JPG, PDF, OCR, kaarten) : CCO• Substantiële delen of alles: CCO(bv. Political Mas...
SGD content voor WikipediaOnderzoeksbron voor artikelen Geschiedenis van de prostitutie in Nederland Bijlmerramp Lijst ...
SGD content voor Wikipedia
SGD content voor Wikipedia
SGD content voor Commons1.112 kaarten en tekeningen• Visueel materiaal in bv. memories van toelichting• Thema’s o.a. haven...
SGD content voor CommonsAfsluiting en droogmaking van de Zuiderzee
SGD content voor CommonsOverzichtskaart van de verplicht door de Koninklijke Paketvaart Maatschappij te bevarenverbindinge...
SGD content voor CommonsMogelijke grenzen van het continentaal plat
SGD content voor WikiSource
SGD content voor WikiSource
SGD content voor WikiSourceWetten & rechtsdocumenten, bv.• Afschaffing slavernij (1863)• Afschaffing doodstraf (1870)• Kin...
3. Middeleeuwse Verluchte Handschriften(MVH)• 11.000 verluchtingen (illustraties en versieringen) uit 400middeleeuwse hand...
manuscripts.kb.nl  verluchtingen zoeken & bladeren
Resultaat zoekactieScans (jpg) + uitleg
Resultaat zoekactieScans (jpg) + uitleg
http://www.kb.nl/banners-apis-en-meer/dataservices-apis/middeleeuwse-verluchte-handschriftenMVH zoek- en download-API
MVH gebruiksvoorwaarden• Losse objecten (JPG) : Public Domain Mark• Substantiële delen of alles: Public Domain Mark• Bron-...
MVH content voor WikipediaReferenties & illustraties bij artikelen Jacob van Maerlant Beatrijs Evangeliarium van Egmond...
MVH content voor Wikipedia
MVH content voor Wikipedia
MVH content voor Wikipedia
MVH content voor Commons11.141afbeeldingen
MVH content voor Commons
MVH batch upload naar Commons• GLAMwiki toolset project: tools om content vanGLAMs naar Commons te uploaden (in bulk)• Par...
Input(XML v/d KB)
Output(op Commons)
Output(detail)
MVH content voor WikiSourceGeen, MVH bevat geenbronteksten
4. Watermerken (WILC)• 16.000 watermerken uit boeken gedrukt in deLage Landen (Nederland & België) in 1450 - 1501• Voorkan...
watermark.kb.nl  watermerken zoeken + achtergrondinformatie
Resultaat zoekactie1. Scans (jpg)2. PDF
Resultaat zoekactie1. Scans (jpg)2. PDF
http://www.kb.nl/banners-apis-en-meer/dataservices-apis/watermerkenWILC  zoek- en download-API
WILC gebruiksvoorwaarden• Losse objecten (JPG, PDF) : CCO• Substantiële delen of alles: CCO• Bron- en naamsvermelding vind...
WILC content voor WikipediaOnderzoeksbron voor artikelen Gheraert Leeu (drukker)
Over Gheraert Leeu
Watermerken in Leeu’s boeken
Watermerken in Leeu’s boeken
WILC content voor CommonsCategory: William Caxton(1e Engelse drukker)
WILC content voor CommonsCategory: William Caxton
WILC content voor WikiSourceNiet, want WILC = afbeeldingen
5. Radiobulletins ANP• Typoscripten van radionieuwsbulletins van het ANP(“zes uur, dit is de radionieuwsdienst verzorgd do...
anp.kb.nl  full-text zoeken
Resultaat zoekactie1. Scans (jpg)2. OCR (txt)
Resultaat zoekactie1. Scans (jpg)2. OCR (txt)
http://www.kb.nl/banners-apis-en-meer/dataservices-apis/anp-radiobulletins-digitaalANP zoek- en download-API
ANP gebruiksvoorwaarden• Losse objecten (JPG, OCR) : CC-BY-NC• Commercieel hergebruik : goedkeuring ANP• Bron- en naamsver...
ANP content voor WikipediaOnderzoeksbron voor artikelen Resolutie 2079 Algemene VergaderingVerenigde Naties Vlag van Ned...
ANP content voor Wikipedia“Op 19 februari 1937 tekende KoninginWilhelmina op haar vakantieverblijf in Zell amSee het korts...
ANP content voor WikipediaBron: anp.kb.nl (24-2-1937)
ANP content voor CommonsNiet, want ANP = CC-BY-NC
ANP content voor WikiSourceNiet, want ANP = CC-BY-NC
Naast kb.nl,waar zijn de open sets van de KB nogmeer te vinden?
opencultuurdata.nl
data.overheid.nl
opendatanederland.org
Publicdata.eu(joining soon)
Upcoming SlideShare
Loading in …5
×

Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

872 views

Published on

Presentation (in Dtch) about the open data sets of the Koninklijke Bibliotheek (KB), the national library of the Netherlands (http://kb.nl/dataservices). What open data does the KB offer (dd. 8-6-2013), where can you find it and what are you allowed to do with it? What are the opportunities for reusing this data on Wikipedia, Wikimedia Commons en Wikisource? This slidedeck is also available on http://commons.wikimedia.org/wiki/File:Open_Data_KB_en_Wikipedia_8juni2013_OlafJanssen.pdf

Published in: Education
  • Be the first to comment

  • Be the first to like this

Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

  1. 1. Open data Koninklijke Bibliotheekhergebruik op Wikipedia, Commons en WikisourceOlaf Janssen, KB, 8 juni 2013
  2. 2. Ik hoop dat jullie meer inzicht krijgen in …• Open data KB- wat hebben we- waar vind je het- wat mag je ermee• Kansen voor hergebruik op- Wikipedia- Wikimedia Commons- Wikisource
  3. 3. Open data KB• Massadigitalisering in volle gang : boeken, kranten, tijdschriften• Beleid KB : “alles open… tenzij” (auteursrecht, contracten metdigitaliseringspartners Google, Proquest)• Collectie in PD of met CC-licentie  open dataset• (Bulk) hergebruik door 3den (bv WikiCommons) mogelijk maken• Tot nu toe 5 sets vrijgegeven
  4. 4. 1. Early Dutch Books Online• 11.000 full-text boeken (2,2 M pagina’s) uit 1780-1800• Onderwerpen: geschiedenis, politiek, religie,maatschappij, wetenschap, toneel, economie, handel,kunst, literatuur ….• Voorkant: earlydutchbooksonline.nl full-text zoeken• Achterkant: API
  5. 5. EarlyDutchBooksOnline.nl  full-text zoeken
  6. 6. Resultaat zoekactie1. Scans (jpg)2. OCR (txt)3. PDF (hele boek)
  7. 7. Resultaat zoekactie1. Scans (jpg)2. OCR (txt)3. PDF (hele boek)
  8. 8. Resultaat zoekactie1. Scans (jpg)2. OCR (txt)3. PDF (hele boek)
  9. 9. Resultaat zoekactie1. Scans (jpg)2. OCR (txt)3. PDF (hele boek)
  10. 10. EDBO zoek- en download-APIhttp://www.kb.nl/banners-apis-en-meer/dataservices-apis/early-dutch-books-online
  11. 11. EDBO gebruiksvoorwaarden• Losse objecten (JPG, PDF, OCR) : Public Domain Mark• Substantiële delen of alles  kb.nl/dataservices• Bron- en naamsvermelding vinden we fijn!
  12. 12. EDBO content voor WikipediaOnderzoeksbron voor artikelen Mosasaurus
  13. 13. EDBO content voor Wikipedia
  14. 14. EDBO content voor Wikipedia
  15. 15. EDBO content voor Wikipedia
  16. 16. EDBO content voor CommonsNaast tekstook veel(verstopte)afbeeldingen!
  17. 17. EDBO content voor Commons
  18. 18. EDBO content voor CommonsNaast tekst ook veel rechtenvrijeafbeeldingen
  19. 19. EDBO content voor CommonsNaast tekst ook veel rechtenvrijeafbeeldingen
  20. 20. EDBO content voor CommonsNaast tekst ook veel rechtenvrijeafbeeldingen
  21. 21. EDBO content voor CommonsNaast tekst ook veel rechtenvrijeafbeeldingen
  22. 22. EDBO content voor CommonsNaast tekst ook veel rechtenvrijeafbeeldingen
  23. 23. EDBO content voor WikiSourceOCR (en scans) vanrechtenvrije (Nederlandse)boeken
  24. 24. EDBO content voor WikiSource
  25. 25. EDBO content voor WikiSource
  26. 26. EDBO content voor WikiSource
  27. 27. 2. Staten-Generaal Digitaal (SGD)1. Kamerverslagen - woordelijke verslagen van de 1e+2e Kamer, VerenigdeVergaderingen2. Kamerstukken - schriftelijk uitgewisselde stukken tussen regering enparlement (bv. Troonrede, rijksbegroting)3. Kamervragen - schriftelijke vragen 1e+2e Kamerleden + bijbehorendeantwoorden bewindslieden• 454.800 documenten, 2.5M pagina’s.• Periode 1814 tot 1995• Voorkant: statengeneraaldigitaal.nl full-text zoeken in stukken + thematische achtergronddossiers• Achterkant: API
  28. 28. statengeneraaldigitaal.nl  full-text zoeken
  29. 29. Resultaat zoekactie1. Scans (jpg)2. OCR (txt)3. PDF
  30. 30. Resultaat zoekactie1. Scans (jpg)2. OCR (txt)3. PDF
  31. 31. Resultaat zoekactie1. Scans (jpg)2. OCR (txt)3. PDF
  32. 32. Resultaat zoekactie1. Scans (jpg)2. OCR (txt)3. PDF
  33. 33. Bulk hergebruik: SGD zoek- en download-APIhttp://www.kb.nl/banners-apis-en-meer/dataservices-apis/staten-generaal-digitaal
  34. 34. SGD gebruiksvoorwaarden• Losse objecten (JPG, PDF, OCR, kaarten) : CCO• Substantiële delen of alles: CCO(bv. Political Mashup)• Bron- en naamsvermelding vinden we fijn!
  35. 35. SGD content voor WikipediaOnderzoeksbron voor artikelen Geschiedenis van de prostitutie in Nederland Bijlmerramp Lijst van rechtbanken in Nederland Tegenpartij
  36. 36. SGD content voor Wikipedia
  37. 37. SGD content voor Wikipedia
  38. 38. SGD content voor Commons1.112 kaarten en tekeningen• Visueel materiaal in bv. memories van toelichting• Thema’s o.a. havens, dijken, ballonvaart, analfabetisme,wegennet, luchthavens…• Geo-boxed (lengte & breedte)• CC0
  39. 39. SGD content voor CommonsAfsluiting en droogmaking van de Zuiderzee
  40. 40. SGD content voor CommonsOverzichtskaart van de verplicht door de Koninklijke Paketvaart Maatschappij te bevarenverbindingen in Nederlandsch-Indie
  41. 41. SGD content voor CommonsMogelijke grenzen van het continentaal plat
  42. 42. SGD content voor WikiSource
  43. 43. SGD content voor WikiSource
  44. 44. SGD content voor WikiSourceWetten & rechtsdocumenten, bv.• Afschaffing slavernij (1863)• Afschaffing doodstraf (1870)• Kinderwet Van Houten (1874)• Zuiderzeewet (1918)• Deltaplan (1953)
  45. 45. 3. Middeleeuwse Verluchte Handschriften(MVH)• 11.000 verluchtingen (illustraties en versieringen) uit 400middeleeuwse handschriften tot ca. 1550• Onderwerpen: religie, natuur, de Bijbel, de mens, mythologie,hemel & aarde….• Voorkant: manuscripts.kb.nl verluchtingen zoeken & bladeren op onderwerp• Achterkant: API
  46. 46. manuscripts.kb.nl  verluchtingen zoeken & bladeren
  47. 47. Resultaat zoekactieScans (jpg) + uitleg
  48. 48. Resultaat zoekactieScans (jpg) + uitleg
  49. 49. http://www.kb.nl/banners-apis-en-meer/dataservices-apis/middeleeuwse-verluchte-handschriftenMVH zoek- en download-API
  50. 50. MVH gebruiksvoorwaarden• Losse objecten (JPG) : Public Domain Mark• Substantiële delen of alles: Public Domain Mark• Bron- en naamsvermelding vinden we fijn!
  51. 51. MVH content voor WikipediaReferenties & illustraties bij artikelen Jacob van Maerlant Beatrijs Evangeliarium van Egmond Gruuthuse manuscript (EN) Historia del pan (ES)
  52. 52. MVH content voor Wikipedia
  53. 53. MVH content voor Wikipedia
  54. 54. MVH content voor Wikipedia
  55. 55. MVH content voor Commons11.141afbeeldingen
  56. 56. MVH content voor Commons
  57. 57. MVH batch upload naar Commons• GLAMwiki toolset project: tools om content vanGLAMs naar Commons te uploaden (in bulk)• Partners: Wikimedia-NL, UK, FR, CH + Europeana• http://commons.wikimedia.org/wiki/Commons:GLAMToolset_project• http://gwtoolset.wmflabs.org/index.php/GWToolset Testrun met 3 MVH-afbeeldingen
  58. 58. Input(XML v/d KB)
  59. 59. Output(op Commons)
  60. 60. Output(detail)
  61. 61. MVH content voor WikiSourceGeen, MVH bevat geenbronteksten
  62. 62. 4. Watermerken (WILC)• 16.000 watermerken uit boeken gedrukt in deLage Landen (Nederland & België) in 1450 - 1501• Voorkant: watermark.kb.nl watermerken zoeken + veel achtergrondinformatie• Achterkant: API
  63. 63. watermark.kb.nl  watermerken zoeken + achtergrondinformatie
  64. 64. Resultaat zoekactie1. Scans (jpg)2. PDF
  65. 65. Resultaat zoekactie1. Scans (jpg)2. PDF
  66. 66. http://www.kb.nl/banners-apis-en-meer/dataservices-apis/watermerkenWILC  zoek- en download-API
  67. 67. WILC gebruiksvoorwaarden• Losse objecten (JPG, PDF) : CCO• Substantiële delen of alles: CCO• Bron- en naamsvermelding vinden we fijn!
  68. 68. WILC content voor WikipediaOnderzoeksbron voor artikelen Gheraert Leeu (drukker)
  69. 69. Over Gheraert Leeu
  70. 70. Watermerken in Leeu’s boeken
  71. 71. Watermerken in Leeu’s boeken
  72. 72. WILC content voor CommonsCategory: William Caxton(1e Engelse drukker)
  73. 73. WILC content voor CommonsCategory: William Caxton
  74. 74. WILC content voor WikiSourceNiet, want WILC = afbeeldingen
  75. 75. 5. Radiobulletins ANP• Typoscripten van radionieuwsbulletins van het ANP(“zes uur, dit is de radionieuwsdienst verzorgd door het ANP”)• 1,5 miljoen pagina’s uit 1937-1984 (geen 100% dekking)• Voorkant: anp.kb.nl full-text zoeken & bladeren op datum• Achterkant: API
  76. 76. anp.kb.nl  full-text zoeken
  77. 77. Resultaat zoekactie1. Scans (jpg)2. OCR (txt)
  78. 78. Resultaat zoekactie1. Scans (jpg)2. OCR (txt)
  79. 79. http://www.kb.nl/banners-apis-en-meer/dataservices-apis/anp-radiobulletins-digitaalANP zoek- en download-API
  80. 80. ANP gebruiksvoorwaarden• Losse objecten (JPG, OCR) : CC-BY-NC• Commercieel hergebruik : goedkeuring ANP• Bron- en naamsvermelding verplicht!
  81. 81. ANP content voor WikipediaOnderzoeksbron voor artikelen Resolutie 2079 Algemene VergaderingVerenigde Naties Vlag van Nederland
  82. 82. ANP content voor Wikipedia“Op 19 februari 1937 tekende KoninginWilhelmina op haar vakantieverblijf in Zell amSee het kortste Koninklijk Besluit ooit, luidend:"De kleuren van de vlag van het Koninkrijk derNederlanden zijn rood, wit en blauw."
  83. 83. ANP content voor WikipediaBron: anp.kb.nl (24-2-1937)
  84. 84. ANP content voor CommonsNiet, want ANP = CC-BY-NC
  85. 85. ANP content voor WikiSourceNiet, want ANP = CC-BY-NC
  86. 86. Naast kb.nl,waar zijn de open sets van de KB nogmeer te vinden?
  87. 87. opencultuurdata.nl
  88. 88. data.overheid.nl
  89. 89. opendatanederland.org
  90. 90. Publicdata.eu(joining soon)

×