Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

828 views

Published on

Presentation (in Dtch) about the open data sets of the Koninklijke Bibliotheek (KB), the national library of the Netherlands (http://kb.nl/dataservices). What open data does the KB offer (dd. 8-6-2013), where can you find it and what are you allowed to do with it? What are the opportunities for reusing this data on Wikipedia, Wikimedia Commons en Wikisource? This slidedeck is also available on http://commons.wikimedia.org/wiki/File:Open_Data_KB_en_Wikipedia_8juni2013_OlafJanssen.pdf

Published in: Education
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
828
On SlideShare
0
From Embeds
0
Number of Embeds
5
Actions
Shares
0
Downloads
3
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Open data sets of the Koninklijke Bibliotheek - Opportunities for reuse on Wikipedia

  1. 1. Open data Koninklijke Bibliotheekhergebruik op Wikipedia, Commons en WikisourceOlaf Janssen, KB, 8 juni 2013
  2. 2. Ik hoop dat jullie meer inzicht krijgen in …• Open data KB- wat hebben we- waar vind je het- wat mag je ermee• Kansen voor hergebruik op- Wikipedia- Wikimedia Commons- Wikisource
  3. 3. Open data KB• Massadigitalisering in volle gang : boeken, kranten, tijdschriften• Beleid KB : “alles open… tenzij” (auteursrecht, contracten metdigitaliseringspartners Google, Proquest)• Collectie in PD of met CC-licentie  open dataset• (Bulk) hergebruik door 3den (bv WikiCommons) mogelijk maken• Tot nu toe 5 sets vrijgegeven
  4. 4. 1. Early Dutch Books Online• 11.000 full-text boeken (2,2 M pagina’s) uit 1780-1800• Onderwerpen: geschiedenis, politiek, religie,maatschappij, wetenschap, toneel, economie, handel,kunst, literatuur ….• Voorkant: earlydutchbooksonline.nl full-text zoeken• Achterkant: API
  5. 5. EarlyDutchBooksOnline.nl  full-text zoeken
  6. 6. Resultaat zoekactie1. Scans (jpg)2. OCR (txt)3. PDF (hele boek)
  7. 7. Resultaat zoekactie1. Scans (jpg)2. OCR (txt)3. PDF (hele boek)
  8. 8. Resultaat zoekactie1. Scans (jpg)2. OCR (txt)3. PDF (hele boek)
  9. 9. Resultaat zoekactie1. Scans (jpg)2. OCR (txt)3. PDF (hele boek)
  10. 10. EDBO zoek- en download-APIhttp://www.kb.nl/banners-apis-en-meer/dataservices-apis/early-dutch-books-online
  11. 11. EDBO gebruiksvoorwaarden• Losse objecten (JPG, PDF, OCR) : Public Domain Mark• Substantiële delen of alles  kb.nl/dataservices• Bron- en naamsvermelding vinden we fijn!
  12. 12. EDBO content voor WikipediaOnderzoeksbron voor artikelen Mosasaurus
  13. 13. EDBO content voor Wikipedia
  14. 14. EDBO content voor Wikipedia
  15. 15. EDBO content voor Wikipedia
  16. 16. EDBO content voor CommonsNaast tekstook veel(verstopte)afbeeldingen!
  17. 17. EDBO content voor Commons
  18. 18. EDBO content voor CommonsNaast tekst ook veel rechtenvrijeafbeeldingen
  19. 19. EDBO content voor CommonsNaast tekst ook veel rechtenvrijeafbeeldingen
  20. 20. EDBO content voor CommonsNaast tekst ook veel rechtenvrijeafbeeldingen
  21. 21. EDBO content voor CommonsNaast tekst ook veel rechtenvrijeafbeeldingen
  22. 22. EDBO content voor CommonsNaast tekst ook veel rechtenvrijeafbeeldingen
  23. 23. EDBO content voor WikiSourceOCR (en scans) vanrechtenvrije (Nederlandse)boeken
  24. 24. EDBO content voor WikiSource
  25. 25. EDBO content voor WikiSource
  26. 26. EDBO content voor WikiSource
  27. 27. 2. Staten-Generaal Digitaal (SGD)1. Kamerverslagen - woordelijke verslagen van de 1e+2e Kamer, VerenigdeVergaderingen2. Kamerstukken - schriftelijk uitgewisselde stukken tussen regering enparlement (bv. Troonrede, rijksbegroting)3. Kamervragen - schriftelijke vragen 1e+2e Kamerleden + bijbehorendeantwoorden bewindslieden• 454.800 documenten, 2.5M pagina’s.• Periode 1814 tot 1995• Voorkant: statengeneraaldigitaal.nl full-text zoeken in stukken + thematische achtergronddossiers• Achterkant: API
  28. 28. statengeneraaldigitaal.nl  full-text zoeken
  29. 29. Resultaat zoekactie1. Scans (jpg)2. OCR (txt)3. PDF
  30. 30. Resultaat zoekactie1. Scans (jpg)2. OCR (txt)3. PDF
  31. 31. Resultaat zoekactie1. Scans (jpg)2. OCR (txt)3. PDF
  32. 32. Resultaat zoekactie1. Scans (jpg)2. OCR (txt)3. PDF
  33. 33. Bulk hergebruik: SGD zoek- en download-APIhttp://www.kb.nl/banners-apis-en-meer/dataservices-apis/staten-generaal-digitaal
  34. 34. SGD gebruiksvoorwaarden• Losse objecten (JPG, PDF, OCR, kaarten) : CCO• Substantiële delen of alles: CCO(bv. Political Mashup)• Bron- en naamsvermelding vinden we fijn!
  35. 35. SGD content voor WikipediaOnderzoeksbron voor artikelen Geschiedenis van de prostitutie in Nederland Bijlmerramp Lijst van rechtbanken in Nederland Tegenpartij
  36. 36. SGD content voor Wikipedia
  37. 37. SGD content voor Wikipedia
  38. 38. SGD content voor Commons1.112 kaarten en tekeningen• Visueel materiaal in bv. memories van toelichting• Thema’s o.a. havens, dijken, ballonvaart, analfabetisme,wegennet, luchthavens…• Geo-boxed (lengte & breedte)• CC0
  39. 39. SGD content voor CommonsAfsluiting en droogmaking van de Zuiderzee
  40. 40. SGD content voor CommonsOverzichtskaart van de verplicht door de Koninklijke Paketvaart Maatschappij te bevarenverbindingen in Nederlandsch-Indie
  41. 41. SGD content voor CommonsMogelijke grenzen van het continentaal plat
  42. 42. SGD content voor WikiSource
  43. 43. SGD content voor WikiSource
  44. 44. SGD content voor WikiSourceWetten & rechtsdocumenten, bv.• Afschaffing slavernij (1863)• Afschaffing doodstraf (1870)• Kinderwet Van Houten (1874)• Zuiderzeewet (1918)• Deltaplan (1953)
  45. 45. 3. Middeleeuwse Verluchte Handschriften(MVH)• 11.000 verluchtingen (illustraties en versieringen) uit 400middeleeuwse handschriften tot ca. 1550• Onderwerpen: religie, natuur, de Bijbel, de mens, mythologie,hemel & aarde….• Voorkant: manuscripts.kb.nl verluchtingen zoeken & bladeren op onderwerp• Achterkant: API
  46. 46. manuscripts.kb.nl  verluchtingen zoeken & bladeren
  47. 47. Resultaat zoekactieScans (jpg) + uitleg
  48. 48. Resultaat zoekactieScans (jpg) + uitleg
  49. 49. http://www.kb.nl/banners-apis-en-meer/dataservices-apis/middeleeuwse-verluchte-handschriftenMVH zoek- en download-API
  50. 50. MVH gebruiksvoorwaarden• Losse objecten (JPG) : Public Domain Mark• Substantiële delen of alles: Public Domain Mark• Bron- en naamsvermelding vinden we fijn!
  51. 51. MVH content voor WikipediaReferenties & illustraties bij artikelen Jacob van Maerlant Beatrijs Evangeliarium van Egmond Gruuthuse manuscript (EN) Historia del pan (ES)
  52. 52. MVH content voor Wikipedia
  53. 53. MVH content voor Wikipedia
  54. 54. MVH content voor Wikipedia
  55. 55. MVH content voor Commons11.141afbeeldingen
  56. 56. MVH content voor Commons
  57. 57. MVH batch upload naar Commons• GLAMwiki toolset project: tools om content vanGLAMs naar Commons te uploaden (in bulk)• Partners: Wikimedia-NL, UK, FR, CH + Europeana• http://commons.wikimedia.org/wiki/Commons:GLAMToolset_project• http://gwtoolset.wmflabs.org/index.php/GWToolset Testrun met 3 MVH-afbeeldingen
  58. 58. Input(XML v/d KB)
  59. 59. Output(op Commons)
  60. 60. Output(detail)
  61. 61. MVH content voor WikiSourceGeen, MVH bevat geenbronteksten
  62. 62. 4. Watermerken (WILC)• 16.000 watermerken uit boeken gedrukt in deLage Landen (Nederland & België) in 1450 - 1501• Voorkant: watermark.kb.nl watermerken zoeken + veel achtergrondinformatie• Achterkant: API
  63. 63. watermark.kb.nl  watermerken zoeken + achtergrondinformatie
  64. 64. Resultaat zoekactie1. Scans (jpg)2. PDF
  65. 65. Resultaat zoekactie1. Scans (jpg)2. PDF
  66. 66. http://www.kb.nl/banners-apis-en-meer/dataservices-apis/watermerkenWILC  zoek- en download-API
  67. 67. WILC gebruiksvoorwaarden• Losse objecten (JPG, PDF) : CCO• Substantiële delen of alles: CCO• Bron- en naamsvermelding vinden we fijn!
  68. 68. WILC content voor WikipediaOnderzoeksbron voor artikelen Gheraert Leeu (drukker)
  69. 69. Over Gheraert Leeu
  70. 70. Watermerken in Leeu’s boeken
  71. 71. Watermerken in Leeu’s boeken
  72. 72. WILC content voor CommonsCategory: William Caxton(1e Engelse drukker)
  73. 73. WILC content voor CommonsCategory: William Caxton
  74. 74. WILC content voor WikiSourceNiet, want WILC = afbeeldingen
  75. 75. 5. Radiobulletins ANP• Typoscripten van radionieuwsbulletins van het ANP(“zes uur, dit is de radionieuwsdienst verzorgd door het ANP”)• 1,5 miljoen pagina’s uit 1937-1984 (geen 100% dekking)• Voorkant: anp.kb.nl full-text zoeken & bladeren op datum• Achterkant: API
  76. 76. anp.kb.nl  full-text zoeken
  77. 77. Resultaat zoekactie1. Scans (jpg)2. OCR (txt)
  78. 78. Resultaat zoekactie1. Scans (jpg)2. OCR (txt)
  79. 79. http://www.kb.nl/banners-apis-en-meer/dataservices-apis/anp-radiobulletins-digitaalANP zoek- en download-API
  80. 80. ANP gebruiksvoorwaarden• Losse objecten (JPG, OCR) : CC-BY-NC• Commercieel hergebruik : goedkeuring ANP• Bron- en naamsvermelding verplicht!
  81. 81. ANP content voor WikipediaOnderzoeksbron voor artikelen Resolutie 2079 Algemene VergaderingVerenigde Naties Vlag van Nederland
  82. 82. ANP content voor Wikipedia“Op 19 februari 1937 tekende KoninginWilhelmina op haar vakantieverblijf in Zell amSee het kortste Koninklijk Besluit ooit, luidend:"De kleuren van de vlag van het Koninkrijk derNederlanden zijn rood, wit en blauw."
  83. 83. ANP content voor WikipediaBron: anp.kb.nl (24-2-1937)
  84. 84. ANP content voor CommonsNiet, want ANP = CC-BY-NC
  85. 85. ANP content voor WikiSourceNiet, want ANP = CC-BY-NC
  86. 86. Naast kb.nl,waar zijn de open sets van de KB nogmeer te vinden?
  87. 87. opencultuurdata.nl
  88. 88. data.overheid.nl
  89. 89. opendatanederland.org
  90. 90. Publicdata.eu(joining soon)

×