SlideShare a Scribd company logo
1 of 51
Download to read offline
Europeana Newspapers 
28 Oktober 2014 – Den Haag 
Marieke Willems, LIBER 
Originele presentatie gepubliceerd door Alastair Dunning, The European 
Library @alastairdunning, www.slideshare.net/alastairdunning
Op 15 april 1912, voer het passagiers 
schip Titanic, met meer dan 2.000 
opvarenden, tegen een ijsschots op 
zijn eerste reis van Southampton naar 
New York
De Titanic ramp in de kranten 
http://anno.onb.ac.at/cgi-content/anno?aid=nzg&datum=19120417&seite=1&zoom=33
De Titanic ramp in de kranten 
http://kranten.delpher.nl/nl/view/index?query=de+telegraaf+titanic&coll=ddd&image=dd 
d%3A110546692%3Ampeg21%3Aa0026&page=2&maxperpage=10&sortfield=date
De Titanic ramp in de kranten 
http://gallica.bnf.fr/ark:/12148/bpt6k289555z
De Titanic ramp in de kranten 
http://hemerotecadigital.bne.es/details.vm?q=id:0000817544&s=0
De Titanic ramp in de kranten
De Titanic ramp in de kranten
Nieuws verspreidt zich 
op verschillende 
snelheden, terwijl het 
belang van nieuws in 
verschillende mate 
afneemt. 
Dit is nu het geval, 
maar dat was het ook 
in 1912. 
(maar internet verandert de zaak...)
Het Europeana Newspapers project 
maakt dit soort onderzoek 
eenvoudiger
The European Library ontwikkelde 
een grensoverschrijdende 
doorzoekbare kranten interface 
(via Europeana zijn de meta-data 
op editie niveau doorzoekbaar) 
http://www.theeuropeanlibrary.org/tel4/newspapers
Nu: 
Ongeveer 7 
miljoen 
pagina's full text 
In 2015: 
10 
miljoen 
pagina’s full text, tot 
2 miljoen 
kranten edities 
Zoeken via trefwoord, en 
filteren per taal, datum, 
bibliotheek, titel
Blader per datum of via geografische kaart 
Nu: 
Ongeveer 7 
miljoen 
pagina's full text 
In 2015: 
10 
miljoen 
pagina’s full text, tot 
2 miljoen 
kranten edities
Full Text van de volgende bibliotheken 
• Bibliotheque nationale de France / National 
Library France 
• Koninklijke Bibliotheek / National Library of the 
Netherlands 
• Landesbibliothek Dr. Friedrich Teßmann / 
Teßmann Library 
• Eesti Rahvusraamatukogu / Estonian National 
Library 
• Kansalliskirjasto / National Library of Finland 
• Latvijas Nacionala Biblioteka / National Library 
of Latvia 
• Biblioteka Narodowa / National Library of 
Poland 
• Milli Kutuphane Baskanligi / National Library of 
Turkey 
• Österreichische Nationalbibliothek / Austrian 
National Library 
• Staatsbibliothek zu Berlin / Berlin State Library 
• Staats- und Universitätsbibliothek Hamburg / 
State and University Library 
• Univerzitet u Beogradu / University Library of 
Belgrade 
Zoek per titel
Kranten-nummer records van de volgende 
bibliotheken 
• National Library of Wales 
• St. Cyril and Methodius National Library / The 
National Library of Bulgaria 
• National Library of Czech Republic 
• National and University Library in Zagreb 
• Koninklijke Bibliotheek van België / 
Bibliothèque royale de Belgique 
• Narodna in univerzitetna knjinica / National and 
University Library of Slovenia 
• National Library of Portugal 
• National Library of Romania 
• Landsbókasafn Íslands - Háskólabókasafn / 
National and Univeristy Library of 
Iceland National Library of Spain 
• Bibliothèque nationale de Luxembourg / 
National Library of Luxembourg 
Het vinden van de 
bijpassende resultaten in 
één enkele of meerdere 
kranten-nummers.
Markeren van zoekwoorden
To zover, OK. Een vergelijkbare 
functionaliteit als van andere 
nationale en regionale digitale 
kranten archieven. 
Zie andere archieven via: 
https://www.google.com/maps/ms?msid=217164746645697066594.0004c3d764fcb71ed 
2314&msa=0
Maar wat was de reactie van de 
gebruiker op het samenvoegen van 
Europese kranten bibliotheken? 
Resultaten van de Usability Testing: 
http://www.europeana-newspapers.eu/wp-content/ 
uploads/2014/05/The-European-Library- 
Newspaper-Archive-Usability-testing-Report- 
April-2014.pdf
“Overzicht van toegevoegde 
inhoud van de diverse bronnen 
werd zeer gewaardeerd. Zeer 
positieve houding t.o.v. de 
beschikbaarheid van het archief.”
“Veel geinterviewden zouden de 
site graag nog eens bezoeken 
omdat de inhoud zich steeds 
uitbreidt.”
“De mogelijkheid om via een 
geografische kaart te zoeken werd 
zeer gewaardeerd”
Opmerkingen over het design 
- posities van de “advanced options” 
- re-organiseren van de lijst van resultaten 
- manipuleren van facetten
Veel hogere verwachtingen van de 
functionaliteit wanneer men 
eenmaal was ingelogd. 
Bijvoorbeeld: 
Bewaarde zoekopdrachten 
Melding van nieuwe inhoud
“Voor veel deelnemers lag de waarde van de site 
in de afbeeldingen van de documenten. 
Deelnemers verwachtten een “lokale” kopie te 
kunnen bewaren wanneer ze eenmaal de 
relevante inhoud hadden gevonden. 
Omdat er geen download faciliteit wordt 
aangeboden, leidde dit tot enige frustratie en 
ondermijnde dit de totale potentiële waarde van 
de site voor sommige deelnemers.”
Planning voor de rest van het 
project 
Nu – Protoype versie van de interface gedeeld met project 
Gedurende 2014 – Voortdurende creatie van OCR, en ander 
gerelateerd technisch werk (OLR, Named Entities) 
Gedurende 2014 – Live versie website verbeterd / usability 
testing / toegevoegde inhoud 
Eind 2014 - Newspaper browser voltooid met inhoud en 
instrumenten van het project 
Meer informatie hier: 
http://www.europeana-newspapers.eu/ 
Interface hier: 
http://www.theeuropeanlibrary.org/tel4/newspapers/
Dingen die de gebruikers niet 
meldden 
(maar waarvan we verwachtten dat ze dat wel zouden 
doen)
Waarom kan ik de text niet 
bewerken? 
(Onze sample bestond uit wetenschappers: misschien 
zijn het andere communities die geïnteresseerd zijn in 
crowdsourcing?) 
NB: Als de tijd het toestaat, zal The European Library 
een crowdsourcing functie ontwikkelen.
Kan ik tekst downloaden voor data 
mining? 
Onthoudt: Digitale Humanisten vormen nog steeds een 
klein percentage van alle humanisten en gebruikers 
NB: Veel van de teksten zijn pubiek domein, dus dit is 
wettelijk gezien haalbaar.
Aantal gedigitaliseerde paginas in 
interface: c.7m 
Aantal gedigitaliseerde paginas 
Europese bibliotheken: c.130m 
Aantal fysieke paginas in Europese 
bibliotheken: 1.5bn+ 
Bron: European Newspaper Survey Report 
http://www.europeana-newspapers.eu/wp-content/uploads/2012/04/D4.1-Europeana-newspapers- 
survey-report.pdf
1,6E+09 
1,4E+09 
1,2E+09 
1E+09 
800000000 
600000000 
400000000 
200000000 
0 
Project Archive Digitised Physical
De digitale bibliotheek van het 
project is slechts een fractie van 
het kranten archief van Europa, of 
zelfs van de wereld.
Hoe zouden wij, als bibliotheken, 
deze afwezigheid naar onze 
gebruikers moeten vertalen?
Zou deze afwezigheid zichtbaar 
moeten zijn op de interface zelf?
Grote witte 
ruimten in 
de lijst met 
resultaten?
Erg lastig om de “gaps” in 
archieven weer te geven als je 
bedenkt dat er slechts 10% is 
gedigitaliseerd. Dit creëert een 
speld in een hooiberg… 
Bron: enumerate.eu
Gestandaardiseerde beschrijvingen 
van gedigitaliseerde bronnen 
aanbieden?
Gestandaardiseerde informatie? 
Voor elke digitale bron van inhoud 
die wordt geproduceerd in de 
wereld? 
Echt?
Grafieken extern van de interface ?
Er zijn ook andere issues 
 OCR kwaliteit variereert 
 Sommige pagina’s (2m in 2015) hebben 
artikel segmentatie 
 Deel van de inhoud heeft “named 
entity”extractie: effect op zoekresultaten. 
 Verschillende vergunningen in 
verschillende landen 
 Datum van copyright grenzen verschillen 
van land tot land.
Hoe zouden we gebruikers kunnen 
helpen om de digitale bibliotheek 
beter te begrijpen?
Welke rol kan de API hierin spelen? 
Zou het helpen om de data in de 
digitale bibliotheek open te stellen 
en verschillende manieren van 
onderzoek toe te staan?
API – Application Programming Interfaces 
Traditioneel 
Model 
Met een API 
Interface 
(gemaakt door 
Bibliotheek) 
Data 
(gepubliceerd door 
Bibliotheek) 
Interface 
(gemaakt door 3e partij) 
Data 
(gepubliceerd door 
Bibliotheek)
Pioneers werk van de Trove API
Interface 
(gemaakt door 
bibliotheek) 
Data 
(gepubliceerd door 
bibliotheek) 
Trove Newspapers site zoals 
gepubliceerd door National 
Library of Australia, en gebaseerd 
op data aangeboden door de 
bibliotheek 
http://trove.nla.gov.au/newspaper
Trove kranten statistieken ontwikkeld 
door derden, gebaseerd op de data 
aangeboden door de bibliotheek 
http://wraggelabs.com/shed/trove/graphs/ 
Interface 
(gemaakt door 3e 
partij) 
Data 
(gepubliceerd door 
bibliotheek)
Headline Roulette, ontwikkeld 
door derden, gebaseerd op data 
aangeboden door bibliotheek 
http://wraggelabs.com/shed/headline-roulette/ 
Interface 
(gemaakt door 3e 
partij) 
Data 
(gepubliceerd door 
bibliotheek)
Woorden tellen van artikelen, 
ontwikkeld door derden, 
gebaseerd op data aangeboden 
door bibliotheek 
http://dhistory.org/frontpages/53/words/ 
Interface 
(gemaakt door 3e 
partij) 
Data 
(Gepubliceerd door 
bibliotheek)
Klinkt Goed! 
Maar … ?
Hoeveel mensen in dit publiek 
zouden een interface bovenop een 
API kunnen bouwen?
Hoeveel gebruikers ken je die een 
interface bovenop een API zouden 
kunnen bouwen?
Dat is het probleem wat ik aan 
jullie overlaat om te besperken. 
Hartelijk dank! 
http://www.theeuropeanlibrary.org/tel4/newspapers

More Related Content

What's hot

Bibliotheekportalen
BibliotheekportalenBibliotheekportalen
BibliotheekportalenBibnet vzw
 
Europeana Data Model voor bibliotheken
Europeana Data Model voor bibliothekenEuropeana Data Model voor bibliotheken
Europeana Data Model voor bibliothekenSally Chambers
 
Boeken toe, oren Open. Een luisterboek, dat spreekt voor zich! Oost-Vlaandere...
Boeken toe, oren Open. Een luisterboek, dat spreekt voor zich! Oost-Vlaandere...Boeken toe, oren Open. Een luisterboek, dat spreekt voor zich! Oost-Vlaandere...
Boeken toe, oren Open. Een luisterboek, dat spreekt voor zich! Oost-Vlaandere...Luisterpuntbibliotheek
 
Bibliotheekportalen achter de schermen
Bibliotheekportalen achter de schermenBibliotheekportalen achter de schermen
Bibliotheekportalen achter de schermenRosemie Callewaert
 
Dd30sept2010 workshop bibliotheekportalen
Dd30sept2010 workshop bibliotheekportalenDd30sept2010 workshop bibliotheekportalen
Dd30sept2010 workshop bibliotheekportalenBibnet vzw
 

What's hot (7)

Bibliotheekportalen
BibliotheekportalenBibliotheekportalen
Bibliotheekportalen
 
Pws
PwsPws
Pws
 
Europeana Data Model voor bibliotheken
Europeana Data Model voor bibliothekenEuropeana Data Model voor bibliotheken
Europeana Data Model voor bibliotheken
 
De evolutie van het Daisy-boek als bijzonder e-boek
De evolutie van het Daisy-boek als bijzonder e-boekDe evolutie van het Daisy-boek als bijzonder e-boek
De evolutie van het Daisy-boek als bijzonder e-boek
 
Boeken toe, oren Open. Een luisterboek, dat spreekt voor zich! Oost-Vlaandere...
Boeken toe, oren Open. Een luisterboek, dat spreekt voor zich! Oost-Vlaandere...Boeken toe, oren Open. Een luisterboek, dat spreekt voor zich! Oost-Vlaandere...
Boeken toe, oren Open. Een luisterboek, dat spreekt voor zich! Oost-Vlaandere...
 
Bibliotheekportalen achter de schermen
Bibliotheekportalen achter de schermenBibliotheekportalen achter de schermen
Bibliotheekportalen achter de schermen
 
Dd30sept2010 workshop bibliotheekportalen
Dd30sept2010 workshop bibliotheekportalenDd30sept2010 workshop bibliotheekportalen
Dd30sept2010 workshop bibliotheekportalen
 

Similar to ENP_Dutch_Infoday_MWillems

Platform voor digitale publicaties NL
Platform voor digitale publicaties NLPlatform voor digitale publicaties NL
Platform voor digitale publicaties NLElco van Staveren
 
Platform voor digitale historische kranten NL
Platform voor digitale historische kranten NLPlatform voor digitale historische kranten NL
Platform voor digitale historische kranten NLElco van Staveren
 
The Youtube of Dutch digital publications - one national platform for full-te...
The Youtube of Dutch digital publications - one national platform for full-te...The Youtube of Dutch digital publications - one national platform for full-te...
The Youtube of Dutch digital publications - one national platform for full-te...Olaf Janssen
 
HET ATHENA-PROJECT STAND VAN ZAKEN & RESULTATEN
HET ATHENA-PROJECT  STAND VAN ZAKEN & RESULTATENHET ATHENA-PROJECT  STAND VAN ZAKEN & RESULTATEN
HET ATHENA-PROJECT STAND VAN ZAKEN & RESULTATENEuropeanaLocal Project
 
De conferentie '12 erfgoed en locatie
De conferentie '12   erfgoed en locatieDe conferentie '12   erfgoed en locatie
De conferentie '12 erfgoed en locatieDouwe Jan Schrale
 
CERL. Internationaal platform voor samenwerking tussen erfgoedbibliotheken (O...
CERL. Internationaal platform voor samenwerking tussen erfgoedbibliotheken (O...CERL. Internationaal platform voor samenwerking tussen erfgoedbibliotheken (O...
CERL. Internationaal platform voor samenwerking tussen erfgoedbibliotheken (O...Vlaamse Erfgoedbibliotheken
 
Open cultuur data - Wikimedia Conferentie Nederland 2012
Open cultuur data - Wikimedia Conferentie Nederland 2012Open cultuur data - Wikimedia Conferentie Nederland 2012
Open cultuur data - Wikimedia Conferentie Nederland 2012Lotte Belice Baltussen
 
Elco van Staveren - KB
Elco van Staveren - KBElco van Staveren - KB
Elco van Staveren - KBKVANdagen
 
Archieven Portaal Europa
Archieven Portaal EuropaArchieven Portaal Europa
Archieven Portaal EuropaKVANdagen
 
20190611 contactdag erfgoeddatabanken_hergebruik_wikimediaplatformen
20190611 contactdag erfgoeddatabanken_hergebruik_wikimediaplatformen20190611 contactdag erfgoeddatabanken_hergebruik_wikimediaplatformen
20190611 contactdag erfgoeddatabanken_hergebruik_wikimediaplatformenPACKED vzw
 
ArchiefWiki en de eerste stappen op het semantische web
ArchiefWiki en de eerste stappen op het semantische webArchiefWiki en de eerste stappen op het semantische web
ArchiefWiki en de eerste stappen op het semantische webTom Cobbaert
 
Europeana 090309 Cip
Europeana 090309 CipEuropeana 090309 Cip
Europeana 090309 CipFARO
 
20190207_collectieontsluiting op_wikimedia_platformen
20190207_collectieontsluiting op_wikimedia_platformen20190207_collectieontsluiting op_wikimedia_platformen
20190207_collectieontsluiting op_wikimedia_platformenPACKED vzw
 

Similar to ENP_Dutch_Infoday_MWillems (20)

Platform voor digitale publicaties NL
Platform voor digitale publicaties NLPlatform voor digitale publicaties NL
Platform voor digitale publicaties NL
 
Archieven & eCultuur
Archieven & eCultuurArchieven & eCultuur
Archieven & eCultuur
 
Open Cultuur Data - MOMU
Open Cultuur Data - MOMUOpen Cultuur Data - MOMU
Open Cultuur Data - MOMU
 
Karin Van Honacker
Karin Van HonackerKarin Van Honacker
Karin Van Honacker
 
Platform voor digitale historische kranten NL
Platform voor digitale historische kranten NLPlatform voor digitale historische kranten NL
Platform voor digitale historische kranten NL
 
Open Cultuur Data - Eth0:2012 Summer
Open Cultuur Data - Eth0:2012 Summer Open Cultuur Data - Eth0:2012 Summer
Open Cultuur Data - Eth0:2012 Summer
 
The Youtube of Dutch digital publications - one national platform for full-te...
The Youtube of Dutch digital publications - one national platform for full-te...The Youtube of Dutch digital publications - one national platform for full-te...
The Youtube of Dutch digital publications - one national platform for full-te...
 
HET ATHENA-PROJECT STAND VAN ZAKEN & RESULTATEN
HET ATHENA-PROJECT  STAND VAN ZAKEN & RESULTATENHET ATHENA-PROJECT  STAND VAN ZAKEN & RESULTATEN
HET ATHENA-PROJECT STAND VAN ZAKEN & RESULTATEN
 
De conferentie '12 erfgoed en locatie
De conferentie '12   erfgoed en locatieDe conferentie '12   erfgoed en locatie
De conferentie '12 erfgoed en locatie
 
Het Europeana Newspapers Project
Het Europeana Newspapers ProjectHet Europeana Newspapers Project
Het Europeana Newspapers Project
 
CERL. Internationaal platform voor samenwerking tussen erfgoedbibliotheken (O...
CERL. Internationaal platform voor samenwerking tussen erfgoedbibliotheken (O...CERL. Internationaal platform voor samenwerking tussen erfgoedbibliotheken (O...
CERL. Internationaal platform voor samenwerking tussen erfgoedbibliotheken (O...
 
Open cultuur data - Wikimedia Conferentie Nederland 2012
Open cultuur data - Wikimedia Conferentie Nederland 2012Open cultuur data - Wikimedia Conferentie Nederland 2012
Open cultuur data - Wikimedia Conferentie Nederland 2012
 
Elco van Staveren - KB
Elco van Staveren - KBElco van Staveren - KB
Elco van Staveren - KB
 
Archieven Portaal Europa
Archieven Portaal EuropaArchieven Portaal Europa
Archieven Portaal Europa
 
Digitalisering voor gebruik
Digitalisering voor gebruikDigitalisering voor gebruik
Digitalisering voor gebruik
 
Contactdag erfgoeddatabanken hergebruik wikimediaplatformen
Contactdag erfgoeddatabanken hergebruik wikimediaplatformenContactdag erfgoeddatabanken hergebruik wikimediaplatformen
Contactdag erfgoeddatabanken hergebruik wikimediaplatformen
 
20190611 contactdag erfgoeddatabanken_hergebruik_wikimediaplatformen
20190611 contactdag erfgoeddatabanken_hergebruik_wikimediaplatformen20190611 contactdag erfgoeddatabanken_hergebruik_wikimediaplatformen
20190611 contactdag erfgoeddatabanken_hergebruik_wikimediaplatformen
 
ArchiefWiki en de eerste stappen op het semantische web
ArchiefWiki en de eerste stappen op het semantische webArchiefWiki en de eerste stappen op het semantische web
ArchiefWiki en de eerste stappen op het semantische web
 
Europeana 090309 Cip
Europeana 090309 CipEuropeana 090309 Cip
Europeana 090309 Cip
 
20190207_collectieontsluiting op_wikimedia_platformen
20190207_collectieontsluiting op_wikimedia_platformen20190207_collectieontsluiting op_wikimedia_platformen
20190207_collectieontsluiting op_wikimedia_platformen
 

More from Europeana Newspapers

Presentation of Philippe Mezzasalma at the BnF Information Day in Paris
Presentation of Philippe Mezzasalma at the BnF Information Day in ParisPresentation of Philippe Mezzasalma at the BnF Information Day in Paris
Presentation of Philippe Mezzasalma at the BnF Information Day in ParisEuropeana Newspapers
 
Presentation of Ioannis Anagnostopoulos at BnF Information Day
Presentation of Ioannis Anagnostopoulos at BnF Information DayPresentation of Ioannis Anagnostopoulos at BnF Information Day
Presentation of Ioannis Anagnostopoulos at BnF Information DayEuropeana Newspapers
 
Presentation of Clemens Neudecker, BnF Information Day
Presentation of Clemens Neudecker, BnF Information DayPresentation of Clemens Neudecker, BnF Information Day
Presentation of Clemens Neudecker, BnF Information DayEuropeana Newspapers
 
Presentation of Hans-Jörg Lieder, BnF Information Day
Presentation of Hans-Jörg Lieder, BnF Information DayPresentation of Hans-Jörg Lieder, BnF Information Day
Presentation of Hans-Jörg Lieder, BnF Information DayEuropeana Newspapers
 
Présentation Günter Mühlberger, BnF Information Day
Présentation Günter Mühlberger, BnF Information DayPrésentation Günter Mühlberger, BnF Information Day
Présentation Günter Mühlberger, BnF Information DayEuropeana Newspapers
 
Presentation of Claus Gravenhorst, BnF Information Day
Presentation of Claus Gravenhorst, BnF Information DayPresentation of Claus Gravenhorst, BnF Information Day
Presentation of Claus Gravenhorst, BnF Information DayEuropeana Newspapers
 
Presentation of Alaa Abi Haidar at the BnF Information Day
Presentation of Alaa Abi Haidar at the BnF Information DayPresentation of Alaa Abi Haidar at the BnF Information Day
Presentation of Alaa Abi Haidar at the BnF Information DayEuropeana Newspapers
 
IFLA 2014 Europeana Newspapers Rossitza Atanassova
IFLA 2014 Europeana Newspapers Rossitza AtanassovaIFLA 2014 Europeana Newspapers Rossitza Atanassova
IFLA 2014 Europeana Newspapers Rossitza AtanassovaEuropeana Newspapers
 
Europeana Newspapers Estonian Infoday Ragne Kouts
Europeana Newspapers Estonian Infoday Ragne KoutsEuropeana Newspapers Estonian Infoday Ragne Kouts
Europeana Newspapers Estonian Infoday Ragne KoutsEuropeana Newspapers
 
Europeana Newspapers Estonian Infoday Kristel Veimann
Europeana Newspapers Estonian Infoday Kristel VeimannEuropeana Newspapers Estonian Infoday Kristel Veimann
Europeana Newspapers Estonian Infoday Kristel VeimannEuropeana Newspapers
 
Europeana Newspapers Estonian Infoday Krista Kiisa
Europeana Newspapers Estonian Infoday Krista KiisaEuropeana Newspapers Estonian Infoday Krista Kiisa
Europeana Newspapers Estonian Infoday Krista KiisaEuropeana Newspapers
 
Europeana Newspapers Estonian Infoday Krista Aru
Europeana Newspapers Estonian Infoday Krista AruEuropeana Newspapers Estonian Infoday Krista Aru
Europeana Newspapers Estonian Infoday Krista AruEuropeana Newspapers
 
Europeana Newspapers Estonian Infoday Fred Puss
Europeana Newspapers Estonian Infoday Fred PussEuropeana Newspapers Estonian Infoday Fred Puss
Europeana Newspapers Estonian Infoday Fred PussEuropeana Newspapers
 
Europeana Newpapers LFT Infoday Neudecker
Europeana Newpapers LFT Infoday NeudeckerEuropeana Newpapers LFT Infoday Neudecker
Europeana Newpapers LFT Infoday NeudeckerEuropeana Newspapers
 
Europeana Newspapers LFT Infoday Thompson
Europeana Newspapers LFT Infoday ThompsonEuropeana Newspapers LFT Infoday Thompson
Europeana Newspapers LFT Infoday ThompsonEuropeana Newspapers
 
Europeana Newspapers LFT Infoday Rossi
Europeana Newspapers LFT Infoday RossiEuropeana Newspapers LFT Infoday Rossi
Europeana Newspapers LFT Infoday RossiEuropeana Newspapers
 
Europeana Newspapers LFT Infoday Muehlberger
Europeana Newspapers LFT Infoday MuehlbergerEuropeana Newspapers LFT Infoday Muehlberger
Europeana Newspapers LFT Infoday MuehlbergerEuropeana Newspapers
 
Europeana Newspapers LFT Infoday Messina
Europeana Newspapers LFT Infoday MessinaEuropeana Newspapers LFT Infoday Messina
Europeana Newspapers LFT Infoday MessinaEuropeana Newspapers
 
Europeana Newspapers Infoday Marchetti
Europeana Newspapers Infoday MarchettiEuropeana Newspapers Infoday Marchetti
Europeana Newspapers Infoday MarchettiEuropeana Newspapers
 

More from Europeana Newspapers (20)

Presentation of Philippe Mezzasalma at the BnF Information Day in Paris
Presentation of Philippe Mezzasalma at the BnF Information Day in ParisPresentation of Philippe Mezzasalma at the BnF Information Day in Paris
Presentation of Philippe Mezzasalma at the BnF Information Day in Paris
 
Presentation of Ioannis Anagnostopoulos at BnF Information Day
Presentation of Ioannis Anagnostopoulos at BnF Information DayPresentation of Ioannis Anagnostopoulos at BnF Information Day
Presentation of Ioannis Anagnostopoulos at BnF Information Day
 
Presentation of Clemens Neudecker, BnF Information Day
Presentation of Clemens Neudecker, BnF Information DayPresentation of Clemens Neudecker, BnF Information Day
Presentation of Clemens Neudecker, BnF Information Day
 
Presentation of Hans-Jörg Lieder, BnF Information Day
Presentation of Hans-Jörg Lieder, BnF Information DayPresentation of Hans-Jörg Lieder, BnF Information Day
Presentation of Hans-Jörg Lieder, BnF Information Day
 
Présentation Günter Mühlberger, BnF Information Day
Présentation Günter Mühlberger, BnF Information DayPrésentation Günter Mühlberger, BnF Information Day
Présentation Günter Mühlberger, BnF Information Day
 
Presentation of Claus Gravenhorst, BnF Information Day
Presentation of Claus Gravenhorst, BnF Information DayPresentation of Claus Gravenhorst, BnF Information Day
Presentation of Claus Gravenhorst, BnF Information Day
 
Presentation of Alaa Abi Haidar at the BnF Information Day
Presentation of Alaa Abi Haidar at the BnF Information DayPresentation of Alaa Abi Haidar at the BnF Information Day
Presentation of Alaa Abi Haidar at the BnF Information Day
 
IFLA 2014 Europeana Newspapers Rossitza Atanassova
IFLA 2014 Europeana Newspapers Rossitza AtanassovaIFLA 2014 Europeana Newspapers Rossitza Atanassova
IFLA 2014 Europeana Newspapers Rossitza Atanassova
 
Europeana Newspapers Estonian Infoday Ragne Kouts
Europeana Newspapers Estonian Infoday Ragne KoutsEuropeana Newspapers Estonian Infoday Ragne Kouts
Europeana Newspapers Estonian Infoday Ragne Kouts
 
Europeana Newspapers Estonian Infoday Kristel Veimann
Europeana Newspapers Estonian Infoday Kristel VeimannEuropeana Newspapers Estonian Infoday Kristel Veimann
Europeana Newspapers Estonian Infoday Kristel Veimann
 
Europeana Newspapers Estonian Infoday Krista Kiisa
Europeana Newspapers Estonian Infoday Krista KiisaEuropeana Newspapers Estonian Infoday Krista Kiisa
Europeana Newspapers Estonian Infoday Krista Kiisa
 
Europeana Newspapers Estonian Infoday Krista Aru
Europeana Newspapers Estonian Infoday Krista AruEuropeana Newspapers Estonian Infoday Krista Aru
Europeana Newspapers Estonian Infoday Krista Aru
 
Europeana Newspapers Estonian Infoday Fred Puss
Europeana Newspapers Estonian Infoday Fred PussEuropeana Newspapers Estonian Infoday Fred Puss
Europeana Newspapers Estonian Infoday Fred Puss
 
Europeana Newpapers LFT Infoday Neudecker
Europeana Newpapers LFT Infoday NeudeckerEuropeana Newpapers LFT Infoday Neudecker
Europeana Newpapers LFT Infoday Neudecker
 
Europeana Newspapers LFT Infoday Thompson
Europeana Newspapers LFT Infoday ThompsonEuropeana Newspapers LFT Infoday Thompson
Europeana Newspapers LFT Infoday Thompson
 
Europeana Newspapers LFT Infoday Rossi
Europeana Newspapers LFT Infoday RossiEuropeana Newspapers LFT Infoday Rossi
Europeana Newspapers LFT Infoday Rossi
 
Enp lft infoday_neudecker
Enp lft infoday_neudeckerEnp lft infoday_neudecker
Enp lft infoday_neudecker
 
Europeana Newspapers LFT Infoday Muehlberger
Europeana Newspapers LFT Infoday MuehlbergerEuropeana Newspapers LFT Infoday Muehlberger
Europeana Newspapers LFT Infoday Muehlberger
 
Europeana Newspapers LFT Infoday Messina
Europeana Newspapers LFT Infoday MessinaEuropeana Newspapers LFT Infoday Messina
Europeana Newspapers LFT Infoday Messina
 
Europeana Newspapers Infoday Marchetti
Europeana Newspapers Infoday MarchettiEuropeana Newspapers Infoday Marchetti
Europeana Newspapers Infoday Marchetti
 

ENP_Dutch_Infoday_MWillems

  • 1. Europeana Newspapers 28 Oktober 2014 – Den Haag Marieke Willems, LIBER Originele presentatie gepubliceerd door Alastair Dunning, The European Library @alastairdunning, www.slideshare.net/alastairdunning
  • 2. Op 15 april 1912, voer het passagiers schip Titanic, met meer dan 2.000 opvarenden, tegen een ijsschots op zijn eerste reis van Southampton naar New York
  • 3. De Titanic ramp in de kranten http://anno.onb.ac.at/cgi-content/anno?aid=nzg&datum=19120417&seite=1&zoom=33
  • 4. De Titanic ramp in de kranten http://kranten.delpher.nl/nl/view/index?query=de+telegraaf+titanic&coll=ddd&image=dd d%3A110546692%3Ampeg21%3Aa0026&page=2&maxperpage=10&sortfield=date
  • 5. De Titanic ramp in de kranten http://gallica.bnf.fr/ark:/12148/bpt6k289555z
  • 6. De Titanic ramp in de kranten http://hemerotecadigital.bne.es/details.vm?q=id:0000817544&s=0
  • 7. De Titanic ramp in de kranten
  • 8. De Titanic ramp in de kranten
  • 9. Nieuws verspreidt zich op verschillende snelheden, terwijl het belang van nieuws in verschillende mate afneemt. Dit is nu het geval, maar dat was het ook in 1912. (maar internet verandert de zaak...)
  • 10. Het Europeana Newspapers project maakt dit soort onderzoek eenvoudiger
  • 11. The European Library ontwikkelde een grensoverschrijdende doorzoekbare kranten interface (via Europeana zijn de meta-data op editie niveau doorzoekbaar) http://www.theeuropeanlibrary.org/tel4/newspapers
  • 12. Nu: Ongeveer 7 miljoen pagina's full text In 2015: 10 miljoen pagina’s full text, tot 2 miljoen kranten edities Zoeken via trefwoord, en filteren per taal, datum, bibliotheek, titel
  • 13. Blader per datum of via geografische kaart Nu: Ongeveer 7 miljoen pagina's full text In 2015: 10 miljoen pagina’s full text, tot 2 miljoen kranten edities
  • 14. Full Text van de volgende bibliotheken • Bibliotheque nationale de France / National Library France • Koninklijke Bibliotheek / National Library of the Netherlands • Landesbibliothek Dr. Friedrich Teßmann / Teßmann Library • Eesti Rahvusraamatukogu / Estonian National Library • Kansalliskirjasto / National Library of Finland • Latvijas Nacionala Biblioteka / National Library of Latvia • Biblioteka Narodowa / National Library of Poland • Milli Kutuphane Baskanligi / National Library of Turkey • Österreichische Nationalbibliothek / Austrian National Library • Staatsbibliothek zu Berlin / Berlin State Library • Staats- und Universitätsbibliothek Hamburg / State and University Library • Univerzitet u Beogradu / University Library of Belgrade Zoek per titel
  • 15. Kranten-nummer records van de volgende bibliotheken • National Library of Wales • St. Cyril and Methodius National Library / The National Library of Bulgaria • National Library of Czech Republic • National and University Library in Zagreb • Koninklijke Bibliotheek van België / Bibliothèque royale de Belgique • Narodna in univerzitetna knjinica / National and University Library of Slovenia • National Library of Portugal • National Library of Romania • Landsbókasafn Íslands - Háskólabókasafn / National and Univeristy Library of Iceland National Library of Spain • Bibliothèque nationale de Luxembourg / National Library of Luxembourg Het vinden van de bijpassende resultaten in één enkele of meerdere kranten-nummers.
  • 17. To zover, OK. Een vergelijkbare functionaliteit als van andere nationale en regionale digitale kranten archieven. Zie andere archieven via: https://www.google.com/maps/ms?msid=217164746645697066594.0004c3d764fcb71ed 2314&msa=0
  • 18. Maar wat was de reactie van de gebruiker op het samenvoegen van Europese kranten bibliotheken? Resultaten van de Usability Testing: http://www.europeana-newspapers.eu/wp-content/ uploads/2014/05/The-European-Library- Newspaper-Archive-Usability-testing-Report- April-2014.pdf
  • 19. “Overzicht van toegevoegde inhoud van de diverse bronnen werd zeer gewaardeerd. Zeer positieve houding t.o.v. de beschikbaarheid van het archief.”
  • 20. “Veel geinterviewden zouden de site graag nog eens bezoeken omdat de inhoud zich steeds uitbreidt.”
  • 21. “De mogelijkheid om via een geografische kaart te zoeken werd zeer gewaardeerd”
  • 22. Opmerkingen over het design - posities van de “advanced options” - re-organiseren van de lijst van resultaten - manipuleren van facetten
  • 23. Veel hogere verwachtingen van de functionaliteit wanneer men eenmaal was ingelogd. Bijvoorbeeld: Bewaarde zoekopdrachten Melding van nieuwe inhoud
  • 24. “Voor veel deelnemers lag de waarde van de site in de afbeeldingen van de documenten. Deelnemers verwachtten een “lokale” kopie te kunnen bewaren wanneer ze eenmaal de relevante inhoud hadden gevonden. Omdat er geen download faciliteit wordt aangeboden, leidde dit tot enige frustratie en ondermijnde dit de totale potentiële waarde van de site voor sommige deelnemers.”
  • 25. Planning voor de rest van het project Nu – Protoype versie van de interface gedeeld met project Gedurende 2014 – Voortdurende creatie van OCR, en ander gerelateerd technisch werk (OLR, Named Entities) Gedurende 2014 – Live versie website verbeterd / usability testing / toegevoegde inhoud Eind 2014 - Newspaper browser voltooid met inhoud en instrumenten van het project Meer informatie hier: http://www.europeana-newspapers.eu/ Interface hier: http://www.theeuropeanlibrary.org/tel4/newspapers/
  • 26. Dingen die de gebruikers niet meldden (maar waarvan we verwachtten dat ze dat wel zouden doen)
  • 27. Waarom kan ik de text niet bewerken? (Onze sample bestond uit wetenschappers: misschien zijn het andere communities die geïnteresseerd zijn in crowdsourcing?) NB: Als de tijd het toestaat, zal The European Library een crowdsourcing functie ontwikkelen.
  • 28. Kan ik tekst downloaden voor data mining? Onthoudt: Digitale Humanisten vormen nog steeds een klein percentage van alle humanisten en gebruikers NB: Veel van de teksten zijn pubiek domein, dus dit is wettelijk gezien haalbaar.
  • 29. Aantal gedigitaliseerde paginas in interface: c.7m Aantal gedigitaliseerde paginas Europese bibliotheken: c.130m Aantal fysieke paginas in Europese bibliotheken: 1.5bn+ Bron: European Newspaper Survey Report http://www.europeana-newspapers.eu/wp-content/uploads/2012/04/D4.1-Europeana-newspapers- survey-report.pdf
  • 30. 1,6E+09 1,4E+09 1,2E+09 1E+09 800000000 600000000 400000000 200000000 0 Project Archive Digitised Physical
  • 31. De digitale bibliotheek van het project is slechts een fractie van het kranten archief van Europa, of zelfs van de wereld.
  • 32. Hoe zouden wij, als bibliotheken, deze afwezigheid naar onze gebruikers moeten vertalen?
  • 33. Zou deze afwezigheid zichtbaar moeten zijn op de interface zelf?
  • 34. Grote witte ruimten in de lijst met resultaten?
  • 35. Erg lastig om de “gaps” in archieven weer te geven als je bedenkt dat er slechts 10% is gedigitaliseerd. Dit creëert een speld in een hooiberg… Bron: enumerate.eu
  • 36. Gestandaardiseerde beschrijvingen van gedigitaliseerde bronnen aanbieden?
  • 37. Gestandaardiseerde informatie? Voor elke digitale bron van inhoud die wordt geproduceerd in de wereld? Echt?
  • 38. Grafieken extern van de interface ?
  • 39. Er zijn ook andere issues  OCR kwaliteit variereert  Sommige pagina’s (2m in 2015) hebben artikel segmentatie  Deel van de inhoud heeft “named entity”extractie: effect op zoekresultaten.  Verschillende vergunningen in verschillende landen  Datum van copyright grenzen verschillen van land tot land.
  • 40. Hoe zouden we gebruikers kunnen helpen om de digitale bibliotheek beter te begrijpen?
  • 41. Welke rol kan de API hierin spelen? Zou het helpen om de data in de digitale bibliotheek open te stellen en verschillende manieren van onderzoek toe te staan?
  • 42. API – Application Programming Interfaces Traditioneel Model Met een API Interface (gemaakt door Bibliotheek) Data (gepubliceerd door Bibliotheek) Interface (gemaakt door 3e partij) Data (gepubliceerd door Bibliotheek)
  • 43. Pioneers werk van de Trove API
  • 44. Interface (gemaakt door bibliotheek) Data (gepubliceerd door bibliotheek) Trove Newspapers site zoals gepubliceerd door National Library of Australia, en gebaseerd op data aangeboden door de bibliotheek http://trove.nla.gov.au/newspaper
  • 45. Trove kranten statistieken ontwikkeld door derden, gebaseerd op de data aangeboden door de bibliotheek http://wraggelabs.com/shed/trove/graphs/ Interface (gemaakt door 3e partij) Data (gepubliceerd door bibliotheek)
  • 46. Headline Roulette, ontwikkeld door derden, gebaseerd op data aangeboden door bibliotheek http://wraggelabs.com/shed/headline-roulette/ Interface (gemaakt door 3e partij) Data (gepubliceerd door bibliotheek)
  • 47. Woorden tellen van artikelen, ontwikkeld door derden, gebaseerd op data aangeboden door bibliotheek http://dhistory.org/frontpages/53/words/ Interface (gemaakt door 3e partij) Data (Gepubliceerd door bibliotheek)
  • 49. Hoeveel mensen in dit publiek zouden een interface bovenop een API kunnen bouwen?
  • 50. Hoeveel gebruikers ken je die een interface bovenop een API zouden kunnen bouwen?
  • 51. Dat is het probleem wat ik aan jullie overlaat om te besperken. Hartelijk dank! http://www.theeuropeanlibrary.org/tel4/newspapers