2. • In Project EuropeanaPhotography ongeveer 450.000 vroege foto’s (1839-
1939) opgeladen in Europeana
• Bron: consortium van private en publieke archieven, foto agencies
• Digitalisatie + metadata verrijking + invoer in Europeana
• Verschillende opvolgprojecten voor hergebruikt van deze collecties voor
curatie, onderzoek en onderwijs
• Opvolgprojecten om andere periodes toe te voegen aan Europeana
• Ondersteuning van kleinere archieven om hieraan bij te dragen
CS Digital - Faculty of Arts2
Ervaring met Data hergebruik
3. • Toeleverende partners gebruikten erg verschillende databases en
beschrijvingssystemen
• Geen gemeenschappelijke thesaurus beschikbaar voor vroege fotografie
• Noodzaak 16 talen te ondersteunen
• Partners hadden geen tot weinig ervaring met data-transformatie
• Data-catalografie was gemaakt met andere doelstelling dan het bereiken van
een breed publiek
CS Digital - Faculty of Arts3
Situatie
4. • selectie EDM Fields voor project : Record ID, Title/description, Keywords,
Dimensions, Material/technique, places, autor, copyright information, photographic
type/practice
• Techniques (negatieven/positieven) gebaseerd op AAT/SEPIADES
• Practice bv. documentary photography, portraiture, advertising, news …
• Onwikkeling van een (vroege) fotografie thesaurus
• Gemeenschappelijke tussenstandaard: LIDO
• Conversies native naar LIDO
• Conversietool LIDO to EDM (MINT)
• Gecentraliseerde ingestie in Europeana
CS Digital - Faculty of Arts4
Aanpak
5. • Grote verschillen in basis data naargelang provider
• Bv veel foto’s hebben geen “titel”, beschrijving wordt door catalograaf gemaakt
• Benadering Europeana is object based, geen notie van collecties/folders/ … verlies /
deduplicatie van contextuele informatie
• In geval KU Leuven: gebruik MARC-gebaseerd bibliotheek management systeem
voor archiefdata niet optimaal
• Noodzaak transformaties via scripting
• Onvoldoende controle op gemeenschappelijke interpretatie van toepassing thesaurus
• Dereferencing van thesaurus en bestaande Linked data (Getty AAT, Wikidata, …)
• Geringe kwaliteit/ontbreken van tijdsaanduiding
• Heel weinig ervaring met XML formaat bij partners, verkiezen CSV
CS Digital - Faculty of Arts5
Problemen
6. • Heel grote vraag naar annotaties en keywords vanuit verschillende
perspectieven
• Eindgebruiker kent technische terminologie niet
• Catalografische terminologie vaak verouderd, niet meer adequaat
• Nood aan duidelijke, bevattelijke periodisering
CS Digital - Faculty of Arts6
Vanuit gebruikerskant
7. • Kunnen toevoegen van eigen groeperingen en annotaties
• Veel krachtigere zoekmogelijkheden op gehele dataset
CS Digital - Faculty of Arts7
Wensen professionele curator
8. • Liever CSV dan JSON of XML
• Graag vlot bruikbare API
• Eenduidige record identifier
• Virtuele, gedistribueerde cataloog zoals Europeana laat geen betrouwbare
tellingen toe
• Meer context bij records
CS Digital - Faculty of Arts8
Wensen onderzoeker
9. • Metadata kwaliteitsverbetering: Europeana Publishing Framework
• Photographer’s index uitwerken
• Meer mapping naar Linked data URI’s
• Ontwikkelen van “Entity Pages”
• Integration in Wikidata
• Toelaten en beheren van annotaties, aanspreken Europeana Annotations
engine
• Ontwikkelen eigen zoek/werkomgeving (WITHCrowd)
CS Digital - Faculty of Arts9
Roadmap