Matthias Priem, manager digitalisering bij VIAA, schetst hoe VIAA verschillende ontsluitingsplatformen heeft uitgebouwd, en gaat dieper in op enkele belangrijke aspecten van ontsluiting:
1) Afspraken en licenties 2) Metadata 3) Content: uniforme formaten 4) Architectuur 5) Rapportering
3. Cijfers en schaal
• We bestaan 6 jaar
• We werken voor 150 content partners
• We doen drie dingen (meestal ook in die
volgorde)
Digitaliseren → Digitaal archiveren → Interactie
want: Quid Pro Quo
4. Cijfers en schaal (waar staan we nu?)
• Archief op dit moment: 4 mio items (12 PB)
• We runnen een aantal platformen voor
ontsluiting
• Archief voor Onderwijs (offering naar het leerplichtonderwijs) - 18k
• Nieuws van de Groote Oorlog - 50k kranten (250.000 pages)
• Catalogus Pro - 950k A/V objecten
• In 2019 : hetarchief.be - 600k metadata publiek beschikbaar
• In 2020 : nieuwe versie Archief voor Onderwijs
• In 2021 : leeszaal applicatie voor content partners
• … + API’s zodat CP’s er zelf mee aan de slag kunnen.
5. ● Niet zo heel veel content (18k items)
● Redactieproces zeer belangrijk
● Sterk verrijkte / opgeschoonde metadata
● Zeer rijk qua functionaliteit
● 56.000 accounts op dit moment
● Leerkrachten ONLY
6. ● Relatief grote collectie (250k kranten), statisch
● Campagne website (herdenking WO-I)
● Publiek beschikbaar
● OCR, veel metadata beschikbaar,
● Oud materiaal, weinig risico op copyright claims
● We gebruiken dit nu voor Linked Data POC’s
7. ● Ongeveer 1 mio items beschikbaar (enkel A/V)
● Wordt dagelijks automatisch bijgewerkt (geen redactie)
● Metadata zoals ze is
● Voor specifiek publiek: VIAA content partners.
8. Vraag
• Elk platform heeft zijn specificiteit.
• Elk platform heeft noden naar verdere
ontwikkeling of onderhoud.
• Toekomst: meer content, meer users.
• Hoe kunnen we zorgen dat we dit kostenefficiënt
kunnen blijven doen?
10. 1. Afspraken en licenties
• Het is ons materiaal niet. Goeie heldere afspraken zijn
cruciaal.
• We moeten weten wat we met welk materiaal mogen doen.
• We hebben dat vertaald naar
• een aantal licenties op het materiaal (~flags in onze systemen)
• een proces waarbij die licenties (grotendeels automatisch) ingesteld
worden, bvb op basis van metadata
• Gebruikersovereenkomsten op de site zelf
11. Voorbeeld van licenties
Bron : https://viaa.be/nl/portaal/support-category/item/viaa-licenties-in-het-archiefsysteem
14. 2. Metadata - hoera voor standaarden
• We hebben verschillende soorten materiaal (kranten, audio,
video, foto)
• We hebben verschillende oorsprongen van het materiaal
(omroepen vs. archief vs. cultuur)
• Alle objecten worden omschreven aan de hand van 1
gemeenschappelijk metadatamodel, dat mapt naar een aantal
zaken → ebuCore // dc.terms // dublin.core // METS
(dat heeft ook nadelen)
16. 3. Content - uniforme formaten
• We hebben verschillende soorten materiaal (kranten, audio,
video, foto)
• We hebben verschillende oorsprongen van het materiaal
(omroepen vs. archief vs. cultuur)
• Alle objecten worden tijdens de import getranscodeerd naar
een beperkt aantal types materiaal, die heel geschikt zijn voor
ontsluiting
• audio : m4a, mp3
• video : mp4
• foto : jpeg (soms jp2)
17. 4. Architectuur
• Er is een bepaalde ‘levenscyclus’ van digitaal materiaal en/of
de metadata van dat materiaal
• Passeert mogelijk een aantal platformen vooraleer een
gebruiker het ziet op het ontsluitingsplatform
• Komt potentieel niet allemaal uit dezelfde systemen
• ⇒ Duidelijke en zo eenvoudig mogelijke architectuur is
cruciaal om zaken op schaal te laten werken.
18. voorbeeld architectuur
Media Asset Management Systeem
Metadata
(en licenties)
Archief Master
Links naar
Browse kopie
API’s (bvb. OAI-PMH)
Nieuw Materiaal
Browse kopie
Storage
“geef alle metadata + link naar
video voor alles wat naar
onderwijs mag”
“geef alle metadata + link
naar video voor alles wat naar
cat pro mag”
METADATA
UPDATES
DOOR
USERS
21. Historiek + toekomst
● 2014 : eerste byte in het archief + launch testbeeld (als eiland)
● 2015 : launch nieuws van de groote oorlog (als eiland)
● 2016 : migratie testbeeld + launch AvO, gekoppeld op de API
● 2018 : launch Catalogus Pro, gekoppeld op de API
● 2019 : launch hetarchief.be, gekoppeld op de API
(metadata cat)
● 2021 : bouw leeszaal applicatie
● 2022 : herziene versie hetarchief.be
● … etc etc.
22. Nieuwe uitdagingen
● Vaststelling: we hebben veel ontsluitingsplatformen
● Vaststelling: we hebben meerdere technologieën in huis.
● Vaststelling: veel functionaliteit komt terug, bvb.
○ Inloggen (en paswoord reset, profielbeheer, …)
○ Zoeken
○ Metadata bekijken
○ Media bekijken
● Kunnen we dit niet efficiënter organiseren?
23. Ook hier zijn standaarden
heel dankbaar, bvb: S3 voor
opslag, JWT voor tokens,
IIIF voor images, ...
24. Voorbeelden componenten
● Event logging : content partners moeten over platformen
heen rapporten kunnen krijgen. Iedereen logt op dezelfde
manier.
● Zoeken : gemeenschappelijke elasticsearch cluster die
specifiek op VIAA content ingericht kan worden
● Player : 1 mediaspeler met ingebouwd security, ondertitels,
logo overlay, etc.
● Winst? ⇒ Eenvoudiger, goedkoper, sneller platformen
bouwen.
26. Case industriemuseum
● IM : maakt (net als VIAA zelf) gebruik van de VIAA
componenten om de eigen collectie te ontsluiten.
● Kadert in een bredere visie van hoe men wil omgaan met
digitale content en collecties.
28. Linked data projecten op NvdGO
● NvdGO heeft veel metadata, en content is makkelijk te
hergebruiken, laag risico op claims.
● 2 projecten
○ Metadata is beschikbaar via JSON-LD als linked (open) data
○ Metadata is verrijkt met links naar namenlijst
29. Linked data projecten op NvdGO
Voorbeeld: https://nieuwsvandegrooteoorlog.hetarchief.be/nl/media/ons-vlaanderen/T2HCWUXLMRUVTOeJbUeCoWUS
30. Linked data projecten op NvdGO
Voorbeeld: https://nieuwsvandegrooteoorlog.hetarchief.be/nl/media/ons-vlaanderen/T2HCWUXLMRUVTOeJbUeCoWUS