Your SlideShare is downloading. ×
Duurzame ontsluiting in Archipel
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
536
On Slideshare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
8
Comments
0
Likes
0
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. Archipel: Digitale Lange Termijn Preservatie
    Inge Van Nieuwerburgh (Universiteitsbibliotheek Gent)
    Sam Coppens (Multimedia Lab)
  • 2. Inhoud
    • Doelstellingen en Uitdagingen
    • 3. Data Model
    • 4. PREMIS OWL
    • 5. Architectuur
    • 6. Voordelen content providers
    • 7. Demonstratie
  • Doelstellingen & Uitdagingen
    Doelstellingen:
    • OAIS Lange termijn preservatie van de data
    (metadata en multimedia assets)
    • Publicatie van alle informatie als Linked Open Data
  • Doelstellingen & Uitdagingen
    Uitdagingen:
    • Multi-layered metadata
    • 8. Verschillende sector-specifieke metadata
    • 9. Gemeenschappelijk metadata model
    • 10. Preservatie metadata
    • 11. Linked Open Data publicatie
    • 12. OAIS in een gedistribueerde, semantische omgeving
  • Data Model
  • 13. PREMIS OWL
  • 14. PREMIS OWL
    • Semantischeimplementatie van de PREMIS 2.1 Data Dictionary.
    • 15. Kan gebruiktwordenom preservatie informatietepublicerenals Linked Open Data.
    • 16. Gelinkt aan de preservatie vocabularies van het LOC.
    Namespace:
    http://multimedialab.elis.ugent.be/users/samcoppe/ontologies/Premis/premis.owl
    Ondergaat een standardisatie proces:
    • Archipel – LOC - BNF
    • 17. Zal weldra aangekondigd worden door het Library of Congress en naar een LOC namespace verhuizen.
  • Architectuur
  • 18. Architectuur
    Shared Repositories
  • 19. Architectuur
    LOD Server – Preservatie Platform
  • 20. Architectuur
    Integratie Server
  • 21. Architectuur
    Disseminatie modules
  • 22. Architectuur - Ingest
    1) SharedRepository via OAI-PMH:
    • Publiceert content online en maakt de content beschikbaar voor harvesting (OAI-PMH)
    MediaMosa (http://www.mediamosa.org/)
    Andere overwogen tools:
    Omeka (http://omeka.org)
    FedoraIslandora (https://wiki.duraspace.org/display/ISLANDORA/Islandora)
  • 23. Architectuur - Ingest
    2) BagIts via FTP:
    • ZIP-archieven met metadata, data en extra informatie (checksums)
    BagIt (https://wiki.ucop.edu/display/Curation/BagIt)
    exampleBag/
    |
    | manifest-md5.txt
    | (49afbd86a1ca9f34b677a3f09655eae9 data/27613-h/images/q172.png)
    | (408ad21d50cef31da4df6d9ed81b01a7 data/27613-h/images/q172.txt)
    |
    | bagit.txt
    | (BagIt-version: 0.96)
    | (Tag-File-Character-Encoding: UTF-8 )
    |
    --- data/
    | 27613-h/images/q172.png
    | (... image bytes ...)
    | 27613-h/images/q172.txt
    | (... OCR text ...)
  • 24. Architectuur - LODServer
    LODServer & Preservatie Platform:
    • Disseminatie van de content als Linked Open Data
    • 25. Preservatie van de content via semantisch webtechnologieën
  • Architectuur - LODServer
    LODServer & Preservatie Platform:
    • Ingest: OAI-PMH of via BagIts
    • 26. Characterisatie / Validatie: DROID + PRONOM + Preserv2
    • 27. Triple Store: Openlink Virtuoso Open Source
    • 28. Transcoding:
    • 29. Video/sound: FFMpeg
    • 30. Beeld: ImageMagick
    • 31. Documenten: JODConverter (OpenOfficeconverter)
    • 32. Disseminatie:
    • 33. SPARQL
    • 34. LuceneIndexing Full Text Search
    • 35. Linked Open Data
    • 36. BagIts
  • Architectuur – Integratie Server
    Integratie Server:
    • Orchestreert alle preservatie- en disseminatieprocessen.
    Porthus .Net Integration Server
  • 37. Architectuur – Integratie Server
    Disseminatie Workflow:
    Site
    Enrichment
    Triple Store
    LOD Ingest
    SPARQL
    Service Bus
    Service bus
    OAI-PMH
    Harvest
    Mapping
    Repository
  • 38. Architectuur – Integratie Server
    Preservatie Workflow:
    Consumer
    DIPs
    Triple Store
    Migration/
    Transcoding
    DIP Extract
    SPARQL
    Enrichment
    LOD Ingest
    Content store
    Characterisation
    ServiceBus
    SIP (Bagit)
    Ingest
    Cloud
    Storage
    OAI-PMH
    Harvest
    Workflow
    Tracker
    Mapping
    SIP
    creation
    Orchestration/
    Routing
    Ingest services
  • 39. Architectuur – Disseminatie Modules
    Disseminatie Modules:
    • Alle disseminatie modules maken gebruik van het SPARQL endpoint van de LOD Server
    DRUPAL
    SPARQL Views Module
    SPARQL
  • 40. Voordelen Content Providers
    • Lange termijn preservatie van de content.
    • 41. Linked Open Data publicatie van de content.
    • 42. Reconciled metadata:
    • 43. Semantische metadata
    • 44. Gelinkte metadata
    • 45. Resource based:
    • 46. SKOS vocabularies
    • 47. Personen- en Organisatie-register
    • 48. Verrijkingen
  • Demo
  • 49. Medewerkers Architectuur
    Descartes (Porthus)
    Inuits
    Krimson
    VTi
    Boekentoren
    Multimedia Lab
  • 50. Demonstrators
    Toneelstof: theater
    Ambrosia’s Tafel: mediawijsheid bij jongeren
    Constant vzw: Active Archives Video Wiki
    Klascement: portaal voor leerkrachten
    Boekentoren – UGent: portaal voor Onderzoek en hoger onderwijs
  • 51. Wensen
    Zoveel digitale audiovisuele data, zo moeilijk toegankelijk
    1 portaal voor onderzoek en onderwijs UGent: zoveel mogelijk externe bronnen
    Data datadatadata ….
  • 52. Voorwaarden
    Simpele maar krachtige zoekmogelijkheden
    Snelheid
    Eenvoudige downloadmogelijkheden
    Data mining (maar: CR)
  • 53. Technische voorwaarden
    Gebaseerd op standaarden (zie ook onderzoek in BOM_vl)
    Mogelijk integratie met andere systemen zoals ELO
    Gebaseerd op bestaande technologie
  • 54. Bestaande technologie
    Solr: zoekmachine
    Lucene index
    Representatie:
    Hangt af van bron-interface
    Zoomer beelden: IIPimage
    Streamer video en audio: CRTMP server
  • 55. File types
    Lokaal beschikbare files: 
    TIFF = input
    Pyramid TIF en JPEG2000 = zoomer (afgeleid van tiff)
    mp4 (wordt bijgewerkt), flv, mp3 (dit heeft streamer nodig)
    Afgeleiden:
    JPEG, GIF, PNG
  • 56. Search&find
    Krachtige search:
    Google-like, los van velden
    Fuzzy (ondermeer spellingsfouten worden opgevangen)
    Boolean search
    Zoeken via een kaart (= feature)
    Openurl gebaseerd: bv. verschillende formaten eenvoudig tonen
    Toegang tot de xml-beschrijving of Json-beschrijving, indien beschikbaar
  • 57. Resultaten
    Sterke zoomer
    Bladerinterface: kan complexe objecten aan
    Persistente URLs: zowel per complex object als per onderdeel (bv. boek – blz)
    Selectie en mandje (vooral organisatorische keuze wat kan)
    Toegangscontrole mogelijk
  • 58. 16 november: eindevenement archipel in deSingel in Antwerpen
    Registreren via http://archipelproject.be
  • 59. Medewerkers
    Technisch: Nicolas Franck en Patrick Hochtstenbach
    Inhoudelijk: Mui-ling Verbist en Inge Van Nieuwerburgh

×