Your SlideShare is downloading. ×
Medienübergreifende Repositorien - mehr als nur Dokumentenserver
Medienübergreifende Repositorien - mehr als nur Dokumentenserver
Medienübergreifende Repositorien - mehr als nur Dokumentenserver
Medienübergreifende Repositorien - mehr als nur Dokumentenserver
Medienübergreifende Repositorien - mehr als nur Dokumentenserver
Medienübergreifende Repositorien - mehr als nur Dokumentenserver
Medienübergreifende Repositorien - mehr als nur Dokumentenserver
Medienübergreifende Repositorien - mehr als nur Dokumentenserver
Medienübergreifende Repositorien - mehr als nur Dokumentenserver
Medienübergreifende Repositorien - mehr als nur Dokumentenserver
Medienübergreifende Repositorien - mehr als nur Dokumentenserver
Medienübergreifende Repositorien - mehr als nur Dokumentenserver
Medienübergreifende Repositorien - mehr als nur Dokumentenserver
Medienübergreifende Repositorien - mehr als nur Dokumentenserver
Medienübergreifende Repositorien - mehr als nur Dokumentenserver
Medienübergreifende Repositorien - mehr als nur Dokumentenserver
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

Medienübergreifende Repositorien - mehr als nur Dokumentenserver

375

Published on

Um den weltweiten, freien und schnellen Zugriff auf Preprint-Artikel zu ermöglichen, entstand 1991 das heute weltweit bekannte Repository-System der Physik: ArXiv.org. Mit der Zeit griffen viele …

Um den weltweiten, freien und schnellen Zugriff auf Preprint-Artikel zu ermöglichen, entstand 1991 das heute weltweit bekannte Repository-System der Physik: ArXiv.org. Mit der Zeit griffen viele Einrichtungen diese Idee auf und entwickelten sie zum praktischen Konzept des Open Access Publikationsservers mit standardisierten und zertifizierten Schnittstellen weiter.
Zunächst nur für die Sammlung von ausgewählten Hochschulschriften vorgesehen, entwickelten sich diese Dienste zu Publikationsplattformen für Volltexte, zunehmend aber auch zu Sammlungen von multimedialen Dateiformaten. Dies ermöglichte für bestimmte Materialien zunächst die Abkehr von den klassischen Druckausgaben. Aber auch das Konzept des Dokumentenservers bleibt nicht vom Medienwandel verschont, der den Fokus vom Volltext auf zusammenhängend publizierte digitale Objekte verschiebt und heute auch nachträglich digitalisierte Werke sowie Forschungsdaten umfasst. Dieser Paradigmenwechsel bedeutet für Repositorien die Notwendigkeit zur Erneuerung ihrer Infrastruktur und bibliothekarischen Workflows. Die moderne Bibliothek muss hier ansetzen und das Dienstkonzept Dokumentenserver mit dem der Digitalen Sammlungen und Mediatheken vereinen, moderne Schnittstellen schaffen und den Zielkonflikt zwischen umfassender Sammlung und Langzeitarchivierung weitestgehend auflösen.
Das an der SLUB gestartete Projekt "Medienübergreifendes Repository“ hat zum Ziel, die sächsische Publikationsplattform Qucosa in diesem Sinne technologisch neu auszurichten. Im Zuge der Entwicklung soll eine Gesamtlösung für alle digitalen Objekte gefunden werden, die es ermöglicht, die vorhandenen Workflows miteinander zu vernetzen und unterschiedliche Präsentationsformate zu unterstützen. Der Vortrag gibt einen Überblick über die Anforderungen an eine solche Technologie sowie über die sich ergebenden Möglichkeiten und berichtet vom Stand der Systementwicklung sowie den Möglichkeiten der Nachnutzung der quelloffenen Gesamtlösung.

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
375
On Slideshare
0
From Embeds
0
Number of Embeds
2
Actions
Shares
0
Downloads
0
Comments
0
Likes
0
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden slub-dresden.de © by SLUB Dresden Mehr als „nur“ Dokumentenserver Ralf Claußnitzer Medienübergreifende Repositorien 05.06.2014
  • 2. Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden slub-dresden.de © by SLUB Dresden Gesamtlösung für alle digitalen Objekte 05.06.2014 Ralf Claußnitzer, IT SLUB, (@claussni) Anforderung: Hochschulschriftenserver • Entwicklung von Pre-Print, über Post-Print-Volltext zu Gold Open Access • Fokussierung auf Dissertationen im PDF Format − Beispiel Ablieferungsform für Harvesting: Genau eine Transfer-URL, sonst ZIP-Datei − Ausdruckbar, Analysierbar - im Fall von PDF-A – Archivierbar − Anforderungen der Katalogisierung (Verbund und DNB) − Rechteübertragung verhältnismäßig unkompliziert • Sekundär auch Bilder und Tondokumente, DVD − Angabe von Hochschul-spezifischen Metadaten über Betreuer und Hochschullehrer, etc. • Oft Einbettung in Webseiten der UNI − Anpassungen am Quelltext (daher primär Webtechnologien mit geringer Einstieghürde, wie PHP MYSQL…)
  • 3. Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden slub-dresden.de © by SLUB Dresden Gesamtlösung für alle digitalen Objekte 05.06.2014 Ralf Claußnitzer, IT SLUB, (@claussni) Anforderung: Open Access Publishing Plattform • Weniger qualifizierte erschlossene Beiträge bedeuten mehr Aufwand für die Bearbeiter, mehr Nachfragen, mehr Änderungen • Unter Umständen müssen Publikationsanfragen abgelehnt werden (keine Thematische Einschränkung, aber inhaltliche) • Unklare Lizenzsituation bzw. Patentsituation kann zum Veranlassen einer Sperrung führen • Häufig müssen Embargofristen beachtet werden (Konflikt mit Abgabe und Ablieferungspflicht DNB) • Neue Veröffentlichung -> neue bibliothekarische Metadaten (schwierig bei einfachen Datenbankkonstruktionen) • Dubletten (Erkennung? Repository muss potentielle Kandidaten finden und den Administratoren vorschlagen)
  • 4. Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden slub-dresden.de © by SLUB Dresden Gesamtlösung für alle digitalen Objekte 05.06.2014 Ralf Claußnitzer, IT SLUB, (@claussni) Anforderung: Elektronische Pflichtexemplare (1) • Gesetzliche geforderte Abgabe aller elektronisch Publikationen an die Bibliothek • Basis: Pflichtexemplarrecht „Zweck des Pflichtexemplarrechtes ist heute vorrangig die möglichst vollständige Archivierung aller Veröffentlichungen eines Landes als Zeugnis des kulturellen Schaffens, ihre bibliografische Dokumentation und die Zugänglichmachung für die Allgemeinheit. Die Bibliotheken sind deshalb gesetzlich dazu verpflichtet, Pflichtexemplare auf unbegrenzte Zeit aufzubewahren und eine Nationalbibliographie zu erstellen.“ (*) http://de.wikipedia.org/wiki/Pflichtexemplar
  • 5. Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden slub-dresden.de © by SLUB Dresden Gesamtlösung für alle digitalen Objekte 05.06.2014 Ralf Claußnitzer, IT SLUB, (@claussni) Anforderung: Elektronische Pflichtexemplare (2) § 7 Beschaffenheit von Netzpublikationen und Umfang der Ablieferungspflicht (1) Unkörperliche Medienwerke (Netzpublikationen) sind in marktüblicher Ausführung und in mit marktüblichen Hilfsmitteln benutzbarem Zustand abzuliefern. Eine Pflicht zur Ablieferung besteht nicht, wenn die Ablieferungspflichtigen im Rahmen des § 16 Satz 2 des Gesetzes über die Deutsche Nationalbibliothek mit der Bibliothek vereinbaren, die Netzpublikationen zur elektronischen Abholung bereitzustellen. Für die Ablieferung von Netzpublikationen gilt § 2 Abs. 3 entsprechend; für die Bereitstellung zur elektronischen Abholung gilt § 2 Abs. 3 Satz 1 entsprechend. (2) Die Ablieferungspflicht umfasst auch alle Elemente, Software und Werkzeuge, die in physischer oder in elektronischer Form erkennbar zu den ablieferungspflichtigen Netzpublikationen gehören, auch wenn sie für sich allein nicht der Ablieferungspflicht unterliegen. Dies gilt insbesondere für nicht marktübliche Hilfsmittel, die eine Bereitstellung und Benutzung der Netzpublikationen erst ermöglichen und bei den Ablieferungspflichtigen erschienen sind. Sie sind zusammen mit den Netzpublikationen abzuliefern oder zur elektronischen Abholung bereitzustellen. http://www.gesetze-im-internet.de/pflav/__7.html
  • 6. Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden slub-dresden.de © by SLUB Dresden Gesamtlösung für alle digitalen Objekte 05.06.2014 Ralf Claußnitzer, IT SLUB, (@claussni) Anforderung: Elektronische Pflichtexemplare (3) • Nicht nur Open Access Publikationen • Portale mit unterschiedlich lizensiertem Inhalt • Formatqualität? Archivierbarkeit? • Rechtliche Bedingungen? Keine freie Verfügbarkeit bei gleichzeitiger Ablieferungspflicht über öffentliche Schnittstellen? • Wie dem Pflichtexemplar-Gesetz genügen? • Bibliothek kann Veröffentlichung im archivierbaren Format fordern, aber diese Forderung durchzusetzen ist oft nicht praktikabel • Schulung und Hilfe anbieten
  • 7. Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden slub-dresden.de © by SLUB Dresden Gesamtlösung für alle digitalen Objekte 05.06.2014 Ralf Claußnitzer, IT SLUB, (@claussni) Anforderung: Digitalisate • Digitalisate im Repository? Ja, weil: Digitales Objekt (Born Digital oder Digital Reformatting aka Retrodigitalisate) • Behandlung bisher getrennt von Repositorien in „Digitalen Sammlungen“ und Bilddatenbanken • Aber: Born Digitals und Retrodigitalisiate teilen sich viele Eigenschaften (URIs, Dateien, Präsentation im Web) • Und: Technologisch im Grunde kein Unterschied • Datenqualität deutlich homogener (Bilder, Beschreibungsformate wie METS/MODS) • Metadatenerfassung meist ausreichend standardisiert • DFG Richtlinien haben zu eingehender Standardisierung in diesem Bereich geführt • Zu Beachten: Behandlung von Digitalisaten auf Grund ihrer Größe deutlich teurer, Synergien in der Administration helfen Aufwand insgesamt zu verringern
  • 8. Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden slub-dresden.de © by SLUB Dresden Sammlung vs. Langzeitarchivierung 05.06.2014 Ralf Claußnitzer, IT SLUB, (@claussni) Qualitätsabwägung • Möglichst umfassende Sammlung von Netzpublikationen erfordert Verringerung der (technischen) Qualitätsanforderungen • (echte) Langzeitarchivierung erfordert aber hohe Qualität • Umwandlung nicht immer möglich (oder erlaubt)
  • 9. Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden slub-dresden.de © by SLUB Dresden Sammlung vs. Langzeitarchivierung 05.06.2014 Ralf Claußnitzer, IT SLUB, (@claussni) Service Levels • Definition von Service Levels: • LZA Ampelsystem • Den Nutzer schon bei der Abgabe über den bereitstellbaren Service Level informieren • Schlussfolgerung für den Export ins Archivierungssystem • Prüfung durch Programme wie JHove (Dienste, bereitgestellt vom LZA System) http://www.dcc.ac.uk/resources/external/jhove2 Gute Archivierbarkeit Schlechte Archivierbarkeit Keine Archivierbarkeit
  • 10. Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden slub-dresden.de © by SLUB Dresden Vorhandene Workflows vernetzen 05.06.2014 Ralf Claußnitzer, IT SLUB, (@claussni) • Workflows zur Bearbeitung von elektronischen Publikationen meist sehr individuell und Erfassungs-fokussiert • Werkzeuge sind entsprechend spezialisiert • Workflows für Digitalisate auf Durchsatz optimiert -> ohne Automatisierung ist dem Aufkommen eines Digitalisierungszentrums nicht beizukommen • Produktion der digitalen Objekte unterschiedlich. Verwaltung und Präsentation hingegen sehr ähnlich! • Technische Workflows: − Archivierung − Backup − Migration − Datenhaltung! − Bereitstellung
  • 11. Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden slub-dresden.de © by SLUB Dresden Verschiedene Präsentationsformate 05.06.2014 Ralf Claußnitzer, IT SLUB, (@claussni) • Liegen digitale Objekte in bekannten Formaten vor, können automatische (on- demand) Umwandlungen erfolgen, z.B. PDF als ePUB ausliefern • Digitalisate werden bereits in herunterladbaren PDFs angeboten • Inhaltsverzeichnisse, wenn Strukturmetadaten das hergeben • Weiter denkbar: − Video Anzeige − Bildvorschau (Thumbnails) − Audio Streaming − OCR Text Einbettung
  • 12. Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden slub-dresden.de © by SLUB Dresden Anforderungen und Möglichkeiten 05.06.2014 Ralf Claußnitzer, IT SLUB, (@claussni) • Born-Digitals und Digitalisierungen zusammenlegen und gleichartige Objekte auch gleichartig behandeln • Erweiterbarkeit: Metadatenstandards voll ausnutzen • Behandlung sehr großer Dateien > 300Mb > 1Tb (Übertragung aus technischen Gründen oft beschränkt, Alternative aktiver Download) • DRM Check, Einschätzung der Archivierbarkeit, Transparente Erklärung zu den Gründen, Möglicherweise Anpassung bei der Dokumenterstellung • Nutzungseinschränkung: Allg.: Durchsetzen der Lizenzbestimmung. (In einigen Fällen nicht mit vertretbarem Aufwand zu realisieren) • Nicht mehrere Backendsysteme einsetzen (z.B.: mehrere unterschiedliche Implementationen des OAI Protokolls, ) • Organisatorisch-Technische Vorteile ausnutzen
  • 13. Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden slub-dresden.de © by SLUB Dresden Notwendigkeit zur Erneuerung der Infrastruktur 05.06.2014 Ralf Claußnitzer, IT SLUB, (@claussni) Qucosa • SLUB Repository Qucosa − Seit 2010 − OPUS4 basiert (PHP, MySQL, Non-Standard Schema) − Mandantenunterstützung − TYPO3 Frontend • Erfordert generischere Metadaten (keine Anwendungsfallbasierten) • Konsequenter Einsatz von Standards • Langzeitarchivierung mit bedenken • Schnittstellen: Sehr unterschiedliche Anforderungen, Verbindung mit Durchsetzung von Lizenzen • MediaTypes (application/mods+xml)! • MediaTypes sind nicht nur andere Form der Dateiendung. Sie beschreiben auch das Protokoll
  • 14. Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden slub-dresden.de © by SLUB Dresden Stand der Entwicklung Qucosa 05.06.2014 Ralf Claußnitzer, IT SLUB, (@claussni) • Fedora 3.7.1 als Repository Generisch, Schemaunabhängig • ElasticSearch 1.2.x Cluster-fähiger Suchindex, Lucene Core, REST API, Indexierung der Daten mit Fedora River (Eigenentwicklung) • Legacy API Migration von OPUS4 Kern nach Fedora abgeschirmt durch Legacy API (setzt Qucosa Protokoll auf Fedora API Aufrufe um) • Fedora 4 nächster großer Schritt, aber: Fundamental anderes Konzept. Migration von Fedora 3.x erst mit Fedora 4.1 geplant • Intensivierter Einsatz Apache Camel und Apache ActiveMQ Generisches Messaging und Application Integration (SLUB Datenmanagement Plattform d:swarm für Suchindex) • TYPO3 Frontend für Fedora 3 (mit Option 4) geplant
  • 15. Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden slub-dresden.de © by SLUB Dresden Nachnutzung der Gesamtlösung 05.06.2014 Ralf Claußnitzer, IT SLUB, (@claussni) • Lizenzierung • Qucosa Code GPLv3 (Legacy API nicht sinnvoll nachnutzbar) • Fedora Content Model als Anschauungsobjekt • ElasticSearch basierter Code Apache Licence 2.0 • Quelltexte auf GitHub − https://github.com/slub/qucosa-webapi − https://github.com/slub/elasticsearch-river-fedora − https://github.com/slub/qucosa-fcrepo-contentmodel − TYPO3 Frontend soll auch dort veröffentlicht werden
  • 16. Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden slub-dresden.de © by SLUB Dresden Vielen Dank für die Aufmerksamkeit! Ralf Claußnitzer ralf.claussnitzer@slub-dresden.de 05.06.2014 Ralf Claußnitzer, IT SLUB, (@claussni)

×