Ist Langzeitarchivierung finanzierbar? Präsentation Akademie Sankelmark 2008

1,255 views

Published on

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
1,255
On SlideShare
0
From Embeds
0
Number of Embeds
3
Actions
Shares
0
Downloads
3
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Ist Langzeitarchivierung finanzierbar? Präsentation Akademie Sankelmark 2008

  1. 1. Ist Langzeitarchivierung finanzierbar? Überlegungen zur Produktion langzeitarchivierbarer Objekte Ralf Stockmann, Göttinger Digitalisierungszentrum
  2. 2. Langzeitarchivierung – Was kostet es, nichts zu tun?• Dr. Ross King Austrian Research Centers• Kosten für (vergebliche) Produktion, Anzahl relevanter Dokumente, Halbwertzeit von Dokumentenformaten• Für den EU-Raum:
  3. 3. Das Göttinger Digitalisierungszentrum (GDZ)• Abteilung der Staats- und Universitätsbibliothek Göttingen (SUB)• Nationales und Internationales Service- und Kompetenzzentrum seit 1997 - zu Beginn gefördert von der Deutschen Forschungsgemeinschaft (DFG)• Entwicklung eines Produktionsworkflows für große Mengen an Digitalisaten im Printbereich• Standardisierungsaktivitäten (METS)• Mehr als 6 Millionen Seiten digitalisiert, über 4 Millionen Seiten online bereitgestellt• Konzeption, Beratung und Durchführung von Projekten (häufig kooperativ)• Zielsetzung: Masse UND Klasse
  4. 4. Gliederung• Ebenen der LZA• Komponenten und Kostenfaktoren der LZA• Kostenrechnung• Empfehlungen
  5. 5. Ebenen der LZA• Bitstream Preservation (Hardware) – Integrität der Dateien erhalten• Inhalte im Zugriff halten (Software) – Nutzung/Bedeutung der Datei erhalten – Migration – Emulation
  6. 6. Komponenten und Kostenfaktoren• Dateiformate• Produktionswerkzeuge• Metadaten• LZA-Management System (für Migration, Emulation)• Storage (4-fach redundant)
  7. 7. Produktionworkflow (Digitalisierung) Image Selection PDF Rendering, Upload, Scanning Optimization Quality Control Metadata(Bookshelf) Processing OCR, backup CMS / DMS förderungsfähig Selection Upload Produktion LZA(Bookshelf) CMS / DMS
  8. 8. Kostenfaktoren Image PDF Rendering, Upload / Scanning OptimizationPro Quality Control Metadata OCR, backup LZA cessingDateiformat Header Log PDF/A Format ArchivobjektJPG Software Software ZVDD-METS IngestTIFF EAD(FAXG4) MuseumDAT StorageJPG20003D-Scan LZA: PREMIS UpdatesHeader MigrationHardwareSoftware
  9. 9. Kosten entstehen durch…• Weiche Kosten – Change Management Prozesse – Wechsel des Workflow, Schulungen auf neue Tools und Verfahren, …• Harte Kosten – Anschaffungen – Software, Lizenzen – Hardware (Storage, RAID-Systeme)
  10. 10. Kosten Software LZA• Produktionssysteme – Open Source (Supportkosten) • Goobi (GDZ) – Kommerziell (Lizenzkosten) • ZENDpro (MDZ) • Semantics • CCS – Ziel: ingestfähige LZA Pakete• LZA Systeme – LOCKSS (open source) – KOPAL (DNB/SUB/IBM) –…
  11. 11. Beispielrechnung Storage• Lizenzgebühren LZA Software – 40.000 € p.a. – 100 TB LZA-Storage: 25.000 € einmalig • 4-fach redundant • Tape• 1TB = 250 € – Platz für 62.000 unkomprimierte TIFF Bilder A5 (16 MB pro Seite) – Kosten GDZ Jahresproduktion (3 Mio Seiten): ca. 20.000 €• Kosten pro Seite: ca. 2 Cent• Ca. 10% der Gesamtkosten
  12. 12. Dienstleistungs-Infrastruktur• Der Aufbau eigener LZA-Archive ist wenig ratsam• Dienstleister: – GWDG (KOPAL, DNB, SUB) – Leibnitz RZ (BSB) – Angebote noch nicht im Dauerbetrieb getestet
  13. 13. Werkzeuge für Format- ValidierungJHOVE (JSTOR/Harvard Object Validation Environment)Konformitätsvalidierung für:– AIFF, AIFF-C– ASCII– GIF 87a, 89a– HTML 3.2, 4.0, 4.01, XHTML 1.0, 1.1– JPEG, JFIF, SPIFF, JTIP, JPEG-LS, Exif 2.0, 2.1, 2.2– JPEG 2000 JP2, JPX– PDF 1.0 – 1.6, PDF/X-1, -1a, -2, -3, PDF/A, Tagged PDF, Linearized PDF– TIFF 4.0 – 6.0, Class B, G, P, R, Y, F, RFC 1314, TIFF/EP, TIFF/IT (CT, LW, HC, MP, BP, BL, FP, and P1, P2), GeoTIFF, TIFF-FX, Exif 2.0, 2.1, 2.2, DNG– UTF-8– WAVE, BWF– XMLhttp://hul.harvard.edu/jhove/http://www.nationalarchives.gov.uk/pronom/
  14. 14. Empfehlungen• Vorsicht vor proprietären Formaten• Formate/Metadaten jetzt umstellen, jeder Tag Verzug führt zu höheren Kosten• Bitstream Preservation jetzt garantieren (LOCKS, RAID, Verbund)• LZA Archivsysteme: abwarten bis Marktreif erwiesen und Konsolidierung erreicht• Auf dem Laufenden bleiben: – www.nestor.sub.uni-goettingen.de
  15. 15. Vielen Dank

×