Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
Upcoming SlideShare
Manual Fusca 1950
Next
Download to read offline and view in fullscreen.

0

Share

Download to read offline

Kooperative Angebote von GBV und GDZ im Bereich Digitalisierung

Download to read offline

Related Books

Free with a 30 day trial from Scribd

See all
  • Be the first to like this

Kooperative Angebote von GBV und GDZ im Bereich Digitalisierung

  1. 1. Kooperative Angebote von GBV und GDZ im Bereich Digitalisierung Ralf Stockmann < [email_address] >
  2. 2. GDZ: Laufende Projekte (Auszug) <ul><li>SSG Digitalisierung (Mathematik) </li></ul><ul><li>VD17 / VD18 (seit heute 6:00: Vollasttest) </li></ul><ul><li>EZOOLO 2 </li></ul><ul><li>Rezensionszeitschriften </li></ul><ul><li>DigiWunschbuch </li></ul><ul><li>> 7 Mio. Seiten </li></ul><ul><li>Unterschiedliche Erschließung </li></ul>
  3. 3. Anforderungen an Massendigitalisierung <ul><li>Workflow-Steuerung </li></ul><ul><li>Computing-Kapazität </li></ul><ul><ul><li>Suchindex, Rendering, ... </li></ul></ul><ul><li>Storage </li></ul><ul><li>Verlässlichkeit </li></ul><ul><li>Ansprechpartner die „unsere Sprache“ verstehen </li></ul>
  4. 4. Strategische Ziele <ul><li>Kein eigenes „Blech“ warten (Outsourcing des Betriebs in Rechenzentren) </li></ul><ul><li>Angebot „von der Stange“ das an die Projektbedürfnisse angepasst werden kann (Design, spezialisiertes Retrieval) </li></ul><ul><li>Garantierte Kompatibilität zu DFG-Richtlinien (METS, TIFF, PDF, DFG-Viewer, TEI-Volltext) </li></ul><ul><li>Skalierbare Lösungen, auch für kleine Standorte sinnvoll nutzbar </li></ul><ul><li>Partner der „unsere Sprache“ versteht </li></ul>
  5. 5. D rei Schritte: ?
  6. 6. 1. Schritt Volltexterkennung (OCR) <ul><li>Grundlage: ABBYY Finereader Recognition Server </li></ul><ul><li>16 Kerne </li></ul><ul><li>80 Seiten pro Minute </li></ul><ul><li>Konvertierung des Finereader-XML Outputs in TEI P5 </li></ul><ul><li>Wortkoordinaten für Image-Highlighting </li></ul><ul><li>Derzeit nicht: Fraktur </li></ul><ul><li>In Arbeit: Fehlerrobuste Übergabe aus Goobi heraus, für Anwender transparent </li></ul>
  7. 7. OCR <ul><li>Zielsetzung </li></ul><ul><li>Auswahl des Materials </li></ul><ul><li>Benchmarking / Standards </li></ul><ul><li>Produktionsorganisation / Logistik </li></ul><ul><li>Arbeitsvorbereitungen (AV) </li></ul><ul><li>Digitalisierung </li></ul><ul><li>Qualitätskontrolle (QK) </li></ul><ul><li>Bildoptimierung / Verarbeitung </li></ul><ul><li>Metadatengenerierung </li></ul><ul><li>Präsentation / Verwertung </li></ul><ul><li>Zugang / Evaluation </li></ul><ul><li>(Langzeit) Archivierung </li></ul>OCR
  8. 8. Seitenpreis: ca. 1 Cent ✗ ✔
  9. 9. 2. Schritt Storage <ul><li>Produktionsstorage für die Wochenproduktion </li></ul><ul><li>Hintergelagerter Archivstorage für die Master-Files </li></ul><ul><li>Schneller Storage für die Präsentationsexemplare </li></ul><ul><li>Im Einzelfall zu klären: </li></ul><ul><ul><li>Datentransport </li></ul></ul><ul><ul><li>Sogar Scannen über das Netz möglich? </li></ul></ul><ul><li>Preis: im Einzelfall zu errechnen </li></ul>
  10. 10. 3. Schritt Goobi-Hosting <ul><li>Apache, MySQL, PHP, JAVA, Tomcat, Lucéne, TYPO3, OAI, RSS, WebDAV, PDF-Renderer, ... </li></ul><ul><li>Server-Bereitstellung sowohl der Produktions- als auch der Präsentationsumgebung </li></ul><ul><li>Wartung und Updates durch verschiedene Dienstleister (eventuell auch GBV selbst) </li></ul><ul><li>Vorgefertigte Layouts und Workflow-Vorlagen </li></ul><ul><li>Verfügbarkeit und Preis noch zu klären </li></ul>
  11. 11. D rei Schritte: Massendigitalisierung für jede Einrichtung <ul><li>Volltexterkennung (OCR) </li></ul><ul><li>Storage-Hosting </li></ul><ul><li>Hosting der Produktions- und Präsentations-umgebung (Goobi) </li></ul>
  12. 12. Vielen Dank... ...Fragen? Ralf Stockmann (stockmann@sub.uni-goettingen.de)

Views

Total views

1,144

On Slideshare

0

From embeds

0

Number of embeds

11

Actions

Downloads

3

Shares

0

Comments

0

Likes

0

×