Kooperative Angebote von GBV und GDZ im Bereich Digitalisierung Ralf Stockmann < [email_address] >
GDZ: Laufende Projekte (Auszug) <ul><li>SSG Digitalisierung (Mathematik) </li></ul><ul><li>VD17 / VD18 (seit heute 6:00: V...
Anforderungen an Massendigitalisierung <ul><li>Workflow-Steuerung </li></ul><ul><li>Computing-Kapazität </li></ul><ul><ul>...
Strategische Ziele <ul><li>Kein eigenes „Blech“ warten (Outsourcing des Betriebs in Rechenzentren) </li></ul><ul><li>Angeb...
D rei Schritte: ?
1. Schritt Volltexterkennung (OCR) <ul><li>Grundlage: ABBYY Finereader Recognition Server </li></ul><ul><li>16 Kerne </li>...
OCR <ul><li>Zielsetzung </li></ul><ul><li>Auswahl des Materials </li></ul><ul><li>Benchmarking / Standards </li></ul><ul><...
Seitenpreis: ca. 1 Cent ✗ ✔
2. Schritt Storage <ul><li>Produktionsstorage für die Wochenproduktion </li></ul><ul><li>Hintergelagerter Archivstorage fü...
3. Schritt Goobi-Hosting <ul><li>Apache, MySQL, PHP, JAVA, Tomcat, Lucéne, TYPO3, OAI, RSS, WebDAV, PDF-Renderer, ... </li...
D rei Schritte: Massendigitalisierung für jede Einrichtung <ul><li>Volltexterkennung (OCR) </li></ul><ul><li>Storage-Hosti...
Vielen Dank... ...Fragen? Ralf Stockmann (stockmann@sub.uni-goettingen.de)
Upcoming SlideShare
Loading in …5
×

Kooperative Angebote von GBV und GDZ im Bereich Digitalisierung

943 views

Published on

Published in: Education
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
943
On SlideShare
0
From Embeds
0
Number of Embeds
11
Actions
Shares
0
Downloads
3
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Kooperative Angebote von GBV und GDZ im Bereich Digitalisierung

  1. 1. Kooperative Angebote von GBV und GDZ im Bereich Digitalisierung Ralf Stockmann < [email_address] >
  2. 2. GDZ: Laufende Projekte (Auszug) <ul><li>SSG Digitalisierung (Mathematik) </li></ul><ul><li>VD17 / VD18 (seit heute 6:00: Vollasttest) </li></ul><ul><li>EZOOLO 2 </li></ul><ul><li>Rezensionszeitschriften </li></ul><ul><li>DigiWunschbuch </li></ul><ul><li>> 7 Mio. Seiten </li></ul><ul><li>Unterschiedliche Erschließung </li></ul>
  3. 3. Anforderungen an Massendigitalisierung <ul><li>Workflow-Steuerung </li></ul><ul><li>Computing-Kapazität </li></ul><ul><ul><li>Suchindex, Rendering, ... </li></ul></ul><ul><li>Storage </li></ul><ul><li>Verlässlichkeit </li></ul><ul><li>Ansprechpartner die „unsere Sprache“ verstehen </li></ul>
  4. 4. Strategische Ziele <ul><li>Kein eigenes „Blech“ warten (Outsourcing des Betriebs in Rechenzentren) </li></ul><ul><li>Angebot „von der Stange“ das an die Projektbedürfnisse angepasst werden kann (Design, spezialisiertes Retrieval) </li></ul><ul><li>Garantierte Kompatibilität zu DFG-Richtlinien (METS, TIFF, PDF, DFG-Viewer, TEI-Volltext) </li></ul><ul><li>Skalierbare Lösungen, auch für kleine Standorte sinnvoll nutzbar </li></ul><ul><li>Partner der „unsere Sprache“ versteht </li></ul>
  5. 5. D rei Schritte: ?
  6. 6. 1. Schritt Volltexterkennung (OCR) <ul><li>Grundlage: ABBYY Finereader Recognition Server </li></ul><ul><li>16 Kerne </li></ul><ul><li>80 Seiten pro Minute </li></ul><ul><li>Konvertierung des Finereader-XML Outputs in TEI P5 </li></ul><ul><li>Wortkoordinaten für Image-Highlighting </li></ul><ul><li>Derzeit nicht: Fraktur </li></ul><ul><li>In Arbeit: Fehlerrobuste Übergabe aus Goobi heraus, für Anwender transparent </li></ul>
  7. 7. OCR <ul><li>Zielsetzung </li></ul><ul><li>Auswahl des Materials </li></ul><ul><li>Benchmarking / Standards </li></ul><ul><li>Produktionsorganisation / Logistik </li></ul><ul><li>Arbeitsvorbereitungen (AV) </li></ul><ul><li>Digitalisierung </li></ul><ul><li>Qualitätskontrolle (QK) </li></ul><ul><li>Bildoptimierung / Verarbeitung </li></ul><ul><li>Metadatengenerierung </li></ul><ul><li>Präsentation / Verwertung </li></ul><ul><li>Zugang / Evaluation </li></ul><ul><li>(Langzeit) Archivierung </li></ul>OCR
  8. 8. Seitenpreis: ca. 1 Cent ✗ ✔
  9. 9. 2. Schritt Storage <ul><li>Produktionsstorage für die Wochenproduktion </li></ul><ul><li>Hintergelagerter Archivstorage für die Master-Files </li></ul><ul><li>Schneller Storage für die Präsentationsexemplare </li></ul><ul><li>Im Einzelfall zu klären: </li></ul><ul><ul><li>Datentransport </li></ul></ul><ul><ul><li>Sogar Scannen über das Netz möglich? </li></ul></ul><ul><li>Preis: im Einzelfall zu errechnen </li></ul>
  10. 10. 3. Schritt Goobi-Hosting <ul><li>Apache, MySQL, PHP, JAVA, Tomcat, Lucéne, TYPO3, OAI, RSS, WebDAV, PDF-Renderer, ... </li></ul><ul><li>Server-Bereitstellung sowohl der Produktions- als auch der Präsentationsumgebung </li></ul><ul><li>Wartung und Updates durch verschiedene Dienstleister (eventuell auch GBV selbst) </li></ul><ul><li>Vorgefertigte Layouts und Workflow-Vorlagen </li></ul><ul><li>Verfügbarkeit und Preis noch zu klären </li></ul>
  11. 11. D rei Schritte: Massendigitalisierung für jede Einrichtung <ul><li>Volltexterkennung (OCR) </li></ul><ul><li>Storage-Hosting </li></ul><ul><li>Hosting der Produktions- und Präsentations-umgebung (Goobi) </li></ul>
  12. 12. Vielen Dank... ...Fragen? Ralf Stockmann (stockmann@sub.uni-goettingen.de)

×