• Share
  • Email
  • Embed
  • Like
  • Save
  • Private Content
BSB Demo Day - Balk-Pennington de Jongh - Projektvorstellung
 

BSB Demo Day - Balk-Pennington de Jongh - Projektvorstellung

on

  • 307 views

 

Statistics

Views

Total Views
307
Views on SlideShare
247
Embed Views
60

Actions

Likes
0
Downloads
2
Comments
0

1 Embed 60

http://impactocr.wordpress.com 60

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    BSB Demo Day - Balk-Pennington de Jongh - Projektvorstellung BSB Demo Day - Balk-Pennington de Jongh - Projektvorstellung Presentation Transcript

    • IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. Ein Überblick über das IMPACT Projekt Twitter: @impactocr, #impactprojectHildelies Balk, IMPACT Project Director, KB Nationalbibliothek der Niederlande
    • Twitter: @impactocr, #impactprojectIMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.Aufbau der Präsentation Herausforderungen bei der Digitalisierung von historischen Texten Das IMPACT Projekte und seine Ziele Ergebnisse des IMPACT Projekts 2
    • Twitter: @impactocr, #impactproject IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.Herausforderungen 3
    • Twitter: @impactocr, #impactproject IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.DutchNewspaperonline 4
    • Twitter: @impactocr, #impactprojectIMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.Eine Nachricht an die Benutzer 5
    • Twitter: @impactocr, #impactprojectIMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.Herausforderungen für die ZeichenerkennungVVt Venetien den 1.Junij, Anno 1618.DJgn i f paffato te S aöJifeert mo?üen/bah .)etgiuotbciraetail)i.r/JtmelchontDecht te /sbnbe bele btr felbrr geiufttceert baer bnber eeniglje jprant o^fen/bie ftcb .metbeSpaenfcbeu enbeeemgljen bifet Cbeiiupcen berbonbru befe 6
    • Twitter: @impactocr, #impactprojectIMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.Papier gewellt (auf Grund von Feuchtigkeit) 7
    • Twitter: @impactocr, #impactprojectIMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.Durchscheinen von Text Niedrige Qualität der Vorlage: unscharf, ausgefranst, schlechter Druck 8
    • Twitter: @impactocr, #impactprojectIMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.Frakturschriften 9
    • Twitter: @impactocr, #impactprojectIMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.Handgeschriebene Anmerkungen 10
    • Twitter: @impactocr, #impactprojectIMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.Komplexes Layout der Seiten 11
    • Twitter: @impactocr, #impactproject IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. Herausforderungen durch historische Sprache: archaische Schreibweisen, orthographische Variationen, Flexion und vieles mehrHistorische Schreibweisen des niederländischen Worts ‘wereld’(die Welt):werelt weerelt wereld weerelds wereldt werelden weereld werrelts waerelds weerlytwereldts vveerelts waereld weerelden waerelden weerlt werlt werelds sweerelszwerlys swarels swerelts werelts swerrels weirelts tsweerelds werret vverelt werltswerrelt worreld werlden wareld weirelt weireld waerelt werreld werld vvereld weereltswerlde tswerels werreldts weereldt wereldje waereldje weurlt wald weëled 12
    • Twitter: @impactocr, #impactprojectIMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.Herausforderungen auf institutioneller Ebene: Fehlenvon Erfahrungswerten und Expertise → Ineffizienz 13
    • Twitter: @impactocr, #impactproject IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.Das IMPACT Projekte und seine Ziele 14
    • Twitter: @impactocr, #impactprojectIMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.IMPACT nimmt sich der Probleme anIMPACT – Improving Access to Text (2008-2011) Large-scale integrating research project Konsortium von 26 Partnern Guter Mix aus öffentlichen und kommerziellen Organisationen Benutzer, Wissenschaftler und Industrie arbeiten gemeinsam an Lösungen Partner mit etablierten internationalen Beziehungen Koordiniert von der Nationalbibliothek der Niederlande (KB) Gefördert durch die EU (FP7 ICT Work Programme) Ab 2012: nachhaltiges Kompetenzzentrum mit alternativen Ressourcen 15
    • IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. 16
    • IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. 17
    • Twitter: @impactocr, #impactprojectIMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.Ziele des IMPACT Projekts Verbesserungen bei der Massendigitalisierung von historischen Drucken durch: Innovationen bei OCR Software und Sprachtechnologien → Tools für jeden Schritt eines Digitalisierungsworkflows, vom Scannen bis zur Bereitstellung Teilen von Expertise und Verbreitung von Wissen in ganz Europa Sicherstellen dass Tools und Services nach dem Ende des Projekts verfügbar bleiben 18
    • Twitter: @impactocr, #impactprojectIMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.Ergebnisse aus dem IMPACT Projekt Einige Beispiele Zusammenfassung 19
    • Twitter: @impactocr, #impactproject IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.Vorverarbeitung: Neue Ansätze zur Bildverbesserung vorher nachherRandentfernung und Textbegradigung, entwickelt durch NCSR und USAL 20
    • Twitter: @impactocr, #impactproject IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.OCR: Verbesserte kommerzielle Tools (verfügbar):ABBYY FineReader Engine 10 Historische Europäische Schriften: FRE10 Erkennung von historischen Schriften: 25% genauer als FRE9 38% genauer als FR XIX 21
    • Twitter: @impactocr, #impactproject IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.OCR Korrektur: Zwei effektive Tools bereit zurImplementierung Beide machen Gebrauch von Freiwilligen CONCERT von IBM: collaborative correction, integriert die Adaptive OCR → vielversprechende Piloten in mehreren Bibliotheken LMU Post correction tool basierend auf Sprachtechnologie → Piloten stehen kurz bevor 22
    • Twitter: @impactocr, #impactprojectIMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. Sprachtechnologien: Lexika für neuen europäische Sprachen Korrektur des langen S mit Hilfe des IMPACT Lexikon für historisches Niederländisch 23
    • Twitter: @impactocr, #impactproject IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.Nachbearbeitung: Erkennung des Satzspiegel Functional Extension Parser von UIBK Erkennung der Strukturmerkmale eines Dokuments Anreicherung der OCR Resultate mit Strukturinformation 24
    • Twitter: @impactocr, #impactprojectIMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.Evaluierung: IMPACT Framework Modulare und transparente Methode um spezifische Workflows zu evaluieren 25
    • Twitter: @impactocr, #impactprojectIMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.Evaluierung: IMPACT Dataset Mehr als eine halbe Million repräsentative Seiten aus digitalisierten historischen Dokumenten (Zeitungen, Bücher, Pamphlete, Protokolle) aus den Sammlungen von 11 Europäischen Bibliotheken, mit unique IDs und Metadaten Wertvolle Ressource für zukünftige Forschung in OCR und Sprachtechnologien 26
    • Twitter: @impactocr, #impactproject IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.IMPACT Ergebnisse: ZusammenfassungAuf dem Markt: Verbesserte kommerzielle OCRBereit für Tests unter realen Bedingungen: – Adaptive OCR Engine – Tools für OCR Korrektur unter Einbeziehung Freiwilliger – Computerlexica für neun SprachenSchon bald verfügbar: – Digitalisierungframework mit Evaluierungstools und Dataset – Datenbank mit Digitalisierungswissen, Richtlinien und Lernmaterialien – Service für Strukturanreicherung, SatzspiegelerkennungFür die weitere Entwicklung: – Neue Ansätze zur Vorverarbeitung, OCR und Nachkorrektur – Tools zum Erstellen von LexicaExtra: Einzigartiges Netzwerk bringt Experten aus verschiedenen Bereichen zusammenKompetenzzentrum wird im Rahmen der Abschlusskonferenz am 24-25 Oktober 2011 gestartet 27
    • Twitter: @impactocr, #impactproject IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands. Fragen? impact@kb.nl www.impact-project.euVielen Dank für Ihre Aufmerksamkeit! 28