• Share
  • Email
  • Embed
  • Like
  • Save
  • Private Content
IMPACT Framework en Evaluatie by Clemens Neudecker
 

IMPACT Framework en Evaluatie by Clemens Neudecker

on

  • 504 views

Presentation given on the KB IMPACT Demo Day on 16 February 2011 in The Hague.

Presentation given on the KB IMPACT Demo Day on 16 February 2011 in The Hague.

Statistics

Views

Total Views
504
Views on SlideShare
446
Embed Views
58

Actions

Likes
0
Downloads
4
Comments
0

2 Embeds 58

http://impactocr.wordpress.com 57
url_unknown 1

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    IMPACT Framework en Evaluatie by Clemens Neudecker IMPACT Framework en Evaluatie by Clemens Neudecker Presentation Transcript

    • IMPACT Framework en Evaluatie Clemens Neudecker, Technisch Project Manager IMPACT
    • Achtergrond: Een uiteenlopende set van tools
      • Verschillende tools van diverse ontwikkelaars,
      • gericht op specifieke problemen
      • Verschillende platforms (Windows/Linux),
      • executables, DLL’s, SDK’s, broncode
      • Prototypes of proof-of-concept,
      • state-of-the-art commerciële producten
      • Gebruikers zonder of met weinig achtergrond in computers
    • IMPACT Framework
      • “ Een uniform technisch framework waarmee eindgebruikers op een duidelijke en consistente manier met IMPACT tools en applicaties kunnen werken”
      • Opgebouwd uit open source
      • software componenten
      • (Apache License 2.0)
      • Gebaseerd op open
      • standaarden
      • Service oriented architecture,
      • distributed processing
    • Applicatie integratie
      • Transformatie van tools naar web services met gebruik van een generieke wrapper (Java-based)
      • Web-based implementatie van tools, platform-onafhankelijk
      • Web services kunnen worden gecombineerd in workflows (ketens)
    • Workflow integratie: Mashups
      • OCR workflow =
      • data pipeline
      • Bouwstenen =
      • stappen in het proces (knooppunten)
      • Integratie =
      • interactie tussen knooppunten
      • Samenwerking myGrid
    • Workflow management
      • Web 2.0 style registry: myExperiment
      • Lokale client: Taverna Workbench
      • Web client: project website
    • Voordelen
      • Flexibel
      • Modulair
      • Transparant
      • Mogelijkheid tot uitbreiding
      • Kan gebruikt worden als: productieplatform, evaluatie framework,
      • systeem voor digitale duurzaamheid – en nog veel meer!
    • Evaluatie
      • Bibliotheken selecteren afbeeldingen voor datasets
      • (toevallig & met focus op een collectie)
      • Ground truth wordt geproduceerd
      • (100% correcte tekst en lay-out)
      • Vergelijking van workflows
      • (verschillende combinaties van tools)
    • Image Datasets
      • Collectie van datasets per institutie, status November 2010:
      • - 534,193 afbeeldingen in totaal (met uniek ID)
      • - 3.2 TB aan ruimte
      • - Metadata
    • Ground Truth
      • Ground truth = 100% correcte transformatie van tekst en lay-out (coordinaten)
      • PAGE formaat specificatie
      • Ground truthing tools
      • Ground truthing richlijnen
      • Grote handmatige inspanning,
      • niet triviaal!
    • IMPACT Framework
      • Modulaire en transparente methode voor evaluatie van specifieke workflows
    • Evaluatie: OCR Nauwkeurigheid
    • Gedeeltelijk gemist Gemist Samen- smelten Gesplitst Ground Truth Segmentatie Resultaat Mis-classi-ficatie Paragraaf (Onder)titel Evaluatie: Layout en Segmentatie
    • Live Demonstratie
      • Workflow registry
      • Lokale client
      • Web client
    •