3. Methode
thans:
- patroonherkenning van woorden en delen van woorden
in de toekomst ook:
- regelmatigheden van de inhoud van teksten (statistische
computerlinguistiek )
- layout-analyse
3
4. Resultaat
1 Applicatie voor het zoeken en vinden van teksten in
gedigitaliseerd handgeschreven materiaal
2 Transcriptieomgeving voor het transcriberen / annoteren
van gedigitaliseerd handgeschreven materiaal
4
16. En hoe verder ?
Nationaal Archief:
- SLA afsluiten met leverancier
- Inbouwen met behulp van een REST-interface in de eigen
website van het Nationaal Archief
Leveranciers (RUG-AI en Target Holding bv):
- Verder ontwikkelen van MONK, met als doel:
- minder transcriptie per handschrift
- hogere en betere zoekresultaten
- geringere en goedkopere opslagcapaciteit
- verbeterde gebruikersinterface
- verbeterde inschakeling van “the crowd”
16
17. Mogelijkheden voor ú ...
Beschikt u over
- omvangrijk corpus teksten, in hetzelfde handschrift
geschreven
- hoogwaardig gedigitaliseerd, bij voorkeur in TIFF
Neem dan contact op met
17
18. Meer informatie
Het Catch-programma van NWO:
http://www.nwo.nl/nwohome.nsf/pages/NWOP_7XXTW7
Het Scratch4All-project:
http://www.catchplus.nl/projecten/deelprojecten/scratch4all/
Het wetenschappelijk onderzoek:
http://www.ai.rug.nl/alice/nwo-catch-scratch/
De exploitatie:
http://www.target-holding.nl/
18