8. Mijn project
Hoe kunnen tijd en aspect omgezet worden van natuurlijke taal
naar pictogrammen?
A Hoe kan het bepalen van de werkwoordstijd mogelijk gemaakt
worden?
B Hoe kunnen tijd en aspect het beste gerepresenteerd worden in
pictogrammen?
9. Chunker en Clause detector
> Chunker: NP, VP, PP
> Clause detector: Hoofdzin, bijzin, relatieve bijzin
Input:
De witte kat die in de boom slaapt zingt vals
Output:
kleur-wit kat zingen vals
kleur-wit kat slapen in boom
10. Werkwoordscombinaties
3 basispatronen:
A Persoonsvorm: Ik eet/at friet.
WW(pv, tgw) → L
WW(pv, verl) → P L
B Persoonsvorm + voltooid deelwoord: Ik heb friet gegeten.
WW(pv, tgw)|hebben, WW(vd, vrij) → P L
C Persoonsvorm + infintief: Ik ga friet eten
WW(pv, tgw)|gaan, WW(inf, vrij) → F L
L = Lemma WW
P = Verleden tijd
F = Toekomende tijd
Bron: Van Eynde, F. (2004) Part of Speech Tagging van het Corpus Gesproken
Nederlands
11. Vertaling
De weergave van tijd:
X
Verleden(P) Heden Toekomst(F)
Probleem
Nederlands heeft 8 werkwoordstijden: te veel complexiteit
- Weergave abstracta als ‘voltooidheid’?
- Tegenstrijdigheden: voltooid verleden toekomende tijd?
Haeseryn et al. (1997) Algemene Nederlandse Spraakkunst
12. Aspect
We aten een ijsje.
WW(pv, verl)
We hebben een ijsje gegeten.
WW(pv, tgw)_hebben, WW(vd, vrij)
We hadden een ijsje gegeten.
WW(pv, verl)_hebben, WW(vd, vrij)
13. Aspect
We aten een ijsje.
WW(pv, verl) → P L
We hebben een ijsje gegeten.
WW(pv, tgw)_hebben, WW(vd, vrij) → P L
We hadden een ijsje gegeten.
WW(pv, verl)_hebben, WW(vd, vrij) → P L
“Wij P eten ijsje”
15. Weglating ‘lege’ HWW
We zullen friet gegeten gaan hebben .
“Wij Fut eten friet”
Maar:
Wij zouden friet gegeten gaan hebben.
Nu: synoniem met “We aten friet”.
→ extra pictogram?
16. Weglating ‘lege’ HWW
We zullen friet gegeten gaan hebben .
“Wij Fut eten friet”
Mogelijk toevoeging:
Wij zouden friet gegeten gaan hebben.
21. Conclusie
3 simpele basispatronen:
Heden: L (L+)
Verleden: P L (L+)
Toekomst: F L (L+)
• Gemakkelijk herkenbaar
• Snel leerbaar
• Redundantie beperkt
• Geschikt voor verschillende talen
22. Literatuur
Dawe, M. (2006). Desperately Seeking Simplicity : How Young Adults with Cognitive Disabilities and Their
Families Adopt Assistive Technologies, 1143–1152.
Keskinen, T. et al. (2012). SymbolChat: A flexible picture-based communication platform for users with
intellectual disabilities. Interacting with Computers, 24(5), 374–386.
Li-Tsang, C., Yeung, S., Chan, C., & Hui-Chan, C. (2005). Factors affecting people with intellectual
disabilities in learning to use computer technology. International Journal of Rehabilitation Research,
28(2), 127–133.
Reichenbach, H. (1947). The Tenses of Verbs. Elements of Symbolic Logic, 287–298.
Vandeghinste, V. (2008) LoRe-MT: A Hybrid Modular Machine Translation System. LOT: Utrecht
Vandeghinste, V., & Eynde, F. Van. (2014). Improving the Precision of Synset Links Between Cornetto and
Princeton WordNet, 120–126.
Vandeghinste, V., & Schuurman, I. (2008). Linking Pictographs to Synsets : Sclera2Cornetto, 3404–3410.
Van Eynde, F. et al. 2000. Part-of-Speech Tagging and Lemmatization for the Spoken Dutch Corpus. In M.
Gravilidou et al. (eds.), Proceedings of the Second International Conference on Language Resources
and Evaluation. 1427-1433
Text2Picto Webdemo: http://webservices.ccl.kuleuven.be/picto/index.php