SlideShare a Scribd company logo
1 of 22
Download to read offline
De omzetting van tijd en aspect in
natuurlijke taal naar pictogrammen
Charlotte Tesselaar
Promotor: Vincent Vandeghinste
Doen jullie nog zonder?
Augmentatieve en Assistieve Communicatie (AAC)
Vormen van ondersteunde communicatie:
- Gebarentaal
- Text-to-speech
-Grafisch
Text2Picto
Tekstinput: Ik eet graag friet.
Sclera
Beta
http://webservices.ccl.kuleuven.be/picto/picto.php
Het TextToPicto systeem
Uit: Vandeghinste & Schuurman 2008: 3408
Cornetto: Synset relaties
Bulldog → ‘hond’
Het glas is vol → ‘Het glas is heel
Genezen → ‘niet ziek’1
1 Vandeghinste & Schuurman 2008: 3409
Het TextToPicto systeem
Uit: Vandeghinste & Schuurman 2008: 3408
Mijn project
Hoe kunnen tijd en aspect omgezet worden van natuurlijke taal
naar pictogrammen?
A Hoe kan het bepalen van de werkwoordstijd mogelijk gemaakt
worden?
B Hoe kunnen tijd en aspect het beste gerepresenteerd worden in
pictogrammen?
Chunker en Clause detector
> Chunker: NP, VP, PP
> Clause detector: Hoofdzin, bijzin, relatieve bijzin
Input:
De witte kat die in de boom slaapt zingt vals
Output:
kleur-wit kat zingen vals
kleur-wit kat slapen in boom
Werkwoordscombinaties
3 basispatronen:
A Persoonsvorm: Ik eet/at friet.
WW(pv, tgw) → L
WW(pv, verl) → P L
B Persoonsvorm + voltooid deelwoord: Ik heb friet gegeten.
WW(pv, tgw)|hebben, WW(vd, vrij) → P L
C Persoonsvorm + infintief: Ik ga friet eten
WW(pv, tgw)|gaan, WW(inf, vrij) → F L
L = Lemma WW
P = Verleden tijd
F = Toekomende tijd
Bron: Van Eynde, F. (2004) Part of Speech Tagging van het Corpus Gesproken
Nederlands
Vertaling
De weergave van tijd:
X
Verleden(P) Heden Toekomst(F)
Probleem
Nederlands heeft 8 werkwoordstijden: te veel complexiteit
- Weergave abstracta als ‘voltooidheid’?
- Tegenstrijdigheden: voltooid verleden toekomende tijd?
Haeseryn et al. (1997) Algemene Nederlandse Spraakkunst
Aspect
We aten een ijsje.
WW(pv, verl)
We hebben een ijsje gegeten.
WW(pv, tgw)_hebben, WW(vd, vrij)
We hadden een ijsje gegeten.
WW(pv, verl)_hebben, WW(vd, vrij)
Aspect
We aten een ijsje.
WW(pv, verl) → P L
We hebben een ijsje gegeten.
WW(pv, tgw)_hebben, WW(vd, vrij) → P L
We hadden een ijsje gegeten.
WW(pv, verl)_hebben, WW(vd, vrij) → P L
“Wij P eten ijsje”
Weglating ‘lege’ HWW
We zullen friet gaan hebben gegeten.
“Wij Fut eten friet”
Weglating ‘lege’ HWW
We zullen friet gegeten gaan hebben .
“Wij Fut eten friet”
Maar:
Wij zouden friet gegeten gaan hebben.
Nu: synoniem met “We aten friet”.
→ extra pictogram?
Weglating ‘lege’ HWW
We zullen friet gegeten gaan hebben .
“Wij Fut eten friet”
Mogelijk toevoeging:
Wij zouden friet gegeten gaan hebben.
Tijdsbepalingen
Redundant:
We gaan morgen zwemmen.
Tijdsbepalingen
Redundant:
We gaan morgen zwemmen.
Noodzakelijk:
Papa komt maandag. vs. Papa kwam maandag.
Het passiefprobleem
Hij slaat mij.
WW(pv,tgw) → L
Ik word geslagen (door hem).
WW(pv, tgw)_worden, WW(vd, vrij) → L
(door ) )
Samenvatting
Output Chunker + Clause Detector
Tijdsbepaling?
Ja Nee
Werkwoordstijd
Pictogrammen
Conclusie
3 simpele basispatronen:
Heden: L (L+)
Verleden: P L (L+)
Toekomst: F L (L+)
• Gemakkelijk herkenbaar
• Snel leerbaar
• Redundantie beperkt
• Geschikt voor verschillende talen
Literatuur
Dawe, M. (2006). Desperately Seeking Simplicity : How Young Adults with Cognitive Disabilities and Their
Families Adopt Assistive Technologies, 1143–1152.
Keskinen, T. et al. (2012). SymbolChat: A flexible picture-based communication platform for users with
intellectual disabilities. Interacting with Computers, 24(5), 374–386.
Li-Tsang, C., Yeung, S., Chan, C., & Hui-Chan, C. (2005). Factors affecting people with intellectual
disabilities in learning to use computer technology. International Journal of Rehabilitation Research,
28(2), 127–133.
Reichenbach, H. (1947). The Tenses of Verbs. Elements of Symbolic Logic, 287–298.
Vandeghinste, V. (2008) LoRe-MT: A Hybrid Modular Machine Translation System. LOT: Utrecht
Vandeghinste, V., & Eynde, F. Van. (2014). Improving the Precision of Synset Links Between Cornetto and
Princeton WordNet, 120–126.
Vandeghinste, V., & Schuurman, I. (2008). Linking Pictographs to Synsets : Sclera2Cornetto, 3404–3410.
Van Eynde, F. et al. 2000. Part-of-Speech Tagging and Lemmatization for the Spoken Dutch Corpus. In M.
Gravilidou et al. (eds.), Proceedings of the Second International Conference on Language Resources
and Evaluation. 1427-1433
Text2Picto Webdemo: http://webservices.ccl.kuleuven.be/picto/index.php

More Related Content

Featured

Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
Kurio // The Social Media Age(ncy)
 
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them wellGood Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
Saba Software
 

Featured (20)

Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work
 
ChatGPT webinar slides
ChatGPT webinar slidesChatGPT webinar slides
ChatGPT webinar slides
 
More than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike RoutesMore than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike Routes
 
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
 
Barbie - Brand Strategy Presentation
Barbie - Brand Strategy PresentationBarbie - Brand Strategy Presentation
Barbie - Brand Strategy Presentation
 
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them wellGood Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
 

Presentatie_CTesselaar

  • 1. De omzetting van tijd en aspect in natuurlijke taal naar pictogrammen Charlotte Tesselaar Promotor: Vincent Vandeghinste
  • 2. Doen jullie nog zonder?
  • 3. Augmentatieve en Assistieve Communicatie (AAC) Vormen van ondersteunde communicatie: - Gebarentaal - Text-to-speech -Grafisch
  • 4. Text2Picto Tekstinput: Ik eet graag friet. Sclera Beta http://webservices.ccl.kuleuven.be/picto/picto.php
  • 5. Het TextToPicto systeem Uit: Vandeghinste & Schuurman 2008: 3408
  • 6. Cornetto: Synset relaties Bulldog → ‘hond’ Het glas is vol → ‘Het glas is heel Genezen → ‘niet ziek’1 1 Vandeghinste & Schuurman 2008: 3409
  • 7. Het TextToPicto systeem Uit: Vandeghinste & Schuurman 2008: 3408
  • 8. Mijn project Hoe kunnen tijd en aspect omgezet worden van natuurlijke taal naar pictogrammen? A Hoe kan het bepalen van de werkwoordstijd mogelijk gemaakt worden? B Hoe kunnen tijd en aspect het beste gerepresenteerd worden in pictogrammen?
  • 9. Chunker en Clause detector > Chunker: NP, VP, PP > Clause detector: Hoofdzin, bijzin, relatieve bijzin Input: De witte kat die in de boom slaapt zingt vals Output: kleur-wit kat zingen vals kleur-wit kat slapen in boom
  • 10. Werkwoordscombinaties 3 basispatronen: A Persoonsvorm: Ik eet/at friet. WW(pv, tgw) → L WW(pv, verl) → P L B Persoonsvorm + voltooid deelwoord: Ik heb friet gegeten. WW(pv, tgw)|hebben, WW(vd, vrij) → P L C Persoonsvorm + infintief: Ik ga friet eten WW(pv, tgw)|gaan, WW(inf, vrij) → F L L = Lemma WW P = Verleden tijd F = Toekomende tijd Bron: Van Eynde, F. (2004) Part of Speech Tagging van het Corpus Gesproken Nederlands
  • 11. Vertaling De weergave van tijd: X Verleden(P) Heden Toekomst(F) Probleem Nederlands heeft 8 werkwoordstijden: te veel complexiteit - Weergave abstracta als ‘voltooidheid’? - Tegenstrijdigheden: voltooid verleden toekomende tijd? Haeseryn et al. (1997) Algemene Nederlandse Spraakkunst
  • 12. Aspect We aten een ijsje. WW(pv, verl) We hebben een ijsje gegeten. WW(pv, tgw)_hebben, WW(vd, vrij) We hadden een ijsje gegeten. WW(pv, verl)_hebben, WW(vd, vrij)
  • 13. Aspect We aten een ijsje. WW(pv, verl) → P L We hebben een ijsje gegeten. WW(pv, tgw)_hebben, WW(vd, vrij) → P L We hadden een ijsje gegeten. WW(pv, verl)_hebben, WW(vd, vrij) → P L “Wij P eten ijsje”
  • 14. Weglating ‘lege’ HWW We zullen friet gaan hebben gegeten. “Wij Fut eten friet”
  • 15. Weglating ‘lege’ HWW We zullen friet gegeten gaan hebben . “Wij Fut eten friet” Maar: Wij zouden friet gegeten gaan hebben. Nu: synoniem met “We aten friet”. → extra pictogram?
  • 16. Weglating ‘lege’ HWW We zullen friet gegeten gaan hebben . “Wij Fut eten friet” Mogelijk toevoeging: Wij zouden friet gegeten gaan hebben.
  • 18. Tijdsbepalingen Redundant: We gaan morgen zwemmen. Noodzakelijk: Papa komt maandag. vs. Papa kwam maandag.
  • 19. Het passiefprobleem Hij slaat mij. WW(pv,tgw) → L Ik word geslagen (door hem). WW(pv, tgw)_worden, WW(vd, vrij) → L (door ) )
  • 20. Samenvatting Output Chunker + Clause Detector Tijdsbepaling? Ja Nee Werkwoordstijd Pictogrammen
  • 21. Conclusie 3 simpele basispatronen: Heden: L (L+) Verleden: P L (L+) Toekomst: F L (L+) • Gemakkelijk herkenbaar • Snel leerbaar • Redundantie beperkt • Geschikt voor verschillende talen
  • 22. Literatuur Dawe, M. (2006). Desperately Seeking Simplicity : How Young Adults with Cognitive Disabilities and Their Families Adopt Assistive Technologies, 1143–1152. Keskinen, T. et al. (2012). SymbolChat: A flexible picture-based communication platform for users with intellectual disabilities. Interacting with Computers, 24(5), 374–386. Li-Tsang, C., Yeung, S., Chan, C., & Hui-Chan, C. (2005). Factors affecting people with intellectual disabilities in learning to use computer technology. International Journal of Rehabilitation Research, 28(2), 127–133. Reichenbach, H. (1947). The Tenses of Verbs. Elements of Symbolic Logic, 287–298. Vandeghinste, V. (2008) LoRe-MT: A Hybrid Modular Machine Translation System. LOT: Utrecht Vandeghinste, V., & Eynde, F. Van. (2014). Improving the Precision of Synset Links Between Cornetto and Princeton WordNet, 120–126. Vandeghinste, V., & Schuurman, I. (2008). Linking Pictographs to Synsets : Sclera2Cornetto, 3404–3410. Van Eynde, F. et al. 2000. Part-of-Speech Tagging and Lemmatization for the Spoken Dutch Corpus. In M. Gravilidou et al. (eds.), Proceedings of the Second International Conference on Language Resources and Evaluation. 1427-1433 Text2Picto Webdemo: http://webservices.ccl.kuleuven.be/picto/index.php