Language Grid

1. UMD Crowdsourcing and Translation Workshop, June 10-11 Language Grid: Service-OrientedInfrastructurefor Multilingual Society Donghui Lin National Institute of Information and Communications Technology (NICT), Japan

2. Introduction of the Language Grid http://langrid.nict.go.jp 2

3. Language Grid Architecture Education Medical Care Disaster Management more more Sharing Multilingual Information Translation Services at Hospital Receptions Universal Playground Language Support for Multicultural Societies Sharing language resources such as dictionaries and machine translators around the world German Research Center for Artificial Intelligence Kookmin University Stuttgart University National Institute of Informatics Princeton University National Research Council, Italy Chinese Academy of Sciences Google Inc. NICT NTT Research Labs Asian Disaster Reduction Center NECTEC Univ. of Indonesia 3

4. From Language Resources to Language Services Dictionary Service 避難場所 Wrapping disaster shelter Dictionary Return translated word Dictionary Service Parallel Text Service 避難場所は、家から近い学校です。 Wrapping In the case of disaster, people should be evacuated to a school nearby their house. Return similar translated text Parallel Text Parallel Text Service Machine Translation Service 避難場所は、家から近い学校です。 Wrapping Disaster shelter is school close from a house. Translate by machine Machine Translator Machine Translation Service Human Translation Service 避難場所は、家から近い学校です。 Wrapping Your disaster shelter is the school closest to your house. Translate with high quality Human Translator Human Translation Service

5. From Atomic Services to Composite Services 授業料は無償ですが、教材費や給食費は必要です。 (Original Text in English：Tuition is free,but cost of textbooks and school meals is required) Multilingual Service Infrastructure Multilingual Communication Support System Over60 language services are available currently (April 2010) AutoComplete Service Multilingual Communication Support System for a middle school in Kawasaki City, Japan School Guidance for Foreign Guardians Mie Prefecture, JapanParallel Text As aulas referentes ao ensino obrigatório são gratuitas. Porém, serão cobrados os valores referentes à refeição escolar e os materiais a serem usados. (Translation Result in English: Tuition of compulsory education is free,but cost of textbooks and school meals is required) If original text is registered as parallel text item, perfect translation can be acquired Composite Translation Service A taxa escolar é gratuita, mas a um custo de material educativo e um gasto de merenda escolar são necessários. (Translation Result in English: Although tuition is free,cost of textbooks and waste of school meals is necessary.) Display area for conversationlogs J-Server, Kodensha (Rule-based Translation) Translation（ja-en） Multi-hop Translation Web-transer, CrossLanguage (Rule-based Translation) Translation（en-pt） Translation quality is similar to that of free translation on the Web ・Multi-hop translation ・Composite translation with dictionary ・Best translation selection A taxa escolar é gratuita, mas as taxas de materiais didáticos e merenda escolar são as taxas necessárias. (Translation Result in English: Although tuition is free,the rate that learns materials and school meals is the necessary cost. ) Composite Translation with Dictionary Mecab, NTT Morphological Analysis Professional translation can be realized by combining dictionaries fortechnical terminology (jargon) TreeTagger, University of Stuttgart Morphological Analysis Education Dictionary, The Toyota Foundation Dictionary Best translation result can be selected from multiple translation services AutoComplete Service Composite Translation with Dictionary Best Translation Selection Service O ensino é livre, as taxas de materiais de aprendizagem taxas de merenda escolar e é necessário. (Translation Result in English: Tuition is free,but cost of textbooks and school feeding is required.) Translation quality is possible to be further improved by learning from examples (parallel texts). (Under development by Kyoto Univ.) GoogleTranslate, Google (Statistical Translation) Translation（ja-pt） Best Translation Selection

7. University / Research Institute

8. Kyoto Univ. (Japan), Shanghai Jiao Tong Univ. (China), Univ. of Stuttgart (Germany), IT Univ. of Copenhagen (Denmark), Princeton Univ. (USA), DFKI (Germany), CNR (Italy), Chinese Academy of Sciences (China), NECTEC (Thailand), and more.

9. NPO/NGO/Public Sector

10. NGOs for disaster reduction, NGOs for Intercultural exchange, Public Junior-high schools, City Boards of Education, and more.

11. Corporate (CSR activities / language resource providers)

12. Google, NTT, Toshiba, Oki, Kodensha, Translution, and more.

13. Language Resources (60+ language resources)

14. Machine Translator

15. J-Server (ja/en/ko/zh), Web-Transer (ja/en/ko/zh/fr/de/it/es), Toshiba (en/zh), Parsit (en>th), Google Translate (40+ languages), and more.

16. Bilingual Dictionary, Concept Dictionary

17. EDR , Wordnet, Life Science Dictionary, Multi-language Glossary on Natural Disasters, and more.

18. Parallel Text

19. Morphological Analyzer, Dependency Parser

20. Voice Recognition6

21. Participatory Design Approach Users create and share their own language services, combine their services with services on the Language Grid to support their multilingual activities Multilingual medical support system in a hospital Multilingual chatting system in a middle school Multilingual BBS for international staffs in an NPO

22. Participatory Design Approach Users customize how to use language services on the Language Grid to support their multilingual activities User can customize translation services and dictionary services Multilingual BBS

24. http://langrid.org/playground

25. Try language services on the Language Grid

26. Machine Translation

27. Dictionary / Concept Dictionary

28. Parallel Text

29. Morphological Analysis

30. …

31. Language Grid Toolbox

32. http://langrid-tool.nict.go.jp

33. Try customization of language services on the Language Grid

34. Text Translation (Back-translation, Composite translation)

35. Language Resource Creation (Dictionary, Parallel Text…)

36. Multilingual BBS

38. Open Smart Classroom (IEEE TKED 2009) Language Grid YueSuo, Naoki Miyata, Hiroki Morikawa, Toru Ishida and Yuanchun Shi. Open Smart Classroom: Extensible and Scalable Learning System in Smart Space using Web Service Technology. IEEE Transactions on Knowledge and Data Engineering, Vol.21, No.6, pp. 814-828, 2009. Gold Prize (1st place) in "Microsoft Cup" IEEE China Student Paper Contest.

39. Analysis of Multicultural Communication (CSCW 2006, CHI 2009) Problems of MT-mediated communication Translation Asymmetry Echoing for ratification does not work. Naomi Yamashita, Reiko Inaba, Hideaki Kuzuoka and Toru Ishida. Difficulties in Establishing Common Ground in Multiparty Groups using Machine Translation. International Conference on Human Factors in Computing Systems (CHI-09), pp. 679-688, 2009. Naomi Yamashita and Toru Ishida. Effects of Machine Translation on Collaborative Work. International Conference on Computer Supported Cooperative Work (CSCW-06), pp. 515-523, 2006.

40. Cross Language News Analysis (ongoing) Translation andDictionary Creation バラク・オバマ巴拉克·奥巴马 Japan China Korea USA World News Analysis Prof. Yoshioka, Hokkaido University, Japan

42. Wiki-to-Wiki Translation (just started) Number of Wikipedia articles by language Support Wikipedia communities to create multilingual articles. Number of Wiktionary entries by language 15

43. Research on Developing the Language Grid

45. Morphological Analysis Technical Term Extraction Technical Term Bilingual Dictionary Technical Term Bilingual Dictionary Term Replacement Machine Translation Term Replacement + Any remaining terms Any remaining terms Constraint-basedHorizontal Service Composition (ISWC 2006) Original sentence X1 Vertical service composition is to create a workflow. Horizontal service composition is to select atomic services for a given workflow. Satisfy hard constraints (required functions), while maximizing soft constraints (QoS for example). Set of morphemes X2 Set of technical terms included in the sentence Set of technical terms included in the sentence No No yes yes X3 Intermediate code of technical term Translation of technical term Original sentence Set of technical terms Set of intermediate code X4 Sentence including intermediate code. X5 Translated sentence Set of intermediate code Set of term translations X6 Ahlem Ben Hassine, Matsubara Shigeo and Toru Ishida. Constraint-based Approach for Web Service Composition. International Semantic Web Conference (ISWC-06), pp. 130-143, 2006.

46. Summary: Research Issues Interaction analysis Creating conversational common ground with inconsistent, asymmetric, and intransitive machine translations. (CSCW2006, CHI2009) Service Composition Horizontal service composition. (ISWC2006, ICWS2008) Service supervision. (ICWS2009, SCC2010) Context aware service composition for pivot translations. (IJCAI2009) Provider-centered trust for autonomic service composition. Pricing composite/atomic language services. User-centered QoS for composite language services. Customizing statistical translations with community dictionaries. Extending the Language Grid Emotions and pictograms in language services (ESWC2008) e-learning grid (IEEE Transactions on KDE, 2009) 19

47. International Conference Initiated by the Language Grid

49. Research Example 1: MT-Mediated Communication, Collaborative Translation

50. 23 MT-Mediated Communication (CSCW06, CHI09) To observe and analyze the effects of machine translation on communication among monolinguals Participants: 5 Chinese-Japanesepairs, 3 Japanese-Korean pairs They have never met before the experiments Tasks: Each pair of users try to indentify the same avatars by using their mother tongues and machine translations Communication medias: MT-based multilingual chatting systems

51. 24 Experiment Design Indentify the same avatars < China Side> < Japan Side> Multilingual Chatting System Based on the Language Grid

52. Analysis of MT-Mediated Communication Problem of MT-mediated communication (1) Translation Asymmetry Echoing for ratification does not work.

53. Analysis of MT-Mediated Communication Problem of MT-mediated communication (2) Translation Inconsistency Different expressions of a same sentence can get totally different translation results.

54. MT-Mediated Collaborative Translation Protocols (IUI2009) Language Grid Basic concept of collaborative translation DaisukeMorita and Toru Ishida. Collaborative Translation by Monolinguals with Machine Translators. International Conference on Intelligent User Interfaces (IUI-09), pp. 361-365, 2009.

55. Examples of Collaborative Translation Protocols

56. Experiment Result Result of Japanese-English Translation Result of Japanese-Chinese Translation

57. Research Example 2: Multilingual Localization

58. Language Grid for Multilingual Localization (ICSOC2009, LREC2010) Machine translation VS Human translation Human translations are of high costs with long durations Machine translation have limited translation quality (in dimensions of fluency and adequacy) Language Grid improves traditional machine translation service by combining community dictionaries, but still has limitation in translation quality Language Grid for Localization Processes Localization processes requires perfect translation quality that machine translation services cannot provide 31 Let’s try to combine machine translation services and human activities using the Language Grid!!

60. Experiment Design Localization Contents Business, University, Temple… Languages JA, EN, ZH-CN, ZH-TW, KO, PT, ES, DE, FR… Monolingual Foreign students in Kyoto University Bilingual Professional bilingual translator in Translation Company Machine Translation Services Composite translation with bilingual dictionary For each content, there is a dictionary covers 15%-25% of the total contents Comparison Localization Process by using Language Grid Common Localization Process

61. Contents for Experiment

62. Monolingual Modification Rate and Length of Original Sentences

63. Monolingual Modification Rate and Translation Time Monolingual modification time keeps stable for different modification rate Bilingual translation/confirmation time becomes less when monolingual modification rate increases Bilingual Time Monolingual Time

64. Monolingual Modification Rate and Translation Time Bilingual Time Monolingual Time

65. Monolingual Modification Rate and Bilingual Time Reduction Rate The bilingual time reduction rate increases with the monolingual modification rate

66. Challenging Issues Requirements of composing machine translation and human Methodologies of balancing the cost and quality Control of human translation qualities and machine translation quality Interaction design of human-human and human-machine translation

Language Grid

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Similar to Language Grid

Similar to Language Grid (20)

Recently uploaded

Recently uploaded (20)

Language Grid