10. 語料庫開發 1. 語料庫類型 把兩種語言中完全對應的文本(如法律文件)輸入計算機,通過分析對比找出兩者關係,可用於機器翻譯研究。 平行語料庫稱為 parallel corpura 將各種程度的學生在學習英語過程中的研與輸出輸入計算機,建立學生英語語料庫。對於研究中間語的性質及找出學生易犯的錯誤,從而提高學習效率。 如 Chinese Learner English Corpus 學生英語語料庫 研究口語特徵的重要工具,如語音語調的規律,其研究成果在語聲合成中有重要應用。其建設涉及口語真實語料的採集及語音轉錄,工作量極大。 如 The London-Lund Corpus 、 the Corpus of Spoken American English 。 口語語料庫 COBUILD 語料庫:用於觀察現代英語的變遷。 監控語料庫稱為 Monitor corpus JDEST :學術英語語料庫,用於研究學術英語。 Helsinki Corpus of Historical English :用於研究古英語。 專用語料庫 LOB 語料庫:在構成上完全和 BROWN 對應,取材自當代英國英語語料。 BROWN 語料庫:當代美國英語語料庫。 通用語料庫