台語文學及非文學類 詞彙差異分析 指導教授:楊允言 研究生:陳慧蓮
一、研究動機 語言的重要 詞彙的重要 詞彙的對比分析研究較少  高低頻詞的差異 壹、緒論
二、研究目的 了解文學類、非文學類詞彙,在高頻詞與低頻詞的詞彙使用情形。  了解文學類、非文學類詞彙,在高頻詞與低頻詞的使用差異。 將研究結果提供編寫台語教科書相關單位與台語詞彙相關研究之參考。  壹、緒論
本研究將語料分為文學及非文學兩類,文學類語料的來源是「台語文數位典藏資料庫(第二階段)」所蒐集的文本;非文學類語料的來源是「白話字台語文網站」所蒐集之台語文學術研討會論文,研究者從取得的語料中分別抽樣文學與非文學語料各約 12 萬音節,合計約 24 萬音節語料。  三、研究範圍 壹、緒論
三、名詞解釋 語料庫 詞頻 覆蓋率 高頻詞 低頻詞 壹、緒論
曾金金。 1997 。〈台語斷詞原則〉 楊允言。 2003 。〈從語域及借詞觀點探討台語文寫作風格〉。 楊允言、張學謙。 2005 。〈台語文語料庫蒐集及語料庫為本台語書面語音節詞頻統計〉。   楊允言、劉杰岳。 2006 。〈台語文計算語言學基礎建設─介紹台語線頂辭典 kap 語料庫〉。 楊允言。 2003 。〈近年來台語文資料處理的成果與展望〉。  楊允言。 1993 。〈台語文字化个過去佮現在〉。 貳、文獻探討 第一節  語料庫研究
第一節  語料庫 黃居仁。 1990 。〈計算語言學﹣﹣人工智慧、語言學、認知科學的結合〉。《科學月刊》   黃居仁。 1997 。〈科技整合與整合科技 --- 談計算語言學與語料庫語言學之角色與發展〉。 黃居仁。 2006 。〈大數與求真:如何以十億字語料庫進行語言分析與研究〉。   黃昌寧、李涓子著。 2002 。《語料庫語言學》。   謝昌運。 2008 。 《台語加強詞的研究:語料庫語言學的分析》。 曾國榕。 2008 。 《台語學術類和非學術類的詞彙使用比較》 貳、文獻探討
顏國仁。 1995 。《台語口語常用詞頻率調查初步報告》 張學謙。 2000 。〈台語口語及書面語體的多面向分析〉。 林香薇。 2003 。〈論宋澤萊台語詩《一枝煎匙》的用字與用詞〉。 張學謙。 1998 。〈 Ho-Lo 台語虛詞的語層及語用〉。  葉德眀。 1997 。 〈華語文常用詞彙頻率等級統整研究〉。  第二節  台語詞彙分析 貳、文獻探討
參、研究方法與步驟 蒐集語料 人工整理語料   電腦斷詞 人工校對 詞頻統計 高頻詞 / 低頻詞 覆蓋率 80 %的語詞 分析比較 歸納統整
肆、結果分析
伍、結論與建議
伍、參考書目

05 台語文學及非文學類詞彙差異分析