SlideShare a Scribd company logo
1 of 59
Download to read offline
!1
厝內sak台灣話
!2
出外sak台灣話
!3
報告sak台灣話
!4
!5
意傳科技
台灣媠聲
!6
語音合成是 sánn-mı ̍h?
試聽
多元文化欲受人肯定, 語言佇公領域的呈現是真重要的開
始。

To-guân bûn-huà beh siū lâng khíng-tīng, gí-giân tī kong
líng-hı ̍k ê thîng-hiān sī tsin tiōng-iàu ê khai-sí.
!7
Tsit-má成果
!8
0
125
250
375
500
2016版 2019版 錄⾳音檔
khi-móo-tsih
鬥拍字
!9
• 詞、句

• 仔前變調

• 再變調

• beh

• koh

• 三連音

• 輕聲
是 án-ná beh 做媠聲
!10
!11
製作ê流程
!12
應用 合成模型 語料庫 文本
產業箍仔
!13
應用 合成模型 語料庫 文本
科技開發商 學術研究
語言tshui-sak
者
合成模型=>應用
• 科技開發商
!14
Ta̍k-ke 想著 sánn 應用?
!15
!16
!17
!18
豬仔
!19
!20
!21
語料庫=>合成模型
• 學術研究

• HTS

• Wavenet

• WaveRNN
!22
變調
• 變調規則

• 楊允言老師「臺語口語調系統實作研究」

• 詞性

• 用華文ê模型來粗坯標記

• 蔡素娟老師「兒童語料庫」

• 句法樹

• 用華文ê模型來粗坯標記
!23
文本=>語料庫
• 發音人

• 文稿準備

• 錄音方法

• 錄音室

• 校對畫面
!24
發音人
• 王秀容

• 教典發音人

• 高雄腔

• 第8調

• o=>or

• ian=>en
!25
第8調
!26
o=>or
!27
ian=>en
!28
地方腔
• 稿有收著彼號音、發音人有法度唸、羅馬字標有著

• hîr, siōnn地方腔無法度
!29
文稿授權
• 授權者名單

民報、 廖妍媚、	 林麗黛、 簡繡芬、	 郭家華、

何信翰、 曾菁怡、	 楊允言、 范嘉云、	 陳利成、

周盈成、	 林曉瑛、	 沈祚瑋、 蔡惠芬、	 陳廷宣、

劉孟宜、 林桂鄉、	 洪景田、 蔡連真、	 魏俊陽、

劉承賢、 林漢森、	 王朝源、 賴錫真、	 黃文俊、

夏玉華、 林美麗、	 程惠如、 邱偉欣、	 黃靜惠
!30
行情
• 愛提合理ê錢

• 才會久長
!31
$
Kônn!
$
$
錄音方法
• 台大錄音室

• 瓦器錄音室
!32
錄音稿
!33
!34
!35
校對介面
!36
校對羅馬字
• 咧 leh, tih, teh
!37
用字檢查
!38
連字符
• 教育部連字符規則、分類說明

• 規則無明,規則衝突時無說明

• Gún ê立場

• 一直寄部長批桶,整理in的回應,揣出衝突的所在,寄予
in改規範。
!39
若無
!40
標記規則
• 第9調

• buaih, bua̋i

• 合音

• 外語詞

• 地名
!41
小可仔
!42
小khua̋仔
!43
őo
!44
後lâng
!45
開源
語料庫
!46
模型訓練script
模型
校對網站
程式嘛是台文
!47
感謝
• 發音人、文稿作者

• Lí Kang-khioh Ki-kim-huē

• 程俊源老師、Khóo Ngá-tîng

• 謝書凱、馮怡蓁、邱振豪老師,曾婷、簡慧宇

• 謝豐帆、張月琴

• 文化部語言多樣性友善環境補助
!48
未來方向
• 發展其他應用

• 提升聲音品質

• 講kóo講kin攏會thong
!49
結論
• 語音合成ê 4階段,意傳攏總行過一擺,而且開源。

• 向望這 ê 成果成做咱台灣話ê té-tì,予台灣話繼續senn-
thuànn。
!50
討論
• 針對台灣媠聲 ê 問題

• 台文界有需要 sánn-mih 科技幫贊?
!51
!52
!53
!54
!55
!56
!57
公司服務項目
服務內容 實作經驗
線上網頁輸入法 台語、客語(2016~2017)
電腦輸入法 Linux台語輸入法(2018)
劇本發音參考、語音合成
台語、客語、阿美語語音合成
(2016~2017)
自動產生字幕、語音辨識
Kah中研院合作製作台語語音辨識
(2018)
語料標注解決方案 台灣媠聲 2.0 語料庫(2018~2019)
辭典建置、客製化語料庫 itaigi(2015~)詞彙分級語料庫(2018)
華語對譯 華台翻譯(2014)
!58
勞力
意傳科技:https://意傳.台灣/
email:ithuan@意傳.台灣
!59

More Related Content

More from 丞宏 薛

文化部推行語言多樣性友善環境補助案 107年度 臺灣媠聲 2.0 變更計劃書
文化部推行語言多樣性友善環境補助案 107年度 臺灣媠聲 2.0 變更計劃書文化部推行語言多樣性友善環境補助案 107年度 臺灣媠聲 2.0 變更計劃書
文化部推行語言多樣性友善環境補助案 107年度 臺灣媠聲 2.0 變更計劃書丞宏 薛
 
文化部推行語言多樣性友善環境補助案 107年度獲補助名單
文化部推行語言多樣性友善環境補助案 107年度獲補助名單文化部推行語言多樣性友善環境補助案 107年度獲補助名單
文化部推行語言多樣性友善環境補助案 107年度獲補助名單丞宏 薛
 
文化部推行語言多樣性友善環境補助案 107年度 臺灣媠聲 2.0 計劃書
文化部推行語言多樣性友善環境補助案 107年度 臺灣媠聲 2.0 計劃書 文化部推行語言多樣性友善環境補助案 107年度 臺灣媠聲 2.0 計劃書
文化部推行語言多樣性友善環境補助案 107年度 臺灣媠聲 2.0 計劃書 丞宏 薛
 
臺灣媠聲2.0
臺灣媠聲2.0臺灣媠聲2.0
臺灣媠聲2.0丞宏 薛
 
語音合成準備流程
語音合成準備流程語音合成準備流程
語音合成準備流程丞宏 薛
 
20160220萌典松-你佇寫啥物!?
20160220萌典松-你佇寫啥物!?20160220萌典松-你佇寫啥物!?
20160220萌典松-你佇寫啥物!?丞宏 薛
 
漢語間統計式機器翻譯語料處理-用臺灣閩南語示範
漢語間統計式機器翻譯語料處理-用臺灣閩南語示範漢語間統計式機器翻譯語料處理-用臺灣閩南語示範
漢語間統計式機器翻譯語料處理-用臺灣閩南語示範丞宏 薛
 
監票者聯盟志工培訓 20141120
監票者聯盟志工培訓 20141120監票者聯盟志工培訓 20141120
監票者聯盟志工培訓 20141120丞宏 薛
 
監票者聯盟志工培訓 20141114
監票者聯盟志工培訓 20141114監票者聯盟志工培訓 20141114
監票者聯盟志工培訓 20141114丞宏 薛
 

More from 丞宏 薛 (9)

文化部推行語言多樣性友善環境補助案 107年度 臺灣媠聲 2.0 變更計劃書
文化部推行語言多樣性友善環境補助案 107年度 臺灣媠聲 2.0 變更計劃書文化部推行語言多樣性友善環境補助案 107年度 臺灣媠聲 2.0 變更計劃書
文化部推行語言多樣性友善環境補助案 107年度 臺灣媠聲 2.0 變更計劃書
 
文化部推行語言多樣性友善環境補助案 107年度獲補助名單
文化部推行語言多樣性友善環境補助案 107年度獲補助名單文化部推行語言多樣性友善環境補助案 107年度獲補助名單
文化部推行語言多樣性友善環境補助案 107年度獲補助名單
 
文化部推行語言多樣性友善環境補助案 107年度 臺灣媠聲 2.0 計劃書
文化部推行語言多樣性友善環境補助案 107年度 臺灣媠聲 2.0 計劃書 文化部推行語言多樣性友善環境補助案 107年度 臺灣媠聲 2.0 計劃書
文化部推行語言多樣性友善環境補助案 107年度 臺灣媠聲 2.0 計劃書
 
臺灣媠聲2.0
臺灣媠聲2.0臺灣媠聲2.0
臺灣媠聲2.0
 
語音合成準備流程
語音合成準備流程語音合成準備流程
語音合成準備流程
 
20160220萌典松-你佇寫啥物!?
20160220萌典松-你佇寫啥物!?20160220萌典松-你佇寫啥物!?
20160220萌典松-你佇寫啥物!?
 
漢語間統計式機器翻譯語料處理-用臺灣閩南語示範
漢語間統計式機器翻譯語料處理-用臺灣閩南語示範漢語間統計式機器翻譯語料處理-用臺灣閩南語示範
漢語間統計式機器翻譯語料處理-用臺灣閩南語示範
 
監票者聯盟志工培訓 20141120
監票者聯盟志工培訓 20141120監票者聯盟志工培訓 20141120
監票者聯盟志工培訓 20141120
 
監票者聯盟志工培訓 20141114
監票者聯盟志工培訓 20141114監票者聯盟志工培訓 20141114
監票者聯盟志工培訓 20141114
 

打狗台語開講社【電腦mā會講台語!「台灣媠聲」發表會】