14. Device Edge Cloud
• ASR|STT(聲音轉文字)
ü 中等模型、固定範圍
• NLP(自然語言處理)
ü 中等模型、固定範圍
語音現在可以怎麼做?
• ASR(自動語音辨識)
ü 語音喚醒 or 命令詞
ü 簡易的辨識
ü 語音合成(TTS)
• ASR|STT
ü 大模型、辨識範圍廣
• NLP(自然語言處理)
ü 大模型、理解範圍廣
低延遲
當超出理解
範圍時
latency
17. Device Edge Cloud
高階的車用語音場景
低延遲
當超出理解
範圍時
• 較為複雜的語意的操作
e.g.
ü {空調} {降} 到 {20} 度
ü {副架} {車窗} {打開} {一半}
ü {音樂} {聲音} {小} 一點
• 語音喚醒
• 簡易的固定命令詞
e.g.
ü 開導航
ü 聽廣播
• 語音合成(TTS)
• 更為複雜的語意操作
e.g.
ü 有沒有周杰倫的歌能聽?
ü 距離最近的加油站在哪?
ü 車子胎壓是不是不太對勁?
Client(車內)
內部網路
18. Device Edge Cloud
智慧家庭(智能家居)語音場景
低延遲
當超出理解
範圍時
• 較為複雜的語意的操作
e.g.
ü 來首 {輕快的} {音樂}
ü {空調} {降} 到 {20} 度
ü 把 {廁所} 裡的 {燈} {打開}
ü {兩小時} 後 {關掉} {除濕機}
• 語音喚醒
• 簡易的固定命令詞
e.g.
ü 開燈
ü 關冷氣
• 語音合成(TTS)
• 更為複雜的語意操作
e.g.
ü 有沒有周杰倫的歌能聽?
ü 看看外面是誰按鈴?
ü 附近哪個餐廳有促銷?
ü 紅燒獅子頭需要什麼材料?
Client(家裡 & 樓層/大樓/社區)
內部網路
19.
20. . . / . ,
T
u e t m h
. .,/ L V o C c h c
L I
l p n s L L a g
i : g A p h