SlideShare a Scribd company logo
1 of 31
Download to read offline
AI 時代下的新使用者介面 - 語音人工智慧
h t t p : / / o l a m i . a i
威盛電子股份有限公司
Ryan Hang , 2017-12-16
人工智慧
• 人工智慧(Artificial Intelligence, AI)一詞最早起源於 1950 年代
• 1980 年代研究領域轉為(Machine Learning)
• 2006 年深度神經網路(Deep Neural Network, DNN)發表
• 2012 年深度學習(Deep Learning)大爆發
機器學習?or 深度學習?
資料來源:www.inside.com.tw
使用者介面(User Interface)的演進
語音人工智慧
語 音 辨 識 + 自 然 語 言 理 解 + 多 輪 互 動 = 新 一 代 的 使 用 者 介 面
OLAMI 人工智慧平台
以 人 工 智 慧 創 造 新 一 代 的 “ 中 文 語 音 人 機 互 動 使 用 者 介 面 ”
VIA Technologies, Inc. | http://olami.ai
語音辨識
Voice Recognition
電腦視覺
Computer Vision
語言理解
Language
Understanding
語音命令檢測
Voice Commands Recognition
視線檢測
Eye Gaze Detection
即時目標檢測
Real-Time Object Detection
機器認知
Machine Cognition
自然語言語意理解
Natural Language Understanding
雲端語音辨識
Cloud Speech Recognition
人工智慧雲
AI Cloud Service
OLAMI 是一個多元化的 AI 軟體開發平台
提 供 給 A I 產 品 開 發 者 的 軟 體 開 發 解 決 方 案 包 含 了 視 覺 , 聽 覺 , 以 及 語 言 理 解 領 域
自然語言語意互動
Natural Language Interaction
中文語意理解的難題:
“衣服能穿多少穿多少”
這是希望你 多 穿一點?還是 少 穿一點?
如何解決這類充滿歧異的中文語意?
ü 知識庫的輔助,確定合理性,消除歧異。
ü 多層上下文處理技術(例如多輪對話)。
• 台中今天很冷 👉 能穿多少穿多少(多穿一點 👚)
• 台中今天天氣如何? 👉 那台北呢? 👉 買一張去那裡的高鐵票。
ü 結合使用情境。
OLAMI 中文語音辨識
最 深 入 台 灣 本 土 化 的 中 文 語 音 辨 識 技 術
以台灣中文為主的混合辨識引擎
ü 台灣在地化的用語
ü 解決“台灣國語”的口音問題
ü 國台語混合 or 國語+台語+英文混合
ü 台語辨識(中國大陸閩南語不完全等於台語)
簡體中文語音辨識也很OK!
協 助 台 灣 企 業 的 語 音 互 動 產 品 或 服 務 拓 展 至 中 國 大 陸 市 場
辨識率的迷思
9 9 % ? 9 8 % ? 9 7 % ?
VIA Technologies, Inc. | http://olami.ai
案例:特殊領域專用詞彙及句型辨識
例句:
• 嘴唇無發紺情形,予散瞳藥物使用。
• 鼻胃管留置,固定妥,口內內固定存。
• 於十點五十五分治療完畢協助出艙。
• 冰枕使用導致紅臀予以消毒。
Powered by Deep Learning !
經資料採集、模型設計、深度學習訓練後的引擎,辨識率可達 97% 以上。
VIA Technologies, Inc. | http://olami.ai
案例:台灣國語語音辨識率分析
評測日期:2016/12/19 • 男 女 共 計 1 0 人
• 測 試 2 0 0 句 語 料
• 樣 本 總 數 2 0 0 0 筆
測 試 範 例 ( 一 般 發 音 ) : 二 千 二 百 位 善 男 信 女
台 灣 國 語 發 音 參 考 案 例 : 嘔 千 嘔 百 位 善 藍 性 呂
82.24
75.30
72.29
78.39
64.45
56.99
50.00
55.00
60.00
65.00
70.00
75.00
80.00
85.00
OLAMI X	公司 B	公司 G	公司 N	公司 M	公司
當語音人工智慧遇上 IoT/AIoT
離線辨識 & 邊緣運算(Edge Computing)
• 命令詞辨識(Voice Command)
• 語音喚醒(Hotword Detection)
• 回聲消除(Acoustic Echo Cancelling;AEC)
遠場拾音技術
( Far-Field Voice Recognition )
ü 命令詞辨識(Voice Command)
ü 語音喚醒(Hotword Detection)
ü 回聲消除(Acoustic Echo Cancelling; AEC)
語音人工智慧應用案例分享
VIA Technologies, Inc. | http://olami.ai
• Hands-Free 全 語 音 操 作 。
• 取 代 傳 統 鍵 盤 輸 入 作 業 。
• 大 幅 降 低 護 理 人 員 工 作 量 及 時 間 。
• 中 英 文 混 合 專 用 詞 彙 辨 識 。
智慧醫療應用:
語音輸入護理日誌
• 嘴唇無發紺
• 鼻胃管留置
• heart rate 是 86
• follow sugar 狀況
• 有 O2 mask 5L 使用
VIA Technologies, Inc. | http://olami.ai
OLAMI
人 工 智 慧 雲
OLAMI
機 器 認 知
OLAMI
內 容 數 據
語音辨識 API
語意理解 API
百科,即時數據
& 第三方 CP 數據
語音喚醒 / 離線命令詞辨識 SDK
NLI 語意互動管理系統(智能對話)
AI 軟體 & 服務
智慧裝置 & 機器人
AI 客服 & 導覽員
VR & AR 應用
軟體開發者
可應用於各種〝對話式〞服務與應用
VIA Technologies, Inc. | http://olami.ai
• 自然語言上下文處理與多輪對話能力。
• 百科與知識庫輔助應用範例。
• 自然語言於智慧家庭控制的應用示範。
https://www.youtube.com/watch?v=GRYj4WMZATM
Smart Home
語音助理 APP 或智慧喇叭
示範影片 :
VIA Technologies, Inc. | http://olami.ai
挑戰孩子們
模糊的語意及發音
• 陪伴型語音智慧喇叭應用場景:
• Far-Field 遠距離收音 & 語音喚醒。
• 閒聊(自然語言理解)。
• 講故事、聽音樂。
• 學習數學。
• 多人語音訊息傳送與互動。
https://youtu.be/AiUfFRMhHKE
示範影片 :
AR/VR 語音助理、客服
or 互動式電子看板
VIA Technologies, Inc. | http://olami.ai
OLAMI Voice Kit – 語音智慧喇叭開發套件
威盛 OLAMI Voice Kit 語音智慧喇叭開發套件是一款整合 Far-Field 遠場麥克風收音、降噪、
自動語音辨識(喚醒)、自然語言理解等技術的 一站式 自然語言語音人機互動開發套件。
• 硬體
• 支援任何 ARM SoC,或 Raspberry Pi
• 支援遠場收音的麥克風陣列板(Far-Field Microphone Array)
• 麥克風與 speaker-out 經由 USB Audio,方便硬體整合與設計
• 軟體
• OLAMI Voice Kit SDK(支援 Android 和 Linux)
• 降噪及 AEC 消回聲處理(可選擇由軟體支援,或由麥克風板硬體支援)
• OLAMI 語音助理(智慧喇叭版本)範例程式
STEM/ STEAM、自造者、技職教育
電腦視覺 x 語音互動
結 合 強 大 的 人 工 智 慧 , 讓 人 機 互 動 的 行 模 式 為 更 加 精 準 、 聰 明 !
VIA Technologies, Inc. | http://olami.ai
結合視線檢測觸發語音互動流程,取代語音喚醒的動作。
• 基於 Deep Learning 訓練的視線檢測模型,辨識人臉視線(是否在看你):
• 應用於機器人:讓 Robot 理解 User 是否正在看著它。
• 結合語音互動:當 User 看著 Robot 時,進行語音對話(無須經過語音喚醒的步驟)。
Gotcha !
示範影片:https://youtu.be/RxPNDiG7Sls
No No
VIA Technologies, Inc. | http://olami.ai
Eye/Gaze + Face Detection
她正在移動
可跟隨
Camera 拍攝畫面
示範影片:https://youtu.be/KaeKmwbKDhI
VIA Technologies, Inc. | http://olami.ai
以物件檢測作為語音互動的觸發點
將 Real-Time Object Detection 模型優化,
使其不需要在高階的運算環境也可以流暢運作。
示範影片:
https://youtu.be/_kf_VEjZbVw
Thank You !
h t t p : / / o l a m i . a i
關注 「OLAMI 人工智慧開放」粉絲團掌握最新應用與發展
👉 👉 👉 @ai.olami

More Related Content

What's hot

IBM Bluemix 物聯新世界 Future with Robot
IBM Bluemix 物聯新世界  Future with RobotIBM Bluemix 物聯新世界  Future with Robot
IBM Bluemix 物聯新世界 Future with RobotCAVEDU Education
 
GMIC 2012 - Guobi Technology, Presentation by Mr GaoJinlian, 国笔科技 高精练
GMIC 2012 - Guobi Technology, Presentation by Mr GaoJinlian, 国笔科技 高精练 GMIC 2012 - Guobi Technology, Presentation by Mr GaoJinlian, 国笔科技 高精练
GMIC 2012 - Guobi Technology, Presentation by Mr GaoJinlian, 国笔科技 高精练 Great Wall Club
 
人工智慧與語音助理
人工智慧與語音助理人工智慧與語音助理
人工智慧與語音助理Collaborator
 
第五組-AI視力檢測機AI Vision-Exam Presenation v.1.6.6
第五組-AI視力檢測機AI Vision-Exam Presenation v.1.6.6第五組-AI視力檢測機AI Vision-Exam Presenation v.1.6.6
第五組-AI視力檢測機AI Vision-Exam Presenation v.1.6.6IttrainingIttraining
 
Apple ibeacon 20130513 ken
Apple ibeacon 20130513 kenApple ibeacon 20130513 ken
Apple ibeacon 20130513 kenWei-Chih Tsai
 
第四組-無人機&無人車的實作與應用Drone and self driving car (Quadcopter,Smart Car,Gesture Con...
第四組-無人機&無人車的實作與應用Drone and self driving car (Quadcopter,Smart Car,Gesture Con...第四組-無人機&無人車的實作與應用Drone and self driving car (Quadcopter,Smart Car,Gesture Con...
第四組-無人機&無人車的實作與應用Drone and self driving car (Quadcopter,Smart Car,Gesture Con...IttrainingIttraining
 
庚寅虎年第一季
庚寅虎年第一季庚寅虎年第一季
庚寅虎年第一季emmalee1987
 
高速移動網路新時代 - 雲端與物聯網發展新趨勢 (An Integration Trend of Terminal Devices, IoT and C...
高速移動網路新時代  - 雲端與物聯網發展新趨勢 (An Integration Trend of Terminal Devices, IoT and C...高速移動網路新時代  - 雲端與物聯網發展新趨勢 (An Integration Trend of Terminal Devices, IoT and C...
高速移動網路新時代 - 雲端與物聯網發展新趨勢 (An Integration Trend of Terminal Devices, IoT and C...William Liang
 
2012 Phind Corp. 公司簡介
2012 Phind Corp. 公司簡介2012 Phind Corp. 公司簡介
2012 Phind Corp. 公司簡介Chia-Yu Kuo
 
Data-centric IoT (NTU CSIE 2016.12)
Data-centric IoT (NTU CSIE 2016.12)Data-centric IoT (NTU CSIE 2016.12)
Data-centric IoT (NTU CSIE 2016.12)William Liang
 
移动终端的应用与未来 20100418
移动终端的应用与未来 20100418移动终端的应用与未来 20100418
移动终端的应用与未来 20100418wingofwind
 
151107 物聯網教學應用發表會-開場
151107   物聯網教學應用發表會-開場151107   物聯網教學應用發表會-開場
151107 物聯網教學應用發表會-開場CAVEDU Education
 
Extended reality the end of distance -XR technologies applications at museum
Extended reality the end of distance -XR technologies applications at museumExtended reality the end of distance -XR technologies applications at museum
Extended reality the end of distance -XR technologies applications at museumFAUST CHOU
 

What's hot (14)

IBM Bluemix 物聯新世界 Future with Robot
IBM Bluemix 物聯新世界  Future with RobotIBM Bluemix 物聯新世界  Future with Robot
IBM Bluemix 物聯新世界 Future with Robot
 
GMIC 2012 - Guobi Technology, Presentation by Mr GaoJinlian, 国笔科技 高精练
GMIC 2012 - Guobi Technology, Presentation by Mr GaoJinlian, 国笔科技 高精练 GMIC 2012 - Guobi Technology, Presentation by Mr GaoJinlian, 国笔科技 高精练
GMIC 2012 - Guobi Technology, Presentation by Mr GaoJinlian, 国笔科技 高精练
 
人工智慧與語音助理
人工智慧與語音助理人工智慧與語音助理
人工智慧與語音助理
 
第五組-AI視力檢測機AI Vision-Exam Presenation v.1.6.6
第五組-AI視力檢測機AI Vision-Exam Presenation v.1.6.6第五組-AI視力檢測機AI Vision-Exam Presenation v.1.6.6
第五組-AI視力檢測機AI Vision-Exam Presenation v.1.6.6
 
Apple ibeacon 20130513 ken
Apple ibeacon 20130513 kenApple ibeacon 20130513 ken
Apple ibeacon 20130513 ken
 
第四組-無人機&無人車的實作與應用Drone and self driving car (Quadcopter,Smart Car,Gesture Con...
第四組-無人機&無人車的實作與應用Drone and self driving car (Quadcopter,Smart Car,Gesture Con...第四組-無人機&無人車的實作與應用Drone and self driving car (Quadcopter,Smart Car,Gesture Con...
第四組-無人機&無人車的實作與應用Drone and self driving car (Quadcopter,Smart Car,Gesture Con...
 
庚寅虎年第一季
庚寅虎年第一季庚寅虎年第一季
庚寅虎年第一季
 
高速移動網路新時代 - 雲端與物聯網發展新趨勢 (An Integration Trend of Terminal Devices, IoT and C...
高速移動網路新時代  - 雲端與物聯網發展新趨勢 (An Integration Trend of Terminal Devices, IoT and C...高速移動網路新時代  - 雲端與物聯網發展新趨勢 (An Integration Trend of Terminal Devices, IoT and C...
高速移動網路新時代 - 雲端與物聯網發展新趨勢 (An Integration Trend of Terminal Devices, IoT and C...
 
2012 Phind Corp. 公司簡介
2012 Phind Corp. 公司簡介2012 Phind Corp. 公司簡介
2012 Phind Corp. 公司簡介
 
Data-centric IoT (NTU CSIE 2016.12)
Data-centric IoT (NTU CSIE 2016.12)Data-centric IoT (NTU CSIE 2016.12)
Data-centric IoT (NTU CSIE 2016.12)
 
移动终端的应用与未来 20100418
移动终端的应用与未来 20100418移动终端的应用与未来 20100418
移动终端的应用与未来 20100418
 
151107 物聯網教學應用發表會-開場
151107   物聯網教學應用發表會-開場151107   物聯網教學應用發表會-開場
151107 物聯網教學應用發表會-開場
 
AIoT team 2 report
AIoT team 2 reportAIoT team 2 report
AIoT team 2 report
 
Extended reality the end of distance -XR technologies applications at museum
Extended reality the end of distance -XR technologies applications at museumExtended reality the end of distance -XR technologies applications at museum
Extended reality the end of distance -XR technologies applications at museum
 

Similar to AI 時代下的新使用者介面 - 語音人工智慧 | Dec. 2017 威盛 OLAMI | 台中 OASIS FORUM

讯飞语音云及示范应用讯飞语点
讯飞语音云及示范应用讯飞语点讯飞语音云及示范应用讯飞语点
讯飞语音云及示范应用讯飞语点geekparknet
 
中華民國科技管理個案競賽 Motivate our taiwan
中華民國科技管理個案競賽 Motivate our taiwan中華民國科技管理個案競賽 Motivate our taiwan
中華民國科技管理個案競賽 Motivate our taiwan孟賢 顏
 
[2018 台灣人工智慧學校校友年會] 啟動物聯網新關鍵 - 未來由你「喚」醒 / 沈品勳
[2018 台灣人工智慧學校校友年會] 啟動物聯網新關鍵 - 未來由你「喚」醒 / 沈品勳[2018 台灣人工智慧學校校友年會] 啟動物聯網新關鍵 - 未來由你「喚」醒 / 沈品勳
[2018 台灣人工智慧學校校友年會] 啟動物聯網新關鍵 - 未來由你「喚」醒 / 沈品勳台灣資料科學年會
 
Conversational AI Orientation
Conversational AI OrientationConversational AI Orientation
Conversational AI OrientationRyan Chung
 
數位大革命來襲 掌握您的決勝關鍵
數位大革命來襲 掌握您的決勝關鍵數位大革命來襲 掌握您的決勝關鍵
數位大革命來襲 掌握您的決勝關鍵Mooi Hsieh
 
媒體、影視產業、AI新創
媒體、影視產業、AI新創媒體、影視產業、AI新創
媒體、影視產業、AI新創Albert Y. C. Chen
 
如何打造品牌热门App案例篇
如何打造品牌热门App案例篇如何打造品牌热门App案例篇
如何打造品牌热门App案例篇Mary Yang
 
移动互联网的微时代
移动互联网的微时代移动互联网的微时代
移动互联网的微时代宁 阮
 
Ai & dentistry from li na 20180926
Ai & dentistry from li na 20180926Ai & dentistry from li na 20180926
Ai & dentistry from li na 20180926Jinze Yu
 
Voice recognization in Android
Voice recognization in AndroidVoice recognization in Android
Voice recognization in Androidrogeryi
 
用AI創造大商機:媒體、廣告、電商、零售業的視覺辨識應用
用AI創造大商機:媒體、廣告、電商、零售業的視覺辨識應用用AI創造大商機:媒體、廣告、電商、零售業的視覺辨識應用
用AI創造大商機:媒體、廣告、電商、零售業的視覺辨識應用Albert Y. C. Chen
 
連結生活者水脈的創意發想與管理
連結生活者水脈的創意發想與管理連結生活者水脈的創意發想與管理
連結生活者水脈的創意發想與管理ivy hsu
 
[iCreate] Focus VC Show!! 上課講義~ 連結生活者水脈的創意發想與管理 by應用劇本實驗室創辦人暨營運總監林文綺
[iCreate]  Focus VC  Show!! 上課講義~ 連結生活者水脈的創意發想與管理 by應用劇本實驗室創辦人暨營運總監林文綺[iCreate]  Focus VC  Show!! 上課講義~ 連結生活者水脈的創意發想與管理 by應用劇本實驗室創辦人暨營運總監林文綺
[iCreate] Focus VC Show!! 上課講義~ 連結生活者水脈的創意發想與管理 by應用劇本實驗室創辦人暨營運總監林文綺ivy hsu
 
聊天機器人實作展示與解密 Tommy wut克邦
聊天機器人實作展示與解密 Tommy wut克邦聊天機器人實作展示與解密 Tommy wut克邦
聊天機器人實作展示與解密 Tommy wut克邦湯米吳 Tommy Wu
 
淡江資管專題演講簡報_那些年,我們應該知道得事情
淡江資管專題演講簡報_那些年,我們應該知道得事情淡江資管專題演講簡報_那些年,我們應該知道得事情
淡江資管專題演講簡報_那些年,我們應該知道得事情ChiaHsien Lee
 
AOI智慧升級─AI訓練師在地養成計畫_台灣人工智慧學校
AOI智慧升級─AI訓練師在地養成計畫_台灣人工智慧學校AOI智慧升級─AI訓練師在地養成計畫_台灣人工智慧學校
AOI智慧升級─AI訓練師在地養成計畫_台灣人工智慧學校CHENHuiMei
 
雲端科技
雲端科技雲端科技
雲端科技esther720
 
Hc meetup0828(sharing) (2)
Hc meetup0828(sharing) (2)Hc meetup0828(sharing) (2)
Hc meetup0828(sharing) (2)AI.academy
 

Similar to AI 時代下的新使用者介面 - 語音人工智慧 | Dec. 2017 威盛 OLAMI | 台中 OASIS FORUM (20)

讯飞语音云及示范应用讯飞语点
讯飞语音云及示范应用讯飞语点讯飞语音云及示范应用讯飞语点
讯飞语音云及示范应用讯飞语点
 
中華民國科技管理個案競賽 Motivate our taiwan
中華民國科技管理個案競賽 Motivate our taiwan中華民國科技管理個案競賽 Motivate our taiwan
中華民國科技管理個案競賽 Motivate our taiwan
 
[2018 台灣人工智慧學校校友年會] 啟動物聯網新關鍵 - 未來由你「喚」醒 / 沈品勳
[2018 台灣人工智慧學校校友年會] 啟動物聯網新關鍵 - 未來由你「喚」醒 / 沈品勳[2018 台灣人工智慧學校校友年會] 啟動物聯網新關鍵 - 未來由你「喚」醒 / 沈品勳
[2018 台灣人工智慧學校校友年會] 啟動物聯網新關鍵 - 未來由你「喚」醒 / 沈品勳
 
Conversational AI Orientation
Conversational AI OrientationConversational AI Orientation
Conversational AI Orientation
 
數位大革命來襲 掌握您的決勝關鍵
數位大革命來襲 掌握您的決勝關鍵數位大革命來襲 掌握您的決勝關鍵
數位大革命來襲 掌握您的決勝關鍵
 
媒體、影視產業、AI新創
媒體、影視產業、AI新創媒體、影視產業、AI新創
媒體、影視產業、AI新創
 
如何打造品牌热门App案例篇
如何打造品牌热门App案例篇如何打造品牌热门App案例篇
如何打造品牌热门App案例篇
 
企經會雲端知識蒐集達人-2012-0510
企經會雲端知識蒐集達人-2012-0510企經會雲端知識蒐集達人-2012-0510
企經會雲端知識蒐集達人-2012-0510
 
移动互联网的微时代
移动互联网的微时代移动互联网的微时代
移动互联网的微时代
 
Ai & dentistry from li na 20180926
Ai & dentistry from li na 20180926Ai & dentistry from li na 20180926
Ai & dentistry from li na 20180926
 
Voice recognization in Android
Voice recognization in AndroidVoice recognization in Android
Voice recognization in Android
 
2012-01-12資訊人員價值提升
2012-01-12資訊人員價值提升2012-01-12資訊人員價值提升
2012-01-12資訊人員價值提升
 
用AI創造大商機:媒體、廣告、電商、零售業的視覺辨識應用
用AI創造大商機:媒體、廣告、電商、零售業的視覺辨識應用用AI創造大商機:媒體、廣告、電商、零售業的視覺辨識應用
用AI創造大商機:媒體、廣告、電商、零售業的視覺辨識應用
 
連結生活者水脈的創意發想與管理
連結生活者水脈的創意發想與管理連結生活者水脈的創意發想與管理
連結生活者水脈的創意發想與管理
 
[iCreate] Focus VC Show!! 上課講義~ 連結生活者水脈的創意發想與管理 by應用劇本實驗室創辦人暨營運總監林文綺
[iCreate]  Focus VC  Show!! 上課講義~ 連結生活者水脈的創意發想與管理 by應用劇本實驗室創辦人暨營運總監林文綺[iCreate]  Focus VC  Show!! 上課講義~ 連結生活者水脈的創意發想與管理 by應用劇本實驗室創辦人暨營運總監林文綺
[iCreate] Focus VC Show!! 上課講義~ 連結生活者水脈的創意發想與管理 by應用劇本實驗室創辦人暨營運總監林文綺
 
聊天機器人實作展示與解密 Tommy wut克邦
聊天機器人實作展示與解密 Tommy wut克邦聊天機器人實作展示與解密 Tommy wut克邦
聊天機器人實作展示與解密 Tommy wut克邦
 
淡江資管專題演講簡報_那些年,我們應該知道得事情
淡江資管專題演講簡報_那些年,我們應該知道得事情淡江資管專題演講簡報_那些年,我們應該知道得事情
淡江資管專題演講簡報_那些年,我們應該知道得事情
 
AOI智慧升級─AI訓練師在地養成計畫_台灣人工智慧學校
AOI智慧升級─AI訓練師在地養成計畫_台灣人工智慧學校AOI智慧升級─AI訓練師在地養成計畫_台灣人工智慧學校
AOI智慧升級─AI訓練師在地養成計畫_台灣人工智慧學校
 
雲端科技
雲端科技雲端科技
雲端科技
 
Hc meetup0828(sharing) (2)
Hc meetup0828(sharing) (2)Hc meetup0828(sharing) (2)
Hc meetup0828(sharing) (2)
 

AI 時代下的新使用者介面 - 語音人工智慧 | Dec. 2017 威盛 OLAMI | 台中 OASIS FORUM

  • 1. AI 時代下的新使用者介面 - 語音人工智慧 h t t p : / / o l a m i . a i 威盛電子股份有限公司 Ryan Hang , 2017-12-16
  • 2. 人工智慧 • 人工智慧(Artificial Intelligence, AI)一詞最早起源於 1950 年代 • 1980 年代研究領域轉為(Machine Learning) • 2006 年深度神經網路(Deep Neural Network, DNN)發表 • 2012 年深度學習(Deep Learning)大爆發
  • 5. 語音人工智慧 語 音 辨 識 + 自 然 語 言 理 解 + 多 輪 互 動 = 新 一 代 的 使 用 者 介 面
  • 6. OLAMI 人工智慧平台 以 人 工 智 慧 創 造 新 一 代 的 “ 中 文 語 音 人 機 互 動 使 用 者 介 面 ”
  • 7. VIA Technologies, Inc. | http://olami.ai 語音辨識 Voice Recognition 電腦視覺 Computer Vision 語言理解 Language Understanding 語音命令檢測 Voice Commands Recognition 視線檢測 Eye Gaze Detection 即時目標檢測 Real-Time Object Detection 機器認知 Machine Cognition 自然語言語意理解 Natural Language Understanding 雲端語音辨識 Cloud Speech Recognition 人工智慧雲 AI Cloud Service OLAMI 是一個多元化的 AI 軟體開發平台 提 供 給 A I 產 品 開 發 者 的 軟 體 開 發 解 決 方 案 包 含 了 視 覺 , 聽 覺 , 以 及 語 言 理 解 領 域 自然語言語意互動 Natural Language Interaction
  • 9. 如何解決這類充滿歧異的中文語意? ü 知識庫的輔助,確定合理性,消除歧異。 ü 多層上下文處理技術(例如多輪對話)。 • 台中今天很冷 👉 能穿多少穿多少(多穿一點 👚) • 台中今天天氣如何? 👉 那台北呢? 👉 買一張去那裡的高鐵票。 ü 結合使用情境。
  • 10. OLAMI 中文語音辨識 最 深 入 台 灣 本 土 化 的 中 文 語 音 辨 識 技 術
  • 11. 以台灣中文為主的混合辨識引擎 ü 台灣在地化的用語 ü 解決“台灣國語”的口音問題 ü 國台語混合 or 國語+台語+英文混合 ü 台語辨識(中國大陸閩南語不完全等於台語)
  • 12. 簡體中文語音辨識也很OK! 協 助 台 灣 企 業 的 語 音 互 動 產 品 或 服 務 拓 展 至 中 國 大 陸 市 場
  • 13. 辨識率的迷思 9 9 % ? 9 8 % ? 9 7 % ?
  • 14. VIA Technologies, Inc. | http://olami.ai 案例:特殊領域專用詞彙及句型辨識 例句: • 嘴唇無發紺情形,予散瞳藥物使用。 • 鼻胃管留置,固定妥,口內內固定存。 • 於十點五十五分治療完畢協助出艙。 • 冰枕使用導致紅臀予以消毒。 Powered by Deep Learning ! 經資料採集、模型設計、深度學習訓練後的引擎,辨識率可達 97% 以上。
  • 15. VIA Technologies, Inc. | http://olami.ai 案例:台灣國語語音辨識率分析 評測日期:2016/12/19 • 男 女 共 計 1 0 人 • 測 試 2 0 0 句 語 料 • 樣 本 總 數 2 0 0 0 筆 測 試 範 例 ( 一 般 發 音 ) : 二 千 二 百 位 善 男 信 女 台 灣 國 語 發 音 參 考 案 例 : 嘔 千 嘔 百 位 善 藍 性 呂 82.24 75.30 72.29 78.39 64.45 56.99 50.00 55.00 60.00 65.00 70.00 75.00 80.00 85.00 OLAMI X 公司 B 公司 G 公司 N 公司 M 公司
  • 17. 離線辨識 & 邊緣運算(Edge Computing) • 命令詞辨識(Voice Command) • 語音喚醒(Hotword Detection) • 回聲消除(Acoustic Echo Cancelling;AEC)
  • 18. 遠場拾音技術 ( Far-Field Voice Recognition ) ü 命令詞辨識(Voice Command) ü 語音喚醒(Hotword Detection) ü 回聲消除(Acoustic Echo Cancelling; AEC)
  • 20. VIA Technologies, Inc. | http://olami.ai • Hands-Free 全 語 音 操 作 。 • 取 代 傳 統 鍵 盤 輸 入 作 業 。 • 大 幅 降 低 護 理 人 員 工 作 量 及 時 間 。 • 中 英 文 混 合 專 用 詞 彙 辨 識 。 智慧醫療應用: 語音輸入護理日誌 • 嘴唇無發紺 • 鼻胃管留置 • heart rate 是 86 • follow sugar 狀況 • 有 O2 mask 5L 使用
  • 21. VIA Technologies, Inc. | http://olami.ai OLAMI 人 工 智 慧 雲 OLAMI 機 器 認 知 OLAMI 內 容 數 據 語音辨識 API 語意理解 API 百科,即時數據 & 第三方 CP 數據 語音喚醒 / 離線命令詞辨識 SDK NLI 語意互動管理系統(智能對話) AI 軟體 & 服務 智慧裝置 & 機器人 AI 客服 & 導覽員 VR & AR 應用 軟體開發者 可應用於各種〝對話式〞服務與應用
  • 22. VIA Technologies, Inc. | http://olami.ai • 自然語言上下文處理與多輪對話能力。 • 百科與知識庫輔助應用範例。 • 自然語言於智慧家庭控制的應用示範。 https://www.youtube.com/watch?v=GRYj4WMZATM Smart Home 語音助理 APP 或智慧喇叭 示範影片 :
  • 23. VIA Technologies, Inc. | http://olami.ai 挑戰孩子們 模糊的語意及發音 • 陪伴型語音智慧喇叭應用場景: • Far-Field 遠距離收音 & 語音喚醒。 • 閒聊(自然語言理解)。 • 講故事、聽音樂。 • 學習數學。 • 多人語音訊息傳送與互動。 https://youtu.be/AiUfFRMhHKE 示範影片 :
  • 25. VIA Technologies, Inc. | http://olami.ai OLAMI Voice Kit – 語音智慧喇叭開發套件 威盛 OLAMI Voice Kit 語音智慧喇叭開發套件是一款整合 Far-Field 遠場麥克風收音、降噪、 自動語音辨識(喚醒)、自然語言理解等技術的 一站式 自然語言語音人機互動開發套件。 • 硬體 • 支援任何 ARM SoC,或 Raspberry Pi • 支援遠場收音的麥克風陣列板(Far-Field Microphone Array) • 麥克風與 speaker-out 經由 USB Audio,方便硬體整合與設計 • 軟體 • OLAMI Voice Kit SDK(支援 Android 和 Linux) • 降噪及 AEC 消回聲處理(可選擇由軟體支援,或由麥克風板硬體支援) • OLAMI 語音助理(智慧喇叭版本)範例程式
  • 27. 電腦視覺 x 語音互動 結 合 強 大 的 人 工 智 慧 , 讓 人 機 互 動 的 行 模 式 為 更 加 精 準 、 聰 明 !
  • 28. VIA Technologies, Inc. | http://olami.ai 結合視線檢測觸發語音互動流程,取代語音喚醒的動作。 • 基於 Deep Learning 訓練的視線檢測模型,辨識人臉視線(是否在看你): • 應用於機器人:讓 Robot 理解 User 是否正在看著它。 • 結合語音互動:當 User 看著 Robot 時,進行語音對話(無須經過語音喚醒的步驟)。 Gotcha ! 示範影片:https://youtu.be/RxPNDiG7Sls No No
  • 29. VIA Technologies, Inc. | http://olami.ai Eye/Gaze + Face Detection 她正在移動 可跟隨 Camera 拍攝畫面 示範影片:https://youtu.be/KaeKmwbKDhI
  • 30. VIA Technologies, Inc. | http://olami.ai 以物件檢測作為語音互動的觸發點 將 Real-Time Object Detection 模型優化, 使其不需要在高階的運算環境也可以流暢運作。 示範影片: https://youtu.be/_kf_VEjZbVw
  • 31. Thank You ! h t t p : / / o l a m i . a i 關注 「OLAMI 人工智慧開放」粉絲團掌握最新應用與發展 👉 👉 👉 @ai.olami