Voice UX has strongly related with Human communication. Here is why Voice User Experience is weird and how to change it better based on Human to Human and Human to Machine interaction concept
23. 2018. 2. 25.Copyright, Andy Na, All rights reserved
•
분류기준 내용 적용 예
적용화자 화자종속 미리 등록한 특정화자만을 대
상.
인식 성능이 뛰어남.
휴대폰 Voice dialing
화자독립 불특정 화자를 대상.
대용량의 음성 데이터베이스
필요.
Directory
assistance 서비스
발음형태 고립어 고립어 고립 단어 인식.
단어 앞뒤에 상당한 묵음구간
존재.
Voice 브라우저
연속어 연결단어, 연속문장 및 대화체
음성 인식.
다양한 발음변이를 고려한 기
준패턴과Task에 맞는 언어모델
이 필요.
적용방법에 따라 핵심어 인식
기술도 요구됨.
음성 타이프라이터,
자동예약시스템,
대화형 컴퓨터
어휘 수 소용량 수백 단어 이하. 단어를 개개의
모델로 구성하거나 문맥 독립
형 모델 사용.
PC commander
대용량 수만 단어 이상. 문맥을 고려한
수천 개의 sub-word 형태의 모
델단위 사용.
음성 타이프라이터, 방송용 뉴
스transcription
ü
ü
ü
25. 2018. 2. 25.Copyright, Andy Na, All rights reserved
IQ AI Human Age
97 18 Year old
Eugene
(Super com)
13 Year old
55.5 6 Year old
Google Assistant
(Google)
47.28
Deep Speech2
Baidu
32.92
Cortana
(microsoft)
31.98
Siri
(Apple)
23.9
•
•
Processors
By Google Research Team