사람에 가까운 자연스럽고 깨끗한 합성음을 제공하는 음성 합성 API인 Clova Premium Voice에 대한 기능 및 데모를 통한 사용법을 소개합니다 | Introducing features and demos for Clova Premium Voice, a voice synthesis API that provides near-human, natural, clean sounds
4. Text to Speech
서비스는 아주 오래 전부터 우리와 함께한 기술
‘음성합성 서비스’텍스트를 음성으로 바꿔주는 것
텍스트를 얼마나 정확하게 인식하는지 그리고 또 얼마나 자연스럽게 읽느냐 가
비슷한 목소리라고 판단하는 가지 기준
음색의 유사성 목소리 톤이 비슷한가
음소의 유사성 발음이 유사한가
준언어적 요소의 유사성 말소리의 음향적 성질이 유사한가
언어적 유사성 문장 구성 방식이 유사한가
언어외적 요소의 유사성 말하기 습관이 유사한가
5. - 텍스트를 음성으로 변환
- 자연스러운 합성음
- 총 9개의 음색 제공 (언어별 2개 이하)
- Rest API 제공
- 한국어, 영어, 일어, 중국어, 스페인어 제공
Clova Speech Synthesis
Request body : {“안녕하세요.”}
.MP3
서비스라고 들어보셨나요 익숙한 분도 있고 생소한 분도 있을 겁니다
서비스는 아주 오래 전부터 우리와 함께한 기술인데요
의 약자로 흔히 ‘음성 합성 서비스’라고 부르죠 쉽게 말해 텍스트를 음성으
로
바꿔주는 것을 말합니다
10. REST API 지원
HTTP Request
텍스트,
option
HTTP Response
mehtod : POST
header : Client ID, Client Secret
Clova Speech Synthesis
Clova Premium Voice
mp3, wav
기반의
사용자 인증(로그인)이 필요하지 않은 비로그인 Open API
11. REST API EndPoint
API 명 메서드 EndPoint URL Return
Clova Speech Synthesis POST https://naveropenapi.apigw.ntruss.com/voice/v1/tts MP3
Clova Premium Voice POST https://naveropenapi.apigw.ntruss.com/voice-premium/v1/tts
MP3,
WAV
12. Clova Speech Synthesis Reqeust Parameter
파라미터 이름 타입 설명
speaker string
mijin : 한국어, 여성 음색
jinho : 한국어, 남성 음색
clara : 영어, 여성 음색
matt : 영어, 남성 음색
shinji : 일본어, 남성 음색
meimei : 중국어, 여성 음색
liangliang : 중국어, 남성 음색
jose : 스페인어, 남성 음색
carmen : 스페인어, 여성 음색
speed integer -5 ~ 5
text string
UTF-8 인코딩
5000자 이하
13. Clova Premium Voice Reqeust Parameter
파라미터 이름 타입 설명
speaker string nara : 한국어, 여성 음색
Volume integer -5 ~ 5
Emotion integer
0 : 기본
1 : 어두움
2 : 밝음
Format integer Wav, mp3
Pitch integer -5 ~ 5
Speed integer -5 ~ 5
text string
UTF-8 인코딩
200자 이하