2. 딥러닝 모델 기반의 인공신경망 기계 번역
SSL암호화를 통해 안전한 통신 제공
약 55개의 언어를 지원->지원되는 모든 언어 간에 번역제공
기본적으로 사용한 만큼 비용 지불->
번역을 위한 API로 전송된 총 문자 수를 기준으로 요금이 부과
->프리티어: 12개월 동안 월 2백만개
->1백만 자당 15USD 약17000원
6. 소스 언어
출력 언어
소스 텍스트
출력 텍스트
작동방식 애플리케이션 통합을 확인
JSON
{
“Text”:”안녕하세요”,
“SourceLanguageCode”:”auto”,
“TargetLanguageCode”:”en”
}
JSON
{
“Text”:”Hallo”,
“SourceLanguageCode”:”ko”,
“TargetLanguageCode”:”en”
}
utf-8
utf-8
UnsupportedLanguagePairException
지원되지 않을시
Err
Real-Time Translation
9. import json
import boto3
def lambda_handler(event, context):
# TODO implement
translate = boto3.client(service_name='translate', region_name='ap-northeast-2', use_ssl=True)
result = translate.translate_text(Text=event[‘text’], SourceLanguageCode="en", TargetLanguageCode="ko")
resultText = result.get('TranslatedText')
…
SDK를 이용
Real-Time Translation
10. Real-Time Translation
주의:Identity and Access Management(IAM) Role :Lambda
참고URL:https://docs.aws.amazon.com/ko_kr/translate/latest/dg/translate-api-permissions-ref.htmll
간단한 테스트 중이라면: TranslateFullAccess
최종적으로는 적절한 설정
ex)
SourceLanguageCode: ‘ko’
translate:TranslateText 만으로 충분
SourceLanguageCode: ‘auto’
translate:TranslateText
comprehend:DetectDominantLanguage도 포함
Comprehend
언어식별
20. Asynchronous Batch Processing
지원 리전
미국 동부(버지니아 북부)
미국 동부(오하이오)
미국 서부(오레곤)
아시아 태평양(서울)
유럽(프랑크푸르트)
유럽(아일랜드)
유럽(런던)
참고URL:https://aws.amazon.com/ko/about-aws/whats-new/2020/01/amazon-translate-introduces-batch-translation/
작동 방식
번역 파일 형식
TEXT .txt
HTML .html or .xml
Word .docx
Excel .xlsx
PowerPoint .pptx
1.Source문자열을 여러 문장로 나누는 함수 동
작
Source TargetTranslate
2.각 문장에 대해 Translate연산을 호출 하는 함수
동작
30. 사용자 지정 용어
AZ 가용영역
AZ AZ
원하는 결과
실제 결과
EN:
EN:
KO:
KO:
Custom terminology(사용자 지정 용어)
31. 소스 언어
출력 언어
소스 텍스
트
출력 텍스
트
동작원리
Custom terminology(사용자 지정 용어)
32. .csv(쉼표로 분리된 값)
.tmx(번역 소프트웨어에서 일반적으로 사용되는 XML유형 파일
암호화 키
용어 파일 데이터 형
식
AWS의 암호화 키
현재 계정의 키 : KMS 키 ID
다른 계정의 키 : KMS 키 ARN
Custom terminology(사용자 지정 용어)
33. .csv(쉼표로 분리된 값)
암호화 키
AWS의 암호화 키
en,ko
AZ,가용영역
Custom terminology(사용자 지정 용어)
36. 모범 사례
1.모호하지 않은 단어만 포함
2.대체 의미로는 사용 되지 않는 오직 한 가지 방식으로만 번역하려는 단어
만 사용
3.브랜드 이름 및 제품 이름과 같은 고유 명사 와 같은 단어로 목록을 제한
4.동일한 소스 단어에 다른 번역을 포함 시키지 않음
Custom terminology(사용자 지정 용어)