2. 자연어 처리…?
What is the Natural Language Processing …?
정보 검색
음성 인식
감정 분석 단어 분류
개체명 인식
질의 응답
기계 번역
머신 러닝
품사 태깅
3. 자연어 처리…?
What is the Natural Language Processing …?
정보 검색
음성 인식
감정 분석 단어 분류
개체명 인식
질의 응답
기계 번역
머신 러닝
품사 태깅
구문 생성의미 파악형태 분석
4. 목차
01
02
03
04
1. 기계 번역
자연어 처리를 필요로 하는 가장 큰 이유
2. 형태 분석
입력 받은 문장을 형태소에 맞춰 분해하고
분석하는 과정
3. 의미 파악
주어진 형태소와 어순을 통해 문장의 의미를
파악하는 과정
4. 구문 생성
형태 분석과 의미 분석을 거쳐 적절한 답을
도출해 내는 과정
6. 1950’s1940’s 1960’s 1980~
고전적인 방법으로 자연어를 처리하는 것에
한계를 느낌… >> 이후 딥 러닝이 해결
자연어 처리의 암흑기
DB 와 연동하여 질의에 응답하는
시스템 개발
본격적인 자연어처리 연구
미국 정부의 지원으로 단어 - 단어 + 약간의 숙어
방식으로 번역기를 만듦
소련어의 논문을 영어로 번역하자 ! – (GAT)
Warren Weaver 와 Donald Booth
사이에서 처음으로 얘기가 나옴
처음으로 기계 번역이라는 개념 등장 !
기계 번역과 자연어 처리.. ?
8. 규칙 / 패턴 기반 방법론
If else 문으로 가능한 많은 경우의 수를
조건문으로 형성.
- 엄청난 노가다…
- 모든 단어와 문장의 경우의 수를 고려해야
하므로 굉장히 비효율적.
- 무한대에 가까운 경우의 수.
기계 번역 방식들 …
예시 / 검색 기반 방법론
데이터베이스에 수천~수만의 번역 예시를
저장하고 가장 유사한 결과를 출력함.
- 매우 떨어지는 정확도.
- 문장이 길어질 수록 산으로 감.
뉴럴 기반 방법론
심층학습 / 딥러닝 에 기반하여 현재 가장 연구가
활발히 되고 있음.
- 매우 느린 학습 / 처리 속도.
- 하드웨어가 더욱 발달한다면 가장 각광받을 것.
- 대규모의 데이터를 필요로 함.
통계 기반 방법론
현재 가장 널리 사용되는 번역 방식.
기계학습을 통한 절, 구, 어순 등의 세밀한 분석
- 임의의 언어쌍에 적용 가능
- 수천만의 통계 데이터가 필요함
- 데이터 도메인에 따라 분위기가 천차만별
25. 앞의 예를 잘 못 들었지만…
자람아 오늘 날씨 어떨 것 같니?
지금 몇 시인지 알려 줄래?
자람아 너는 좋아하는게 뭐니?
26. NPL 은 소프트웨어공학 + 수학 + 언어학 + 심리학 이 접목된
융합기술이다.
훗날 하드웨어가 발달하고 딥러닝,
머신러닝이 발달하면 더 정확하고
빠른 NPL 이 등장할 것.
따라서…
각 분야의 전문가들을 모아 NPL을
만들지 않는 이상, 60-80년대의
로직 수준의 NPL에서 벗어나긴
힘들 것.
>> 이는 빅데이터와 딥러닝이
해결해 줄 것임.