2016년 4월 9일
microsoft 세미나 발표자료입니다.
발표는 PPT 로 할거고 애니메이션등 약간의 내용을 추가해서 발표할 예정입니다.
알파고관련된 내용만있는 축약본은 아래링크에 있습니다.
http://www.slideshare.net/redrebel/20160409-ms-ml
What is AI?
Some possible definitions :
• Thinking humanly
• Acting humanly
• Thinking rationally
The Turing Test
Turing (1950) "Computing machinery and intelligence”
http://www.loebner.net/Prizef/TuringArticle.html
Deep Blue
순수하게 빠른 연산능력으로 모든 경우의 수 계산
https://ko.wikipedia.org/wiki/%EB%94%A5_%EB%B8%94%EB%A3%A8
https://en.wikipedia.org/wiki/Deep_Blue_(chess_computer)
Machine Learning
인공지능(AI) 의 ‘학습’에 관한 부분을 구체화한 기술
Arthur Samuel (1958)
machine learning : "Field of study that gives computers the
ability to learn without being explicitly programmed".
"컴퓨터에 명시적으로 프로그램되지 않고 학습 할 수 있는
능력을 주는 연구 분야.”
Machine Learning
Data mining
- 많은 데이터 속에서 유효한 정보를 찾아내는 과정
(데이터 속에 숨어 있는 의미를 발견)
Machie learning
- 데이터를 이용해 검증과 학습의 과정을 통해 특정
조건에서 예측값을 얻는 과정
(과거의 추이를 통해 미래를 예측)
Machine Learning
딥러닝 이전
데이터에 내재된 패턴, 규칙, 의미 등을 컴퓨터로 하여금
알고리즘을 기반으로 스스로 학습하게 해, 새롭게 입력되는
데이터에 대한 결과를 예측 가능하도록 하는 기술.
딥러닝 이후
데이터를 정제하고 정리하는 과정을 통해 추상화하고,
이렇게 추상화된 모형을 기반으로 훈련과 테스트를 통해
일반화된 알고리즘을 도출하는 과정.
Supervised Learning
• 보통의 머신러닝은 의미(lable)을 부여한 훈련 데이터를
기반으로 다른 데이터를 파악하는 지도 학습(Supervised
Learning) 사용
• Facebook 나 iPhoto 에서 ‘이사람이 영희다’ 라고 계속
입력해야 영희의 얼굴을 정확하게 인식.
• 아파트의 면적, 방의 갯수, 위치 등을 입력하고 아파트의
가격을 입력.
Machine Learning
• 머신러닝의 강점은 수많은 데이터 속에서 패턴을 스스로
찾아낸다는 것
• 미래에 관한 예측
• 하지만
• 오늘날 한국의 머신러닝은 콘텐츠 추천이나 검색 품질을
높이는 알고리즘 등 국한된 서비스에만 집중
• 마케팅 용어로만 강조
Deep Learning
• 인간의 신경망을 모태로한 데이터 처리방식(since 1958)
• 사물이나 데이터를 군집화하거나 분류(classfication)하는데
사용되는 일종의 기술적 방법론.
• 핵심 학습 방식은 자율 학습 ( Unsupervised Learing)
• 20~30개의 신경망 레이어로 복잡한 사물의 내용을 판단
History of Deep Learning
• First generation (1958) : perceptrons (F. Rosenblett,
1958)
• Second generation (1986) : multilayer perceptrons
• Third generation (2006) : deep learning
History of Deep Learning
• 불과 4~5년 전부터 컴퓨팅 기술과 수학이 모여 더 깊은
단계의 신경망이 구축되기 시작
• 최근 들어 새롭개 조명되는 이유
• 빅데이터
• 컴퓨팅 능력과 기술 향상
• 기계를 할 수 있는 알고리즘 발달
• http://www.aistudy.com/neural/perceptron.htm
연역적 추론 , 귀납적 추론
• 연역적 추론 :
• 이미 알고 있는 판단을 근거로 새로운 판단을 유도.
• 귀납적 추론 :
• 기존의 지식이나 데이터를 관찰하여, 그들 사이에
성립되는 일반적 성질 또는 관계를 이끌어 내거나,
반복되는 현상의 패턴들의 법칙을 형식화.
Induction(귀납적 추론)
deduction은 명제가 거의 확실하므로 추론도 거의 틀리지 않고
abduction 역시 어느정도는 틀리지 않는 추론이 가능하고
컴퓨터로 구현하기도 어려움이 없다.
하지만 induction은 통찰을 얻기 위해서는
많은 데이터(빅데이터)와 많은 수학적 계산이 필요하다.
이상거래 탐지 시스템(FDS)
• 어떠한 개인이 매달 25일쯤이 되면 일정한 범위의 지역의
ATM기기에서 일정한 범위(10 ~ 100 만원 정도의 오차)의
금액을 인출하는 패턴이 어느 기간동안 데이터로 저장.
• 위와 같은 패턴 (정상경우)
• 간단한 비밀번호만으로 돈의 인출을 승인.
• 25일 이전 or 전혀 다른 위치 or 너무 많은 인출요청
(비정상경우)
• 이상거래로 판단
• 보다 자세한 개인정보나 인출단계를 요구
=SS DSO U
• % c b OfS S QS b Sbe &
은닉1입력1
입력2
입력3
은닉2
은닉3
출력1
출력2
출력3
=SS DSO U
• % c b OfS S QS b Sbe &
Hidden1
Online
Pharmacy
Hidden2
Hidden3
Spam
Not Spam
5
-5
2
3
-5
5
5
0
5
0
0
5
=SS DSO U
• % c b OfS S QS b Sbe &
5
Online
Pharmacy
2
0
Spam
Not Spam
5
-5
2
3
-5
5
5
0
5
0
0
5
5×5 = 25
2×5 = 10
=SS DSO U
• % c b OfS S QS b Sbe &
0
Online
Pharmacy
5
0
Spam
Not Spam
5
-5
2
3
-5
5
5
0
5
0
0
5
5×5 = 25
0×5 = 0
=SS DSO U
• r
남자
머리가
길다(a)
여자
0
0
0
치마를
입었다(b)
화장을
했다(c)
0
0
0
Learn : a-> 여자
Learn : a-> 여자
Learn : a-> 남자
Learn : a-> 여자
남자
머리가
길다(a)
여자
1
0
3
치마를
입었다(b)
화장을
했다(c)
0
0
0
머리가 긴
사람이 남자일
확률은?
: 25%
=SS DSO U
• r
남자
머리가
길다(a)
여자
2
1
3
치마를
입었다(b)
화장을
했다(c)
1
4
4
머리가 길고 치마를 입었고
화장을 하지 않은 사람은(d)?
: 남자일 확률 (2+1->30%)
여자일 확률(3+4->70%)
#여자일거다.
맥주
화장품
5
1
2
4
d?
: 맥주를 살 확률
(3×5)+(7×2)->29
화장품을 살 확률
(3×1)+(7×4)->31
#화장품을 살 거다.
=SS DSO U
• r
남자
머리가
길다(a)
여자
2
1
3
치미를
입었다(b)
화장을
했다(c)
1
4
4
머리가 길고 치마를 입었고 화장을 하지 않은
사람은(d)?
: 지하1층? (29×4) + (31×2) = 116+62 -> 178
지상1층? (29×1) + (31×3) = 29+93 -> 122
#지하1층으로….!!!???
맥주
화장품
5
1
2
4
지하1층
지상1층
4
1
2
3
U b
(인간) 1 , 2 , 3 , 4 , 5 , 6 (베타고) 1 , 2 , 3 , 4 , 5 , 6 경우의 수 = 6! = 720
1 2 3 4 5 6 알파고
총점
인간
총점
승리
3 4 5 6 (기권) 10 8 베타고
4 3 5 3 2 (기권) 11 9 베타고
4 5 3 6 (기권) 11 7 베타고
4 6 1 5 (기권) 5 11 인간
3 2 4 6 (기권) 8 7 베타고
이해를 쉽게 하기 위한 예)일뿐 위의 점수들을 심각하게 생각하지는 마세요^^
4국에서의 이세돌의 78수는
신의 한수.?.!
• 알파고는 전략이 없음.
• 그저 매번 이길 확률이 높은 수를 택한다.
• 그래서 소위 인간이라면 하지 않을 손빼기를 여러번
하였음.
• 78수 이후에 급격히 경기력이 떨어진 이유도 마찮가지임.
• 바알못을 위한 이세돌 vs. 알파고 제4국 풀이
http://slownews.kr/52383
흉내바둑 논란이 있음?
• 50% 는 맞을수 있고 50%는 틀릴수 있음.
• 그저 매번 이길 확률이 높은 수를 택한다.
• 하지만 몬테 카롤로 탐색의 기본 컨셉은 랜덤 서치이므로
다른 경우의 수로 놓을 가능성이 많음.
이세돌 1명과 컴퓨터
1202대(CPU)의 대결을 불공정
게임?
• 5% 는 맞을수 있고 95%는 틀릴수 있음.
• 병렬처리 , 외부와의 커뮤니케이션 가능.
• 하지만, 그건 중요하지 않음.
• 불공정하다고 주장하는 이유들은 거의 다 틀린주장
http://www.hani.co.kr/arti/sports/baduk/734463.html
• 알파고에 대한 오해와 진실
https://plus.google.com/+CheolhoPark/posts/WNRMXTG2Rer
“데이터는 정확도”
• 많은 사람들의 기보와 많은 경험은 그만큼 더 많은
머신러닝의 소재가 되는 정보를 수집 할 수 있음.
• 이세돌과의 경기는 구글에겐 엄청난 가치의 데이터와
경험이 었음.
• http://biz.khan.co.kr/khan_art_view.html?artid=20160316
1003071&code=920301&med=khan
• http://www.insight.co.kr/newsRead.php?ArtNo=88&Col=
rep
• % - &
• }
bb 6++ Oa OP S Q +.,-1+,3+,-+U U S) b a)
P OQ ) S S)U Oa+ C2 LIINEd@_
• “
•
• (
( r
머신러닝과 우리
• 우리는 머신러닝을 ‘할때’가 아니다.
• 머신러닝을 ‘써야 할 때다’
• 그것도 아주 잘 활용해야 한다.
• 어떤 회사든 개인이든 활용을 위해 머신러닝 자체를
면밀히 파악해야겠지만, 그 기술자체를 만들겠다고, 말
그대로 ‘머신러닝을 하겠다’고 덤벼선 곤란하다.
• 머신러닝은 툴이다.
…
• bb a6++Q cR U U S Q + RcQba+ OQ S) SO U+
• bb 6++U U SRSd P Ua b +.,-2+,/+P U)
ab b
…
•
• bb a6++ROP S +A S
•
• bb 6++eee T cS bf Q +
•
• bb 6++ c b +
•
…
•
n r
r
…r
(
} r …
r o
bb 6++eee gR Sb Q + Sea+ SeaNd Se Oa 9O b QSN R8.,-
1-../-,...2
머신러닝을 알아야할 5가지
• 머신러닝은 모두에게 블랙박스와 같다.
• 백문이 불여일견, 신뢰하되 검증하라.
• 때로는 작아야 많이 담을 수 있다.
• 머신러닝은 분석 도구 중 하나다.
• 응용은 사람의 몫
• http://www.itdaily.kr/news/articleView.html?idxno=73632
Book
• 인공지능 세트(현대적 접근방식)
http://www.kangcom.com/sub/view.asp?sku=201601195782
• 머신러닝 (데이터를 이해하는 알고리즘의 예술과 과학)
http://www.kangcom.com/sub/view.asp?sku=201601149629
Link
• 로보틱스와 머신 러닝/인공지능 무료 교재 추천 15권
http://slownews.kr/36701
• 코세라(스텐포트 머신러닝 코스)
https://www.coursera.org/learn/machine-learning/
• 알파고를 파이썬으로 구현하는 프로젝트
https://github.com/Rochester-NRT/AlphaGo
• 모두를 위한 머신러닝/딥러닝 강의
http://hunkim.github.io/ml/
Link
• “기계에 지능을 더하는” 머신러닝의 이해
http://www.itworld.co.kr/techlibrary/91743
• http://www.itworld.co.kr/news/91546
• http://www.it.co.kr/news/article.html?no=2794932&sec_no=15
2
• https://googleblog.blogspot.kr/2015/10/11-things-to-know-
about-google-photos.html
• 머신러닝에 대해 알아야할 5가지
http://www.itdaily.kr/news/articleView.html?idxno=73632
• 딥러닝에 대한 쉬운 설명
http://www.bloter.net/archives/201445
Link
• 구글 인공지능과 이세돌 9단의 대국 전망
http://www.wikitree.co.kr/main/news_view.php?id=248248
• 모두의 알파고
http://www.slideshare.net/DonghunLee20/ss-59338971
• 알파고를 계기로 알게된 기계학습의 원리와 한계
http://platum.kr/archives/56039
• 알파고에 활용된 머신러닝 기술
http://techneedle.com/archives/25764
• 네이쳐에 투고된 알파고에 대한 논문
http://www.nature.com/nature/journal/v529/n7587/full/nature169
61.html
• https://brunch.co.kr/@madlymissyou/9