SlideShare a Scribd company logo
1 of 17
PRML review
(hidden markov model)
2016-01-27
markov model
1. 입력 데이터에 대한 순서(시간성) 도입
2. 문맥 데이터의 개념으로 확장 가능
3. 언어모델에 적함.
4. 이를 확장하여 이용하는 recurrent neural net
markov model
markov model
욕설을 분류한다고 했을 때,
상태 : 형용사, bj명, 욕(물론 실제 데이터에서는 상태는 더 많음. 다 할 수 없어 가정)
1차 마코프 모델로 했을 때, 생성될 수 있는 관측 데이터는 3^2 개
욕이 나왔는데 그전에 앞에 나온 상태가 bj-명사-bj 일 확률은 얼마인가?
P(O|A) = P(O1=bj, O2=명사, O3=bj | A)
= P(bj,명사,bj) =
= P(욕)
markov model (2)
2차, 3차? 로 갈 경우 관측데이터의 증가
많은 파라미터 값 추정이 필요하고, 그로 인한 계산 복잡도가 증가
주어진 데이터에 의해서 몇차까지 사용할 것인지에 대한 판단이 필요
Hidden markov model
1. 앞의 markov model에서 상태를 볼 수 없게 만듬.
2. 이것을 상태에 대한 은닉이라고 하여 은닉마코프모델이라고 한다.
3. 관측 데이터의 크기에 대한 문제(0차: m-1개, 1차: m(m-1), 2차 m^2(m-1)개)
4. 차수를 늘릴 수록 정확하겠지만, 기하급수적으로 늘어나게 됨
1. 모든 상태에서 각 상태를 관측 가능하다
2. 모든 상태에 대한 각 상태의
조건부확률 값을 갖고 있음.
Hidden markov model
무엇이 상태라는 것일가?
상태는 몇개인가?
확률 분포는 어떻게?
실제상태정보의 알 수 없음.
관측데이터(실제 학습 데이터)를 가지고 위 그림처럼(HMM) 만들어야 한다.
Hidden markov model in real world
What we find in data
세가지 파라미터가 우리가 찾아야 하는 것. 이것을 “학습”하는 것이다.
Build HMM
MLE가 안되..왜? 상태를 나타내는 변수를 확정지을 수 없다.(욕,bj명,명사)
latent variable model 이라고 부름 (이 latent variable 을 추정하는 단계가 필요)
EM(기대값 최대화) 알고리즘의 적용
p(욕| O,세타) 를 이용하여, p욕(O|세타) 이것을 찾아내야한다.
P(O|세타^new) > P(O|세타) 로
1)t 라는 순서(시간)에 Si 를 지나갈 확률
2)t 라는 시간에 Si, t+1에 Sj에 있을 확률
Expectation-maximization
loop
mixture model for gaussian
after
1. 데이터에 맞춘 러닝 알고리즘인가?
2. 갖고 있는 데이터에 대한 이해 먼저, 무엇을 찾아낼것인가.
3. 모델에 대한 이해가 더 나은 결과를 가져온다. 어떤 데이터를 넣어야하나? 이
런걸 생각해볼 수 있고, 피쳐선택등에 이롭다. 왜 이런 결과가 나오는지에 대한
가늠? 파악이 가능하다.
4. 결국엔 통계모델

More Related Content

Similar to hidden markov model

Introduction to SAC(Soft Actor-Critic)
Introduction to SAC(Soft Actor-Critic)Introduction to SAC(Soft Actor-Critic)
Introduction to SAC(Soft Actor-Critic)Suhyun Cho
 
Machine learning bysogood
Machine learning bysogoodMachine learning bysogood
Machine learning bysogoodS.Good Kim
 
시스템공학 기본(Fundamental of systems engineering) - Day6 design synthesis 2
시스템공학 기본(Fundamental of systems engineering) - Day6 design synthesis 2시스템공학 기본(Fundamental of systems engineering) - Day6 design synthesis 2
시스템공학 기본(Fundamental of systems engineering) - Day6 design synthesis 2Jinwon Park
 
알고리즘트레이딩 전략교육 커리큘럼 v4.0
알고리즘트레이딩 전략교육 커리큘럼 v4.0알고리즘트레이딩 전략교육 커리큘럼 v4.0
알고리즘트레이딩 전략교육 커리큘럼 v4.0Smith Kim
 
밑바닥부터시작하는딥러닝 Ch2
밑바닥부터시작하는딥러닝 Ch2밑바닥부터시작하는딥러닝 Ch2
밑바닥부터시작하는딥러닝 Ch2HyeonSeok Choi
 
2.supervised learning(epoch#2)-1
2.supervised learning(epoch#2)-12.supervised learning(epoch#2)-1
2.supervised learning(epoch#2)-1Haesun Park
 
[216]딥러닝예제로보는개발자를위한통계 최재걸
[216]딥러닝예제로보는개발자를위한통계 최재걸[216]딥러닝예제로보는개발자를위한통계 최재걸
[216]딥러닝예제로보는개발자를위한통계 최재걸NAVER D2
 
Natural Language Processing(NLP) - basic 2
Natural Language Processing(NLP) - basic 2Natural Language Processing(NLP) - basic 2
Natural Language Processing(NLP) - basic 2KyeongUkJang
 
데이터분석의 길 4: “고수는 통계학습의 달인이다”
데이터분석의 길 4:  “고수는 통계학습의 달인이다”데이터분석의 길 4:  “고수는 통계학습의 달인이다”
데이터분석의 길 4: “고수는 통계학습의 달인이다”Jaimie Kwon (권재명)
 
[NDC 2018] 유체역학 엔진 개발기
[NDC 2018] 유체역학 엔진 개발기[NDC 2018] 유체역학 엔진 개발기
[NDC 2018] 유체역학 엔진 개발기Chris Ohk
 

Similar to hidden markov model (11)

Introduction to SAC(Soft Actor-Critic)
Introduction to SAC(Soft Actor-Critic)Introduction to SAC(Soft Actor-Critic)
Introduction to SAC(Soft Actor-Critic)
 
Machine learning bysogood
Machine learning bysogoodMachine learning bysogood
Machine learning bysogood
 
시스템공학 기본(Fundamental of systems engineering) - Day6 design synthesis 2
시스템공학 기본(Fundamental of systems engineering) - Day6 design synthesis 2시스템공학 기본(Fundamental of systems engineering) - Day6 design synthesis 2
시스템공학 기본(Fundamental of systems engineering) - Day6 design synthesis 2
 
알고리즘트레이딩 전략교육 커리큘럼 v4.0
알고리즘트레이딩 전략교육 커리큘럼 v4.0알고리즘트레이딩 전략교육 커리큘럼 v4.0
알고리즘트레이딩 전략교육 커리큘럼 v4.0
 
Rnn keras
Rnn kerasRnn keras
Rnn keras
 
밑바닥부터시작하는딥러닝 Ch2
밑바닥부터시작하는딥러닝 Ch2밑바닥부터시작하는딥러닝 Ch2
밑바닥부터시작하는딥러닝 Ch2
 
2.supervised learning(epoch#2)-1
2.supervised learning(epoch#2)-12.supervised learning(epoch#2)-1
2.supervised learning(epoch#2)-1
 
[216]딥러닝예제로보는개발자를위한통계 최재걸
[216]딥러닝예제로보는개발자를위한통계 최재걸[216]딥러닝예제로보는개발자를위한통계 최재걸
[216]딥러닝예제로보는개발자를위한통계 최재걸
 
Natural Language Processing(NLP) - basic 2
Natural Language Processing(NLP) - basic 2Natural Language Processing(NLP) - basic 2
Natural Language Processing(NLP) - basic 2
 
데이터분석의 길 4: “고수는 통계학습의 달인이다”
데이터분석의 길 4:  “고수는 통계학습의 달인이다”데이터분석의 길 4:  “고수는 통계학습의 달인이다”
데이터분석의 길 4: “고수는 통계학습의 달인이다”
 
[NDC 2018] 유체역학 엔진 개발기
[NDC 2018] 유체역학 엔진 개발기[NDC 2018] 유체역학 엔진 개발기
[NDC 2018] 유체역학 엔진 개발기
 

Recently uploaded

JMP를 활용한 전자/반도체 산업 Yield Enhancement Methodology
JMP를 활용한 전자/반도체 산업 Yield Enhancement MethodologyJMP를 활용한 전자/반도체 산업 Yield Enhancement Methodology
JMP를 활용한 전자/반도체 산업 Yield Enhancement MethodologyJMP Korea
 
데이터 분석 문제 해결을 위한 나의 JMP 활용법
데이터 분석 문제 해결을 위한 나의 JMP 활용법데이터 분석 문제 해결을 위한 나의 JMP 활용법
데이터 분석 문제 해결을 위한 나의 JMP 활용법JMP Korea
 
공학 관점에서 바라본 JMP 머신러닝 최적화
공학 관점에서 바라본 JMP 머신러닝 최적화공학 관점에서 바라본 JMP 머신러닝 최적화
공학 관점에서 바라본 JMP 머신러닝 최적화JMP Korea
 
JMP를 활용한 가속열화 분석 사례
JMP를 활용한 가속열화 분석 사례JMP를 활용한 가속열화 분석 사례
JMP를 활용한 가속열화 분석 사례JMP Korea
 
JMP가 걸어온 여정, 새로운 도약 JMP 18!
JMP가 걸어온 여정, 새로운 도약 JMP 18!JMP가 걸어온 여정, 새로운 도약 JMP 18!
JMP가 걸어온 여정, 새로운 도약 JMP 18!JMP Korea
 
JMP 기능의 확장 및 내재화의 핵심 JMP-Python 소개
JMP 기능의 확장 및 내재화의 핵심 JMP-Python 소개JMP 기능의 확장 및 내재화의 핵심 JMP-Python 소개
JMP 기능의 확장 및 내재화의 핵심 JMP-Python 소개JMP Korea
 
실험 설계의 평가 방법: Custom Design을 중심으로 반응인자 최적화 및 Criteria 해석
실험 설계의 평가 방법: Custom Design을 중심으로 반응인자 최적화 및 Criteria 해석실험 설계의 평가 방법: Custom Design을 중심으로 반응인자 최적화 및 Criteria 해석
실험 설계의 평가 방법: Custom Design을 중심으로 반응인자 최적화 및 Criteria 해석JMP Korea
 
(독서광) 인간이 초대한 대형 참사 - 대형 참사가 일어날 때까지 사람들은 무엇을 하고 있었는가?
(독서광) 인간이 초대한 대형 참사 - 대형 참사가 일어날 때까지 사람들은 무엇을 하고 있었는가?(독서광) 인간이 초대한 대형 참사 - 대형 참사가 일어날 때까지 사람들은 무엇을 하고 있었는가?
(독서광) 인간이 초대한 대형 참사 - 대형 참사가 일어날 때까지 사람들은 무엇을 하고 있었는가?Jay Park
 

Recently uploaded (8)

JMP를 활용한 전자/반도체 산업 Yield Enhancement Methodology
JMP를 활용한 전자/반도체 산업 Yield Enhancement MethodologyJMP를 활용한 전자/반도체 산업 Yield Enhancement Methodology
JMP를 활용한 전자/반도체 산업 Yield Enhancement Methodology
 
데이터 분석 문제 해결을 위한 나의 JMP 활용법
데이터 분석 문제 해결을 위한 나의 JMP 활용법데이터 분석 문제 해결을 위한 나의 JMP 활용법
데이터 분석 문제 해결을 위한 나의 JMP 활용법
 
공학 관점에서 바라본 JMP 머신러닝 최적화
공학 관점에서 바라본 JMP 머신러닝 최적화공학 관점에서 바라본 JMP 머신러닝 최적화
공학 관점에서 바라본 JMP 머신러닝 최적화
 
JMP를 활용한 가속열화 분석 사례
JMP를 활용한 가속열화 분석 사례JMP를 활용한 가속열화 분석 사례
JMP를 활용한 가속열화 분석 사례
 
JMP가 걸어온 여정, 새로운 도약 JMP 18!
JMP가 걸어온 여정, 새로운 도약 JMP 18!JMP가 걸어온 여정, 새로운 도약 JMP 18!
JMP가 걸어온 여정, 새로운 도약 JMP 18!
 
JMP 기능의 확장 및 내재화의 핵심 JMP-Python 소개
JMP 기능의 확장 및 내재화의 핵심 JMP-Python 소개JMP 기능의 확장 및 내재화의 핵심 JMP-Python 소개
JMP 기능의 확장 및 내재화의 핵심 JMP-Python 소개
 
실험 설계의 평가 방법: Custom Design을 중심으로 반응인자 최적화 및 Criteria 해석
실험 설계의 평가 방법: Custom Design을 중심으로 반응인자 최적화 및 Criteria 해석실험 설계의 평가 방법: Custom Design을 중심으로 반응인자 최적화 및 Criteria 해석
실험 설계의 평가 방법: Custom Design을 중심으로 반응인자 최적화 및 Criteria 해석
 
(독서광) 인간이 초대한 대형 참사 - 대형 참사가 일어날 때까지 사람들은 무엇을 하고 있었는가?
(독서광) 인간이 초대한 대형 참사 - 대형 참사가 일어날 때까지 사람들은 무엇을 하고 있었는가?(독서광) 인간이 초대한 대형 참사 - 대형 참사가 일어날 때까지 사람들은 무엇을 하고 있었는가?
(독서광) 인간이 초대한 대형 참사 - 대형 참사가 일어날 때까지 사람들은 무엇을 하고 있었는가?
 

hidden markov model

  • 1. PRML review (hidden markov model) 2016-01-27
  • 2. markov model 1. 입력 데이터에 대한 순서(시간성) 도입 2. 문맥 데이터의 개념으로 확장 가능 3. 언어모델에 적함. 4. 이를 확장하여 이용하는 recurrent neural net
  • 4. markov model 욕설을 분류한다고 했을 때, 상태 : 형용사, bj명, 욕(물론 실제 데이터에서는 상태는 더 많음. 다 할 수 없어 가정) 1차 마코프 모델로 했을 때, 생성될 수 있는 관측 데이터는 3^2 개 욕이 나왔는데 그전에 앞에 나온 상태가 bj-명사-bj 일 확률은 얼마인가? P(O|A) = P(O1=bj, O2=명사, O3=bj | A) = P(bj,명사,bj) = = P(욕)
  • 5. markov model (2) 2차, 3차? 로 갈 경우 관측데이터의 증가 많은 파라미터 값 추정이 필요하고, 그로 인한 계산 복잡도가 증가 주어진 데이터에 의해서 몇차까지 사용할 것인지에 대한 판단이 필요
  • 6. Hidden markov model 1. 앞의 markov model에서 상태를 볼 수 없게 만듬. 2. 이것을 상태에 대한 은닉이라고 하여 은닉마코프모델이라고 한다. 3. 관측 데이터의 크기에 대한 문제(0차: m-1개, 1차: m(m-1), 2차 m^2(m-1)개) 4. 차수를 늘릴 수록 정확하겠지만, 기하급수적으로 늘어나게 됨
  • 7. 1. 모든 상태에서 각 상태를 관측 가능하다 2. 모든 상태에 대한 각 상태의 조건부확률 값을 갖고 있음. Hidden markov model
  • 8. 무엇이 상태라는 것일가? 상태는 몇개인가? 확률 분포는 어떻게? 실제상태정보의 알 수 없음. 관측데이터(실제 학습 데이터)를 가지고 위 그림처럼(HMM) 만들어야 한다. Hidden markov model in real world
  • 9. What we find in data 세가지 파라미터가 우리가 찾아야 하는 것. 이것을 “학습”하는 것이다.
  • 10. Build HMM MLE가 안되..왜? 상태를 나타내는 변수를 확정지을 수 없다.(욕,bj명,명사) latent variable model 이라고 부름 (이 latent variable 을 추정하는 단계가 필요) EM(기대값 최대화) 알고리즘의 적용 p(욕| O,세타) 를 이용하여, p욕(O|세타) 이것을 찾아내야한다. P(O|세타^new) > P(O|세타) 로
  • 11. 1)t 라는 순서(시간)에 Si 를 지나갈 확률 2)t 라는 시간에 Si, t+1에 Sj에 있을 확률
  • 12.
  • 14.
  • 15. mixture model for gaussian
  • 16.
  • 17. after 1. 데이터에 맞춘 러닝 알고리즘인가? 2. 갖고 있는 데이터에 대한 이해 먼저, 무엇을 찾아낼것인가. 3. 모델에 대한 이해가 더 나은 결과를 가져온다. 어떤 데이터를 넣어야하나? 이 런걸 생각해볼 수 있고, 피쳐선택등에 이롭다. 왜 이런 결과가 나오는지에 대한 가늠? 파악이 가능하다. 4. 결국엔 통계모델