SlideShare a Scribd company logo
1 of 15
Download to read offline
Dialog system을 위한 

크라우드 소싱 기반의 학습데이터
수집 방안 연구
- Progress of Graduation Thesis
/김병준
x 2018 Summer
좋은 피드백이란
그건 별로야 논리가 부족하니까

선행연구를 더 찾아보는게 어때?
평가보다는
해결방안을 애기한다
원인과
우선 제 졸업논문은…
크라우드 소싱을 통해
특정대화에 대한 다양하고 많은 대화 표현을 수집하는 방법 연구
“알렉사, 뭐 먹을까?”
Crowdsourcing
먹을거 추천해줘
맛있는거 알려줘
뭐 먹지
먹기 좋은거
…
뭐 먹을까
뭐 먹을까
뭐 먹을까
뭐 먹을까
…
먹을거 추천해줘 뭐 먹을까
양
표현
https://www.amazon.com
이론적으로는
Sentence Similarity (Achananuparp etl al, 2008)
/ Semantic(의미론적) 유사도는 높고

 Syntactic(통사론적) 유사도는 낮은
점심 뭐 먹을까?
점심 뭐 먹을까?
점심 뭐 먹을까?
점심메뉴 추천해줘
Semantic
Syntactic
100
100
100
20
Example.
이게 왜 중요하냐면
IT 공룡기업들의 잇따른 AI 기술 민주화 선언에 따라
음성인식 기술 개발 툴이 제공되면서
기술적 문제보다는 특정 의미에 대응하는 대화 데이터 수집이 중요해짐
발화 데이터를 넣어서 

음성인식 서비스를 만듦
https://dialogflow.com/ https://developer.amazon.com/alexa/console/ask?
하지만, 발화데이터 수집은 Challenging Task
발화데이터 수집 방식은
1) 문법적인 형식에 맞춰 늘리거나

2) Small Scale의 Wizard of OZ

3) 기존 Corpus 사용

…
모으고 전사하고 라벨링
Or
Low
Performance
OTL
어떻게 만들어야 할까?에 대한 고민
계속 보고 읽고 듣고…

(Information Gap Theory, Placebo, Wide wall effect, Social Proof…)
Social Proof
이 논문은
사람들에게 피드백 요청을 하면

좋은 대답을 해주려하는 

Bias 문제를 해결하고자 함
Social Proof 이론을 적용해서
How?
이 논문은
사람들에게 피드백 요청을 하면

좋은 대답을 해주려하는 

Bias 문제를 해결하고자 함
Social Proof 이론을 적용해서
How?
How?
Social Proof를 정리해보면
주어진 상황에서 올바른 행동을 반영하기 위해 

사람들이 다른 사람들의 행동을 취하는 심리적, 사회적 현상
https://www.convertingcopy.com/what-is-social-proof-and-how-can-it-make-or-break-your-sitebusiness-online/
제 연구에서는
2가지 Study 중 Crowdsourcing Experiments에 적용
Study 1.
Crowdsourcing 

Experiments
Study 2.
Semi-Structured

Interviews
제공하는 예시의 종류를 독립변인으로
3가지 Condition별 각 100명씩 

Mturk 진행
각 Condition별 

Mturk 참가자 10명 반구조화 인터뷰
진행
Study 1에 대해 조금 더 애기하자면
다른 사람들이 한 예시라 설명하고
None / Positive / Negative 형식으로 제공
종속 변인 측정
1) Time

2) Sentence Similarity

3) Cognitive load
None Positive Negative
- 뭐 먹을까?
맛있는거 추천해줘
뭐 먹지?
뭐 먹을까?
뭐 먹을까?
뭐 먹을까?
O X
앞으로의 계획은
8월에는 실험물 제작해서 실험하고 결과를 내보기로
D - 36
여담으로
답은 데이터 시각화? ELK stack, 파이썬 시각화 툴, 통계 공부 중..
UX의 가치는 어떻게 증명하는가?
Byungjoon Kim
User Experience Lab
Graduate School of Convergence Science and Technology
Seoul National University
Contact
E-mail: kimbyungjoon@snu.ac.kr
Dialog system을 위한 

크라우드 소싱 기반의 학습데이터 수집 방안 연구
- Progress of Graduation Thesis
감사합니다

More Related Content

Similar to Dialog system을 위한 크라우드 소싱 기반의 학습데이터 수집방안 연구

2011 susi nonsul_announce_in_sa
2011 susi nonsul_announce_in_sa2011 susi nonsul_announce_in_sa
2011 susi nonsul_announce_in_sa
보승 강
 
정리되는 지혜노트 version 2 v1.0 200901
정리되는 지혜노트 version 2 v1.0 200901정리되는 지혜노트 version 2 v1.0 200901
정리되는 지혜노트 version 2 v1.0 200901
jihoon jung
 
[뉴미디어] Creative learning 정윤하,박하나 1106
[뉴미디어] Creative learning 정윤하,박하나 1106[뉴미디어] Creative learning 정윤하,박하나 1106
[뉴미디어] Creative learning 정윤하,박하나 1106
J Park
 
갈등과 네트워크 소통 전략(13 oct2011)
갈등과 네트워크 소통 전략(13 oct2011)갈등과 네트워크 소통 전략(13 oct2011)
갈등과 네트워크 소통 전략(13 oct2011)
Han Woo PARK
 
리서치란 무엇인가
리서치란 무엇인가리서치란 무엇인가
리서치란 무엇인가
sundol75
 
첫눈에 반한 커뮤니케이션이론
첫눈에 반한 커뮤니케이션이론첫눈에 반한 커뮤니케이션이론
첫눈에 반한 커뮤니케이션이론
commbooks
 
00 갈등 Disc
00 갈등 Disc00 갈등 Disc
00 갈등 Disc
parkds2
 
New attempts to explore the study(학문을 대하는 새로운 시도)
New attempts to explore the study(학문을 대하는 새로운 시도)New attempts to explore the study(학문을 대하는 새로운 시도)
New attempts to explore the study(학문을 대하는 새로운 시도)
jihoon jung
 
정자중학교 학습효과 개선을 위한 서비스디자인 워크숍 결과 정리
정자중학교 학습효과 개선을 위한 서비스디자인 워크숍 결과 정리정자중학교 학습효과 개선을 위한 서비스디자인 워크숍 결과 정리
정자중학교 학습효과 개선을 위한 서비스디자인 워크숍 결과 정리
한국디자인진흥원 공공서비스디자인PD
 

Similar to Dialog system을 위한 크라우드 소싱 기반의 학습데이터 수집방안 연구 (20)

IoT & UX
IoT & UXIoT & UX
IoT & UX
 
2011 susi nonsul_announce_in_sa
2011 susi nonsul_announce_in_sa2011 susi nonsul_announce_in_sa
2011 susi nonsul_announce_in_sa
 
정리되는 지혜노트 version 2 v1.0 200901
정리되는 지혜노트 version 2 v1.0 200901정리되는 지혜노트 version 2 v1.0 200901
정리되는 지혜노트 version 2 v1.0 200901
 
[동그라미재단] 2014ㄱ찾기_서울중등진로와직업교과교육연구회_디자인 사고
[동그라미재단] 2014ㄱ찾기_서울중등진로와직업교과교육연구회_디자인 사고[동그라미재단] 2014ㄱ찾기_서울중등진로와직업교과교육연구회_디자인 사고
[동그라미재단] 2014ㄱ찾기_서울중등진로와직업교과교육연구회_디자인 사고
 
[뉴미디어] Creative learning 정윤하,박하나 1106
[뉴미디어] Creative learning 정윤하,박하나 1106[뉴미디어] Creative learning 정윤하,박하나 1106
[뉴미디어] Creative learning 정윤하,박하나 1106
 
무료강의 논리적글쓰기 요약본
무료강의 논리적글쓰기 요약본무료강의 논리적글쓰기 요약본
무료강의 논리적글쓰기 요약본
 
[Recobell] 넛지의비밀,애드테크가 증명하다 monthly october
[Recobell] 넛지의비밀,애드테크가 증명하다 monthly october[Recobell] 넛지의비밀,애드테크가 증명하다 monthly october
[Recobell] 넛지의비밀,애드테크가 증명하다 monthly october
 
갈등과 네트워크 소통 전략(13 oct2011)
갈등과 네트워크 소통 전략(13 oct2011)갈등과 네트워크 소통 전략(13 oct2011)
갈등과 네트워크 소통 전략(13 oct2011)
 
리서치란 무엇인가
리서치란 무엇인가리서치란 무엇인가
리서치란 무엇인가
 
첫눈에 반한 커뮤니케이션이론
첫눈에 반한 커뮤니케이션이론첫눈에 반한 커뮤니케이션이론
첫눈에 반한 커뮤니케이션이론
 
Decision and experience: why don’t we choose what makes us happy?
Decision and experience: why don’t we choose what makes us happy?Decision and experience: why don’t we choose what makes us happy?
Decision and experience: why don’t we choose what makes us happy?
 
첫눈에 반한 커뮤니케이션 이론 1장
첫눈에 반한 커뮤니케이션 이론 1장첫눈에 반한 커뮤니케이션 이론 1장
첫눈에 반한 커뮤니케이션 이론 1장
 
(강의용) 사회적 경제와 디자인 띵킹_김재훈
(강의용) 사회적 경제와 디자인 띵킹_김재훈 (강의용) 사회적 경제와 디자인 띵킹_김재훈
(강의용) 사회적 경제와 디자인 띵킹_김재훈
 
[TOC for Education] Approaches to Problem Solving
[TOC for Education]  Approaches to Problem Solving [TOC for Education]  Approaches to Problem Solving
[TOC for Education] Approaches to Problem Solving
 
00 갈등 Disc
00 갈등 Disc00 갈등 Disc
00 갈등 Disc
 
New attempts to explore the study(학문을 대하는 새로운 시도)
New attempts to explore the study(학문을 대하는 새로운 시도)New attempts to explore the study(학문을 대하는 새로운 시도)
New attempts to explore the study(학문을 대하는 새로운 시도)
 
RU5th Open Project_COACH
RU5th Open Project_COACHRU5th Open Project_COACH
RU5th Open Project_COACH
 
효과적인 강의기법 (스마트 교육)
효과적인 강의기법 (스마트 교육)효과적인 강의기법 (스마트 교육)
효과적인 강의기법 (스마트 교육)
 
창조 능력을 키우는 TOC 사고프로세스
창조 능력을 키우는 TOC 사고프로세스창조 능력을 키우는 TOC 사고프로세스
창조 능력을 키우는 TOC 사고프로세스
 
정자중학교 학습효과 개선을 위한 서비스디자인 워크숍 결과 정리
정자중학교 학습효과 개선을 위한 서비스디자인 워크숍 결과 정리정자중학교 학습효과 개선을 위한 서비스디자인 워크숍 결과 정리
정자중학교 학습효과 개선을 위한 서비스디자인 워크숍 결과 정리
 

More from Byungjoon Kim

More from Byungjoon Kim (8)

0529 designing the club of the future with data
0529 designing the club of the future with data0529 designing the club of the future with data
0529 designing the club of the future with data
 
180417 Curiosity killed the cat but makes crowdwork better
180417 Curiosity killed the cat but makes crowdwork better 180417 Curiosity killed the cat but makes crowdwork better
180417 Curiosity killed the cat but makes crowdwork better
 
Managing uncertainty in time expression for virtual assistant
Managing uncertainty in time expression for virtual assistantManaging uncertainty in time expression for virtual assistant
Managing uncertainty in time expression for virtual assistant
 
Prediction of ice breaking
Prediction of ice breakingPrediction of ice breaking
Prediction of ice breaking
 
지위와 인종이 Hai에 미치는 영향
지위와 인종이 Hai에 미치는 영향지위와 인종이 Hai에 미치는 영향
지위와 인종이 Hai에 미치는 영향
 
Locally noisy autonomous agents improve global human coordination in network ...
Locally noisy autonomous agents improve global human coordination in network ...Locally noisy autonomous agents improve global human coordination in network ...
Locally noisy autonomous agents improve global human coordination in network ...
 
Does a conversational robot need to have its own values
Does a conversational robot need to have its own values Does a conversational robot need to have its own values
Does a conversational robot need to have its own values
 
Real conversations with artificial intelligence
Real conversations with artificial intelligenceReal conversations with artificial intelligence
Real conversations with artificial intelligence
 

Dialog system을 위한 크라우드 소싱 기반의 학습데이터 수집방안 연구

  • 1. Dialog system을 위한 
 크라우드 소싱 기반의 학습데이터 수집 방안 연구 - Progress of Graduation Thesis /김병준 x 2018 Summer
  • 2. 좋은 피드백이란 그건 별로야 논리가 부족하니까
 선행연구를 더 찾아보는게 어때? 평가보다는 해결방안을 애기한다 원인과
  • 3. 우선 제 졸업논문은… 크라우드 소싱을 통해 특정대화에 대한 다양하고 많은 대화 표현을 수집하는 방법 연구 “알렉사, 뭐 먹을까?” Crowdsourcing 먹을거 추천해줘 맛있는거 알려줘 뭐 먹지 먹기 좋은거 … 뭐 먹을까 뭐 먹을까 뭐 먹을까 뭐 먹을까 … 먹을거 추천해줘 뭐 먹을까 양 표현 https://www.amazon.com
  • 4. 이론적으로는 Sentence Similarity (Achananuparp etl al, 2008) / Semantic(의미론적) 유사도는 높고
 Syntactic(통사론적) 유사도는 낮은 점심 뭐 먹을까? 점심 뭐 먹을까? 점심 뭐 먹을까? 점심메뉴 추천해줘 Semantic Syntactic 100 100 100 20 Example.
  • 5. 이게 왜 중요하냐면 IT 공룡기업들의 잇따른 AI 기술 민주화 선언에 따라 음성인식 기술 개발 툴이 제공되면서 기술적 문제보다는 특정 의미에 대응하는 대화 데이터 수집이 중요해짐 발화 데이터를 넣어서 
 음성인식 서비스를 만듦 https://dialogflow.com/ https://developer.amazon.com/alexa/console/ask?
  • 6. 하지만, 발화데이터 수집은 Challenging Task 발화데이터 수집 방식은 1) 문법적인 형식에 맞춰 늘리거나
 2) Small Scale의 Wizard of OZ
 3) 기존 Corpus 사용
 … 모으고 전사하고 라벨링 Or Low Performance OTL
  • 7. 어떻게 만들어야 할까?에 대한 고민 계속 보고 읽고 듣고…
 (Information Gap Theory, Placebo, Wide wall effect, Social Proof…) Social Proof
  • 8. 이 논문은 사람들에게 피드백 요청을 하면
 좋은 대답을 해주려하는 
 Bias 문제를 해결하고자 함 Social Proof 이론을 적용해서 How?
  • 9. 이 논문은 사람들에게 피드백 요청을 하면
 좋은 대답을 해주려하는 
 Bias 문제를 해결하고자 함 Social Proof 이론을 적용해서 How?
  • 10. How? Social Proof를 정리해보면 주어진 상황에서 올바른 행동을 반영하기 위해 
 사람들이 다른 사람들의 행동을 취하는 심리적, 사회적 현상 https://www.convertingcopy.com/what-is-social-proof-and-how-can-it-make-or-break-your-sitebusiness-online/
  • 11. 제 연구에서는 2가지 Study 중 Crowdsourcing Experiments에 적용 Study 1. Crowdsourcing 
 Experiments Study 2. Semi-Structured
 Interviews 제공하는 예시의 종류를 독립변인으로 3가지 Condition별 각 100명씩 
 Mturk 진행 각 Condition별 
 Mturk 참가자 10명 반구조화 인터뷰 진행
  • 12. Study 1에 대해 조금 더 애기하자면 다른 사람들이 한 예시라 설명하고 None / Positive / Negative 형식으로 제공 종속 변인 측정 1) Time
 2) Sentence Similarity
 3) Cognitive load None Positive Negative - 뭐 먹을까? 맛있는거 추천해줘 뭐 먹지? 뭐 먹을까? 뭐 먹을까? 뭐 먹을까? O X
  • 13. 앞으로의 계획은 8월에는 실험물 제작해서 실험하고 결과를 내보기로 D - 36
  • 14. 여담으로 답은 데이터 시각화? ELK stack, 파이썬 시각화 툴, 통계 공부 중.. UX의 가치는 어떻게 증명하는가?
  • 15. Byungjoon Kim User Experience Lab Graduate School of Convergence Science and Technology Seoul National University Contact E-mail: kimbyungjoon@snu.ac.kr Dialog system을 위한 
 크라우드 소싱 기반의 학습데이터 수집 방안 연구 - Progress of Graduation Thesis 감사합니다