BOAZ 분석 17기 Stalker팀
MBTI 기반 투자성향분석 챗봇 개발
떡상이
김
지
원
조
수
연
유
승
희
김
나
현
곽
윤
경
팀 이름
STALKER
팀 이름
목차
STALKER의 투자성향분석
주제 선정 이유
서비스 시연
서비스 구축 과정
- 설계
- 모델링
1
2
3
56
45
33
https://pf.kakao.com/_yxdGLb
떡상이 친구추가 해주세요!
주제 선정 이유
2030세대 의 투자 관심도 증가
시중의 투자 성향 분석
MBTI 성격유형에 따른 투자성향 연구
MBTI 타입별 투자 성향은
유의한 의미를 가짐
※ 최종 주제 ※
MBTI별 개인 맞춤형 투자 성향 분석
투자 가이드 라인을 제공하는 챗봇 구현하기
주제 선정 이유
서비스 개요
카카오톡 플러스친구 STALKER MBTI 기반 투자성향 분석
STALKER
‘STOCK’ + ‘TALKER’
서비스 설계
DATA SET
- 긍/부정 주관식 답변을 유도할 수 있는 질문 10개 제작
- 구글폼 활용하여 약 3000개의 답변 데이터 확보
- 긍부정의 정도를 기준으로 총 5가지로 라벨링 작업
서비스 설계
📌 객관식 및 주관식 총 20문항
📌 스토리 형식 질문으로 구성
아무도 먼저 나에게 말을 걸어주지 않는다면 어떤 기분이나 생각이 드시나요?
주식 초보인 나에게 주식 포트폴리오 구성 종목, 작성법, 심지어 글씨체까지 알려주는 친절한
옆자리 훈수러 프로도. 당신은 프로도가 마음에 드시나요?
프로도가 나에게 열심히 주식을 알려주다가, 뜬금없이 '지진나면 어떻게 할거야?' 라고
물어봅니다. 이 때 당신의 행동이나 생각을 적어주세요.
당신은 일년동안 스터디에서 열심히 공부해서 세미나 발표를 무사히 끝냈습니다. 절친 춘식이
가 "너 공부 열심히 안하는 것 같았는데 발표 잘했다." 라고 했을때, 당신의 기분은 어떤가요?
챗봇 질문 제시 -> 사용자 답변
서비스 설계
📌 카카오톡 오픈빌더 플랫폼 이용하여 질문-답변 시나리오 설계
챗봇 질문 제시 -> 사용자 답변
서비스 설계
📌 flask서버로 json전달-> 답변 누적
사용자 답변 파라미터 -> 서버 전송
사용 데이터
5가지 라벨링 데이터 사용
전처리
한국어 텍스트 데이터 전처리
📌 중복 제거
📌 특수문자 및 다중공백 제거
📌 불용어 제거 후 토큰화 (Okt 사용)
전처리
📌 정수 인코딩 (Integer Encoding)
한국어 텍스트 데이터 전처리
전처리
📌 패딩 (Padding)
한국어 텍스트 데이터 전처리
max_length = 75
전처리
Data 1 하늘 을 나 는 자동차
Data 2 파란 하늘 을 나 는 자동차
Data 3 파란 하늘 을 나 는 전기 자동차
Data 1 34 2 11 5 100
Data 2 8 34 2 11 5 100
Data 3 8 34 2 11 5 1 100
Data 1 34 2 11 5 100 0 (패딩) 0
Data 2 8 34 2 11 5 100 0
Data 3 8 34 2 11 5 1 100
패딩
정수 인코딩
<토큰화 된 데이터>
Max length = 75
한국어 텍스트 데이터 전처리
전처리
y_label (라벨 데이터) 분류
데이터 분리 (Splitting Data)
📌 라벨값 0.5 이상 : 긍정
📌 라벨값 0.5 미만 : 부정
📌 Train_data : Test_data = 8 : 2
80% 20%
서비스 모델링
모델링 Process
📌 BiLSTM 모델 사용
📌 Activation function : Relu & Softmax
서비스 모델링
모델링 결과
📌 Epoch = 5
📌 Batch size = 64
서비스 모델링
모델링 결과
서비스 모델링
📌 답변을 list 형태로 받고
📌 주관식과 객관식 답변을 구분하여 저장
질문 유형별 답변 구분
서비스 모델링
📌 객관식 답변은 설정해 둔 라벨 값과 매칭
📌 MBTI 관련 질문 : E/N/F일 경우 긍정적으로, I/S/T일 경우 부정적으로 답하도록 설계
📌 투자 성향 관련 질문 : 투자 위험 감수 성향이 클수록 긍정적으로, 낮을 수록 부정적으로 답하도록 설계
(집중 투자, 수익 추구, 단기 투자는 긍정 <-> 분산 투자, 안전 추구, 장기 투자는 부정)
객관식 답변 감정분석
1
0.7
0.5
0.3
0
라벨 예시
서비스 모델링
📌 주관식 답변은 앞서 훈련한 모델을 활용하여 감정분석
주관식 답변 감정분석
서비스 모델링
최종 MBTI 결과 도출
1 차 결 과 도 출
MBTI와 직접 관련된 질문들로 1차 결과 도출
(예) E/I 관련 질문 답변 [0, 1, 1, 1]
-> 평균 : 0.75… -> 0.5보다 크므로 E
최 종 결 과 도 출
투자 성향 관련 질문들로 1차 결과 보정
(예) 수익성/안전성 관련 질문 답변 [0, 0, 0.5]
-> 평균 : 0.1666… -> 0.5보다 작으므로
투자 위험 감수 정도 한 단계 아래로
IST
ENF
ISF
INT
INF
ENT
ESF
EST
📌 MBTI 별 투자 위험 감수 정도
E/I : [0, 1, 1, 1] -> E
S/N : [1, 1, 1, 0] -> N
T/F : [1, 1, 1, 1] -> F
1차 결과 = ENF
수익성vs 안전성 : [0, 0, 0.5]
-> 한 단계 아래로 = ISF
집중투자 vs 분산 투자 : [1, 1]
-> 한 단계 위로 = ENF
단기투자 vs 장기투자 : [1, 0]
-> 변화 없음 = ENF
최종 = ENF
서비스 출력
<성향 분류>
📌 카카오프렌즈 캐릭터를 컨셉으로 총 8개 성향으로 분류
📌 성향별 특징과 투자 조언을 함께 보여줌
I S F 겁쟁이 주린이 라이언
I N T 게으른 분석가 허세킹 프로도
I S T 자신감 뿜뿜 마이웨이 네오
I N F 멘탈 관리 필요한 튜브
E N F 일단 가보자고~! 팔랑귀 무지
E N T 과감한 투자천재 어피치
E S F 팔고나면 오르는 호구 제이지
E S T 생각을 알 수 없는 욕심쟁이 능력자 콘
질문 종료-> 결과 출력
Q&A
BOAZ 분석 17기 Stalker팀
감사합니다!
떡상이

제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Stalker 팀] : 감정분석을 통한 MBTI 기반 개인별 투자 성향 분석

  • 1.
    BOAZ 분석 17기Stalker팀 MBTI 기반 투자성향분석 챗봇 개발 떡상이
  • 2.
  • 3.
    팀 이름 목차 STALKER의 투자성향분석 주제선정 이유 서비스 시연 서비스 구축 과정 - 설계 - 모델링 1 2 3 56 45 33
  • 4.
  • 5.
    주제 선정 이유 2030세대의 투자 관심도 증가
  • 6.
    시중의 투자 성향분석 MBTI 성격유형에 따른 투자성향 연구 MBTI 타입별 투자 성향은 유의한 의미를 가짐 ※ 최종 주제 ※ MBTI별 개인 맞춤형 투자 성향 분석 투자 가이드 라인을 제공하는 챗봇 구현하기 주제 선정 이유
  • 7.
    서비스 개요 카카오톡 플러스친구STALKER MBTI 기반 투자성향 분석 STALKER ‘STOCK’ + ‘TALKER’
  • 8.
    서비스 설계 DATA SET -긍/부정 주관식 답변을 유도할 수 있는 질문 10개 제작 - 구글폼 활용하여 약 3000개의 답변 데이터 확보 - 긍부정의 정도를 기준으로 총 5가지로 라벨링 작업
  • 9.
    서비스 설계 📌 객관식및 주관식 총 20문항 📌 스토리 형식 질문으로 구성 아무도 먼저 나에게 말을 걸어주지 않는다면 어떤 기분이나 생각이 드시나요? 주식 초보인 나에게 주식 포트폴리오 구성 종목, 작성법, 심지어 글씨체까지 알려주는 친절한 옆자리 훈수러 프로도. 당신은 프로도가 마음에 드시나요? 프로도가 나에게 열심히 주식을 알려주다가, 뜬금없이 '지진나면 어떻게 할거야?' 라고 물어봅니다. 이 때 당신의 행동이나 생각을 적어주세요. 당신은 일년동안 스터디에서 열심히 공부해서 세미나 발표를 무사히 끝냈습니다. 절친 춘식이 가 "너 공부 열심히 안하는 것 같았는데 발표 잘했다." 라고 했을때, 당신의 기분은 어떤가요? 챗봇 질문 제시 -> 사용자 답변
  • 10.
    서비스 설계 📌 카카오톡오픈빌더 플랫폼 이용하여 질문-답변 시나리오 설계 챗봇 질문 제시 -> 사용자 답변
  • 11.
    서비스 설계 📌 flask서버로json전달-> 답변 누적 사용자 답변 파라미터 -> 서버 전송
  • 12.
  • 13.
    전처리 한국어 텍스트 데이터전처리 📌 중복 제거 📌 특수문자 및 다중공백 제거 📌 불용어 제거 후 토큰화 (Okt 사용)
  • 14.
    전처리 📌 정수 인코딩(Integer Encoding) 한국어 텍스트 데이터 전처리
  • 15.
    전처리 📌 패딩 (Padding) 한국어텍스트 데이터 전처리 max_length = 75
  • 16.
    전처리 Data 1 하늘을 나 는 자동차 Data 2 파란 하늘 을 나 는 자동차 Data 3 파란 하늘 을 나 는 전기 자동차 Data 1 34 2 11 5 100 Data 2 8 34 2 11 5 100 Data 3 8 34 2 11 5 1 100 Data 1 34 2 11 5 100 0 (패딩) 0 Data 2 8 34 2 11 5 100 0 Data 3 8 34 2 11 5 1 100 패딩 정수 인코딩 <토큰화 된 데이터> Max length = 75 한국어 텍스트 데이터 전처리
  • 17.
    전처리 y_label (라벨 데이터)분류 데이터 분리 (Splitting Data) 📌 라벨값 0.5 이상 : 긍정 📌 라벨값 0.5 미만 : 부정 📌 Train_data : Test_data = 8 : 2 80% 20%
  • 18.
    서비스 모델링 모델링 Process 📌BiLSTM 모델 사용 📌 Activation function : Relu & Softmax
  • 19.
    서비스 모델링 모델링 결과 📌Epoch = 5 📌 Batch size = 64
  • 20.
  • 21.
    서비스 모델링 📌 답변을list 형태로 받고 📌 주관식과 객관식 답변을 구분하여 저장 질문 유형별 답변 구분
  • 22.
    서비스 모델링 📌 객관식답변은 설정해 둔 라벨 값과 매칭 📌 MBTI 관련 질문 : E/N/F일 경우 긍정적으로, I/S/T일 경우 부정적으로 답하도록 설계 📌 투자 성향 관련 질문 : 투자 위험 감수 성향이 클수록 긍정적으로, 낮을 수록 부정적으로 답하도록 설계 (집중 투자, 수익 추구, 단기 투자는 긍정 <-> 분산 투자, 안전 추구, 장기 투자는 부정) 객관식 답변 감정분석 1 0.7 0.5 0.3 0 라벨 예시
  • 23.
    서비스 모델링 📌 주관식답변은 앞서 훈련한 모델을 활용하여 감정분석 주관식 답변 감정분석
  • 24.
    서비스 모델링 최종 MBTI결과 도출 1 차 결 과 도 출 MBTI와 직접 관련된 질문들로 1차 결과 도출 (예) E/I 관련 질문 답변 [0, 1, 1, 1] -> 평균 : 0.75… -> 0.5보다 크므로 E 최 종 결 과 도 출 투자 성향 관련 질문들로 1차 결과 보정 (예) 수익성/안전성 관련 질문 답변 [0, 0, 0.5] -> 평균 : 0.1666… -> 0.5보다 작으므로 투자 위험 감수 정도 한 단계 아래로 IST ENF ISF INT INF ENT ESF EST 📌 MBTI 별 투자 위험 감수 정도 E/I : [0, 1, 1, 1] -> E S/N : [1, 1, 1, 0] -> N T/F : [1, 1, 1, 1] -> F 1차 결과 = ENF 수익성vs 안전성 : [0, 0, 0.5] -> 한 단계 아래로 = ISF 집중투자 vs 분산 투자 : [1, 1] -> 한 단계 위로 = ENF 단기투자 vs 장기투자 : [1, 0] -> 변화 없음 = ENF 최종 = ENF
  • 25.
    서비스 출력 <성향 분류> 📌카카오프렌즈 캐릭터를 컨셉으로 총 8개 성향으로 분류 📌 성향별 특징과 투자 조언을 함께 보여줌 I S F 겁쟁이 주린이 라이언 I N T 게으른 분석가 허세킹 프로도 I S T 자신감 뿜뿜 마이웨이 네오 I N F 멘탈 관리 필요한 튜브 E N F 일단 가보자고~! 팔랑귀 무지 E N T 과감한 투자천재 어피치 E S F 팔고나면 오르는 호구 제이지 E S T 생각을 알 수 없는 욕심쟁이 능력자 콘 질문 종료-> 결과 출력
  • 26.
  • 27.
    BOAZ 분석 17기Stalker팀 감사합니다! 떡상이