Presenter : JunPyo Park
UNIST FE Lab
# Stock price manipulation
# Unsupervised
# Peer group analysis
Process
1. 타겟 종목 선정
2. 트레이닝 셋에서 피어 그룹 형성
3. 피어 그룹의 대푯값 계산
4. 테스트 셋을 돌면서 대푯값 업데이트
5. 타겟 종목이 대푯값을 많이 벗어나면 이상하다 탐지
Process – Setting Target Stock
분석기간 : 16년 5월 ~ 19년 9월 까지 (40개월)
트레이닝 : 16년 5월 ~ 17년 10월 까지 (18개월)
테스트 : 17년 11월 ~ 19년 9월 까지 (22개월)
어떤 타겟을 고르지?
Process – Setting Target Stock
Process
1. 타겟 종목 선정
2. 트레이닝 셋에서 피어 그룹 형성
3. 피어 그룹의 대푯값 계산
4. 테스트 셋을 돌면서 대푯값 업데이트
5. 타겟 종목이 대푯값을 많이 벗어나면 이상하다 탐지
Process – Construct Peer Group
Process – Smoothing and Normalizing
D/N = 5 사용
-> 5 거래일씩 잘라서 평균 계산하여 저장
Process – Smoothing and Normalizing
Process – Smoothing and Normalizing
Process – Smoothing and Normalizing
p.5 Then we normalized the data at each time point so that the data is on a commensurate
scale.
Process – Construct Peer Group
Smoothing 과 Normalizing을 거친 target(네이처셀) value
Process – Construct Peer Group (k=10)
Process – Construct Peer Group (k=50)
Process
1. 타겟 종목 선정
2. 트레이닝 셋에서 피어 그룹 형성
3. 피어 그룹의 대푯값 계산
4. 테스트 셋을 돌면서 대푯값 업데이트
5. 타겟 종목이 대푯값을 많이 벗어나면 이상하다 탐지
Process – Peer group summary
Simple Mean
Weighted Mean
Process – Peer group summary
Weighted Mean
Prox ~ similarity -> distance가 0이면 1로 최대이고
멀어질수록 작아짐
결과적으로 training set에서 distance가 가까운 peer에
더 큰 weight 부여
Process – Peer group summary
Process
1. 타겟 종목 선정
2. 트레이닝 셋에서 피어 그룹 형성
3. 피어 그룹의 대푯값 계산
4. 테스트 셋을 돌면서 대푯값 업데이트
5. 타겟 종목이 대푯값을 많이 벗어나면 이상하다 탐지
Process – Smooth and Normalize Test set
Process – Smooth and Normalize Test set
Process – Smooth and Normalize Test set
Training set 의 mean 과 std를 사용하여 normalize
Process – Weight Update
Prox ~ similarity -> distance가 0이면 1로 최대이고 멀어질수록 작아짐
테스트 셋에서 새로 업데이트 되는 종가의 distance가 가까운 peer에 더 큰 weight 증가분 부여
Peer의 최근 움직임이 target과 유사할 수록 weight가 증가함
Process – Weight Update
Process – Weight Update
Process – Weight Update (k=10)
Process – Weight Update (k=50)
Process – Peer Group Summary (k=10)
Process – Peer Group Summary (k=50)
Process
1. 타겟 종목 선정
2. 트레이닝 셋에서 피어 그룹 형성
3. 피어 그룹의 대푯값 계산
4. 테스트 셋을 돌면서 대푯값 업데이트
5. 타겟 종목이 대푯값을 많이 벗어나면 이상하다 탐지
Process – Detect Anomaly
Results – Other target
Results – Other target
Results – Other target
Results – Other target
Results – Other target (정상적인 종목들)
구현하지 못한 것 – Evaluation
Conclusion

Stock fraud detection using peer group analysis