SlideShare a Scribd company logo
1 of 26
Data-Driven Attribution
(데이터 기반 기여)
보기에 앞서..
예민한 데이터들과 기밀사항이 존재하므로, 데이터 전처리 과정은 생략합니다!
기존 발표자료를 공개용으로 편집한 자료이기에, 중간중간 어색한 부분이 있을 수 있는 점 양해 부탁
드립니다.
Dataset
• 채널 경로 데이터셋 (데이터 전처리 완료)
데이터 전처리 하느라 수고하셨습니다.
이제 이 데이터셋으로 무엇을 할 수 있나요?
Data-Driven Attribution
• Data-Driven Attribution이란?
기존의 전통적인 Rule-Based 기여모델에서 벗어나 데이터를 이용하여 채널에 보다
정당한 기여를 분배해주는 방법
Data-Driven Attribution
• 기존의 전통적인 Rule-Based 기여모델
1. First Touch Attribution Model 2. Last Touch Attribution Model
3. Linear Touch Attribution Model 4. U-shaped Attribution Model
Data-Driven Attribution
• 기존의 전통적인 Rule-Based 기여모델
1. First Touch Attribution Model 2. Last Touch Attribution Model
3. Linear Touch Attribution Model 4. U-shaped Attribution Model
가장 많이 사용!
Data-Driven Attribution
• 기존의 전통적인 Rule-Based 기여모델
1. 장점
- 간단해요!
- 쉬워요!
- 편해요!
2. 단점
- 각 채널, 광고에 정당한 기여가 분배되지 않아요! -> 뭣이 중한지 모르겠어요!
- 정확한 인사이트를 얻을 수 없어요!
Data-Driven Attribution
• 기존의 전통적인 Rule-Based 기여모델
1. 장점
- 간단해요!
- 쉬워요!
- 편해요!
2. 단점
- 각 채널, 광고에 정당한 기여가 분배되지 않아요! -> 뭣이 중한지 모르겠어요!
- 정확한 인사이트를 얻을 수 없어요!
보다 정당하게 기여를 분배해주는 모델이 있었으면 좋겠어요!
Data-Driven Attribution
그래서 구글로 세상을 둘러보니 학계나 필드에서 인정받는 데이터 기반 기여모델이 두 가지 있었습니다.
1. Shapley Value 기여모델 2. Markov Chain 기여모델
Data-Driven Attribution
그래서 구글로 세상을 둘러보니 학계와 필드에서 인정받는 데이터 기반 기여모델이 두 가지 있었습니다.
1. Shapley Value 기여모델 2. Markov Chain 기여모델
수학 싫어요. 보기 싫어요ㅠ
Data-Driven Attribution
1. Shapley Value란?
나는 한 회사의 CEO이다. 한때 잘나갔던 우리회사는 코로나에 큰 타격을 입어 구조조정이
불가피해졌다.
Q) 사원 A,B,C 중 한 명을 해고해야 하는데 누구를 해고해야 할까?
제가 일은 못해도
가장 성실합니다 ㅠㅠ
사장님 저는 제가 돌봐야 할
처자식이 있습니다…
안녕 사장님! 전 셋 중 제일 일
잘하니까 당연히 아니겠죠~?
Data-Driven Attribution
1. Shapley Value란?
나는 한 회사의 CEO이다. 한때 잘나갔던 우리회사는 코로나에 큰 타격을 입어 구조조정이
불가피해졌다.
Q) 사원 A,B,C 중 한 명을 해고해야 하는데 누구를 해고해야 할까?
제가 일은 못해도
가장 성실합니다 ㅠㅠ
미안해요 A씨.. 회사를 위한
어쩔 수 없는 선택이었어요..
Data-Driven Attribution
1. Shapley Value란?
Q) 사원 A,B,C 중 한 명을 해고해야 하는데 누구를 해고해야 할까?
Data-Driven Attribution
1. Shapley Value란?
Q) 사원 A,B,C 중 한 명을 해고해야 하는데 누구를 해고해야 할까?
협업에 대한 정당한 기여분배 방법론
-> Shapley Value
Data-Driven Attribution
1. Shapley Value란?
Q) 사원 A,B,C 중 한 명을 해고해야 하는데 누구를 해고해야 할까?
Shapley Value 기반 기여 재분배
A : 2.3
B : 1.7
C : 2.0
B씨, 그동안
수고하셨습니다.
Data-Driven Attribution
1. Shapley Value란?
광고 마케팅에 적용해보면 다음과 같다.
Channel (노동자)
A : unattributed (App)
B : unattributed (Web)
C : naver_ep (Web)
D : naverbs_m (Web)
E : facebook (Web)
F : naver_m (Web)
G : gdn_DA (Web)
H : kakao_plus (Web)
…
Conversion (노동력)
111721
31322
12263
9733
7690
…
Data-Driven Attribution
2. Markov Chain이란?
Def) Markov Chain은 마르코프 성질을 지닌 이산 확률 과정을 의미한다.
- 오늘 비가 왔을 때, 내일 화창할 확률은 얼마일까?
- 어제 구름이 꼈을 때, 오늘은 어느정도 확률로 비가올까?
Data-Driven Attribution
2. Markov Chain이란?
Markov Chain을 마케팅에 적용해볼 수 있지 않을까..?
-> 채널간 전환 확률을 구함으로써 모델링 가능!
Data-Driven Attribution
2. Markov Chain이란?
Markov Chain 만들긴 했는데 어느 채널이 얼마나 중요한지는 어떻게 구하나요?
-> Removal Effect
Removal Effect(i) = {1 - P(S without i)/P(S)} * 100 (%)
(where i는 임의의 채널, S는 전체 채널 집합)
Data-Driven Attribution
2. Markov Chain이란?
Removal Effect 예시)
여기서 Facebook이 얼마나 중요해?
(Facebook이 Conversion에 얼마나
기여해?)
Data-Driven Attribution
2. Markov Chain이란?
Removal Effect 예시)
Facebook을 없앴을 때 Conversion
확률이 얼마나 줄어드는지 확인해보자!
Data-Driven Attribution
2. Markov Chain이란?
Removal Effect 예시)
따라서 각 채널에 대해 Removal Effect를
적용한 후 비율을 계산하면 채널의 기여도를
알 수 있습니다!
Data-Driven Attribution
3. 분석결과
구체적인 분석 결과는 공개하지 못하고, 아래 취합된 데이터로 대체합니다.
Data-Driven Attribution
4. 결론
정당한 구매기여를 파악한다는 점 이해했고 수고하셨습니다.
그런데 Shapley Value, Markov Chain 기여모델 중에 무엇이
더 정확합니까? 뭘 써야해요?
Data-Driven Attribution
4. 결론
Shapley Value 기여모델 vs Markov Chain 기여모델
1. Shapley Value 기여모델 2. Markov Chain 기여모델
- Shapley Value로 노벨상 수상!
- Google에서 제공하는 데이터 기반 기여 알고리즘
- 알고리즘의 복잡도가 높기에 많은 개수의 채널에 대
해서는 적용 불가함. (채널 통합 및 최적화 필요)
- 비교적 최근에 각광받고 있는 알고리즘
- 채널 간 순서도 고려함!
Data-Driven Attribution
4. 결론
질문에 대한 제 답은 이러합니다.
1. 둘 중 어느 데이터 기반 기여모델을 쓰던 최소한 기존 Rule-Based 기여모델보다 명확한
채널 기여를 확인할 수 있습니다.
2. Shapley Value, Markov Chain 기여모델간의 직접적인 성능 비교는 불가능합니다.
3. 분석 대상인 데이터셋마다 어느 모델이 더 적합할지는 복합적인 판단이 필요합니다.
4. 만약 특이사항이 없는 평균적인 데이터셋이라면 개인적인 의견으로는 Shapley Value 기여
모델이 조금 더 우세하다고 생각합니다.

More Related Content

What's hot

Introduction to Tree-LSTMs
Introduction to Tree-LSTMsIntroduction to Tree-LSTMs
Introduction to Tree-LSTMsDaniel Perez
 
Normalization 방법
Normalization 방법 Normalization 방법
Normalization 방법 홍배 김
 
내가 이해하는 SVM(왜, 어떻게를 중심으로)
내가 이해하는 SVM(왜, 어떻게를 중심으로)내가 이해하는 SVM(왜, 어떻게를 중심으로)
내가 이해하는 SVM(왜, 어떻게를 중심으로)SANG WON PARK
 
어떻게 하면 데이터 사이언티스트가 될 수 있나요?
어떻게 하면 데이터 사이언티스트가 될 수 있나요?어떻게 하면 데이터 사이언티스트가 될 수 있나요?
어떻게 하면 데이터 사이언티스트가 될 수 있나요?Yongho Ha
 
Transactional SQL in Apache Hive
Transactional SQL in Apache HiveTransactional SQL in Apache Hive
Transactional SQL in Apache HiveDataWorks Summit
 

What's hot (6)

Introduction to Tree-LSTMs
Introduction to Tree-LSTMsIntroduction to Tree-LSTMs
Introduction to Tree-LSTMs
 
Normalization 방법
Normalization 방법 Normalization 방법
Normalization 방법
 
Hadoop 기반 빅데이터 이해
Hadoop 기반 빅데이터 이해Hadoop 기반 빅데이터 이해
Hadoop 기반 빅데이터 이해
 
내가 이해하는 SVM(왜, 어떻게를 중심으로)
내가 이해하는 SVM(왜, 어떻게를 중심으로)내가 이해하는 SVM(왜, 어떻게를 중심으로)
내가 이해하는 SVM(왜, 어떻게를 중심으로)
 
어떻게 하면 데이터 사이언티스트가 될 수 있나요?
어떻게 하면 데이터 사이언티스트가 될 수 있나요?어떻게 하면 데이터 사이언티스트가 될 수 있나요?
어떻게 하면 데이터 사이언티스트가 될 수 있나요?
 
Transactional SQL in Apache Hive
Transactional SQL in Apache HiveTransactional SQL in Apache Hive
Transactional SQL in Apache Hive
 

Data-Driven 기여모델

  • 2. 보기에 앞서.. 예민한 데이터들과 기밀사항이 존재하므로, 데이터 전처리 과정은 생략합니다! 기존 발표자료를 공개용으로 편집한 자료이기에, 중간중간 어색한 부분이 있을 수 있는 점 양해 부탁 드립니다.
  • 3. Dataset • 채널 경로 데이터셋 (데이터 전처리 완료) 데이터 전처리 하느라 수고하셨습니다. 이제 이 데이터셋으로 무엇을 할 수 있나요?
  • 4. Data-Driven Attribution • Data-Driven Attribution이란? 기존의 전통적인 Rule-Based 기여모델에서 벗어나 데이터를 이용하여 채널에 보다 정당한 기여를 분배해주는 방법
  • 5. Data-Driven Attribution • 기존의 전통적인 Rule-Based 기여모델 1. First Touch Attribution Model 2. Last Touch Attribution Model 3. Linear Touch Attribution Model 4. U-shaped Attribution Model
  • 6. Data-Driven Attribution • 기존의 전통적인 Rule-Based 기여모델 1. First Touch Attribution Model 2. Last Touch Attribution Model 3. Linear Touch Attribution Model 4. U-shaped Attribution Model 가장 많이 사용!
  • 7. Data-Driven Attribution • 기존의 전통적인 Rule-Based 기여모델 1. 장점 - 간단해요! - 쉬워요! - 편해요! 2. 단점 - 각 채널, 광고에 정당한 기여가 분배되지 않아요! -> 뭣이 중한지 모르겠어요! - 정확한 인사이트를 얻을 수 없어요!
  • 8. Data-Driven Attribution • 기존의 전통적인 Rule-Based 기여모델 1. 장점 - 간단해요! - 쉬워요! - 편해요! 2. 단점 - 각 채널, 광고에 정당한 기여가 분배되지 않아요! -> 뭣이 중한지 모르겠어요! - 정확한 인사이트를 얻을 수 없어요! 보다 정당하게 기여를 분배해주는 모델이 있었으면 좋겠어요!
  • 9. Data-Driven Attribution 그래서 구글로 세상을 둘러보니 학계나 필드에서 인정받는 데이터 기반 기여모델이 두 가지 있었습니다. 1. Shapley Value 기여모델 2. Markov Chain 기여모델
  • 10. Data-Driven Attribution 그래서 구글로 세상을 둘러보니 학계와 필드에서 인정받는 데이터 기반 기여모델이 두 가지 있었습니다. 1. Shapley Value 기여모델 2. Markov Chain 기여모델 수학 싫어요. 보기 싫어요ㅠ
  • 11. Data-Driven Attribution 1. Shapley Value란? 나는 한 회사의 CEO이다. 한때 잘나갔던 우리회사는 코로나에 큰 타격을 입어 구조조정이 불가피해졌다. Q) 사원 A,B,C 중 한 명을 해고해야 하는데 누구를 해고해야 할까? 제가 일은 못해도 가장 성실합니다 ㅠㅠ 사장님 저는 제가 돌봐야 할 처자식이 있습니다… 안녕 사장님! 전 셋 중 제일 일 잘하니까 당연히 아니겠죠~?
  • 12. Data-Driven Attribution 1. Shapley Value란? 나는 한 회사의 CEO이다. 한때 잘나갔던 우리회사는 코로나에 큰 타격을 입어 구조조정이 불가피해졌다. Q) 사원 A,B,C 중 한 명을 해고해야 하는데 누구를 해고해야 할까? 제가 일은 못해도 가장 성실합니다 ㅠㅠ 미안해요 A씨.. 회사를 위한 어쩔 수 없는 선택이었어요..
  • 13. Data-Driven Attribution 1. Shapley Value란? Q) 사원 A,B,C 중 한 명을 해고해야 하는데 누구를 해고해야 할까?
  • 14. Data-Driven Attribution 1. Shapley Value란? Q) 사원 A,B,C 중 한 명을 해고해야 하는데 누구를 해고해야 할까? 협업에 대한 정당한 기여분배 방법론 -> Shapley Value
  • 15. Data-Driven Attribution 1. Shapley Value란? Q) 사원 A,B,C 중 한 명을 해고해야 하는데 누구를 해고해야 할까? Shapley Value 기반 기여 재분배 A : 2.3 B : 1.7 C : 2.0 B씨, 그동안 수고하셨습니다.
  • 16. Data-Driven Attribution 1. Shapley Value란? 광고 마케팅에 적용해보면 다음과 같다. Channel (노동자) A : unattributed (App) B : unattributed (Web) C : naver_ep (Web) D : naverbs_m (Web) E : facebook (Web) F : naver_m (Web) G : gdn_DA (Web) H : kakao_plus (Web) … Conversion (노동력) 111721 31322 12263 9733 7690 …
  • 17. Data-Driven Attribution 2. Markov Chain이란? Def) Markov Chain은 마르코프 성질을 지닌 이산 확률 과정을 의미한다. - 오늘 비가 왔을 때, 내일 화창할 확률은 얼마일까? - 어제 구름이 꼈을 때, 오늘은 어느정도 확률로 비가올까?
  • 18. Data-Driven Attribution 2. Markov Chain이란? Markov Chain을 마케팅에 적용해볼 수 있지 않을까..? -> 채널간 전환 확률을 구함으로써 모델링 가능!
  • 19. Data-Driven Attribution 2. Markov Chain이란? Markov Chain 만들긴 했는데 어느 채널이 얼마나 중요한지는 어떻게 구하나요? -> Removal Effect Removal Effect(i) = {1 - P(S without i)/P(S)} * 100 (%) (where i는 임의의 채널, S는 전체 채널 집합)
  • 20. Data-Driven Attribution 2. Markov Chain이란? Removal Effect 예시) 여기서 Facebook이 얼마나 중요해? (Facebook이 Conversion에 얼마나 기여해?)
  • 21. Data-Driven Attribution 2. Markov Chain이란? Removal Effect 예시) Facebook을 없앴을 때 Conversion 확률이 얼마나 줄어드는지 확인해보자!
  • 22. Data-Driven Attribution 2. Markov Chain이란? Removal Effect 예시) 따라서 각 채널에 대해 Removal Effect를 적용한 후 비율을 계산하면 채널의 기여도를 알 수 있습니다!
  • 23. Data-Driven Attribution 3. 분석결과 구체적인 분석 결과는 공개하지 못하고, 아래 취합된 데이터로 대체합니다.
  • 24. Data-Driven Attribution 4. 결론 정당한 구매기여를 파악한다는 점 이해했고 수고하셨습니다. 그런데 Shapley Value, Markov Chain 기여모델 중에 무엇이 더 정확합니까? 뭘 써야해요?
  • 25. Data-Driven Attribution 4. 결론 Shapley Value 기여모델 vs Markov Chain 기여모델 1. Shapley Value 기여모델 2. Markov Chain 기여모델 - Shapley Value로 노벨상 수상! - Google에서 제공하는 데이터 기반 기여 알고리즘 - 알고리즘의 복잡도가 높기에 많은 개수의 채널에 대 해서는 적용 불가함. (채널 통합 및 최적화 필요) - 비교적 최근에 각광받고 있는 알고리즘 - 채널 간 순서도 고려함!
  • 26. Data-Driven Attribution 4. 결론 질문에 대한 제 답은 이러합니다. 1. 둘 중 어느 데이터 기반 기여모델을 쓰던 최소한 기존 Rule-Based 기여모델보다 명확한 채널 기여를 확인할 수 있습니다. 2. Shapley Value, Markov Chain 기여모델간의 직접적인 성능 비교는 불가능합니다. 3. 분석 대상인 데이터셋마다 어느 모델이 더 적합할지는 복합적인 판단이 필요합니다. 4. 만약 특이사항이 없는 평균적인 데이터셋이라면 개인적인 의견으로는 Shapley Value 기여 모델이 조금 더 우세하다고 생각합니다.