SlideShare a Scribd company logo
1 of 23
Download to read offline
이윤희
다짜고짜 배워보는
인과추론
Product
Analytics
Playground
안녕하세요 ☺
한국신용데이터에서
CEO Staff로 일하는 이윤희 입니다.
안녕하세요 ☺
한국신용데이터에서
CEO Staff로 일하는 이윤희 입니다.
= 조직의 목표 달성과 CEO 의사결정을
지원하기 위해 필요한 모든 일을 하는 사람
(프로젝트 관리, 지표 관리, 신규 사업 Growth)
제러널리스트로서…
- 새로운 일, 처음 보는 개념에 열린 마음
- 빠르게 배우기
- 쉽게 설명하기
(저도 방금까지 몰랐던 내용이니까요!)
인과추론 떡밥 뿌리기
앞으로 10분 동안…
인과추론, 빙산의 일각만 배워보아요!
- 인과추론이란 무엇일까요?
- 인과추론을 위한 통계 지식
- 현실에서 이렇게 쓰입니다!
인과추론(Causal Inference)이란
무엇일까요?
상관관계 vs. 인과관계
맥도날드 점포가 많아진다 물가가 상승한다x
맥도날드 점포가 많아졌기 때문에, 물가가 상승했다 !?
상관관계
인과관계
상관관계는 인과관계가 아니다!
- 다른 요인이 맥도날드 점포 수와 물가
지수에 동시에 영향을 미쳤을 가능성
- 예시) 수요 증가 / 공급 감소, 생산비
원자재 가격 상승, 유통 구조 등
다른 요인이 영향을 미쳤을 수도.. 인과관계가 반대일 수도..
- 물가가 상승했기 때문에, 맥도날드 점포
수가 늘어났을 가능성
예측 vs. 추론 (feat. 충성고객)
예측
추론
어떤 사람이 충성 고객이 될까? 그 사람을 타깃해보자!
➡ 결과 맞추기, 오차를 최소화 하는 게 중요해요!
사용자에게 무엇을 해주면 충성고객이 될까? 포인트를 쌓는
게 좋을지, 배송비 무료 쿠폰을 주는 게 좋을지 고민 돼 😵
➡ 원인과 결과 사이의 관계 알아내기
인과추론이 쓸모 있는 이유
인과추론은 Actionable 하다!
인과추론을 위한
(어렵지 않은) 통계 지식
인과관계 입증에 있어 중요한 관점
개입을 받은 집단
예시) 타이레놀을 복용한 사람들이 모인 그룹
개입을 받지 않은 집단 (= 대조군, 통제군)
예시) 타이레놀을 복용하지 않은 사람들이 모인 그룹
개입 효과
Treatment Effect
현실에서 인과관계를 입증하기 어려운 이유
세상에는 통제할 수 없는 것이 너무 많아 😭
- Treatment를 명확히 정의 할 수 없다.
오프라인 매장의 매출을 증감 요인 9,999+가지
- Control Group의 결과를 알 수 없다.
메뉴 가격 상승과 매출 간의 인과관계를 본다면?
- Group에 무작위로 배정되지 않는다.
멤버십 가입에 따른 객단가를 분석한다면?
(선택에 의해서 배정 ➡ Self-Selection Bias)
한 눈에 보는 인과추론 방법론
��
Source) Jiyong Park. “Korea Summer Session on Causal Inference 2021”. https://youtu.be/kr-7PXLefyc
한 눈에 보는 인과추론 방법론
종합 선물셋트 🎁
무작위 비교 실험 A/B Test
통제 환경을 가정
통제 환경을 가정하기 어려울 때
회귀분석 - 개정판
회귀분석 y = f(x) + e
도구변수
준 실험
Source) Jiyong Park. “Korea Summer Session on Causal Inference 2021”. https://youtu.be/kr-7PXLefyc
데이터에 경계선이 있다면, RD 디자인 Regression Discontinuity
Source) Prof. Eric Dunford. “Accelerated Statistics for Public Policy” .McCourt School of Public Policy.
http://ericdunford.com/ppol561/Lectures/week_08/week08-regression-discontinuity-ppol561.html#1
Control
Group
Treatment
Group
RD 디자인 적용 사례
Source 1) Srikanth Kadiyala and Erin Strumpf. 2014. “How Effective is Population-Based Cancer Screening”. Forum for Health Economics and Policy
Source 2) Hoekstra, Mark. 2009. “The Effect of Attending the Flagship State University on Earnings: A Discontinuity-Based Approach”. Review of
Economics and Statistics 91 (4): 717–24.
현실에서 이렇게 쓰입니다!
왜 A/B 테스트가 아닌 준 실험을 활용할까?
Source 1) Colin McFarland, Michael Pow, Julia Glick. 2018. “Quasi Experimentation at Netflix”.
https://netflixtechblog.com/quasi-experimentation-at-netflix-566b57d2e362
- 기술적으로 개별 사용자를 대상으로 무작위 배정을 시행할 수 없는 경우
- 기술적으로는 가능하지만, 다른 변수가 개입할 여지가 있는 경우
(대중매체 노출, 개인화된 추천 시스템, 사용자 사이의 소문 등)
(사례) 옥외광고를 통한 가입 효과 분석
Source 1) Colin McFarland, Michael Pow, Julia Glick. 2018. “Quasi Experimentation at Netflix”.
https://netflixtechblog.com/quasi-experimentation-at-netflix-566b57d2e362
인과추론,
더 알고 싶다면?
🙌 또 만나요!
이윤희
leeyunhee12@gamil.com | 이메일
https://medium.com/@connect2yh | 블로그
https://www.linkedin.com/in/connect2yh | 링크드인

More Related Content

What's hot

프로덕트를 빠르게 개선하기 위한 베이지안 A/B 테스트
프로덕트를 빠르게 개선하기 위한 베이지안 A/B 테스트프로덕트를 빠르게 개선하기 위한 베이지안 A/B 테스트
프로덕트를 빠르게 개선하기 위한 베이지안 A/B 테스트Minho Lee
 
실무에서 활용하는 A/B테스트
실무에서 활용하는 A/B테스트실무에서 활용하는 A/B테스트
실무에서 활용하는 A/B테스트JeongMin Kwon
 
데이터 기반 성장을 위한 선결 조건: Product-Market Fit, Instrumentation, 그리고 프로세스
데이터 기반 성장을 위한 선결 조건: Product-Market Fit, Instrumentation, 그리고 프로세스데이터 기반 성장을 위한 선결 조건: Product-Market Fit, Instrumentation, 그리고 프로세스
데이터 기반 성장을 위한 선결 조건: Product-Market Fit, Instrumentation, 그리고 프로세스Minwoo Kim
 
데이터 분석에 필요한 기본 개념: 지표, Funnel 등 데이터를 이해하기 위한 멘탈 모델(Mental Model)
데이터 분석에 필요한 기본 개념: 지표, Funnel 등 데이터를 이해하기 위한 멘탈 모델(Mental Model)데이터 분석에 필요한 기본 개념: 지표, Funnel 등 데이터를 이해하기 위한 멘탈 모델(Mental Model)
데이터 분석에 필요한 기본 개념: 지표, Funnel 등 데이터를 이해하기 위한 멘탈 모델(Mental Model)Minwoo Kim
 
신뢰할 수 있는 A/B 테스트를 위해 알아야 할 것들
신뢰할 수 있는 A/B 테스트를 위해 알아야 할 것들신뢰할 수 있는 A/B 테스트를 위해 알아야 할 것들
신뢰할 수 있는 A/B 테스트를 위해 알아야 할 것들Minho Lee
 
실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다
실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다
실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다승화 양
 
린분석 with 레진코믹스 ( Lean Analytics with Lezhin Comics )
린분석 with 레진코믹스 ( Lean Analytics with Lezhin Comics )린분석 with 레진코믹스 ( Lean Analytics with Lezhin Comics )
린분석 with 레진코믹스 ( Lean Analytics with Lezhin Comics )정혁 권
 
Random Forest Intro [랜덤포레스트 설명]
Random Forest Intro [랜덤포레스트 설명]Random Forest Intro [랜덤포레스트 설명]
Random Forest Intro [랜덤포레스트 설명]Hyunwoo Kim
 
Data Engineering 101
Data Engineering 101Data Engineering 101
Data Engineering 101DaeMyung Kang
 
그래프에서 대시보드까지, 서비스를 위한 데이터 시각화
그래프에서 대시보드까지, 서비스를 위한 데이터 시각화그래프에서 대시보드까지, 서비스를 위한 데이터 시각화
그래프에서 대시보드까지, 서비스를 위한 데이터 시각화Minho Lee
 
나 혼자 한다: 개발자가 창업을 하면 벌어지는 일
나 혼자 한다: 개발자가 창업을 하면 벌어지는 일나 혼자 한다: 개발자가 창업을 하면 벌어지는 일
나 혼자 한다: 개발자가 창업을 하면 벌어지는 일Hyeonjong Gim
 
[데이터야놀자 2023] 비즈니스 분석가 vs 프로덕트 분석가_ 데이터 분석ᄀ...
[데이터야놀자 2023]  비즈니스 분석가 vs 프로덕트 분석가_ 데이터 분석ᄀ...[데이터야놀자 2023]  비즈니스 분석가 vs 프로덕트 분석가_ 데이터 분석ᄀ...
[데이터야놀자 2023] 비즈니스 분석가 vs 프로덕트 분석가_ 데이터 분석ᄀ...Jeongmin Ju
 
아이싱 디지털 마케팅 기획안
아이싱 디지털 마케팅 기획안아이싱 디지털 마케팅 기획안
아이싱 디지털 마케팅 기획안April7
 
[팝콘 시즌1] 박동혁 : 마케터에게 필요한 Data Literacy
[팝콘 시즌1] 박동혁 : 마케터에게 필요한 Data Literacy[팝콘 시즌1] 박동혁 : 마케터에게 필요한 Data Literacy
[팝콘 시즌1] 박동혁 : 마케터에게 필요한 Data LiteracyPAP (Product Analytics Playground)
 
스타트업은 데이터를 어떻게 바라봐야 할까? (개정판)
스타트업은 데이터를 어떻게 바라봐야 할까? (개정판)스타트업은 데이터를 어떻게 바라봐야 할까? (개정판)
스타트업은 데이터를 어떻게 바라봐야 할까? (개정판)Yongho Ha
 
그로스 해킹 & 데이터 프로덕트 (Growth Hacking & Data Product) - 고넥터 고영혁 (Gonnector Dylan Ko)
그로스 해킹 & 데이터 프로덕트 (Growth Hacking & Data Product) - 고넥터 고영혁 (Gonnector Dylan Ko)그로스 해킹 & 데이터 프로덕트 (Growth Hacking & Data Product) - 고넥터 고영혁 (Gonnector Dylan Ko)
그로스 해킹 & 데이터 프로덕트 (Growth Hacking & Data Product) - 고넥터 고영혁 (Gonnector Dylan Ko)Dylan Ko
 
데이터가 흐르는 조직 만들기 - 마이리얼트립
데이터가 흐르는 조직 만들기 - 마이리얼트립데이터가 흐르는 조직 만들기 - 마이리얼트립
데이터가 흐르는 조직 만들기 - 마이리얼트립승화 양
 
어떻게 하면 데이터 사이언티스트가 될 수 있나요?
어떻게 하면 데이터 사이언티스트가 될 수 있나요?어떻게 하면 데이터 사이언티스트가 될 수 있나요?
어떻게 하면 데이터 사이언티스트가 될 수 있나요?Yongho Ha
 
활성 사용자(Active user) 개념잡기
활성 사용자(Active user) 개념잡기활성 사용자(Active user) 개념잡기
활성 사용자(Active user) 개념잡기와이즈트래커
 
[우리가 데이터를 쓰는 법] 좋다는 건 알겠는데 좀 써보고 싶소. 데이터! - 넘버웍스 하용호 대표
[우리가 데이터를 쓰는 법] 좋다는 건 알겠는데 좀 써보고 싶소. 데이터! - 넘버웍스 하용호 대표[우리가 데이터를 쓰는 법] 좋다는 건 알겠는데 좀 써보고 싶소. 데이터! - 넘버웍스 하용호 대표
[우리가 데이터를 쓰는 법] 좋다는 건 알겠는데 좀 써보고 싶소. 데이터! - 넘버웍스 하용호 대표Dylan Ko
 

What's hot (20)

프로덕트를 빠르게 개선하기 위한 베이지안 A/B 테스트
프로덕트를 빠르게 개선하기 위한 베이지안 A/B 테스트프로덕트를 빠르게 개선하기 위한 베이지안 A/B 테스트
프로덕트를 빠르게 개선하기 위한 베이지안 A/B 테스트
 
실무에서 활용하는 A/B테스트
실무에서 활용하는 A/B테스트실무에서 활용하는 A/B테스트
실무에서 활용하는 A/B테스트
 
데이터 기반 성장을 위한 선결 조건: Product-Market Fit, Instrumentation, 그리고 프로세스
데이터 기반 성장을 위한 선결 조건: Product-Market Fit, Instrumentation, 그리고 프로세스데이터 기반 성장을 위한 선결 조건: Product-Market Fit, Instrumentation, 그리고 프로세스
데이터 기반 성장을 위한 선결 조건: Product-Market Fit, Instrumentation, 그리고 프로세스
 
데이터 분석에 필요한 기본 개념: 지표, Funnel 등 데이터를 이해하기 위한 멘탈 모델(Mental Model)
데이터 분석에 필요한 기본 개념: 지표, Funnel 등 데이터를 이해하기 위한 멘탈 모델(Mental Model)데이터 분석에 필요한 기본 개념: 지표, Funnel 등 데이터를 이해하기 위한 멘탈 모델(Mental Model)
데이터 분석에 필요한 기본 개념: 지표, Funnel 등 데이터를 이해하기 위한 멘탈 모델(Mental Model)
 
신뢰할 수 있는 A/B 테스트를 위해 알아야 할 것들
신뢰할 수 있는 A/B 테스트를 위해 알아야 할 것들신뢰할 수 있는 A/B 테스트를 위해 알아야 할 것들
신뢰할 수 있는 A/B 테스트를 위해 알아야 할 것들
 
실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다
실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다
실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다
 
린분석 with 레진코믹스 ( Lean Analytics with Lezhin Comics )
린분석 with 레진코믹스 ( Lean Analytics with Lezhin Comics )린분석 with 레진코믹스 ( Lean Analytics with Lezhin Comics )
린분석 with 레진코믹스 ( Lean Analytics with Lezhin Comics )
 
Random Forest Intro [랜덤포레스트 설명]
Random Forest Intro [랜덤포레스트 설명]Random Forest Intro [랜덤포레스트 설명]
Random Forest Intro [랜덤포레스트 설명]
 
Data Engineering 101
Data Engineering 101Data Engineering 101
Data Engineering 101
 
그래프에서 대시보드까지, 서비스를 위한 데이터 시각화
그래프에서 대시보드까지, 서비스를 위한 데이터 시각화그래프에서 대시보드까지, 서비스를 위한 데이터 시각화
그래프에서 대시보드까지, 서비스를 위한 데이터 시각화
 
나 혼자 한다: 개발자가 창업을 하면 벌어지는 일
나 혼자 한다: 개발자가 창업을 하면 벌어지는 일나 혼자 한다: 개발자가 창업을 하면 벌어지는 일
나 혼자 한다: 개발자가 창업을 하면 벌어지는 일
 
[데이터야놀자 2023] 비즈니스 분석가 vs 프로덕트 분석가_ 데이터 분석ᄀ...
[데이터야놀자 2023]  비즈니스 분석가 vs 프로덕트 분석가_ 데이터 분석ᄀ...[데이터야놀자 2023]  비즈니스 분석가 vs 프로덕트 분석가_ 데이터 분석ᄀ...
[데이터야놀자 2023] 비즈니스 분석가 vs 프로덕트 분석가_ 데이터 분석ᄀ...
 
아이싱 디지털 마케팅 기획안
아이싱 디지털 마케팅 기획안아이싱 디지털 마케팅 기획안
아이싱 디지털 마케팅 기획안
 
[팝콘 시즌1] 박동혁 : 마케터에게 필요한 Data Literacy
[팝콘 시즌1] 박동혁 : 마케터에게 필요한 Data Literacy[팝콘 시즌1] 박동혁 : 마케터에게 필요한 Data Literacy
[팝콘 시즌1] 박동혁 : 마케터에게 필요한 Data Literacy
 
스타트업은 데이터를 어떻게 바라봐야 할까? (개정판)
스타트업은 데이터를 어떻게 바라봐야 할까? (개정판)스타트업은 데이터를 어떻게 바라봐야 할까? (개정판)
스타트업은 데이터를 어떻게 바라봐야 할까? (개정판)
 
그로스 해킹 & 데이터 프로덕트 (Growth Hacking & Data Product) - 고넥터 고영혁 (Gonnector Dylan Ko)
그로스 해킹 & 데이터 프로덕트 (Growth Hacking & Data Product) - 고넥터 고영혁 (Gonnector Dylan Ko)그로스 해킹 & 데이터 프로덕트 (Growth Hacking & Data Product) - 고넥터 고영혁 (Gonnector Dylan Ko)
그로스 해킹 & 데이터 프로덕트 (Growth Hacking & Data Product) - 고넥터 고영혁 (Gonnector Dylan Ko)
 
데이터가 흐르는 조직 만들기 - 마이리얼트립
데이터가 흐르는 조직 만들기 - 마이리얼트립데이터가 흐르는 조직 만들기 - 마이리얼트립
데이터가 흐르는 조직 만들기 - 마이리얼트립
 
어떻게 하면 데이터 사이언티스트가 될 수 있나요?
어떻게 하면 데이터 사이언티스트가 될 수 있나요?어떻게 하면 데이터 사이언티스트가 될 수 있나요?
어떻게 하면 데이터 사이언티스트가 될 수 있나요?
 
활성 사용자(Active user) 개념잡기
활성 사용자(Active user) 개념잡기활성 사용자(Active user) 개념잡기
활성 사용자(Active user) 개념잡기
 
[우리가 데이터를 쓰는 법] 좋다는 건 알겠는데 좀 써보고 싶소. 데이터! - 넘버웍스 하용호 대표
[우리가 데이터를 쓰는 법] 좋다는 건 알겠는데 좀 써보고 싶소. 데이터! - 넘버웍스 하용호 대표[우리가 데이터를 쓰는 법] 좋다는 건 알겠는데 좀 써보고 싶소. 데이터! - 넘버웍스 하용호 대표
[우리가 데이터를 쓰는 법] 좋다는 건 알겠는데 좀 써보고 싶소. 데이터! - 넘버웍스 하용호 대표
 

Similar to [팝콘 시즌1] 이윤희 : 다짜고짜 배워보는 인과추론

데이터 사이언티스트를 꿈꾸는 분들을 위한 개인적인 데이터 사이언스 경험과 소회 - what I experienced as a data sc...
데이터 사이언티스트를 꿈꾸는 분들을 위한 개인적인 데이터 사이언스 경험과 소회 - what I experienced as a data sc...데이터 사이언티스트를 꿈꾸는 분들을 위한 개인적인 데이터 사이언스 경험과 소회 - what I experienced as a data sc...
데이터 사이언티스트를 꿈꾸는 분들을 위한 개인적인 데이터 사이언스 경험과 소회 - what I experienced as a data sc...Jungmin Lee
 
[TOC for Education] Approaches to Problem Solving
[TOC for Education]  Approaches to Problem Solving [TOC for Education]  Approaches to Problem Solving
[TOC for Education] Approaches to Problem Solving Namkee Chung
 
그로스해킹 세미나 #1
그로스해킹 세미나 #1그로스해킹 세미나 #1
그로스해킹 세미나 #1Haezoom Inc.
 
캡스톤설계1(설문분석)2013-1
캡스톤설계1(설문분석)2013-1캡스톤설계1(설문분석)2013-1
캡스톤설계1(설문분석)2013-1Yong Heui Cho
 
Matrix에 오신 것을_환영합니다!
Matrix에 오신 것을_환영합니다!Matrix에 오신 것을_환영합니다!
Matrix에 오신 것을_환영합니다!Lee_Cheol_Hyun
 
안.전.제.일. 강화학습!
안.전.제.일. 강화학습!안.전.제.일. 강화학습!
안.전.제.일. 강화학습!Dongmin Lee
 
데이터를 비즈니스에 활용하기 왜 어려울까?
데이터를 비즈니스에 활용하기 왜 어려울까?데이터를 비즈니스에 활용하기 왜 어려울까?
데이터를 비즈니스에 활용하기 왜 어려울까?Glen Park
 
MongoDB in Banksalad [Rainist]
MongoDB in Banksalad [Rainist]MongoDB in Banksalad [Rainist]
MongoDB in Banksalad [Rainist]MongoDB
 
분석 현장에서 요구되는 데이터과학자의 역량과 자질
분석 현장에서 요구되는 데이터과학자의 역량과 자질분석 현장에서 요구되는 데이터과학자의 역량과 자질
분석 현장에서 요구되는 데이터과학자의 역량과 자질Sun Young Kim
 
Learning dataanalyst 2020oct_yonsei
Learning dataanalyst 2020oct_yonseiLearning dataanalyst 2020oct_yonsei
Learning dataanalyst 2020oct_yonseiIsabel Myeongju Han
 
Digital transformation era, role and competencies of hr
Digital transformation era, role and competencies of hrDigital transformation era, role and competencies of hr
Digital transformation era, role and competencies of hrYoungchan Jo
 
People Analytics.170420
People Analytics.170420People Analytics.170420
People Analytics.170420sidney yang
 
관리하지 말고 경영하라! 데이터접목활용을 통한 Hr 성과사례 - 원...
관리하지 말고 경영하라!   데이터접목활용을 통한 Hr 성과사례 - 원...관리하지 말고 경영하라!   데이터접목활용을 통한 Hr 성과사례 - 원...
관리하지 말고 경영하라! 데이터접목활용을 통한 Hr 성과사례 - 원...Jinho Jung
 
조선비즈 경제아카데미
조선비즈 경제아카데미조선비즈 경제아카데미
조선비즈 경제아카데미Gyuseung Kim
 
Ux멘토스쿨3기 3조 보담 최종본
Ux멘토스쿨3기 3조 보담 최종본Ux멘토스쿨3기 3조 보담 최종본
Ux멘토스쿨3기 3조 보담 최종본금 태종
 
장기기증 중간발표
장기기증 중간발표장기기증 중간발표
장기기증 중간발표sangmin song
 
장기기증조 중간발표
장기기증조 중간발표장기기증조 중간발표
장기기증조 중간발표sangmin song
 
韩国Ppt高手收集的ppt图表素材[免积分下载]
韩国Ppt高手收集的ppt图表素材[免积分下载]韩国Ppt高手收集的ppt图表素材[免积分下载]
韩国Ppt高手收集的ppt图表素材[免积分下载]fgf201213
 
2018 06-11-active-question-answering
2018 06-11-active-question-answering2018 06-11-active-question-answering
2018 06-11-active-question-answeringWoong won Lee
 
정보탐색과 특강 Ver1.5
정보탐색과 특강 Ver1.5정보탐색과 특강 Ver1.5
정보탐색과 특강 Ver1.5진호 안
 

Similar to [팝콘 시즌1] 이윤희 : 다짜고짜 배워보는 인과추론 (20)

데이터 사이언티스트를 꿈꾸는 분들을 위한 개인적인 데이터 사이언스 경험과 소회 - what I experienced as a data sc...
데이터 사이언티스트를 꿈꾸는 분들을 위한 개인적인 데이터 사이언스 경험과 소회 - what I experienced as a data sc...데이터 사이언티스트를 꿈꾸는 분들을 위한 개인적인 데이터 사이언스 경험과 소회 - what I experienced as a data sc...
데이터 사이언티스트를 꿈꾸는 분들을 위한 개인적인 데이터 사이언스 경험과 소회 - what I experienced as a data sc...
 
[TOC for Education] Approaches to Problem Solving
[TOC for Education]  Approaches to Problem Solving [TOC for Education]  Approaches to Problem Solving
[TOC for Education] Approaches to Problem Solving
 
그로스해킹 세미나 #1
그로스해킹 세미나 #1그로스해킹 세미나 #1
그로스해킹 세미나 #1
 
캡스톤설계1(설문분석)2013-1
캡스톤설계1(설문분석)2013-1캡스톤설계1(설문분석)2013-1
캡스톤설계1(설문분석)2013-1
 
Matrix에 오신 것을_환영합니다!
Matrix에 오신 것을_환영합니다!Matrix에 오신 것을_환영합니다!
Matrix에 오신 것을_환영합니다!
 
안.전.제.일. 강화학습!
안.전.제.일. 강화학습!안.전.제.일. 강화학습!
안.전.제.일. 강화학습!
 
데이터를 비즈니스에 활용하기 왜 어려울까?
데이터를 비즈니스에 활용하기 왜 어려울까?데이터를 비즈니스에 활용하기 왜 어려울까?
데이터를 비즈니스에 활용하기 왜 어려울까?
 
MongoDB in Banksalad [Rainist]
MongoDB in Banksalad [Rainist]MongoDB in Banksalad [Rainist]
MongoDB in Banksalad [Rainist]
 
분석 현장에서 요구되는 데이터과학자의 역량과 자질
분석 현장에서 요구되는 데이터과학자의 역량과 자질분석 현장에서 요구되는 데이터과학자의 역량과 자질
분석 현장에서 요구되는 데이터과학자의 역량과 자질
 
Learning dataanalyst 2020oct_yonsei
Learning dataanalyst 2020oct_yonseiLearning dataanalyst 2020oct_yonsei
Learning dataanalyst 2020oct_yonsei
 
Digital transformation era, role and competencies of hr
Digital transformation era, role and competencies of hrDigital transformation era, role and competencies of hr
Digital transformation era, role and competencies of hr
 
People Analytics.170420
People Analytics.170420People Analytics.170420
People Analytics.170420
 
관리하지 말고 경영하라! 데이터접목활용을 통한 Hr 성과사례 - 원...
관리하지 말고 경영하라!   데이터접목활용을 통한 Hr 성과사례 - 원...관리하지 말고 경영하라!   데이터접목활용을 통한 Hr 성과사례 - 원...
관리하지 말고 경영하라! 데이터접목활용을 통한 Hr 성과사례 - 원...
 
조선비즈 경제아카데미
조선비즈 경제아카데미조선비즈 경제아카데미
조선비즈 경제아카데미
 
Ux멘토스쿨3기 3조 보담 최종본
Ux멘토스쿨3기 3조 보담 최종본Ux멘토스쿨3기 3조 보담 최종본
Ux멘토스쿨3기 3조 보담 최종본
 
장기기증 중간발표
장기기증 중간발표장기기증 중간발표
장기기증 중간발표
 
장기기증조 중간발표
장기기증조 중간발표장기기증조 중간발표
장기기증조 중간발표
 
韩国Ppt高手收集的ppt图表素材[免积分下载]
韩国Ppt高手收集的ppt图表素材[免积分下载]韩国Ppt高手收集的ppt图表素材[免积分下载]
韩国Ppt高手收集的ppt图表素材[免积分下载]
 
2018 06-11-active-question-answering
2018 06-11-active-question-answering2018 06-11-active-question-answering
2018 06-11-active-question-answering
 
정보탐색과 특강 Ver1.5
정보탐색과 특강 Ver1.5정보탐색과 특강 Ver1.5
정보탐색과 특강 Ver1.5
 

[팝콘 시즌1] 이윤희 : 다짜고짜 배워보는 인과추론

  • 3. 안녕하세요 ☺ 한국신용데이터에서 CEO Staff로 일하는 이윤희 입니다. = 조직의 목표 달성과 CEO 의사결정을 지원하기 위해 필요한 모든 일을 하는 사람 (프로젝트 관리, 지표 관리, 신규 사업 Growth)
  • 4.
  • 5. 제러널리스트로서… - 새로운 일, 처음 보는 개념에 열린 마음 - 빠르게 배우기 - 쉽게 설명하기 (저도 방금까지 몰랐던 내용이니까요!)
  • 6. 인과추론 떡밥 뿌리기 앞으로 10분 동안… 인과추론, 빙산의 일각만 배워보아요! - 인과추론이란 무엇일까요? - 인과추론을 위한 통계 지식 - 현실에서 이렇게 쓰입니다!
  • 8. 상관관계 vs. 인과관계 맥도날드 점포가 많아진다 물가가 상승한다x 맥도날드 점포가 많아졌기 때문에, 물가가 상승했다 !? 상관관계 인과관계
  • 9. 상관관계는 인과관계가 아니다! - 다른 요인이 맥도날드 점포 수와 물가 지수에 동시에 영향을 미쳤을 가능성 - 예시) 수요 증가 / 공급 감소, 생산비 원자재 가격 상승, 유통 구조 등 다른 요인이 영향을 미쳤을 수도.. 인과관계가 반대일 수도.. - 물가가 상승했기 때문에, 맥도날드 점포 수가 늘어났을 가능성
  • 10. 예측 vs. 추론 (feat. 충성고객) 예측 추론 어떤 사람이 충성 고객이 될까? 그 사람을 타깃해보자! ➡ 결과 맞추기, 오차를 최소화 하는 게 중요해요! 사용자에게 무엇을 해주면 충성고객이 될까? 포인트를 쌓는 게 좋을지, 배송비 무료 쿠폰을 주는 게 좋을지 고민 돼 😵 ➡ 원인과 결과 사이의 관계 알아내기
  • 11. 인과추론이 쓸모 있는 이유 인과추론은 Actionable 하다!
  • 13. 인과관계 입증에 있어 중요한 관점 개입을 받은 집단 예시) 타이레놀을 복용한 사람들이 모인 그룹 개입을 받지 않은 집단 (= 대조군, 통제군) 예시) 타이레놀을 복용하지 않은 사람들이 모인 그룹 개입 효과 Treatment Effect
  • 14. 현실에서 인과관계를 입증하기 어려운 이유 세상에는 통제할 수 없는 것이 너무 많아 😭 - Treatment를 명확히 정의 할 수 없다. 오프라인 매장의 매출을 증감 요인 9,999+가지 - Control Group의 결과를 알 수 없다. 메뉴 가격 상승과 매출 간의 인과관계를 본다면? - Group에 무작위로 배정되지 않는다. 멤버십 가입에 따른 객단가를 분석한다면? (선택에 의해서 배정 ➡ Self-Selection Bias)
  • 15. 한 눈에 보는 인과추론 방법론 �� Source) Jiyong Park. “Korea Summer Session on Causal Inference 2021”. https://youtu.be/kr-7PXLefyc
  • 16. 한 눈에 보는 인과추론 방법론 종합 선물셋트 🎁 무작위 비교 실험 A/B Test 통제 환경을 가정 통제 환경을 가정하기 어려울 때 회귀분석 - 개정판 회귀분석 y = f(x) + e 도구변수 준 실험 Source) Jiyong Park. “Korea Summer Session on Causal Inference 2021”. https://youtu.be/kr-7PXLefyc
  • 17. 데이터에 경계선이 있다면, RD 디자인 Regression Discontinuity Source) Prof. Eric Dunford. “Accelerated Statistics for Public Policy” .McCourt School of Public Policy. http://ericdunford.com/ppol561/Lectures/week_08/week08-regression-discontinuity-ppol561.html#1 Control Group Treatment Group
  • 18. RD 디자인 적용 사례 Source 1) Srikanth Kadiyala and Erin Strumpf. 2014. “How Effective is Population-Based Cancer Screening”. Forum for Health Economics and Policy Source 2) Hoekstra, Mark. 2009. “The Effect of Attending the Flagship State University on Earnings: A Discontinuity-Based Approach”. Review of Economics and Statistics 91 (4): 717–24.
  • 20. 왜 A/B 테스트가 아닌 준 실험을 활용할까? Source 1) Colin McFarland, Michael Pow, Julia Glick. 2018. “Quasi Experimentation at Netflix”. https://netflixtechblog.com/quasi-experimentation-at-netflix-566b57d2e362 - 기술적으로 개별 사용자를 대상으로 무작위 배정을 시행할 수 없는 경우 - 기술적으로는 가능하지만, 다른 변수가 개입할 여지가 있는 경우 (대중매체 노출, 개인화된 추천 시스템, 사용자 사이의 소문 등)
  • 21. (사례) 옥외광고를 통한 가입 효과 분석 Source 1) Colin McFarland, Michael Pow, Julia Glick. 2018. “Quasi Experimentation at Netflix”. https://netflixtechblog.com/quasi-experimentation-at-netflix-566b57d2e362
  • 23. 🙌 또 만나요! 이윤희 leeyunhee12@gamil.com | 이메일 https://medium.com/@connect2yh | 블로그 https://www.linkedin.com/in/connect2yh | 링크드인