SlideShare a Scribd company logo
1 of 15
Download to read offline
확률을 높이는 확률
- 직감과 현실을 차이를 일깨우는 확률적 사고
SW Kang
Feb/2015
이시우치 히로무 지음(2010년)
신현호 번역(2013년)
불확실 한 세계를 살기 위한 확률적 사고
• 최선의 선택은 확률에 기반한 선택 ➔ 후회와 불안을 없애는 사고
• 잘못된 정보 해석에 빠지지 않기 위해서는
– 1) 출처, 2) 조사방법, 3)빠진 데이터, 4)바뀐 내용, 5) 상식기반 확인이 필수
– 도표와 숫자를 통해 진실을 확인
• 정보(확률)을 상황에 따라 왜곡된다.
– 시기와 장소, 선입견, 편의성, 자신의 이익에 따라 정보는 왜곡된다
• 지극히 정확한 대략적 추측 ➔ 나무가 아닌 숲을 보는 것 : 확률적 사고
– 추정의 목적과 구간을 명확히, 모델의 한계와 유용성에 주의
• ‘확률적으로 얼마만큼의 편의(bias)가 있는가?’에 살펴보고 의사결정 ➔ 피셔의 임의화 실험
• 가시화에 의한 확인
– 3 가지 가시화 방법 : 1) 수형도, 2) 도표, 3) 벤다이어그램
• 게임의 편향을 확인하면 게임에서 확률적으로 지지않을 방법을 찾을 수 있다
• 도박판을 경영하는 측은 ‘확률적 사고의 프로’ ➔ 모든 도박은 평균적으로 손해
노력은 어디까지나 도박이다. 그러니까 인생은 재미있다.
목차
• ‘확률적 사고’로 무엇이 바뀌는가
• 이 세상의 정보는 거짓투성이? ‘직감’과 ‘현실’의 함정
• 무엇이 확률을 왜곡시키는가
• 모르면 모르는 대로 목표부터 설정하라
• 모르면 모르는 대로 흑백을 가려놓아라
• 의사결정을 위한 확률적 사고
• 게임과 도박에서 지지 않는 방법
• 일상에 감춰져 있는 확률
확률적 사고로 무엇이 바뀌는가?
• 불확실성이 큰 상황에서의 행동은 ‘확률적 사고’에 근거 결과론, 결정론 등은 도움이 되지 않음
• 확률적 사고 : 모르는 부분과 모르는 가운데서도 아는 부분으로 상황을 정리하는 것
– 4할 타자 vs 2할 타자, 주사위 1,2,3,4 나올 가능성과 5,6이 나올 가능성
– 확률이 높은 쪽을 선택하는 것이 장기적으로 유리
– 세이버매트릭스(Sabermatrics) : 과학적 수치를 바탕으로 야구 시합에서 이기는 방법을 찾기 위한 기법
• 최고의 선택은 원인과 해결방법을 알 수 있는 경우, 최선의 선택은 확률에 기반한 선택
– 인생은 선택의 연속 ➔ 자유로운 선택을 할 수 있음을 감사하며 매순간 최선의 선택으로 풍요로운 삶 만들기
– 최선의 선택을 위해서
• 1) 확률로서 직감을 왜곡시키는 말에 민감, 2) 객관적 정보로 진실을 파악, 3)정확성과 부정확성 파악, 4)자신의 중요도에 따라 선택
• 후회와 불안을 줄이는 확률적 사고
– 후회를 없앤다 : 정리가 되어 있어 ‘이것이 최선이다’라는 신념으로 도전한 결과로서 실패는 후회가 없다
– 불안을 없앤다 : 불안은 근거가 없는 곳에서 생긴다.
– 농구 황제의 슛 성공률
[참고자료] 세이버 메트릭스
• 데이터 야구의 시대 – 세이버메트릭스
– SABR(The Society for American Baseball Research)+ merics
– SK 와이번스 김성근 감독의 훌륭한 전력분석팀
– 2011년 개봉한 <머니볼(Moneyball)>
• 월스트리트 경력의 저널리스트 Michael Lewis 작품
• Okland Athletics 의 Billy Beane 단장의 실화
• 출루율 기반의 선수 구성 : (출루율) = (안타+볼넷+데드볼)/(타수 – 희생번트)
– 타순 배치 시뮬레이션
• 잘치는 타자를 상위 타선에 ➔ 타석 기회가 많아짐
• 연타석 안타가 중요 ➔ 연속 안타는 득점을 높임
• 출루율 우선 타선 ➔ 팀의 득점력 향상 ( 출루율 > 정상 > 타율 > 반대 )
– 야구 통계는 ‘야구의 아버지’ Heny Chadwick의 박스 스코어 개념에서
– ‘세이버메트릭’의 아버지 : Bill James ➔ 빌제임스 야구 개요서
• OPS (On base Plus Slugging ) ➔ 출루율과 장타율의 합
– 2010년 LG 트윈스의 신연봉제도 ➔ ‘Valuation’의 도입
• 몬티홀의 딜레마 ➔ 직감적으로 모순되는 결과 (참고자료 참조)
– 인간의 직감은 속임을 당하기 쉽다
• 확률은 해석이 중요하다 ➔ 과장된/잘못된 해석 주의
– 폭력사건 대부분은 ‘잠’을 잔지 24시간 내에 발생
– 누구나 집에서 ‘빵’을 구워 먹었던 18세기 유럽의 평균 수명은 고작 50세
– 1) 출처, 2) 조사방법, 3)빠진 데이터, 4)바뀐 내용, 5) 상식기반 확인
• 마음의 회계학(Mental Accounting) : 돈을 다룰 경우의 심리 영향 연구하는 ‘행동 경제학’의 주요 개념
– 비싼 물건을 살 때는 약간의 가격 차이는 무시(4만원 구두를 2만원, 100만원 냉장고를 95만원에 파는 옆동네)
– 5000엔 할인 쿠폰을 받기 위해 1만엔 추가 지출
– 가전제품 살 경우 3년 무상 보증을 위한 5% 추가금 vs 5000원 점검 비용으로 3년간 무상 보증
– 학자금 적금 해약 vs 자동차 할부 의 가치 비교 (의미를 부여한 돈에 의한 판단 착오)
• 도표나 숫자를 확인함으로써 진실을 확인 ➔ 무지를 인식하고 알기위한 노력하는 확률적 사고
– 현실은 도표나 숫자로 정리하기가 쉽지는 않음 ➔ 최소한 어림잡아 계산은 해보아야
– 한 가지 사례로는 과학적 검증이 되지 않음
이 세상의 정보는 거짓투성이? 직감과 현실의 함정
▪ 범죄자 98%가 매일 먹는다
▪ 폭력사건 90%는 이 음식을 먹은 24시간 이내에 발생
▪신생아에게 이 음식을 주면 숨이 막힐 듯 괴로와 한다
▪이 음식을 먹고자란 아이의 약 과반수는 성적이 평균 이하
➔ 이 음식을 금지해야 할까?
선량한 시민 범죄자
매일 밥을 먹음 9704 (98%) 98 (98%)
가끔 밥을 안먹음 196 (2%) 2 (2%)
합 계 9900 100
[Fun] 몬티 홀(Monty Hall) 문제
• 시기와 장소를 바꾸면 내용도 달라진다 ➔ 정보의 편향(bias)성
– 정부에 대한 지지율은 설문 조사의 위치(지방, 도시, 강남, 강북)와 시간(낮시간, 밤시간)에 따라 변동
• 사람은 자신에게 득이 되는 정보를 주로 전달한다 ➔ 정보 전달자의 입장 확인 필요
– 상품에 불만인 99%를 제외한 만족한 1%를 소개
– ‘비디오 게임을 하는 아이는 바보가 되기쉽다’ ➔ 부모들의 이해득실에 따라 전파(TV, 방송, 그리고 소문)
• 선입견으로 생각이 바뀐다.
– 비싼 와인 vs 싼와인, 표고버섯 vs 송이버섯, A형 vs AB형
– 선입견이 자리를 잡으면 그와 일치하는 정보는 인지하기 쉽고, 기억하기 쉽고, 생각해내기 쉽다 ➔ 편견과
• 편의에 의해 생기는 도시전설
– ‘소니 타이머’ ➔ 신제품이 출시될 즈음에 고장이 나는 현상 : 화제성이 있어 기억하기 쉽고, 퍼지기 쉬움
– 도시 전설을 믿기 전에 우리 주변에 존재하는 편의를 감안해야
무엇이 확률을 왜곡시키는가
• 지극히 정확한 대략적 추측 ➔ 나무가 아닌 숲을 보는 것 : 확률적 사고
– 시카고의 조율사는 몇 명일까?
• (시카고 전체 인구) X (열심히 피아노 치는 사람 비율) X(1년 조율 횟수) X ( 1회 조율 비용) = (시카고 피아노 조율비용 합)
• (조율사 연 매출) X ( 조율사 수 ) = (시가코 피아노 조율 비용의 합)
• 위의 두 식을 대략적으로 계산하여 (대략적 추측)을 함
– 구글의 입사 시험
• 스쿨 버스에는 골프공이 몇개나 들어갈까? 전세계에는 얼마나 많은 피아노 조율사가 있을까? 등등
• 추정의 ‘목적’과 ‘구간’을 고려
– 위험부담을 최소화하기 위한 것이라면 가장 보수적인 결과를 고려해야
• 추정 모델의 한계와 유용성
– 모든 모델은 잘못되어 있다. 다만 사고를 전개해나가는 과정은 유용하다
모르면 모른는대로 목표부터 설정하라
• ‘확률적으로 얼마만큼의 편의(bias)가 있는가?’에 살펴보고 의사결정
– 한 경기의 심판은 몇 명이 필요한가? : (한심판이 실수할 확률)과 (유의수준)에 따라 달라짐
– 다수결은 인원이 많을수록 잘못이 줄어들기는 하지만, 미묘한 문제는 가급적 충분한 자료조사가 뒷받침되어야
– 귀무가설 과 대립가설에 따른 논제의 검증
• ’10%의 까마귀는 검지 않다’ 는 논제를 검증하기 위해서는 샘플 수집을 통해 검증 필요
• 귀무가설이 유의 범위 있는지 확인
– 과학은 ‘가장 겸허하게 객관적으로 논의하는 방법’
– 로널드 A. 피셔와 밀크티 검증 (참고자료 참조)
– 점쟁이에 대한 ‘임의화 실험’에 의한 검증 필요
모르면 모른는대로 흑백을 가려놓아라
[참고자료] 로널드 A. 피셔 – 현대 통계학의 아버지
• 실험 계획법 (The design of experiment) - 1935 년
• 우유가 먼저인가? 홍차가 먼저 인가?
– 우유를 먼저 넣은 밀크티와 홍차를 먼저 넣은 밀크티의 구분은 가능한가?
– 임의화 비교 실험에 의한 검증 제안
– 검증법에 대한 고민
▪ 한번 맞춘 경우 ➔ 50% 의 확률을 가짐
▪ 여러번 맞춘 경우 ➔ 특정 규칙에 따른 것은 아닌지 에 대한 확인 필요
▪ 한번의 실험의 경우 ➔ 특수 시간, 특수 여건에 의한 것인지 확인 필요
• Fisher의 3원칙
– 반복 실험 ( Repetition and Replication )
– 무작위화 ( Randomization )
– 국소 관리 ( Local Control )
• 2003년 영국왕립 화학 협회 - 한 잔의 완벽한 홍차를 타는 법
– 우유를 먼저 넣는 것이 뜨거운 홍차에 의한 우유 단백질의 변형(75도에서 발생)을 막는다.
• 가능성을 ‘가시화’ 해야
– 막연한 상황에 대한 이해와 다른 사람과 정확한 공유에 도움이 되는 ‘가시화’
– 불확실한 미래에 대해 회사의 경영적 판단과 개인의 미래에 대한 결정은 ‘가시화’를 기반으로
– 가시화는 목적이 아닌 수단 ➔ 무엇을 보고싶은 지가 명확해야 효과
• 가시화를 위한 세 가지 방법
– 수형도 : 조건에 따른 경우의 수를 그림으로 표현
– 도표: 중복에 따른 상황에 주의
(주사위의 2의 배수, 3의 배수 ➔ 2와 3의 배수는?)
– 벤다이어그램 : ‘중복의 경우를 쉽게 확인 가능
• ‘감’은 마지막까지 비축해두자
– 직감적으로 뭔가 이상한 느낌이 있는 경우는 확인 필요 ➔ 모델도 틀릴 수 있다
– 모델의 가정, 계산 방법에 대한 재확인 필요
의사 결정을 위한 확률적 사고
• 평균적으로 지지않는 방법
– 그리코 게임에서 지지않기 (가위 바위 보로 계단을 올라가는 게임)
• 상대방이 1:1:1로 가위 바위 보를 낸다는 가정 하에서 도표를 이용한 계산
• “가위를 많이 내고 바위를 적게”
• 확률의 편의(bias) 찾기
– 넘버스(numbers : 구매자가 직접 숫자를 기입하는 복권)의 당첨금 높이기
• 편향에 따른 확률 계산 ➔ 다른 사람이 많이 걸지 않는 숫자에 걸기
• 당첨자가 없을 경우에 이월되어 증가하는 상금에 도전
➔편향이 알려진 경우는 다른 사람들도 같은 행동을 하게 됨
➔다만, ‘어떤 확률에 주목해야할 지 관점을 전환하는 계기’ 로 삼아야
• 도박판을 경영하는 측은 ‘확률적 사고의 프로’ ➔ 모든 도박은 평균적으로 손해
– 이득을 보겠다는 생각보다는 아슬아슬한 체험을 감당할 수 있는 예산 범위에서 한다 는 자세로 임해야
게임과 도박에서 지지않는 방법
• 인간은 자유, 그 자체 - 장 폴 사르트르 (프랑스 철학자, 사상가)
– 생활습관병 ➔ 자신의 건강에 대해서도 자유의 영향이 더 큼. 기적의 건강식품은 없다
– 확률적으로 평소 생활습관이 엉망이면 병에 걸리 가능성이 높아짐
– 자신의 건강에 ‘불안’과 ‘후회’를 없애려면 확률적으로 건강한 생활 습관을 익혀야
• 생명보험 ➔ 기본적으로는 ‘손해’ (확률적으로)
– 보험회사는 ‘평균적으로 손해를 보지 않는’ 계약 내용으로 상품을 개발
– 협동조합, 공제조합 혹은 비영리단체의 보험은 광고나 근사한 옵션의 비용이 없어 확률적으로 손실이 적다
• 노력할 필요는 있는가?
– 제대로 된 목표를 정해 집중적으로 노력했을 때 도박보다 더 짜릿한 흥분을 느낀다
– “노력했다고 꼭 성공하는 것은 아니다. 하지만 성공한 사람은 언제나 노력하고 있다”
➔노력은 어디까지나 도박이다. 그러니까 인생은 재미있다.
일상에 감춰져 있는 확률
확률을 높이는 확률

More Related Content

What's hot

Ml professional bandit_chapter2
Ml professional bandit_chapter2Ml professional bandit_chapter2
Ml professional bandit_chapter2Takeru Maehara
 
FDRの使い方 (Kashiwa.R #3)
FDRの使い方 (Kashiwa.R #3)FDRの使い方 (Kashiwa.R #3)
FDRの使い方 (Kashiwa.R #3)Haruka Ozaki
 
7. binomial distribution
7. binomial distribution7. binomial distribution
7. binomial distributionKaran Kukreja
 
機械学習モデルの列挙
機械学習モデルの列挙機械学習モデルの列挙
機械学習モデルの列挙Satoshi Hara
 
Imputation of Missing Values using Random Forest
Imputation of Missing Values using  Random ForestImputation of Missing Values using  Random Forest
Imputation of Missing Values using Random ForestSatoshi Kato
 
Estadistiva ii distribución de probabilidad discreta 2 2
Estadistiva ii distribución de probabilidad discreta  2 2Estadistiva ii distribución de probabilidad discreta  2 2
Estadistiva ii distribución de probabilidad discreta 2 2ROJASVN
 
高速なガンマ分布の最尤推定法について
高速なガンマ分布の最尤推定法について高速なガンマ分布の最尤推定法について
高速なガンマ分布の最尤推定法についてhoxo_m
 
ハミルトニアンモンテカルロ法についての説明
ハミルトニアンモンテカルロ法についての説明ハミルトニアンモンテカルロ法についての説明
ハミルトニアンモンテカルロ法についての説明KCS Keio Computer Society
 
Sigfin Neural Fractional SDE NET
Sigfin Neural Fractional SDE NETSigfin Neural Fractional SDE NET
Sigfin Neural Fractional SDE NETKei Nakagawa
 
強くなるためのプログラミング -プログラミングに関する様々なコンテストとそのはじめ方-#pyconjp
強くなるためのプログラミング -プログラミングに関する様々なコンテストとそのはじめ方-#pyconjp強くなるためのプログラミング -プログラミングに関する様々なコンテストとそのはじめ方-#pyconjp
強くなるためのプログラミング -プログラミングに関する様々なコンテストとそのはじめ方-#pyconjpcocodrips
 
Rパッケージ“KFAS”を使った時系列データの解析方法
Rパッケージ“KFAS”を使った時系列データの解析方法Rパッケージ“KFAS”を使った時系列データの解析方法
Rパッケージ“KFAS”を使った時系列データの解析方法Hiroki Itô
 
PRML 2.4-2.5: The Exponential Family & Nonparametric Methods
PRML 2.4-2.5: The Exponential Family & Nonparametric MethodsPRML 2.4-2.5: The Exponential Family & Nonparametric Methods
PRML 2.4-2.5: The Exponential Family & Nonparametric MethodsShinichi Tamura
 
アンサンブル木モデル解釈のためのモデル簡略化法
アンサンブル木モデル解釈のためのモデル簡略化法アンサンブル木モデル解釈のためのモデル簡略化法
アンサンブル木モデル解釈のためのモデル簡略化法Satoshi Hara
 
Prml 2_3_5
Prml 2_3_5Prml 2_3_5
Prml 2_3_5brownbro
 
色々な確率分布とその応用
色々な確率分布とその応用色々な確率分布とその応用
色々な確率分布とその応用Hiroki Iida
 
RとPythonを比較する
RとPythonを比較するRとPythonを比較する
RとPythonを比較するJoe Suzuki
 

What's hot (20)

Ml professional bandit_chapter2
Ml professional bandit_chapter2Ml professional bandit_chapter2
Ml professional bandit_chapter2
 
FDRの使い方 (Kashiwa.R #3)
FDRの使い方 (Kashiwa.R #3)FDRの使い方 (Kashiwa.R #3)
FDRの使い方 (Kashiwa.R #3)
 
PRML2.3.1-2.3.3
PRML2.3.1-2.3.3PRML2.3.1-2.3.3
PRML2.3.1-2.3.3
 
7. binomial distribution
7. binomial distribution7. binomial distribution
7. binomial distribution
 
機械学習モデルの列挙
機械学習モデルの列挙機械学習モデルの列挙
機械学習モデルの列挙
 
Imputation of Missing Values using Random Forest
Imputation of Missing Values using  Random ForestImputation of Missing Values using  Random Forest
Imputation of Missing Values using Random Forest
 
Estadistiva ii distribución de probabilidad discreta 2 2
Estadistiva ii distribución de probabilidad discreta  2 2Estadistiva ii distribución de probabilidad discreta  2 2
Estadistiva ii distribución de probabilidad discreta 2 2
 
高速なガンマ分布の最尤推定法について
高速なガンマ分布の最尤推定法について高速なガンマ分布の最尤推定法について
高速なガンマ分布の最尤推定法について
 
ハミルトニアンモンテカルロ法についての説明
ハミルトニアンモンテカルロ法についての説明ハミルトニアンモンテカルロ法についての説明
ハミルトニアンモンテカルロ法についての説明
 
Sigfin Neural Fractional SDE NET
Sigfin Neural Fractional SDE NETSigfin Neural Fractional SDE NET
Sigfin Neural Fractional SDE NET
 
強くなるためのプログラミング -プログラミングに関する様々なコンテストとそのはじめ方-#pyconjp
強くなるためのプログラミング -プログラミングに関する様々なコンテストとそのはじめ方-#pyconjp強くなるためのプログラミング -プログラミングに関する様々なコンテストとそのはじめ方-#pyconjp
強くなるためのプログラミング -プログラミングに関する様々なコンテストとそのはじめ方-#pyconjp
 
1 2.t検定
1 2.t検定1 2.t検定
1 2.t検定
 
Rパッケージ“KFAS”を使った時系列データの解析方法
Rパッケージ“KFAS”を使った時系列データの解析方法Rパッケージ“KFAS”を使った時系列データの解析方法
Rパッケージ“KFAS”を使った時系列データの解析方法
 
最適腕識別
最適腕識別最適腕識別
最適腕識別
 
Cfa 20190620
Cfa 20190620Cfa 20190620
Cfa 20190620
 
PRML 2.4-2.5: The Exponential Family & Nonparametric Methods
PRML 2.4-2.5: The Exponential Family & Nonparametric MethodsPRML 2.4-2.5: The Exponential Family & Nonparametric Methods
PRML 2.4-2.5: The Exponential Family & Nonparametric Methods
 
アンサンブル木モデル解釈のためのモデル簡略化法
アンサンブル木モデル解釈のためのモデル簡略化法アンサンブル木モデル解釈のためのモデル簡略化法
アンサンブル木モデル解釈のためのモデル簡略化法
 
Prml 2_3_5
Prml 2_3_5Prml 2_3_5
Prml 2_3_5
 
色々な確率分布とその応用
色々な確率分布とその応用色々な確率分布とその応用
色々な確率分布とその応用
 
RとPythonを比較する
RとPythonを比較するRとPythonを比較する
RとPythonを比較する
 

Similar to 확률을 높이는 확률

양성봉 - 알기쉬운 알고리즘 - 1장알고리즘의첫걸음
양성봉 - 알기쉬운 알고리즘 - 1장알고리즘의첫걸음양성봉 - 알기쉬운 알고리즘 - 1장알고리즘의첫걸음
양성봉 - 알기쉬운 알고리즘 - 1장알고리즘의첫걸음Dongseo University
 
통계의 힘 (도서정리)
통계의 힘 (도서정리)통계의 힘 (도서정리)
통계의 힘 (도서정리)TIMEGATE
 
통계의 힘 (스터디 자료)
통계의 힘 (스터디 자료)통계의 힘 (스터디 자료)
통계의 힘 (스터디 자료)Seung-Woo Kang
 
레벨디자인 특강 이동훈
레벨디자인 특강 이동훈레벨디자인 특강 이동훈
레벨디자인 특강 이동훈Donghun Lee
 
레벨디자인 특강 이동훈
레벨디자인 특강 이동훈레벨디자인 특강 이동훈
레벨디자인 특강 이동훈Donghun Lee
 
(책 소개) 신호와 소음
(책 소개) 신호와 소음(책 소개) 신호와 소음
(책 소개) 신호와 소음Jay Park
 
3일차 상대를내편으로만드는소통기술
3일차 상대를내편으로만드는소통기술3일차 상대를내편으로만드는소통기술
3일차 상대를내편으로만드는소통기술Lee Sungyoung
 

Similar to 확률을 높이는 확률 (8)

양성봉 - 알기쉬운 알고리즘 - 1장알고리즘의첫걸음
양성봉 - 알기쉬운 알고리즘 - 1장알고리즘의첫걸음양성봉 - 알기쉬운 알고리즘 - 1장알고리즘의첫걸음
양성봉 - 알기쉬운 알고리즘 - 1장알고리즘의첫걸음
 
통계의 힘 (도서정리)
통계의 힘 (도서정리)통계의 힘 (도서정리)
통계의 힘 (도서정리)
 
통계의 힘 (스터디 자료)
통계의 힘 (스터디 자료)통계의 힘 (스터디 자료)
통계의 힘 (스터디 자료)
 
레벨디자인 특강 이동훈
레벨디자인 특강 이동훈레벨디자인 특강 이동훈
레벨디자인 특강 이동훈
 
레벨디자인 특강 이동훈
레벨디자인 특강 이동훈레벨디자인 특강 이동훈
레벨디자인 특강 이동훈
 
(책 소개) 신호와 소음
(책 소개) 신호와 소음(책 소개) 신호와 소음
(책 소개) 신호와 소음
 
3일차 상대를내편으로만드는소통기술
3일차 상대를내편으로만드는소통기술3일차 상대를내편으로만드는소통기술
3일차 상대를내편으로만드는소통기술
 
Fgdgfd
FgdgfdFgdgfd
Fgdgfd
 

More from Seung-Woo Kang

[도서 리뷰] 디스럽트(Disrupt)
[도서 리뷰] 디스럽트(Disrupt)[도서 리뷰] 디스럽트(Disrupt)
[도서 리뷰] 디스럽트(Disrupt)Seung-Woo Kang
 
[도서 리뷰] 인센티브와 무임승차
[도서 리뷰] 인센티브와 무임승차[도서 리뷰] 인센티브와 무임승차
[도서 리뷰] 인센티브와 무임승차Seung-Woo Kang
 
[도서 리뷰] 왜 지금 핀테크인가?
[도서 리뷰] 왜 지금 핀테크인가?[도서 리뷰] 왜 지금 핀테크인가?
[도서 리뷰] 왜 지금 핀테크인가?Seung-Woo Kang
 
[도서 리뷰] 헤드 퍼스트 데이터 분석 ( Head First Data Analysis )
[도서 리뷰]  헤드 퍼스트 데이터 분석 ( Head First Data Analysis )[도서 리뷰]  헤드 퍼스트 데이터 분석 ( Head First Data Analysis )
[도서 리뷰] 헤드 퍼스트 데이터 분석 ( Head First Data Analysis )Seung-Woo Kang
 
[도서 리뷰] 어떻게 돌파할 것인가
[도서 리뷰] 어떻게 돌파할 것인가[도서 리뷰] 어떻게 돌파할 것인가
[도서 리뷰] 어떻게 돌파할 것인가Seung-Woo Kang
 
[도서 리뷰] 이나모리 가즈오의 회계경영
[도서 리뷰] 이나모리 가즈오의 회계경영[도서 리뷰] 이나모리 가즈오의 회계경영
[도서 리뷰] 이나모리 가즈오의 회계경영Seung-Woo Kang
 
차이의 붕괴(Collapse of Distinction) - 도서 요약
차이의 붕괴(Collapse of Distinction) - 도서 요약차이의 붕괴(Collapse of Distinction) - 도서 요약
차이의 붕괴(Collapse of Distinction) - 도서 요약Seung-Woo Kang
 
일본 기업은 AI를 어떻게 활용하고 있을까(도서 정리)
일본 기업은 AI를 어떻게 활용하고 있을까(도서 정리)일본 기업은 AI를 어떻게 활용하고 있을까(도서 정리)
일본 기업은 AI를 어떻게 활용하고 있을까(도서 정리)Seung-Woo Kang
 
소음과 투자 (도서 요약)
소음과 투자 (도서 요약)소음과 투자 (도서 요약)
소음과 투자 (도서 요약)Seung-Woo Kang
 
피케티의 21세기 자본론(도서요약)
피케티의 21세기 자본론(도서요약)피케티의 21세기 자본론(도서요약)
피케티의 21세기 자본론(도서요약)Seung-Woo Kang
 
현명한 초보 투자자(도서 요약)
현명한 초보 투자자(도서 요약)현명한 초보 투자자(도서 요약)
현명한 초보 투자자(도서 요약)Seung-Woo Kang
 
세상에서 가장 쉬운 회계학 입문(도서 요약)
세상에서 가장 쉬운 회계학 입문(도서 요약)세상에서 가장 쉬운 회계학 입문(도서 요약)
세상에서 가장 쉬운 회계학 입문(도서 요약)Seung-Woo Kang
 
캐리커처 생성기 테스트
캐리커처 생성기 테스트캐리커처 생성기 테스트
캐리커처 생성기 테스트Seung-Woo Kang
 
주가_변화시점탐지(Change point Detection)
주가_변화시점탐지(Change point Detection)주가_변화시점탐지(Change point Detection)
주가_변화시점탐지(Change point Detection)Seung-Woo Kang
 
시계열 분석의 이해와 활용
시계열 분석의 이해와 활용시계열 분석의 이해와 활용
시계열 분석의 이해와 활용Seung-Woo Kang
 
스플렁크 머신러닝 연동
스플렁크 머신러닝 연동스플렁크 머신러닝 연동
스플렁크 머신러닝 연동Seung-Woo Kang
 
하이퍼레저 프로젝트 개요
하이퍼레저 프로젝트 개요하이퍼레저 프로젝트 개요
하이퍼레저 프로젝트 개요Seung-Woo Kang
 
Azure ml studio_fraud_detection
Azure ml studio_fraud_detectionAzure ml studio_fraud_detection
Azure ml studio_fraud_detectionSeung-Woo Kang
 
MS_QnA_Maker_챗봇만들기
MS_QnA_Maker_챗봇만들기MS_QnA_Maker_챗봇만들기
MS_QnA_Maker_챗봇만들기Seung-Woo Kang
 
블록체인 이해와 활용
블록체인 이해와 활용블록체인 이해와 활용
블록체인 이해와 활용Seung-Woo Kang
 

More from Seung-Woo Kang (20)

[도서 리뷰] 디스럽트(Disrupt)
[도서 리뷰] 디스럽트(Disrupt)[도서 리뷰] 디스럽트(Disrupt)
[도서 리뷰] 디스럽트(Disrupt)
 
[도서 리뷰] 인센티브와 무임승차
[도서 리뷰] 인센티브와 무임승차[도서 리뷰] 인센티브와 무임승차
[도서 리뷰] 인센티브와 무임승차
 
[도서 리뷰] 왜 지금 핀테크인가?
[도서 리뷰] 왜 지금 핀테크인가?[도서 리뷰] 왜 지금 핀테크인가?
[도서 리뷰] 왜 지금 핀테크인가?
 
[도서 리뷰] 헤드 퍼스트 데이터 분석 ( Head First Data Analysis )
[도서 리뷰]  헤드 퍼스트 데이터 분석 ( Head First Data Analysis )[도서 리뷰]  헤드 퍼스트 데이터 분석 ( Head First Data Analysis )
[도서 리뷰] 헤드 퍼스트 데이터 분석 ( Head First Data Analysis )
 
[도서 리뷰] 어떻게 돌파할 것인가
[도서 리뷰] 어떻게 돌파할 것인가[도서 리뷰] 어떻게 돌파할 것인가
[도서 리뷰] 어떻게 돌파할 것인가
 
[도서 리뷰] 이나모리 가즈오의 회계경영
[도서 리뷰] 이나모리 가즈오의 회계경영[도서 리뷰] 이나모리 가즈오의 회계경영
[도서 리뷰] 이나모리 가즈오의 회계경영
 
차이의 붕괴(Collapse of Distinction) - 도서 요약
차이의 붕괴(Collapse of Distinction) - 도서 요약차이의 붕괴(Collapse of Distinction) - 도서 요약
차이의 붕괴(Collapse of Distinction) - 도서 요약
 
일본 기업은 AI를 어떻게 활용하고 있을까(도서 정리)
일본 기업은 AI를 어떻게 활용하고 있을까(도서 정리)일본 기업은 AI를 어떻게 활용하고 있을까(도서 정리)
일본 기업은 AI를 어떻게 활용하고 있을까(도서 정리)
 
소음과 투자 (도서 요약)
소음과 투자 (도서 요약)소음과 투자 (도서 요약)
소음과 투자 (도서 요약)
 
피케티의 21세기 자본론(도서요약)
피케티의 21세기 자본론(도서요약)피케티의 21세기 자본론(도서요약)
피케티의 21세기 자본론(도서요약)
 
현명한 초보 투자자(도서 요약)
현명한 초보 투자자(도서 요약)현명한 초보 투자자(도서 요약)
현명한 초보 투자자(도서 요약)
 
세상에서 가장 쉬운 회계학 입문(도서 요약)
세상에서 가장 쉬운 회계학 입문(도서 요약)세상에서 가장 쉬운 회계학 입문(도서 요약)
세상에서 가장 쉬운 회계학 입문(도서 요약)
 
캐리커처 생성기 테스트
캐리커처 생성기 테스트캐리커처 생성기 테스트
캐리커처 생성기 테스트
 
주가_변화시점탐지(Change point Detection)
주가_변화시점탐지(Change point Detection)주가_변화시점탐지(Change point Detection)
주가_변화시점탐지(Change point Detection)
 
시계열 분석의 이해와 활용
시계열 분석의 이해와 활용시계열 분석의 이해와 활용
시계열 분석의 이해와 활용
 
스플렁크 머신러닝 연동
스플렁크 머신러닝 연동스플렁크 머신러닝 연동
스플렁크 머신러닝 연동
 
하이퍼레저 프로젝트 개요
하이퍼레저 프로젝트 개요하이퍼레저 프로젝트 개요
하이퍼레저 프로젝트 개요
 
Azure ml studio_fraud_detection
Azure ml studio_fraud_detectionAzure ml studio_fraud_detection
Azure ml studio_fraud_detection
 
MS_QnA_Maker_챗봇만들기
MS_QnA_Maker_챗봇만들기MS_QnA_Maker_챗봇만들기
MS_QnA_Maker_챗봇만들기
 
블록체인 이해와 활용
블록체인 이해와 활용블록체인 이해와 활용
블록체인 이해와 활용
 

확률을 높이는 확률

  • 1. 확률을 높이는 확률 - 직감과 현실을 차이를 일깨우는 확률적 사고 SW Kang Feb/2015 이시우치 히로무 지음(2010년) 신현호 번역(2013년)
  • 2. 불확실 한 세계를 살기 위한 확률적 사고 • 최선의 선택은 확률에 기반한 선택 ➔ 후회와 불안을 없애는 사고 • 잘못된 정보 해석에 빠지지 않기 위해서는 – 1) 출처, 2) 조사방법, 3)빠진 데이터, 4)바뀐 내용, 5) 상식기반 확인이 필수 – 도표와 숫자를 통해 진실을 확인 • 정보(확률)을 상황에 따라 왜곡된다. – 시기와 장소, 선입견, 편의성, 자신의 이익에 따라 정보는 왜곡된다 • 지극히 정확한 대략적 추측 ➔ 나무가 아닌 숲을 보는 것 : 확률적 사고 – 추정의 목적과 구간을 명확히, 모델의 한계와 유용성에 주의 • ‘확률적으로 얼마만큼의 편의(bias)가 있는가?’에 살펴보고 의사결정 ➔ 피셔의 임의화 실험 • 가시화에 의한 확인 – 3 가지 가시화 방법 : 1) 수형도, 2) 도표, 3) 벤다이어그램 • 게임의 편향을 확인하면 게임에서 확률적으로 지지않을 방법을 찾을 수 있다 • 도박판을 경영하는 측은 ‘확률적 사고의 프로’ ➔ 모든 도박은 평균적으로 손해 노력은 어디까지나 도박이다. 그러니까 인생은 재미있다.
  • 3. 목차 • ‘확률적 사고’로 무엇이 바뀌는가 • 이 세상의 정보는 거짓투성이? ‘직감’과 ‘현실’의 함정 • 무엇이 확률을 왜곡시키는가 • 모르면 모르는 대로 목표부터 설정하라 • 모르면 모르는 대로 흑백을 가려놓아라 • 의사결정을 위한 확률적 사고 • 게임과 도박에서 지지 않는 방법 • 일상에 감춰져 있는 확률
  • 4. 확률적 사고로 무엇이 바뀌는가? • 불확실성이 큰 상황에서의 행동은 ‘확률적 사고’에 근거 결과론, 결정론 등은 도움이 되지 않음 • 확률적 사고 : 모르는 부분과 모르는 가운데서도 아는 부분으로 상황을 정리하는 것 – 4할 타자 vs 2할 타자, 주사위 1,2,3,4 나올 가능성과 5,6이 나올 가능성 – 확률이 높은 쪽을 선택하는 것이 장기적으로 유리 – 세이버매트릭스(Sabermatrics) : 과학적 수치를 바탕으로 야구 시합에서 이기는 방법을 찾기 위한 기법 • 최고의 선택은 원인과 해결방법을 알 수 있는 경우, 최선의 선택은 확률에 기반한 선택 – 인생은 선택의 연속 ➔ 자유로운 선택을 할 수 있음을 감사하며 매순간 최선의 선택으로 풍요로운 삶 만들기 – 최선의 선택을 위해서 • 1) 확률로서 직감을 왜곡시키는 말에 민감, 2) 객관적 정보로 진실을 파악, 3)정확성과 부정확성 파악, 4)자신의 중요도에 따라 선택 • 후회와 불안을 줄이는 확률적 사고 – 후회를 없앤다 : 정리가 되어 있어 ‘이것이 최선이다’라는 신념으로 도전한 결과로서 실패는 후회가 없다 – 불안을 없앤다 : 불안은 근거가 없는 곳에서 생긴다. – 농구 황제의 슛 성공률
  • 5. [참고자료] 세이버 메트릭스 • 데이터 야구의 시대 – 세이버메트릭스 – SABR(The Society for American Baseball Research)+ merics – SK 와이번스 김성근 감독의 훌륭한 전력분석팀 – 2011년 개봉한 <머니볼(Moneyball)> • 월스트리트 경력의 저널리스트 Michael Lewis 작품 • Okland Athletics 의 Billy Beane 단장의 실화 • 출루율 기반의 선수 구성 : (출루율) = (안타+볼넷+데드볼)/(타수 – 희생번트) – 타순 배치 시뮬레이션 • 잘치는 타자를 상위 타선에 ➔ 타석 기회가 많아짐 • 연타석 안타가 중요 ➔ 연속 안타는 득점을 높임 • 출루율 우선 타선 ➔ 팀의 득점력 향상 ( 출루율 > 정상 > 타율 > 반대 ) – 야구 통계는 ‘야구의 아버지’ Heny Chadwick의 박스 스코어 개념에서 – ‘세이버메트릭’의 아버지 : Bill James ➔ 빌제임스 야구 개요서 • OPS (On base Plus Slugging ) ➔ 출루율과 장타율의 합 – 2010년 LG 트윈스의 신연봉제도 ➔ ‘Valuation’의 도입
  • 6. • 몬티홀의 딜레마 ➔ 직감적으로 모순되는 결과 (참고자료 참조) – 인간의 직감은 속임을 당하기 쉽다 • 확률은 해석이 중요하다 ➔ 과장된/잘못된 해석 주의 – 폭력사건 대부분은 ‘잠’을 잔지 24시간 내에 발생 – 누구나 집에서 ‘빵’을 구워 먹었던 18세기 유럽의 평균 수명은 고작 50세 – 1) 출처, 2) 조사방법, 3)빠진 데이터, 4)바뀐 내용, 5) 상식기반 확인 • 마음의 회계학(Mental Accounting) : 돈을 다룰 경우의 심리 영향 연구하는 ‘행동 경제학’의 주요 개념 – 비싼 물건을 살 때는 약간의 가격 차이는 무시(4만원 구두를 2만원, 100만원 냉장고를 95만원에 파는 옆동네) – 5000엔 할인 쿠폰을 받기 위해 1만엔 추가 지출 – 가전제품 살 경우 3년 무상 보증을 위한 5% 추가금 vs 5000원 점검 비용으로 3년간 무상 보증 – 학자금 적금 해약 vs 자동차 할부 의 가치 비교 (의미를 부여한 돈에 의한 판단 착오) • 도표나 숫자를 확인함으로써 진실을 확인 ➔ 무지를 인식하고 알기위한 노력하는 확률적 사고 – 현실은 도표나 숫자로 정리하기가 쉽지는 않음 ➔ 최소한 어림잡아 계산은 해보아야 – 한 가지 사례로는 과학적 검증이 되지 않음 이 세상의 정보는 거짓투성이? 직감과 현실의 함정 ▪ 범죄자 98%가 매일 먹는다 ▪ 폭력사건 90%는 이 음식을 먹은 24시간 이내에 발생 ▪신생아에게 이 음식을 주면 숨이 막힐 듯 괴로와 한다 ▪이 음식을 먹고자란 아이의 약 과반수는 성적이 평균 이하 ➔ 이 음식을 금지해야 할까? 선량한 시민 범죄자 매일 밥을 먹음 9704 (98%) 98 (98%) 가끔 밥을 안먹음 196 (2%) 2 (2%) 합 계 9900 100
  • 7. [Fun] 몬티 홀(Monty Hall) 문제
  • 8. • 시기와 장소를 바꾸면 내용도 달라진다 ➔ 정보의 편향(bias)성 – 정부에 대한 지지율은 설문 조사의 위치(지방, 도시, 강남, 강북)와 시간(낮시간, 밤시간)에 따라 변동 • 사람은 자신에게 득이 되는 정보를 주로 전달한다 ➔ 정보 전달자의 입장 확인 필요 – 상품에 불만인 99%를 제외한 만족한 1%를 소개 – ‘비디오 게임을 하는 아이는 바보가 되기쉽다’ ➔ 부모들의 이해득실에 따라 전파(TV, 방송, 그리고 소문) • 선입견으로 생각이 바뀐다. – 비싼 와인 vs 싼와인, 표고버섯 vs 송이버섯, A형 vs AB형 – 선입견이 자리를 잡으면 그와 일치하는 정보는 인지하기 쉽고, 기억하기 쉽고, 생각해내기 쉽다 ➔ 편견과 • 편의에 의해 생기는 도시전설 – ‘소니 타이머’ ➔ 신제품이 출시될 즈음에 고장이 나는 현상 : 화제성이 있어 기억하기 쉽고, 퍼지기 쉬움 – 도시 전설을 믿기 전에 우리 주변에 존재하는 편의를 감안해야 무엇이 확률을 왜곡시키는가
  • 9. • 지극히 정확한 대략적 추측 ➔ 나무가 아닌 숲을 보는 것 : 확률적 사고 – 시카고의 조율사는 몇 명일까? • (시카고 전체 인구) X (열심히 피아노 치는 사람 비율) X(1년 조율 횟수) X ( 1회 조율 비용) = (시카고 피아노 조율비용 합) • (조율사 연 매출) X ( 조율사 수 ) = (시가코 피아노 조율 비용의 합) • 위의 두 식을 대략적으로 계산하여 (대략적 추측)을 함 – 구글의 입사 시험 • 스쿨 버스에는 골프공이 몇개나 들어갈까? 전세계에는 얼마나 많은 피아노 조율사가 있을까? 등등 • 추정의 ‘목적’과 ‘구간’을 고려 – 위험부담을 최소화하기 위한 것이라면 가장 보수적인 결과를 고려해야 • 추정 모델의 한계와 유용성 – 모든 모델은 잘못되어 있다. 다만 사고를 전개해나가는 과정은 유용하다 모르면 모른는대로 목표부터 설정하라
  • 10. • ‘확률적으로 얼마만큼의 편의(bias)가 있는가?’에 살펴보고 의사결정 – 한 경기의 심판은 몇 명이 필요한가? : (한심판이 실수할 확률)과 (유의수준)에 따라 달라짐 – 다수결은 인원이 많을수록 잘못이 줄어들기는 하지만, 미묘한 문제는 가급적 충분한 자료조사가 뒷받침되어야 – 귀무가설 과 대립가설에 따른 논제의 검증 • ’10%의 까마귀는 검지 않다’ 는 논제를 검증하기 위해서는 샘플 수집을 통해 검증 필요 • 귀무가설이 유의 범위 있는지 확인 – 과학은 ‘가장 겸허하게 객관적으로 논의하는 방법’ – 로널드 A. 피셔와 밀크티 검증 (참고자료 참조) – 점쟁이에 대한 ‘임의화 실험’에 의한 검증 필요 모르면 모른는대로 흑백을 가려놓아라
  • 11. [참고자료] 로널드 A. 피셔 – 현대 통계학의 아버지 • 실험 계획법 (The design of experiment) - 1935 년 • 우유가 먼저인가? 홍차가 먼저 인가? – 우유를 먼저 넣은 밀크티와 홍차를 먼저 넣은 밀크티의 구분은 가능한가? – 임의화 비교 실험에 의한 검증 제안 – 검증법에 대한 고민 ▪ 한번 맞춘 경우 ➔ 50% 의 확률을 가짐 ▪ 여러번 맞춘 경우 ➔ 특정 규칙에 따른 것은 아닌지 에 대한 확인 필요 ▪ 한번의 실험의 경우 ➔ 특수 시간, 특수 여건에 의한 것인지 확인 필요 • Fisher의 3원칙 – 반복 실험 ( Repetition and Replication ) – 무작위화 ( Randomization ) – 국소 관리 ( Local Control ) • 2003년 영국왕립 화학 협회 - 한 잔의 완벽한 홍차를 타는 법 – 우유를 먼저 넣는 것이 뜨거운 홍차에 의한 우유 단백질의 변형(75도에서 발생)을 막는다.
  • 12. • 가능성을 ‘가시화’ 해야 – 막연한 상황에 대한 이해와 다른 사람과 정확한 공유에 도움이 되는 ‘가시화’ – 불확실한 미래에 대해 회사의 경영적 판단과 개인의 미래에 대한 결정은 ‘가시화’를 기반으로 – 가시화는 목적이 아닌 수단 ➔ 무엇을 보고싶은 지가 명확해야 효과 • 가시화를 위한 세 가지 방법 – 수형도 : 조건에 따른 경우의 수를 그림으로 표현 – 도표: 중복에 따른 상황에 주의 (주사위의 2의 배수, 3의 배수 ➔ 2와 3의 배수는?) – 벤다이어그램 : ‘중복의 경우를 쉽게 확인 가능 • ‘감’은 마지막까지 비축해두자 – 직감적으로 뭔가 이상한 느낌이 있는 경우는 확인 필요 ➔ 모델도 틀릴 수 있다 – 모델의 가정, 계산 방법에 대한 재확인 필요 의사 결정을 위한 확률적 사고
  • 13. • 평균적으로 지지않는 방법 – 그리코 게임에서 지지않기 (가위 바위 보로 계단을 올라가는 게임) • 상대방이 1:1:1로 가위 바위 보를 낸다는 가정 하에서 도표를 이용한 계산 • “가위를 많이 내고 바위를 적게” • 확률의 편의(bias) 찾기 – 넘버스(numbers : 구매자가 직접 숫자를 기입하는 복권)의 당첨금 높이기 • 편향에 따른 확률 계산 ➔ 다른 사람이 많이 걸지 않는 숫자에 걸기 • 당첨자가 없을 경우에 이월되어 증가하는 상금에 도전 ➔편향이 알려진 경우는 다른 사람들도 같은 행동을 하게 됨 ➔다만, ‘어떤 확률에 주목해야할 지 관점을 전환하는 계기’ 로 삼아야 • 도박판을 경영하는 측은 ‘확률적 사고의 프로’ ➔ 모든 도박은 평균적으로 손해 – 이득을 보겠다는 생각보다는 아슬아슬한 체험을 감당할 수 있는 예산 범위에서 한다 는 자세로 임해야 게임과 도박에서 지지않는 방법
  • 14. • 인간은 자유, 그 자체 - 장 폴 사르트르 (프랑스 철학자, 사상가) – 생활습관병 ➔ 자신의 건강에 대해서도 자유의 영향이 더 큼. 기적의 건강식품은 없다 – 확률적으로 평소 생활습관이 엉망이면 병에 걸리 가능성이 높아짐 – 자신의 건강에 ‘불안’과 ‘후회’를 없애려면 확률적으로 건강한 생활 습관을 익혀야 • 생명보험 ➔ 기본적으로는 ‘손해’ (확률적으로) – 보험회사는 ‘평균적으로 손해를 보지 않는’ 계약 내용으로 상품을 개발 – 협동조합, 공제조합 혹은 비영리단체의 보험은 광고나 근사한 옵션의 비용이 없어 확률적으로 손실이 적다 • 노력할 필요는 있는가? – 제대로 된 목표를 정해 집중적으로 노력했을 때 도박보다 더 짜릿한 흥분을 느낀다 – “노력했다고 꼭 성공하는 것은 아니다. 하지만 성공한 사람은 언제나 노력하고 있다” ➔노력은 어디까지나 도박이다. 그러니까 인생은 재미있다. 일상에 감춰져 있는 확률