SlideShare a Scribd company logo
확률 변수와 분포

R과 함께하는 기초통계
용어
• 확률 실험(Random Experiment)
  – 모집단으로부터 표본을 임의로 추출하는 과정
  – 대문자 X, Y, Z 등으로 표기
  – Ex) 아파트 단지내의 1000세대의 각 가정에 있는 TV
    수를 조사하기 위해 가정 한곳을 임의로 선정
• 확률 변수(Random Variable)
  – 확률 실험의 결과
  – 이 결과는 실험에 따라 다르게 나타난다.
  – Ex) 앞선 조사를 X라 하면 X는 0, 1, 2, 3의 값중에 하
    나를 갖게 된다.

          한림대학교 이윤환(http://fb.com/yoonani72)
예제 - 두 개의 공정한 동전을 던지는 시행


• 앞면이 나오는 횟수를 X, 즉 확률변수
 – 표본공간 : S = {HH, HT, TH, TT}
 – 확률 변수 X의 출현 가능한 값
   • X(HH) = 2
   • X(HT) = X(TH) = 1
   • X(TT) = 0


   • 𝑃𝑥 0    =   𝑃 𝑋=0 = 𝑃   𝑇𝑇   =
 – X의 출현 가능한 값들이 나타날 확률
                                      1
                                      4

   • 𝑃𝑥 1    =   𝑃 𝑋=1 = 𝑃   𝐻𝐻 , 𝑇𝐻      =
                                              1
                                              2

   • 𝑃𝑥 2    =   𝑃 𝑋=2 = 𝑃   𝐻𝐻   =
                                      1
                                      4


             한림대학교 이윤환(http://fb.com/yoonani72)
예제 - 두 개의 공정한 동전을 던지는 시행



Ω = 𝐻𝐻, 𝐻𝐻, 𝑇𝑇, 𝑇𝑇
𝐹 = { 𝐻𝐻 , 𝐻𝐻, 𝑇𝑇 , 𝑇𝑇 }
𝑃 𝑇𝑇 = , 𝑃 𝐻𝐻, 𝑇𝐻 = , 𝑃      𝐻𝐻    =
          1              1             1
        4             2                4



                                           확률변수 X



                                  𝑆 = 𝑅(실수 전체)
                                  𝐵(𝑅) = { 0 , {1}, {2}}
                                  𝑃𝑥 0 = , 𝑃𝑥 1 = , 𝑃𝑥 2     =
                                           1             1       1
                                            4       2            4




              한림대학교 이윤환(http://fb.com/yoonani72)
이산확률 분포
• 확률변수를 통한 출현 가능한 값이 셀 수 있는 값
  을 취한다.
• 이산확률변수의 확률 분포
 – 확률변수가 취할 수 있는 모든 가능한 값과 그 값들의
   확률들을 표현한 것
• 이산확률 분포의 성질(조건)

          0 ≤ 𝑃 𝑋= 𝑥 ≤1
 – 확률변수 X의 각 값에 대한 확률 P(X=x)는



              � 𝑝 𝑥 =1
 – 모든 확률값의 합은 1



        한림대학교 이윤환(http://fb.com/yoonani72)
예제
• 표 5.3 각 가정의 TV 수와 확률분포

     보유 TV의 수 (X)             P(X=x)

          0                    0.010

          1                    0.840

          2                    0.145

          3                    0.005

         합계                    1.000




         한림대학교 이윤환(http://fb.com/yoonani72)
이산확률변수의 평균
• 평균은 확률변수에서 기대값(Expected Value)
  이라고 한다.
• 이산확률변수 X의 평균은 어떤 실험을 수많이 실

  을 의미하며 𝜇 𝑋 또는 𝐸 𝑋 로 표기한다.
  행할 때 평균적으로 관찰될 것으로 기대되는 값

• 출현가능한 값과 출현 가능할 확률을 곱한 것을
  모두 더한다.
 – 확률에 평균의 개념이 들어가 있으므로 나누는 과정이

 – 𝐸 𝑋 = ∑ 𝑥𝑥(𝑥)
   필요없다.


        한림대학교 이윤환(http://fb.com/yoonani72)
이산확률변수의 분산

  로 얼마나 퍼져있는 지를 나타내는 것(𝜎 2 )
• 확률변수들의 출현가능한 값들이 평균을 중심으

• 계산방법은 앞선 편차 제곱으로 부터 차용 가능

 – 편차 제곱 : (𝑥 𝑖 − 𝐸(𝑋))2
  하다.


   이들에 개별 확률값을 곱한다 : 𝑥 𝑖 − 𝐸(𝑋) 2 𝑝(𝑥)
 – 이 편차 제곱들이 각각 확률적으로 나타나는 것이므로

 – 위의 값을 모두 더한다 : ∑ 𝑖=1 𝑥 𝑖 − 𝐸(𝑋) 2 𝑝(𝑥)
                         𝑛

   • 간편 계산식 : ∑ 𝑖=1 𝑥 𝑖 2 𝑝 𝑥 𝑖 − 𝐸(𝑋)2
                 𝑛




             한림대학교 이윤환(http://fb.com/yoonani72)
R 예제
> x <- c(0, 1, 2, 3)
> pr.x <- c(0.010, 0.840, 0.145, 0.005)
> e.x <- sum(x*px)
> e.x
[1] 1.145
> var.x <- sum((x^2) * px ) – e.x^2
> var.x
[1] 0.153975

           한림대학교 이윤환(http://fb.com/yoonani72)
팩토리얼과 조합
• 교재 p.118 ~ p.120 까지 반드시 읽어볼 것!!!




         한림대학교 이윤환(http://fb.com/yoonani72)
이항분포(Binomial Dist.)
• 베르누이 시행

      성공의 확률 𝑝 (0 < 𝑝 < 1)
  –   어떤 시행의 결과 성공과 실패로 나타난다.
  –
  –   확률 변수 X의 실현값은 성공이면 1, 실패면 0

      • Bernoulli(p=0.5) = 𝑝 𝑥 (1 − 𝑝)1−𝑥 =0.5 𝑥 (1 − 0.5)1−𝑥
  –   Ex) 공정한 동전을 던져 앞면이 나오면 성공

• iid(Independent & Identically)
  – 모수(Parameter) : 분포함수의 특징을 결정 짓는 값.
      • 앞선 베르누이 시행에서는 확률값 p
  – 동일한 모수를 갖는 확률변수의 실험을 독립적으로 실
    행하는 것

                한림대학교 이윤환(http://fb.com/yoonani72)
이항분포(Binomial Dist.)
• 앞선 베르누이 시행을 n번 iid로 반복한다고 하자.
• 이 시행의 결과는 각 베르누이 시행의 성공의 개수를
  구하는 것이 된다.
• 즉, n번 수행하여 x번 성공하는 실험의 확률분포함
  수를 이항분포라고 한다.
• Ex) 공정한 동전을 두번 던져 앞면이 나오는 횟수
  (앞면이 나오면 성공)

                                𝑛
 – n번 던져 x번 성공하는 경우의 수 ( )
 – n : 2, p = ½

                                𝑥
 – 성공과 실패의 확률(iid) : 0.5 𝑥 (1 − 0.5) 𝑛−𝑥

             한림대학교 이윤환(http://fb.com/yoonani72)
이항분포(Binomial Dist.)
• 확률 밀도 함수 (Probability Mass Function)
  – 이항분포를 따르는(시행의 횟수 n, 성공확률 p) 확률

             𝑛 𝑥
  – 𝐵 𝑛, 𝑝 =   𝑝 1 − 𝑝 𝑛−𝑥 , x는 성공의 횟수
    변수 X는 다음의 확률밀도함수를 갖는다.

             𝑥

  – 일반적으로 말하는 분포함수는 𝑃(𝑋 ≤ 𝑥) 로 나타낸다.
• (누적)분포함수 (Probability Function)

  – 즉, 확률변수의 실현값 x 이하의 확률들을 모두 더한
    값이다.
  – 분포함수는 고유하게 정해져 있다.


          한림대학교 이윤환(http://fb.com/yoonani72)
R에서의분포함수(p.136)
• 이항분포 함수 : xbinom(x, size=n, prob=p)
• R분포함수의 첫글자(x)와 기능
    첫 글자                      기능

     d       확률변수의 출현값에 대한 개별 확률(Density)

     p          Probability function, 즉 (누적)분포함수

     q                  Quantile(백분위수)

     r              Random number(난수 발생)




           한림대학교 이윤환(http://fb.com/yoonani72)
예제(p. 137)
• 성공의 확률이 0.6인 어떤 실험을 3번 시행한다
  고 하자. 즉, B(3, 0.6)
• 이 경우 성공의 횟수 x=0, 1, 2, 3
• 성공의 횟수별 확률 구하기
 > x = c(0, 1, 2, 3)
 > p.x = dbinom(x, size=3, prob=0.6)
 > p.x
 [1] 0.064 0.288 0.432 0.216



           한림대학교 이윤환(http://fb.com/yoonani72)
예제(p. 137)
• 성공의 횟수가 2 이하일 확률 구하기
 > pbinom(2, size=3, prob=0.6)
 [1] 0.784
• (누적)분포 구하기
 > cdf.x = pbinom(x, size=3, prob=0.6)
 > names(cdf.x)=c("0", "1", "2", "3")
 > cdf.x
    0    1  2   3
 0.064 0.352 0.784 1.000


           한림대학교 이윤환(http://fb.com/yoonani72)
예제(p. 137)
• 중앙값 구하기 (백분위수가 50%인 곳)
 > qbinom(0.5, size=3, prob=0.6)
 [1] 2
• B(3, 0.6)을 따르는 이항분포로부터 난수 100
  개 구하기
 > smp = rbinom(100, 3, 0.6)
 > table(smp)
 smp
  0 1 2 3
  7 34 43 16


           한림대학교 이윤환(http://fb.com/yoonani72)

More Related Content

What's hot

11.두표본의 평균비교
11.두표본의 평균비교11.두표본의 평균비교
11.두표본의 평균비교Yoonwhan Lee
 
11_통계 자료분석 입문
11_통계 자료분석 입문11_통계 자료분석 입문
11_통계 자료분석 입문noerror
 
10.단일표본 평균 모비율
10.단일표본 평균 모비율10.단일표본 평균 모비율
10.단일표본 평균 모비율Yoonwhan Lee
 
02.자료다루기
02.자료다루기02.자료다루기
02.자료다루기Yoonwhan Lee
 
12.세표본 이상의 평균비교
12.세표본 이상의 평균비교12.세표본 이상의 평균비교
12.세표본 이상의 평균비교Yoonwhan Lee
 

What's hot (6)

11.두표본의 평균비교
11.두표본의 평균비교11.두표본의 평균비교
11.두표본의 평균비교
 
11_통계 자료분석 입문
11_통계 자료분석 입문11_통계 자료분석 입문
11_통계 자료분석 입문
 
10.단일표본 평균 모비율
10.단일표본 평균 모비율10.단일표본 평균 모비율
10.단일표본 평균 모비율
 
02.자료다루기
02.자료다루기02.자료다루기
02.자료다루기
 
07.표본분포
07.표본분포07.표본분포
07.표본분포
 
12.세표본 이상의 평균비교
12.세표본 이상의 평균비교12.세표본 이상의 평균비교
12.세표본 이상의 평균비교
 

Viewers also liked

02주차 ddl- db를 만들자
02주차 ddl- db를 만들자02주차 ddl- db를 만들자
02주차 ddl- db를 만들자
Yoonwhan Lee
 
표본들의 분포
표본들의 분포표본들의 분포
표본들의 분포
Yoonwhan Lee
 
R과 기초통계 : 02.기술통계-자료나타내기
R과 기초통계 : 02.기술통계-자료나타내기R과 기초통계 : 02.기술통계-자료나타내기
R과 기초통계 : 02.기술통계-자료나타내기
Yoonwhan Lee
 
신세계 마케팅전략 (No.1)(브랜딩제안)_뇌새김
신세계 마케팅전략 (No.1)(브랜딩제안)_뇌새김신세계 마케팅전략 (No.1)(브랜딩제안)_뇌새김
신세계 마케팅전략 (No.1)(브랜딩제안)_뇌새김승욱 유
 
R 기초 Part. 01
R 기초 Part. 01R 기초 Part. 01
R 기초 Part. 01
Yoonwhan Lee
 
R과 기초통계 : 01.자료다루기
R과 기초통계 : 01.자료다루기R과 기초통계 : 01.자료다루기
R과 기초통계 : 01.자료다루기
Yoonwhan Lee
 
R 기초 : R Basics
R 기초 : R BasicsR 기초 : R Basics
R 기초 : R Basics
Yoonwhan Lee
 
통계자료 분석을 위한 R
통계자료 분석을 위한 R통계자료 분석을 위한 R
통계자료 분석을 위한 R
Yoonwhan Lee
 
2015 Upload Campaigns Calendar - SlideShare
2015 Upload Campaigns Calendar - SlideShare2015 Upload Campaigns Calendar - SlideShare
2015 Upload Campaigns Calendar - SlideShare
SlideShare
 
What to Upload to SlideShare
What to Upload to SlideShareWhat to Upload to SlideShare
What to Upload to SlideShare
SlideShare
 
Getting Started With SlideShare
Getting Started With SlideShareGetting Started With SlideShare
Getting Started With SlideShare
SlideShare
 

Viewers also liked (11)

02주차 ddl- db를 만들자
02주차 ddl- db를 만들자02주차 ddl- db를 만들자
02주차 ddl- db를 만들자
 
표본들의 분포
표본들의 분포표본들의 분포
표본들의 분포
 
R과 기초통계 : 02.기술통계-자료나타내기
R과 기초통계 : 02.기술통계-자료나타내기R과 기초통계 : 02.기술통계-자료나타내기
R과 기초통계 : 02.기술통계-자료나타내기
 
신세계 마케팅전략 (No.1)(브랜딩제안)_뇌새김
신세계 마케팅전략 (No.1)(브랜딩제안)_뇌새김신세계 마케팅전략 (No.1)(브랜딩제안)_뇌새김
신세계 마케팅전략 (No.1)(브랜딩제안)_뇌새김
 
R 기초 Part. 01
R 기초 Part. 01R 기초 Part. 01
R 기초 Part. 01
 
R과 기초통계 : 01.자료다루기
R과 기초통계 : 01.자료다루기R과 기초통계 : 01.자료다루기
R과 기초통계 : 01.자료다루기
 
R 기초 : R Basics
R 기초 : R BasicsR 기초 : R Basics
R 기초 : R Basics
 
통계자료 분석을 위한 R
통계자료 분석을 위한 R통계자료 분석을 위한 R
통계자료 분석을 위한 R
 
2015 Upload Campaigns Calendar - SlideShare
2015 Upload Campaigns Calendar - SlideShare2015 Upload Campaigns Calendar - SlideShare
2015 Upload Campaigns Calendar - SlideShare
 
What to Upload to SlideShare
What to Upload to SlideShareWhat to Upload to SlideShare
What to Upload to SlideShare
 
Getting Started With SlideShare
Getting Started With SlideShareGetting Started With SlideShare
Getting Started With SlideShare
 

Similar to 확률변수와 분포함수

03. linear regression
03. linear regression03. linear regression
03. linear regression
Jeonghun Yoon
 
Probability with MLE, MAP
Probability with MLE, MAPProbability with MLE, MAP
Probability with MLE, MAP
Junho Lee
 
Neural network (perceptron)
Neural network (perceptron)Neural network (perceptron)
Neural network (perceptron)
Jeonghun Yoon
 
Crash Course on Graphical models
Crash Course on Graphical modelsCrash Course on Graphical models
Crash Course on Graphical models
Jong Wook Kim
 
Super resolution
Super resolutionSuper resolution
Super resolution
SEMINARGROOT
 
Ensemble Model (Hybrid model)
Ensemble Model (Hybrid model)Ensemble Model (Hybrid model)
Ensemble Model (Hybrid model)
Jeonghun Yoon
 
0228 2 sample_distribution
0228 2 sample_distribution0228 2 sample_distribution
0228 2 sample_distribution
Jeonghun Yoon
 
통계 기초 용어1
통계 기초 용어1통계 기초 용어1
통계 기초 용어1
Seong-Bok Lee
 
Deep Learning from scratch 4장 : neural network learning
Deep Learning from scratch 4장 : neural network learningDeep Learning from scratch 4장 : neural network learning
Deep Learning from scratch 4장 : neural network learning
JinSooKim80
 
0307 1 estimation_theory
0307 1 estimation_theory0307 1 estimation_theory
0307 1 estimation_theory
Jeonghun Yoon
 
Variational Auto Encoder, Generative Adversarial Model
Variational Auto Encoder, Generative Adversarial ModelVariational Auto Encoder, Generative Adversarial Model
Variational Auto Encoder, Generative Adversarial Model
SEMINARGROOT
 
0221 basic probability theory
0221 basic probability theory0221 basic probability theory
0221 basic probability theory
Jeonghun Yoon
 
Deep learning study 1
Deep learning study 1Deep learning study 1
Deep learning study 1
San Kim
 
0314 1 anova
0314 1 anova0314 1 anova
0314 1 anova
Jeonghun Yoon
 
python 수학이해하기
python 수학이해하기python 수학이해하기
python 수학이해하기
Yong Joon Moon
 
3 Generative models for discrete data
3 Generative models for discrete data3 Generative models for discrete data
3 Generative models for discrete data
Jungkyu Lee
 
정규확률분포
정규확률분포정규확률분포
정규확률분포
kidoki
 
Anomaly Detection based on Diffusion
Anomaly Detection based on DiffusionAnomaly Detection based on Diffusion
Anomaly Detection based on Diffusion
ssuserbaebf8
 
[홍대 머신러닝 스터디 - 핸즈온 머신러닝] 2장. 머신러닝 프로젝트 처음부터 끝까지
[홍대 머신러닝 스터디 - 핸즈온 머신러닝] 2장. 머신러닝 프로젝트 처음부터 끝까지[홍대 머신러닝 스터디 - 핸즈온 머신러닝] 2장. 머신러닝 프로젝트 처음부터 끝까지
[홍대 머신러닝 스터디 - 핸즈온 머신러닝] 2장. 머신러닝 프로젝트 처음부터 끝까지
Haesun Park
 

Similar to 확률변수와 분포함수 (20)

03. linear regression
03. linear regression03. linear regression
03. linear regression
 
Probability with MLE, MAP
Probability with MLE, MAPProbability with MLE, MAP
Probability with MLE, MAP
 
Neural network (perceptron)
Neural network (perceptron)Neural network (perceptron)
Neural network (perceptron)
 
Crash Course on Graphical models
Crash Course on Graphical modelsCrash Course on Graphical models
Crash Course on Graphical models
 
Super resolution
Super resolutionSuper resolution
Super resolution
 
Ensemble Model (Hybrid model)
Ensemble Model (Hybrid model)Ensemble Model (Hybrid model)
Ensemble Model (Hybrid model)
 
0228 2 sample_distribution
0228 2 sample_distribution0228 2 sample_distribution
0228 2 sample_distribution
 
통계 기초 용어1
통계 기초 용어1통계 기초 용어1
통계 기초 용어1
 
Deep Learning from scratch 4장 : neural network learning
Deep Learning from scratch 4장 : neural network learningDeep Learning from scratch 4장 : neural network learning
Deep Learning from scratch 4장 : neural network learning
 
0307 1 estimation_theory
0307 1 estimation_theory0307 1 estimation_theory
0307 1 estimation_theory
 
Variational Auto Encoder, Generative Adversarial Model
Variational Auto Encoder, Generative Adversarial ModelVariational Auto Encoder, Generative Adversarial Model
Variational Auto Encoder, Generative Adversarial Model
 
0221 basic probability theory
0221 basic probability theory0221 basic probability theory
0221 basic probability theory
 
Deep learning study 1
Deep learning study 1Deep learning study 1
Deep learning study 1
 
0314 1 anova
0314 1 anova0314 1 anova
0314 1 anova
 
Hfs ch11
Hfs ch11Hfs ch11
Hfs ch11
 
python 수학이해하기
python 수학이해하기python 수학이해하기
python 수학이해하기
 
3 Generative models for discrete data
3 Generative models for discrete data3 Generative models for discrete data
3 Generative models for discrete data
 
정규확률분포
정규확률분포정규확률분포
정규확률분포
 
Anomaly Detection based on Diffusion
Anomaly Detection based on DiffusionAnomaly Detection based on Diffusion
Anomaly Detection based on Diffusion
 
[홍대 머신러닝 스터디 - 핸즈온 머신러닝] 2장. 머신러닝 프로젝트 처음부터 끝까지
[홍대 머신러닝 스터디 - 핸즈온 머신러닝] 2장. 머신러닝 프로젝트 처음부터 끝까지[홍대 머신러닝 스터디 - 핸즈온 머신러닝] 2장. 머신러닝 프로젝트 처음부터 끝까지
[홍대 머신러닝 스터디 - 핸즈온 머신러닝] 2장. 머신러닝 프로젝트 처음부터 끝까지
 

More from Yoonwhan Lee

09.통계적가설검정
09.통계적가설검정09.통계적가설검정
09.통계적가설검정Yoonwhan Lee
 
00.통계학입문
00.통계학입문00.통계학입문
00.통계학입문Yoonwhan Lee
 
Smart work 자료 1
Smart work 자료 1Smart work 자료 1
Smart work 자료 1
Yoonwhan Lee
 
통계자료분석을 ㅇ
통계자료분석을 ㅇ통계자료분석을 ㅇ
통계자료분석을 ㅇYoonwhan Lee
 
PHP를 이용한 간단한 방명록 만들기
PHP를 이용한 간단한 방명록 만들기PHP를 이용한 간단한 방명록 만들기
PHP를 이용한 간단한 방명록 만들기
Yoonwhan Lee
 
MySQL과 PHP
MySQL과 PHPMySQL과 PHP
MySQL과 PHP
Yoonwhan Lee
 
MySQL 기초
MySQL 기초MySQL 기초
MySQL 기초
Yoonwhan Lee
 
쿠키를 통해 구현해보는 간단한 로그인 과정
쿠키를 통해 구현해보는 간단한 로그인 과정쿠키를 통해 구현해보는 간단한 로그인 과정
쿠키를 통해 구현해보는 간단한 로그인 과정
Yoonwhan Lee
 
에버노트와 드롭박스 설치
에버노트와 드롭박스 설치에버노트와 드롭박스 설치
에버노트와 드롭박스 설치
Yoonwhan Lee
 
PHP에서 객체와 데이터 연결 유지
PHP에서 객체와 데이터 연결 유지PHP에서 객체와 데이터 연결 유지
PHP에서 객체와 데이터 연결 유지
Yoonwhan Lee
 
HTML Form과 배열
HTML Form과 배열HTML Form과 배열
HTML Form과 배열
Yoonwhan Lee
 
Android 기초 앱 사용
Android 기초 앱 사용Android 기초 앱 사용
Android 기초 앱 사용
Yoonwhan Lee
 

More from Yoonwhan Lee (15)

01.r 기초
01.r 기초01.r 기초
01.r 기초
 
09.통계적가설검정
09.통계적가설검정09.통계적가설검정
09.통계적가설검정
 
00.통계학입문
00.통계학입문00.통계학입문
00.통계학입문
 
Smart work 자료 1
Smart work 자료 1Smart work 자료 1
Smart work 자료 1
 
통계자료분석을 ㅇ
통계자료분석을 ㅇ통계자료분석을 ㅇ
통계자료분석을 ㅇ
 
PHP를 이용한 간단한 방명록 만들기
PHP를 이용한 간단한 방명록 만들기PHP를 이용한 간단한 방명록 만들기
PHP를 이용한 간단한 방명록 만들기
 
Class10
Class10Class10
Class10
 
MySQL과 PHP
MySQL과 PHPMySQL과 PHP
MySQL과 PHP
 
MySQL 기초
MySQL 기초MySQL 기초
MySQL 기초
 
추정
추정추정
추정
 
쿠키를 통해 구현해보는 간단한 로그인 과정
쿠키를 통해 구현해보는 간단한 로그인 과정쿠키를 통해 구현해보는 간단한 로그인 과정
쿠키를 통해 구현해보는 간단한 로그인 과정
 
에버노트와 드롭박스 설치
에버노트와 드롭박스 설치에버노트와 드롭박스 설치
에버노트와 드롭박스 설치
 
PHP에서 객체와 데이터 연결 유지
PHP에서 객체와 데이터 연결 유지PHP에서 객체와 데이터 연결 유지
PHP에서 객체와 데이터 연결 유지
 
HTML Form과 배열
HTML Form과 배열HTML Form과 배열
HTML Form과 배열
 
Android 기초 앱 사용
Android 기초 앱 사용Android 기초 앱 사용
Android 기초 앱 사용
 

확률변수와 분포함수

  • 1. 확률 변수와 분포 R과 함께하는 기초통계
  • 2. 용어 • 확률 실험(Random Experiment) – 모집단으로부터 표본을 임의로 추출하는 과정 – 대문자 X, Y, Z 등으로 표기 – Ex) 아파트 단지내의 1000세대의 각 가정에 있는 TV 수를 조사하기 위해 가정 한곳을 임의로 선정 • 확률 변수(Random Variable) – 확률 실험의 결과 – 이 결과는 실험에 따라 다르게 나타난다. – Ex) 앞선 조사를 X라 하면 X는 0, 1, 2, 3의 값중에 하 나를 갖게 된다. 한림대학교 이윤환(http://fb.com/yoonani72)
  • 3. 예제 - 두 개의 공정한 동전을 던지는 시행 • 앞면이 나오는 횟수를 X, 즉 확률변수 – 표본공간 : S = {HH, HT, TH, TT} – 확률 변수 X의 출현 가능한 값 • X(HH) = 2 • X(HT) = X(TH) = 1 • X(TT) = 0 • 𝑃𝑥 0 = 𝑃 𝑋=0 = 𝑃 𝑇𝑇 = – X의 출현 가능한 값들이 나타날 확률 1 4 • 𝑃𝑥 1 = 𝑃 𝑋=1 = 𝑃 𝐻𝐻 , 𝑇𝐻 = 1 2 • 𝑃𝑥 2 = 𝑃 𝑋=2 = 𝑃 𝐻𝐻 = 1 4 한림대학교 이윤환(http://fb.com/yoonani72)
  • 4. 예제 - 두 개의 공정한 동전을 던지는 시행 Ω = 𝐻𝐻, 𝐻𝐻, 𝑇𝑇, 𝑇𝑇 𝐹 = { 𝐻𝐻 , 𝐻𝐻, 𝑇𝑇 , 𝑇𝑇 } 𝑃 𝑇𝑇 = , 𝑃 𝐻𝐻, 𝑇𝐻 = , 𝑃 𝐻𝐻 = 1 1 1 4 2 4 확률변수 X 𝑆 = 𝑅(실수 전체) 𝐵(𝑅) = { 0 , {1}, {2}} 𝑃𝑥 0 = , 𝑃𝑥 1 = , 𝑃𝑥 2 = 1 1 1 4 2 4 한림대학교 이윤환(http://fb.com/yoonani72)
  • 5. 이산확률 분포 • 확률변수를 통한 출현 가능한 값이 셀 수 있는 값 을 취한다. • 이산확률변수의 확률 분포 – 확률변수가 취할 수 있는 모든 가능한 값과 그 값들의 확률들을 표현한 것 • 이산확률 분포의 성질(조건) 0 ≤ 𝑃 𝑋= 𝑥 ≤1 – 확률변수 X의 각 값에 대한 확률 P(X=x)는 � 𝑝 𝑥 =1 – 모든 확률값의 합은 1 한림대학교 이윤환(http://fb.com/yoonani72)
  • 6. 예제 • 표 5.3 각 가정의 TV 수와 확률분포 보유 TV의 수 (X) P(X=x) 0 0.010 1 0.840 2 0.145 3 0.005 합계 1.000 한림대학교 이윤환(http://fb.com/yoonani72)
  • 7. 이산확률변수의 평균 • 평균은 확률변수에서 기대값(Expected Value) 이라고 한다. • 이산확률변수 X의 평균은 어떤 실험을 수많이 실 을 의미하며 𝜇 𝑋 또는 𝐸 𝑋 로 표기한다. 행할 때 평균적으로 관찰될 것으로 기대되는 값 • 출현가능한 값과 출현 가능할 확률을 곱한 것을 모두 더한다. – 확률에 평균의 개념이 들어가 있으므로 나누는 과정이 – 𝐸 𝑋 = ∑ 𝑥𝑥(𝑥) 필요없다. 한림대학교 이윤환(http://fb.com/yoonani72)
  • 8. 이산확률변수의 분산 로 얼마나 퍼져있는 지를 나타내는 것(𝜎 2 ) • 확률변수들의 출현가능한 값들이 평균을 중심으 • 계산방법은 앞선 편차 제곱으로 부터 차용 가능 – 편차 제곱 : (𝑥 𝑖 − 𝐸(𝑋))2 하다. 이들에 개별 확률값을 곱한다 : 𝑥 𝑖 − 𝐸(𝑋) 2 𝑝(𝑥) – 이 편차 제곱들이 각각 확률적으로 나타나는 것이므로 – 위의 값을 모두 더한다 : ∑ 𝑖=1 𝑥 𝑖 − 𝐸(𝑋) 2 𝑝(𝑥) 𝑛 • 간편 계산식 : ∑ 𝑖=1 𝑥 𝑖 2 𝑝 𝑥 𝑖 − 𝐸(𝑋)2 𝑛 한림대학교 이윤환(http://fb.com/yoonani72)
  • 9. R 예제 > x <- c(0, 1, 2, 3) > pr.x <- c(0.010, 0.840, 0.145, 0.005) > e.x <- sum(x*px) > e.x [1] 1.145 > var.x <- sum((x^2) * px ) – e.x^2 > var.x [1] 0.153975 한림대학교 이윤환(http://fb.com/yoonani72)
  • 10. 팩토리얼과 조합 • 교재 p.118 ~ p.120 까지 반드시 읽어볼 것!!! 한림대학교 이윤환(http://fb.com/yoonani72)
  • 11. 이항분포(Binomial Dist.) • 베르누이 시행 성공의 확률 𝑝 (0 < 𝑝 < 1) – 어떤 시행의 결과 성공과 실패로 나타난다. – – 확률 변수 X의 실현값은 성공이면 1, 실패면 0 • Bernoulli(p=0.5) = 𝑝 𝑥 (1 − 𝑝)1−𝑥 =0.5 𝑥 (1 − 0.5)1−𝑥 – Ex) 공정한 동전을 던져 앞면이 나오면 성공 • iid(Independent & Identically) – 모수(Parameter) : 분포함수의 특징을 결정 짓는 값. • 앞선 베르누이 시행에서는 확률값 p – 동일한 모수를 갖는 확률변수의 실험을 독립적으로 실 행하는 것 한림대학교 이윤환(http://fb.com/yoonani72)
  • 12. 이항분포(Binomial Dist.) • 앞선 베르누이 시행을 n번 iid로 반복한다고 하자. • 이 시행의 결과는 각 베르누이 시행의 성공의 개수를 구하는 것이 된다. • 즉, n번 수행하여 x번 성공하는 실험의 확률분포함 수를 이항분포라고 한다. • Ex) 공정한 동전을 두번 던져 앞면이 나오는 횟수 (앞면이 나오면 성공) 𝑛 – n번 던져 x번 성공하는 경우의 수 ( ) – n : 2, p = ½ 𝑥 – 성공과 실패의 확률(iid) : 0.5 𝑥 (1 − 0.5) 𝑛−𝑥 한림대학교 이윤환(http://fb.com/yoonani72)
  • 13. 이항분포(Binomial Dist.) • 확률 밀도 함수 (Probability Mass Function) – 이항분포를 따르는(시행의 횟수 n, 성공확률 p) 확률 𝑛 𝑥 – 𝐵 𝑛, 𝑝 = 𝑝 1 − 𝑝 𝑛−𝑥 , x는 성공의 횟수 변수 X는 다음의 확률밀도함수를 갖는다. 𝑥 – 일반적으로 말하는 분포함수는 𝑃(𝑋 ≤ 𝑥) 로 나타낸다. • (누적)분포함수 (Probability Function) – 즉, 확률변수의 실현값 x 이하의 확률들을 모두 더한 값이다. – 분포함수는 고유하게 정해져 있다. 한림대학교 이윤환(http://fb.com/yoonani72)
  • 14. R에서의분포함수(p.136) • 이항분포 함수 : xbinom(x, size=n, prob=p) • R분포함수의 첫글자(x)와 기능 첫 글자 기능 d 확률변수의 출현값에 대한 개별 확률(Density) p Probability function, 즉 (누적)분포함수 q Quantile(백분위수) r Random number(난수 발생) 한림대학교 이윤환(http://fb.com/yoonani72)
  • 15. 예제(p. 137) • 성공의 확률이 0.6인 어떤 실험을 3번 시행한다 고 하자. 즉, B(3, 0.6) • 이 경우 성공의 횟수 x=0, 1, 2, 3 • 성공의 횟수별 확률 구하기 > x = c(0, 1, 2, 3) > p.x = dbinom(x, size=3, prob=0.6) > p.x [1] 0.064 0.288 0.432 0.216 한림대학교 이윤환(http://fb.com/yoonani72)
  • 16. 예제(p. 137) • 성공의 횟수가 2 이하일 확률 구하기 > pbinom(2, size=3, prob=0.6) [1] 0.784 • (누적)분포 구하기 > cdf.x = pbinom(x, size=3, prob=0.6) > names(cdf.x)=c("0", "1", "2", "3") > cdf.x 0 1 2 3 0.064 0.352 0.784 1.000 한림대학교 이윤환(http://fb.com/yoonani72)
  • 17. 예제(p. 137) • 중앙값 구하기 (백분위수가 50%인 곳) > qbinom(0.5, size=3, prob=0.6) [1] 2 • B(3, 0.6)을 따르는 이항분포로부터 난수 100 개 구하기 > smp = rbinom(100, 3, 0.6) > table(smp) smp 0 1 2 3 7 34 43 16 한림대학교 이윤환(http://fb.com/yoonani72)