SlideShare a Scribd company logo
정규 확률 분포
           박기덕
목차

● 연속데이터

● 확률밀도함수

● 정규분포

● 정규확률 계산하기
 ○ 분포와 범위를 확보
 ○ 표준화
 ○ 확률테이블에서 확률 찾기
연속데이터

● 이산(Discrete) 데이터의 경우 서로 구별되는
  수치적 값들로 구성되고, 정확한 값만을 포함
  한다.

● 연속(Continuous) 데이터의 경우 어떤 값도
  포함할 수 있는 범위로 이루어진 값을 의미한
  다.

● 즉, 이산데이터는 정확하게 세어지는 (Counted)값 이며,
  연속데이터의 경우 측정되는(Measured)값 으로 볼 수 있
  다.
확률밀도함수

● 확률밀도함수 f(x)는 일정한 값들의 범위를 포
  괄하는 연속변수의 확률을 찾는데 사용하는
  함수
  f(x)




                     확률 = 면적
         f(x)
                     연속데이터에서의 확률을
                     구하기 위해서는 확률밀
     0      20   x
                     도 함수의 면적을 구함
정규분포

● 정규분포는 이상적인 형태로 실생활에서 길
  이나 높이를 재는 것처럼 연속되어 있는 데이
  터를 다룰 때 '정상적으로' 기대할 수 있는 분
  포를 말한다.




X ~ N(μ, σ²)
정규확률 계산하기


1. 분포와 범위를 확보

2. 1번을 표준화

3. 확률테이블에서 확률 찾기
분포와 범위를 확보

● 변수 x는 정규분포를 따르고, 평균값 71과 분
  산 20.25를 가질 때 X ~ N (71, 20.25)
N (0, 1)로 표준화

● 확률테이블은 N(0, 1)에 대한 확률만을 제공
  하므로 전단계에서 구한 정규분포를 표준화
  한다.




                Z = X - μ (표준점수)
                      σ
표준화한 정규분포의 Z값 찾기




 z=x-μ   = 64 - 71   = -1.56
    σ     4.5
확률테이블에서 확률 찾기

● 확률테이블에서 확률값은 P (Z < z) 값을의미

● 즉, 위에서 구한 -1.56의 확률값을 찾은 후 전
  체 확률 1에서 해당 확률을 빼주면 P (Z >
  -1.56)의 값을 구할 수 있다.

● P (Z > -1.56) = 1 - P(Z < -1.56)
                = 1 - 0.0594
                = 0.9406

More Related Content

Similar to 정규확률분포

데이터처리와 통계 기본 머신러닝
데이터처리와 통계 기본 머신러닝데이터처리와 통계 기본 머신러닝
데이터처리와 통계 기본 머신러닝
Sunggon Song
 
07. PCA
07. PCA07. PCA
07. PCA
Jeonghun Yoon
 
11_통계 자료분석 입문
11_통계 자료분석 입문11_통계 자료분석 입문
11_통계 자료분석 입문noerror
 
확률변수와 분포함수
확률변수와 분포함수확률변수와 분포함수
확률변수와 분포함수
Yoonwhan Lee
 
2.linear regression and logistic regression
2.linear regression and logistic regression2.linear regression and logistic regression
2.linear regression and logistic regression
Haesun Park
 

Similar to 정규확률분포 (6)

06.확률분포
06.확률분포06.확률분포
06.확률분포
 
데이터처리와 통계 기본 머신러닝
데이터처리와 통계 기본 머신러닝데이터처리와 통계 기본 머신러닝
데이터처리와 통계 기본 머신러닝
 
07. PCA
07. PCA07. PCA
07. PCA
 
11_통계 자료분석 입문
11_통계 자료분석 입문11_통계 자료분석 입문
11_통계 자료분석 입문
 
확률변수와 분포함수
확률변수와 분포함수확률변수와 분포함수
확률변수와 분포함수
 
2.linear regression and logistic regression
2.linear regression and logistic regression2.linear regression and logistic regression
2.linear regression and logistic regression
 

More from kidoki

Hadoop io
Hadoop ioHadoop io
Hadoop io
kidoki
 
Chapter 14. json
Chapter 14. jsonChapter 14. json
Chapter 14. json
kidoki
 
전문 검색 기술
전문 검색 기술전문 검색 기술
전문 검색 기술
kidoki
 
Http 헤더
Http 헤더Http 헤더
Http 헤더
kidoki
 
로그 수집, 집약
로그 수집, 집약로그 수집, 집약
로그 수집, 집약kidoki
 
14. no sql을 넘어
14. no sql을 넘어14. no sql을 넘어
14. no sql을 넘어kidoki
 
My sql 장애복구
My sql 장애복구My sql 장애복구
My sql 장애복구kidoki
 
9장. 문서 데이터베이스
9장. 문서 데이터베이스9장. 문서 데이터베이스
9장. 문서 데이터베이스kidoki
 
[NoSQL] 2장. 집합적 데이터 모델
[NoSQL] 2장. 집합적 데이터 모델[NoSQL] 2장. 집합적 데이터 모델
[NoSQL] 2장. 집합적 데이터 모델kidoki
 
Code chapter15
Code chapter15Code chapter15
Code chapter15
kidoki
 
Code chapter5
Code chapter5Code chapter5
Code chapter5
kidoki
 
Ch18. 빅리그 거물에서 선지자로
Ch18. 빅리그 거물에서 선지자로Ch18. 빅리그 거물에서 선지자로
Ch18. 빅리그 거물에서 선지자로kidoki
 
Ch.11 승진
Ch.11 승진Ch.11 승진
Ch.11 승진kidoki
 
Ch7. 소프트웨어 r&d 조직
Ch7. 소프트웨어 r&d 조직Ch7. 소프트웨어 r&d 조직
Ch7. 소프트웨어 r&d 조직kidoki
 
Ch2. 좋은 소프트웨어란
Ch2. 좋은 소프트웨어란Ch2. 좋은 소프트웨어란
Ch2. 좋은 소프트웨어란kidoki
 
11장. 분석 패턴의 적용
11장. 분석 패턴의 적용11장. 분석 패턴의 적용
11장. 분석 패턴의 적용
kidoki
 
2장. 의사소통과 언어 사용
2장. 의사소통과 언어 사용2장. 의사소통과 언어 사용
2장. 의사소통과 언어 사용
kidoki
 
11장 시스템
11장 시스템11장 시스템
11장 시스템
kidoki
 
10장 클래스
10장 클래스10장 클래스
10장 클래스
kidoki
 
클러스터링을 통한 패턴 추출
클러스터링을 통한 패턴 추출클러스터링을 통한 패턴 추출
클러스터링을 통한 패턴 추출kidoki
 

More from kidoki (20)

Hadoop io
Hadoop ioHadoop io
Hadoop io
 
Chapter 14. json
Chapter 14. jsonChapter 14. json
Chapter 14. json
 
전문 검색 기술
전문 검색 기술전문 검색 기술
전문 검색 기술
 
Http 헤더
Http 헤더Http 헤더
Http 헤더
 
로그 수집, 집약
로그 수집, 집약로그 수집, 집약
로그 수집, 집약
 
14. no sql을 넘어
14. no sql을 넘어14. no sql을 넘어
14. no sql을 넘어
 
My sql 장애복구
My sql 장애복구My sql 장애복구
My sql 장애복구
 
9장. 문서 데이터베이스
9장. 문서 데이터베이스9장. 문서 데이터베이스
9장. 문서 데이터베이스
 
[NoSQL] 2장. 집합적 데이터 모델
[NoSQL] 2장. 집합적 데이터 모델[NoSQL] 2장. 집합적 데이터 모델
[NoSQL] 2장. 집합적 데이터 모델
 
Code chapter15
Code chapter15Code chapter15
Code chapter15
 
Code chapter5
Code chapter5Code chapter5
Code chapter5
 
Ch18. 빅리그 거물에서 선지자로
Ch18. 빅리그 거물에서 선지자로Ch18. 빅리그 거물에서 선지자로
Ch18. 빅리그 거물에서 선지자로
 
Ch.11 승진
Ch.11 승진Ch.11 승진
Ch.11 승진
 
Ch7. 소프트웨어 r&d 조직
Ch7. 소프트웨어 r&d 조직Ch7. 소프트웨어 r&d 조직
Ch7. 소프트웨어 r&d 조직
 
Ch2. 좋은 소프트웨어란
Ch2. 좋은 소프트웨어란Ch2. 좋은 소프트웨어란
Ch2. 좋은 소프트웨어란
 
11장. 분석 패턴의 적용
11장. 분석 패턴의 적용11장. 분석 패턴의 적용
11장. 분석 패턴의 적용
 
2장. 의사소통과 언어 사용
2장. 의사소통과 언어 사용2장. 의사소통과 언어 사용
2장. 의사소통과 언어 사용
 
11장 시스템
11장 시스템11장 시스템
11장 시스템
 
10장 클래스
10장 클래스10장 클래스
10장 클래스
 
클러스터링을 통한 패턴 추출
클러스터링을 통한 패턴 추출클러스터링을 통한 패턴 추출
클러스터링을 통한 패턴 추출
 

정규확률분포

  • 2. 목차 ● 연속데이터 ● 확률밀도함수 ● 정규분포 ● 정규확률 계산하기 ○ 분포와 범위를 확보 ○ 표준화 ○ 확률테이블에서 확률 찾기
  • 3. 연속데이터 ● 이산(Discrete) 데이터의 경우 서로 구별되는 수치적 값들로 구성되고, 정확한 값만을 포함 한다. ● 연속(Continuous) 데이터의 경우 어떤 값도 포함할 수 있는 범위로 이루어진 값을 의미한 다. ● 즉, 이산데이터는 정확하게 세어지는 (Counted)값 이며, 연속데이터의 경우 측정되는(Measured)값 으로 볼 수 있 다.
  • 4. 확률밀도함수 ● 확률밀도함수 f(x)는 일정한 값들의 범위를 포 괄하는 연속변수의 확률을 찾는데 사용하는 함수 f(x) 확률 = 면적 f(x) 연속데이터에서의 확률을 구하기 위해서는 확률밀 0 20 x 도 함수의 면적을 구함
  • 5. 정규분포 ● 정규분포는 이상적인 형태로 실생활에서 길 이나 높이를 재는 것처럼 연속되어 있는 데이 터를 다룰 때 '정상적으로' 기대할 수 있는 분 포를 말한다. X ~ N(μ, σ²)
  • 6. 정규확률 계산하기 1. 분포와 범위를 확보 2. 1번을 표준화 3. 확률테이블에서 확률 찾기
  • 7. 분포와 범위를 확보 ● 변수 x는 정규분포를 따르고, 평균값 71과 분 산 20.25를 가질 때 X ~ N (71, 20.25)
  • 8. N (0, 1)로 표준화 ● 확률테이블은 N(0, 1)에 대한 확률만을 제공 하므로 전단계에서 구한 정규분포를 표준화 한다. Z = X - μ (표준점수) σ
  • 9. 표준화한 정규분포의 Z값 찾기 z=x-μ = 64 - 71 = -1.56 σ 4.5
  • 10. 확률테이블에서 확률 찾기 ● 확률테이블에서 확률값은 P (Z < z) 값을의미 ● 즉, 위에서 구한 -1.56의 확률값을 찾은 후 전 체 확률 1에서 해당 확률을 빼주면 P (Z > -1.56)의 값을 구할 수 있다. ● P (Z > -1.56) = 1 - P(Z < -1.56) = 1 - 0.0594 = 0.9406