SlideShare a Scribd company logo
1 of 8
R 기초 – 유의성검증 (I) 한림대학교 금융정보통계학과  이    윤    환
용어 정리 모집단 우리가 알고자 하는 전체 집단 예 : 15세 이상 전국민, 한림대학교 간호학과 재학생 표본 모집단으로부터 추출된 관찰 대상 예 : 15세 이상 전국민 중 매달 1일 출생한 사람, 한림대학교 간호학과 재학생 중 학번의 끝 두자리가4의 배수인 학생 추출 방법은 모집단을 잘 대표할 수 있도록 통계학의 기본원리 “표본을 공평하게 수집하면 모집단의 특성을 잘 닮는다” 평균과표준편차 모평균(μ): 모집단의 평균, 일반적으로 우리가 알고자 하는 값 모표준편차(σ) : 모집단의 표준편차 표본평균(𝑥 ) : 표본으로부터 관찰된 평균, 우리가 알 수 있는 값, 모평균 추정에 사용 표본표준편차(s) : 표본의 표준편차, 모표준편차 추정에 사용   이윤환, yoonani72@gmail.com 간호 통계
표준오차 (SE) 표준편차를 표본의 크기의 제곱근으로 나눈 값 𝜎𝑛 작게 하려면 표본의 크기를 크게 한다. 동일한 모집단에 대해 여러 번 표본을 추출할 때마다(각각 n 개의 표본 추출) 각 표본들 관측 표본평균들의 평균은 근사적으로 모집단 평균으로 가까워 지고 표본평균들의 표준편차는 표준오차에 근사적으로 가까워 진다. 모집단 평균 추정에 있어 표본평균이 얼마나 정확히 추정될 수 있는지를 나타냄 중심극한정리에 대한 교재를 다시 한번!   이윤환, yoonani72@gmail.com 간호 통계
신뢰구간 신뢰구간 분산을 알고 있는 정규분포를 따르는 모집단으로 부터 표본 추출을 여러 번 실시한다고 했을때 각 표본별로“표본평균 ± 1.96×표준오차”의 구간지정 각 표본별로 계산된 구간내에 모집단의 평균이 존재할 확률은 0.95 95% 신뢰구간 이윤환, yoonani72@gmail.com 간호 통계
Z-test 가정 모집단이 정규분포를 따르고 분산(표준편차)을 알고 있다. 검정통계량 : 𝑋 − μσ𝑛 예제 표본 : 157 153 162 160 168 163 170 158 156 170 여학생들의 키의 평균이 160 이라고 말할 수 있을까? 검정통계량 (표준편차는 5라고 알려짐) 유의수준 0.05로 했을때 키의 평균이 160이라고 할 수 있는가?   이윤환, yoonani72@gmail.com 간호 통계 > s <- c(157, 153, 162, 160, 168, 163, 170, 158, 156, 170) > mean(s) [1] 161.7 > (mean(s) - 160 ) / ( 5 / sqrt(10)) [1] 1.075174
One Sample T-test 가정 모집단은 정규분포를 따른다. 검정 통계량 𝑡𝑑𝑓= 𝑋 − μ𝑠𝑛 예제 앞선 예제를 갖고 t-test를 실시하자. t-test는 모분산을 모를 경우 사용하는데 표준오차 계산은 표본평균으로 부터 한다. 검정통계량 : t.test함수 사용   이윤환, yoonani72@gmail.com 간호 통계 > sd(s) [1] 6.019413 > t.test(s, mu=160)
One Sample T-test 이윤환, yoonani72@gmail.com 간호 통계 One Sample t-test data:  s  t = 0.8931, df = 9, p-value = 0.3951 alternative hypothesis: true mean is not equal to 160  95 percent confidence interval: 157.394     166.006 sample estimates: mean of x      161.7
t.test() 이윤환, yoonani72@gmail.com 간호 통계 t.test ( x,  y = NULL,  alternative = c("two.sided", "less", "greater"),  mu = 0,  paired = FALSE,  var.equal= FALSE,  conf.level= 0.95, ...)  분석에 사용될 자료 단측, 양측검정 여부 추정하고자 하는 모평균 Under H0 신뢰구간

More Related Content

Viewers also liked

02.자료다루기
02.자료다루기02.자료다루기
02.자료다루기Yoonwhan Lee
 
11.두표본의 평균비교
11.두표본의 평균비교11.두표본의 평균비교
11.두표본의 평균비교Yoonwhan Lee
 
14.범주형자료분석
14.범주형자료분석14.범주형자료분석
14.범주형자료분석Yoonwhan Lee
 
13.상관과 회귀
13.상관과 회귀13.상관과 회귀
13.상관과 회귀Yoonwhan Lee
 
00.통계학입문
00.통계학입문00.통계학입문
00.통계학입문Yoonwhan Lee
 
R 기초 : R Basics
R 기초 : R BasicsR 기초 : R Basics
R 기초 : R BasicsYoonwhan Lee
 
R 기초교안 (페북 api까지)
R 기초교안 (페북 api까지)R 기초교안 (페북 api까지)
R 기초교안 (페북 api까지)Mingun Jung
 
practice2
practice2practice2
practice2yosm
 
[오픈콘텐츠랩/Boc] 소셜 데이팅 특강 강의자료
[오픈콘텐츠랩/Boc] 소셜 데이팅 특강 강의자료[오픈콘텐츠랩/Boc] 소셜 데이팅 특강 강의자료
[오픈콘텐츠랩/Boc] 소셜 데이팅 특강 강의자료opencontentslab
 
2016 크라우드펀딩대회 사전설명회
2016 크라우드펀딩대회 사전설명회2016 크라우드펀딩대회 사전설명회
2016 크라우드펀딩대회 사전설명회opencontentslab
 
Google analytics
Google analyticsGoogle analytics
Google analyticsETRIBE_STG
 
R과 기초통계 : 02.기술통계-자료나타내기
R과 기초통계 : 02.기술통계-자료나타내기R과 기초통계 : 02.기술통계-자료나타내기
R과 기초통계 : 02.기술통계-자료나타내기Yoonwhan Lee
 
Google analytics in business
Google analytics in businessGoogle analytics in business
Google analytics in businessTae Young Lee
 
[오픈콘텐츠랩] 논문 "쉽게" 쓰기 전략 _ 히든:그레이스
[오픈콘텐츠랩] 논문 "쉽게" 쓰기 전략 _ 히든:그레이스[오픈콘텐츠랩] 논문 "쉽게" 쓰기 전략 _ 히든:그레이스
[오픈콘텐츠랩] 논문 "쉽게" 쓰기 전략 _ 히든:그레이스opencontentslab
 

Viewers also liked (20)

02.자료다루기
02.자료다루기02.자료다루기
02.자료다루기
 
11.두표본의 평균비교
11.두표본의 평균비교11.두표본의 평균비교
11.두표본의 평균비교
 
06.확률분포
06.확률분포06.확률분포
06.확률분포
 
14.범주형자료분석
14.범주형자료분석14.범주형자료분석
14.범주형자료분석
 
13.상관과 회귀
13.상관과 회귀13.상관과 회귀
13.상관과 회귀
 
05.확률
05.확률05.확률
05.확률
 
00.통계학입문
00.통계학입문00.통계학입문
00.통계학입문
 
R 기초 : R Basics
R 기초 : R BasicsR 기초 : R Basics
R 기초 : R Basics
 
R 기초교안 (페북 api까지)
R 기초교안 (페북 api까지)R 기초교안 (페북 api까지)
R 기초교안 (페북 api까지)
 
practice2
practice2practice2
practice2
 
R 기초 II
R 기초 IIR 기초 II
R 기초 II
 
[오픈콘텐츠랩/Boc] 소셜 데이팅 특강 강의자료
[오픈콘텐츠랩/Boc] 소셜 데이팅 특강 강의자료[오픈콘텐츠랩/Boc] 소셜 데이팅 특강 강의자료
[오픈콘텐츠랩/Boc] 소셜 데이팅 특강 강의자료
 
2016 크라우드펀딩대회 사전설명회
2016 크라우드펀딩대회 사전설명회2016 크라우드펀딩대회 사전설명회
2016 크라우드펀딩대회 사전설명회
 
01.r 기초
01.r 기초01.r 기초
01.r 기초
 
R 소개
R 소개R 소개
R 소개
 
R 기초 Part. 01
R 기초 Part. 01R 기초 Part. 01
R 기초 Part. 01
 
Google analytics
Google analyticsGoogle analytics
Google analytics
 
R과 기초통계 : 02.기술통계-자료나타내기
R과 기초통계 : 02.기술통계-자료나타내기R과 기초통계 : 02.기술통계-자료나타내기
R과 기초통계 : 02.기술통계-자료나타내기
 
Google analytics in business
Google analytics in businessGoogle analytics in business
Google analytics in business
 
[오픈콘텐츠랩] 논문 "쉽게" 쓰기 전략 _ 히든:그레이스
[오픈콘텐츠랩] 논문 "쉽게" 쓰기 전략 _ 히든:그레이스[오픈콘텐츠랩] 논문 "쉽게" 쓰기 전략 _ 히든:그레이스
[오픈콘텐츠랩] 논문 "쉽게" 쓰기 전략 _ 히든:그레이스
 

More from Yoonwhan Lee

Smart work 자료 1
Smart work 자료 1Smart work 자료 1
Smart work 자료 1Yoonwhan Lee
 
통계자료 분석을 위한 R
통계자료 분석을 위한 R통계자료 분석을 위한 R
통계자료 분석을 위한 RYoonwhan Lee
 
통계자료분석을 ㅇ
통계자료분석을 ㅇ통계자료분석을 ㅇ
통계자료분석을 ㅇYoonwhan Lee
 
PHP를 이용한 간단한 방명록 만들기
PHP를 이용한 간단한 방명록 만들기PHP를 이용한 간단한 방명록 만들기
PHP를 이용한 간단한 방명록 만들기Yoonwhan Lee
 
쿠키를 통해 구현해보는 간단한 로그인 과정
쿠키를 통해 구현해보는 간단한 로그인 과정쿠키를 통해 구현해보는 간단한 로그인 과정
쿠키를 통해 구현해보는 간단한 로그인 과정Yoonwhan Lee
 
에버노트와 드롭박스 설치
에버노트와 드롭박스 설치에버노트와 드롭박스 설치
에버노트와 드롭박스 설치Yoonwhan Lee
 
PHP에서 객체와 데이터 연결 유지
PHP에서 객체와 데이터 연결 유지PHP에서 객체와 데이터 연결 유지
PHP에서 객체와 데이터 연결 유지Yoonwhan Lee
 
표본들의 분포
표본들의 분포표본들의 분포
표본들의 분포Yoonwhan Lee
 
HTML Form과 배열
HTML Form과 배열HTML Form과 배열
HTML Form과 배열Yoonwhan Lee
 
Android 기초 앱 사용
Android 기초 앱 사용Android 기초 앱 사용
Android 기초 앱 사용Yoonwhan Lee
 
확률변수와 분포함수
확률변수와 분포함수확률변수와 분포함수
확률변수와 분포함수Yoonwhan Lee
 

More from Yoonwhan Lee (15)

Smart work 자료 1
Smart work 자료 1Smart work 자료 1
Smart work 자료 1
 
통계자료 분석을 위한 R
통계자료 분석을 위한 R통계자료 분석을 위한 R
통계자료 분석을 위한 R
 
통계자료분석을 ㅇ
통계자료분석을 ㅇ통계자료분석을 ㅇ
통계자료분석을 ㅇ
 
PHP를 이용한 간단한 방명록 만들기
PHP를 이용한 간단한 방명록 만들기PHP를 이용한 간단한 방명록 만들기
PHP를 이용한 간단한 방명록 만들기
 
Class10
Class10Class10
Class10
 
MySQL과 PHP
MySQL과 PHPMySQL과 PHP
MySQL과 PHP
 
MySQL 기초
MySQL 기초MySQL 기초
MySQL 기초
 
추정
추정추정
추정
 
쿠키를 통해 구현해보는 간단한 로그인 과정
쿠키를 통해 구현해보는 간단한 로그인 과정쿠키를 통해 구현해보는 간단한 로그인 과정
쿠키를 통해 구현해보는 간단한 로그인 과정
 
에버노트와 드롭박스 설치
에버노트와 드롭박스 설치에버노트와 드롭박스 설치
에버노트와 드롭박스 설치
 
PHP에서 객체와 데이터 연결 유지
PHP에서 객체와 데이터 연결 유지PHP에서 객체와 데이터 연결 유지
PHP에서 객체와 데이터 연결 유지
 
표본들의 분포
표본들의 분포표본들의 분포
표본들의 분포
 
HTML Form과 배열
HTML Form과 배열HTML Form과 배열
HTML Form과 배열
 
Android 기초 앱 사용
Android 기초 앱 사용Android 기초 앱 사용
Android 기초 앱 사용
 
확률변수와 분포함수
확률변수와 분포함수확률변수와 분포함수
확률변수와 분포함수
 

04.r 기초 유의성 검증

  • 1. R 기초 – 유의성검증 (I) 한림대학교 금융정보통계학과 이 윤 환
  • 2. 용어 정리 모집단 우리가 알고자 하는 전체 집단 예 : 15세 이상 전국민, 한림대학교 간호학과 재학생 표본 모집단으로부터 추출된 관찰 대상 예 : 15세 이상 전국민 중 매달 1일 출생한 사람, 한림대학교 간호학과 재학생 중 학번의 끝 두자리가4의 배수인 학생 추출 방법은 모집단을 잘 대표할 수 있도록 통계학의 기본원리 “표본을 공평하게 수집하면 모집단의 특성을 잘 닮는다” 평균과표준편차 모평균(μ): 모집단의 평균, 일반적으로 우리가 알고자 하는 값 모표준편차(σ) : 모집단의 표준편차 표본평균(𝑥 ) : 표본으로부터 관찰된 평균, 우리가 알 수 있는 값, 모평균 추정에 사용 표본표준편차(s) : 표본의 표준편차, 모표준편차 추정에 사용   이윤환, yoonani72@gmail.com 간호 통계
  • 3. 표준오차 (SE) 표준편차를 표본의 크기의 제곱근으로 나눈 값 𝜎𝑛 작게 하려면 표본의 크기를 크게 한다. 동일한 모집단에 대해 여러 번 표본을 추출할 때마다(각각 n 개의 표본 추출) 각 표본들 관측 표본평균들의 평균은 근사적으로 모집단 평균으로 가까워 지고 표본평균들의 표준편차는 표준오차에 근사적으로 가까워 진다. 모집단 평균 추정에 있어 표본평균이 얼마나 정확히 추정될 수 있는지를 나타냄 중심극한정리에 대한 교재를 다시 한번!   이윤환, yoonani72@gmail.com 간호 통계
  • 4. 신뢰구간 신뢰구간 분산을 알고 있는 정규분포를 따르는 모집단으로 부터 표본 추출을 여러 번 실시한다고 했을때 각 표본별로“표본평균 ± 1.96×표준오차”의 구간지정 각 표본별로 계산된 구간내에 모집단의 평균이 존재할 확률은 0.95 95% 신뢰구간 이윤환, yoonani72@gmail.com 간호 통계
  • 5. Z-test 가정 모집단이 정규분포를 따르고 분산(표준편차)을 알고 있다. 검정통계량 : 𝑋 − μσ𝑛 예제 표본 : 157 153 162 160 168 163 170 158 156 170 여학생들의 키의 평균이 160 이라고 말할 수 있을까? 검정통계량 (표준편차는 5라고 알려짐) 유의수준 0.05로 했을때 키의 평균이 160이라고 할 수 있는가?   이윤환, yoonani72@gmail.com 간호 통계 > s <- c(157, 153, 162, 160, 168, 163, 170, 158, 156, 170) > mean(s) [1] 161.7 > (mean(s) - 160 ) / ( 5 / sqrt(10)) [1] 1.075174
  • 6. One Sample T-test 가정 모집단은 정규분포를 따른다. 검정 통계량 𝑡𝑑𝑓= 𝑋 − μ𝑠𝑛 예제 앞선 예제를 갖고 t-test를 실시하자. t-test는 모분산을 모를 경우 사용하는데 표준오차 계산은 표본평균으로 부터 한다. 검정통계량 : t.test함수 사용   이윤환, yoonani72@gmail.com 간호 통계 > sd(s) [1] 6.019413 > t.test(s, mu=160)
  • 7. One Sample T-test 이윤환, yoonani72@gmail.com 간호 통계 One Sample t-test data: s t = 0.8931, df = 9, p-value = 0.3951 alternative hypothesis: true mean is not equal to 160 95 percent confidence interval: 157.394 166.006 sample estimates: mean of x 161.7
  • 8. t.test() 이윤환, yoonani72@gmail.com 간호 통계 t.test ( x, y = NULL, alternative = c("two.sided", "less", "greater"), mu = 0, paired = FALSE, var.equal= FALSE, conf.level= 0.95, ...) 분석에 사용될 자료 단측, 양측검정 여부 추정하고자 하는 모평균 Under H0 신뢰구간