SlideShare a Scribd company logo
1 of 18
Download to read offline
통계에서의 자료
용어
• 모집단
– 관심있는 연구대상 전체 집합

• 표본
– 모집단을 닮은 모집단의 부분집합

• 모수
– 모집단의 특성을 나타내는 측도, 상수이며 일반적으로
미지

• 통계량
– 표본의 특성을 나타내는 측도
이윤환 (yoonani72@gmail.com)
측정
• 개체
– 관찰 대상

• 요인
– 개체에 관한 특성 중 연구자가 관심을 갖는 특성

• 변수
– 요인의 특성을 수치화하기 위해 쓰이는 속성

• 데이터
– 변수를 측정해서 수치화하는 것

• 측정
– 개체의 특성, 요인을 수치화하는 것
이윤환 (yoonani72@gmail.com)
연구 대상
흡연산모의 신생아

요인
흡연산모의 영향

변수

척도

신생아 몸무게

g(비율 척도)

자료
둘리 = 2940
도우너 = 4020
또치 = 2740
…
이윤환 (yoonani72@gmail.com)
통계 유형
• 기술통계 (Descriptive Statistics)
– 자료 수집 및 정리
– 자료 형태 표현
– 자료의 특성값 도출 등

• 추측통계 (Inferential Statistics)
– 표본으로부터 관찰하고자 하는 특성값 도출
• 표본은 모집단을 잘 대표하여야 한다.

– 이를 바탕으로 모집단의 특성 파악

이윤환 (yoonani72@gmail.com)
자료 입력
• 다음의 자료를 어떻게 입력하시겠습니까?
남학생 50명의 체중
72

74

73

76

66

86

70

71

77

71

70

72

71

72

70

72

79

74

70

74

72

77

78

72

69

68

76

67

69

73

72

73

66

67

72

68

68

67

71

67

69

75

70

68

73

70

68

69

70

71

기초통계학-R을 이용한 통계분석, 노맹석 외, 자유아카데미, 2011, p17

이윤환 (yoonani72@gmail.com)
자료 입력
• 속성, 특성 혹은 변수
– 관측하고자 하는 특성값의 집합
– Excel 같은 응용 프로그램에서는 한 개의 행 혹은 한 개의 열에
입력한다.

이윤환 (yoonani72@gmail.com)
자료 입력 - R
• c() 함수 이용
– 괄호(“(“)를 열고 닫지 않으면 Prompt가 “>”에서
“+”로 바뀐다.

이윤환 (yoonani72@gmail.com)
자료 입력 - R
• scan() 함수 이용
– 저장할 이름 = scan() 입력후 개별 값들을 공백(Space)으로 구
별하여 입력한다.
– 끝까지 입력후 엔터를 누르고 다시 한번 눌러 끝낸다.

이윤환 (yoonani72@gmail.com)
자료 입력 - R
• 외부 파일 가져오기 : csv 파일

이윤환 (yoonani72@gmail.com)
자료 입력 - R

이윤환 (yoonani72@gmail.com)
자료 입력 - R
• CSV(Comma Seperated Value) 파일
– 열의 구분은 Comma(,)
– 행의 구분은 줄 바꿈(Enter)

이윤환 (yoonani72@gmail.com)
자료 입력 - R
• read.csv() 함수 이용
– ?read.csv : read.csv에 대한 도움말 보기

이윤환 (yoonani72@gmail.com)
자료 수정 - R
• data.entry() 이용
– data.entry(자료이름)
– 수정할 자료를 찾아
수정후 “x”를 눌러 닫
는다.

이윤환 (yoonani72@gmail.com)
자료의 형태
• 측정
–
–
–
–
–
–

키→
안경을 착용한 사람의 수 →
학점 →
성별 →
우리 반의 전체 인원수 중 남성의 비율 →
자료에 포함된 정보의 양을 결정하는 것

이윤환 (yoonani72@gmail.com)
자료의 형태
어떤 것이 있을까요?

연속형자료
양적자료
이산형자료

자료
순위형자료
질적자료
명목형자료

이윤환 (yoonani72@gmail.com)
자료의 형태 - R
• Excel 에서 마우스 오른쪽을 클릭하여 “셀 서식”
을 열어보신 적이 있나요?

이윤환 (yoonani72@gmail.com)
자료의 형태 - R
• R 자료형은 간단합니다.
– 수치형 : 정수와 실수 모두 입력
• Ex) x = 3; y= 3.14

– 문자형 : 큰 따옴표를 이용하여 입력
• Ex) name = “yoonani”

– 논리형 : 정해진 상수 TRUE(축약형 T), FALSE(F) 입력
• Ex) isFemale = FALSE; isFemalie = F

– 복소수형 : “실수부 + 허수부i” 형태 입력
• Ex) cmplx = 2 + 3i

이윤환 (yoonani72@gmail.com)

More Related Content

What's hot

12.세표본 이상의 평균비교
12.세표본 이상의 평균비교12.세표본 이상의 평균비교
12.세표본 이상의 평균비교Yoonwhan Lee
 
14.범주형자료분석
14.범주형자료분석14.범주형자료분석
14.범주형자료분석Yoonwhan Lee
 
10.단일표본 평균 모비율
10.단일표본 평균 모비율10.단일표본 평균 모비율
10.단일표본 평균 모비율Yoonwhan Lee
 
Week5 data vis(2)
Week5 data vis(2)Week5 data vis(2)
Week5 data vis(2)Eun Yu
 
확률변수와 분포함수
확률변수와 분포함수확률변수와 분포함수
확률변수와 분포함수Yoonwhan Lee
 
11.두표본의 평균비교
11.두표본의 평균비교11.두표본의 평균비교
11.두표본의 평균비교Yoonwhan Lee
 

What's hot (8)

12.세표본 이상의 평균비교
12.세표본 이상의 평균비교12.세표본 이상의 평균비교
12.세표본 이상의 평균비교
 
14.범주형자료분석
14.범주형자료분석14.범주형자료분석
14.범주형자료분석
 
122
122122
122
 
06.확률분포
06.확률분포06.확률분포
06.확률분포
 
10.단일표본 평균 모비율
10.단일표본 평균 모비율10.단일표본 평균 모비율
10.단일표본 평균 모비율
 
Week5 data vis(2)
Week5 data vis(2)Week5 data vis(2)
Week5 data vis(2)
 
확률변수와 분포함수
확률변수와 분포함수확률변수와 분포함수
확률변수와 분포함수
 
11.두표본의 평균비교
11.두표본의 평균비교11.두표본의 평균비교
11.두표본의 평균비교
 

Viewers also liked

00.통계학입문
00.통계학입문00.통계학입문
00.통계학입문Yoonwhan Lee
 
09.통계적가설검정
09.통계적가설검정09.통계적가설검정
09.통계적가설검정Yoonwhan Lee
 
R과 기초통계 : 02.기술통계-자료나타내기
R과 기초통계 : 02.기술통계-자료나타내기R과 기초통계 : 02.기술통계-자료나타내기
R과 기초통계 : 02.기술통계-자료나타내기Yoonwhan Lee
 
R 기초 : R Basics
R 기초 : R BasicsR 기초 : R Basics
R 기초 : R BasicsYoonwhan Lee
 
통계자료 분석을 위한 R
통계자료 분석을 위한 R통계자료 분석을 위한 R
통계자료 분석을 위한 RYoonwhan Lee
 
브루노 무나리, 디자인과 시각 커뮤니케이션 1414287 오은경
브루노 무나리, 디자인과 시각 커뮤니케이션 1414287 오은경브루노 무나리, 디자인과 시각 커뮤니케이션 1414287 오은경
브루노 무나리, 디자인과 시각 커뮤니케이션 1414287 오은경o_eg2
 
practice2
practice2practice2
practice2yosm
 
R 기초교안 (페북 api까지)
R 기초교안 (페북 api까지)R 기초교안 (페북 api까지)
R 기초교안 (페북 api까지)Mingun Jung
 
[오픈콘텐츠랩/Boc] 소셜 데이팅 특강 강의자료
[오픈콘텐츠랩/Boc] 소셜 데이팅 특강 강의자료[오픈콘텐츠랩/Boc] 소셜 데이팅 특강 강의자료
[오픈콘텐츠랩/Boc] 소셜 데이팅 특강 강의자료opencontentslab
 
2016 크라우드펀딩대회 사전설명회
2016 크라우드펀딩대회 사전설명회2016 크라우드펀딩대회 사전설명회
2016 크라우드펀딩대회 사전설명회opencontentslab
 
Google analytics
Google analyticsGoogle analytics
Google analyticsETRIBE_STG
 
[week11] R_ggmap, leaflet
[week11] R_ggmap, leaflet[week11] R_ggmap, leaflet
[week11] R_ggmap, leafletneuroassociates
 

Viewers also liked (17)

05.확률
05.확률05.확률
05.확률
 
00.통계학입문
00.통계학입문00.통계학입문
00.통계학입문
 
09.통계적가설검정
09.통계적가설검정09.통계적가설검정
09.통계적가설검정
 
R과 기초통계 : 02.기술통계-자료나타내기
R과 기초통계 : 02.기술통계-자료나타내기R과 기초통계 : 02.기술통계-자료나타내기
R과 기초통계 : 02.기술통계-자료나타내기
 
R 기초 Part. 01
R 기초 Part. 01R 기초 Part. 01
R 기초 Part. 01
 
R 기초 : R Basics
R 기초 : R BasicsR 기초 : R Basics
R 기초 : R Basics
 
통계자료 분석을 위한 R
통계자료 분석을 위한 R통계자료 분석을 위한 R
통계자료 분석을 위한 R
 
브루노 무나리, 디자인과 시각 커뮤니케이션 1414287 오은경
브루노 무나리, 디자인과 시각 커뮤니케이션 1414287 오은경브루노 무나리, 디자인과 시각 커뮤니케이션 1414287 오은경
브루노 무나리, 디자인과 시각 커뮤니케이션 1414287 오은경
 
practice2
practice2practice2
practice2
 
R 기초교안 (페북 api까지)
R 기초교안 (페북 api까지)R 기초교안 (페북 api까지)
R 기초교안 (페북 api까지)
 
R 기초 II
R 기초 IIR 기초 II
R 기초 II
 
[오픈콘텐츠랩/Boc] 소셜 데이팅 특강 강의자료
[오픈콘텐츠랩/Boc] 소셜 데이팅 특강 강의자료[오픈콘텐츠랩/Boc] 소셜 데이팅 특강 강의자료
[오픈콘텐츠랩/Boc] 소셜 데이팅 특강 강의자료
 
2016 크라우드펀딩대회 사전설명회
2016 크라우드펀딩대회 사전설명회2016 크라우드펀딩대회 사전설명회
2016 크라우드펀딩대회 사전설명회
 
01.r 기초
01.r 기초01.r 기초
01.r 기초
 
R 소개
R 소개R 소개
R 소개
 
Google analytics
Google analyticsGoogle analytics
Google analytics
 
[week11] R_ggmap, leaflet
[week11] R_ggmap, leaflet[week11] R_ggmap, leaflet
[week11] R_ggmap, leaflet
 

Similar to 02.자료다루기

제자리통계 0913
제자리통계 0913제자리통계 0913
제자리통계 0913Yunhwan Kwon
 
★강의교재_데이터 분석을 위한 통계와 확률_v2.pptx
★강의교재_데이터 분석을 위한 통계와 확률_v2.pptx★강의교재_데이터 분석을 위한 통계와 확률_v2.pptx
★강의교재_데이터 분석을 위한 통계와 확률_v2.pptxDonghwan Lee
 
3장 데이터 수집, 정제에서 분석까지
3장 데이터 수집, 정제에서 분석까지3장 데이터 수집, 정제에서 분석까지
3장 데이터 수집, 정제에서 분석까지Hyochan PARK
 
인포그래픽스 데이터분석과 저널리즘 3장 데이터수집,정제에서 분석까지
인포그래픽스 데이터분석과 저널리즘 3장 데이터수집,정제에서 분석까지인포그래픽스 데이터분석과 저널리즘 3장 데이터수집,정제에서 분석까지
인포그래픽스 데이터분석과 저널리즘 3장 데이터수집,정제에서 분석까지Han Woo PARK
 
[Ankus Open Source Conference 2013] 빅데이터 분석을 위한 통계 이해와 해석
[Ankus Open Source Conference 2013] 빅데이터 분석을 위한 통계 이해와 해석[Ankus Open Source Conference 2013] 빅데이터 분석을 위한 통계 이해와 해석
[Ankus Open Source Conference 2013] 빅데이터 분석을 위한 통계 이해와 해석SuHyun Jeon
 

Similar to 02.자료다루기 (6)

제자리통계 0913
제자리통계 0913제자리통계 0913
제자리통계 0913
 
★강의교재_데이터 분석을 위한 통계와 확률_v2.pptx
★강의교재_데이터 분석을 위한 통계와 확률_v2.pptx★강의교재_데이터 분석을 위한 통계와 확률_v2.pptx
★강의교재_데이터 분석을 위한 통계와 확률_v2.pptx
 
3장 데이터 수집, 정제에서 분석까지
3장 데이터 수집, 정제에서 분석까지3장 데이터 수집, 정제에서 분석까지
3장 데이터 수집, 정제에서 분석까지
 
인포그래픽스 데이터분석과 저널리즘 3장 데이터수집,정제에서 분석까지
인포그래픽스 데이터분석과 저널리즘 3장 데이터수집,정제에서 분석까지인포그래픽스 데이터분석과 저널리즘 3장 데이터수집,정제에서 분석까지
인포그래픽스 데이터분석과 저널리즘 3장 데이터수집,정제에서 분석까지
 
[Ankus Open Source Conference 2013] 빅데이터 분석을 위한 통계 이해와 해석
[Ankus Open Source Conference 2013] 빅데이터 분석을 위한 통계 이해와 해석[Ankus Open Source Conference 2013] 빅데이터 분석을 위한 통계 이해와 해석
[Ankus Open Source Conference 2013] 빅데이터 분석을 위한 통계 이해와 해석
 
Mahout
MahoutMahout
Mahout
 

More from Yoonwhan Lee

Smart work 자료 1
Smart work 자료 1Smart work 자료 1
Smart work 자료 1Yoonwhan Lee
 
통계자료분석을 ㅇ
통계자료분석을 ㅇ통계자료분석을 ㅇ
통계자료분석을 ㅇYoonwhan Lee
 
PHP를 이용한 간단한 방명록 만들기
PHP를 이용한 간단한 방명록 만들기PHP를 이용한 간단한 방명록 만들기
PHP를 이용한 간단한 방명록 만들기Yoonwhan Lee
 
쿠키를 통해 구현해보는 간단한 로그인 과정
쿠키를 통해 구현해보는 간단한 로그인 과정쿠키를 통해 구현해보는 간단한 로그인 과정
쿠키를 통해 구현해보는 간단한 로그인 과정Yoonwhan Lee
 
에버노트와 드롭박스 설치
에버노트와 드롭박스 설치에버노트와 드롭박스 설치
에버노트와 드롭박스 설치Yoonwhan Lee
 
PHP에서 객체와 데이터 연결 유지
PHP에서 객체와 데이터 연결 유지PHP에서 객체와 데이터 연결 유지
PHP에서 객체와 데이터 연결 유지Yoonwhan Lee
 
표본들의 분포
표본들의 분포표본들의 분포
표본들의 분포Yoonwhan Lee
 
HTML Form과 배열
HTML Form과 배열HTML Form과 배열
HTML Form과 배열Yoonwhan Lee
 
Android 기초 앱 사용
Android 기초 앱 사용Android 기초 앱 사용
Android 기초 앱 사용Yoonwhan Lee
 
기초 확률 관련
기초 확률 관련기초 확률 관련
기초 확률 관련Yoonwhan Lee
 

More from Yoonwhan Lee (14)

Smart work 자료 1
Smart work 자료 1Smart work 자료 1
Smart work 자료 1
 
통계자료분석을 ㅇ
통계자료분석을 ㅇ통계자료분석을 ㅇ
통계자료분석을 ㅇ
 
PHP를 이용한 간단한 방명록 만들기
PHP를 이용한 간단한 방명록 만들기PHP를 이용한 간단한 방명록 만들기
PHP를 이용한 간단한 방명록 만들기
 
Class10
Class10Class10
Class10
 
MySQL과 PHP
MySQL과 PHPMySQL과 PHP
MySQL과 PHP
 
MySQL 기초
MySQL 기초MySQL 기초
MySQL 기초
 
추정
추정추정
추정
 
쿠키를 통해 구현해보는 간단한 로그인 과정
쿠키를 통해 구현해보는 간단한 로그인 과정쿠키를 통해 구현해보는 간단한 로그인 과정
쿠키를 통해 구현해보는 간단한 로그인 과정
 
에버노트와 드롭박스 설치
에버노트와 드롭박스 설치에버노트와 드롭박스 설치
에버노트와 드롭박스 설치
 
PHP에서 객체와 데이터 연결 유지
PHP에서 객체와 데이터 연결 유지PHP에서 객체와 데이터 연결 유지
PHP에서 객체와 데이터 연결 유지
 
표본들의 분포
표본들의 분포표본들의 분포
표본들의 분포
 
HTML Form과 배열
HTML Form과 배열HTML Form과 배열
HTML Form과 배열
 
Android 기초 앱 사용
Android 기초 앱 사용Android 기초 앱 사용
Android 기초 앱 사용
 
기초 확률 관련
기초 확률 관련기초 확률 관련
기초 확률 관련
 

02.자료다루기

  • 2. 용어 • 모집단 – 관심있는 연구대상 전체 집합 • 표본 – 모집단을 닮은 모집단의 부분집합 • 모수 – 모집단의 특성을 나타내는 측도, 상수이며 일반적으로 미지 • 통계량 – 표본의 특성을 나타내는 측도 이윤환 (yoonani72@gmail.com)
  • 3. 측정 • 개체 – 관찰 대상 • 요인 – 개체에 관한 특성 중 연구자가 관심을 갖는 특성 • 변수 – 요인의 특성을 수치화하기 위해 쓰이는 속성 • 데이터 – 변수를 측정해서 수치화하는 것 • 측정 – 개체의 특성, 요인을 수치화하는 것 이윤환 (yoonani72@gmail.com)
  • 4. 연구 대상 흡연산모의 신생아 요인 흡연산모의 영향 변수 척도 신생아 몸무게 g(비율 척도) 자료 둘리 = 2940 도우너 = 4020 또치 = 2740 … 이윤환 (yoonani72@gmail.com)
  • 5. 통계 유형 • 기술통계 (Descriptive Statistics) – 자료 수집 및 정리 – 자료 형태 표현 – 자료의 특성값 도출 등 • 추측통계 (Inferential Statistics) – 표본으로부터 관찰하고자 하는 특성값 도출 • 표본은 모집단을 잘 대표하여야 한다. – 이를 바탕으로 모집단의 특성 파악 이윤환 (yoonani72@gmail.com)
  • 6. 자료 입력 • 다음의 자료를 어떻게 입력하시겠습니까? 남학생 50명의 체중 72 74 73 76 66 86 70 71 77 71 70 72 71 72 70 72 79 74 70 74 72 77 78 72 69 68 76 67 69 73 72 73 66 67 72 68 68 67 71 67 69 75 70 68 73 70 68 69 70 71 기초통계학-R을 이용한 통계분석, 노맹석 외, 자유아카데미, 2011, p17 이윤환 (yoonani72@gmail.com)
  • 7. 자료 입력 • 속성, 특성 혹은 변수 – 관측하고자 하는 특성값의 집합 – Excel 같은 응용 프로그램에서는 한 개의 행 혹은 한 개의 열에 입력한다. 이윤환 (yoonani72@gmail.com)
  • 8. 자료 입력 - R • c() 함수 이용 – 괄호(“(“)를 열고 닫지 않으면 Prompt가 “>”에서 “+”로 바뀐다. 이윤환 (yoonani72@gmail.com)
  • 9. 자료 입력 - R • scan() 함수 이용 – 저장할 이름 = scan() 입력후 개별 값들을 공백(Space)으로 구 별하여 입력한다. – 끝까지 입력후 엔터를 누르고 다시 한번 눌러 끝낸다. 이윤환 (yoonani72@gmail.com)
  • 10. 자료 입력 - R • 외부 파일 가져오기 : csv 파일 이윤환 (yoonani72@gmail.com)
  • 11. 자료 입력 - R 이윤환 (yoonani72@gmail.com)
  • 12. 자료 입력 - R • CSV(Comma Seperated Value) 파일 – 열의 구분은 Comma(,) – 행의 구분은 줄 바꿈(Enter) 이윤환 (yoonani72@gmail.com)
  • 13. 자료 입력 - R • read.csv() 함수 이용 – ?read.csv : read.csv에 대한 도움말 보기 이윤환 (yoonani72@gmail.com)
  • 14. 자료 수정 - R • data.entry() 이용 – data.entry(자료이름) – 수정할 자료를 찾아 수정후 “x”를 눌러 닫 는다. 이윤환 (yoonani72@gmail.com)
  • 15. 자료의 형태 • 측정 – – – – – – 키→ 안경을 착용한 사람의 수 → 학점 → 성별 → 우리 반의 전체 인원수 중 남성의 비율 → 자료에 포함된 정보의 양을 결정하는 것 이윤환 (yoonani72@gmail.com)
  • 16. 자료의 형태 어떤 것이 있을까요? 연속형자료 양적자료 이산형자료 자료 순위형자료 질적자료 명목형자료 이윤환 (yoonani72@gmail.com)
  • 17. 자료의 형태 - R • Excel 에서 마우스 오른쪽을 클릭하여 “셀 서식” 을 열어보신 적이 있나요? 이윤환 (yoonani72@gmail.com)
  • 18. 자료의 형태 - R • R 자료형은 간단합니다. – 수치형 : 정수와 실수 모두 입력 • Ex) x = 3; y= 3.14 – 문자형 : 큰 따옴표를 이용하여 입력 • Ex) name = “yoonani” – 논리형 : 정해진 상수 TRUE(축약형 T), FALSE(F) 입력 • Ex) isFemale = FALSE; isFemalie = F – 복소수형 : “실수부 + 허수부i” 형태 입력 • Ex) cmplx = 2 + 3i 이윤환 (yoonani72@gmail.com)