SlideShare a Scribd company logo
1 of 9
Download to read offline
- 1 -
2019학년도 1학기 출석수업 대체시험 (중간)
❍ 교과목명 : 데이터정보처리입문
❍ 학 번 : 201934-363698
❍ 성 명 : 이상호
❍ 연 락 처 : 010-4078-7412
l 교재 17쪽의 예제 1.1에 제시된 과정을 따라 엑셀을 활용하여 다음 그래프를 작성하시오. 필요
한 통계정보는 KOSIS에서 찾아서 활용하시오 (12점).
Ÿ 1990년부터 2017년까지의 연도별 전국 총출생성비를 시계열도표로 나타내고 전체적인 경향을 설명하
시오.
Ÿ 1990년부터 2017년까지의 연도별 서울과 부산의 총출생성비를 하나의 시계열도표에 나타내고 비교하
여 설명하시오.
Ÿ 1993년부터 2017년까지의 연도별 전국 합계출산율을 시계열도표로 나타내고 전체적인 경향을 설명하
시오.
l 교재 72쪽에 제시된 데이터 score.txt (이기재 교수 홈페이지 자료실에 업로드되어 있음)에 대해
서 R을 이용하여 다음 분석을 하시오 (12점).
Ÿ 평균, 중앙값, 표본분산, 표본표준편차, 변동계수를 구하여 분포의 특징을 설명하시오.
Ÿ 줄기-잎 그림, 히스토그램, 상자그림을 그리고 분포의 특징을 설명하시오.
l 교재 4장 연습문제 1번 (6점)
< 목 차 >
I. 엑셀 활용 ······················································································································ 2
II. R 활용 ·························································································································· 3
III. 한글 활용 ··················································································································· 7
IV. 참고문헌 ····················································································································· 7
- 2 -
I. 엑셀 활용
- 이 과제에서 연도별 전국 총 출생성비/합계출산율의 시계열 도표 및 증감률 (표 1 참조)을 이용하여
그림 1-3과 같이 나타내었다. 이때 분석 방법은 연도에 따른 선형관계를 파악하기 위해 상관 분석 및
몬테카를로 시뮬레이션을 통해 피어슨 상관계수 (Benesty et al., 2009) 및 유의수준 (Livezey and
Chen, 1983)을 엑셀에 의해 계산하였다.
1. 1990년부터 2017년까지의 연도별 전국 총 출생성비를 시계열도표로 나타내고 전체적인 경향을 설명
하시오.
- 그림 1은 해당 사례 (1990-2017년)에 대하여 연도별 전국 총 출생연비 및 증감률을 나타내었다. 이
그림에서 전국 총 출생연비는 1990년에 116.5로 역대 최고치를 기록한 뒤 2000년대 들어 2001년
109.0, 2003년 108.6, 2005년 107.8로 점차 감소하였다. 이후에는 2008년 106.4, 2009년 106.4, 2010년
106.9, 2011년 105.7, 2012년 105.7, 2013년 105.3 등 7년 연속으로 정상 성비가 유지되고 있다 (표 1
참조). 일반적으로 출생성비가 103∼107 사이면 통상적으로 정상 성비로 평가한다.
- 즉 최근 2017년까지 출생연비 분석 결과 이러한 경향은 –10.27 %로 감소하였고 상관성은 –0.92로 높
았다. 이는 남아선호사상 원인으로 판단된다. 그리고 증감률의 경우 0.93 %로 증가하였고 0.23의 낮
은 상관성을 보였다. 이와 같은 상세 분석하기 위해 다음과 같이 수도권 및 영남권의 대표 도시 (서
울 및 부산)를 선정하여 분석을 수행하였다.
a) 전국
그림 1. 연도별 전국 총 출생성비 및 증감률에 대한 시계열 도표 (흑색 점선: 총 출생성비; 적색 선: 총
출생성비에 대한 선형 회귀선; 회색 점선: 증감률; 청색 선: 증감률에 대한 선형 회귀선; 황색: 기준선).
- 3 -
2. 1990년부터 2017년까지의 연도별 서울과 부산의 총 출생성비를 하나의 시계열도표에 나타내고 비교
하여 설명하시오.
- 그림 2는 해당 사례 (1990-2017년)에 대하여 연도별 서울과 부산의 총 출생연비 및 증감률을 나타내
었다. 이 그림 2a에서 서울 총 출생연비는 1990년에 113.3으로 역대 최고치를 기록한 뒤 2000년대 들
어 2001년 107.6, 2005년 106.4, 2005년 106.6로 점차 감소하다가 2011년 104.9로 최저치를 나타냈다.
최근 5년간 (2013-2017년)에는 105-106로 유지되고 있다 (표 1 참조). 그림 2b의 경우 부산 총 출생연
비로서 서울과 동일 연도에 최고치 (118.8)와 최저치 (103.1)를 기록하였으나 최근 5년간에는 서울과
상이하게 104-107의 출생연비와 급변한 증감률을 보였다 (표 1 참조).
- 최근 2017년까지 서울의 출생연비 분석 결과 이러한 경향 및 상관성 그리고 증감률은 각각 –7.60 %,
–0.87, 0.56 %이나 부산의 경우 서울보다 모든 수치가 높았다 (출생성비 경향: –14.18 %; 상관성: –
0.89; 증감률: 0.93 %). 즉 부산은 서울에 비해 남아를 선호하지 않으며 이는 지역환경 (전통, 문화,
가치관 등)의 영향으로 판단된다 (이삼식, 2001). 이러한 결과는 부산 등 영남 지역에서 출생성비가
가장 먼저 상승하였고 그 수준도 매우 높아 전국의 총 출생성비를 상승시키는 주도적인 역할을 했다
고 사료된다 (서문희, 1995).
a) 서울
b) 부산
그림 2. 연도별 서울 (a)과 부산 (b)의 총 출산율 및 증감률에 대한 (흑색 점선: 총 출생성비; 적색 선: 총
출생성비에 대한 선형 회귀선; 회색 점선: 증감률; 청색 선: 증감률에 대한 선형 회귀선; 황색: 기준선).
- 4 -
3. 1993년부터 2017년까지의 연도별 전국 합계출산율을 시계열도표로 나타내고 전체적인 경향을 설명하
시오.
- 그림 3은 해당 사례 (1993-2017년)에 대하여 연도별 전국 총 합계출산율 및 증감률을 나타내었다. 이
그림 3에서 전국 총 출생연비는 1994년에 1.656으로 역대 최고치를 기록한 뒤 2000년대 들어 2001년
1.309, 2003년 1.191로 점차 감소하다가 2005년 1.085로 두 번째 최저치를 나타냈다. 최근 5년간
(2013-2016년)에는 1.172-1.239로 유지하다가 2017년 역대 최저치를 기록했다 (표 1 참조).
- 또한 최근 2017년까지 합계출산율 분석 결과 이러한 경향은 0.49 %로 증가하였고 상관성은 –0.81로
높았다.
a) 전국
그림 3. 연도별 전국 총 출산율 및 증감률에 대한 시계열 도표 (흑색 점선: 총 출산율; 적색 선: 총 출산율에
대한 선형 회귀선; 회색 점선: 증감률; 청색 선: 증감률에 대한 선형 회귀선; 황색: 기준선).
- 5 -
표 1. 연도별 총 출산율/출생성비 및 증감률에 대한 목록.
연도
전국 서울 부산
출산율 증감률 출생연비 증감률 출생연비 증감률 출생연비 증감률
1990 116.5 113.3 118.4
1991 112.4 -3.52 110.1 -2.82 115.9 -2.11
1992 113.6 1.07 110.9 0.73 116.8 0.78
1993 1.65 115.3 1.50 113.2 2.07 118.3 1.28
1994 1.66 0.12 115.2 -0.09 113.2 0.00 118.8 0.42
1995 1.63 -1.33 113.2 -1.74 110.8 -2.12 117.1 -1.43
1996 1.57 -3.67 111.5 -1.50 109.9 -0.81 115.2 -1.62
1997 1.54 -2.35 108.2 -2.96 106.2 -3.37 110.7 -3.91
1998 1.46 -4.75 110.1 1.76 107.8 1.51 112.5 1.63
1999 1.43 -2.66 109.5 -0.54 107.8 0.00 110.8 -1.51
2000 1.48 3.86 110.1 0.55 108.9 1.02 112.6 1.62
2001 1.31 -11.55 109.0 -1.00 107.6 -1.19 110.4 -1.95
2002 1.18 -10.01 109.9 0.83 108.6 0.93 108.0 -2.17
2003 1.19 1.10 108.6 -1.18 106.4 -2.03 109.6 1.48
2004 1.16 -2.27 108.2 -0.37 106.4 0.00 106.1 -3.19
2005 1.09 -6.79 107.8 -0.37 106.6 0.19 107.2 1.04
2006 1.13 4.33 107.6 -0.19 106.9 0.28 106.1 -1.03
2007 1.26 11.22 106.2 -1.3 106.2 -0.65 106.2 0.09
2008 1.19 -5.32 106.4 0.19 106.4 0.19 104.1 -1.98
2009 1.15 -3.61 106.4 0.00 105.3 -1.03 106.5 2.31
2010 1.23 6.70 106.9 0.47 106.6 1.23 106.8 0.28
2011 1.24 1.47 105.7 -1.12 104.9 -1.59 103.1 -3.46
2012 1.30 4.26 105.7 0.00 106.1 1.14 106.1 2.91
2013 1.19 -8.48 105.3 -0.38 105.6 -0.47 106.7 0.57
2014 1.21 1.52 105.3 0.00 105.1 -0.47 107.2 0.47
2015 1.24 2.82 105.3 0.00 104.3 -0.76 106.7 -0.47
2016 1.17 -5.41 105.0 -0.28 105.3 0.96 104.7 -1.87
2017 1.05 -10.24 106.3 1.24 105 -0.28 106.3 1.53
Note: 증감률 = ((금년 – 작년) / 작년) × 100
- 6 -
II. R 활용
1. 평균, 중앙값, 표본 분산, 표본 표준편차, 변동계수를 구하여 분포의 특징을 설명하시오.
- 해당 분포의 기술 통계량 (평균, 중앙값, 표본 분산, 표본 표준편차, 변동계수)은 표 2와 같이 각각
47.45, 28, 404.31, 20.11, 0.42이다. 이러한 분포를 설명하기 위해 다음과 같이 평균과 중앙값, 분산과
표준편차, 변동계수 순으로 분석하였다.
- 평균과 중앙값에서는 서로 상이하기 때문에 정규분포를 띠지 않으며 양의 왜도 (좌로 치우친 분포)
로 판단된다. 그리고 분산과 표준편차는 데이터의 흩어진 정도로서 작다는 것으로 확인된다. 그 밖
에 절대적인 통계량 (평균과 표준편차)을 보완하기 위한 변동계수는 0.42로서 평균에서 넓은 분포
(첨도가 낮다)를 보여준다.
표 2. 각 항목에 대한 기술 통계량.
평균 중앙값 표본 분산 표본 표준편차 변동계수
기술 통계량 47.45 28 404.31 20.11 0.42
2. 줄기-잎 그림, 빈도분포, 상자 그림을 그리고 분포의 특징을 설명하시오.
- 해당 분포를 설명하기 위해 그림 4와 같이 줄기-잎, 빈도분포, 상자 그림 순으로 시각화하였다. 줄기-
잎 및 빈도분포의 경우 앞서 기술 통계량에서도 언급한 바와 같이 정규 분포를 띠지 않고 양의 왜도
를 확인할 수 있었다. 그리고 상자 그림에서도 동일한 분포를 볼 수 있으며 극단값이 나타났다.
- 7 -
a) 줄기-잎 그림
b) 빈도분포
c) 상자 그림
그림 4. 줄기-잎 (a), 빈도분포 (b), 상자 그림 (c)에 대한 시각화.
- 8 -
III. 한글 활용
1. 다음과 같은 문서를 한글 2014를 이용하여 작성하여라.
<독립성 검정 방법에 대하여>
관측된 자료들이 어떤 특성을 갖는지에 따라 몇 개의 범주(category)로 나뉘어 분류정리되었을 때, 각
범주에 속하는 도수(frequency)로 이루어진 자료변수를 범주형 변수라고 하며, 다음과 같은 표를 2차원
분할표라고 한다.
<2차원 분할표>
변수 
    합계
변
수
A
      ∙
      ∙
 ⋯ ⋯ ⋯ ⋯  ∙
 ⋯ ⋯ ⋯ ⋯  ∙
      ∙
합계 ∙  ∙  ∙  ∙  
독립성 검정에서의 귀무가설은
 : 행과 열 변수는 서로 독립이다.
로서, 총 표본의 크기 만이 미리 결정되어 있다면 번째 반응을 나타내는 개체의 총수는
 ∙    


가 된다. 두 변수 와 가 서로 독립이라면
   (변수 의 범주는 이고 변수 의 범주는 )
  (변수 의 범주는 )  (변수 의 범주는 )
  ∙ ∙ ∙ 
로서, 귀무가설하에서의 각 칸의 기대도수는
   ∙∙  
이며, 검정통계량은 다음과 같다.

 기대도수
관측도수  기대도수
 
   
- 9 -
IV. 참고문헌
1. 서문희 (1995) “우리나라 출생성비 불균형의 지역차이에 관한 연구”, 보건사회연구, 15(2), pp. 144–
173.
2. 이상식 (2001) “남아선호 의식과 행위간 일치성에 관한 연구”, 보건사회연구, 21(2), pp. 34–60.
3. Benesty, J., Chen, J., Huang, Y., Cohen, I. (2009) “Pearson correlation coefficient”, In Noise Reduction in
Speech Processing, Springer: New York, NY, USA, 2009, pp. 1–4.
4. Livezey, R.E., Chen, W. (1983) Statistical field significance and its determination by Monte Carlo
techniques, Mon. Weather Rev., 111, pp. 46–59.

More Related Content

More from Lee Sang-Ho

20230105_[강릉원주대 대기환경과학과] 2015년 1학기 전선 지구환경융합과학 과제물.pdf
20230105_[강릉원주대 대기환경과학과] 2015년 1학기 전선 지구환경융합과학 과제물.pdf20230105_[강릉원주대 대기환경과학과] 2015년 1학기 전선 지구환경융합과학 과제물.pdf
20230105_[강릉원주대 대기환경과학과] 2015년 1학기 전선 지구환경융합과학 과제물.pdfLee Sang-Ho
 
[강릉원주대 대기환경과학과] 2015년 1학기 심교 식품과화학물질 과제물.pdf
[강릉원주대 대기환경과학과] 2015년 1학기 심교 식품과화학물질 과제물.pdf[강릉원주대 대기환경과학과] 2015년 1학기 심교 식품과화학물질 과제물.pdf
[강릉원주대 대기환경과학과] 2015년 1학기 심교 식품과화학물질 과제물.pdfLee Sang-Ho
 
[강릉원주대 대기환경과학과] 2014년 겨울학기 일교 인간과환경 과제물.pdf
[강릉원주대 대기환경과학과] 2014년 겨울학기 일교 인간과환경 과제물.pdf[강릉원주대 대기환경과학과] 2014년 겨울학기 일교 인간과환경 과제물.pdf
[강릉원주대 대기환경과학과] 2014년 겨울학기 일교 인간과환경 과제물.pdfLee Sang-Ho
 
[방송통신대 컴퓨터과학과] 2020년 1학기 교양 컴퓨터의 이해 기말평가 문제
[방송통신대 컴퓨터과학과] 2020년 1학기 교양 컴퓨터의 이해 기말평가 문제[방송통신대 컴퓨터과학과] 2020년 1학기 교양 컴퓨터의 이해 기말평가 문제
[방송통신대 컴퓨터과학과] 2020년 1학기 교양 컴퓨터의 이해 기말평가 문제Lee Sang-Ho
 
[방송통신대 컴퓨터과학과] 2020년 1학기 교양 컴퓨터의 이해 기말평가 제출본
[방송통신대 컴퓨터과학과] 2020년 1학기 교양 컴퓨터의 이해 기말평가 제출본[방송통신대 컴퓨터과학과] 2020년 1학기 교양 컴퓨터의 이해 기말평가 제출본
[방송통신대 컴퓨터과학과] 2020년 1학기 교양 컴퓨터의 이해 기말평가 제출본Lee Sang-Ho
 
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 컴퓨터 보안 기말평가 문제
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 컴퓨터 보안 기말평가 문제[방송통신대 컴퓨터과학과] 2020년 1학기 전공 컴퓨터 보안 기말평가 문제
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 컴퓨터 보안 기말평가 문제Lee Sang-Ho
 
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 컴퓨터 보안 기말평가 제출본
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 컴퓨터 보안 기말평가 제출본[방송통신대 컴퓨터과학과] 2020년 1학기 전공 컴퓨터 보안 기말평가 제출본
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 컴퓨터 보안 기말평가 제출본Lee Sang-Ho
 
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 컴퓨터 그래픽스 기말평가 문제
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 컴퓨터 그래픽스 기말평가 문제[방송통신대 컴퓨터과학과] 2020년 1학기 전공 컴퓨터 그래픽스 기말평가 문제
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 컴퓨터 그래픽스 기말평가 문제Lee Sang-Ho
 
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 컴퓨터 그래픽스 기말평가 제출본
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 컴퓨터 그래픽스 기말평가 제출본[방송통신대 컴퓨터과학과] 2020년 1학기 전공 컴퓨터 그래픽스 기말평가 제출본
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 컴퓨터 그래픽스 기말평가 제출본Lee Sang-Ho
 
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 인터넷과 정보사회 기말평가 제출본
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 인터넷과 정보사회 기말평가 제출본[방송통신대 컴퓨터과학과] 2020년 1학기 전공 인터넷과 정보사회 기말평가 제출본
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 인터넷과 정보사회 기말평가 제출본Lee Sang-Ho
 
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 인터넷과 정보사회 기말평가 문제
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 인터넷과 정보사회 기말평가 문제[방송통신대 컴퓨터과학과] 2020년 1학기 전공 인터넷과 정보사회 기말평가 문제
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 인터넷과 정보사회 기말평가 문제Lee Sang-Ho
 
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 모바일 앱 프로그래밍 기말평가 문제
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 모바일 앱 프로그래밍 기말평가 문제[방송통신대 컴퓨터과학과] 2020년 1학기 전공 모바일 앱 프로그래밍 기말평가 문제
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 모바일 앱 프로그래밍 기말평가 문제Lee Sang-Ho
 
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 모바일 앱 프로그래밍 기말평가 제출본
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 모바일 앱 프로그래밍 기말평가 제출본[방송통신대 컴퓨터과학과] 2020년 1학기 전공 모바일 앱 프로그래밍 기말평가 제출본
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 모바일 앱 프로그래밍 기말평가 제출본Lee Sang-Ho
 
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 그래픽 커뮤니케이션 기말평가 제출본
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 그래픽 커뮤니케이션 기말평가 제출본[방송통신대 컴퓨터과학과] 2020년 1학기 전공 그래픽 커뮤니케이션 기말평가 제출본
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 그래픽 커뮤니케이션 기말평가 제출본Lee Sang-Ho
 
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 그래픽 커뮤니케이션 기말평가 문제
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 그래픽 커뮤니케이션 기말평가 문제[방송통신대 컴퓨터과학과] 2020년 1학기 전공 그래픽 커뮤니케이션 기말평가 문제
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 그래픽 커뮤니케이션 기말평가 문제Lee Sang-Ho
 
[방송통신대 컴퓨터과학과] 2020년 1학기 일선 그래픽 커뮤니케이션 과제물 제출본
[방송통신대 컴퓨터과학과] 2020년 1학기 일선 그래픽 커뮤니케이션 과제물 제출본[방송통신대 컴퓨터과학과] 2020년 1학기 일선 그래픽 커뮤니케이션 과제물 제출본
[방송통신대 컴퓨터과학과] 2020년 1학기 일선 그래픽 커뮤니케이션 과제물 제출본Lee Sang-Ho
 
[방송통신대 컴퓨터과학과] 2020년 1학기 일선 그래픽 커뮤니케이션 과제물 문제
[방송통신대 컴퓨터과학과] 2020년 1학기 일선 그래픽 커뮤니케이션 과제물 문제[방송통신대 컴퓨터과학과] 2020년 1학기 일선 그래픽 커뮤니케이션 과제물 문제
[방송통신대 컴퓨터과학과] 2020년 1학기 일선 그래픽 커뮤니케이션 과제물 문제Lee Sang-Ho
 
[방송통신대 컴퓨터과학과] 2020년 1학기 교양 컴퓨터의 이해 과제물 문제
[방송통신대 컴퓨터과학과] 2020년 1학기 교양 컴퓨터의 이해 과제물 문제[방송통신대 컴퓨터과학과] 2020년 1학기 교양 컴퓨터의 이해 과제물 문제
[방송통신대 컴퓨터과학과] 2020년 1학기 교양 컴퓨터의 이해 과제물 문제Lee Sang-Ho
 
[방송통신대 컴퓨터과학과] 2020년 1학기 교양 컴퓨터의 이해 과제물 제출본
[방송통신대 컴퓨터과학과] 2020년 1학기 교양 컴퓨터의 이해 과제물 제출본[방송통신대 컴퓨터과학과] 2020년 1학기 교양 컴퓨터의 이해 과제물 제출본
[방송통신대 컴퓨터과학과] 2020년 1학기 교양 컴퓨터의 이해 과제물 제출본Lee Sang-Ho
 
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 컴퓨터 그래픽스 과제물 문제
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 컴퓨터 그래픽스 과제물 문제[방송통신대 컴퓨터과학과] 2020년 1학기 전공 컴퓨터 그래픽스 과제물 문제
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 컴퓨터 그래픽스 과제물 문제Lee Sang-Ho
 

More from Lee Sang-Ho (20)

20230105_[강릉원주대 대기환경과학과] 2015년 1학기 전선 지구환경융합과학 과제물.pdf
20230105_[강릉원주대 대기환경과학과] 2015년 1학기 전선 지구환경융합과학 과제물.pdf20230105_[강릉원주대 대기환경과학과] 2015년 1학기 전선 지구환경융합과학 과제물.pdf
20230105_[강릉원주대 대기환경과학과] 2015년 1학기 전선 지구환경융합과학 과제물.pdf
 
[강릉원주대 대기환경과학과] 2015년 1학기 심교 식품과화학물질 과제물.pdf
[강릉원주대 대기환경과학과] 2015년 1학기 심교 식품과화학물질 과제물.pdf[강릉원주대 대기환경과학과] 2015년 1학기 심교 식품과화학물질 과제물.pdf
[강릉원주대 대기환경과학과] 2015년 1학기 심교 식품과화학물질 과제물.pdf
 
[강릉원주대 대기환경과학과] 2014년 겨울학기 일교 인간과환경 과제물.pdf
[강릉원주대 대기환경과학과] 2014년 겨울학기 일교 인간과환경 과제물.pdf[강릉원주대 대기환경과학과] 2014년 겨울학기 일교 인간과환경 과제물.pdf
[강릉원주대 대기환경과학과] 2014년 겨울학기 일교 인간과환경 과제물.pdf
 
[방송통신대 컴퓨터과학과] 2020년 1학기 교양 컴퓨터의 이해 기말평가 문제
[방송통신대 컴퓨터과학과] 2020년 1학기 교양 컴퓨터의 이해 기말평가 문제[방송통신대 컴퓨터과학과] 2020년 1학기 교양 컴퓨터의 이해 기말평가 문제
[방송통신대 컴퓨터과학과] 2020년 1학기 교양 컴퓨터의 이해 기말평가 문제
 
[방송통신대 컴퓨터과학과] 2020년 1학기 교양 컴퓨터의 이해 기말평가 제출본
[방송통신대 컴퓨터과학과] 2020년 1학기 교양 컴퓨터의 이해 기말평가 제출본[방송통신대 컴퓨터과학과] 2020년 1학기 교양 컴퓨터의 이해 기말평가 제출본
[방송통신대 컴퓨터과학과] 2020년 1학기 교양 컴퓨터의 이해 기말평가 제출본
 
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 컴퓨터 보안 기말평가 문제
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 컴퓨터 보안 기말평가 문제[방송통신대 컴퓨터과학과] 2020년 1학기 전공 컴퓨터 보안 기말평가 문제
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 컴퓨터 보안 기말평가 문제
 
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 컴퓨터 보안 기말평가 제출본
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 컴퓨터 보안 기말평가 제출본[방송통신대 컴퓨터과학과] 2020년 1학기 전공 컴퓨터 보안 기말평가 제출본
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 컴퓨터 보안 기말평가 제출본
 
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 컴퓨터 그래픽스 기말평가 문제
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 컴퓨터 그래픽스 기말평가 문제[방송통신대 컴퓨터과학과] 2020년 1학기 전공 컴퓨터 그래픽스 기말평가 문제
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 컴퓨터 그래픽스 기말평가 문제
 
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 컴퓨터 그래픽스 기말평가 제출본
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 컴퓨터 그래픽스 기말평가 제출본[방송통신대 컴퓨터과학과] 2020년 1학기 전공 컴퓨터 그래픽스 기말평가 제출본
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 컴퓨터 그래픽스 기말평가 제출본
 
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 인터넷과 정보사회 기말평가 제출본
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 인터넷과 정보사회 기말평가 제출본[방송통신대 컴퓨터과학과] 2020년 1학기 전공 인터넷과 정보사회 기말평가 제출본
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 인터넷과 정보사회 기말평가 제출본
 
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 인터넷과 정보사회 기말평가 문제
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 인터넷과 정보사회 기말평가 문제[방송통신대 컴퓨터과학과] 2020년 1학기 전공 인터넷과 정보사회 기말평가 문제
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 인터넷과 정보사회 기말평가 문제
 
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 모바일 앱 프로그래밍 기말평가 문제
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 모바일 앱 프로그래밍 기말평가 문제[방송통신대 컴퓨터과학과] 2020년 1학기 전공 모바일 앱 프로그래밍 기말평가 문제
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 모바일 앱 프로그래밍 기말평가 문제
 
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 모바일 앱 프로그래밍 기말평가 제출본
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 모바일 앱 프로그래밍 기말평가 제출본[방송통신대 컴퓨터과학과] 2020년 1학기 전공 모바일 앱 프로그래밍 기말평가 제출본
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 모바일 앱 프로그래밍 기말평가 제출본
 
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 그래픽 커뮤니케이션 기말평가 제출본
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 그래픽 커뮤니케이션 기말평가 제출본[방송통신대 컴퓨터과학과] 2020년 1학기 전공 그래픽 커뮤니케이션 기말평가 제출본
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 그래픽 커뮤니케이션 기말평가 제출본
 
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 그래픽 커뮤니케이션 기말평가 문제
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 그래픽 커뮤니케이션 기말평가 문제[방송통신대 컴퓨터과학과] 2020년 1학기 전공 그래픽 커뮤니케이션 기말평가 문제
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 그래픽 커뮤니케이션 기말평가 문제
 
[방송통신대 컴퓨터과학과] 2020년 1학기 일선 그래픽 커뮤니케이션 과제물 제출본
[방송통신대 컴퓨터과학과] 2020년 1학기 일선 그래픽 커뮤니케이션 과제물 제출본[방송통신대 컴퓨터과학과] 2020년 1학기 일선 그래픽 커뮤니케이션 과제물 제출본
[방송통신대 컴퓨터과학과] 2020년 1학기 일선 그래픽 커뮤니케이션 과제물 제출본
 
[방송통신대 컴퓨터과학과] 2020년 1학기 일선 그래픽 커뮤니케이션 과제물 문제
[방송통신대 컴퓨터과학과] 2020년 1학기 일선 그래픽 커뮤니케이션 과제물 문제[방송통신대 컴퓨터과학과] 2020년 1학기 일선 그래픽 커뮤니케이션 과제물 문제
[방송통신대 컴퓨터과학과] 2020년 1학기 일선 그래픽 커뮤니케이션 과제물 문제
 
[방송통신대 컴퓨터과학과] 2020년 1학기 교양 컴퓨터의 이해 과제물 문제
[방송통신대 컴퓨터과학과] 2020년 1학기 교양 컴퓨터의 이해 과제물 문제[방송통신대 컴퓨터과학과] 2020년 1학기 교양 컴퓨터의 이해 과제물 문제
[방송통신대 컴퓨터과학과] 2020년 1학기 교양 컴퓨터의 이해 과제물 문제
 
[방송통신대 컴퓨터과학과] 2020년 1학기 교양 컴퓨터의 이해 과제물 제출본
[방송통신대 컴퓨터과학과] 2020년 1학기 교양 컴퓨터의 이해 과제물 제출본[방송통신대 컴퓨터과학과] 2020년 1학기 교양 컴퓨터의 이해 과제물 제출본
[방송통신대 컴퓨터과학과] 2020년 1학기 교양 컴퓨터의 이해 과제물 제출본
 
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 컴퓨터 그래픽스 과제물 문제
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 컴퓨터 그래픽스 과제물 문제[방송통신대 컴퓨터과학과] 2020년 1학기 전공 컴퓨터 그래픽스 과제물 문제
[방송통신대 컴퓨터과학과] 2020년 1학기 전공 컴퓨터 그래픽스 과제물 문제
 

[방송통신대 컴퓨터과학과]데이터정보처리입문 과제물 작성

  • 1. - 1 - 2019학년도 1학기 출석수업 대체시험 (중간) ❍ 교과목명 : 데이터정보처리입문 ❍ 학 번 : 201934-363698 ❍ 성 명 : 이상호 ❍ 연 락 처 : 010-4078-7412 l 교재 17쪽의 예제 1.1에 제시된 과정을 따라 엑셀을 활용하여 다음 그래프를 작성하시오. 필요 한 통계정보는 KOSIS에서 찾아서 활용하시오 (12점). Ÿ 1990년부터 2017년까지의 연도별 전국 총출생성비를 시계열도표로 나타내고 전체적인 경향을 설명하 시오. Ÿ 1990년부터 2017년까지의 연도별 서울과 부산의 총출생성비를 하나의 시계열도표에 나타내고 비교하 여 설명하시오. Ÿ 1993년부터 2017년까지의 연도별 전국 합계출산율을 시계열도표로 나타내고 전체적인 경향을 설명하 시오. l 교재 72쪽에 제시된 데이터 score.txt (이기재 교수 홈페이지 자료실에 업로드되어 있음)에 대해 서 R을 이용하여 다음 분석을 하시오 (12점). Ÿ 평균, 중앙값, 표본분산, 표본표준편차, 변동계수를 구하여 분포의 특징을 설명하시오. Ÿ 줄기-잎 그림, 히스토그램, 상자그림을 그리고 분포의 특징을 설명하시오. l 교재 4장 연습문제 1번 (6점) < 목 차 > I. 엑셀 활용 ······················································································································ 2 II. R 활용 ·························································································································· 3 III. 한글 활용 ··················································································································· 7 IV. 참고문헌 ····················································································································· 7
  • 2. - 2 - I. 엑셀 활용 - 이 과제에서 연도별 전국 총 출생성비/합계출산율의 시계열 도표 및 증감률 (표 1 참조)을 이용하여 그림 1-3과 같이 나타내었다. 이때 분석 방법은 연도에 따른 선형관계를 파악하기 위해 상관 분석 및 몬테카를로 시뮬레이션을 통해 피어슨 상관계수 (Benesty et al., 2009) 및 유의수준 (Livezey and Chen, 1983)을 엑셀에 의해 계산하였다. 1. 1990년부터 2017년까지의 연도별 전국 총 출생성비를 시계열도표로 나타내고 전체적인 경향을 설명 하시오. - 그림 1은 해당 사례 (1990-2017년)에 대하여 연도별 전국 총 출생연비 및 증감률을 나타내었다. 이 그림에서 전국 총 출생연비는 1990년에 116.5로 역대 최고치를 기록한 뒤 2000년대 들어 2001년 109.0, 2003년 108.6, 2005년 107.8로 점차 감소하였다. 이후에는 2008년 106.4, 2009년 106.4, 2010년 106.9, 2011년 105.7, 2012년 105.7, 2013년 105.3 등 7년 연속으로 정상 성비가 유지되고 있다 (표 1 참조). 일반적으로 출생성비가 103∼107 사이면 통상적으로 정상 성비로 평가한다. - 즉 최근 2017년까지 출생연비 분석 결과 이러한 경향은 –10.27 %로 감소하였고 상관성은 –0.92로 높 았다. 이는 남아선호사상 원인으로 판단된다. 그리고 증감률의 경우 0.93 %로 증가하였고 0.23의 낮 은 상관성을 보였다. 이와 같은 상세 분석하기 위해 다음과 같이 수도권 및 영남권의 대표 도시 (서 울 및 부산)를 선정하여 분석을 수행하였다. a) 전국 그림 1. 연도별 전국 총 출생성비 및 증감률에 대한 시계열 도표 (흑색 점선: 총 출생성비; 적색 선: 총 출생성비에 대한 선형 회귀선; 회색 점선: 증감률; 청색 선: 증감률에 대한 선형 회귀선; 황색: 기준선).
  • 3. - 3 - 2. 1990년부터 2017년까지의 연도별 서울과 부산의 총 출생성비를 하나의 시계열도표에 나타내고 비교 하여 설명하시오. - 그림 2는 해당 사례 (1990-2017년)에 대하여 연도별 서울과 부산의 총 출생연비 및 증감률을 나타내 었다. 이 그림 2a에서 서울 총 출생연비는 1990년에 113.3으로 역대 최고치를 기록한 뒤 2000년대 들 어 2001년 107.6, 2005년 106.4, 2005년 106.6로 점차 감소하다가 2011년 104.9로 최저치를 나타냈다. 최근 5년간 (2013-2017년)에는 105-106로 유지되고 있다 (표 1 참조). 그림 2b의 경우 부산 총 출생연 비로서 서울과 동일 연도에 최고치 (118.8)와 최저치 (103.1)를 기록하였으나 최근 5년간에는 서울과 상이하게 104-107의 출생연비와 급변한 증감률을 보였다 (표 1 참조). - 최근 2017년까지 서울의 출생연비 분석 결과 이러한 경향 및 상관성 그리고 증감률은 각각 –7.60 %, –0.87, 0.56 %이나 부산의 경우 서울보다 모든 수치가 높았다 (출생성비 경향: –14.18 %; 상관성: – 0.89; 증감률: 0.93 %). 즉 부산은 서울에 비해 남아를 선호하지 않으며 이는 지역환경 (전통, 문화, 가치관 등)의 영향으로 판단된다 (이삼식, 2001). 이러한 결과는 부산 등 영남 지역에서 출생성비가 가장 먼저 상승하였고 그 수준도 매우 높아 전국의 총 출생성비를 상승시키는 주도적인 역할을 했다 고 사료된다 (서문희, 1995). a) 서울 b) 부산 그림 2. 연도별 서울 (a)과 부산 (b)의 총 출산율 및 증감률에 대한 (흑색 점선: 총 출생성비; 적색 선: 총 출생성비에 대한 선형 회귀선; 회색 점선: 증감률; 청색 선: 증감률에 대한 선형 회귀선; 황색: 기준선).
  • 4. - 4 - 3. 1993년부터 2017년까지의 연도별 전국 합계출산율을 시계열도표로 나타내고 전체적인 경향을 설명하 시오. - 그림 3은 해당 사례 (1993-2017년)에 대하여 연도별 전국 총 합계출산율 및 증감률을 나타내었다. 이 그림 3에서 전국 총 출생연비는 1994년에 1.656으로 역대 최고치를 기록한 뒤 2000년대 들어 2001년 1.309, 2003년 1.191로 점차 감소하다가 2005년 1.085로 두 번째 최저치를 나타냈다. 최근 5년간 (2013-2016년)에는 1.172-1.239로 유지하다가 2017년 역대 최저치를 기록했다 (표 1 참조). - 또한 최근 2017년까지 합계출산율 분석 결과 이러한 경향은 0.49 %로 증가하였고 상관성은 –0.81로 높았다. a) 전국 그림 3. 연도별 전국 총 출산율 및 증감률에 대한 시계열 도표 (흑색 점선: 총 출산율; 적색 선: 총 출산율에 대한 선형 회귀선; 회색 점선: 증감률; 청색 선: 증감률에 대한 선형 회귀선; 황색: 기준선).
  • 5. - 5 - 표 1. 연도별 총 출산율/출생성비 및 증감률에 대한 목록. 연도 전국 서울 부산 출산율 증감률 출생연비 증감률 출생연비 증감률 출생연비 증감률 1990 116.5 113.3 118.4 1991 112.4 -3.52 110.1 -2.82 115.9 -2.11 1992 113.6 1.07 110.9 0.73 116.8 0.78 1993 1.65 115.3 1.50 113.2 2.07 118.3 1.28 1994 1.66 0.12 115.2 -0.09 113.2 0.00 118.8 0.42 1995 1.63 -1.33 113.2 -1.74 110.8 -2.12 117.1 -1.43 1996 1.57 -3.67 111.5 -1.50 109.9 -0.81 115.2 -1.62 1997 1.54 -2.35 108.2 -2.96 106.2 -3.37 110.7 -3.91 1998 1.46 -4.75 110.1 1.76 107.8 1.51 112.5 1.63 1999 1.43 -2.66 109.5 -0.54 107.8 0.00 110.8 -1.51 2000 1.48 3.86 110.1 0.55 108.9 1.02 112.6 1.62 2001 1.31 -11.55 109.0 -1.00 107.6 -1.19 110.4 -1.95 2002 1.18 -10.01 109.9 0.83 108.6 0.93 108.0 -2.17 2003 1.19 1.10 108.6 -1.18 106.4 -2.03 109.6 1.48 2004 1.16 -2.27 108.2 -0.37 106.4 0.00 106.1 -3.19 2005 1.09 -6.79 107.8 -0.37 106.6 0.19 107.2 1.04 2006 1.13 4.33 107.6 -0.19 106.9 0.28 106.1 -1.03 2007 1.26 11.22 106.2 -1.3 106.2 -0.65 106.2 0.09 2008 1.19 -5.32 106.4 0.19 106.4 0.19 104.1 -1.98 2009 1.15 -3.61 106.4 0.00 105.3 -1.03 106.5 2.31 2010 1.23 6.70 106.9 0.47 106.6 1.23 106.8 0.28 2011 1.24 1.47 105.7 -1.12 104.9 -1.59 103.1 -3.46 2012 1.30 4.26 105.7 0.00 106.1 1.14 106.1 2.91 2013 1.19 -8.48 105.3 -0.38 105.6 -0.47 106.7 0.57 2014 1.21 1.52 105.3 0.00 105.1 -0.47 107.2 0.47 2015 1.24 2.82 105.3 0.00 104.3 -0.76 106.7 -0.47 2016 1.17 -5.41 105.0 -0.28 105.3 0.96 104.7 -1.87 2017 1.05 -10.24 106.3 1.24 105 -0.28 106.3 1.53 Note: 증감률 = ((금년 – 작년) / 작년) × 100
  • 6. - 6 - II. R 활용 1. 평균, 중앙값, 표본 분산, 표본 표준편차, 변동계수를 구하여 분포의 특징을 설명하시오. - 해당 분포의 기술 통계량 (평균, 중앙값, 표본 분산, 표본 표준편차, 변동계수)은 표 2와 같이 각각 47.45, 28, 404.31, 20.11, 0.42이다. 이러한 분포를 설명하기 위해 다음과 같이 평균과 중앙값, 분산과 표준편차, 변동계수 순으로 분석하였다. - 평균과 중앙값에서는 서로 상이하기 때문에 정규분포를 띠지 않으며 양의 왜도 (좌로 치우친 분포) 로 판단된다. 그리고 분산과 표준편차는 데이터의 흩어진 정도로서 작다는 것으로 확인된다. 그 밖 에 절대적인 통계량 (평균과 표준편차)을 보완하기 위한 변동계수는 0.42로서 평균에서 넓은 분포 (첨도가 낮다)를 보여준다. 표 2. 각 항목에 대한 기술 통계량. 평균 중앙값 표본 분산 표본 표준편차 변동계수 기술 통계량 47.45 28 404.31 20.11 0.42 2. 줄기-잎 그림, 빈도분포, 상자 그림을 그리고 분포의 특징을 설명하시오. - 해당 분포를 설명하기 위해 그림 4와 같이 줄기-잎, 빈도분포, 상자 그림 순으로 시각화하였다. 줄기- 잎 및 빈도분포의 경우 앞서 기술 통계량에서도 언급한 바와 같이 정규 분포를 띠지 않고 양의 왜도 를 확인할 수 있었다. 그리고 상자 그림에서도 동일한 분포를 볼 수 있으며 극단값이 나타났다.
  • 7. - 7 - a) 줄기-잎 그림 b) 빈도분포 c) 상자 그림 그림 4. 줄기-잎 (a), 빈도분포 (b), 상자 그림 (c)에 대한 시각화.
  • 8. - 8 - III. 한글 활용 1. 다음과 같은 문서를 한글 2014를 이용하여 작성하여라. <독립성 검정 방법에 대하여> 관측된 자료들이 어떤 특성을 갖는지에 따라 몇 개의 범주(category)로 나뉘어 분류정리되었을 때, 각 범주에 속하는 도수(frequency)로 이루어진 자료변수를 범주형 변수라고 하며, 다음과 같은 표를 2차원 분할표라고 한다. <2차원 분할표> 변수      합계 변 수 A       ∙       ∙  ⋯ ⋯ ⋯ ⋯  ∙  ⋯ ⋯ ⋯ ⋯  ∙       ∙ 합계 ∙  ∙  ∙  ∙   독립성 검정에서의 귀무가설은  : 행과 열 변수는 서로 독립이다. 로서, 총 표본의 크기 만이 미리 결정되어 있다면 번째 반응을 나타내는 개체의 총수는  ∙       가 된다. 두 변수 와 가 서로 독립이라면    (변수 의 범주는 이고 변수 의 범주는 )   (변수 의 범주는 )  (변수 의 범주는 )   ∙ ∙ ∙  로서, 귀무가설하에서의 각 칸의 기대도수는    ∙∙   이며, 검정통계량은 다음과 같다.   기대도수 관측도수  기대도수      
  • 9. - 9 - IV. 참고문헌 1. 서문희 (1995) “우리나라 출생성비 불균형의 지역차이에 관한 연구”, 보건사회연구, 15(2), pp. 144– 173. 2. 이상식 (2001) “남아선호 의식과 행위간 일치성에 관한 연구”, 보건사회연구, 21(2), pp. 34–60. 3. Benesty, J., Chen, J., Huang, Y., Cohen, I. (2009) “Pearson correlation coefficient”, In Noise Reduction in Speech Processing, Springer: New York, NY, USA, 2009, pp. 1–4. 4. Livezey, R.E., Chen, W. (1983) Statistical field significance and its determination by Monte Carlo techniques, Mon. Weather Rev., 111, pp. 46–59.