SlideShare a Scribd company logo
1 of 5
Download to read offline
Backpain 분석



         20106151 이준석
         20106171 최현섭
         20106114 김정훈
서론


  Backpain이란, 말 그대로 등 쪽에 통증이 생기는 현상으로, 배부만이 아닌 경,
견, 견갑, 요부의 통증도 포함하는 경우가 많다. 각 부위의 뼈, 관절, 건초, 근육 ,
신경의 병변에 의한 것 외에 흉부, 복부 장기의 변화에 의한 관련통인 경우도 있
다.
  이 자료에서는, backpain과 운전 여부의 관련성에 관해 알아보기 위해 backpain
을 앓고 있는 실험군과 그렇지 않은 대조군을 설정하여 조사하였다. 첫 번째는
운전을 하느냐 안 하느냐에 따른 조사, 두 번째는 교외에 사느냐 안 사느냐에 따
른 조사이다.




소스코드 분석

이 실험은 Backpain에 걸린 Case group과 걸리지 않은 Control group을 쌍으로
설정하여 (총 217쌍) 그들의 운전 여부(driver)와 suburban(교외) 거주 여부를
알아본 것이다.


실험의 목표는 운전 여부 혹은 교외 거주 여부가 Backpain에 걸릴 확률에 영향을
주는지 알아보는 것이다.


1. Driver 여부에 따른 발병률 차이 (backpain에 걸리지 않은 사람들 중 driver의
비율과 backpain에 걸린 사람들 중 driver의 비율 비교)

>xtabs(~status+driver, data=backpain)
driver
status no yes
case 32 185
control 54 163


이 자료가 과연 결롞에 타당성이 있는지 여부를 알아내기 위해 유의성 검증을 할
필요가 있다. Table 형태의 자료에선 일반적으로 chisq.test를 많이 사용한다.
>chisq.test(xtabs(~status+driver, data=backpain))
Pearson's Chi-squared test with Yates' continuity correction
data: xtabs(~status + driver, data = backpain)
X-squared = 6.3951, df = 1, p-value = 0.01144


보통 chisq.test에서 p-value가 0.05 이하이면 자료가 유의하다고 생각할 수
있는데 여기서 p-value가 0.01144로 0.05보다 작기 때문에 자료가 유의하다는
결롞을 내릴 수 있다.


2. Suburban 여부에 따른 발병률 차이

>xtabs(~status+suburban, data=backpain)
suburban
status no yes
case 90 127
control 110 107


앞의 driver 경우와 동일하게 이 결과 분석이 유의성이 있는지 검증하기 위해
chisq.test를 사용한다.

>chisq.test(xtabs(~status+suburban, data=backpain))
Pearson's Chi-squared test with Yates' continuity correction
data: xtabs(~status + suburban, data = backpain)
X-squared = 3.3477, df = 1, p-value = 0.0673



보통 chisq.test에서 p-value가 0.05 이하이면 자료가 유의하다고 생각할 수
있는데 여기서 p-value가 0.0673로 0.05보다 크기 때문에 자료가 유의하지
않다는 결롞을 내릴 수 있다.


3. Conditional Logit 모델 분석

> backpain_glm<-clogit(I(status == "case") ~ driver + suburban + strata(ID), data = backpain)



Case에 해당하는 사람들을 추출하여 driver과 suburban을 변수로 근거하여 분석
> summary(backpain_glm)
Call:
coxph(formula = Surv(rep(1, 434L), I(status == "case")) ~ driver +
suburban + strata(ID), data = backpain, method = "exact")
n= 434, number of events= 217
coef exp(coef) se(coef) z Pr(>|z|)
driveryes 0.6579 1.9307 0.2940 2.238 0.0252 *
suburbanyes 0.2555 1.2911 0.2258 1.131 0.2580
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
exp(coef) exp(-coef) lower .95 upper .95
driveryes 1.931 0.5180 1.0851 3.435
suburbanyes 1.291 0.7746 0.8293 2.010
Rsquare= 0.022 (max possible= 0.5 )
Likelihood ratio test= 9.55 on 2 df, p=0.008457
Wald test = 8.85 on 2 df, p=0.01195
Score (logrank) test = 9.31 on 2 df, p=0.0095


여기서 두 변수갂의 상관의 정도를 나타내는 coef 값을 비교해보면
driveryes(운전하는 사람들 & Backpain 발병)에 해당하는 coef 수치가 전반적으로
suburbanyes(교외에 사는 사람들 & Backpain 발병)의 coef 수치보다 높다. 즉,
사는 장소와 backpain 발병 사이의 관계보다 운전 여부와의 관계가 더 크게
영향을 끼친다는 것을 알 수 있다.
또한 자료의 유의성 검증에 사용되는 Pr(>|z|)값을 비교해보면 운전하는 것과 병
사이에는 value 값이 0.0252로 기준치인 0.05보다 작으므로 자료가 유의한 반면,
거주하는 곳과 병 사이의 value 값은 0.2580으로 0.05보다 크기 때문에 유의하지
않다는 것을 알 수 있다. 즉, 결과에 대한 신뢰도가 상대적으로 떨어짂다는
뜻으로 해석할 수 있다.


4. 그래프를 통한 분석

>mosaicplot(~driver+status, data=backpain)
>mosaicplot(~suburban+status, data=backpain)


Mosaicplot은 해당 조건에 속하는 도수의 크기를 직사각형 전체 넓이(전체
도수의 크기) 중 일부에 나타냄으로써(이때 도수의 크기와 직사각형의 넓이는
비례한다) 크기를 비교할 수 있도록 한 모양의 Plot을 말한다.


두 mozaicplot들을 비교해보면 왼쪽 mozaicplot의 case & driver no의 직사각형
밑부분의 높이와 case & driver yes의 직사각형 밑부분의 높이 차가 오른쪽
mozaicplot의 case & suburban no의 밑부분과 case & suburban yes의 밑부분의
높이 차보다 크다는 것을 알 수 있다. 이를 통해 driver과 status 갂의 상관관계가
suburban과 status 갂의 관계보다 상대적으로 유의하다는 것을 알 수 있다.




결론


     이 실험은 backpain과 driver 여부, suburban 여부 사이의 상관관계에 대
해 조사한 것이다. 조사한 통계자료를 분석하기 위하여 카이제곱테스트와
conditional logit모델 분석을 하여 p-value값과 coef 값을 구해보았다.
     그 결과 backpain은 driver 여부와는 통계적으로 유의미한 상관관계를 보
였으나 suburban 여부와는 통계적으로 무의미한 것으로 나타났다. 이를 통해 유
추해 보면 운전할 때 일정한 자세로 장시갂 동안 있어야 하는데 이러한 자세가
허리에 무리를 주는 것으로 추측할 수 있다.
     즉 운전여부는 backpain의 발생에 영향을 주는 요인이라고 할 수 있다.

More Related Content

Viewers also liked

Viewers also liked (7)

Final presentation gorski, christina
Final presentation gorski, christinaFinal presentation gorski, christina
Final presentation gorski, christina
 
Dogs!
Dogs!Dogs!
Dogs!
 
Maternal physiology in pregnancy
Maternal physiology in pregnancyMaternal physiology in pregnancy
Maternal physiology in pregnancy
 
Dogs!
Dogs!Dogs!
Dogs!
 
Storing data in windows server 2012 ss
Storing data in windows server 2012 ssStoring data in windows server 2012 ss
Storing data in windows server 2012 ss
 
Strategy Digby Mgt667 001
Strategy Digby Mgt667 001Strategy Digby Mgt667 001
Strategy Digby Mgt667 001
 
Aplicación del Enfoque Ambiental
Aplicación del Enfoque AmbientalAplicación del Enfoque Ambiental
Aplicación del Enfoque Ambiental
 

Backpain+분석

  • 1. Backpain 분석 20106151 이준석 20106171 최현섭 20106114 김정훈
  • 2. 서론 Backpain이란, 말 그대로 등 쪽에 통증이 생기는 현상으로, 배부만이 아닌 경, 견, 견갑, 요부의 통증도 포함하는 경우가 많다. 각 부위의 뼈, 관절, 건초, 근육 , 신경의 병변에 의한 것 외에 흉부, 복부 장기의 변화에 의한 관련통인 경우도 있 다. 이 자료에서는, backpain과 운전 여부의 관련성에 관해 알아보기 위해 backpain 을 앓고 있는 실험군과 그렇지 않은 대조군을 설정하여 조사하였다. 첫 번째는 운전을 하느냐 안 하느냐에 따른 조사, 두 번째는 교외에 사느냐 안 사느냐에 따 른 조사이다. 소스코드 분석 이 실험은 Backpain에 걸린 Case group과 걸리지 않은 Control group을 쌍으로 설정하여 (총 217쌍) 그들의 운전 여부(driver)와 suburban(교외) 거주 여부를 알아본 것이다. 실험의 목표는 운전 여부 혹은 교외 거주 여부가 Backpain에 걸릴 확률에 영향을 주는지 알아보는 것이다. 1. Driver 여부에 따른 발병률 차이 (backpain에 걸리지 않은 사람들 중 driver의 비율과 backpain에 걸린 사람들 중 driver의 비율 비교) >xtabs(~status+driver, data=backpain) driver status no yes case 32 185 control 54 163 이 자료가 과연 결롞에 타당성이 있는지 여부를 알아내기 위해 유의성 검증을 할 필요가 있다. Table 형태의 자료에선 일반적으로 chisq.test를 많이 사용한다.
  • 3. >chisq.test(xtabs(~status+driver, data=backpain)) Pearson's Chi-squared test with Yates' continuity correction data: xtabs(~status + driver, data = backpain) X-squared = 6.3951, df = 1, p-value = 0.01144 보통 chisq.test에서 p-value가 0.05 이하이면 자료가 유의하다고 생각할 수 있는데 여기서 p-value가 0.01144로 0.05보다 작기 때문에 자료가 유의하다는 결롞을 내릴 수 있다. 2. Suburban 여부에 따른 발병률 차이 >xtabs(~status+suburban, data=backpain) suburban status no yes case 90 127 control 110 107 앞의 driver 경우와 동일하게 이 결과 분석이 유의성이 있는지 검증하기 위해 chisq.test를 사용한다. >chisq.test(xtabs(~status+suburban, data=backpain)) Pearson's Chi-squared test with Yates' continuity correction data: xtabs(~status + suburban, data = backpain) X-squared = 3.3477, df = 1, p-value = 0.0673 보통 chisq.test에서 p-value가 0.05 이하이면 자료가 유의하다고 생각할 수 있는데 여기서 p-value가 0.0673로 0.05보다 크기 때문에 자료가 유의하지 않다는 결롞을 내릴 수 있다. 3. Conditional Logit 모델 분석 > backpain_glm<-clogit(I(status == "case") ~ driver + suburban + strata(ID), data = backpain) Case에 해당하는 사람들을 추출하여 driver과 suburban을 변수로 근거하여 분석
  • 4. > summary(backpain_glm) Call: coxph(formula = Surv(rep(1, 434L), I(status == "case")) ~ driver + suburban + strata(ID), data = backpain, method = "exact") n= 434, number of events= 217 coef exp(coef) se(coef) z Pr(>|z|) driveryes 0.6579 1.9307 0.2940 2.238 0.0252 * suburbanyes 0.2555 1.2911 0.2258 1.131 0.2580 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 exp(coef) exp(-coef) lower .95 upper .95 driveryes 1.931 0.5180 1.0851 3.435 suburbanyes 1.291 0.7746 0.8293 2.010 Rsquare= 0.022 (max possible= 0.5 ) Likelihood ratio test= 9.55 on 2 df, p=0.008457 Wald test = 8.85 on 2 df, p=0.01195 Score (logrank) test = 9.31 on 2 df, p=0.0095 여기서 두 변수갂의 상관의 정도를 나타내는 coef 값을 비교해보면 driveryes(운전하는 사람들 & Backpain 발병)에 해당하는 coef 수치가 전반적으로 suburbanyes(교외에 사는 사람들 & Backpain 발병)의 coef 수치보다 높다. 즉, 사는 장소와 backpain 발병 사이의 관계보다 운전 여부와의 관계가 더 크게 영향을 끼친다는 것을 알 수 있다. 또한 자료의 유의성 검증에 사용되는 Pr(>|z|)값을 비교해보면 운전하는 것과 병 사이에는 value 값이 0.0252로 기준치인 0.05보다 작으므로 자료가 유의한 반면, 거주하는 곳과 병 사이의 value 값은 0.2580으로 0.05보다 크기 때문에 유의하지 않다는 것을 알 수 있다. 즉, 결과에 대한 신뢰도가 상대적으로 떨어짂다는 뜻으로 해석할 수 있다. 4. 그래프를 통한 분석 >mosaicplot(~driver+status, data=backpain) >mosaicplot(~suburban+status, data=backpain) Mosaicplot은 해당 조건에 속하는 도수의 크기를 직사각형 전체 넓이(전체 도수의 크기) 중 일부에 나타냄으로써(이때 도수의 크기와 직사각형의 넓이는
  • 5. 비례한다) 크기를 비교할 수 있도록 한 모양의 Plot을 말한다. 두 mozaicplot들을 비교해보면 왼쪽 mozaicplot의 case & driver no의 직사각형 밑부분의 높이와 case & driver yes의 직사각형 밑부분의 높이 차가 오른쪽 mozaicplot의 case & suburban no의 밑부분과 case & suburban yes의 밑부분의 높이 차보다 크다는 것을 알 수 있다. 이를 통해 driver과 status 갂의 상관관계가 suburban과 status 갂의 관계보다 상대적으로 유의하다는 것을 알 수 있다. 결론 이 실험은 backpain과 driver 여부, suburban 여부 사이의 상관관계에 대 해 조사한 것이다. 조사한 통계자료를 분석하기 위하여 카이제곱테스트와 conditional logit모델 분석을 하여 p-value값과 coef 값을 구해보았다. 그 결과 backpain은 driver 여부와는 통계적으로 유의미한 상관관계를 보 였으나 suburban 여부와는 통계적으로 무의미한 것으로 나타났다. 이를 통해 유 추해 보면 운전할 때 일정한 자세로 장시갂 동안 있어야 하는데 이러한 자세가 허리에 무리를 주는 것으로 추측할 수 있다. 즉 운전여부는 backpain의 발생에 영향을 주는 요인이라고 할 수 있다.