SlideShare a Scribd company logo
1 of 8
논쟁의 심리와 통계학의 가설검정
Jinseob Kim
Preventive Medicine Program, Graduate School of Public Health, Seoul National
University, Seoul, Korea
Abstract
논쟁 시 자신의 의견을 말하고 다른 사람의 의견을 반박하는 논리와 기저에 깔린 심리는 통계
학의 가설검정의 원리와 매우 비슷하다. 다른 사람의 주장을 매우 단순화시켜서 그것을 반박하는
것은 귀무가설을 명확히 설정해야 그것을 반박하기 쉬운 가설검정의 특징과 유사하고, 자신의 주
장을 쉽게 말하지 않으며 애매모호하게 주장하는 것은, 귀무가설을 명확하지 않게 하여 이를 검
정하기 어렵게 하려는 것과 일맥상통한다. 논쟁 주제와 상관없는 상대방에 대한 매도, 인신공격은
가설검정 시 유의수준을 낮추는 효과와 밀접한 관련이 있으며, 반대로 자기 자신을 믿을 만한 사
람, 이득을 줄 사람으로 포장하는 것은 유의수준이 올라가는 것으로 설명할 수 있다. 한편, 통계
학의 가설검정에는 그것을 만들거나 그것을 이용하는 사람의 심리가 반영되어 있다. 정규성 검정
은 가급적 정규분포라는 생각을 버리지 않겠다는 의지가 담긴 통계적 검정 방법이며, 독립 2표본
t-test의 등분산성 검정은 가급적이면 등분산이라는 주장을 바꾸지 않아 편리하게 가설검정을 하
겠다는 마음이 담겨 있는 통계방법이다. 이와 같이 논쟁의 방법과 통계학의 가설검정은 밀접한
관련이 있는 것을 알 수 있으며, 논쟁 시 통계학의 가설검정의 원리를 잘 활용하는 것이 원하는
주장을 하는데 도움이 될 것이며, 이에 대한 지식을 갖고 있는 것이 소모적인 논쟁을 막는데 도
움을 줄 것이다. 또한 연구자가 자료를 통계학적 방법으로 해석할 때 해당 가설 검정에 숨겨진
심리를 잘 파악하는 것이 올바른 결론을 도출하는 데 도움이 될 것이다.
1. 서론
바야흐로 논쟁의 시대이다. 인간이 탄생했을 때부터 논쟁이 없었던 기간은 없었겠지만, 전제 왕
정시대부터 민주화시대로 거쳐오면서 논쟁에 참여하거나 논쟁을 바라보는 것이 매우 흔한 일이
되었으며 20세기 말부터 급속도로 발달한 방송매체, 컴퓨터 기술, 인터넷 커뮤니티 그리고 최근에
는 Social Network Service 까지… 이제 우리는 격렬한 논쟁이 이루어지는 현장을 심심치 않게 발
견할 수 있고 또한 스스로 논쟁에 참여하기도 한다. 수많은 TV토론회에서 한 주제를 두고 찬성쪽
과 반대쪽 토론자들간의 치열한 공방이 일어나고, 주요 포탈사이트나 커뮤니티에선 댓글이 수백
개를 넘는 경우를 심심치 않게 볼 수 있다.
논쟁의 핵심사안 또는 목적은 합리적인 의사결정이다. 합리적이라는 의미가 여려가지가 있을 수
있는데, 필자는 여기서 합리적이라는 단어를 경제학의 “합리”의 단어로 설명해 보려 한다. 즉, 논
쟁의 목적을 내 뜻에 맞는, 나에게 이득이 되는 의사결정이라고 생각해 보겠다. 실상 많은 논쟁이
주어진 상황에서 어떻게든 나에게 유리한 결과를 얻기 위해 이루어진다. 대표적인 것이 피고인에
대한 변호인데, 피고인이 어떤 죄를 지었던 간에 변호사는 피고인에게 유리한 결과를 만들기 위
해 논쟁을 하며, 철학자 쇼펜하우어는 주제를 막론하고 논쟁에서 승리하기 위한 방법을 소개한 <
논쟁에서 이기는 38가지 방법>[1] 이라는 글을 쓰기도 하였다.
한편, 정보화 시대, 데이터의 시대라고도 불리는 21세기에 합리적인 의사결정과 뗄래야 뗄 수 없
는 관계를 가진 학문이 통계학이다. 물리학, 생물학, 의학 등의 자연과학뿐만 아니라 경제학, 심리
학 등의 사회과학에서도 통계학은 어떤 주장을 하기 위해 필수적인 도구로 이용되고 있는데 여기
서 쓰이는 핵심적인 개념은 “가설 검정”이다. R.A Fisher[2]에 의해 처음으로 사용된 귀무가설(null
hypothesis)의 개념은 지금까지도 대부분의 연구에서 가설검정의 핵심 방법이며, 사회과학에서도
널리 이용되고 있는데 그 핵심 논리는 반박하고 싶은 가설을 귀무가설로 설정하고 귀무가설 하에
서 일어날 확률이 매우 적은 사건 또는 현상을 제시함으로서 자신의 주장을 펼치는 방법이다. 이
는 수학의 증명법 중 결론을 부정한 후 모순을 찾아내는 귀류법과 유사한 측면이 있기도 하다.
이런 통계학의 가설검정방법은 크게 두 가지 특성이 있다. 첫째로는 무엇인가 명확한 가설이 주
어진 후에야 이를 반박함으로서 자신의 의견을 주장하는 것인데, 예를 들면 남녀간의 혈압차이가
있다고 주장하는 것은 혈압차이가 없다, 즉 혈압차이는 0이라는 명확한 가설을 반박함으로서 이
루어진다. 즉 이것의 결론은 남녀간의 혈압차이가 어떤 정도라고 말하는 것이 아니라 혈압차이가
없지 않다고 말하는 것이며, 혈압차이가 어떤 정도라고 주장한다면 이것을 귀무가설로 한 또 다
른 가설검정들이 시행될 것이다. 두 번째로는 유의수준(significant level)이다. 통계학에서 유의수
준이란 귀무가설이 참임에도 불구하고 귀무가설을 기각할 확률로 정의하는데 풀어 쓰자면, 귀무
가설을 가정했을 때 내가 발견한 어떤 사건, 현상보다 더 극한 현상이 일어날 확률을 의미하고,
통상적으로 널리 이용되는 유의수준은 0.05인데 이 0.05가 핵심적인 특징이다. 즉 꽤나 낮은 확률
이 되어야 귀무가설을 기각하겠다는 의미가 내포되어 있으며 이는 바꾸어 말하면 웬만하면 귀무
가설을 바꾸지 않겠다는 것이다.
위와 같은 통계학의 가설검정의 특징을 생각한다면 실제 우리 주위에서 일어나는 많은 논쟁이
통계학의 가설검정의 원리와 비슷한 측면을 갖고 있다는 것을 알 수 있다. 실상 많은 논쟁에서
내 주장에 대한 근거를 제시하는 것이 아니라 상대방이 주장을 하기만을 기다렸다가 그것을 반박
함으로서 마치 내 주장이 맞는다는 인상을 심어주려는 행태들이 일어나고 있으며, 자신이 한번
믿는 것은 웬만하면 바꾸지 않으려고 한다. 실제로 쇼펜하우어의 <논쟁에서 이기는 38가지 방법
>[1]의 3번째에는 상대방의 주장을 보편화된 주장인 것처럼, 즉 단순하고 절대적인 것처럼 여기
고 이를 반박함으로서 논쟁에서 승리하라고 되어 있으며, 4번째에는 자신의 결론을 상대방이 예측
하지 못하도록 하라고 되어 있다. 한편, 역으로 적지 않은 통계학의 가설검정 방법이 그것을 만든
사람의 심리를 포함하고 있는데 그것의 간단하고 대표적인 예가 정규성 검정[3-5]과 독립 2표본
T-test의 등분산성 검정[6]이 있다. 정규성 검정은 우리의 자료가 정규분포를 따른다는 귀무가설을
갖는데 이는 특별한 문제가 없는 한 정규분포라고 생각하겠다는 의도가 숨겨져 있으며, 독립 2표
본 T-test의 등분산성 검정은 웬만하면 두 집단의 모집단의 분산이 같다고 생각하겠다는 것이다.
실제로 등분산성 가정은 매우 위험한 가정인 것으로 알려져 있으며, 등분산성 test를 하지 않고
분산이 다르다고 가정한 test가 더 좋다는 주장이 있다[7].
이와 같이 논쟁에서 사람들을 설득하고 상대방에게 설득 당하지 않으려는 일련의 심리들이 통계
학의 가설검정과 매우 비슷한 면을 갖고 있으며, 반대로 통계학의 가설검정에는 그것을 만든 사
람의 심리가 숨겨져 있다고 할 수 있다. 이에 본문에서는 논쟁상황을 사람들을 설득할 때와 상대
방에게 설득되지 않으려는 경우로 나누어 각 상황에서 사용되는 통계학의 가설검정의 원리를 크
게 귀무가설의 설정부분과 유의수준의 결정과 연계 지어서 설명해 볼 것이며, 앞서 말한 통계학
의 가설검정의 원리에 숨겨진 인간의 심리에 대해 좀 더 자세히 이야기 해 볼 것이다. 이에 대해
정확히 파악하는 것이 논쟁 시 소모적인 논쟁을 줄이는데 기여할 수 있을 것이며, 통계학을 도구
로 이용하고 있는 많은 자연과학도, 사회과학도들에게 올바른 결과 해석에 도움을 줄 수 있을 것
이다.
2. 사람들을 설득하려 할 때 사용되는 가설검정의 원리
논쟁을 바라보는 사람들을 설득하려 할 때 가장 중요한 것 중 하나는 논쟁 상대방의 주장을 명
확히 하는 것이다. 이는 가설검정에서 귀무가설을 명확히 설정하는 것과 같은 원리이다. 앞서 예
를 든 남녀간에 혈압의 차이가 있다는 것을 주장하려면 남녀간의 혈압의 차이가 0이라고 귀무가
설을 설정하고 이 때 일어나기 힘든 사건을 제시해야 하는 것이다. 만약 귀무가설이 차이가 0이
라는 것이 아니라 -5~5 로 한다면 이 가설은 차이가 0이라는 그것에 비해 확률분포를 떠올리기
어려워 일어나기 힘든 사건이라고 주장하는 것이 상대적으로 더 힘든데, 이는 상대방의 주장을
단순화하라는 쇼펜하우어의 의견과도 일치한다. 상대방의 주장이 꼭 혈압차이가 0이라는 것은 아
닐지라도, 상대방의 주장을 차이가 0이라는 것으로 단순화하여 이것을 공격함으로서 마치 내 의
견이 맞는 것 같은 인상을 심어주는 것이다.
그 다음으로 중요한 것은 내가 반박할 수 있도록 귀무가설을 잘 조정하는 것이다. 예를 들어 내
가 관찰한 자료에서 남녀의 혈압차이가 10이라고 하자. 근데 혈압차이가 0인 귀무가설 하에서는
유의수준 0.05에서 통계적으로 유의하다고 말할 수 없다면 어떻게 해야 할까? 이 때는 혈압차이
가 0이라는 상대방의 주장을 반박할 수 없음을 일단 인정해야 한다. 그 후 통계적 유의성을 만족
하는 귀무가설을 역으로 찾는데, 만약 혈압차이가 -1이다 라는 귀무가설은 통계적으로 유의하다
면 이 귀무가설을 기각하는 것이다. 이를 통하여 실제로는 혈압차이가 -1은 아니라는 결론을 얻
을 뿐이지만, 마치 혈압차이가 0이라는 귀무가설을 기각하여 혈압차이가 있다고 여기게 하는 효
과를 얻는 것이다. 이는 논쟁에서 상대방의 주장을 교묘히 비틀어 해석하여 그것을 반박함으로서
상대방의 주장이 틀린 것처럼 느끼게 하는 것과 대응된다고 할 수 있다.
마지막으로 생각해봐야 할 것은 어찌 보면 가장 중요한 이슈일 수도 있는데, 사람들이 인식하고
있는 믿음의 경계를 낮추는 것이다. 이는 가설검정에서 유의수준을 높이는 것에 해당하는데 유의
수준 0.05에서 통계적으로 유의하지 않은 것이 0.1에서는 유의할 수 있기 때문이다. 유의수준을
올릴 수 있다면 위에 말한 두 가지 방법을 별로 고려하지 않아도 될 만큼 가장 중요한 사안이라
고 할 수 있겠으나 사람들이 그럴만 하다고 느끼는 유의수준의 정도를 바꾸는 것은 쉽지 않다는
점을 생각해야 할 것이다. 개인의 이득, 대외적인 이미지, 상대방과의 관계 등 여러 가지 요인에
따라 유의수준이 바뀔 수 있으므로 설득을 하려는 자는 이런 부분에 신경을 써야 할 것이다. 사
람은 자신에게 불리할 것으로 생각되는 일은 믿지 않으려 하고, 유리할 것으로 예상되는 일은 그
보다 쉽게 믿는 경향이 있기 때문이며 무엇을 말하느냐가 중요한 게 아니라 누가 말하느냐가 중
요하다는 말이 괜히 나온 말이 아니다.
3. 설득당하지 않으려 할 때 이용되는 가설검정의 원리
설득하는 것과 설득당하지 않는 것은 단순히 반대되는 사건이라고 보기에는 본질이 전혀 다르다.
설득하는 쪽이 무엇인가를 제시하게 되고 설득당하는 쪽은 그것을 받고 판단하게 되기 때문이다.
또한 설득당하지 않으려는 쪽은 웬만하면 자신의 주장을 바꾸지 않으려 하므로 설득하려는 쪽에
서 강한 증거를 제시해야 한다. 이제 앞의 내용을 읽어 보았다면 사람들을 설득하려 할 때 쓰이
는 기법들은 대부분 설득하려 할 때 쓰이는 방법들과 반대되는 것들일 것이라고 쉽게 추측할 수
있다. 첫째로는 나의 주장이 무엇인지 정확히 말하지 않는 것이 있다. 이는 상대방이 가설검정을
쉽게 할 수 없도록 하는 것과도 같은데 앞서 말했듯이 남녀간의 혈압차이가 없다고 주장하는 것
이 아니라 혈압차이가 -5~5라고 주장하는 것이다. 이런 주장을 귀무가설로 한다면 이를 가설검정
하기 위해 귀무가설 하의 혈압차이의 분포를 알기가 상대적으로 더 어려워지며 이것이 극단적으
로 나간다면 혈압차이가 있다고 할 순 없다고 주장하는 것이 된다. 이것은 아예 자신의 주장을
배제하고 상대방의 주장을 예상한 후 그것을 반박하는 것이 내 주장이라는 것으로 이런 주장을
하는 사람을 설득하는 것은 매우 힘들며, 이런 일련의 내용은 자기 주장을 밝히지 말고 상대방을
혼란스럽게 하라는 쇼펜하우어의 의견과 부합한다.
한편, 무엇인가 주장을 해야 한다면, 즉 귀무가설을 명확히 말해야 한다면 고려해야 할 것은 반
박당하지 않도록 귀무가설을 잘 조절하는 일이다. 역시 앞서 말한 설득하기 위한 방법의 반대되
는 개념인데, 내 생각이 반박 당할 가능성이 높다고 판단되거나 이미 반박되었다면, 그 반박 당한
주장에서 약간 물러난 스탠스를 취하는 것이다. 다시 남녀간의 혈압차이를 예를 들면 남녀간의
혈압차이가 없다는 주장이 반박되고 남자의 혈압이 더 높다는 결론이 나올 상황이라면 내 생각을
미리 남자가 여자의 혈압보다 5정도밖에 높지 않다고 한 발 물러서는 쪽으로 바꾸는 것이다. 이
주장은 앞선 차이가 없다는 주장과 달리 가설검정에서 유의한 결과가 아닌 것으로 나올 수가 있
을 것이며, 이것도 안되면 6,7,…로 조금씩 숫자를 올려서 유의한 결과가 나오지 않을 때까지 물러
서는 것이다. 이 방법을 사용하면 비록 처음 생각했던 주장을 유지할 수는 없지만 설득은 당하지
않을 수 있다.
마지막으로 이야기 할 것은 앞에서와 마찬가지로 유의수준의 조절에 관한 부분인데 그럴듯하게
유의수준을 낮추는 방법으로 많이 이용되는 것은 설득하려는 상대방을 믿지 못할 사람으로 만드
는 것인데 주로 쓰이는 것은 논쟁의 주제가 아닌 다른 주제에서의 상대방의 실수나 실패를 말하
거나, 상대방에 대한 인신공격이다. 어떤 쪽이든 상대방을 믿지 못할 사람 혹은 손해를 끼칠 사람
으로 인식하게 하여 유의수준을 낮추는 것을 합리화하는 것이 설득을 당하지 않는데 필요한 항목
이다.
4. 설득과 설득당하지 않기의 예시
2011년부터 지금까지 대한민국에서 큰 이슈가 된 연예인 타블로(영문명: Daniel Sunwoong Lee)
의 스탠포드 대학교 학력검증 논란은 본문의 내용을 가장 잘 적용할 수 있는 사건 중 하나이다.
여기서는 그의 학력이 진짜인지 아닌지에 대한 이야기는 접어두고 진짜라고 생각하는 사람들과
아니라고 생각하는 사람들의 두 집단을 대상으로 해당 논쟁이 어떻게 진행되었으며 가설검정의
원리가 어떻게 쓰여졌는지만 이야기 해 보겠다. 일단 2011년 인터넷 커뮤니티 “타블로에게 진실
을 요구합니다”(이하 타진요) 의 회원들이 타블로의 학력에 대해 의문을 제기하기 전까지의 대부
분 사람들의 귀무가설은 “타블로는 스탠포드 대학교를 나왔다.” 는 것이다. 이에 타진요 회원들은
스탠포드 대학교를 나왔다면 일어나기 힘들다고 생각되는 여러 가지 내용들을 제시하며 이 귀무
가설을 반박하였으며, 타블로의 과거 사실과 다른 방송매체 발언들을 모아서 공개하고 그의 캐나
다 국적을 문제로 삼아 타블로를 믿지 못할 사람, 손해를 끼치는 사람으로 몰아가기도 하였다. 이
는 가설검정에서 유의수준을 올리려는 행위에 해당되는 것이며, 이런 상황이 계속되어 한때 이
귀무가설은 기각된 것으로 여겨지기도 하였는데 그렇다면 그때부터는 기존의 귀무가설은 폐기되
고 새로운 귀무가설 “타블로를 스탠포드 대학교를 나오지 않았다”이 형성된 것이다. 허나 타블로
본인의 해명, 주변인들의 증언, 기타 증거 등 타블로가 스탠포드 대학교를 나온 것이 아니라면 일
어나기 힘든 사건들이 공개되면서 다시 타블로가 스탠포드 대학을 나오지 않았다는 귀무가설이
기각 당하게 되었고 그것이 다시 뒤집히는 일은 현재까지 없었다. 여기서 타진요의 주장의 변화
를 살펴보면 처음에는 기존의 귀무가설을 반박하기 위한 행동들을 했는데, 귀무가설을 반박하고
나온 새로운 귀무가설이 반박 당한 후 타블로의 학력이 진실인 것으로 판명될 분위기가 되자, 타
블로가 스탠포드 대학을 나오지 않았다는 것을 설득시키는 것을 포기한다. 그리고 설득당하지 않
는 것으로 전략을 바꾸게 된다. 설득당하지 않기 위해 원래 주장에서 한 발짝 물러설 필요가 있
고 그 주장은 “타블로가 스탠포드 대학을 졸업했다고 말할 수 없다” 와 같은 형식이 된다. 이 주
장은 타블로의 학력이 가짜다라는 의미가 내포되어 있다고 볼 수 있긴 하지만, 명확하게 가짜라
는 주장이 아니고 애매하다. 따라서 이것을 귀무가설로 놓는다면 이것을 검정하고 기각하기란 여
간 어려운 것이 아니다. 주장이 명확하지 않은데다가, 주장 자체가 어떤 주장에 대한 반박에 대한
내용이기 때문에 귀무가설이 참일 때의 확률공간을 파악하고 인식하기조차 어렵고 따라서 일어나
기 쉬운 일 일어나기 힘든 일을 이야기 하는 것 자체가 무리이다. 따라서 이런 주장을 하는 사람
을 설득하는 것은 거의 불가능하며 타블로의 학력을 믿는 사람들은 학력이 가짜라는 첫 번째의
가설을 반박한 것을, 믿지 않는 사람들은 원래 주장은 반박당했지만 마지막까지 설득당하진 않았
다라는 것을 강조하게 된다. 이 예는 가설검정의 원리가 논쟁에 적용되는 한 가지 예일 뿐이고
실상 우리 주변에서 이와 비슷한 예를 수없이 많이 찾을 수 있을 것이며, 하루에도 수없이 많이
일어나는 소송 및 재판이 이를 지지한다.
5. 통계학의 가설검정에 숨겨진 인간의 심리
이번에는 서론에서 언급한 정규성 검정과, 독립 2표본 t-test에서의 등분산성 검정에 대해 좀 더
이야기 해보려 한다. 서론에서 말했듯이 정규성 검정은 자료의 분포가 정규분포인지를 검정하는
방법으로 통상적으로 유의수준 0.05에서 검정을 하게 되는데 이는 아주 큰 문제가 발견되지 않으
면 그냥 정규분포로 가정하겠다는 심리가 반영된 것이다. 이 심리를 이해하기 위해서는 정규분포
가 어떤 분포이며 어떻게 만들어졌는지에 대한 이해가 필요하며 시대를 거슬러 올라가 보자.
이항분포(binomial distribution)은 어떤 일이 발생할 확률이 주어질 때, 그것이 몇 번 일어날 확
률을 구할 때 이용하는 분포로 실상 세상의 많은 현상들을 이것으로 설명할 수 있는데, 시행횟수
가 커질 때 계산이 어렵다는 단점이 있다. 이에 1733년 De Moivre[8]가 특정 이항분포에서 n이 커질
때 그 분포의 근사치를 계산하는 글을 썼는데 이것이 정규분포의 시초로 알려지고 있고 현재 De Moivre-
Laplace theorem[9]으로 알려져 있으며 이의 수식을 표현하면 다음과 같다.
lim
𝑛→∞
(
𝑛
𝑥
) 𝑝 𝑥
𝑞 𝑛−𝑥
≅
1
√2𝜋√ 𝑛𝑝𝑞
𝑒
−
( 𝑥−𝑛𝑝)2
2𝑛𝑝𝑞 ,(p + q = 1)
즉, 이항분포에서 n이 충분히 커질 때 사거니 x번 일어날 확률은 평균과 분산이 이항분포의 그것
인 정규분포의 확률밀도함수로 가까이 간다는 것이고, 이는 정규분포가 이항분포와 비슷한 분포
로서 세상의 많은 현상들을 설명하는데 이용될 수 있음을 의미한다. 이 정규분포는 수학자 Gauss
에 의해서 새롭게 해석되는데 Gauss는 1809년에 쓴 논문[10]에서 오차의 법칙을 정의하고 있으며
이는 다음과 같다.
(1) +방향의 오차와 –방향의 오차가 일어날 확률은 같다. : x=0에 대한 대칭함수
(2) 작은 오차가 큰 오차보다 일어날 확률이 많다. : Concave.
(3) 전체 확률은 1이다.
(4) 전체 관측치를 𝑥1, 𝑥2,… 𝑥 𝑛 이라 했을 때 실제 값으로 가장 가능성이 높은 것은 전체 관측
치의 평균이다. : Maximum likelihood estimator
생각해보면 위 4가지의 법칙은 매우 자연스럽게 이해가 되는 부분이며 대부분의 관측치가 이 법
칙들을 따를 것이라고 생각할 수 있다. 이 4가지 법칙만 가지고 수학적으로 오차의 분포를 유도
할 수 있는데 이것이 놀랍게도 정규분포의 식과 일치하게 되고, 따라서 정규분포는 세상의 대부
분의 사건에 적용할 수 있는 분포라고 생각할 수 있다. 이런 사실을 토대로 정규성 검정에 숨겨
진 심리를 이해할 수 있는데, 대부분의 사건들이 오차의 법칙을 따를 것이라고 생각이 되므로, 정
규분포를 따를 것이라고 여길 수 있고 따라서 웬만하면 이 생각을 바꾸지 않겠다는 것이다. 또한
연구를 진행하는 사람의 입장에서는 정규분포 가정이 깨진다면 잘 알려진 통계량들을 사용하기
어렵기 때문에 정규분포라는 생각을 가급적 바꾸지 않겠다는 마음을 가질 수도 있을 것이다. 허
나 오늘날에는 poisson, gamma, beta distribution 등 정규분포를 따르지 않는 분포들이 많이 알려
져 있어 무작정 정규분포 가정을 유지하는 것은 위험한 생각일 수 있을 것이다.
그 다음으로는 독립 2표본 t-test를 살펴보겠다. 표본분산이 모분산의 unbiased estimator임이
잘 알려져 있으며, 두 집단의 모분산이 같다는 가정 하에서는 두 집단의 sample수에서 1을 뺀 것
을 가중치로 한 표본분산의 평균이 공통분산의 unbiased estimator라는 것이 알려져 있다. 이 공
통분산을 이용하여 standard error를 구하고, 두 집단의 표본평균 차이를 standard error으로 나눈
통계량이 t분포를 따른다는 것을 이용하여 평균이 같다는 귀무가설을 검정하게 된다. 허나 두 집
단의 모분산이 같다는 가정이 없다면 공통분산의 개념을 사용할 수 없고 따라서 t-분포를 이용할
수가 없는데, 이때는 두 집단의 관측치의 평균 차이의 분산을 그냥 구한 후, 관측치의 평균차이가
t-분포와 비슷한 분포를 따를 것이라는 가정을 한 후 두 집단의 관측치 차이의 평균과 분산을 가
장 잘 설명하는 t-분포의 자유도를 구하여 그 자유도의 t-분포를 따른다고 가정하고 가설검정을
하게 된다[11]. 이를 토대로 등분산성 검정에 숨겨진 심리를 생각해 볼 수 있는데, 등분산 가정이
깨지게 되면 t-분포라 할 수 없어서 근사를 거쳐 복잡한 계산을 해야 하기 때문에 가급적이면 등
분산이라는 생각을 바꾸지 않겠다는 심리가 깔려 있는 것이라 생각할 수 있다. 허나, 따로 떨어진
두 집단의 모분산이 같다는 가정은 앞의 정규분포에 대한 가정과는 달리 자연스럽게 이해되지 않
는 부분이며, 실상 그렇지 않은 경우가 훨씬 많아 무작정 이를 이용하면 올바르지 못한 가설 검
정을 하게 될 수 있다[7]. 또한 오늘날에는 컴퓨터를 이용하여 등분산 가정이 없을 때의 통계량을
쉽게 계산할 수 있고 또 여러 통계 프로그램에서 이를 제시해 주고 있으므로 등분산임이라고 확
신할 수 있는 경우를 제외하고는 등분산 가정을 이용한 가설검정을 하는 것에 대해 신중한 판단
을 해야 할 것이다.
6. 바람직한 논쟁과 올바른 통계적 가설검정에 대하여.
2장부터 4장까지 논쟁 시 설득하려는 마음, 설득당하지 않으려는 심리에서 나올 수 있는 현상들
을 통계학의 가설검정의 원리로 설명해 보았고 실제 있었던 타블로 학력검증 논쟁을 이 원리로
해석해 보았다. 어떠한 주제의 논쟁을 하던 본문에 제시된 방법들을 효과적으로 사용하거나 상대
방이 이런 방법들을 사용하는 것을 알고 대처한다면, 상대적으로 부족한 근거를 가지고도 자신의
주장을 효과적으로 펼칠 수는 있을 것이나, 소모적인 논쟁을 유발하기도 쉽다는 점을 명심해야
할 것이다.
5장에서는 몇 가지 통계학의 가설검정의 기저에 깔린 인간의 심리를 이야기했는데, 연구를 수행
하여 통계학적 가설검정을 할 때, 가설검정이 의도하고 있는 부분이 연구자 자신이 생각하고 있
는 부분과 맞는지 고민을 할 필요성이 있다고 할 수 있으며 이런 고민의 결과를 반영하는 것이
올바른 결과를 도출하는데 큰 도움이 될 것이다.
<References>
1. Schopenhauer (2004) The Art of Always Being Right: Thirty Eight Ways to Win When You Are
Defeated: Gibson Square Books Ltd.
2. FISHER R (1935) The Design of Experiments.
3. Stephens MA (1986) Tests based on EDF statistics. Goodness-of-fit Techniques 68: 97-193.
4. Shapiro SS, Wilk MB (1965) An analysis of variance test for normality (complete samples).
Biometrika 52: 591-611.
5. Moore DS (1986) Tests of chi-squared type. Goodness-of-fit Techniques: 69-70.
6. LEVENE H (1960) ROBUST TESTS FOR EQUALITY OF VARIANCES1. Contributions to probability
and statistics: 278.
7. Moser BK, Stevens GR (1992) Homogeneity of variance in the two-sample means test. American
Statistician: 19-21.
8. De Moivre A (1926) Approximatio ad summam terminorum binomii (a+ b) n in seriem expansi.
Supplement to Miscellanea Analytica, London 1733.
9. De Moivre A (1738) The doctrine of chances.
10. Gauss CF (1809) Theoria motus corporum coelestium in sectionibus conicis solem ambientium
[Theory of the Motion of the Heavenly Bodies Moving about the Sun in Conic Sections].
Nouvelle Memoire de I'Academy Royale des Sciences et Belles-Lettres de Berlin; Oeuvres.
11. Welch BL (1947) The generalization ofstudent's' problem when several different population
variances are involved. Biometrika 34: 28-35.

More Related Content

More from Jinseob Kim

Unsupervised Deep Learning Applied to Breast Density Segmentation and Mammogr...
Unsupervised Deep Learning Applied to Breast Density Segmentation and Mammogr...Unsupervised Deep Learning Applied to Breast Density Segmentation and Mammogr...
Unsupervised Deep Learning Applied to Breast Density Segmentation and Mammogr...Jinseob Kim
 
Fst, selection index
Fst, selection indexFst, selection index
Fst, selection indexJinseob Kim
 
Why Does Deep and Cheap Learning Work So Well
Why Does Deep and Cheap Learning Work So WellWhy Does Deep and Cheap Learning Work So Well
Why Does Deep and Cheap Learning Work So WellJinseob Kim
 
New Epidemiologic Measures in Multilevel Study: Median Risk Ratio, Median Haz...
New Epidemiologic Measures in Multilevel Study: Median Risk Ratio, Median Haz...New Epidemiologic Measures in Multilevel Study: Median Risk Ratio, Median Haz...
New Epidemiologic Measures in Multilevel Study: Median Risk Ratio, Median Haz...Jinseob Kim
 
Win Above Replacement in Sabermetrics
Win Above Replacement in SabermetricsWin Above Replacement in Sabermetrics
Win Above Replacement in SabermetricsJinseob Kim
 
Regression Basic : MLE
Regression  Basic : MLERegression  Basic : MLE
Regression Basic : MLEJinseob Kim
 
iHS calculation in R
iHS calculation in RiHS calculation in R
iHS calculation in RJinseob Kim
 
Selection index population_genetics
Selection index population_geneticsSelection index population_genetics
Selection index population_geneticsJinseob Kim
 
질병부담계산: Dismod mr gbd2010
질병부담계산: Dismod mr gbd2010질병부담계산: Dismod mr gbd2010
질병부담계산: Dismod mr gbd2010Jinseob Kim
 
Case-crossover study
Case-crossover studyCase-crossover study
Case-crossover studyJinseob Kim
 
Generalized Additive Model
Generalized Additive Model Generalized Additive Model
Generalized Additive Model Jinseob Kim
 
Deep Learning by JSKIM (Korean)
Deep Learning by JSKIM (Korean)Deep Learning by JSKIM (Korean)
Deep Learning by JSKIM (Korean)Jinseob Kim
 
Machine Learning Introduction
Machine Learning IntroductionMachine Learning Introduction
Machine Learning IntroductionJinseob Kim
 
Deep learning by JSKIM
Deep learning by JSKIMDeep learning by JSKIM
Deep learning by JSKIMJinseob Kim
 
Multilevel study
Multilevel study Multilevel study
Multilevel study Jinseob Kim
 
GEE & GLMM in GWAS
GEE & GLMM in GWASGEE & GLMM in GWAS
GEE & GLMM in GWASJinseob Kim
 

More from Jinseob Kim (20)

Unsupervised Deep Learning Applied to Breast Density Segmentation and Mammogr...
Unsupervised Deep Learning Applied to Breast Density Segmentation and Mammogr...Unsupervised Deep Learning Applied to Breast Density Segmentation and Mammogr...
Unsupervised Deep Learning Applied to Breast Density Segmentation and Mammogr...
 
Fst, selection index
Fst, selection indexFst, selection index
Fst, selection index
 
Why Does Deep and Cheap Learning Work So Well
Why Does Deep and Cheap Learning Work So WellWhy Does Deep and Cheap Learning Work So Well
Why Does Deep and Cheap Learning Work So Well
 
New Epidemiologic Measures in Multilevel Study: Median Risk Ratio, Median Haz...
New Epidemiologic Measures in Multilevel Study: Median Risk Ratio, Median Haz...New Epidemiologic Measures in Multilevel Study: Median Risk Ratio, Median Haz...
New Epidemiologic Measures in Multilevel Study: Median Risk Ratio, Median Haz...
 
Win Above Replacement in Sabermetrics
Win Above Replacement in SabermetricsWin Above Replacement in Sabermetrics
Win Above Replacement in Sabermetrics
 
Regression Basic : MLE
Regression  Basic : MLERegression  Basic : MLE
Regression Basic : MLE
 
iHS calculation in R
iHS calculation in RiHS calculation in R
iHS calculation in R
 
Fst in R
Fst in R Fst in R
Fst in R
 
Selection index population_genetics
Selection index population_geneticsSelection index population_genetics
Selection index population_genetics
 
질병부담계산: Dismod mr gbd2010
질병부담계산: Dismod mr gbd2010질병부담계산: Dismod mr gbd2010
질병부담계산: Dismod mr gbd2010
 
DALY & QALY
DALY & QALYDALY & QALY
DALY & QALY
 
Case-crossover study
Case-crossover studyCase-crossover study
Case-crossover study
 
Generalized Additive Model
Generalized Additive Model Generalized Additive Model
Generalized Additive Model
 
Deep Learning by JSKIM (Korean)
Deep Learning by JSKIM (Korean)Deep Learning by JSKIM (Korean)
Deep Learning by JSKIM (Korean)
 
Machine Learning Introduction
Machine Learning IntroductionMachine Learning Introduction
Machine Learning Introduction
 
Tree advanced
Tree advancedTree advanced
Tree advanced
 
Deep learning by JSKIM
Deep learning by JSKIMDeep learning by JSKIM
Deep learning by JSKIM
 
Main result
Main result Main result
Main result
 
Multilevel study
Multilevel study Multilevel study
Multilevel study
 
GEE & GLMM in GWAS
GEE & GLMM in GWASGEE & GLMM in GWAS
GEE & GLMM in GWAS
 

가설검정의 심리학

  • 1. 논쟁의 심리와 통계학의 가설검정 Jinseob Kim Preventive Medicine Program, Graduate School of Public Health, Seoul National University, Seoul, Korea Abstract 논쟁 시 자신의 의견을 말하고 다른 사람의 의견을 반박하는 논리와 기저에 깔린 심리는 통계 학의 가설검정의 원리와 매우 비슷하다. 다른 사람의 주장을 매우 단순화시켜서 그것을 반박하는 것은 귀무가설을 명확히 설정해야 그것을 반박하기 쉬운 가설검정의 특징과 유사하고, 자신의 주 장을 쉽게 말하지 않으며 애매모호하게 주장하는 것은, 귀무가설을 명확하지 않게 하여 이를 검 정하기 어렵게 하려는 것과 일맥상통한다. 논쟁 주제와 상관없는 상대방에 대한 매도, 인신공격은 가설검정 시 유의수준을 낮추는 효과와 밀접한 관련이 있으며, 반대로 자기 자신을 믿을 만한 사 람, 이득을 줄 사람으로 포장하는 것은 유의수준이 올라가는 것으로 설명할 수 있다. 한편, 통계 학의 가설검정에는 그것을 만들거나 그것을 이용하는 사람의 심리가 반영되어 있다. 정규성 검정 은 가급적 정규분포라는 생각을 버리지 않겠다는 의지가 담긴 통계적 검정 방법이며, 독립 2표본 t-test의 등분산성 검정은 가급적이면 등분산이라는 주장을 바꾸지 않아 편리하게 가설검정을 하 겠다는 마음이 담겨 있는 통계방법이다. 이와 같이 논쟁의 방법과 통계학의 가설검정은 밀접한 관련이 있는 것을 알 수 있으며, 논쟁 시 통계학의 가설검정의 원리를 잘 활용하는 것이 원하는 주장을 하는데 도움이 될 것이며, 이에 대한 지식을 갖고 있는 것이 소모적인 논쟁을 막는데 도 움을 줄 것이다. 또한 연구자가 자료를 통계학적 방법으로 해석할 때 해당 가설 검정에 숨겨진 심리를 잘 파악하는 것이 올바른 결론을 도출하는 데 도움이 될 것이다. 1. 서론 바야흐로 논쟁의 시대이다. 인간이 탄생했을 때부터 논쟁이 없었던 기간은 없었겠지만, 전제 왕 정시대부터 민주화시대로 거쳐오면서 논쟁에 참여하거나 논쟁을 바라보는 것이 매우 흔한 일이 되었으며 20세기 말부터 급속도로 발달한 방송매체, 컴퓨터 기술, 인터넷 커뮤니티 그리고 최근에 는 Social Network Service 까지… 이제 우리는 격렬한 논쟁이 이루어지는 현장을 심심치 않게 발 견할 수 있고 또한 스스로 논쟁에 참여하기도 한다. 수많은 TV토론회에서 한 주제를 두고 찬성쪽 과 반대쪽 토론자들간의 치열한 공방이 일어나고, 주요 포탈사이트나 커뮤니티에선 댓글이 수백 개를 넘는 경우를 심심치 않게 볼 수 있다.
  • 2. 논쟁의 핵심사안 또는 목적은 합리적인 의사결정이다. 합리적이라는 의미가 여려가지가 있을 수 있는데, 필자는 여기서 합리적이라는 단어를 경제학의 “합리”의 단어로 설명해 보려 한다. 즉, 논 쟁의 목적을 내 뜻에 맞는, 나에게 이득이 되는 의사결정이라고 생각해 보겠다. 실상 많은 논쟁이 주어진 상황에서 어떻게든 나에게 유리한 결과를 얻기 위해 이루어진다. 대표적인 것이 피고인에 대한 변호인데, 피고인이 어떤 죄를 지었던 간에 변호사는 피고인에게 유리한 결과를 만들기 위 해 논쟁을 하며, 철학자 쇼펜하우어는 주제를 막론하고 논쟁에서 승리하기 위한 방법을 소개한 < 논쟁에서 이기는 38가지 방법>[1] 이라는 글을 쓰기도 하였다. 한편, 정보화 시대, 데이터의 시대라고도 불리는 21세기에 합리적인 의사결정과 뗄래야 뗄 수 없 는 관계를 가진 학문이 통계학이다. 물리학, 생물학, 의학 등의 자연과학뿐만 아니라 경제학, 심리 학 등의 사회과학에서도 통계학은 어떤 주장을 하기 위해 필수적인 도구로 이용되고 있는데 여기 서 쓰이는 핵심적인 개념은 “가설 검정”이다. R.A Fisher[2]에 의해 처음으로 사용된 귀무가설(null hypothesis)의 개념은 지금까지도 대부분의 연구에서 가설검정의 핵심 방법이며, 사회과학에서도 널리 이용되고 있는데 그 핵심 논리는 반박하고 싶은 가설을 귀무가설로 설정하고 귀무가설 하에 서 일어날 확률이 매우 적은 사건 또는 현상을 제시함으로서 자신의 주장을 펼치는 방법이다. 이 는 수학의 증명법 중 결론을 부정한 후 모순을 찾아내는 귀류법과 유사한 측면이 있기도 하다. 이런 통계학의 가설검정방법은 크게 두 가지 특성이 있다. 첫째로는 무엇인가 명확한 가설이 주 어진 후에야 이를 반박함으로서 자신의 의견을 주장하는 것인데, 예를 들면 남녀간의 혈압차이가 있다고 주장하는 것은 혈압차이가 없다, 즉 혈압차이는 0이라는 명확한 가설을 반박함으로서 이 루어진다. 즉 이것의 결론은 남녀간의 혈압차이가 어떤 정도라고 말하는 것이 아니라 혈압차이가 없지 않다고 말하는 것이며, 혈압차이가 어떤 정도라고 주장한다면 이것을 귀무가설로 한 또 다 른 가설검정들이 시행될 것이다. 두 번째로는 유의수준(significant level)이다. 통계학에서 유의수 준이란 귀무가설이 참임에도 불구하고 귀무가설을 기각할 확률로 정의하는데 풀어 쓰자면, 귀무 가설을 가정했을 때 내가 발견한 어떤 사건, 현상보다 더 극한 현상이 일어날 확률을 의미하고, 통상적으로 널리 이용되는 유의수준은 0.05인데 이 0.05가 핵심적인 특징이다. 즉 꽤나 낮은 확률 이 되어야 귀무가설을 기각하겠다는 의미가 내포되어 있으며 이는 바꾸어 말하면 웬만하면 귀무 가설을 바꾸지 않겠다는 것이다. 위와 같은 통계학의 가설검정의 특징을 생각한다면 실제 우리 주위에서 일어나는 많은 논쟁이 통계학의 가설검정의 원리와 비슷한 측면을 갖고 있다는 것을 알 수 있다. 실상 많은 논쟁에서 내 주장에 대한 근거를 제시하는 것이 아니라 상대방이 주장을 하기만을 기다렸다가 그것을 반박 함으로서 마치 내 주장이 맞는다는 인상을 심어주려는 행태들이 일어나고 있으며, 자신이 한번 믿는 것은 웬만하면 바꾸지 않으려고 한다. 실제로 쇼펜하우어의 <논쟁에서 이기는 38가지 방법 >[1]의 3번째에는 상대방의 주장을 보편화된 주장인 것처럼, 즉 단순하고 절대적인 것처럼 여기 고 이를 반박함으로서 논쟁에서 승리하라고 되어 있으며, 4번째에는 자신의 결론을 상대방이 예측 하지 못하도록 하라고 되어 있다. 한편, 역으로 적지 않은 통계학의 가설검정 방법이 그것을 만든 사람의 심리를 포함하고 있는데 그것의 간단하고 대표적인 예가 정규성 검정[3-5]과 독립 2표본 T-test의 등분산성 검정[6]이 있다. 정규성 검정은 우리의 자료가 정규분포를 따른다는 귀무가설을
  • 3. 갖는데 이는 특별한 문제가 없는 한 정규분포라고 생각하겠다는 의도가 숨겨져 있으며, 독립 2표 본 T-test의 등분산성 검정은 웬만하면 두 집단의 모집단의 분산이 같다고 생각하겠다는 것이다. 실제로 등분산성 가정은 매우 위험한 가정인 것으로 알려져 있으며, 등분산성 test를 하지 않고 분산이 다르다고 가정한 test가 더 좋다는 주장이 있다[7]. 이와 같이 논쟁에서 사람들을 설득하고 상대방에게 설득 당하지 않으려는 일련의 심리들이 통계 학의 가설검정과 매우 비슷한 면을 갖고 있으며, 반대로 통계학의 가설검정에는 그것을 만든 사 람의 심리가 숨겨져 있다고 할 수 있다. 이에 본문에서는 논쟁상황을 사람들을 설득할 때와 상대 방에게 설득되지 않으려는 경우로 나누어 각 상황에서 사용되는 통계학의 가설검정의 원리를 크 게 귀무가설의 설정부분과 유의수준의 결정과 연계 지어서 설명해 볼 것이며, 앞서 말한 통계학 의 가설검정의 원리에 숨겨진 인간의 심리에 대해 좀 더 자세히 이야기 해 볼 것이다. 이에 대해 정확히 파악하는 것이 논쟁 시 소모적인 논쟁을 줄이는데 기여할 수 있을 것이며, 통계학을 도구 로 이용하고 있는 많은 자연과학도, 사회과학도들에게 올바른 결과 해석에 도움을 줄 수 있을 것 이다. 2. 사람들을 설득하려 할 때 사용되는 가설검정의 원리 논쟁을 바라보는 사람들을 설득하려 할 때 가장 중요한 것 중 하나는 논쟁 상대방의 주장을 명 확히 하는 것이다. 이는 가설검정에서 귀무가설을 명확히 설정하는 것과 같은 원리이다. 앞서 예 를 든 남녀간에 혈압의 차이가 있다는 것을 주장하려면 남녀간의 혈압의 차이가 0이라고 귀무가 설을 설정하고 이 때 일어나기 힘든 사건을 제시해야 하는 것이다. 만약 귀무가설이 차이가 0이 라는 것이 아니라 -5~5 로 한다면 이 가설은 차이가 0이라는 그것에 비해 확률분포를 떠올리기 어려워 일어나기 힘든 사건이라고 주장하는 것이 상대적으로 더 힘든데, 이는 상대방의 주장을 단순화하라는 쇼펜하우어의 의견과도 일치한다. 상대방의 주장이 꼭 혈압차이가 0이라는 것은 아 닐지라도, 상대방의 주장을 차이가 0이라는 것으로 단순화하여 이것을 공격함으로서 마치 내 의 견이 맞는 것 같은 인상을 심어주는 것이다. 그 다음으로 중요한 것은 내가 반박할 수 있도록 귀무가설을 잘 조정하는 것이다. 예를 들어 내 가 관찰한 자료에서 남녀의 혈압차이가 10이라고 하자. 근데 혈압차이가 0인 귀무가설 하에서는 유의수준 0.05에서 통계적으로 유의하다고 말할 수 없다면 어떻게 해야 할까? 이 때는 혈압차이 가 0이라는 상대방의 주장을 반박할 수 없음을 일단 인정해야 한다. 그 후 통계적 유의성을 만족 하는 귀무가설을 역으로 찾는데, 만약 혈압차이가 -1이다 라는 귀무가설은 통계적으로 유의하다 면 이 귀무가설을 기각하는 것이다. 이를 통하여 실제로는 혈압차이가 -1은 아니라는 결론을 얻 을 뿐이지만, 마치 혈압차이가 0이라는 귀무가설을 기각하여 혈압차이가 있다고 여기게 하는 효 과를 얻는 것이다. 이는 논쟁에서 상대방의 주장을 교묘히 비틀어 해석하여 그것을 반박함으로서 상대방의 주장이 틀린 것처럼 느끼게 하는 것과 대응된다고 할 수 있다. 마지막으로 생각해봐야 할 것은 어찌 보면 가장 중요한 이슈일 수도 있는데, 사람들이 인식하고 있는 믿음의 경계를 낮추는 것이다. 이는 가설검정에서 유의수준을 높이는 것에 해당하는데 유의 수준 0.05에서 통계적으로 유의하지 않은 것이 0.1에서는 유의할 수 있기 때문이다. 유의수준을 올릴 수 있다면 위에 말한 두 가지 방법을 별로 고려하지 않아도 될 만큼 가장 중요한 사안이라
  • 4. 고 할 수 있겠으나 사람들이 그럴만 하다고 느끼는 유의수준의 정도를 바꾸는 것은 쉽지 않다는 점을 생각해야 할 것이다. 개인의 이득, 대외적인 이미지, 상대방과의 관계 등 여러 가지 요인에 따라 유의수준이 바뀔 수 있으므로 설득을 하려는 자는 이런 부분에 신경을 써야 할 것이다. 사 람은 자신에게 불리할 것으로 생각되는 일은 믿지 않으려 하고, 유리할 것으로 예상되는 일은 그 보다 쉽게 믿는 경향이 있기 때문이며 무엇을 말하느냐가 중요한 게 아니라 누가 말하느냐가 중 요하다는 말이 괜히 나온 말이 아니다. 3. 설득당하지 않으려 할 때 이용되는 가설검정의 원리 설득하는 것과 설득당하지 않는 것은 단순히 반대되는 사건이라고 보기에는 본질이 전혀 다르다. 설득하는 쪽이 무엇인가를 제시하게 되고 설득당하는 쪽은 그것을 받고 판단하게 되기 때문이다. 또한 설득당하지 않으려는 쪽은 웬만하면 자신의 주장을 바꾸지 않으려 하므로 설득하려는 쪽에 서 강한 증거를 제시해야 한다. 이제 앞의 내용을 읽어 보았다면 사람들을 설득하려 할 때 쓰이 는 기법들은 대부분 설득하려 할 때 쓰이는 방법들과 반대되는 것들일 것이라고 쉽게 추측할 수 있다. 첫째로는 나의 주장이 무엇인지 정확히 말하지 않는 것이 있다. 이는 상대방이 가설검정을 쉽게 할 수 없도록 하는 것과도 같은데 앞서 말했듯이 남녀간의 혈압차이가 없다고 주장하는 것 이 아니라 혈압차이가 -5~5라고 주장하는 것이다. 이런 주장을 귀무가설로 한다면 이를 가설검정 하기 위해 귀무가설 하의 혈압차이의 분포를 알기가 상대적으로 더 어려워지며 이것이 극단적으 로 나간다면 혈압차이가 있다고 할 순 없다고 주장하는 것이 된다. 이것은 아예 자신의 주장을 배제하고 상대방의 주장을 예상한 후 그것을 반박하는 것이 내 주장이라는 것으로 이런 주장을 하는 사람을 설득하는 것은 매우 힘들며, 이런 일련의 내용은 자기 주장을 밝히지 말고 상대방을 혼란스럽게 하라는 쇼펜하우어의 의견과 부합한다. 한편, 무엇인가 주장을 해야 한다면, 즉 귀무가설을 명확히 말해야 한다면 고려해야 할 것은 반 박당하지 않도록 귀무가설을 잘 조절하는 일이다. 역시 앞서 말한 설득하기 위한 방법의 반대되 는 개념인데, 내 생각이 반박 당할 가능성이 높다고 판단되거나 이미 반박되었다면, 그 반박 당한 주장에서 약간 물러난 스탠스를 취하는 것이다. 다시 남녀간의 혈압차이를 예를 들면 남녀간의 혈압차이가 없다는 주장이 반박되고 남자의 혈압이 더 높다는 결론이 나올 상황이라면 내 생각을 미리 남자가 여자의 혈압보다 5정도밖에 높지 않다고 한 발 물러서는 쪽으로 바꾸는 것이다. 이 주장은 앞선 차이가 없다는 주장과 달리 가설검정에서 유의한 결과가 아닌 것으로 나올 수가 있 을 것이며, 이것도 안되면 6,7,…로 조금씩 숫자를 올려서 유의한 결과가 나오지 않을 때까지 물러 서는 것이다. 이 방법을 사용하면 비록 처음 생각했던 주장을 유지할 수는 없지만 설득은 당하지 않을 수 있다. 마지막으로 이야기 할 것은 앞에서와 마찬가지로 유의수준의 조절에 관한 부분인데 그럴듯하게 유의수준을 낮추는 방법으로 많이 이용되는 것은 설득하려는 상대방을 믿지 못할 사람으로 만드 는 것인데 주로 쓰이는 것은 논쟁의 주제가 아닌 다른 주제에서의 상대방의 실수나 실패를 말하 거나, 상대방에 대한 인신공격이다. 어떤 쪽이든 상대방을 믿지 못할 사람 혹은 손해를 끼칠 사람 으로 인식하게 하여 유의수준을 낮추는 것을 합리화하는 것이 설득을 당하지 않는데 필요한 항목 이다.
  • 5. 4. 설득과 설득당하지 않기의 예시 2011년부터 지금까지 대한민국에서 큰 이슈가 된 연예인 타블로(영문명: Daniel Sunwoong Lee) 의 스탠포드 대학교 학력검증 논란은 본문의 내용을 가장 잘 적용할 수 있는 사건 중 하나이다. 여기서는 그의 학력이 진짜인지 아닌지에 대한 이야기는 접어두고 진짜라고 생각하는 사람들과 아니라고 생각하는 사람들의 두 집단을 대상으로 해당 논쟁이 어떻게 진행되었으며 가설검정의 원리가 어떻게 쓰여졌는지만 이야기 해 보겠다. 일단 2011년 인터넷 커뮤니티 “타블로에게 진실 을 요구합니다”(이하 타진요) 의 회원들이 타블로의 학력에 대해 의문을 제기하기 전까지의 대부 분 사람들의 귀무가설은 “타블로는 스탠포드 대학교를 나왔다.” 는 것이다. 이에 타진요 회원들은 스탠포드 대학교를 나왔다면 일어나기 힘들다고 생각되는 여러 가지 내용들을 제시하며 이 귀무 가설을 반박하였으며, 타블로의 과거 사실과 다른 방송매체 발언들을 모아서 공개하고 그의 캐나 다 국적을 문제로 삼아 타블로를 믿지 못할 사람, 손해를 끼치는 사람으로 몰아가기도 하였다. 이 는 가설검정에서 유의수준을 올리려는 행위에 해당되는 것이며, 이런 상황이 계속되어 한때 이 귀무가설은 기각된 것으로 여겨지기도 하였는데 그렇다면 그때부터는 기존의 귀무가설은 폐기되 고 새로운 귀무가설 “타블로를 스탠포드 대학교를 나오지 않았다”이 형성된 것이다. 허나 타블로 본인의 해명, 주변인들의 증언, 기타 증거 등 타블로가 스탠포드 대학교를 나온 것이 아니라면 일 어나기 힘든 사건들이 공개되면서 다시 타블로가 스탠포드 대학을 나오지 않았다는 귀무가설이 기각 당하게 되었고 그것이 다시 뒤집히는 일은 현재까지 없었다. 여기서 타진요의 주장의 변화 를 살펴보면 처음에는 기존의 귀무가설을 반박하기 위한 행동들을 했는데, 귀무가설을 반박하고 나온 새로운 귀무가설이 반박 당한 후 타블로의 학력이 진실인 것으로 판명될 분위기가 되자, 타 블로가 스탠포드 대학을 나오지 않았다는 것을 설득시키는 것을 포기한다. 그리고 설득당하지 않 는 것으로 전략을 바꾸게 된다. 설득당하지 않기 위해 원래 주장에서 한 발짝 물러설 필요가 있 고 그 주장은 “타블로가 스탠포드 대학을 졸업했다고 말할 수 없다” 와 같은 형식이 된다. 이 주 장은 타블로의 학력이 가짜다라는 의미가 내포되어 있다고 볼 수 있긴 하지만, 명확하게 가짜라 는 주장이 아니고 애매하다. 따라서 이것을 귀무가설로 놓는다면 이것을 검정하고 기각하기란 여 간 어려운 것이 아니다. 주장이 명확하지 않은데다가, 주장 자체가 어떤 주장에 대한 반박에 대한 내용이기 때문에 귀무가설이 참일 때의 확률공간을 파악하고 인식하기조차 어렵고 따라서 일어나 기 쉬운 일 일어나기 힘든 일을 이야기 하는 것 자체가 무리이다. 따라서 이런 주장을 하는 사람 을 설득하는 것은 거의 불가능하며 타블로의 학력을 믿는 사람들은 학력이 가짜라는 첫 번째의 가설을 반박한 것을, 믿지 않는 사람들은 원래 주장은 반박당했지만 마지막까지 설득당하진 않았 다라는 것을 강조하게 된다. 이 예는 가설검정의 원리가 논쟁에 적용되는 한 가지 예일 뿐이고 실상 우리 주변에서 이와 비슷한 예를 수없이 많이 찾을 수 있을 것이며, 하루에도 수없이 많이 일어나는 소송 및 재판이 이를 지지한다. 5. 통계학의 가설검정에 숨겨진 인간의 심리 이번에는 서론에서 언급한 정규성 검정과, 독립 2표본 t-test에서의 등분산성 검정에 대해 좀 더 이야기 해보려 한다. 서론에서 말했듯이 정규성 검정은 자료의 분포가 정규분포인지를 검정하는 방법으로 통상적으로 유의수준 0.05에서 검정을 하게 되는데 이는 아주 큰 문제가 발견되지 않으
  • 6. 면 그냥 정규분포로 가정하겠다는 심리가 반영된 것이다. 이 심리를 이해하기 위해서는 정규분포 가 어떤 분포이며 어떻게 만들어졌는지에 대한 이해가 필요하며 시대를 거슬러 올라가 보자. 이항분포(binomial distribution)은 어떤 일이 발생할 확률이 주어질 때, 그것이 몇 번 일어날 확 률을 구할 때 이용하는 분포로 실상 세상의 많은 현상들을 이것으로 설명할 수 있는데, 시행횟수 가 커질 때 계산이 어렵다는 단점이 있다. 이에 1733년 De Moivre[8]가 특정 이항분포에서 n이 커질 때 그 분포의 근사치를 계산하는 글을 썼는데 이것이 정규분포의 시초로 알려지고 있고 현재 De Moivre- Laplace theorem[9]으로 알려져 있으며 이의 수식을 표현하면 다음과 같다. lim 𝑛→∞ ( 𝑛 𝑥 ) 𝑝 𝑥 𝑞 𝑛−𝑥 ≅ 1 √2𝜋√ 𝑛𝑝𝑞 𝑒 − ( 𝑥−𝑛𝑝)2 2𝑛𝑝𝑞 ,(p + q = 1) 즉, 이항분포에서 n이 충분히 커질 때 사거니 x번 일어날 확률은 평균과 분산이 이항분포의 그것 인 정규분포의 확률밀도함수로 가까이 간다는 것이고, 이는 정규분포가 이항분포와 비슷한 분포 로서 세상의 많은 현상들을 설명하는데 이용될 수 있음을 의미한다. 이 정규분포는 수학자 Gauss 에 의해서 새롭게 해석되는데 Gauss는 1809년에 쓴 논문[10]에서 오차의 법칙을 정의하고 있으며 이는 다음과 같다. (1) +방향의 오차와 –방향의 오차가 일어날 확률은 같다. : x=0에 대한 대칭함수 (2) 작은 오차가 큰 오차보다 일어날 확률이 많다. : Concave. (3) 전체 확률은 1이다. (4) 전체 관측치를 𝑥1, 𝑥2,… 𝑥 𝑛 이라 했을 때 실제 값으로 가장 가능성이 높은 것은 전체 관측 치의 평균이다. : Maximum likelihood estimator 생각해보면 위 4가지의 법칙은 매우 자연스럽게 이해가 되는 부분이며 대부분의 관측치가 이 법 칙들을 따를 것이라고 생각할 수 있다. 이 4가지 법칙만 가지고 수학적으로 오차의 분포를 유도 할 수 있는데 이것이 놀랍게도 정규분포의 식과 일치하게 되고, 따라서 정규분포는 세상의 대부 분의 사건에 적용할 수 있는 분포라고 생각할 수 있다. 이런 사실을 토대로 정규성 검정에 숨겨 진 심리를 이해할 수 있는데, 대부분의 사건들이 오차의 법칙을 따를 것이라고 생각이 되므로, 정 규분포를 따를 것이라고 여길 수 있고 따라서 웬만하면 이 생각을 바꾸지 않겠다는 것이다. 또한 연구를 진행하는 사람의 입장에서는 정규분포 가정이 깨진다면 잘 알려진 통계량들을 사용하기 어렵기 때문에 정규분포라는 생각을 가급적 바꾸지 않겠다는 마음을 가질 수도 있을 것이다. 허 나 오늘날에는 poisson, gamma, beta distribution 등 정규분포를 따르지 않는 분포들이 많이 알려 져 있어 무작정 정규분포 가정을 유지하는 것은 위험한 생각일 수 있을 것이다. 그 다음으로는 독립 2표본 t-test를 살펴보겠다. 표본분산이 모분산의 unbiased estimator임이 잘 알려져 있으며, 두 집단의 모분산이 같다는 가정 하에서는 두 집단의 sample수에서 1을 뺀 것 을 가중치로 한 표본분산의 평균이 공통분산의 unbiased estimator라는 것이 알려져 있다. 이 공 통분산을 이용하여 standard error를 구하고, 두 집단의 표본평균 차이를 standard error으로 나눈 통계량이 t분포를 따른다는 것을 이용하여 평균이 같다는 귀무가설을 검정하게 된다. 허나 두 집 단의 모분산이 같다는 가정이 없다면 공통분산의 개념을 사용할 수 없고 따라서 t-분포를 이용할 수가 없는데, 이때는 두 집단의 관측치의 평균 차이의 분산을 그냥 구한 후, 관측치의 평균차이가
  • 7. t-분포와 비슷한 분포를 따를 것이라는 가정을 한 후 두 집단의 관측치 차이의 평균과 분산을 가 장 잘 설명하는 t-분포의 자유도를 구하여 그 자유도의 t-분포를 따른다고 가정하고 가설검정을 하게 된다[11]. 이를 토대로 등분산성 검정에 숨겨진 심리를 생각해 볼 수 있는데, 등분산 가정이 깨지게 되면 t-분포라 할 수 없어서 근사를 거쳐 복잡한 계산을 해야 하기 때문에 가급적이면 등 분산이라는 생각을 바꾸지 않겠다는 심리가 깔려 있는 것이라 생각할 수 있다. 허나, 따로 떨어진 두 집단의 모분산이 같다는 가정은 앞의 정규분포에 대한 가정과는 달리 자연스럽게 이해되지 않 는 부분이며, 실상 그렇지 않은 경우가 훨씬 많아 무작정 이를 이용하면 올바르지 못한 가설 검 정을 하게 될 수 있다[7]. 또한 오늘날에는 컴퓨터를 이용하여 등분산 가정이 없을 때의 통계량을 쉽게 계산할 수 있고 또 여러 통계 프로그램에서 이를 제시해 주고 있으므로 등분산임이라고 확 신할 수 있는 경우를 제외하고는 등분산 가정을 이용한 가설검정을 하는 것에 대해 신중한 판단 을 해야 할 것이다. 6. 바람직한 논쟁과 올바른 통계적 가설검정에 대하여. 2장부터 4장까지 논쟁 시 설득하려는 마음, 설득당하지 않으려는 심리에서 나올 수 있는 현상들 을 통계학의 가설검정의 원리로 설명해 보았고 실제 있었던 타블로 학력검증 논쟁을 이 원리로 해석해 보았다. 어떠한 주제의 논쟁을 하던 본문에 제시된 방법들을 효과적으로 사용하거나 상대 방이 이런 방법들을 사용하는 것을 알고 대처한다면, 상대적으로 부족한 근거를 가지고도 자신의 주장을 효과적으로 펼칠 수는 있을 것이나, 소모적인 논쟁을 유발하기도 쉽다는 점을 명심해야 할 것이다. 5장에서는 몇 가지 통계학의 가설검정의 기저에 깔린 인간의 심리를 이야기했는데, 연구를 수행 하여 통계학적 가설검정을 할 때, 가설검정이 의도하고 있는 부분이 연구자 자신이 생각하고 있 는 부분과 맞는지 고민을 할 필요성이 있다고 할 수 있으며 이런 고민의 결과를 반영하는 것이 올바른 결과를 도출하는데 큰 도움이 될 것이다. <References> 1. Schopenhauer (2004) The Art of Always Being Right: Thirty Eight Ways to Win When You Are Defeated: Gibson Square Books Ltd. 2. FISHER R (1935) The Design of Experiments. 3. Stephens MA (1986) Tests based on EDF statistics. Goodness-of-fit Techniques 68: 97-193. 4. Shapiro SS, Wilk MB (1965) An analysis of variance test for normality (complete samples). Biometrika 52: 591-611. 5. Moore DS (1986) Tests of chi-squared type. Goodness-of-fit Techniques: 69-70. 6. LEVENE H (1960) ROBUST TESTS FOR EQUALITY OF VARIANCES1. Contributions to probability and statistics: 278. 7. Moser BK, Stevens GR (1992) Homogeneity of variance in the two-sample means test. American Statistician: 19-21. 8. De Moivre A (1926) Approximatio ad summam terminorum binomii (a+ b) n in seriem expansi. Supplement to Miscellanea Analytica, London 1733.
  • 8. 9. De Moivre A (1738) The doctrine of chances. 10. Gauss CF (1809) Theoria motus corporum coelestium in sectionibus conicis solem ambientium [Theory of the Motion of the Heavenly Bodies Moving about the Sun in Conic Sections]. Nouvelle Memoire de I'Academy Royale des Sciences et Belles-Lettres de Berlin; Oeuvres. 11. Welch BL (1947) The generalization ofstudent's' problem when several different population variances are involved. Biometrika 34: 28-35.