22장 동전을 앞면으로 던질 확률을 높일 수 있나

1. 동전 던지기는 공평한가 불공평한가

 

동전 던지기는 공평하다.

 

동전은 던졌을 때, 앞면과 뒷면이 나올 확률이 절반이다.

 

그러나 던졌을 때, 한쪽 면이 더 높은 비율로 나오도록 하는 것은 그리 어렵지 않다.

 

https://www.yna.co.kr/view/AKR20091208054500009

 

"동전 던지기는 불공평" | 연합뉴스

"동전 던지기는 불공평" 원하는 면 나올 확률 조작가능

www.yna.co.kr

 

 

https://m.dongascience.com/news.php?idx=63007

 

[주말N수학] 공정하다는 착각! 동전 던지기

수학동아 제공 앞면이냐 뒷면이냐! 온전히 운에 맡긴 결정을 하고 싶을 때 우린 ‘동전 던지기’를 한다. 어떠한 편견도실력도꼼수도 통하지 않는 공정한 의사 결정 방식이란 믿음 때문이다. 하

m.dongascience.com

 

 

열심히 훈련한 캐나다의 어떤 이비인후과 전문의는 앞면이 나올 확률을 무려 68%까지 높였다고 한다.

 

작은 게임을 해보자.

 

정체를 알 수 없는 어떤 사람이 동전 던지기를 반복적으로 시연한다.

 

이 게임의 목표는 동전 던지기 결과를 10번 본 뒤, 이 시연자가 공평한 사람인지 68%확률로 앞면이 나오게 할 수 있는 의사인지 알아맞히는 것이다.

 

실행 결과 10번 던져 앞면이 6번 뒷면이 4번 나왔다.

 

당신의 대답은?

 

1) 앞면이 6번 뒷면이 4번 나오는 사건은 평범한 동전 던지기 결과로 충분히 나올 수 있으므로 공평한 사람이다.

 

2) 동전 던지기 10번 한 결과 앞면일 확률은 6/10 = 60%이다. 이 값은 50%보다는 68%에 더 가까우므로 이 사람은 그 의사가 분명하다.

 

3) 공평한 사람이라면 10번 던져 앞면이 정확히 6번 나올 확률은 20.5%이다. 

 

반면 캐나다 의사가 동전 던지기를 했다면 10번 중 6면이 앞면일 확률은 21.8%이다.(이항분포로 계산가능)

 

캐나다 의사일 경우 확률이 더 높으므로 정답은 캐나다 의사이다.

 

 

2. 무엇이 정답인가

 

첫번째 답 같이 생각했다면 여러분은 '공평한 사람'이라는 귀무가설을 기각하지 못하는 통계적 가설검정을 실행한 것과 같다.

 

귀무가설 '공평한 사람'이 사실일 때, 10번 중 앞면이 6번 또는 그 이상이 나올 확률 약 37%가 p-값이다.

 

한마디로 공평한 사람이 던졌을 때에도 충분히 나올 법한 결과라는 뜻이다. 나쁘지 않다.

 

다만 귀무가설이 캐나다 의사였다면 정반대 대답을 얻게 된다.

 

두번째 답은 과정이 부실하지만 결과적으로 근사한 답을 얻은 경우이다.

 

세번째 답은 통계학을 배운 대학생이 할 법한 답이다. 

 

관측한 결과 '10번 중 6번 앞면'이 두 경우 중 어느 쪽에서 더 그럴듯한지 비교하는 논리이다.

 

통계학에서는 이 확률들을 그럴듯한 정도나 가능한 정도를 잰다는 뜻으로 가능도(likelihood)라고 부른다.

 

캐나다 의사였을 경우 확률이 더 높으므로 답은 캐나다 의사이다.

 

굳이 정답을 고르자면 세번째이다.

 

그런데 이 세 논리 모두 썩 와닿지 않는다.

 

확률이라는 좋은 도구를 불편하게 쓴 것만 같다.

 

그렇다면 네번째 답을 보자.

 

4) 데이터에 기반했을 때 시연자가 공평한 사람일 확률은 48.5%, 캐나다 의사일 확률은 51.5%이다.

 

따라서 정답은 (조심스럽게) 캐나다 의사이다.

 

어떤가? 매우 간단하면서 설득력 있는 대답이 아닌가?

 

3. 통계학의 두가지 관점

 

그런데 여기서 우리는 확률의 수수께끼에 빠져든다. 동전 던지기를 하는 시연자를 섭외한 사람은 정답을 알고 있다.

 

시연자가 공평한 사람이었다면 캐나다 의사일 확률은 0%일 수 밖에 없다.

 

반대의 경우 확률은 100%이다.

 

맞거나 틀리거나 둘 중 하나인데, 51.5%라는 애매한 숫자는 어떻게 계산된 값인가?

 

우리는 그 결과가 달랐을 수도 있는 데이터로부터 어떤 미지의 값이나 모수를 추론하려고 한다.

 

동전 던지기 게임의 경우에 모수는 동전을 던지는 사람이며, 공평한 사람과 캐나다 의사 둘 중 하나이다.

 

대부분의 통계학자는 이와 같은 모수를 이미 정해진 값이라고 생각한다.

 

만약 관심 있는 모수가 새로운 의약품을 복용했을 때 병이 완치되는 비율이라고 해보자.

 

시험하는 의약품은 이미 정해져있으므로 이 약의 효과 역시 정확히는 알 수 없지만 정해진 바뀔 수 없는 어떤 값이다.

 

데이터는 랜덤이지만 추정 대상인 모수는 랜덤이 아니다.

 

무작위가 아닌, 바뀔 수 없는 값의 확률은 논의할 필요가 없다.

 

모수의 값이 0일 때, 이 모수가 0일 확률은 100%, 0이 아닌 어떤 값일 확률은 0%이다.

 

따라서 모수의 값이 캐나다 의사일 확률을 논하는 것은 불가능하다.

 

이와 같은 논리가 20세기 초에 정립된, 지금도 유효한 주류 통계학자들의 사고방식이다.

 

이들이 고른 정답이 세번째 답이다.

 

이 논리에 동의하지 않는 통계학자들도 있다.

 

이들은 모수를 고정된 값이 아니라 랜덤인 값으로 본다.

 

동전 던지기 게임에서 동전을 던지는 사람(모수)이 무작위로 결정된다면 동전을 던진 사람이 캐나다 의사일 확률 역시 상상할 수 있다.

 

이제 네번째 답도 받아들일 수 있는 것이다.

 

네번째 답의 확률 51.5%를 계산할 때 고전적인 확률 법칙인 베이즈 법칙이 쓰인다.

 

이처럼 생각하는 통계학자들을 베이즈 학파, 그 추론 방식을 베이즈 추론이라고 부른다.

 

"신은 주사위 놀이를 하지 않는다"

 

아인슈타인이 양자역학을 부정하고 고전역학을 옹호하면서 했다는 유명한 말이다.

 

세번째, 네번째 답으로 표현되는 두 통계적 추론의 철학을 구분하기에 이처럼 좋은 말이 없다.

 

모수인 동전 던지는 사람을 신이 선택한다면?

 

주사위 놀이를 하지 않는 신이라면 세번째 답을 이끌어낸 주류 통계학의 논증이 맞고, 주사위 놀이를 즐기는 신이라면 네번째 답이 맞다.

 

 

 

TAGS.

Comments