18장 평균과 중앙값의 차이

1. 서론

 

통계학은 과학의 한 분야이다.

 

그런데 통계학에는 물리학, 화학, 생명과학 등 다른 자연과학과 구분되는 특징이 있다.

 

바로 통계적 추론이다.

 

물리학적 추론, 생물학적 추론, 화학적 추론이라는 말은 없다. 그러나 통계적 추론이라는 말은 있다.

 

왜 그럴까? 물리학은 자연의 법칙을 설명한다.

 

물리학 이론이 맞는지 아닌지 판단하기 위해서는 자연이라는 심판자에 의존한다.

 

화학도 생명과학도 대기과학도 마찬가지이다.

 

그런데 통계학의 심판자는 누구일까? 데이터를 분석해 계산한 예측의 성공 여부가 심판자일까?

 

이것은 낚싯대와 물고기를 혼동한 대답이다.

 

분석의 결과가 물고기라면 그 물고기를 낚은 낚싯대가 통계학이다.

 

자연이라는 심판자가 없기에 통계학은 자신의 성과를 평가해줄 새로운 심판이 필요하다.

 

이 심판 과정에 통계적 추론이 필요하다.

 

 

2. 데이터를 요약하는 두가지 방법

 

데이터를 요약하는 두 방법이 있다. 평균과 중앙값이다.

 

평균은 데이터의 무게중심과 같고, 중앙값은 데이터의 값들을 순서대로 나열했을 때 가운데에 있는 값이다.

 

세 숫자로 구성된 데이터 3,5,10의 평균은 8이고, 중앙값은 5이다.

 

어느 방법이 더 좋은 데이터 요약일까?

 

둘 중 하나의 손을 들어줄 심판이 필요하다.

 

통계적 추론의 심판은 미지의 모집단과 임의의 표본이라는 도구를 사용한다.

 

데이터의 값들, 예를 들어 3, 5, 10은 어떤 모집단에서 무작위로 관측된 표본일 뿐이다.

 

평균과 중앙값이라는 낚싯대를 평가하기 위해서는 여러 상황에서 사용해보면 된다.

 

잡은 물고기는 '평균 8'과 '중앙값 5'뿐인데 어떻게 다른 상황을 만들 수 있을까?

 

무작위의 표본을 관측하는 오늘을 무한히 다시 사는 것이 한 방법이다.

 

물론 머릿속에서 다시 살아보는 것으로 충분하다.

 

평균과 중앙값 모두 모집단을 대표하는 어떤 값, 모수를 추정하는 방법이다.

 

관측값 3,5,10이 감기에 걸린 뒤 회복할 때까지 날짜라고 하자.

 

어떤 사람은 하루만에 회복할 수 있고, 어떤 사람은 3주가 지나도 아플 수 있다.

 

이 값은 사람에 따라 다르다.

 

같은 사람이라도 그날 건강 상태에 따라 회복 기간이 다를 수 있다.

 

이 모든 가능성의 모임이 곧 모집단이다.

 

모집단의 무한한 가능성은 확률분포를 이용해 표현한다.

 

내가 감기에 걸린다면 언제쯤 회복할 수 있을까?

 

이 기대 회복 일수가 곧 추정하고자 하는 모수이다.

 

기대 회복 일수는 회복에 필요한 기간의 기댓값이다.

 

기댓값은 때로는 모집단의 평균, 모평균이라고 불리기도 한다.

 

모집단 확률분포가 평균에 대해 대칭 형태라면 모집단의 모평균과 모중앙값은 같다.

 

평균에 대해 대칭인 확률분포 중 대표적인 것이 정규분포이다.

 

3. 통계적 추론

 

통계적 추론은 평균과 중앙값이라는 두 낚싯대가 잡는 물고기가 이 모수와 얼마나 비슷한지 비교한다.

 

모수와 가까울수록 대어라고 보면 된다.

 

오늘을 반복해 살면서 여러 물고기를 잡는다.

 

추정량을 반복해서 관측한다.

 

 

딱 5번 반복했을 때 위 그림을 보면 추정값들이 모수(빨간선) 주변에 있다.

 

두 낚싯대 모두 모수 주변의 추정값을 낚는다.

 

편향이 없다.

 

그런데 평균들은 중앙값들에 비해 서로 더 가깝다.

 

이를 평균의 분산(퍼진 정도)이 중앙값의 분산에 비해 작다고 한다.

 

퍼진 정도가 작으니 평균 낚싯대로 대어를 낚는 경우가 중앙값 낚싯대를 쓸 때보다 더 많다.

 

이제 두 낚싯대 중 하나를 선택할 시간이다.

 

나는 평균을 선택할 것이다. 알고 싶은 모수와 더 가까운 값이 평균이기 때문이다.

 

물론 평균이 항상 중앙값을 이기는 것은 아니다.

 

어떤 데이터에서는 평균보다 중앙값이 더 모수와 가까울 수 있다.

 

그러나 오늘을 무한히 반복해 멀티버스를 설계한다면 대부분의 경우 중앙값 낚싯대를 쓸 때보다 평균 낚싯대를 쓸 때 더 큰 대어를 낚을 수 있다.

 

 

 

 

TAGS.

Comments