27장 평균 인간

1. 평균이 참에 가장 가까운 이유

 

산업혁명이 막 동튼 19세기 초 유럽에서 확률과 통계는 젊은 학문이었다.

 

통계는 주로 물리학과 천문학에 이용되었다.

 

그런데 물리학은 실험을 3번하면 3번 모두 다른 값이 나오기 마련이었고, 천체의 움직임도 측정할 때마다 다른 결과가 나왔다.

 

측정할 때마다 결과가 다르지만 참값이 하나라면 어떤 값이 참값에 가장 가까운가?

 

빛의 속도를 측정하는 실험을 3번 반복했더니 결과가 29.6만km/s, 30만km/s, 30.1만km/s 나왔다고 하자.

 

가운데 값인 중앙값 30만km/s가 참인가?  또는 평균인 29.9만km/s가 참인가?

 

측정된 세 값의 평균을 이용하는 것이 지금은 자연스럽지만, 당시에는 받아들여지기 어려운 개념이었다.

 

어떤 실험에서도 평균값 29.9만km/s는 나오지 않았기 때문이다.

 

관측되지 않은 수가 어떻게 참일 수 있을까?

 

천문학자나 다른 분야의 실험과학자들이 평균을 중앙값보다 애용한 것은 수학의 거장 가우스 덕분이다.

 

가우스는 관측값들은 미지의 참값을 추정하는데 쓰여야 한다고 생각했다.

 

그렇다면 어떤 추정값이 가장 좋은가?

 

측정 오차가 가장 작은 값이다.

 

관측값이 셋이라면 오차도 셋이다.

 

오차는 양수이거나 음수일 수 있으니 제곱해서 모두 양수로 만든 뒤 더한다.

 

이 오차제곱합을 가장 작게 만드는 추정값이 곧 평균이다.

 

현대에서도 쓰이는 통계적인 논리이다. 이 논리에 의한 미지수의 추정법을 '최소제곱법'이라고 부른다.

 

가우스의 최소제곱법은 회귀분석에서 추세의 추정에 쓰이는 기본적인 방법이다.

 

가우스는 이에 그치지 않았다.

 

현대에도 통용되는 확률적인 논리도 동원했다. 가우스의 확률적 추론을 간단히 말하면 이렇다.

 

측정값은 '평균값' 주변에 정규분포 형태로 나타나므로 측정값들의 평균이 가장 좋은 추정값인 셈이다.

 

천문학자이기도 했던 가우스는 '평균'을 이용해 왜행성 세레스가 다음에 관측될 위치를 정확히 예측하는 것으로 평균의 가치를 실증했다.

 

 

2. 평균 인간

 

벨기에의 천문학자인 아돌프 케틀레는 천문학에서 쓰이던 평균의 개념을 인간과 사회현상에 적용한 것으로 유명하다.

 

인간 사회가 작동하는 메커니즘은 물론 매우 복잡하지만,

 

관찰하는 값들이 '평균+오차'형태라면 이 평균을 추론하는 것으로 사회 메커니즘을 대략 알 수 있다

 

케틀레는 <인간과 인간의 능력 개발에 관한 논의, 사회물리학 시론>에서 인간의 표준에 대해 정의했다.

 

예를 들면 다음과 같다.

 

스코틀랜드 병사 5738명의 가슴둘레를 잰 뒤에 표준적이거나 전형적인 스코틀랜드 남성의 가슴둘레는 병사들의 평균인 40인치이다.

 

케틀레는 이상적인 표준인간을 '평균 인간'이라고 불렀다.

 

이 평균 인간이 바로 신이 의도한 인간의 기준이라는 것이다.

 

실제 사람들은 이 평균 인간에 '오차'가 붙어 탄생한다고 해석할 수 있다.

 

케틀레의 평균 인간 개념은 사회학을 포함해 산업에도 지대한 영향을 미쳤다.

 

지금 눈을 감도 미국 또는 중국 사람을 떠올려보자.

 

어떤 전형(stereotype)이 그려지는가? 

 

대학교수를 떠올려보자. 어떻게 생겼는가? 

 

당신이 떠올리는 그 이미지가 곧 '평균' 대학교수의 모습일 것이다.

 

중산층이라는 단어 역시 평균 인간 개념의 일종이다.

 

케틀레 생전에 시작된 산업혁명 시대에는 의복의 대량생산이 가능해졌다.

 

어떤 크기의 의복을 생산했을까?

 

평균 인간 크기의 의복을 생산하면 충분했다. 평균주의는 사회와 산업의 극단적인 효율화를 이뤄냈다.

 

복잡하고 고도화된 현대에는 평균 인간과 다른 차이를 오차가 아닌 개성으로 받아들이는 것이 더 효율적일 수 있다.

 

미국의 교육심리학자인 토드 로즈는 <평균의 종말>에서 평균 인간은 없다며, 평균 잣대로 평가할 때 사회가 불행해진다는 것을 역설했다.

 

 

3. 특성이 많을수록 평균에서 멀어진다

 

평균 인간이 없다는 것은 역설적으로 확률과 통계를 이용해 증명할 수 있다.

 

케틀레 생각대로 실제 신이 의도한 어떤 전형, 이른바 평균 인간이 있으며 실제 사람들은 모두 평균 인간에 작은 오차가 더해서 만들어졌다고 하자.

 

키, 몸무게, 성격, 지능 등 인간의 특성은 매우 다양하다.

 

특성이 단 하나, 예를 들어 몸무게 뿐이라고 하면 평균 몸무게를 가진 사람은 매우 많다.

 

그렇다면 평균 키와 평균 몸무게를 가진 사람은?

 

여전히 많지만 몸무게만 평균인 사람보다는 그 수가 적다.

 

그렇다면 이러한 특성 100가지가 모두 평균적인 사람은 있을까?

 

확률론에 따르면 특성의 개수가 많으면 많을수록 어떤 관측값이든 평균으로부터 무한히 멀어진다.

 

차원의 저주를 생각한다면 특성이 많다는 것은 차원이 높다는 뜻이고

 

차원이 높을수록 데이터간 거리가 멀어져 공간이 sparse해진다

 

그러다보니 데이터 평균에서 관측값까지 거리는 점점 멀어진다

 

평균 인간이 실제로 있을 확률이 0%를 향해 수렴하는 것이다.

 

 

 

 

 

TAGS.

Comments