1. 평균
문맥에 따라 답은 달라진다.
90이 사람 몸무게를 나타낸다면 이 숫자는 큰 수인가?
만약 단위가 킬로그램이라면 상당히 큰 수이지만, 파운드라면 작은 수이다.
얼마나 대단한 숫자인지 이 사람의 키나 성별, 나이에 따라 그 판단은 달라진다.
어떤 수의 크고 작음은 상대적인 개념이다.
그렇다면 무엇과 비교해 크고, 작다고 하는 것일까?
남자 몸무게라면 기준이 되는 몸무게는 약 70kg이고 여자 몸무게라면 55kg이다.
몸무게가 90kg인 사람은 그 사람이 속한 집단의 평균 몸무게 70kg과 비교해 더 무겁다고 할 수 있다.
18세 남성으로 이루어진 이 집단 구성원은 대략 50kg부터 90kg까지 몸무게로 분포되어 있다.
평균 몸무게는 무수히 많은 구성원의 몸무게를 대표하는 값이다.
평균은 곧 무게중심과 같다.
0부터 200까지 눈금이 적힌 널판지가 있다고 하자.
눈금 50과 150의 위치에 작은 쇠공을 놓는다면 무게중심은 100에 위치할 것이다.
한국의 18세 남성 50만 명이 모두 제 몸무게에 해당하는 위치에 작은 공을 하나씩 놓는다면 어느 위치에 무게중심이 있을까?
바로 평균 70kg이다.
어떤 숫자든 평균과 비교해 그 집단 내에서 상대적인 크고 작음을 판단한다.
2. 표준편차
크고 작음을 판단했다면 이제 그 차이가 얼마나 큰지 알고 싶다.
평균 몸무게 70kg과 비교한 90kg은 평균으로부터 얼마나 떨어져 있을까?
평균 지능지수 100점과 비교한 지능지수 90점은 얼마나 작은 값인가?
0에서 200까지 눈금이 적힌 널빤지 이야기로 돌아가자.
이 널빤지에 놓은 쇠공 50만 개는 얼마나 퍼져있을까?
어떤 공은 30kg눈금에, 어떤 공은 150kg 눈금에 놓여 있을 수 있다.
그렇지만 이런 공들은 매우 드물다.
단순히 범위만으로는 퍼진 정도를 제대로 파악할 수 없다.
다른 공들은 대부분 눈금 50에서 90 사이에 놓여 있을 것이다.
쇠공들이 무게중심으로부터 멀리 떨어진 대략의 정도를 '표준편차'라고 부른다.
30kg과 150kg에 공이 하나씩 놓여 범위가 120kg이더라도, 대부분 60~80kg 사이에 놓여 있는 경우 표준편차가 작다.
절반이 30kg 주변에 절반이 90kg 주변에 놓여있다면 표준편차가 더 크다.
18세 남성의 몸무게라면 표준편차가 10kg이다.
90kg의 몸무게는 평균보다 표준편차 2배만큼 더 무거운 것이다.
3. 두 집단을 비교할 수 있게 해주는 표준편차
표준편차는 차이를 표준화하는 역할을 한다.
90kg의 몸무게는 평균 70kg보다 20kg 더 무겁다.
동시에 평균과 2표준편차 차이가 난다.
지능지수 130은 평균 100보다 30점 더 높다.
그러나 지능지수의 표준편차 15와 비교하면 평균과 2표준편차의 차이가 난다.
90kg의 몸무게와 130의 지능지수는 각각 평균과 절대적인 차이는 다르지만 집단 분포와 비교할 때 똑같이 2표준편차의 상대적인 차이가 난다.
둘 다 같은 정도로 매우 무겁고 매우 뛰어난 점수이다.
표준편차는 세상 모든 것을 같은 단위로 잴 수 있게 만든다.

'책 읽기 > 수학보다 데이터 문해력' 카테고리의 다른 글
26장 파레토의 법칙 (0) | 2024.01.29 |
---|---|
25장 중심극한정리 (0) | 2024.01.25 |
23장 편견도 데이터가 많으면 바뀐다 (0) | 2024.01.16 |
22장 동전을 앞면으로 던질 확률을 높일 수 있나 (0) | 2024.01.12 |
21장 통계적으로 의미있는 차이와 실제로 의미있는 차이 (0) | 2024.01.11 |