추정량의 오차는 왜 추정량의 표준편차일까?

참값 SS의 추정량 ˆS^S이 아주 좋은 성질로 E(ˆS)=SE(^S)=S을 만족한다면 불편추정량(unbiased estimator)이라고 한다.

 

참값과 추정값 사이에는 분명한 차이가 있는데 이것을 오차(error)라고 한다.

 

e=ˆSSe=^SS

 

많은 경우에 참값은 알 수 없는 값이니까 e=ˆSSe=^SS를 구하는 것은 불가능하다.

 

사실 ˆS^S이 표본추출에 의해 랜덤하니까 e=ˆSSe=^SS도 랜덤한 확률변수이므로

 

어느 정도 나오리라는 기댓값 정도는 구할 수 있다

 

오차 제곱의 기댓값 E((^(SS)2)E((^(SS)2)을 Mean square for error, 그 유명한 MSE이다.

 

이것을 최소로 하는 추정량 ˆS^S을 선택하는 것이 좋은 추정이다.

 

그런데 ˆS^S이 불편추정량(unbiased estimator) E(ˆS)=SE(^S)=S이므로

 

E((^(SS)2)E((^(SS)2)에 대입하면 E((^(SE(ˆS))2)E((^(SE(^S))2)인데 ˆS^S편차 제곱의 기댓값이므로 분산 Var(ˆS)Var(^S)와 같다

 

이런 의미에서 불편추정량의 오차 E((^(SE(ˆS))2)E((^(SE(^S))2)

 

ˆS^S의 표준편차를 구하면 된다

 

그래서 추정량의 표준편차는 표준오차라고 부른다(standard error)

 

 

728x90