분포함수에 관한 중요한 정리(theorem)

1. theorem 1

 

연속형 확률변수 $X$가 $a<x<b$ (a는 $-\infty$, b는 $\infty$여도 상관 없습니다.)에서 단조증가함수(monotonically increasing function)인 $F(x)$를 누적확률분포함수(cumulative distribution function)로 가진다고 할 때 연속형 확률변수 $Y=F(X)$uniform distribution인 $U(0,1)$을 따른다.

 

1-1) 증명

 

$Y=F(X)$uniform distribution으로 $U(0,1)$을 가진다면 확률변수 $Y=F(X)$의 누적확률분포함수 $G(y)$가 $U(0,1)$의 누적확률분포함수와 일치하면 충분합니다.

 

누적확률분포함수의 정의에 따라 $G(y)=P(Y \leq y)$인데 $Y=F(X)$이므로 $G(y)=P(F(X) \leq y)$로 바꿀 수 있습니다.

 

$F(x)$가 증가함수이기 때문에 그림으로 그리면 다음과 같습니다.

 

그림1.. 증가함수인 분포함수 F(x)에 대한 일반적인 그림

 

위 그림이 의미하는 바는 $F(X) \leq y$이면 $X \leq F ^{-1} (y)$를 만족시킨다는 것입니다.

 

따라서 $$G(y)=P(F(X) \leq y)=P(X \leq F ^{-1} (y))$$

 

그런데 우리는

 

""연속형 확률변수 $X$가 $a<x<b$ (a는 $-\infty$, b는 $\infty$여도 상관 없습니다.)에서 단조증가함수(monotonically increasing function)인 $F(x)$를 누적확률분포함수(cumulative distribution function)로 가진다"" 이라고 했습니다.

 

무슨 말이냐면

 

$F(x)=P(X \leq x)$이므로 x 대신에 $F ^{-1} (y)$를 넣는 것입니다

 

그래서 $$G(y)=P(X \leq F ^{-1} (y))=F(F ^{-1} (y))=y$$를 만족시킵니다.

 

$U(0,1)$의 누적확률분포함수가 $F(x)=x$임을 보였습니다.

 

그러므로 $Y=F(X)$uniform distribution $U(0,1)$을 따릅니다.

 

 

2. theorem 2

 

theorem 1의 역이라고도 볼 수 있는데

 

연속형 확률변수 $Y$가 $U(0,1)$을 따르고 $a<x<b$ (a는 $-\infty$, b는 $\infty$여도 상관 없습니다.)에서 단조증가함수(monotonically increasing function)인 $F(x)$가 $F(a)=0$, $F(b)=1$을 만족시키는 연속형의 누적확률분포함수(cumulative distribution function)이라고 하자. 그렇다면 연속확률변수 $X=F ^{-1} (Y)$는 $F(x)$를 누적확률분포함수(cumulative distribution function)로 가진다.

 

2-2) 증명

 

연속확률변수 $X=F ^{-1} (Y)$의 누적확률분포함수는 그 정의에 의하여 $P(X \leq x)$로 쓸 수 있는데 $X=F ^{-1} (Y)$이므로 대입하면 $P(F ^{-1} (Y) \leq x)$가 성립합니다.

 

그림2. 증가함수 F(x)의 그림

 

위 그림에서 알 수 있는 부분은 $F ^{-1} (Y) \leq x$이면 $Y \leq F(x)$라는 사실입니다.

 

그러므로 우리는 $P(F ^{-1} (Y) \leq x)=P(Y \leq F(x))$를 만족시킵니다.

 

우리는 조건에서 ""연속형 확률변수 $Y$가 $U(0,1)$을 따르고""라고 했고

 

$U(0,1)$의 누적확률분포함수는 $P(Y \leq y)=y$임을 위에서 보였습니다

 

그러므로 $$P(F ^{-1} (Y) \leq x)=P(Y \leq F(x))=F(x)$$를 만족시킵니다.

 

따라서 $X=F ^{-1} (Y)$는 누적확률분포함수로 $F(x)$를 가집니다.

 

 

TAGS.

Comments