1. theorem 1
연속형 확률변수 X가 a<x<b (a는 −∞, b는 ∞여도 상관 없습니다.)에서 단조증가함수(monotonically increasing function)인 F(x)를 누적확률분포함수(cumulative distribution function)로 가진다고 할 때 연속형 확률변수 Y=F(X)는 uniform distribution인 U(0,1)을 따른다.
1-1) 증명
Y=F(X)가 uniform distribution으로 U(0,1)을 가진다면 확률변수 Y=F(X)의 누적확률분포함수 G(y)가 U(0,1)의 누적확률분포함수와 일치하면 충분합니다.
누적확률분포함수의 정의에 따라 G(y)=P(Y≤y)인데 Y=F(X)이므로 G(y)=P(F(X)≤y)로 바꿀 수 있습니다.
F(x)가 증가함수이기 때문에 그림으로 그리면 다음과 같습니다.

위 그림이 의미하는 바는 F(X)≤y이면 X≤F−1(y)를 만족시킨다는 것입니다.
따라서 G(y)=P(F(X)≤y)=P(X≤F−1(y))
그런데 우리는
""연속형 확률변수 X가 a<x<b (a는 −∞, b는 ∞여도 상관 없습니다.)에서 단조증가함수(monotonically increasing function)인 F(x)를 누적확률분포함수(cumulative distribution function)로 가진다"" 이라고 했습니다.
무슨 말이냐면
F(x)=P(X≤x)이므로 x 대신에 F−1(y)를 넣는 것입니다.
그래서 G(y)=P(X≤F−1(y))=F(F−1(y))=y를 만족시킵니다.
U(0,1)의 누적확률분포함수가 F(x)=x임을 보였습니다.
그러므로 Y=F(X)는 uniform distribution U(0,1)을 따릅니다.
2. theorem 2
theorem 1의 역이라고도 볼 수 있는데
연속형 확률변수 Y가 U(0,1)을 따르고 a<x<b (a는 −∞, b는 ∞여도 상관 없습니다.)에서 단조증가함수(monotonically increasing function)인 F(x)가 F(a)=0, F(b)=1을 만족시키는 연속형의 누적확률분포함수(cumulative distribution function)이라고 하자. 그렇다면 연속확률변수 $X=F ^{-1} (Y)$는 F(x)를 누적확률분포함수(cumulative distribution function)로 가진다.
2-2) 증명
연속확률변수 $X=F ^{-1} (Y)$의 누적확률분포함수는 그 정의에 의하여 P(X≤x)로 쓸 수 있는데 X=F−1(Y)이므로 대입하면 P(F−1(Y)≤x)가 성립합니다.

위 그림에서 알 수 있는 부분은 F−1(Y)≤x이면 Y≤F(x)라는 사실입니다.
그러므로 우리는 P(F−1(Y)≤x)=P(Y≤F(x))를 만족시킵니다.
우리는 조건에서 ""연속형 확률변수 Y가 U(0,1)을 따르고""라고 했고
U(0,1)의 누적확률분포함수는 P(Y≤y)=y임을 위에서 보였습니다.
그러므로 P(F−1(Y)≤x)=P(Y≤F(x))=F(x)를 만족시킵니다.
따라서 X=F−1(Y)는 누적확률분포함수로 F(x)를 가집니다.
'다시보는 통계학' 카테고리의 다른 글
경험분포함수(empirical distribution function) (0) | 2021.12.08 |
---|---|
누적분포함수와 분위수(quantile)의 관계 (0) | 2021.12.08 |
누적확률분포함수(cumulative probability distribution)에 대하여 (0) | 2021.12.06 |
확률(probability)과 가능도(likelihood)는 어떻게 다를까? (0) | 2021.11.18 |
p-value에 대한 오해 (0) | 2021.10.06 |