누적분포함수와 분위수(quantile)의 관계

quantile이라고 부르는 것은 잘 알려진 일반적인 정의?라고 한다면

 

$0<p<1$일 때 100p 백분위수는 데이터 set을 오름차순으로 정렬했을 때 전체 데이터의 100p%가 이하에 있고 100(1-p)%가 이상에 있을 때 그러한 수를 100p 백분위 수라고 부른다

 

예를 들어 자료값이 1,2,3.,,,100으로 100개가 있다면 제1 사분위수라고 불리는 25백분위수는 25%가 밑에 있고 75%가 위에 있는 25가 됩니다.

 

그런데 이 말을 조금 더 수학적이고 통계학적으로 멋있게 바꾼다면

 

이산형도 가능하지만 편의상 연속형을 가정하고

 

확률변수 $X$가 확률밀도함수 $f(x)$와 누적확률분포함수 $F(x)$를 가진다고 한다면 $0<p<1$에 대하여 100p 백분위수 $\pi  _{p}$는 다음과 같은 식을 만족시킨다.

 

$$p=  \int _{- \infty } ^{\pi  _{p}} {f(x)dx=F( \pi  _{p} )}$$

 

누적확률분포함수는 확률밀도함수가 0이 아닌 구간에서 일대일대응으로 역함수를 가지는 증가함수이고

 

그러므로 100p 백분위수 $\pi  _{p}$는 누적확률분포함수의 역함수를 이용하여 $$\pi  _{p} =F ^{-1} (p)$$를 만족시킵니다.

 

이런 의미에서 누적확률분포함수의 역함수를 quantile function 혹은 percentile point function이라고 부릅니다.

TAGS.

Comments