누적분포함수와 분위수(quantile)의 관계
quantile이라고 부르는 것은 잘 알려진 일반적인 정의?라고 한다면
$0<p<1$일 때 100p 백분위수는 데이터 set을 오름차순으로 정렬했을 때 전체 데이터의 100p%가 이하에 있고 100(1-p)%가 이상에 있을 때 그러한 수를 100p 백분위 수라고 부른다
예를 들어 자료값이 1,2,3.,,,100으로 100개가 있다면 제1 사분위수라고 불리는 25백분위수는 25%가 밑에 있고 75%가 위에 있는 25가 됩니다.
그런데 이 말을 조금 더 수학적이고 통계학적으로 멋있게 바꾼다면
이산형도 가능하지만 편의상 연속형을 가정하고
“확률변수 $X$가 확률밀도함수 $f(x)$와 누적확률분포함수 $F(x)$를 가진다고 한다면 $0<p<1$에 대하여 100p 백분위수 $\pi _{p}$는 다음과 같은 식을 만족시킨다.
$$p= \int _{- \infty } ^{\pi _{p}} {f(x)dx=F( \pi _{p} )}$$
누적확률분포함수는 확률밀도함수가 0이 아닌 구간에서 일대일대응으로 역함수를 가지는 증가함수이고
그러므로 100p 백분위수 $\pi _{p}$는 누적확률분포함수의 역함수를 이용하여 $$\pi _{p} =F ^{-1} (p)$$를 만족시킵니다.
이런 의미에서 누적확률분포함수의 역함수를 quantile function 혹은 percentile point function이라고 부릅니다.
'다시보는 통계학' 카테고리의 다른 글
몬테카를로(Monte-Carlo) 시뮬레이션에 대한 이론적인 설명 (0) | 2021.12.21 |
---|---|
경험분포함수(empirical distribution function) (0) | 2021.12.08 |
분포함수에 관한 중요한 정리(theorem) (0) | 2021.12.07 |
누적확률분포함수(cumulative probability distribution)에 대하여 (0) | 2021.12.06 |
확률(probability)과 가능도(likelihood)는 어떻게 다를까? (0) | 2021.11.18 |