Loading [MathJax]/jax/output/CommonHTML/jax.js
 

누적분포함수와 분위수(quantile)의 관계

quantile이라고 부르는 것은 잘 알려진 일반적인 정의?라고 한다면

 

0<p<1일 때 100p 백분위수는 데이터 set을 오름차순으로 정렬했을 때 전체 데이터의 100p%가 이하에 있고 100(1-p)%가 이상에 있을 때 그러한 수를 100p 백분위 수라고 부른다

 

예를 들어 자료값이 1,2,3.,,,100으로 100개가 있다면 제1 사분위수라고 불리는 25백분위수는 25%가 밑에 있고 75%가 위에 있는 25가 됩니다.

 

그런데 이 말을 조금 더 수학적이고 통계학적으로 멋있게 바꾼다면

 

이산형도 가능하지만 편의상 연속형을 가정하고

 

확률변수 X가 확률밀도함수 f(x)와 누적확률분포함수 F(x)를 가진다고 한다면 0<p<1에 대하여 100p 백분위수 πp는 다음과 같은 식을 만족시킨다.

 

p=πpf(x)dx=F(πp)

 

누적확률분포함수는 확률밀도함수가 0이 아닌 구간에서 일대일대응으로 역함수를 가지는 증가함수이고

 

그러므로 100p 백분위수 πp는 누적확률분포함수의 역함수를 이용하여 πp=F1(p)를 만족시킵니다.

 

이런 의미에서 누적확률분포함수의 역함수를 quantile function 혹은 percentile point function이라고 부릅니다.

728x90