Wilcoxon rank sum test(Mann–Whitney U test)는 등분산성을 가정하고 있다

1. 문제

 

two sample t-test에서 정규성을 가정할 수 없을 경우 Wilcoxon rank sum test를 사용하는데

 

그냥 사용해도 될까?

 

Wilcoxon rank sum test의 기본 가정은 

 

'두 집단에서 나온 모든 관측치들이 서로 독립이다'

 

'귀무가설 하에 두 집단의 분포는 서로 동일하다'

 

그러므로 두 집단의 분산이 동일하지 않다는 것은 분포가 서로 동일하지 않다는 것으로 기본 가정을 위배하게 된다

 

이런 가정을 위배한 경우는 특히, 등분산이 아니고 sample size가 다른 경우, 제1종오류를 상당히 증가시킨다고 알려져있다.

 

 

2. 등분산이 아니라면? 어떻게 해야할까

 

'두 분포가 동일하지 않은데, 두 집단의 분포차이, 확률적 순서(평균차이, 중앙값차이 등)를 검정하고싶은 경우 더 나은 방법이 있다'

 

대표적으로 Brunner-Munzel test, Fligner-Policello test가 있다

 

'두 집단의 분포가 매우 다르다면, Mann–Whitney U test는 결과 해석에 상당한 에러를 줄 수 있다. 이런 경우 t-test의 unequal variance 버전 Welch's t-test가 더 신뢰할만한 결과를 줄수있다'

 

'어떤 사람은 데이터를 rank로 변환하여 rank로 된 데이터에서 t-test를 하라고 제안한다. rank로 변환한 데이터는 분산을 보존하지 않아서 rank로 변환된 데이터에서 새롭게 분산을 계산해야하고, 이에 따라 적절한 t-test를 사용한다'

 

 

3. 어떻게 사용하나?

 

scipy.stat에서 대부분의 통계적 검정을 지원함

 

Brunner-Munzel test, Fligner-Policello test도 검색하면 scipy.stats에 있다고 나오더라

 

 

4. 통계적 검정 대응전략

 

scipy.stats에 검색해보면 다 나오더라

 

ipynb로 정리해서 github에 올리도록

 

1)데이터의 정규성검정(shapiro test) 먼저 수행

 

> 정규성을 가정할 수 없는 경우? 비모수적 검정

 

>>1-2)비모수적 독립성검정(스피어만 순위상관계수, 켄달의 타우같은 비모수적 상관계수 사용)

 

>>>1-3)비모수적검정의 등분산검정 수행(Fligner-Killeen test)

 

>>등분산인 경우

wilcoxon rank sum test

 

>>등분산이 아닌 경우

Brunner-Munzel test

 

---------------------------------------------------------------------------------------------------------------

 

> 정규성을 가정할 수 있는 경우? 모수적 검정

 

>>2-2)모수적 독립성검정(피어슨 상관계수를 이용한 상관검정)

 

>>>2-3)등분산검정 수행(bartlett test, levene's test)

 

 

scipy.stats.ttest_ind에서

 

>> 등분산인 경우 (equal_var=True)

two-sample t-test

 

>> 등분산이 아닌 경우(equal_var=False)

welch's t-test

 

https://en.wikipedia.org/wiki/Mann%E2%80%93Whitney_U_test

 

Mann–Whitney U test - Wikipedia

From Wikipedia, the free encyclopedia Jump to navigation Jump to search Nonparametric test of the null hypothesis In statistics, the Mann–Whitney U test (also called the Mann–Whitney–Wilcoxon (MWW/MWU), Wilcoxon rank-sum test, or Wilcoxon–Mann–Wh

en.wikipedia.org

 

 

 

 

 

TAGS.

Comments