Loading...
2024. 1. 1. 23:45

20장 유의확률 p-값에 대하여

1. 여성이 82년 연속 더 많이 태어난다면 남성과 여성의 출생 성비는 정확히 1:1이 아니라 대략 1.05:1로 알려져 있다. 여자아이 100명이 태어날 때 남자아이 105명이 태어난다는 뜻이다. 이 사실을 처음 발긴 영국의 의사이자 과학자인 존 아버스넛은 1629년부터 1710년까지 82년 동안 영국 런던의 모든 출생 기록을 조사했는데, 해마다 태어난 여아가 남아보다 많다는 사실을 발견했다. 이것은 우연일까? 만약 출생 성비가 1:1이었다면 태어난 여아가 남아보다 우연히 많을 확률은 1/2일 것이다. 그리고 82년 동안 매해 여아가 더 많이 태어나는 사건은 매우 드문 일이다. 그러므로 출생 성비가 1:1일 수는 없다. 2의 82제곱은 4835703000000000000000000이다. 그래서 여성이 ..

2022. 5. 23. 04:16

피어슨 상관계수, 스피어만 상관계수, 켄달의 타우 완벽비교

1. 상관계수(correlation coefficient) 두 변수의 통계적 관계를 나타내는 상관관계의 정도를 수치로 나타낸 값 -1부터 1까지의 값을 가지며, 0인 경우는 상관관계가 없다고 말한다. 세가지 성질을 가지는 것이 좋다. 1)두 변수의 값이 완전한 부합이면 +1, 완전한 비부합이면 -1 2)두 변수가 서로 독립이면 0 3)두 변수에 대해 크기의 순서가 보존되는 변환을 수행해도 상관계수의 값은 변하지 않는다 수치를 확인하기 전에 산점도(scatter plot)를 먼저 그리고 수치적으로 파악하는 것이 기본 2. 피어슨 상관계수(pearson) 두 변수 X,Y의 선형적 관계(linear relationship)의 측도 선형적 관계가 강하다는 것은 선형모형에 의해 두 변수의 관계를 잘 모델링할 수 ..

2021. 10. 6. 19:45

p-value에 대한 오해

1. 문제 제기 빅데이터분석기사, ADsP를 공부하면서 p-value에 대한 정의가 이상한 것 같아서 이번 기회에 정리를 해볼려고 한다. 2. p-value에 대한 오해 2-1) p-value가 관측된 검정통계량이 귀무가설을 지지하는 방향으로 관찰될 확률? 2-2) p-value는 제1종오류를 일으킬 확률? 3. p-value의 정의 위키피디아에서 ‘In null hypothesis significance testing, the p-value is the probability of obtaining test results at least as extreme as the results actually observed, under the assumption that the null hypothesis is ..