precision은 정답과는 무관하게 데이터들끼리 얼마나 같은 경향을 나타내는가 데이터들끼리 얼마나 멀리 분포하는지, 얼마나 좁게 분포하는지 variance에 관한 이야기 accuracy는 분포하는 경향과는 무관하게 데이터 하나하나가 정답을 맞췄는지 아닌지 bias에 관한 이야기 빨간 점이 정답과는 상관없이 비슷한 경향, 가깝게 뭉쳐있으면 precision이 높다고함 반면 accuracy는 정답인지 아닌지를 판단함 2번과 4번을 보면 정답에 있더라도 뭉쳐있지 않은 2번은 precision이 떨어지고 4번은 precision이 높음 3번과 4번을 보면 정답이 아니더라도 뭉쳐있는 둘은 precision이 높음
1. 조건부확률 P(A|B)는 사건 B가 일어난 상황에서 사건 A가 발생할 확률 P(A∩B)=P(B)P(A|B) 2. 조건부확률 시각화 민감도, 특이도, 정밀도,재현율, F1score를 구분함 그림의 정밀도가 정확도 귀무가설 H0 :음성, 대립가설 H1 :양성 실제로 걸리진 않았는데(귀무가설이 참) 걸렸다고 검진(귀무가설 기각)한 경우 False positive는 1종오류 실제로 걸렸는데(대립가설이 참) 검진하지 못한(대립가설 기각) 경우 False Negative는 2종오류 보통 정확도는 False Positive가 커질 경우 떨어진다(식만 봐도 알 수 있음) 보통 1종오류보다 2종오류가 심각하여, 1종오류를 조금 희생하더라도 2종오류를 줄이려고 한다 위에 1종,2종오류 의미만 보더라도 실제로 걸렸는데..
1. 문제제기 class간 불균형 데이터를 classification할 때 모델이 데이터가 많은 class(다수 class)에 분류하려는 경향이 있다는 것은 잘 알려진 사실 왜냐하면 class 1과 0이 97:3으로 나뉘어져있다고 해보자 모델이 전체 데이터를 예측할 때 전부 class 1로 예측하면 무려 97% 정확도를 얻는다 그러면 여기서 문제 데이터가 적은 소수 클래스의 민감도가 낮아지는가?? 2. 생각 소수 클래스의 민감도라는 것이 도대체 무슨 말이지? 내가 아는건 이런 혼동행렬에서 민감도는 실제 긍정인 것중에 모델이 긍정이라고 예측한 것의 비율 TP/(TP+FN) 특이도는 실제 부정인 것중에서 모델이 부정이라고 예측한 것의 비율 TN/(FP+TN) 정밀도는 모델이 긍정이라고 예측한 것중에서 실제 ..
1. 혼동행렬 완성 ⓐ예측을 기준으로 예측의 P, N을 그대로 쓴 다음에 ⓑ예측 = 실제이면 T를 붙이고 예측 != 실제이면 F를 붙인다 2. 민감도 특이도 정밀도 재현율 실제를 기준으로 묶어서 민감도와 특이도 민감도 = 재현율 대칭방향으로 정밀도 민감도 = TPTP+FN = 재현율 특이도 = TNFP+TN 정밀도 = TPTP+FP 3. F1 score 재현율과 정밀도의 조화평균 조화평균이란? 역수의 산술평균의 역수 F1=11재현율+1정밀도2=2×재현율×정밀도재현율+정밀도 4. TPR, FPR??? 1에서 그린 혼동핼렬 표를..
내 블로그 - 관리자 홈 전환 |
Q
Q
|
---|---|
새 글 쓰기 |
W
W
|
글 수정 (권한 있는 경우) |
E
E
|
---|---|
댓글 영역으로 이동 |
C
C
|
이 페이지의 URL 복사 |
S
S
|
---|---|
맨 위로 이동 |
T
T
|
티스토리 홈 이동 |
H
H
|
단축키 안내 |
Shift + /
⇧ + /
|
* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.