Loading...
2022. 4. 7. 02:27

재현율(recall)에 대해 정확히 알기

1. 문제제기 class간 불균형 데이터를 classification할 때 모델이 데이터가 많은 class(다수 class)에 분류하려는 경향이 있다는 것은 잘 알려진 사실 왜냐하면 class 1과 0이 97:3으로 나뉘어져있다고 해보자 모델이 전체 데이터를 예측할 때 전부 class 1로 예측하면 무려 97% 정확도를 얻는다 그러면 여기서 문제 데이터가 적은 소수 클래스의 민감도가 낮아지는가?? 2. 생각 소수 클래스의 민감도라는 것이 도대체 무슨 말이지? 내가 아는건 이런 혼동행렬에서 민감도는 실제 긍정인 것중에 모델이 긍정이라고 예측한 것의 비율 TP/(TP+FN) 특이도는 실제 부정인 것중에서 모델이 부정이라고 예측한 것의 비율 TN/(FP+TN) 정밀도는 모델이 긍정이라고 예측한 것중에서 실제 ..

2022. 1. 29. 02:32

데이터 시험 단골손님인 혼동행렬(confusion matrix) 민감도 특이도 완전정복

1. 혼동행렬 완성 ⓐ예측을 기준으로 예측의 P, N을 그대로 쓴 다음에 ⓑ예측 = 실제이면 T를 붙이고 예측 != 실제이면 F를 붙인다 2. 민감도 특이도 정밀도 재현율 실제를 기준으로 묶어서 민감도와 특이도 민감도 = 재현율 대칭방향으로 정밀도 민감도 = $\frac{TP}{TP+FN}$ = 재현율 특이도 = $\frac{TN}{FP+TN}$ 정밀도 = $\frac{TP}{TP+FP}$ 3. F1 score 재현율과 정밀도의 조화평균 조화평균이란? 역수의 산술평균의 역수 $$F1 = \frac{1}{\frac{\frac{1}{재현율} + \frac{1}{정밀도}}{2}} = \frac{2 \times 재현율 \times 정밀도}{재현율+정밀도}$$ 4. TPR, FPR??? 1에서 그린 혼동핼렬 표를..