#
예상 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
참값 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
정확도로 계산하면, 18/20이라는 결과가 나온다.
하지만,
정밀도로 계산하면, 0/1라는 결과가 나오고
민감도로 계산하면, 0/1이라는 결과가 나온다.
불균일한 dataset의 경우 정확도는 신뢰할 수 없다.
# 정밀도와 민감도의 차이
다음과 같은 모델의 예가 있다고 한다.
pred 1 0 1 0 1 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0
true 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0
- 정밀도 : 전체를 긍정이라고 예측한 비율이라고 한정할 때, 그중 실제값도 긍정인 비율 = 2/5
- 민감도 : 전체를 실제 긍정인 비율로 한정할 때, 그중 예측값도 긍정인 비율 = 2/4
결과를 보면, 분자가 동일하고 분모가 예측값이냐 실제값이냐, 즉 예측값을 중심으로 해석할 것인가 실제값을 중심으로 해석할 것 인가에 따라 다른 결과를 갖고 있음을 알 수 있다.
정밀도 : 긍정이라고 얼마나 잘 예측하였는가?
민감도 : 얼마나 잘 긍정이라고 예측하였는가?
'C Lang > machine learing' 카테고리의 다른 글
9-7. confusion matrix (0) | 2019.05.15 |
---|---|
9-5. Maximum Likelihood Estimation (0) | 2019.05.13 |
9-4. Logistic regression implementation with Numpy (0) | 2019.05.13 |
9-3. logistic regression cost function (0) | 2019.05.08 |
9-2. Sigmoid function (0) | 2019.05.08 |