모델의 일반화능력(generalization performance)

모델에 학습을 계속 시켜서 train data에 대해 error를 0으로 만드는 것이 최적인가?

 

많은 경우 우리는 ‘generalization performance’가 좋은, train data가 아닌 다른 test data에 대해 잘 동작하는 모델을 만들고자 함

 

iteration이 커질 수록 train error는 계속 줄어들지만 test error는 어느 순간 커진다는 것이 알려짐

 

그림1. iteration에 따른 train error와 test error의 일반적인 분포

 

generalization performance가 좋다는 것은 이 모델의 train data의 성능이 다른 test data에서의 성능과 비슷하게 나온다는 것

 

generalization performance가 좋은 모델이 반드시 좋은 모델인가? 사실 그렇지도 않다.

 

generalization performance가 좋다고하더라도, 만약 train data에서 성능이 안좋다면 test data에서 성능도 안좋은 것이다.

 

왜냐하면 generalization performance가 좋다는 것은 train data에서의 성능과 test data에서의 성능이 비슷하다는 의미니까.

TAGS.

Comments