x축 : 수용력 >> 은닉층의 개수 , 은닉층 노드의 개수
은닉층의 개수를 늘려 더 복잡한 형태로 표현 > 모델의 수용력이 커짐
y축
학습오차 : 학습 데이터에 대한 오차
테스트 오차 : 테스트 데이터에 대한 오차
generalizaion gap 일반화 차이 = 학습오차 - 테스트 오차
수용력이 커질수록 학습오차는 줄어드나 테스트 오차는 줄어들다가 다시 증가하여 일반화 차가 커진다. >> overfitting 발생
학습 오차 큼 | 학습 오차 작음 | |
---|---|---|
일반화 차이 큼 | 언더피팅 | 오버피팅 |
일반화 차이 작음 | 언더피팅 | 이상적인 상태 |
언더피팅
학습오차가 클 때
분산이 작고 편차가 클 때
오버피팅
학습오차는 작은데 테스트 오차가 클 때
분산이 클 때
train data : 학습에 사용하는 데이터 모델을 학습하는 데 사용된다.