decision tree의 가지치기(pruning)

위와 같이 decision tree는 recursive partitioning을 통해 각 node에서 information gain이 순간 순간 최대가 되는 방향으로 feature를 선택하고 최종 node의 entropy가 0이 될 때까지 구분을 진행합니다.

그런데 딥러닝을 많이 하신 혹시나 이 글을 읽고 계신 분은 짐작하셨겠지만 주어진 training data에 너무나 fitting된다는 단점이 있습니다.

그러니까 새로운 data가 들어올 때 사실 정확한 분류를 해줄지는 미지수라는 점입니다.

그래서 pruning이라는 방법을 수행하여 일반화 능력(generalization performance)을 올려줍니다.

일반화 능력은 딥러닝에서 모델이 train중 한 번도 보지 못한 test data에 대해서도 잘 예측할 수 있는 능력으로 정의합니다.

pruning하는 방법은 여러 가지가 있는데 기본 원리는 추상적으로 말하자면

전체 tree를 구성하고 나서 검증용 데이터를 넣어보면서 오분류율이 증가하는 지점을 찾아 가지를 쳐서 없애는 방식입니다.

없앤다고 하지만 아래의 가지들을 모두 합쳐서 상위 노드로 만들어준다고 생각해야한다고 합니다.

방법들을 예를 들어 나열하자면

1) 각 분기점에서 entropy 변화가 통계적으로 정말 유의한지 chi square test를 이용한 방법

2) 특별한 cost function을 정의하는 방법

3) error reduced pruning으로 잘라보고 나서 오분류율과 자르기 전 오분류율을 비교하여 자르고 나서 좋으면 자르는 방법

4) 그 외에 rule post pruning 등등 여러 가지가 있다고 합니다.

참고

[머신러닝] 의사결정트리 (Decision Trees)

지도학습 알고리즘 지도학습 관련 알고리즘들로는 최근접 이웃 (Nearest Neighbor) 나이브 베이즈 (Naive Bayes) 의사결정 트리 (Decision Trees) 분류 규칙 학습자 (Classification Rule Learners) 선형 회귀 (..

gomguard.tistory.com

728x90

연속형 변수를 사용한 decision tree (0)	2021.12.14
decision tree의 불순도를 측정하는 기준 (0)	2021.12.14
예시를 통해 이해하는 decision tree가 생성되는 원리 (0)	2021.12.11
분위수 변환(quantile transformation) (0)	2021.12.09
의사결정나무(decision tree)의 생성 원리 (0)	2021.12.06

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`