5-1. 결정 트리
결정트리란?
- 결정트리는 여러 개의 조건문으로 구성된 트리를 통해 데이터를 분류하는 알고리즘이다. 일반적인 나무와 달리 결정 트리는 아래쪽으로 가지가 뻗어나가는 형태이다.

결정트리의 구성 요소
1. 노드
- 노드는 하나의 조건문을 지칭하는 용어로 각 노드는 조건문, 총 샘플 수, 클래스별 샘플 수와 불순도로 구성되어 있다.
- 리프 노드: 결정 트리 가장 아래쪽에 위치한 노드로 자식노드가 없다.
- 루트 노드: 결정트리 가장 위쪽에 위치한 노드로 부모 노드가 없다.

2. 가지
- 하나의 노드에서 데이터는 조건문을 만족하는 지, 않하는 지에 따라 서로 다른 노드로 전달되게 되는데 이렇게 두개의 노드를 잇는 선을 가지라고 합니다.
- 이렇게 가지로 이어진 노드들 중 위에 있는 노드를 부모 노드, 아래 있는 노드를 자식 노드라고 합니다.
-노드와 가지를 통한 데이터의 흐름
데이터들은 노드 조건문의 참 거짓에 따라 루프 노드부터 리프 노드까지 각기 다른 루트를 통해 도달하게 되고 리프 노드에서 최종적인 클래스가 정해진다.
-리프 노드에서의 클래스 결정 기준
위의 과정에 따라 모든 샘플은 최종적으로 리프 노드에 도달하게 된다. 각 리프 노드에서는 전체 클래스들 중 샘플의 개수가 가장 많은 클래스로 전체 샘플의 클래스를 정하게 된다.
불순도 - 조건문 생성 기준