![]()
![]()
목차
1. 기획 및 조사
2. 개발 및 검증
본문내용
1-1. 알고리즘 선정 이유 및 원리 파악
결정 트리(Decision Tree)는 지도 학습(Supervised Learning)에서 사용되는 머신러닝 알고리즘 중 하나이다. 이 알고리즘은 데이터를 분석하고 특정 기준에 따라 여러 개의 의사 결정 규칙을 만들어내는 방식으로 동작한다. 이러한 의사 결정 규칙들을 트리 구조로 나타내기 때문에 ‘결정 트리’라는 이름이 붙었다.
의사 결정 트리는 금융, 의료, NLP, 추천 시스템 및 프로세스 최적화 내에서 주로 사용되는데, 이는 다양한 도메인에 걸친 의사결정 트리의 다양성을 보여주고 많은 산업에서 실제 문제를 해결하는 데 있어 의사결정 트리의 유용성을 강조한다. 이러한 이유로 결정 트리 알고리즘을 선정하였다.
위의 표에서 결정 트리는 데이터에서 다음을 학습한다. if-then-else 결정 규칙 세트를 사용하여 사인 곡선을 근사한다. 더 깊은 트리가 많을수록 의사 결정 규칙이 더 복잡해지고 모델이 더 적합하다.
결정 트리의 원리는 다음과 같다:
①트리 구조 생성: 데이터셋을 분할시키는 규칙을 찾기 위해 트리 구조를 생성한다. 이때, 데이터의 특성을 기반으로 분할 규칙을 정하며, 각 분할은 트리의 노드(node)로 표현된다. 트리의 맨 위에 있는 노드를 ‘루트 노드(root node)’라고 하며, 이 노드에서부터 시작하여 하위 노드로 나뉜다.
②분할 규칙 찾기: 데이터셋을 가장 잘 구분할 수 있는 특성과 해당 특성의 분할 기준을 찾는다. 이를 위해 다양한 알고리즘과 지표들이 사용될 수 있다. 일반적으로는 특성의 정보 이득(Information Gain)이나 지니 불순도(Gini Impurity) 등의 지표를 사용하여 분할 기준을 선택한다.
출처 : 해피캠퍼스
답글 남기기