결정 트리 결정 트리는 예/아니오에 대한 질문을 이어나가면서 정답을 찾아 학습하는 알고리즘 불순도는 결정 트리가 최적의 질문을 찾기 위한 기준 사이킷런은 지니 불순도와 엔트로피 불순도를 제공 정보 이득은 부모 노드와 자식 노드의 불순도 차이를 나타내며 결정 트리 알고리즘은 정보 이득이 최대화되도록 학습함 가지치기는 결정 트리의 성장을 제한하여 훈련 세트의 과대적합을 막는 방법으로 사이킷런의 결정 트리 알고리즘은 여러 가지 가지치기 매개변수를 제공 특정 중요도는 결정 트리에 사용된 특성이 불순도를 감소하는데 기여한 정보를 나타내는 값 교차 검증과 그리드 서치 검증 세트는 하이퍼파라미터 튜닝을 위해 모델을 평가할 때, 테스트 세트를 사용하지 않기 위해 훈련 세트에서 다시 떼어낸 데이터 세트 교차 검증은 훈련..