party를 활용한 모델 기반의 재귀 분할 방법
예를 들어 특정 데이터에 회귀모델을 적합한다고 하자…. 직관적으로 scatter plot을 그리면서 회귀모델 피팅을 하게 된다. 아래 처럼.. 그러나 알다시피 오차의 분산이 일정하지 않은 잘못된 모델이 도출된다. (이 경우 가중 회귀를 쓰거나 변수 변환을 통해 모델을 튜닝해 나가는 과정이 필요하다고 학교에서 배우긴 했다.) 눈으로 보면 나쁘지 않아 보이나, 어떤 그룹 변수의 영향으로 인해 위 […]
계속 읽기