본문 바로가기
코드스테이츠 Ai Boostcamp

[Tree Based Model]Random Forests(랜덤 포레스트)

by mintee
728x90

랜덤포레스트(Random Forests)


  • 랜덤포레스트 모델을 이해하고 문제에 적용할 수 있습니다.
  • 순서형인코딩(Ordinal encoding) 과 원핫인코딩을 구분하여 사용할 수 있습니다.
  • 범주형 변수의 인코딩 방법이 트리모델과 선형회귀 모델에 주는 영향 이해합니다.

Warm up


오늘 배우는 랜덤포레스트 모델에 대해서 다음 영상을 시청하고 질문에 답해보세요:

  • StatQuest: Random Forests Part 1 - Building, Using and Evaluating
    • 랜텀포레스트가 결정트리와 어떻게 다를까요?
      결정트리는 상부에서 생긴 에러가 하부까지 내려오거나, 트리 깊이에 따라 과적합이 생기는 단점이 있는데 앙상블 모델인 랜덤포레스트로 이러한 문제를 해결할 수 있음
    • 배깅(Bagging)이 무슨 뜻입니까?
    • Out-Of-Bag(OOB) sample의 역할이 무엇이지요?

데이터가 선형이든 비선형이든, 여러분들이 분류문제를 풀어야 한다면 랜덤포레스트를 먼저 적용해 보시기를 바랍니다.

앞서 배운 결정트리모델은 한 개의 트리만 사용하기 때문에 한 노드에서 생긴 에러가 하부 노드에서도 계속 영향을 주는 특성이 있습니다. 그리고 트리의 깊이에 따라 과적합되는 경향이 있습니다. 이러한 문제는 앙상블모델인 랜덤포레스트를 사용하면 쉽게 해결할 수 있습니다!

랜덤포레스트


728x90

댓글