728x90
랜덤포레스트(Random Forests)
- 랜덤포레스트 모델을 이해하고 문제에 적용할 수 있습니다.
- 순서형인코딩(Ordinal encoding) 과 원핫인코딩을 구분하여 사용할 수 있습니다.
- 범주형 변수의 인코딩 방법이 트리모델과 선형회귀 모델에 주는 영향 이해합니다.
Warm up
오늘 배우는 랜덤포레스트 모델에 대해서 다음 영상을 시청하고 질문에 답해보세요:
- StatQuest: Random Forests Part 1 - Building, Using and Evaluating
- 랜텀포레스트가 결정트리와 어떻게 다를까요?
결정트리는 상부에서 생긴 에러가 하부까지 내려오거나, 트리 깊이에 따라 과적합이 생기는 단점이 있는데 앙상블 모델인 랜덤포레스트로 이러한 문제를 해결할 수 있음
- 배깅(Bagging)이 무슨 뜻입니까?
- Out-Of-Bag(OOB) sample의 역할이 무엇이지요?
- 랜텀포레스트가 결정트리와 어떻게 다를까요?
데이터가 선형이든 비선형이든, 여러분들이 분류문제를 풀어야 한다면 랜덤포레스트를 먼저 적용해 보시기를 바랍니다.
앞서 배운 결정트리모델은 한 개의 트리만 사용하기 때문에 한 노드에서 생긴 에러가 하부 노드에서도 계속 영향을 주는 특성이 있습니다. 그리고 트리의 깊이에 따라 과적합되는 경향이 있습니다. 이러한 문제는 앙상블모델인 랜덤포레스트를 사용하면 쉽게 해결할 수 있습니다!
랜덤포레스트
728x90
'코드스테이츠 Ai Boostcamp' 카테고리의 다른 글
[트리모델]Evaluation Metrics for Classification 평가지표 (0) | 2021.06.24 |
---|---|
[트리모델]Model Selection 모델선택 방법 (0) | 2021.06.24 |
[Tree Based Model]Decision Trees(의사결정나무) (0) | 2021.06.15 |
[선형모델]Multiple Regression(다중선형회귀) (0) | 2021.06.12 |
[선형모델]Simple Regression(단순선형회귀) (0) | 2021.06.12 |
댓글