본문 바로가기
728x90

통계2

[회귀분석] 단순/ 다중/ 릿지/ 로지스틱 머신러닝 지도학습에서 쓰이는 회귀분석 모델 머신러닝의 지도학습에서 쓰이는 통계학의 회귀분석 4가지 모델에 대해서 알아보자. (이는 공부한 것을 정리하기 위한 포스팅으로 틀린 부분이 있을 수 있습니다.) 단순선형회귀 하나의 독립변수로 종속변수를 예측할 때 쓰이는가장 기본적인 회귀분석 방법이다. 독립변수와 종속변수간의 상관관계가 어느정도 있을 때 시도할 수 있다. 공식 $$\hat{Y} = aX + b$$ 단순선형 회귀식의 모수는 예측값에서 실제값을 뺀 오차를 최소화하는 값으로 이를 구하는 공식은 아래와 같다. $$a = \frac{S_{xy}}{S_{xx}}, b = \bar{y} - a\bar{x}$$ 다중선형회귀 다중선형회귀는 단순선형 회귀에서 독립변수의 수가 2개 이상으로 늘어난 것으로 똑같이 오차를..
카이제곱검정 카이제곱 검정 : 범주 변수간의 관계성을 보기 위한 검정 방법 일원 카이제곱 검정 : 한개의 범주를 대상으로 함 이원 카이제곱 검정 : 두개 이상의 범주를 대상으로 검정 이원 카이제곱 검정 핵심 질문 : 두개 범주변수 간 관계가 존재하는가? H0 : 두 범주변수 간에 연관이 없다. H1 : 두 볌주변수 간에 연관관계가 있다. 공식 (카이제곱 통계량) = sum( (관찰횟수 - 기대횟수)^2 / 기대횟수 ) 카이제곱 통계량은 이원분류표에서의 실제 관찰 횟수에서 기대횟수를 뺀 차이를 제곱한 후 이를 기대횟수로 나눠준 값들의 합이다. 카이제곱통계량은 기대횟수로부터 벗어난 관찰횟수의 거리를 측정한 값이라고 생각하자. (어느 거리와 마찬가지로 관찰 횟수가 기대횟수와 완벽하게 일치할 경우에만 0이 되기 때문이다. ..
728x90