//애드센스//
반응형

 

 

가장 흔히 쓰는 Trend를 예측하는 forecasting 모델에는 회귀분석(regression analysis)과

홀트의 트렌드 모델(Holt’s trend model)이 있습니다.

이번 포스팅에서는 회귀모델(Regression model), 그 중에서도 선형(linear) 회귀모델에 대해서 정리해 보고자 합니다. 

 

Regression model은 독립 변수(X)와 종속 변수(Y)간의 관계를 모델링하는 데 사용되는 예측 모델인데, 

선형 회귀 모델은 독립 변수와 종속 변수 간의 관계를 직선으로 모델링하는 방법입니다.

중학교 수학시간에 배웠던 1차함수를 생각하면 쉽습니다. 

 

Y = α + β·X

 

여기서 X는 독립변수 (independent variable), Y는 종속변수 (dependent variable),

α 는 절편 (intercept), β는 기울기 (slope)를 나타냅니다. 

(여기서의 α값은 지수평활법에 언급했던 α와는 다른 것입니다. 착오 없으시길..)

 

최소제곱법을 이용하여 우리가 계산해도 되지만, 엑셀에서는 클릭 몇 번 만으로 계산이 가능합니다. 

 

잔차(Residual)란 모델이 실제 데이터와 얼마나 차이가 나는지를 나타내는 값인데,  최소제곱법(Least Squares Method)에서는 회귀 모델에서 추정된 계수 값(β)를 계산하기 위해 잔차의 제곱합을 최소화하는 방식으로 계수를 추정합니다.   

 

예를 들어보겠습니다. 

우선은 기간별 데이터가 있을 것입니다. 

 

 

엑셀의 리본메뉴에서 데이터 → 데이터분석으로 들어 가시면 오른쪽 그림과 같이 '통계 데이터 분석' 팝업이 나타나고,

아래로 내려보시면 회귀 분석이 나옵니다. 

 


리본 메뉴에 데이터분석 탭이 나오지 않는 분들은 아래 포스팅을 참고하세요~

https://sman7.tistory.com/400

 

 

 


 

회귀분석 메뉴를 선택하시면, 아래의 팝업 입력창이 뜨게됩니다. 

 

여기서 Y축 입력범위(demand)와

X축 입력범위(Month)를 넣어주시고,

출력옵션에서 출력셀을 지정하시면 

눈깜짝할 사이에 분석을 해 줍니다. 

 

 

아래 캡쳐 화면이 내용이 엑셀에서 분석/요약한 자료입니다. 

 

여기서 우리가 필요한 숫자는 노락색 표기부분 입니다. 

앞서서 선형회귀모델의 식을 Y = α + β·X라고 표기한다고 말했죠?

α (Y절편) 값이 26.466667 이고 β(기울기) 값이 4.4242424라고 이해하시면 됩니다. 

 

 

'차트'에서도 해당 수식을 확인하실 수 있는데요. 

해당 표의 월별 demand로 분산형 차트를 만드신 후 데이터 값을 누르고 마우스 오른쪽 팝업메뉴에서

'추세선 추가' 선택 → '수식을 차트에 표시' 선택

아래 그림과 같이 앞서 구했던 식과 동일한 값이 표기되는 것을 확인하실 수 있습니다. 

 

 

선형 회귀분석은 트렌드를 반영한 forecasting 모델로 엑셀로 쉽게 구할 수 있으니

데이터 예측에 하나의 툴로 참고하시면 좋을 것 같습니다. 

 

Believe you can and you're halfway there.



반응형

+ Recent posts