시계열(Time series) > ARIMAX, SARIMA, SARIMAX

2021. 1. 1. 23:01계량경제학

반응형

이번 포스팅에서는 지금까지 정리했던 내용과 더불어 ARIMAX, SARIMA, SARIMAX를 활용하여, 예측하는 문제를 해결해보도록 하겠습니다.

예측에 앞서 먼저 ARIMAX, SARIMA, SRIMAX개념에 대해서 간단히 정리해보도록 하겠습니다.

[ARIMAX(Autoregressive Integrated Moving Average Exogenous Model)]

ARIMAX는 일종의 회귀모형으로 볼 수 있습니다. 다만 AR모형과 MA모형을 동시에 포함되게 됩니다. 일반적인 AR이나 MA모형은 Univariate(단변량) 시계열을 표현하는데 적절한 모형이지만 ARIMAX모형은 추가적인 Explanatory variable을 활요함으로써 다변량 시계열 데이터를 활용하기에 적절한 모형입니다.

ARIMAX의 일반적인 모형은 아래와 같습니다.

위와 같이 일반적인 ARMA모형에 외생변수 X를 포함하여 모형을 수립하게 됩니다. 해당 X변수는 Categorical변수일수도 있고 연속형 변수일 수도 있습니다. $y_t$와 X의 관측값 수는 일치해야 합니다.

[SARIMA/SARIMAX(Seasonal Autoregressive Integrated Moving Average/Exogenous Model)]

SARIMA는 말그대로 계절성을 포함하는 모형입니다. 계절성이라는 것은 어떤 특정한 패턴이 주기적으로 나타나는 거을 뜻합니다. 예를 들어 우리가 가지고 있는 시계열 데이터가 Monthly 베이스라면, 1년 주기 기반 패턴이 발생할 가능성이 높습니다. 이렇게 주기적으로 나타내는 특성은 AR 모형이나 MA모형만을 활용해서 나타내는 것은 어렵습니다. 

SARIMA모형의 일반적인 모형은 아래와 같습니다. SARIMA모형은 표현되는 항의 수가 많기 때문에, 일반적으로 Backshift Operator, B를 활용하여 나타내며 아래와 같습니다.

위 모형은  SARIMA(p,d,q)(P,D,Q,S)을 나타내는 것입니다. 이 모형은 Non-seasonalpart (p,d,q)와 $Seasonal part(P,D,Q,S)로 구분될 수 있습니다.

p: order of non-seasonal AR terms
d: order of non-seasonal differencing
q: order of non-seasonal MA terms
P: order of seasonal AR terms
D: order of seasonal differencing
Q: order of seasonal MA terms
S: length of the cycle

간단한 경우로 예를 들어 정리해보도록 하겠습니다. SARIMA(1,0,2)(2,0,1,5)의 모형은 아래와 같이 표현될 수 있습니다.

SARIMAX는  ARIMAX와 마찬가지로 기존 SARIMA 모형에, 외생변수 X를 포함하여 모형을 수립합니다.

SARIMA나 SARIMAX의 경우에는 객관적으로 차수를 정하는 것이 어려운 것 같습니다.. 따라서 실무적으로는 많은 경우에 grid search를 활용하여(계량경제학 관점에서는 옳은 방향인지와는 별개로) AIC, BIC, 예측력을 기준으로 차수를 정하는 경우가 많습니다.

다음 포스팅에서는 지금까지 정리해 왔던 ARIMA, ARIMAX, SARIMA, SARIMAX를 활용하여 예측을 수행해 보도록 하겠습니다. 

 

 

반응형