전체 글(115)
-
시계열(Time series) > Diagnosing Models(ARMA, ARIMA)(2/2)
이전 포스팅(direction-f.tistory.com/68)에 이어서, 시계열 모형을 결정하기 위한 Process에 대해서 정리해보도록 하겠습니다. 이전 포스팅에서 원본 시계열 데이터의 비정상성을 차분을 통해서 정상성을 가진 시계열 데이터로 변환했으며, ACF&PACF 그래프를 활용하여, 대략적으로 모형의 차수를 결정해보았습니다. 이번 포스팅에서는 모형을 추정하고, 진단을 통해서 우리가 가지고 있는 데이터의 타당한 모형을 구축해보겠습니다. [Estimation/Diagnosis] 먼저 일차적으로 차분한 데이터를 활용하여 ARMA(1,1)과 ARMA(5,5)를 Fitting 해보겠습니다. LLR Test 결과를 보면 ARMA(5,5)일 때 Likelihood가 더 높음을 알 수 있습니다. model_re..
2020.12.27 -
시계열(Time series) > Diagnosing Models(ARMA, ARIMA)(1/2)
지난 포스팅(https://direction-f.tistory.com/67)에서 AR(1)모델을 우리는 MA(∞)으로 나타낼 수 있으며, MA(1)모형을 AR(∞)로 표현할 수 있음을 확인했습니다. 이러한 가역성 특징을 활용하여 어떤 시계열 모형울 수립할때, AR모형과 MA모형을 함께 사용하는 것이 효율적인 경우가 많습니다. ARMA모형은 AR모형과 MA모형을 섞어서 일반적으로 아래와 같이 표현됩니다. ARIMA 모형은 ARMA모형과 모양은 거의 유사하지만 우리가 가지고 있는 시계열 데이터에 대해서 차분(differencing)을 하느냐 입니다. ARMA모형은 정상성을 가진 시계열 데이터를 활용하여 모델링을 해야 하기 때문에, 시계열 데이터가 정상성을 가지지 않는다면 차분을 통해 정상 시계열 데이터로 만..
2020.12.27 -
시계열(Time series) > Moving average model(이동평균모형)
Moving average(MA) 모형은 앞선 포스팅에서 정리한 AR 모형과 함께 시계열 데이터를 활용한 모형을 수립하는데 활발히 적용되고 있는 모형입니다. AR 모형은 과거의 값을 활용하여 미래를 예측하는데 반해, MA 모형은 과거의 예측 오차를 활용하여 미래를 예측하는데 활용합니다. 가장 기본적은 MA(1) 모형은 다음과 같습니다. AR 모형과 마찬가지로 일반적인 MA(q) 모형은 아래와 같습니다. MA 모형도 AR 모형과 마찬가지로 계수 \theta가 -1과 1사이의 값을 가지게 됩니다. 정상성을 가지는 어떤 AR(1)모델을 우리는 MA(∞)으로 나타낼 수 있으며, MA(1)모형을 AR(∞)로 표현할 수 있습니다. 이러한 성질을 가역성(Invertibility)라고 표현합니다. 즉 AR모형을 과거의..
2020.12.23 -
시계열(Time series) > Autoregressive model(자기회귀모형)
Autoregrssive model(AR model)은 예측하는 문제에 있어 정말 활발히 활용되고 있는 모형입니다. 해당 모형의 기본적인 아이디어는 time t에 일어난 일을 예측하는데 제일 좋은 Predictor는 t-1에서 일어난 일이라는 것입니다. 가장 기본적인 1차 AR model은 아래와 같습니다. 좀 더 고차수를 가지는 AR model은 다음과 같이 표현할 수 있습니다. Backshift operator를 활용하면 아래와 같습니다. 위와 같이 차수 p를 가진 모형을 일반적으로 AR(p) 모형이라고 부릅니다. 전통적인 Regression과 유사하게 생겼지만, 계수 $\phi$가 -1과 1사이의 값을 가진다는 추가적인 제약조건이 필요합니다. Python을 활용하여 AR model을 추정해보겠습니다..
2020.12.21 -
시계열(Time series) > ACF, PACF
시계열 데이터의 성질을 분석하는데 있어서 중요하게 활용되고 있는 것이 상관도표(Correlogram)입니다. Correlogram은 autocorrelation function(ACF)와 partial autocorrelation function(PACF) 중 하나를 그래프로 표현한 것입니다. Correlogram을 활용하여 현 시점의 자료와 시점의 차이(lag)를 가지는 자료를 비교하여 어떤 관계를 가지고 있는지를 분석할 수 있습니다. 즉, Correlogram을 활용하여 시점의 차이의 영향력을 알아볼 수 있습니다. [자기상관함수(Autocorrelation Fucntion, ACF)] 먼저 ACF에 대해서 정리해보도록 하겠습니다. ACF는 $y_t$와 $y_{t+k}$사이에 correlation을 측..
2020.12.19 -
시계열(Time series) > White Noise, Random walk
본격적인 시계열 분석에 들어가기 앞서, 시계열 분석에서 중요한 개념인 백색잡음(White Noise)와 랜덤워크(Random walk) 개념에 대해서 정리해보겠습니다. [백색잡음(White Noise)] 백색잡음은 평균이 0이고 분산이 일정한 상수($\sigma^2$)인 정규분포를 따르며, 시간에 흐름에 따른 다른 백색잡음들과 Correlation이 0인 잡음입니다. 만약 $a_t$가 백색잡음 프로세스를 따른다고 한다면, $a_t$는 아래와 같은 성질을 만족해야 합니다. 만약에 우리가 가지고 있는 시계열 데이터에서 "시계열적인 부분"을 모두 제외한다면 남는 것은 White Noise뿐입니다. 우리가 시계열 분석을 통해 이상적으로 시계열 분석을 수행했다면, 예측 오차는 White Noise를 따를것입니다...
2020.12.06