29가지 통계 개념 - ARMA 모형

시계열 모형 중 ARMA 모형에대해 알아보자.

ARMA 모형

ARMA 모형, 또는 자기회귀이동평균 (Autoregressive Moving Average) 모형은 두 가지 다항식으로 약한 정상성을 가진 확률적 시계열을 표현하는데 사용한다. 이 두 다항식 중 첫 번째는 자기회귀(autoregressive)이며, 두 번째는 이동평균(moving average)이다.

때때로 이 모형을 ARMA(p, q) 로 나타내기도 하며, 여기서 p와 q는 아래와 같다:

  • p: 자기회귀 다항식의 차수(order)
  • q: 이동평균 다항식의 차수(order)

전체 방정식은 다음과 같으며, 모수들은 그 아래에 설명되어 있다.

$X_t = c + \epsilon_t + \sum_{i = 1}^p \phi_i X_{t-i} + \sum_{i = 1}^q \theta_i \epsilon_{t-i} $

  • $\phi$: 자기회귀 모형의 모수
  • $\theta$: 이동평균 모형의 모수
  • c: 상수
  • $\epsilon$: 오차항 (백색잡음; white noise)

ARMA 모형과 ARIMA 모형과의 차이

두 모형은 비슷한 점이 많이 있다. 실제로 일반적인 자기회귀 모형인 AR(p) 와 이동평균 모형인 MA(q) 를 포함하는 것은 동일하다. AR(p) 모형은 종속변수의 이전 값을 이용해서 예측을 한다. MA(q) 모형은 시계열의 평균과 이전의 오차를 이용해서 예측을 한다.

ARMA 와 ARIMA 의 차이를 만드는 것은 차분(differencing) 이다. ARMA 모형은 정상성을 가진 모형이다. 만약 모형이 정상성을 가지고 있지 않다면, 시계열을 차분함으로써 정상 시계열로 만들 수 있다. ARIMA 모형에서 “I” 는 누적(integrated) 을 의미한다. 이는 비정상(non-stationary) 시계열을 정상(stationary) 시계열로 만들기 위해서 필요한 차분의 횟수를 나타낸다. 만약 모형에 차분이 필요 없다면 ARIMA 모형은 ARMA 모형이 된다.

적합을 위해서 d차 차분이 필요한 ARMA(p, q) 모형은 차수가 (p, d, q) 인 ARIMA 과정(process) 라고 한다. p, d, 그리고 q 값은 AIC, BIC, 그리고 경험적인 자기상관 등 다양한 방법을 통해서 선택할 수 있다(Petris, 2009)

또 다른 비슷한 모형으로는 ARIMAX 가 있는데, 이는 추가적인 설명변수(additional explanatory viariables)를 포함한 ARIMA 모형이다.

참고자료

Petris, G. et al. (2009). Dynamic Linear Models with R. Springer Science & Business Media.

출처: ARMA model

2020

사내 스터디에 대한 회고

1 minute read

회사 서비스의 추천 시스템을 개선하기 위해 팀 내에서 (아직까진 두 명이긴 하지만) 지난 두 달 동안 스터디를 진행했습니다. 얼마 전 두 번째 스터디가 끝났고 이에 대한 회고를 해보려고 합니다.

Back to top ↑

2019

GitHub 블로그에 Jupyter notebook 올리는 방법

3 minute read

여러분의 GitHub 블로그에 Jupyter notebook 을 바꿔서 올릴 수 있도록 도와줄 글이다. 직접 바꾸는 방법은 1회성 글들을 위해서 추가했고, 변환 과정과 파일 이동, 그리고 여러분의 블로그에 올리는 것까지 한 번에 할 수 있는 자동화 bash 를 만드는 자세한 방법...

Back to top ↑

less than 1 minute read

1 minute read

Back to top ↑
0 Comments