이동평균 모델

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

이동 평균 모델(MA)은 시계열의 현재 값을 현재 및 이전의 백색 잡음 오차 항의 선형 회귀로 나타내는 통계 모델이다. MA 모델은 q차 이동 평균 모델 MA(q)로 표기하며, 시계열의 평균, 모델 계수, 오차 항, 그리고 모델의 차수 q로 구성된다. MA 모델은 유한 임펄스 응답 필터가 백색 잡음에 적용된 것으로 해석되며, 무작위 충격이 미래 값에 직접적인 영향을 미치는 특징을 갖는다. 모델의 계수 추정은 반복 계산을 통한 비선형 커브 피팅을 필요로 하며, 자기상관 함수(ACF)를 통해 모델의 차수를 결정하고, 부분 자기상관 함수(PACF)와 함께 모델 선택에 활용된다.

이동평균 모델

개요

종류	시계열 모델
특징	현재 값은 과거의 백색 소음들의 선형 결합으로 표현됨. 모형 식별 및 추정이 비교적 쉬움. 모형의 해석이 직관적이지 않을 수 있음.

수식

MA(q) 모델	X(t) = μ + W(t) + θ₁W(t-1) + ... + θ(q)W(t-q)
설명	X(t): 시점 t에서의 시계열 값 μ: 시계열의 평균 W(t): 시점 t에서의 백색 소음 θ₁, ..., θ(q): 모수

AR 모델	과거 자신의 값으로 현재 값을 설명하는 모델
ARMA 모델	AR 모델과 MA 모델을 결합한 모델
ARIMA 모델	ARMA 모델에 차분 개념을 추가한 모델
상태 공간 모델	시계열을 확률 변수의 상태로 표현하는 모델

2. 정의

MA(q) 표기법은 q차 이동평균 모델을 나타낸다.

이동평균 모델은 시계열 분석에서 사용되는 모델 중 하나로, 현재 시점의 값을 과거 q개의 백색 잡음(오차 항)들의 가중 평균과 시계열의 전체 평균( $\mu$ )의 합으로 표현하는 방식이다. 즉, 시계열 데이터의 현재 값이 과거의 예측 불가능했던 충격(오차 항)들의 영향을 받아 결정된다고 보는 것이다.

여기서 q는 모델의 차수를 의미하며, 몇 개의 과거 오차 항( $\varepsilon_{t-1}, \dots, \varepsilon_{t-q}$ )을 현재 값( $X_t$ )을 설명하는 데 사용할지 결정한다. 각 과거 오차 항에는 모델의 계수( $\theta_1, \dots, \theta_q$ )라고 불리는 고유한 가중치가 곱해진다.

이 모델은 각 시점에서 발생하는 오차 항( $\varepsilon_t$ )들이 서로 통계적으로 독립이며, 평균이 0이고 분산이 일정한 동일한 분포(주로 정규 분포)를 따른다고 가정한다. 이동평균 모델은 후진 연산자를 사용하여 수식으로 간결하게 표현할 수 있으며, 개념적으로는 현재 값을 과거의 오차 항들에 대한 선형 회귀로 해석할 수도 있다. 모델의 구체적인 수식 표현은 하위 섹션 '수식 표현'에서 확인할 수 있다.

2.1. 수식 표현

MA(q) 표기법은 q차 이동평균 모델을 나타낸다.

: $X_t = \mu + \varepsilon_t + \theta_1 \varepsilon_{t-1} + \cdots + \theta_q \varepsilon_{t-q} = \mu + \sum_{i=1}^q \theta_i \varepsilon_{t-i} + \varepsilon_{t}$

여기서 $\mu$ 는 시계열의 평균이고, $\theta_1, \dots, \theta_q$ 는 모델의 계수이며, $\varepsilon_t, \varepsilon_{t-1}, \dots, \varepsilon_{t-q}$ 는 백색 잡음 오차 항이다. q의 값은 MA 모델의 차수라고 불린다.

이 식은 후진 연산자 B를 사용하여 다음과 같이 동등하게 작성할 수 있다.

: $X_t = \mu + (1 + \theta_1 B + \cdots + \theta_q B^q)\varepsilon_t.$

따라서 이동평균 모델은 시계열의 현재 값을 현재 및 이전 시점의 백색 잡음 오차 항 또는 임의의 충격에 대한 선형 회귀로 볼 수 있다. 각 시점에서의 임의의 충격(오차 항)은 서로 독립적이며 동일한 분포를 따른다고 가정한다. 일반적으로 이 분포는 평균이 0이고 분산이 일정한 정규 분포로 가정된다.

3. 해석

이동 평균(MA) 모델은 기본적으로 백색 잡음에 유한 임펄스 응답(FIR) 필터를 적용한 것으로 볼 수 있다. 이 모델에서 무작위 충격( $\varepsilon_t$ )이 시계열에 미치는 영향은 자기 회귀(AR) 모형과는 다른 특징을 가진다. MA 모델에서는 과거의 충격이 미래 값에 직접적으로, 그리고 유한한 기간(q 기간) 동안만 영향을 미치는 반면, AR 모델에서는 충격의 영향이 간접적이며 이론적으로 무한히 지속될 수 있다(충격 반응 참조).

3.1. FIR 필터 관점

이동 평균(MA) 모델은 본질적으로 유한 임펄스 응답(FIR) 필터에 백색 잡음이 적용된 것으로 해석할 수 있다. MA 모델에서 무작위 충격( $\varepsilon_t$ )이 시계열에 미치는 영향은 자기 회귀(AR) 모형과 두 가지 주요한 차이점을 보인다.

첫째, 충격 전파 방식이다. MA 모델에서는 과거의 무작위 충격이 현재 값( $X_t$ )에 직접적으로 영향을 미친다. 예를 들어, $\varepsilon_{t-1}$ 항이 $X_t$ 를 계산하는 식의 오른쪽에 직접 포함된다. 반면, AR 모델에서는 $\varepsilon_{t-1}$ 이 $X_t$ 식에 직접 나타나지 않고, $X_{t-1}$ 식에 나타난다. 그리고 $X_{t-1}$ 이 $X_t$ 식에 포함되므로, $\varepsilon_{t-1}$ 이 $X_t$ 에 미치는 영향은 간접적이다.

둘째, 충격의 영향 기간이다. MA 모델에서 특정 시점의 충격은 현재 시점과 그 이후 정해진 q 기간 동안만 시계열 값( $X$ )에 영향을 준다. 하지만 AR 모델에서는 충격의 영향이 이론적으로 무한히 먼 미래까지 지속될 수 있다. 이는 $\varepsilon_t$ 가 $X_t$ 에 영향을 주고, $X_t$ 는 다시 $X_{t+1}$ 에, $X_{t+1}$ 은 $X_{t+2}$ 에 영향을 미치는 연쇄적인 과정 때문이다(충격 반응 참조).

MA 모델의 식을 다른 관점에서 보면 FIR 필터와의 유사성을 명확히 알 수 있다. MA(q) 모델의 식에서 출력 $y_t$ 에서 상수 평균 $\mu$ 를 뺀 값을 새로운 출력 $y'_t$ 로 정의하고, 입력인 백색 잡음 열을 $x_t$ , 모델 계수 $\theta_k$ (및 $\theta_0=1$ )를 필터 계수 $b_k$ 로 바꾸어 표현하면 다음과 같은 형태가 된다.

$y'_t = \sum_{k=0}^q b_k x_{t-k}$

이 식은 정확히 FIR 필터의 수학적 정의와 일치한다. 따라서 $\text{MA(q)}$ 모델은 "백색 잡음( $x_t$ )을 입력으로 받아 $q$ 개의 이전 입력값까지 가중합하여 현재 출력( $y'_t$ )을 내는 $q$ 차 FIR 필터" 또는 "q차 피드포워드(feedforward) 구조를 가진 선형 시스템"으로 해석될 수 있다.

3.2. 일반화된 이동 평균

계수 θ_k의 합이 1이면 MA(q) 모델은 백색 잡음의 가중 이동 평균에 상수항을 더한 것으로 볼 수 있다. 이것이 "이동 평균" 모델이라는 이름이 붙은 이유이다. 하지만 일반적인 이동 평균 모델은 계수에 특별한 제약이 없기 때문에, 이동 평균 자체라기보다는 이동 평균을 일반화한 형태라고 보는 것이 더 정확하다.

4. 특징

이동 평균(MA) 모델은 본질적으로 유한 임펄스 응답(FIR) 필터가 백색 잡음에 적용된 것과 유사한 특성을 가진다. 이 때문에 MA 모델에서는 과거의 무작위 충격(오차 항)이 현재 값에 미치는 영향이 정해진 기간(q)으로 한정된다는 특징이 있다. 이는 충격의 영향이 이론적으로 무한히 지속될 수 있는 자기 회귀(AR) 모형과 구별되는 점이며, 두 모델은 충격이 시계열 값에 영향을 미치는 방식과 그 지속 기간에서 차이를 보인다.

4.1. 영향 범위

이동 평균(MA) 모델에서 무작위 충격, 즉 백색 잡음은 시계열의 미래 값에 직접 영향을 미친다. 예를 들어, 시점 $t-1$ 의 충격 $\varepsilon _{t-1}$ 은 시점 $t$ 의 값 $X_t$ 를 결정하는 식의 오른쪽에 직접 나타난다. 또한, MA 모델에서 특정 시점의 충격은 현재 시점과 미래의 정해진 q 기간 동안만 시계열 값 $X$ 에 영향을 미친다. 즉, 시점 $t$ 의 백색 잡음은 $t$ 시점부터 $t+q$ 시점까지만 영향을 미치는데, 이는 이동 평균 모델이 본질적으로 유한 임펄스 응답(FIR) 필터의 특성을 가지기 때문이다.

이는 자기 회귀(AR) 모형과 대조되는 중요한 특징이다. AR 모델에서는 충격이 시계열 값에 미치는 영향이 간접적이다. 예를 들어, $\varepsilon _{t-1}$ 은 $X_t$ 에 직접 나타나지 않고, 이전 시점의 값 $X_{t-1}$ 에 영향을 주며, 이 $X_{t-1}$ 이 다시 $X_t$ 에 영향을 미치는 방식으로 전달된다. 더불어 AR 모델에서는 충격의 영향이 이론적으로 무한히 먼 미래까지 지속된다. 왜냐하면 $\varepsilon _t$ 가 $X_t$ 에 영향을 주고, $X_t$ 는 $X_{t+1}$ 에, $X_{t+1}$ 은 $X_{t+2}$ 에 영향을 미치는 과정이 계속 이어지기 때문이다. 이는 무한 임펄스 응답(IIR) 특성과 관련이 있다 (충격 반응 참조).

4.2. AR 모델과의 비교

이동평균(MA) 모델은 본질적으로 유한 임펄스 응답 필터가 백색 잡음에 적용된 것과 유사한 특성을 가진다. MA 모델과 자기회귀(AR) 모델은 무작위 충격(오차 항 또는 랜덤 쇼크)이 시계열 데이터의 미래 값에 영향을 미치는 방식에서 두 가지 주요한 차이점을 보인다.

첫째, 영향의 직접성 여부이다.
* MA 모델에서는 무작위 충격이 시계열의 미래 값에 직접 전파된다. 예를 들어, 특정 시점 t의 값 $X_t$ 를 설명하는 방정식의 오른쪽에 이전 시점의 충격 $\varepsilon _{t-1}$ 이 직접적으로 나타난다.
* 반면, AR 모델에서는 충격 $\varepsilon _{t-1}$ 이 $X_t$ 방정식의 오른쪽에 직접 나타나지 않는다. 대신 $\varepsilon _{t-1}$ 은 $X_{t-1}$ 값에 영향을 주고, 이 $X_{t-1}$ 값이 다시 $X_t$ 방정식의 오른쪽에 나타나므로, 충격 $\varepsilon_{t-1}$ 은 $X_t$ 에 간접적인 영향만 미친다.

둘째, 영향의 지속 기간이다.
* MA 모델에서 특정 시점의 충격은 현재 시점과 미래의 정해진 q 기간 동안만 $X$ 값에 영향을 미친다. 즉, 충격의 효과는 유한하다.
* AR 모델에서는 충격의 영향이 이론적으로 무한히 먼 미래까지 지속될 수 있다. 이는 충격 $\varepsilon _t$ 가 $X_t$ 에 영향을 미치고, $X_t$ 는 $X_{t+1}$ 에 영향을 미치며, $X_{t+1}$ 이 $X_{t+2}$ 에 영향을 미치는 식으로 계속 이어지기 때문이다(충격 반응 참조).

5. 모델 적합

이동 평균(MA) 모델의 계수를 추정하는 과정은 자기 회귀 모델(AR)보다 일반적으로 더 복잡하다. 이는 모델을 구성하는 과거의 오차 항(백색 잡음)을 직접 관찰할 수 없기 때문이다. 따라서, 단순한 선형 최소 제곱법 대신 반복적인 계산이 필요한 비선형 맞춤 기법을 사용해야 한다.

모델의 차수 q를 결정하기 위해서는 주로 자기상관 함수(ACF)를 분석한다. MA(q) 모델의 ACF는 특정 시차 q 이후에는 0이 되는 특징을 가지므로, 실제 데이터의 표본 ACF를 통해 적절한 q 값을 추정할 수 있다. ACF와 부분 자기상관 함수(PACF)를 함께 분석하여 MA 모델이 적합한지, 혹은 AR이나 ARMA 모델이 더 적합한지 판단하기도 한다(Box–Jenkins 방법 참조).

ARIMA 모델 역시 이동 평균 모델을 적합시키는 데 사용될 수 있는 방법 중 하나이다.

5.1. 자기상관함수 (ACF)

MA(q) 프로세스의 자기상관 함수(ACF)는 중요한 특징을 가지는데, 바로 시차(래그, lag^영어) q + 1 이상에서는 그 값이 0이 된다는 점이다. 즉, 특정 시점까지만 상관관계를 가지고 그 이후 시점의 값과는 상관관계가 없다는 의미이다.

이러한 특성은 이동평균 모델의 차수 q를 결정하는 데 유용하게 사용된다. 실제 시계열 데이터로부터 표본 자기상관 함수(sample ACF^영어)를 계산하고 그래프로 나타내어, 어느 시차 이후부터 ACF 값이 통계적으로 0에 가까워지는지 확인한다. 만약 특정 래그 k 이후의 모든 래그(k+1, k+2, ...)에서 표본 ACF 값이 0과 유의미하게 다르지 않다면, 모델의 최대 차수 q를 k로 추정할 수 있다.

자기상관 함수(ACF)와 함께 부분 자기상관 함수(PACF)를 함께 분석하는 것은 주어진 시계열 데이터에 순수한 MA 모델이 적합한지, 아니면 자기 회귀 모델(AR)이나 두 요소를 모두 포함하는 ARMA 모델이 더 나은 선택인지 판단하는 데 도움을 준다(Box–Jenkins 방법 참조).

5.2. Box-Jenkins 방법

이동 평균 모델(MA)의 적합은 자기 회귀 모델(AR)의 적합보다 일반적으로 더 복잡하다. 이는 과거의 오차 항을 직접 관찰할 수 없기 때문에, 선형 최소 제곱법 대신 반복적인 비선형 맞춤 절차를 사용해야 하기 때문이다. MA 모델은 과거 백색 잡음 항의 선형 결합인 반면, AR 모델은 과거 시계열 값의 선형 결합이라는 차이가 있다.

MA(q) 프로세스의 자기상관 함수(ACF)는 특정 시차 q 이후에는 0이 되는 특징이 있다. 즉, ACF는 시차 q + 1 이상에서 0의 값을 가진다. 따라서 실제 데이터의 표본 ACF를 분석하여, 특정 시차 이후의 모든 시차에서 ACF 값이 0과 통계적으로 유의미한 차이가 없는 지점을 찾아내면, 모델 추정에 적합한 최대 시차 q를 결정할 수 있다.

Box–Jenkins 방법에서는 ACF뿐만 아니라 부분 자기상관 함수(PACF)도 함께 고려하여 모델을 식별한다. 때로는 ACF와 PACF의 패턴을 통해 순수한 MA 모델이 데이터에 더 적합하다고 판단할 수 있으며, 다른 경우에는 AR 요소와 MA 요소를 모두 포함하는 ARMA 모델이 더 나은 선택일 수 있다. ARIMA 모델 역시 MA 모델을 적합시키는 데 사용될 수 있는 대안적인 방법 중 하나이다.

6. 한국에서의 활용

이동평균 모델은 한국에서도 다양한 분야에서 시계열 데이터의 추세를 파악하고 미래를 예측하는 데 활용되고 있다.

* 경제 지표 예측: 한국은행, 통계청과 같은 국가 기관에서는 경기 동향을 분석하거나 단기적인 경제 지표 변화를 예측하기 위해 이동평균 모델을 사용한다. 이를 통해 복잡한 경제 데이터 속에서 의미 있는 추세를 파악하고 경제 정책 수립의 기초 자료로 활용한다.
* 주가 분석: 금융 투자 분야에서 주가나 금융 시장 지표의 변동성을 분석하고 단기적인 추세를 예측하는 데 널리 쓰인다. 투자자들은 이동평균선을 통해 매수 또는 매도 시점을 판단하는 기술적 분석 지표로 활용하기도 한다.
* 기상 예측: 기상청 등 기상 관련 기관에서는 단기 기상 예보 모델의 정확도를 개선하기 위한 보조적인 도구로 이동평균 기법을 활용할 수 있다. 시간에 따른 기온, 강수량 등의 변화 패턴을 분석하여 예측 모델의 안정성을 높이는 데 도움을 줄 수 있다.