지수 평활법

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요
2. 지수 평활법의 역사와 발전
- 2.1. 초기 연구 (17세기~1950년대)
- 2.2. 발전과 응용 (1960년대 이후)
3. 지수 평활법의 종류
4. 지수 평활법의 활용
5. 지수 평활법의 한계 및 개선 방안
- 5.1. 한계
- 5.2. 개선 방안
참조

1. 개요

지수 평활법은 과거 데이터의 가중 평균을 사용하여 시계열 데이터의 미래 값을 예측하는 데 사용되는 방법이다. 17세기부터 연구가 시작되었으며, 1950년대 이후 발전하여 다양한 종류의 지수 평활법이 개발되었다. 단순 지수 평활법, 이중 지수 평활법, 삼중 지수 평활법 등이 있으며, 각 방법은 데이터의 특성에 따라 적합하게 사용된다. 지수 평활법은 경제, 금융, 산업 현장 등 다양한 분야에서 활용되며, 예측의 정확성을 높이기 위한 연구가 지속적으로 이루어지고 있다.

더 읽어볼만한 페이지

시계열 분석 - 공적분
공적분은 불안정한 시계열 변수들 간의 장기적인 안정 관계를 나타내는 개념으로, 개별 시계열이 불안정하더라도 특정 선형 결합이 안정적인 경우를 설명하며, 엥글-그레인저 2단계 방법, 요한센 검정 등으로 검정한다.
시계열 분석 - ARCH 모형
ARCH 모형은 시계열 데이터의 변동성 군집 현상을 설명하기 위해 개발된 통계적 모형이며, 과거 오차항의 제곱을 사용하여 조건부 변동성을 나타낸다.

지수 평활법

2. 지수 평활법의 역사와 발전

2. 1. 초기 연구 (17세기~1950년대)

2. 2. 발전과 응용 (1960년대 이후)

3. 지수 평활법의 종류

3. 1. 단순 지수 평활법 (Simple Exponential Smoothing)

지수 가중 함수는 17세기부터 내려온 수치 분석 기술의 확장으로 푸아송^[1]에게 처음 귀속되었으며, 이후 1940년대에 신호 처리 커뮤니티에서 채택되었다. 지수 평활법은 1956년 로버트 굿델 브라운에 의해 이전 연구에 대한 인용 없이 통계 문헌에 처음 제안되었고,^[2] 이후 1957년 찰스 C. 홀트에 의해 확장되었다.^[3] 일반적으로 사용되는 공식은 브라운에게 귀속되며 "브라운의 단순 지수 평활법"으로 알려져 있다.^[4] 홀트, 윈터스 및 브라운의 모든 방법은 1940년대에 처음 발견된^[1] 유한 임펄스 응답 (FIR) 필터를 무한 임펄스 응답 필터로 변환하기 위한 재귀 필터링의 간단한 응용으로 볼 수 있다.

단순 지수 평활법의 공식은 다음과 같다.

:

s_t = \alpha x_t + (1-\alpha) s_{t-1} = s_{t-1} + \alpha (x_t - s_{t-1}),

여기서

\alpha

는 ''평활 계수''이며,

0 \le \alpha \le 1

이다. 즉, 평활 통계량

s_t

는 현재 관측치

x_t

와 이전 평활 통계량

s_{t-1}

의 단순 가중 평균이다. 단순 지수 평활법은 쉽게 적용할 수 있으며, 두 개의 관측치가 있으면 즉시 평활 통계량을 생성한다.

\alpha

값이 1에 가까울수록 평활 효과가 적고 데이터의 최근 변화에 더 큰 가중치를 부여하는 반면,

\alpha

값이 0에 가까울수록 평활 효과가 더 크고 최근 변화에 덜 민감하다.

\alpha

를 선택하는 데는 공식적으로 올바른 절차가 없다. 때로는 통계학자의 판단을 사용하거나, 통계적 기술을 사용하여

\alpha

의 값을 ''최적화''할 수 있다. 예를 들어, 최소 제곱법을 사용하여 양

(s_t - x_{t+1})^2

의 합을 최소화하는

\alpha

의 값을 결정할 수 있다.^[5]

단순 이동 평균과 같은 다른 평활 방법과 달리 이 기술은 결과를 생성하기 전에 최소한의 관측 횟수를 필요로 하지 않는다. 그러나 실제로 "좋은 평균"은 여러 샘플을 함께 평균화해야 달성된다. 정보 손실 없이 원래 신호를 정확하게 재구성하려면 지수 이동 평균의 모든 단계도 사용할 수 있어야 한다. 이전 샘플의 가중치가 지수적으로 감소하기 때문이다. 이것은 단순 이동 평균과 대조되는데, 단순 이동 평균에서는 평균 내 샘플의 가중치가 일정하므로 일부 샘플을 정보 손실 없이 건너뛸 수 있다.

이 단순한 형태의 지수 평활법은 지수 가중 이동 평균 (EWMA)으로도 알려져 있다. 기술적으로는 상수 항이 없는 자기 회귀 누적 이동 평균 (ARIMA) (0,1,1) 모델로 분류할 수도 있다.^[6]

위의 정의에서

s_0

(지수 평활법 알고리즘의 초기 출력)이

x_0

(초기 원시 데이터 또는 관측값)으로 초기화된다. 지수 평활법은 각 단계에서 이전 예측

s_{t-1}

을 가져야 하므로, 이 방법을 시작하는 방법은 명확하지 않습니다. 초기 예측이 수요의 초기 값과 같다고 가정할 수 있다. 그러나 이 접근 방식에는 심각한 단점이 있습니다. 지수 평활법은 과거 관측치에 상당한 가중치를 두므로 수요의 초기 값은 초기 예측에 과도하게 큰 영향을 미친다. 이 문제는 합리적인 기간(10 이상) 동안 프로세스가 발전하도록 허용하고 해당 기간 동안의 수요 평균을 초기 예측으로 사용하여 극복할 수 있다.

\alpha

값이 작을수록 이 초기 평활 값

s_0

선택에 대한 예측이 더 민감해진다.^[7]^[8]

모든 지수 평활법에 대해, 평활 매개변수의 값도 선택해야 한다. 단순 지수 평활법에는 단 하나의 평활 매개변수(''α'')가 있지만, 그 이후의 방법에는 일반적으로 하나 이상의 평활 매개변수가 있다.

평활 매개변수는 주관적인 방식으로 선택될 수 있는데, 예측자는 이전 경험을 바탕으로 평활 매개변수의 값을 지정한다. 그러나 모든 지수 평활법에 포함된 미지의 매개변수 값을 얻는 보다 강력하고 객관적인 방법은 관측된 데이터로부터 이를 추정하는 것이다.

모든 지수 평활법에 대한 미지의 매개변수와 초기값은 오차 제곱합 (SSE)을 최소화함으로써 추정할 수 있다. 오차는

e_t=y_t-\hat{y}_{t\mid t-1}

로 지정되며, 여기서

t=1, \ldots,T

(표본 내 1단계 앞 예측 오차)이고,

y_t

와

\hat{y}_{t\mid t-1}

는 각각

t

에서 예측할 변수와

t

에서의 예측 결과(이전 데이터 또는 예측 기반)이다. 따라서 다음을 최소화하는 미지의 매개변수와 초기값을 찾는다.

:

\text{SSE} = \sum_{t=1}^T (y_t-\hat{y}_{t\mid t-1})^2=\sum_{t=1}^T e_t^2

^[9]

SSE를 최소화하는 회귀 계수를 직접 계산하는 공식이 있는 회귀와 달리, 이것은 비선형 최소화 문제를 포함하며, 이를 수행하기 위해 최적화 도구를 사용해야 한다.

'지수 평활'이라는 이름은 컨볼루션 과정에서 지수 윈도우 함수를 사용한 데서 유래되었다.

단순 지수 평활의 정의 방정식을 직접 대입하면 다음과 같다.

:

\begin{align}s_t& = \alpha x_t + (1-\alpha)s_{t-1}\\[3pt]& = \alpha x_t + \alpha (1-\alpha)x_{t-1} + (1 - \alpha)^2 s_{t-2}\\[3pt]& = \alpha \left[x_t + (1-\alpha)x_{t-1} + (1-\alpha)^2 x_{t-2} + (1-\alpha)^3 x_{t-3} + \cdots + (1-\alpha)^{t-1} x_1 \right]+ (1-\alpha)^t x_0.\end{align}

다시 말해, 시간이 지남에 따라 평활 통계량

s_t

는 과거 관측치

s_{t-1},\ldots, s_{t-n},\ldots

의 가중 평균이 되며, 이전 관측치에 할당된 가중치는 등비 수열의 항에 비례한다.

:

1, (1-\alpha), (1-\alpha)^2,\ldots, (1-\alpha)^n,\ldots

등비 수열은 지수 함수의 이산 버전이므로, 이는 통계학 설에 따르면 이 평활 방법의 이름이 유래된 곳이다.

지수 평활법과 이동 평균은 입력 데이터에 상대적인 지연을 도입한다는 유사한 결점을 가지고 있다. 지수 평활법은 1차 무한 임펄스 응답 (IIR) 필터와 동일하며, 이동 평균은 동일한 가중치를 갖는 유한 임펄스 응답 필터와 동일하다.^[10]

3. 2. 이중 지수 평활법 (Double Exponential Smoothing, Holt Linear)

단순 지수 평활법은 데이터에 추세 추정이 있을 때 잘 작동하지 않는다.^[11] 이러한 상황에서 "이중 지수 평활법" 또는 "2차 지수 평활법"이라는 이름으로 여러 방법이 고안되었는데, 이는 지수 필터를 두 번 재귀적으로 적용하는 것으로, "이중 지수 평활법"이라고 불린다.

이중 지수 평활법의 기본 아이디어는 어떤 형태의 추세를 나타낼 가능성을 고려하기 위해 항을 도입하는 것이다. 이 기울기 구성 요소 자체는 지수 평활법을 통해 업데이트된다.

한 가지 방법은 다음과 같다.^[12]

관측치의 원시 데이터 시퀀스는 x_t로 표시되며, 시간 t=0부터 시작한다. s_t는 시간 t에 대한 평활화된 값을 나타내는 데 사용하고, b_t는 시간 t에서의 추세에 대한 최상의 추정치이다. 알고리즘의 출력은 F_{t+m}으로 기록되며, 시간 t까지의 원시 데이터를 기반으로 시간 m > 0에서의 x_{t+m} 값에 대한 추정치이다. 이중 지수 평활법은 다음 공식으로 주어집니다.

s_0 = x_0

b_0 = x_1 - x_0

그리고 t > 0에 대해서는

s_t = α x_t + (1-α)(s_{t-1} + b_{t-1})

b_t = β (s_t - s_{t-1}) + (1-β)b_{t-1}

여기서 α (0 ≤ α ≤ 1)는 ''데이터 평활화 인자''이고, β (0 ≤ β ≤ 1)는 ''추세 평활화 인자''이다.

x_t를 넘어서 예측하는 것은 다음 근사치로 주어진다.

F_{t+m} = s_t + m · b_t.

초기 값 b를 설정하는 것은 선호도의 문제이다. 위에 나열된 것 외의 다른 옵션은 어떤 n에 대해 (x_n-x_0) / n이다.

F_0는 정의되지 않고 (시간 0에 대한 추정이 없음), 정의에 따르면 F_1=s_0+b_0이며, 이는 잘 정의되어 있으므로 추가 값을 평가할 수 있다.

브라운의 선형 지수 평활법(LES) 또는 브라운의 이중 지수 평활법이라고 하는 두 번째 방법은 다음과 같이 작동한다.^[13]

s'_0 = x_0

s''_0 = x_0

s'_t = α x_t + (1-α)s'_{t-1}

s''_t = α s'_t + (1-α)s''_{t-1}

F_{t+m} = a_t + mb_t,

여기서 시간 t에서의 추정 레벨인 a_t와 시간 t에서의 추정 추세인 b_t는 다음과 같이 주어진다.

a_t = 2s'_t - s''_t

b_t = α / (1-α) (s'_t - s''_t).

3. 3. 삼중 지수 평활법 (Triple Exponential Smoothing, Holt-Winters)

삼중 지수 평활법(Triple Exponential Smoothing)은 시계열에서 세 개의 고주파 신호를 제거해야 할 때 일반적으로 사용되는 방법으로, 지수 평활법을 세 번 적용한다.^[14] 계절성은 매년 12월에 11월보다 아파트가 10,000채 더 팔리는 경우처럼 ''덧셈''의 성격을 띨 수 있고, 여름철에 겨울철보다 아파트가 10% 더 팔리는 경우처럼 ''곱셈''의 성격을 띨 수 있다. 곱셈 계절성은 절대적인 양이 아닌 상수 요인으로 표현될 수 있다.^[14]

삼중 지수 평활법은 1960년 홀트의 제자인 피터 윈터스에 의해 처음 제안되었다.^[15] 홀트의 새로운 아이디어는 1보다 크고 5보다 작은 홀수 번 필터링을 반복하는 것이었는데, 이는 이전 시대의 학자들에게 인기가 있었다.^[15]

이 방법은 데이터의 추세선뿐만 아니라 해당 시점이 길이

L

의 주기의 어디에 위치하는지에 따라 추세선의 값을 가중하는 계절 지수를 계산한다.

$s_t$ : 시간 $t$ 에 대한 상수 부분의 평활화된 값
$b_t$ : 계절적 변화에 중첩된 선형 추세의 최상의 추정치 시퀀스
$c_t$ : 계절적 보정 계수 시퀀스

관측값이 발생하는 주기의 각 시간

t

mod

L

에서

c_t

를 추정하며, 계절 요소를 초기화하려면 최소 두 개의 전체 계절(

2L

기간)의 과거 데이터가 필요하다.

곱셈 계절성을 갖는 삼중 지수 평활법 공식은 다음과 같다.^[11]

s_0 = x_0

s_t = \alpha \frac{x_t}{c_{t-L}} + (1-\alpha)(s_{t-1} + b_{t-1})

b_t = \beta (s_t - s_{t-1}) + (1-\beta)b_{t-1}

c_t = \gamma \frac{x_t}{s_t}+(1-\gamma)c_{t-L}

F_{t+m} = (s_t + mb_t)c_{t-L+1+(m-1)\bmod L}

$\alpha$ ( $0 \le \alpha \le 1$ ): ''데이터 평활 계수''
$\beta$ ( $0 \le \beta \le 1$ ): ''추세 평활 계수''
$\gamma$ ( $0 \le \gamma \le 1$ ): ''계절 변화 평활 계수''

초기 추세 추정

b

공식은 다음과 같다.

:

b_0 = \frac{1}{L} \left(\frac{x_{L+1}-x_1}{L} + \frac{x_{L+2}-x_2}{L} + \cdots + \frac{x_{L+L}-x_L}{L}\right)

계절 지수

c_i

(

i = 1,2,\ldots,L

)의 초기 추정치는 다음과 같이 계산한다. (

N

: 데이터에 존재하는 완전한 주기의 수)

:

c_i = \frac{1}{N} \sum_{j=1}^N \frac{x_{L(j-1)+i}}{A_j} \quad \text{for } i = 1,2,\ldots,L

여기서

A_j

는 데이터의

j^\text{th}

주기에서

x

의 평균값이다.

:

A_j = \frac{\sum_{k=1}^{L} x_{L(j-1)+k}}{L} \quad \text{for } j = 1,2,\ldots,N

덧셈 계절성을 갖는 삼중 지수 평활법은 다음과 같다.

s_0  = x_0

s_t  = \alpha (x_t-c_{t-L}) + (1-\alpha)(s_{t-1} + b_{t-1})

b_t  = \beta (s_t - s_{t-1}) + (1-\beta)b_{t-1}

c_t  = \gamma (x_t-s_{t-1}-b_{t-1})+(1-\gamma)c_{t-L}

F_{t+m}  = s_t + mb_t+c_{t-L+1+(m-1) \bmod L}

4. 지수 평활법의 활용

4. 1. 경제 및 금융 분야

4. 2. 산업 현장

4. 3. 기타 분야

5. 지수 평활법의 한계 및 개선 방안

5. 1. 한계

5. 2. 개선 방안

참조

_[1] 서적 Digital Signal Processing Prentice Hall
_[2] 서적 Exponential Smoothing for Predicting Demand http://legacy.librar[...] Arthur D. Little Inc.
_[3] 간행물 Forecasting Trends and Seasonal by Exponentially Weighted Averages
_[4] 서적 Smoothing Forecasting and Prediction of Discrete Time Series http://babel.hathitr[...] Prentice-Hall
_[5] 웹사이트 NIST/SEMATECH e-Handbook of Statistical Methods, 6.4.3.1. Single Exponential Smoothing http://www.itl.nist.[...] NIST 2017-07-05
_[6] 웹인용 Averaging and Exponential Smoothing Models http://www.duke.edu/[...] 2010-07-26
_[7] 문서 Production and Operations Analysis Nahmias
_[8] 간행물 "Optimization methods of EWMA statistics."
_[9] 서적 7.1 Simple exponential smoothing | Forecasting: Principles and Practice https://www.otexts.o[...]
_[10] 서적 Production and Operations Analysis Waveland Press
_[11] 웹사이트 NIST/SEMATECH e-Handbook of Statistical Methods http://www.itl.nist.[...] NIST 2010-05-23
_[12] 웹인용 6.4.3.3. Double Exponential Smoothing http://www.itl.nist.[...] 2011-09-25
_[13] 웹인용 Averaging and Exponential Smoothing Models http://www.duke.edu/[...] 2011-09-25
_[14] 웹사이트 Time series Forecasting using Holt–Winters Exponential Smoothing http://www.it.iitb.a[...] 2014-06-23
_[15] 간행물 Forecasting Sales by Exponentially Weighted Moving Averages 1960-04
_[16] 웹사이트 R: Holt–Winters Filtering https://stat.ethz.ch[...] 2016-06-05
_[17] 웹사이트 ets {forecast} {{!}} inside-R {{!}} A Community Site for R http://www.inside-r.[...] 2016-06-05
_[18] 웹사이트 Comparing HoltWinters() and ets() http://robjhyndman.c[...] 2011-05-29
_[19] 문서 tssmooth https://www.stata.co[...] Stata manual
_[20] 웹인용 LibreOffice 5.2: Release Notes – the Document Foundation Wiki https://wiki.documen[...]
_[21] 웹인용 Excel 2016 Forecasting Functions | Real Statistics Using Excel http://www.real-stat[...]

본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com