맨위로가기

평균 절대 편차

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

평균 절대 편차는 통계적 분산의 척도 중 하나로, 데이터 값과 중심 경향성(평균, 중앙값, 최빈값 등) 간의 절대 차이의 평균을 나타낸다. 평균 절대 편차는 중심 경향성을 어떻게 정의하느냐에 따라 여러 가지 방식으로 계산될 수 있으며, 특히 평균 주변의 평균 절대 편차(MAD)와 중앙값 주변의 중앙값 절대 편차(MAD)가 널리 사용된다. MAD는 표준 편차보다 변동성을 측정하는 간단한 척도로, 이상치에 덜 민감하며, 정규 분포의 경우 표준 편차와 밀접한 관계를 갖는다. 평균 절대 편차는 평균 제곱 오차(MSE)와 관련이 있으며, L1 노름 통계에서 평균 절대 편차를 최소화하는 것은 중앙값이다.

더 읽어볼만한 페이지

  • 통계학 용어 - 퍼센트 포인트
    퍼센트포인트는 전체 비율을 나타내는 퍼센트와 달리 두 퍼센트 값의 차이를 나타내는 단위로, 경제 지표나 여론조사 등에서 명확한 정보 전달을 위해 중요하며 절대적 변화량을 나타낸다.
  • 통계학 용어 - 편차
    편차는 관측값과 참값의 차이인 오차를 의미하며 통계적 분산 측정에 중요하고, 데이터 분석, 과학 실험, 무선 공학 등에서 활용된다.
평균 절대 편차

2. 분산 측도로서의 절대 편차

통계적 분산의 여러 척도는 절대 편차의 관점에서 정의된다.

"평균 절대 편차"라는 용어는 통계적 분산의 척도를 명확하게 나타내지 않는다. 왜냐하면 절대 편차와 중심 경향성을 측정하는데 여러 척도가 사용될 수 있기 때문이다. 따라서 절대 편차를 특정하려면 편차 척도와 중심 경향성 척도를 모두 명시해야 한다. 통계 문헌에서는 아직 표준 표기법을 채택하지 않아, 평균 주변의 평균 절대 편차와 중앙값 주변의 중앙값 절대 편차 모두 "MAD"라는 약어로 표시되어 혼란을 야기할 수 있다.[1] 이 둘은 일반적으로 서로 상당히 다른 값을 가지기 때문이다.

2. 1. 중심점 주변의 평균 절대 편차

집합 ''X'' = {''x''1, ''x''2, …, ''x''''n''}의 평균 절대 편차는 다음과 같이 정의된다.

:\frac{1}{n} \sum_{i=1}^n |x_i-m(X)|.

여기서 m(''X'')는 중심 경향성 측도(산술 평균, 중앙값, 최빈값 등)를 나타낸다. 중심 경향성 측도의 선택은 평균 절대 편차 값에 큰 영향을 미친다.

데이터 집합 {2, 2, 3, 4, 14}에 대한 예시는 다음과 같다.

{| class="wikitable"

|-

! 중심 경향성 측도 ''m(X)''

! 평균 절대 편차

|-

| 산술 평균 = 5

| \frac

{5} = 3.6

|-

| 중앙값 = 3

| \frac

{5} = 2.8

|-

| 최빈값 = 2

| \frac

{5} = 3.0

|}

2. 1. 1. 평균 주변의 평균 절대 편차 (MAD)

'''평균 절대 편차'''(MAD)는 "평균 편차" 또는 "평균 절대 편차"라고도 불린다. 이는 데이터의 평균을 중심으로 한 데이터의 절대 편차의 평균, 즉 평균으로부터의 평균(절대) 거리이다. "평균 절대 편차"는 이 용어 또는 지정된 중심점과 관련된 일반적인 형태를 나타낼 수 있다.

MAD는 실제 생활에 더 잘 부합하기 때문에 표준 편차 대신 사용될 것을 제안했다.[1] MAD는 표준 편차보다 변동성을 측정하는 간단한 척도이기 때문에 학교 교육에 유용할 수 있다.[2][3]

이 방법의 예측 정확도는 예측의 평균 제곱 오차(MSE) 방법과 매우 밀접하게 관련되어 있다. MAD는 MSE보다 계산하기 쉽고(제곱할 필요가 없음)[4] 이해하기 쉽기 때문에[5] 더 일반적으로 사용된다.

평균으로부터의 평균 절대 편차는 표준 편차보다 작거나 같다.

2. 1. 2. 중앙값 주변의 평균 절대 편차

중앙값은 평균 편차가 최소화되는 지점이다. 중앙값을 기준으로 한 MAD는 중앙값을 중심으로 한 임의 변수의 척도를 직접적으로 측정한다.

이는 라플라스 분포의 척도 모수 b의 최대 우도 추정량이다.

중앙값은 평균 절대 거리를 최소화하므로 D_\text{med} \le D_\text{mean}이다. 중앙값으로부터의 평균 절대 편차는 평균으로부터의 평균 절대 편차보다 작거나 같다. 사실, 중앙값으로부터의 평균 절대 편차는 다른 고정된 숫자로부터의 평균 절대 편차보다 항상 작거나 같다.

Habib (2011)은 일반적인 분산 함수를 사용하여 중앙값을 기준으로 한 MAD를 다음과 같이 정의했다.

D_\text{med} = E |X-\text{median}| = 2\operatorname{Cov}(X,I_O)

여기서 지표 함수는 다음과 같다.

\mathbf{I}_O := \begin{cases}

1 &\text{if } x > \text{median}, \\

0 &\text{otherwise}.

\end{cases}



이 표현을 통해 MAD 중앙값 상관 계수를 얻을 수 있다.

2. 2. 중앙값 주변의 중앙값 절대 편차 (MAD)

원칙적으로 평균이나 다른 중앙값을 중앙값 절대 편차의 중심점으로 사용할 수 있지만, 대부분 중앙값이 대신 사용된다.

중앙값 절대 편차(MAD)는 중앙값에서 절대 편차의 중앙값이다. 이는 분산에 대한 강건한 추정량이다.

예를 들어 {2, 2, 3, 4, 14}의 경우: 3은 중앙값이므로 중앙값에서 절대 편차는 {1, 1, 0, 1, 11} (재정렬하면 {0, 1, 1, 1, 11})이며 중앙값은 1이다. 이 경우 이상치 14의 값에 영향을 받지 않으므로 중앙값 절대 편차는 1이다.

대칭 분포의 경우, 중앙값 절대 편차는 사분위 범위의 절반과 같다.

3. 최대 절대 편차

최대 절대 편차는 임의의 점을 중심으로 한 표본의 각 값과 해당 점 사이의 절대 편차 중 최댓값이다. 엄밀히 말해 중심 경향성 척도는 아니지만, 최대 절대 편차는 평균 절대 편차 공식에서 m(X)=\max(X)를 사용하여 구할 수 있으며, 여기서 \max(X)는 표본 최댓값이다.

4. 최소화

''L''1 노름 통계에서 중앙값은 ''평균'' 절대 편차를 최소화한다.

5. 추정

표본의 평균 절대 편차는 모집단의 평균 절대 편차에 대한 편향 추정량이다.



절대 편차가 비편향 추정량이 되려면, 모든 표본 절대 편차의 기대값(평균)이 모집단 절대 편차와 같아야 한다. 그러나 그렇지 않다. 모집단이 1, 2, 3인 경우, 중앙값에 대한 모집단 절대 편차와 평균에 대한 모집단 절대 편차는 모두 2/3이다. 모집단에서 추출할 수 있는 크기 3인 표본의 평균에 대한 모든 표본 절대 편차의 평균은 44/81인 반면, 중앙값에 대한 모든 표본 절대 편차의 평균은 4/9이다. 따라서 절대 편차는 편향 추정량이다.

그러나 이 주장은 평균 비편향성의 개념에 기반한다. 각 위치 측정값에는 고유한 형태의 비편향성이 있다([편향 추정량] 항목 참조). 여기서 관련 있는 비편향성은 중앙값 비편향성이다.


참조

[1] 웹사이트 What scientific idea is ready for retirement? http://www.edge.org/[...] 2014
[2] 간행물 Means and MADS http://www.learner.o[...] 1999-03
[3] 서적 Guidelines for Assessment and Instruction in Statistics Education http://www.amstat.or[...] American Statistical Association
[4] 서적 Production and Operations Analysis https://books.google[...] Waveland Press
[5] 서적 Supply Chain Management and Advanced Planning: Concepts, Models, Software, and Case Studies https://books.google[...] Springer
[6] 논문 The ratio of the mean deviation to the standard deviation as a test of normality. 1935
[7] 논문
[8] 서적 이훈영교수의 통계학 도서출판 청람



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com