맨위로가기

평균 제곱근 편차

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

평균 제곱근 편차(RMSD)는 추정량의 평균 제곱 오차(MSE)의 제곱근으로 정의되며, 다양한 분야에서 모델의 예측 정확도를 평가하는 데 사용되는 지표이다. RMSD는 예측값과 실제 값 간의 차이를 나타내며, 값이 낮을수록 모델의 예측 성능이 우수함을 의미한다. RMSD는 정규화를 통해 서로 다른 척도를 가진 데이터 간의 비교를 용이하게 할 수 있으며, 평균 절대 오차(MAE)와 비교하여 사용되기도 한다. RMSD는 기상학, 생물 정보학, 약물 설계, 경제학, 심리학, GIS, 수문 지질학, 영상 과학, 계산 신경 과학 등 다양한 분야에서 활용된다.

더 읽어볼만한 페이지

  • 추정 이론 - 기댓값 최대화 알고리즘
  • 추정 이론 - 델파이 기법
    델파이 기법은 전문가들의 의견을 반복적인 피드백을 통해 수렴하여 문제를 해결하는 하향식 의견 도출 방법으로, 익명성, 정보 흐름의 구조화, 정기적인 피드백을 특징으로 하며 다양한 분야에서 활용된다.
  • 통계학 - 확률
    확률은 사건의 가능성을 수치화한 개념으로, 도박에서 시작되어 수학적으로 발전했으며, 다양한 해석과 요소, 응용 분야를 가지며 양자역학, 사회 현상 등에도 적용된다.
  • 통계학 - 사분위수
    사분위수는 정렬된 데이터를 4등분하는 세 개의 값으로 데이터 분포 요약 및 이상치 탐지에 활용되며, 제1사분위수(Q₁)는 하위 25%, 제2사분위수(Q₂ 또는 중앙값)는 하위 50%, 제3사분위수(Q₃)는 하위 75%를 나타낸다.
평균 제곱근 편차
개요
정의통계학에서 추정값 또는 모델의 예측값과 실제값 간의 차이를 나타내는 척도
다른 이름평균 제곱근 오차 (Root Mean Square Error, RMSE)
이차 평균 제곱근 편차
계산
계산식\[\text{RMSD} = \sqrt{\frac{\sum_{i=1}^{n} (\hat{y}_i - y_i)^2}{n}}\]
변수 설명"\[\hat{y}_i\]: 예측값"
"\[y_i\]: 실제값"
"\[n\]: 데이터 포인트의 수"
활용
활용 분야기상학
예측 분석
공학
의학
해석
특징RMSD 값이 작을수록 모델의 정확도가 높음
단위가 측정 단위와 동일하므로 해석이 용이
장단점
장점오차의 크기에 민감하게 반응하여 큰 오차에 더 큰 가중치를 부여
단점이상치에 민감하게 반응할 수 있음
관련 통계량
관련 통계량평균 절대 오차 (Mean Absolute Error, MAE)
평균 제곱 오차 (Mean Squared Error, MSE)

2. 정의 및 공식

평균 제곱근 편차(RMSD)는 추정값과 실제 값의 차이를 나타내는 평균 제곱 오차(MSE)의 제곱근으로 정의된다.[1] 즉, 추정값과 실제 값의 차이를 제곱하여 평균을 낸 후 제곱근을 취하는 방식으로 계산된다.

RMSD는 예측 오차의 크기를 하나의 숫자로 나타내는 척도로, 예측 모델의 정확도를 평가하는 데 사용된다.[1] RMSD는 항상 0 이상의 값을 가지며, 0에 가까울수록 예측 모델이 데이터에 더 잘 맞는다는 것을 의미한다. 그러나 RMSD는 데이터의 크기에 따라 달라지므로, 서로 다른 데이터 세트 간의 모델 성능을 비교하는 데는 적합하지 않다.[1]

RMSD는 제곱 오차의 평균을 사용하기 때문에 큰 오차에 더 큰 영향을 받는다. 따라서 이상치에 민감하게 반응한다.[2][3]

일부 분야에서는 RMSD를 "표준"으로 인정되지 않는 다른 두 대상의 차이를 비교할 때 사용하기도 한다.

2. 1. 추정량

추정량 \hat{\theta}의 평균 제곱근 편차(RMSD)는 평균 제곱 오차의 제곱근으로 다음과 같이 정의된다.

:\operatorname{RMSD}(\hat{\theta}) = \sqrt{\operatorname{MSE}(\hat{\theta})} = \sqrt{\operatorname{E}((\hat{\theta}-\theta)^2)}.

불편 추정량의 경우, RMSD는 분산의 제곱근이며, 이는 표준 편차와 같다. 편의 추정량의 경우도 마찬가지로 RMSD는 분산의 제곱근, 즉 표준 편차가 된다.

2. 2. 표본

편의 추정량에서 평균 제곱근 오차는 분산의 제곱근, 즉 표준 오차가 된다.

만약 X_1, ..., X_n이 실제 평균값 x_0를 갖는 모집단의 표본이라면, 표본의 RMSD는 다음과 같이 계산된다.

:\operatorname{RMSD} = \sqrt{\frac{1}{n}\sum_{i=1}^n(X_i-x_0)^2}.

2. 3. 회귀 분석

회귀 분석에서 예측값의 RMSD는 ''T''개의 변수가 ''T''번 관찰되었을 때, 오차 제곱 평균의 제곱근으로 계산된다.

:\operatorname{RMSD}=\sqrt{\frac{\sum_{t=1}^T (y_t - \hat y_t)^2}{T}}.

여기서 y_t는 종속 변수, \hat y_t는 시간 ''t''에 대한 예측값이다. 횡단면 데이터에 대한 회귀 분석의 경우, 아래첨자 ''t''는 ''i''로, ''T''는 ''n''으로 대체된다.

3. 정규화

평균 제곱근 편차(RMSD)는 데이터의 척도에 따라 값이 달라지므로, 서로 다른 척도를 가진 데이터 세트나 모델 간의 비교를 위해 정규화가 필요하다. RMSD를 정규화하면 서로 다른 척도를 가진 데이터 세트나 모델을 비교하기가 용이해진다.[1]

정규화된 RMSD는 일반적으로 NRMSD (Normalized Root Mean Square Deviation) 또는 NRMSE (Normalized Root Mean Square Error)라고 불리며, 백분율로 표시되는 경우가 많다. 값이 낮을수록 잔차 분산이 적음을 의미한다.

하지만, 문헌에 따라 일관된 정규화 방법이 존재하는 것은 아니며, 측정된 데이터의 평균이나 범위(최댓값에서 최솟값을 뺀 값)를 사용하는 것이 일반적인 방법이다.[4]

3. 1. 일반적인 정규화 방법

RMSD를 정규화하면 서로 다른 척도를 가진 데이터 세트 또는 모델 간의 비교가 용이해진다. 문헌에서 일관된 정규화 방법은 없지만, 일반적인 선택은 측정된 데이터의 평균 또는 범위(최댓값에서 최솟값을 뺀 값)이다.[4]

:\mathrm{NRMSD} = \frac{\mathrm{RMSD}}{y_\max -y_\min} 또는 \mathrm{NRMSD} = \frac {\mathrm{RMSD}}{\bar y} .

이 값은 일반적으로 ''정규화된 제곱근 평균 편차'' 또는 ''오차'' (NRMSD 또는 NRMSE)라고 하며, 종종 백분율로 표시되며, 값이 낮을수록 잔차 분산이 적음을 나타낸다. 이는 또한 변동 계수 또는 '''RMS 백분율'''이라고도 한다. 특히 표본 크기가 작은 경우 표본 범위는 표본 크기의 영향을 받을 가능성이 높아 비교가 어려워진다.

측정값의 평균값으로 정규화할 때 용어 ''RMSD의 변동 계수, CV(RMSD)''를 사용하여 모호성을 피할 수 있다.[5] 이는 RMSD가 표준 편차를 대신하는 변동 계수와 유사하다.

: \mathrm{CV(RMSD)} = \frac {\mathrm{RMSD}}{\bar y} .

3. 2. 사분위 범위(IQR)를 이용한 정규화

RMSD를 더 유용한 비교 척도로 만들기 위한 또 다른 방법은 RMSD를 사분위 범위(IQR)로 나누는 것이다. RMSD를 IQR로 나누면 정규화된 값은 대상 변수의 극단적인 값에 덜 민감해진다.

:\mathrm{RMSDIQR} = \frac{\mathrm{RMSD}}{IQR} 여기서 IQR = Q_3 - Q_1

Q_1 = \text{CDF}^{-1}(0.25)Q_3 = \text{CDF}^{-1}(0.75) 이고, 여기서 CDF−1은 분위 함수이다.[4]

3. 3. 변동 계수(CV)를 이용한 정규화

측정값의 평균값으로 정규화할 때, 변동 계수를 사용하여 RMSD의 변동 계수(CV(RMSD))를 나타낼 수 있다.[5] 이는 RMSD가 표준 편차를 대신하는 변동 계수와 유사하다.

: \mathrm{CV(RMSD)} = \frac {\mathrm{RMSD}}{\bar y} .

4. 평균 절대 오차(MAE)와의 비교

평균 절대 오차(MAE)는 평균 제곱근 편차(RMSD)와 같이 모델의 예측 성능을 평가하는 데 사용되는 지표이다. MAE는 오차의 절대값의 평균으로, RMSD보다 이해하기 쉽다. MAE는 각 오차가 오차의 절대값에 비례하여 직접적인 영향을 주지만, RMSD는 제곱을 하므로 큰 오차에 더 민감하게 반응한다.[12]

5. 활용 분야

평균 제곱근 편차(RMSD)는 모델의 예측 정확도를 평가하고 데이터를 비교하는 데 다양한 분야에서 활용된다.

분야활용
기상학수학적 모델이 대기의 움직임을 얼마나 잘 예측하는지 확인 [1]
생물정보학겹쳐진 단백질의 원자 간 평균 거리를 측정 [1]
구조 기반 약물 설계리간드(화학에서 분자나 이온의 중심 금속 원자에 결합하는 분자나 이온)의 배좌 결정 형태와 도킹 예측 간의 차이 측정
경제학경제 모델이 경제 지표에 얼마나 잘 부합하는지 판단 (일부 전문가는 RMSD가 상대 절대 오차보다 신뢰성이 떨어진다고 주장) [6]
실험 심리학행동에 대한 수학적 또는 계산적 모델이 경험적으로 관찰된 행동을 얼마나 잘 설명하는지 평가 [1]
지리 정보 시스템공간 분석 및 원격 감지의 정확도를 평가 [7]
수문지질학지하수 모델의 보정을 평가 [7]
영상 과학최대 신호 대 잡음비의 일부로, 이미지를 재구성하는 방법이 원본 이미지에 비해 얼마나 우수한지를 평가 [8]
계산 신경 과학시스템이 주어진 모델을 얼마나 잘 학습하는지 평가 [8]
단백질 핵 자기 공명 분광법얻어진 구조 묶음의 품질을 추정
넷플릭스 상테스트 데이터 세트의 비공개 "참값"과의 RMSD를 사용하여 평가
건물 에너지 소비 시뮬레이션측정된 건물 성능에 대한 모델을 보정 [9]
X선 결정학분자 내부 좌표가 제약 라이브러리 값에서 얼마나 벗어나는지 측정
제어 이론상태 관측기의 성능을 평가하기 위한 품질 척도 [10]
유체 역학속도 프로파일, 온도 분포 또는 가스 종 농도와 같은 흐름 거동의 균일성을 정량화하고, 산업 표준과 비교하여 흐름 및 열 장비 및 공정 설계를 최적화


5. 1. 기상학

기상학에서 평균 제곱근 편차는 수학적 모델이 대기의 움직임을 얼마나 잘 예측하는지 확인하는 데 사용된다.[6]

5. 2. 생물 정보학

생물정보학에서, 원자 위치의 평균 제곱근 편차는 겹쳐진 단백질의 원자 간 평균 거리를 측정하는 데 사용된다.[6]

5. 3. 의학 및 약학

구조 기반 약물 설계에서, 평균 제곱근 편차(RMSD)는 리간드의 배좌 결정 형태와 도킹 예측 간의 차이를 측정하는 데 사용된다.

5. 4. 경제학

경제학에서 평균 제곱근 편차(RMSD)는 경제 모델이 경제 지표에 얼마나 잘 부합하는지 판단하는 데 사용된다. 하지만 일부 전문가들은 RMSD가 상대 절대 오차보다 신뢰성이 떨어진다고 주장한다.[6]

5. 5. 심리학

실험 심리학에서 평균 제곱근 편차(RMSD)는 행동에 대한 수학적 또는 계산적 모델이 경험적으로 관찰된 행동을 얼마나 잘 설명하는지 평가하는 데 사용된다.[6]

5. 6. 지리 정보 시스템 (GIS)

지리 정보 시스템에서 평균 제곱근 편차(RMSD)는 공간 분석 및 원격 감지의 정확도를 평가하는 데 사용되는 척도 중 하나이다.[7]

5. 7. 수문 지질학

수문지질학에서 RMSD와 NRMSD는 지하수 모델의 보정을 평가하는 데 사용된다.[7]

5. 8. 영상 과학

영상 과학에서 평균 제곱근 편차(RMSD)는 최대 신호 대 잡음비의 일부이며, 이미지를 재구성하는 방법이 원본 이미지에 비해 얼마나 우수한지를 평가하는 데 사용되는 지표이다.[8]

5. 9. 계산 신경 과학

계산 신경 과학에서 RMSD는 시스템이 주어진 모델을 얼마나 잘 학습하는지 평가하는 데 사용된다.[8]

5. 10. 기타


  • 단백질 핵 자기 공명 분광법에서, RMSD는 얻어진 구조 묶음의 품질을 추정하는 척도로 사용된다.[8]
  • 넷플릭스 상 제출물은 테스트 데이터 세트의 공개되지 않은 "진실" 값에서 RMSD를 사용하여 평가되었다.
  • 건물의 에너지 소비 시뮬레이션에서, RMSE 및 CV(RMSE)는 측정된 건물 성능에 대한 모델을 보정하는 데 사용된다.[9]
  • X선 결정학에서, RMSD(및 RMSZ)는 분자 내부 좌표가 제약 라이브러리 값에서 얼마나 벗어나는지 측정하는 데 사용된다.
  • 제어 이론에서, RMSE는 상태 관측기의 성능을 평가하기 위한 품질 척도로 사용된다.[10]
  • 유체 역학에서, 정규화된 평균 제곱근 편차(NRMSD), 변동 계수(CV) 및 백분율 RMS는 속도 프로파일, 온도 분포 또는 가스 종 농도와 같은 흐름 거동의 균일성을 정량화하는 데 사용된다. 이 값은 흐름 및 열 장비 및 공정의 설계를 최적화하기 위해 산업 표준과 비교된다.

참조

[1] 논문 Another look at measures of forecast accuracy
[2] 논문 Components of information for multiple resolution comparison between maps that share a real variable https://commons.clar[...] 2008
[3] 논문 On the use of dimensioned measures of error to evaluate the performance of spatial interpolators 2006
[4] 웹사이트 Coastal Inlets Research Program (CIRP) Wiki - Statistics http://cirpwiki.info[...] 2015-02-04
[5] 웹사이트 FAQ: What is the coefficient of variation? https://stats.idre.u[...] 2019-02-19
[6] 논문 Error Measures For Generalizing About Forecasting Methods: Empirical Comparisons http://faculty.weath[...]
[7] 서적 Applied Groundwater Modeling: Simulation of Flow and Advective Transport Academic Press
[8] 문서 Ensemble Neural Network Model http://www.ocgy.ubc.[...]
[9] 문서 ANSI/BPI-2400-S-2012: Standard Practice for Standardized Qualification of Whole-House Energy Savings Predictions by Calibration to Energy Use History http://www.bpi.org/W[...]
[10] 문서 https://kalman-filter.com/root-mean-square-error https://kalman-filte[...]
[11] 논문 Another look at measures of forecast accuracy
[12] 논문 Components of information for multiple resolution comparison between maps that share a real variable 2008
[13] 논문 On the use of dimensioned measures of error to evaluate the performance of spatial interpolators 2006
[14] 웹사이트 Coastal Inlets Research Program (CIRP) Wiki - Statistics http://cirpwiki.info[...] 2015-02-04
[15] 웹사이트 FAQ: What is the coefficient of variation? https://stats.idre.u[...] 2019-02-19
[16] 논문 Error Measures For Generalizing About Forecasting Methods: Empirical Comparisons http://faculty.weath[...]
[17] 서적 Applied Groundwater Modeling: Simulation of Flow and Advective Transport Academic Press
[18] 문서 Ensemble Neural Network Model http://www.ocgy.ubc.[...]
[19] 문서 ANSI/BPI-2400-S-2012: Standard Practice for Standardized Qualification of Whole-House Energy Savings Predictions by Calibration to Energy Use History http://www.bpi.org/W[...]



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com