관측값
1. 개요
관측값은 측정을 통해 얻은 값으로, 참값, 최확값, 잔차, 편의, 참오차 등과 관련된 개념이다. 참값은 실제 대상의 정확한 값이며, 최확값은 참값을 대신하는 값이다. 잔차는 관측값과 최확값의 차이, 편의는 참값과 최확값의 차이, 참오차는 잔차와 편의의 합이다. 관측값 조정은 우연오차를 줄여 최확값을 결정하는 과정이며, 최소제곱법이 대표적인 방법이다. 확률론에서 관측값은 확률 변수의 실현 값으로 정의된다.
2. 용어 정의
착오 및 정오차를 보정해도 관측값에는 우연오차가 남는다. 이때 관측값 조정(adjustment)을 통해 최확값을 결정한다. 관측값 조정의 대표적인 방법은 최소제곱법이다. 경중률이 같은 관측값은 잔차 제곱의 합이 최소가 될 때, 서로 다른 경중률을 가진 관측값은 (경중률)X(잔차)2의 합이 최소가 될 때 최확값을 정한다.
확률론에서 확률 변수는 표본 공간 Ω에서 가측 공간인 상태 공간으로 가는 함수 X로 정의된다. Ω의 한 요소가 X에 의해 상태 공간의 한 요소에 대응되면, 그 요소는 X의 실현 값이다. 표본 공간의 요소는 가능한 모든 경우, 실현 값은 그중 하나가 발생했을 때 X의 값이다. 확률은 표본 공간의 부분 집합(사건)에 0과 1 사이의 값을 부여하는 사상이다. 기본 사건은 하나의 요소만 포함하는 표본 공간의 부분 집합이다. 확률 변수 X의 ω ∈ Ω 에서의 값은
:
와 같이 표현된다.
2.1. 관측값, 최확값, 참값
측정을 통해 알아낸 값을 관측값이라 하고, 측정한 대상물의 실제 값을 참값(true value)이라고 한다. 참값은 정확하게 알 수 없는 추상적인 개념이다. 따라서 참값을 대신할 값을 정하는데 이것을 최확값(most probable value)이라고 한다.
관측값을 x, 최확값을 μ, 참값을 τ라고 하면 잔차(residual, ν), 편의(bias, β), 참오차(error, ε)를 정의할 수 있다. 잔차는 관측값과 최확값의 차이다.(ν=μ–x) 편의는 참값과 최확값의 차이다.(β=τ–μ) 참오차는 잔차와 편의를 합한 값이다.(ε=ν+β) 참오차 역시 참값과 마찬가지로 실제로 알 수 없는 가상의 값이다.
최확값은 단순히 산술평균이 아니라 조건과 경중률의 유무에 따라 달라진다. 경중률(weight)이란 여러 관측 값들 각각의 상대적인 신뢰도를 나타내는 것으로, 관측값의 분산에 반비례한다. 조건이 없는 경우는 관측값을 직접 조정하여 최확값을 구하고, 조건이 있는 경우에는 조건에 맞게 오차를 조정하여 최확값을 구한다. 경중률은 관측 횟수, 관측 거리, 관측 정밀도 등 여러 가지 경우에 따라 달라진다.
2.2. 잔차, 편의, 참오차
측정을 통해 알아낸 값을 관측값이라 하고, 측정한 대상물의 실제 값을 참값(true value)이라고 한다. 참값은 정확하게 알 수 없는 추상적인 개념이다. 따라서 참값을 대신할 값을 정하는데 이것을 최확값(most probable value)이라고 한다.
관측값을 x, 최확값을 μ, 참값을 τ라고 하면 잔차(residual, ν), 편의(bias, β), 참오차(error, ε)를 정의할 수 있다. 잔차는 관측값과 최확값의 차이(ν=μ–x)이고, 편의는 참값과 최확값의 차이(β=τ–μ)이며, 참오차는 잔차와 편의를 합한 값(ε=ν+β)이다. 참오차 역시 참값과 마찬가지로 실제로 알 수 없는 가상의 값이다.
2.3. 상대오차
상대오차(relative error)는 관측값과 잔차의 절댓값의 비이다. 상대오차는 관측의 정밀도를 나타낼 때 중요하게 쓰인다. 상대오차는 1/10000 등과 같이 나타낸다.
: