최대 신호 대 잡음비

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

최대 신호 대 잡음비(PSNR)는 이미지 및 비디오 압축과 같은 손실 압축 코덱의 재구성 품질을 평가하는 데 사용되는 지표이다. PSNR은 평균 제곱 오차(MSE)를 기반으로 하며, 데시벨(dB) 단위로 표현된다. 일반적으로 PSNR 값이 높을수록 재구성 품질이 더 높다고 간주되지만, PSNR은 동일한 코덱과 콘텐츠를 비교하는 데에만 유효하며, 인간의 시각적 품질을 정확하게 반영하지 못할 수 있다. PSNR의 변형으로 인간 시각 시스템의 특성을 고려한 PSNR-HVS, 시각적 마스킹을 추가로 고려한 PSNR-HVS-M 등이 있다.

최대 신호 대 잡음비
📚 더 읽어볼만한 페이지
  • 화상 압축 - JPEG
    JPEG은 정지 화상의 디지털 압축 및 코딩을 위한 국제 표준이자 이를 만든 위원회의 이름으로, 1992년 최초 표준 발표 이후 웹 환경에서 널리 사용되는 이미지 형식이 되었다.
  • 화상 압축 - PNG
    PNG는 GIF의 단점을 보완하여 개발된 무손실 압축 방식의 그래픽 파일 형식이며, 높은 색상 표현과 투명도를 지원하고, 8바이트 시그니처와 이미지 정보를 담은 청크들로 파일 구조가 구성된다.
  • 측정 - 측지학
    측지학은 지구의 형상, 크기, 중력장 및 시간적 변화를 측정하고 연구하는 지구과학의 한 분야로, 고대 그리스어에서 유래되었으며 현대에는 GPS 등의 기술을 활용하여 지구 역학적 현상 연구에 기여한다.
  • 측정 - 불확실성
    불확실성이란 현재나 미래를 정확히 예측할 수 없는 상태를 말하며, 확률을 알 수 없는 근본적인 불확실성도 존재하고, 바람직하지 않은 결과를 초래할 수 있는 위험과는 구별되며, 과학, 경제, 철학 등 다양한 분야에서 다뤄지는 중요한 개념이다.

2. 정의

최대 신호 대 잡음비(PSNR)는 평균 제곱 오차(MSE)를 통해 가장 쉽게 정의된다. 잡음이 없는 m×n 흑백 이미지 I와 해당 이미지의 잡음이 있는 근사치 K가 주어지면, MSE는 다음과 같이 정의된다.

:\mathit{MSE} = \frac{1}{m\,n}\sum_{i=0}^{m-1}\sum_{j=0}^{n-1} [I(i,j) - K(i,j)]^2.

PSNR(dB)은 다음과 같이 정의된다.

:\begin{align}
\mathit{PSNR} &= 10 \cdot \log_{10} \left( \frac{\mathit{MAX}_I^2}{\mathit{MSE}} \right) \\
&= 20 \cdot \log_{10} \left( \frac{\mathit{MAX}_I}{\sqrt{\mathit{MSE}}} \right) \\
&= 20 \cdot \log_{10}(\mathit{MAX}_I) - 10 \cdot \log_{10} (\mathit{MSE}).
\end{align}

여기서 MAXI는 이미지의 가능한 최대 픽셀 값이다. 픽셀이 샘플당 8비트를 사용하여 표현될 때, 이 값은 255이다. 더 일반적으로, 샘플이 샘플당 B 비트의 선형 PCM을 사용하여 표현될 때, MAXI는 2B − 1이다.

2.1. 컬러 이미지

색상 이미지의 경우, 픽셀당 세 개의 RGB 값을 가지며, 최대 신호 대 잡음비(PSNR)의 정의는 평균 제곱 오차(MSE)가 모든 제곱 값 차이의 합이라는 점을 제외하면 동일하다(이제 각 색상에 대해, 즉 흑백 이미지보다 세 배 많은 차이). 또는, 컬러 이미지의 경우 이미지를 다른 색 공간으로 변환하고 최대 신호 대 잡음비(PSNR)는 해당 색 공간의 각 채널에 대해 보고된다. 예를 들어, YCbCr 또는 HSL이다.

3. PSNR을 이용한 품질 평가

PSNR은 손실 압축 코덱 (예: 이미지 압축)의 재구성에 대한 품질을 측정하는 데 가장 일반적으로 사용된다. 이 경우 신호는 원본 데이터이고 노이즈는 압축으로 인해 발생한 오류이다. 압축 코덱을 비교할 때 PSNR은 재구성 품질에 대한 인간의 인식에 대한 "근사치"이다.

손실 이미지 및 비디오 압축에서 PSNR의 일반적인 값은 비트 심도가 8 비트인 경우 30~50 dB 사이이며, 값이 높을수록 좋다. 12비트 이미지의 처리 품질은 PSNR 값이 60 dB 이상일 때 높다고 간주된다. 16비트 데이터의 경우 PSNR의 일반적인 값은 60~80 dB 사이이다. 무선 전송 품질 손실에 대한 허용 가능한 값은 약 20 dB에서 25 dB로 간주된다.

노이즈가 없으면 두 이미지 IK가 동일하므로 MSE는 0이다. 이 경우 PSNR은 무한대이다 (또는 정의되지 않음, 0으로 나누기 참조).

원본 압축되지 않은 이미지
원본 압축되지 않은 이미지



4. 성능 비교

일반적으로 더 높은 PSNR이 더 높은 품질의 재구성과 상관관계가 있지만, 많은 경우 그렇지 않을 수 있다. 이 지표의 유효 범위에 대해 극도로 주의해야 한다. 동일한 코덱(또는 코덱 유형) 및 동일한 콘텐츠의 결과를 비교하는 데 사용될 때만 결정적으로 유효하다.

일반적으로 인간이 인식하는 이미지 품질 및 비디오 품질을 추정하는 데 있어서 PSNR은 다른 품질 지표에 비해 매우 낮은 성능을 보이는 것으로 나타났다.

5. 변형

PSNR-HVS는 인간 시각 시스템의 특성, 예를 들어 대비 인지를 통합한 PSNR의 확장이다.

PSNR-HVS-M은 시각적 마스킹을 추가로 고려하여 PSNR-HVS를 개선했다. 2007년 연구에서 PSNR 및 SSIM보다 인간의 시각적 품질 판단에 대한 더 나은 근사치를 제공했다. 또한 DCTune 및 PSNR-HVS보다 뚜렷한 이점이 있는 것으로 나타났다.