부호율-변형 이론
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
부호율-왜곡 이론은 주어진 왜곡 수준에서 신호를 압축하는 데 필요한 최소 비트율을 연구하는 정보 이론의 한 분야이다. 이 이론은 가우시안 신호, 베르누이 신호 등 다양한 신호에 대한 율-왜곡 함수를 수학적으로 모델링하며, 왜곡 함수를 사용하여 원본 신호와 근사 신호 간의 차이를 측정한다. 율-왜곡 함수는 주어진 왜곡 수준에서 달성 가능한 최소 비트율을 나타내며, 섀넌 하한과 블라후트-아리모토 알고리즘을 통해 계산될 수 있다. 이 이론은 채널 용량과의 관계를 통해 정보 전송 시 손실을 최소화하는 데 활용되며, 압축 시스템 설계에 중요한 역할을 한다.
더 읽어볼만한 페이지
- 데이터 압축 - 해상도
해상도는 1인치당 픽셀 또는 점의 수를 나타내는 지표로, 이미지의 선명도를 결정하며 DPI와 PPI 단위를 사용하고, 높을수록 섬세한 표현이 가능하다. - 데이터 압축 - MP3
MP3는 MPEG 표준의 오디오 압축 형식으로, 인간의 청각 심리를 이용하여 음질 저하를 최소화하며 데이터를 압축하고, 1991년에 발명되어 2017년 특허 만료로 퍼블릭 도메인이 되었다. - 정보 이론 - 양자 컴퓨터
양자 컴퓨터는 양자역학적 현상을 이용하여 정보를 처리하는 컴퓨터로, 큐비트를 통해 0과 1을 동시에 표현하여 특정 연산에서 기존 컴퓨터보다 빠른 속도를 보이며 암호 해독, 신약 개발 등 다양한 분야에 혁신을 가져올 것으로 기대된다. - 정보 이론 - 정보 엔트로피
정보 엔트로피는 확률 변수의 불확실성을 측정하는 방법으로, 사건 발생 가능성이 낮을수록 정보량이 커진다는 원리에 기반하며, 데이터 압축, 생물다양성 측정, 암호화 등 다양한 분야에서 활용된다.
부호율-변형 이론 | |
---|---|
일반 정보 | |
분야 | 정보 이론 |
하위 분야 | 데이터 압축 |
이론적 측면 | |
주요 목표 | 주어진 비트 레이트 또는 저장 공간 제약 조건 하에서 정보의 손실 표현에 필요한 압축률과 왜곡 사이의 절충을 연구함 이는 주어진 왜곡 수준에서 달성 가능한 최소 비트율을 찾는 것을 포함함 |
핵심 개념 | 율-왜곡 함수 정보율 왜곡 함수 최적화 양자화 정보 이론 |
관련 개념 | |
관련 분야 | 데이터 압축 정보 이론 신호 처리 통신 이론 표본화 이론 |
관련 정리 | Shannon의 소스 코딩 정리 |
역사 | |
창시자 | 클로드 섀넌 |
최초 발표 | 1948년 |
주요 기여자 | |
주요 인물 | 토비 버거 데이비드 스테이츠먼 로버트 그레이 리머 크레트슈머 나람만 팔라스라자 셰라즈 알리 |
2. 역사
가우시안이고 독립 항등 분포(i.i.d)인 신호 에 대한 부호율-변형 함수는 다음과 같이 주어진다.[2]3. 수학적 모델링
:
여기서 은 신호 의 분산(크기)이다. 이 식은 왜곡(D)이 신호의 분산보다 커질 수 없으며, 왜곡을 줄이려면 비트율(R)을 늘려야 함을 의미한다. distortion의 양은 원신호의 전력보다 커질 수 가 없다는 것이 한 가지이다. 그리고 distortion을 줄이기 위해서는 계속 bit수를 늘려야 함을 의미한다. 최대 distortion은 신호의 전력만큼이면 SDR로 나타내면 0dB이다. 여기서 3dB를 올려갈 때마다 1bit씩 추가로 늘어나야 한다. Distortion에 의한 SDR은 15dB까지 올리려고 하면 최소 5bits가 필요하다는 의미이다. 신호 대 왜곡 비(SDR)를 3dB 높일 때마다 1bit씩 추가해야 한다.[2]
주의해야 할 점은 SDR에 있어서 필요한 rate는 원 신호의 전력의 절대적인 값과는 상관없다는 점이다. 통신 시스템의 성능이 신호대 오류의 전력비율로 결정되는 만큼 rate와 SDR과의 상관관계는 신호의 절대전력이 아니라 상대전력비로 결정이 된다.
부호율-왜곡 이론에 따르면 '회색 영역 밖에서 작동하는 압축 시스템은 존재하지 않는다'.[3] 실제 압축 시스템이 빨간색 (하한) 경계에 가까울수록 성능이 더 좋다. 일반적으로, 이 경계는 부호화 블록 길이를 증가시킴으로써만 달성할 수 있다. 그럼에도 불구하고, 단위 블록 길이에서도 실질적으로 관련 있는 부호율-왜곡 함수로부터의 거리에 있는 좋은 (스칼라) 양자화기를 종종 찾을 수 있다.[3]
이 부호율-왜곡 함수는 가우시안 무기억 소스에 대해서만 유효하다. 가우시안 소스는 인코딩하기에 가장 "어려운" 소스로 알려져 있다. 주어진 평균 제곱 오차에 대해, 가장 많은 비트 수를 필요로 한다.
3. 1. 가우시안 신호
가우시안이고 독립 항등 분포(i.i.d)인 신호 에 대한 부호율-변형 함수는 다음과 같이 주어진다.[2]
:
여기서 은 신호 의 분산(크기)이다. 이 식은 왜곡(D)이 신호의 분산보다 커질 수 없으며, 왜곡을 줄이려면 비트율(R)을 늘려야 함을 의미한다. 신호 대 왜곡 비(SDR)를 3dB 높일 때마다 1bit씩 추가해야 한다.[2] Distortion에 의한 SDR은 15dB까지 올리려고 하면 최소 5bits가 필요하다는 의미이다.
부호율-왜곡 이론에 따르면 '회색 영역 밖에서 작동하는 압축 시스템은 존재하지 않는다'.[3] 실제 압축 시스템이 빨간색 (하한) 경계에 가까울수록 성능이 더 좋다. 일반적으로, 이 경계는 부호화 블록 길이를 증가시킴으로써만 달성할 수 있다. 그럼에도 불구하고, 단위 블록 길이에서도 실질적으로 관련 있는 부호율-왜곡 함수로부터의 거리에 있는 좋은 (스칼라) 양자화기를 종종 찾을 수 있다.[3]
이 부호율-왜곡 함수는 가우시안 무기억 소스에 대해서만 유효하다. 가우시안 소스는 인코딩하기에 가장 "어려운" 소스로 알려져 있다. 주어진 평균 제곱 오차에 대해, 가장 많은 비트 수를 필요로 한다.
3. 2. 베르누이 신호
해밍 왜곡을 갖는 베르누이 확률 변수의 율-왜곡 함수는 다음과 같다.
:
여기서 는 이진 엔트로피 함수를 나타낸다.
4. 왜곡 함수 (Distortion Function)
왜곡 함수는 원본 기호 를 근사 기호 로 표현하는 비용을 측정한다. 대표적인 왜곡 함수로는 해밍 왜곡과 제곱 오차 왜곡이 있다.
해밍 왜곡 (Hamming Distortion)원본 기호와 복원된 기호가 같으면 왜곡이 없고, 다르면 왜곡이 1이다.
:
제곱 오차 왜곡 (Squared-Error Distortion)원본 신호와 복원된 신호 간 차이의 제곱으로 왜곡을 측정한다.
:
4. 1. 해밍 왜곡 (Hamming Distortion)
원본 기호와 복원된 기호가 같으면 왜곡이 없고, 다르면 왜곡이 1이다.:
4. 2. 제곱 오차 왜곡 (Squared-Error Distortion)
원본 신호와 복원된 신호 간 차이의 제곱으로 왜곡을 측정한다.:
5. 율-왜곡 함수 (Rate-Distortion Function)
율-왜곡 함수는 주어진 왜곡 수준(D)에서 달성 가능한 최소 비트율(R)을 나타내는 함수이다. 율-왜곡 함수는 다음 최소화 문제의 해로 찾아진다.
:
여기서 는 검정 채널(test channel)이라고도 불리며, 주어진 입력(원 신호) 에 대한 통신 채널 출력(압축된 신호) 의 조건부 확률 밀도 함수(PDF)이다. 는 와 사이의 상호 정보량으로, 다음과 같이 정의된다.
:
여기서 와 는 각각 출력 신호 ''Y''의 엔트로피와 입력 신호가 주어졌을 때 출력 신호의 조건부 엔트로피이다.
상호 정보량은 수신자가 송신자의 신호에 대해 갖는 '사전' 불확실성(''H''(''Y''))에서 송신자의 신호에 대한 정보를 받은 후 남은 불확실성()을 뺀 값으로 이해할 수 있다.
율-왜곡 함수를 계산하려면 입력 의 확률적 설명()이 필요하며, 주어진 왜곡 에 대해 율을 최소화하는 조건부 PDF 를 찾아야 한다.
이 최적화 문제에 대한 해석적 표현은 일반적으로 구하기 어렵지만, 섀넌 하한 (SLB)을 포함하여 율-왜곡 함수에 대한 상한 및 하한이 존재한다. 제곱 오차와 무기억 소스의 경우, 유한한 미분 엔트로피를 가진 임의의 소스에 대해 다음과 같은 섀넌 하한을 갖는다.
:
여기서 ''h''(''D'')는 분산 D를 갖는 가우스 확률 변수의 미분 엔트로피이다.
블라후트-아리모토 알고리즘은 임의의 유한 입력/출력 알파벳 소스의 율-왜곡 함수를 수치적으로 구하는 반복 기법이다.
메모리가 있는 정상 소스를 사용할 때는 율 왜곡 함수의 정의를 수정해야 하며, 증가하는 길이의 시퀀스에 대한 극한의 의미로 이해해야 한다.
가우시안이고 i.i.d인 신호 에 대한 부호율-변형 함수는 다음과 같이 주어진다.
:
여기서 은 신호 의 크기이다. 이 수식의 의미는 distortion의 양은 원신호의 전력보다 커질 수 없고, distortion을 줄이기 위해서는 계속 bit수를 늘려야 함을 의미한다.
6. 섀넌 하한 (Shannon Lower Bound)
7. 블라후트-아리모토 알고리즘 (Blahut-Arimoto Algorithm)
8. 채널 용량과의 관계
사용자가 왜곡 ''D''를 초과하지 않는 상태로 소스에 대한 정보를 전송하려 한다고 가정할 때, 부호율-왜곡 이론에 따르면 소스에서 사용자에게 최소 비트/심볼의 정보가 도달해야 한다.[4] 소스 엔트로피가 ''H'' 비트/심볼이고, 채널 용량이 ''C'' (여기서 )인 경우, 섀넌의 채널 부호화 정리에 따르면, 주어진 채널을 통해 이 정보를 전송할 때 비트/심볼이 손실된다.[4] 사용자가 최대 왜곡 ''D''로 재구성할 수 있기를 바란다면, 전송 중에 손실된 정보가 비트/심볼의 최대 허용 손실을 초과하지 않도록 요구해야 한다.[4] 즉, 채널 용량은 최소한 이상이어야 한다.[4]
9. 응용
참조
[1]
학회
Rethinking Lossy Compression: The Rate-Distortion-Perception Tradeoff
http://proceedings.m[...]
PMLR
2019
[2]
서적
[3]
서적
Elements of Information Theory
Wiley
[4]
서적
Rate Distortion Theory: A Mathematical Basis for Data Compression
https://archive.org/[...]
Prentice Hall
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com