손실 압축
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
손실 압축은 원본 데이터의 일부 정보를 손실시키면서 데이터를 압축하는 방식이다. 주로 수학적 모델링, 예측 알고리즘, 변환 코딩 등을 활용하며, 인간의 감각으로 인지하기 어려운 정보를 제거하여 압축률을 높인다. 변환 코딩 방식인 이산 코사인 변환(DCT)이 널리 사용되며, JPEG, MPEG, MP3 등 다양한 형식에 적용된다. 손실 압축은 무손실 압축에 비해 압축률이 높고 저장 및 전송 비용이 적게 들지만, 반복적인 압축 및 압축 해제 시 품질 저하(세대 손실)가 발생하며, 편집 시 재인코딩으로 인해 추가적인 손실이 생길 수 있다.
더 읽어볼만한 페이지
- 손실 압축 알고리즘 - JPEG
JPEG은 정지 화상의 디지털 압축 및 코딩을 위한 국제 표준이자 이를 만든 위원회의 이름으로, 1992년 최초 표준 발표 이후 웹 환경에서 널리 사용되는 이미지 형식이 되었다. - 손실 압축 알고리즘 - VP9
VP9는 구글이 개발한 오픈 소스 비디오 코덱으로, VP8보다 압축 효율을 높이고 HEVC보다 나은 성능을 목표로 개발되었으며, WebM 형식으로 사용되고 주요 웹 브라우저와 넷플릭스, 유튜브 등에서 지원했으나 AV1의 등장으로 개발이 중단되었다. - 데이터 압축 - 해상도
해상도는 1인치당 픽셀 또는 점의 수를 나타내는 지표로, 이미지의 선명도를 결정하며 DPI와 PPI 단위를 사용하고, 높을수록 섬세한 표현이 가능하다. - 데이터 압축 - MP3
MP3는 MPEG 표준의 오디오 압축 형식으로, 인간의 청각 심리를 이용하여 음질 저하를 최소화하며 데이터를 압축하고, 1991년에 발명되어 2017년 특허 만료로 퍼블릭 도메인이 되었다.
손실 압축 |
---|
2. 손실 압축의 원리
손실 압축은 일반적으로 수학적 모델링이나 예측 알고리즘을 통해 주요 데이터를 표현하고, 원본과의 오차값을 변환하여 양자화한 후 전송하는 방식으로 이루어진다. 이 과정에서는 사람이 잘 인지하지 못하거나 둔감하게 느끼는 정보는 의도적으로 손실시켜 데이터의 양을 줄인다. 예를 들어, 영상 압축에서는 고주파 성분이나 색상 차이 정보를 줄이는 방식을 사용하며,[15] 오디오 압축에서는 음향학 연구 결과를 바탕으로 사람이 잘 듣지 못하는 소리 성분을 제거하는 방식을 사용한다.
많은 디지털 데이터는 저장에 필요한 컴퓨터 파일의 크기나 전송에 필요한 대역폭을 줄이기 위해 압축된다. 무손실 데이터 압축은 원본 정보의 손실 없이 파일 크기를 줄일 수 있지만, 기본적인 정보 이론에 따르면 데이터의 크기를 줄이는 데에는 절대적인 한계가 있다. 데이터가 압축되면 엔트로피가 증가하며, 무한정 증가할 수는 없다. 예를 들어, 압축된 ZIP 파일은 원본보다 작지만, 동일한 파일을 반복적으로 압축해도 크기가 0이 되지는 않는다.
반면, 손실 압축은 파일이나 데이터 스트림에 포함된 정보 중 일부를 의도적으로 제거하여 더 높은 압축률을 얻는다. 예를 들어, 그림 파일은 사람이 눈으로 구별하기 어려운 세부 정보를 제거하거나, 오디오 파일은 잘 들리지 않는 소리 정보를 제거하는 방식으로 압축될 수 있다. 손실 압축 기술은 인간의 인지 능력에 맞춰 최대한 자연스럽게 보이거나 들리도록 설계되지만, 어느 정도의 품질 저하는 불가피하다. 때로는 이러한 품질 손실이 눈에 띄지 않아 '시각적으로 무손실'이라고 표현하기도 하며, 의료 영상 분야처럼 특수한 경우에는 '손실' 및 '무손실' 대신 각각 '비가역'(irreversibleeng) 및 '가역'(reversibleeng)이라는 용어를 선호하기도 한다. 손실의 유형과 양은 이미지의 유용성에 영향을 미칠 수 있으며, 압축으로 인한 왜곡(아티팩트)이 보이더라도 의도된 목적에 유용할 수 있다. 의료 이미지의 경우, 소위 진단적으로 허용 가능한 비가역 압축 (DAIC)[1]이 적용될 수 있다.
일부 손실 압축 방식은 변환 코딩을 응용한 것으로 볼 수 있는데, 이는 데이터를 다른 영역(예: 주파수 영역)으로 변환하여 중요도가 낮은 정보를 보다 효과적으로 양자화하고 제거하는 기법이다. 이 과정에서 응용 프로그램의 특성을 고려하여 폐기할 정보를 선택함으로써 필요한 대역폭을 낮춘다. 디코딩된 결과는 원본과 완전히 동일하지는 않지만, 사용 목적에 충분히 가까운 수준의 품질을 유지할 것으로 기대된다.
손실 압축 형식은 파일을 반복적으로 압축하고 압축 해제하면 품질이 점차 떨어지는 '''세대 손실'''을 겪는다. 이는 이러한 절차를 사용해도 데이터가 손실되지 않는 무손실 데이터 압축과 대조된다. 손실 데이터 압축에 대한 정보 이론적 기초는 율-왜곡 이론에 의해 제공된다. 이는 최적의 코딩 이론에서 확률을 사용하는 것과 마찬가지로, 지각적 왜곡과 심지어 미학적 판단을 모델링하기 위해 베이즈 추정 이론 및 결정 이론에 크게 의존한다.
손실 압축 방식에는 두 가지 기본 방식이 있다.
- '''손실 변환 코덱''': 그림 또는 소리의 샘플을 채취하여 작은 세그먼트로 자르고, 새로운 기저 공간으로 변환하고, 양자화한다. 결과적으로 양자화된 값은 엔트로피 코딩된다.
- '''손실 예측 코덱''': 이전 및/또는 이후에 디코딩된 데이터를 사용하여 현재 사운드 샘플 또는 이미지 프레임을 예측한다. 예측된 데이터와 실제 데이터 간의 오차, 그리고 예측을 재현하는 데 필요한 추가 정보는 양자화되고 코딩된다.
일부 시스템에서는 두 기술을 결합하여 변환 코덱을 사용하여 예측 단계에서 생성된 오차 신호를 압축한다.
2. 1. 이산 코사인 변환 (DCT)
가장 일반적인 형태의 손실 압축은 변환 코딩 방식인 이산 코사인 변환 (DCT)이다.[2] 이는 1974년 나시르 아흐메드, T. 나타라잔 및 K. R. 라오에 의해 처음 발표되었다.[3] DCT는 널리 사용되는 이미지 압축 형식 (예: JPEG),[4] 비디오 코딩 표준 (예: MPEG 및 H.264/AVC) 및 오디오 압축 형식 (예: MP3 및 AAC)에 가장 널리 사용되는 손실 압축 방식이다.변환 코딩은 디지털 이미지, 디지털 오디오 신호, 디지털 비디오에 사용되는 데이터 압축의 한 유형으로, 변환을 통해 데이터를 더 효율적으로 양자화할 수 있게 한다. 응용 프로그램에 대한 지식을 활용하여 덜 중요한 정보를 선택적으로 폐기함으로써 데이터 전송에 필요한 대역폭을 줄인다. 나머지 정보는 다양한 방법을 통해 압축될 수 있으며, 디코딩된 결과는 원본과 완전히 동일하지는 않지만, 원래의 목적을 달성하기에 충분한 수준의 품질을 유지한다.
2. 2. 지각 코딩 (Perceptual coding)
오디오 데이터의 경우, 변환 코딩의 인기 있는 형태는 지각 코딩이다. 이는 원시 데이터를 정보 내용을 보다 정확하게 반영하는 도메인으로 변환하는 기술이다.[5] 예를 들어, 사운드 파일을 시간에 따른 진폭 레벨로 표현하는 대신, 인간의 청각 인식과 더 정확하게 일치하는 시간에 따른 주파수 스펙트럼으로 표현할 수 있다.[5]데이터 축소(압축)가 변환 코딩의 주요 목표이지만, 지각 코딩은 다른 목표도 가능하게 한다. 예를 들어, 원칙적으로 아날로그나 고해상도 디지털 마스터에서 시작하는 경우, 주어진 파일 크기의 MP3 파일은 동일한 크기의 원시 비압축 WAV나 AIFF 파일보다 원본 오디오 신호를 더 잘 표현할 수도 있다.[5] 이는 비압축 오디오는 비트레이트나 샘플링 깊이를 낮춰 파일 크기를 줄여야 하지만, 지각 코딩을 사용한 압축은 비트레이트와 깊이를 유지하면서도 덜 중요한 데이터를 선택적으로 손실시켜 크기를 줄일 수 있기 때문이다.[5] 또한, 변환 코딩은 데이터를 조작하거나 편집하기 더 좋은 도메인을 제공하기도 한다. 예를 들어, 오디오의 이퀄라이제이션(음색 조정)은 원시 시간 도메인보다는 주파수 도메인에서 더 자연스럽게 표현되고 처리될 수 있다(예: 저음 강화).[5]
이러한 관점에서 지각 코딩은 단순히 데이터를 '버리는' 것이 아니라, 인간의 인지에 맞춰 데이터를 '더 잘 표현하는' 기술로 이해할 수 있다.[5]
3. 손실 압축의 유형 및 활용 분야
많은 종류의 디지털 데이터를 압축하여 저장에 필요한 컴퓨터 파일의 크기나 전송에 필요한 대역폭을 줄일 수 있다. 모든 정보를 보존하는 무손실 압축과 달리, 손실 압축은 원본 데이터의 일부 정보를 의도적으로 제거하여 더 높은 압축률을 얻는 방식이다.
원본 데이터에는 일정량의 정보가 있으며, 정보 이론에 따르면 데이터를 압축하는 데에는 한계가 있다. 데이터가 압축되면 엔트로피가 증가하며 무한정 압축될 수는 없다. 예를 들어, 이미 압축된 ZIP 파일을 반복해서 압축한다고 해서 파일 크기가 계속 줄어들지는 않는다. 대부분의 압축 알고리즘은 더 이상의 압축이 비효율적이거나 오히려 파일 크기를 늘릴 수 있다는 것을 인지한다.
많은 경우, 이미지나 오디오 파일과 같은 디지털 데이터는 사람이 인지할 수 있는 수준 이상의 정보를 포함하고 있다. 예를 들어, 이미지는 사람이 눈으로 구별하기 어려운 세부 정보를 가질 수 있고, 오디오 파일 역시 특정 소리에 묻혀 잘 들리지 않는 소리 정보를 포함할 수 있다. 손실 압축 기술은 이러한 인간의 인지적 한계를 이용하여 불필요하다고 판단되는 정보를 제거함으로써 파일 크기를 효과적으로 줄인다. 이는 가능한 한 원본과 유사한 인식을 유지하면서 최대한 많은 디지털 정보를 제거하려는 시도이며, 때로는 눈에 띄는 품질 저하가 허용 가능한 절충안으로 여겨지기도 한다.
'손실'이라는 단어가 주는 부정적인 인식을 피하기 위해, 의료 영상 압축과 같은 일부 분야에서는 '손실' 대신 '비가역적'(irreversibleeng)이라는 용어를 사용하기도 한다. (반대로 무손실 압축은 '가역적'(reversibleeng)이라고 한다.) 손실의 유형과 정도는 데이터의 유용성에 영향을 미칠 수 있다. 압축으로 인해 생긴 인공적인 왜곡(압축 아티팩트)이 눈에 띄더라도, 결과물이 의도된 목적에 충분히 유용할 수 있다. 어떤 경우에는 손실 압축된 이미지가 원본과 시각적으로 거의 구별되지 않는 '시각적으로 무손실' 수준일 수도 있으며, 의료 이미지의 경우 '진단적으로 허용 가능한 비가역 압축'(DAIC, Diagnostically Acceptable Irreversible Compressioneng)이라는 기준이 적용되기도 한다.[1]
3. 1. 그래픽
그래픽 데이터는 일반적으로 이미지와 비디오를 포함하며, 원본 데이터의 크기가 매우 커서 효율적인 저장과 전송을 위해 데이터 압축 기술이 필수적으로 요구된다. 특히 손실 압축은 사람이 잘 인지하지 못하는 정보를 제거하여 데이터 크기를 획기적으로 줄이는 방식으로, 웹 환경이나 디지털 방송, 스트리밍 서비스 등 다양한 분야에서 핵심적인 역할을 수행한다.그래픽 분야의 손실 압축은 주로 이미지 압축과 비디오 압축으로 나뉘어 발전해왔으며, 각각의 데이터 특성에 맞는 다양한 알고리즘과 파일 형식이 개발되어 사용되고 있다. 예를 들어, 정지 이미지 압축에는 JPEG[7]와 같은 형식이 널리 쓰이며, 동영상 압축에는 프레임 간의 유사성을 이용하는 기법들이 추가로 적용된다.
3. 1. 1. 이미지
이미지 손실 압축에는 다양한 기술과 형식이 사용된다. 대표적인 기술로는 이산 코사인 변환(DCT)과 웨이블릿 변환이 있다.'''DCT 기반 압축 형식'''
- JPEG:[7] 가장 널리 사용되는 이미지 압축 형식 중 하나로, 이산 코사인 변환(DCT) 기술을 기반으로 한다.
- WebP: 구글에서 개발한 이미지 형식으로, RGB 및 RGBA 이미지의 고밀도 무손실 또는 손실 압축을 지원한다.
- HEIF (High Efficiency Image Format): 고효율 이미지 형식으로, 차세대 이미지 압축 기술로 주목받고 있다.
- BPG (Better Portable Graphics): 무손실 또는 손실 압축을 지원하는 형식이다.
- JPEG XR: 고다이내믹 레인지(HDR) 및 넓은 색 영역 픽셀 형식을 지원하는 JPEG의 후속 기술로, 무손실 또는 손실 압축을 지원한다.
'''웨이블릿 변환 기반 압축 형식'''
- JPEG 2000: 웨이블릿을 사용하는 JPEG의 후속 형식으로, 손실 및 무손실 압축을 모두 지원한다.
- DjVu: 문서 이미지 압축에 주로 사용되는 형식이다.
- ICER: 화성 탐사 로버에서 사용된 이미지 압축 형식으로, 웨이블릿을 사용한다는 점에서 JPEG 2000과 관련이 있다.
- PGF (Progressive Graphics File): 점진적 로딩을 지원하며, 손실 및 무손실 압축을 모두 지원한다.
'''기타 이미지 압축 형식'''
- CPC (Cartesian Perceptual Compression): 데카르트 지각 압축이라고도 불린다.
- 프랙탈 압축: 이미지의 자기 유사성을 이용하는 압축 방식이다.
- JBIG2: 주로 흑백 이미지 압축에 사용되며, 무손실 또는 손실 압축을 지원한다.
- S3TC: 그래픽 처리 장치(GPU)에서 텍스처 압축을 위해 사용되는 기술이다.
3. 1. 2. 비디오
비디오 데이터를 압축하는 데에도 손실 압축 기법이 널리 사용된다. 비디오는 연속된 이미지 프레임과 오디오 데이터로 구성되므로, 이미지 압축과 오디오 압축 기술을 함께 활용하며, 프레임 간의 시간적 중복성을 제거하여 압축 효율을 높인다. 주요 비디오 손실 압축 코덱은 다음과 같다.- 이산 코사인 변환 (DCT) 기반 코덱: 많은 비디오 코덱은 이미지 압축과 유사하게 DCT를 기반으로 한다.
- * H.261: 화상 통화 및 화상 회의를 위한 초기 비디오 코딩 표준이다.[7]
- * 모션 JPEG (Motion JPEG, M-JPEG): 각 비디오 프레임을 개별적인 JPEG 이미지로 압축하는 방식이다.[7] 편집에 용이하지만 압축 효율은 상대적으로 낮다.
- * MPEG-1 파트 2: 비디오 CD (VCD) 등에 사용된 초기 MPEG 표준이다.[8]
- * MPEG-2 파트 2 (H.262): DVD 비디오, 초기 디지털 방송 (예: ATSC, DVB) 표준으로 널리 사용되었다.[8] 현재도 일부 방송 환경에서 사용되고 있다.
- * MPEG-4 파트 2 (H.263 기반): MPEG-1, 2보다 개선된 압축 효율을 제공하며, 웹 스트리밍, 화상 통화 등 다양한 분야에 적용되었다.[7]
- * 고급 비디오 코딩 (Advanced Video Coding, AVC / H.264 / MPEG-4 파트 10): 현재 가장 널리 사용되는 비디오 코덱 중 하나이다.[7] MPEG-2 대비 약 2배의 압축 효율을 보이면서도 우수한 화질을 제공하여, 지상파 방송 (예: FHD 방송), IPTV, 케이블 방송, 위성방송, 블루레이 디스크, 인터넷, 모바일 스트리밍 서비스 (예: 유튜브, 넷플릭스) 등 거의 모든 분야에서 표준으로 자리 잡았다. 한국의 주요 방송사와 OTT 서비스 대부분이 H.264/AVC를 채택하고 있다. 특정 프로파일에서는 무손실 압축도 지원한다.
- * 고효율 비디오 코딩 (High Efficiency Video Coding, HEVC / H.265): H.264/AVC의 후속 표준으로, 동일 화질에서 약 2배의 압축 효율을 목표로 개발되었다.[7] 4K, 8K UHD 방송 및 콘텐츠 전송에 주로 사용된다. 한국에서도 UHD 방송 표준으로 채택되었다. 다만, H.264/AVC에 비해 로열티 문제가 복잡하여 보급이 다소 더디게 진행되었다.
- * Ogg Theora: Xiph.Org 재단에서 개발한 개방형, 로열티 없는 비디오 코덱이다. 특허 제약 없이 자유롭게 사용할 수 있다는 장점이 있다.
- * VC-1: 마이크로소프트에서 개발한 코덱으로, 윈도우 미디어 비디오 (WMV) 9 코덱을 기반으로 표준화되었다. 블루레이 디스크 표준 중 하나로 채택되기도 했다.
- 웨이블릿 변환 기반 코덱: DCT 대신 웨이블릿 변환을 사용하여 압축하는 방식이다.
- * 모션 JPEG 2000 (Motion JPEG 2000): JPEG 2000 이미지 압축 표준을 비디오에 적용한 것이다. 높은 압축률과 화질, 다양한 해상도 및 화질 지원 등의 장점이 있어 디지털 시네마 등 전문 분야에서 사용된다.
- * 디랙 (Dirac): BBC에서 개발한 개방형, 로열티 없는 코덱이다. 웨이블릿 변환을 사용하며 높은 압축 성능을 목표로 한다.
- 기타 코덱:
- * 소렌슨 비디오 코덱 (Sorenson Video Codec): 애플의 퀵타임 등에서 초기에 널리 사용되었던 코덱이다.
- * AV1: Alliance for Open Media에서 개발한 개방형, 로열티 없는 차세대 비디오 코덱이다. HEVC/H.265와 비슷하거나 더 나은 압축 효율을 제공하면서도 로열티 문제가 없어 구글 (유튜브), 넷플릭스, 메타, 아마존 등 여러 기업의 지원을 받고 있다. 웹 브라우저 지원 확대와 함께 사용이 점차 늘어나고 있으며, 차세대 비디오 표준으로 주목받고 있다. 개방형 기술로서 독점적 코덱의 대안으로 부상하고 있다는 점에서 의미가 크다.
3. 2. 오디오
오디오 데이터의 손실 압축은 주로 지각 코딩(Perceptual coding) 원리를 활용한다. 이는 인간의 청각 시스템이 잘 감지하지 못하는 소리 정보를 제거하여 데이터 크기를 줄이는 방식이다. 예를 들어, 특정 소리에 의해 다른 소리가 잘 들리지 않는 마스킹 효과 등을 이용하여 불필요한 데이터를 선별적으로 제거한다.많은 오디오 손실 압축 기술은 변환 코딩(Transform coding) 방식을 사용한다. 원본 오디오 신호를 시간 영역에서 주파수 영역과 같은 다른 영역으로 변환한 후, 인간의 청각 특성에 맞춰 덜 중요한 정보를 양자화하거나 제거한다. 대표적인 변환 방식으로는 이산 코사인 변환(DCT)의 변형인 변형 이산 코사인 변환(MDCT)이 있으며, 이는 MP3, AAC 등 널리 사용되는 오디오 코덱의 핵심 기술이다.[9][10]
이러한 과정을 통해 오디오 파일의 크기를 원본 WAV나 AIFF 같은 무손실 형식에 비해 크게 줄일 수 있다. 이는 저장 공간을 절약하고 인터넷 스트리밍이나 파일 전송에 필요한 대역폭을 줄이는 데 매우 효과적이다. 손실 압축은 원본 데이터의 일부를 영구적으로 제거하지만, 잘 설계된 코덱은 청취자가 음질 저하를 거의 느끼지 못하도록 중요한 정보는 최대한 보존한다. 따라서 오디오 손실 압축은 단순히 데이터를 버리는 것이 아니라, 제한된 데이터 용량 내에서 최대한 원본에 가까운 청취 경험을 제공하기 위한 정보 처리 기술로 이해할 수 있다.[5]
다양한 종류의 손실 오디오 코덱이 개발되어 사용되고 있으며, 이들은 주로 압축 효율, 음질, 사용 목적(예: 음악, 음성) 등에 따라 구분된다. 구체적인 코덱의 종류와 특징은 하위 섹션인 음악 및 음성에서 자세히 다룬다.
3. 2. 1. 음악
오디오 파일의 손실 압축은 주로 인간의 청각 시스템이 잘 감지하지 못하는 소리 정보를 제거하여 데이터 크기를 줄이는 지각 코딩 원리를 이용한다. 이는 원본 오디오 신호를 주파수 영역 등으로 변환한 후, 덜 중요한 정보를 선별적으로 제거하는 방식으로 이루어진다. 이를 통해 제한된 저장 공간이나 대역폭 내에서 최대한 원본에 가까운 음질을 유지하려는 목적을 가진다.다양한 손실 오디오 압축 형식(코덱)이 개발되어 사용되고 있으며, 주요 코덱들은 다음과 같다.
- MP3: MPEG-1 Audio Layer III의 약자로, 가장 널리 알려지고 오랫동안 사용된 손실 오디오 압축 형식 중 하나이다.[9] 디지털 오디오 플레이어의 대중화를 이끈 핵심 기술로 평가받는다.
- AAC (Advanced Audio Coding): MP3보다 일반적으로 더 나은 압축 효율과 음질을 제공하는 것으로 알려져 있다.[10] 애플의 아이튠즈 및 iOS 기기, 유튜브 등 다양한 플랫폼과 서비스에서 표준 코덱으로 채택되어 널리 사용된다.
- Ogg Vorbis: 개방형 표준이며 로열티가 없는 자유로운 오디오 코덱이다. MP3나 AAC와 경쟁할 만한 음질과 압축률을 제공하며, 특히 오픈 소스 소프트웨어나 게임 등에서 선호된다.
- WMA (Windows Media Audio): 마이크로소프트가 개발한 오디오 코덱이다. 과거 윈도우 미디어 플레이어의 기본 코덱이었으며, 일부 DRM 기능과 함께 인터넷 스트리밍 서비스 등에서 사용되었다. WMA는 손실 압축 방식 외에 무손실 압축 방식(WMA Lossless)도 지원한다.
이러한 코덱들 외에도 다양한 목적과 성능을 가진 손실 오디오 코덱들이 존재한다. 많은 현대 오디오 코덱들은 변형 이산 코사인 변환(MDCT) 알고리즘을 기반으로 개발되었다.
다음은 주요 손실 오디오 코덱 및 관련 기술 목록이다.
- MDCT 기반 코덱:
- 돌비 디지털 (AC-3)
- ATRAC (Adaptive Transform Acoustic Coding)
- MP3[9]
- AAC / MP4 오디오[10]
- Ogg Vorbis
- WMA (표준 및 Pro 프로파일)
- LDAC[11][12]
- Opus (특허 제약이 적고, 낮은 지연 시간으로 음성 및 일반 오디오 모두에 적합)
- ADPCM (Adaptive Differential Pulse-Code Modulation) 기반 코덱:
- MQA (Master Quality Authenticated)
- 기타 코덱:
- MP2
- Musepack
- aptX / aptX-HD[13] (주로 블루투스 오디오 전송에 사용)
3. 2. 2. 음성
음성 데이터 압축에는 다양한 음성 부호화 기술이 사용된다. 이러한 기술들은 주로 인간의 음성 생성 및 청각 특성을 모델링하여 정보량을 줄이는 손실 압축 방식을 사용한다. 대표적인 음성 코딩 방식과 코덱들은 다음과 같다.- G.711: 펄스 부호 변조(PCM) 기반의 초기 디지털 전화 표준 코덱이다.
- G.726: 적응 차분 펄스 부호 변조(ADPCM) 기반 코덱이다.
- HILN (Harmonic and Individual Lines plus Noise): 파라미터 음성 코덱이다.
- 선형 예측 부호화(LPC) 계열: 음성 신호의 예측 가능성을 이용하여 압축하는 방식이다.
- 코드 여기 선형 예측(CELP): LPC 계열의 대표적인 방식으로, 다양한 파생 코덱이 존재한다.
- 대수적 코드 여기 선형 예측(ACELP)
- 완화된 코드 여기 선형 예측(RCELP)
- 저지연 CELP(LD-CELP)
- 적응 예측 부호화(APC)
- 적응형 다중 전송률 오디오 코덱(Adaptive Multi-Rate, AMR): GSM 및 3GPP 표준에 채택되어 휴대 전화 음성 통신 등에 널리 사용되는 코덱이다. 전송 환경에 따라 비트율을 조절할 수 있는 특징이 있다.
- Codec2: 특허 제한이 없는 오픈 소스 음성 코덱이다.
- Speex: 특허 제한이 없는 개방형 코덱으로, 특히 음성 압축에 특화되어 인터넷 전화(VoIP) 등 실시간 통신 환경에서 많이 사용된다.
- 수정된 이산 코사인 변환(MDCT) 계열: 주파수 영역 변환을 기반으로 하는 압축 방식이다.
- AAC-LD (Advanced Audio Coding - Low Delay)
- 제약 에너지 겹침 변환(CELT)
- 오푸스(Opus): CELT와 SILK(LPC 기반) 코덱을 결합한 하이브리드 코덱으로, 낮은 지연 시간과 높은 압축 효율을 제공하여 주로 실시간 응용 프로그램에 사용된다.
4. 손실 압축의 장단점
손실 압축은 원본 데이터의 일부 정보를 의도적으로 제거하여 컴퓨터 파일의 크기나 전송 대역폭을 줄이는 방식이다. 무손실 압축과 달리 정보 손실을 감수하는 대신 훨씬 높은 압축률을 얻을 수 있다는 장점이 있다. 파일 크기가 작아지면 저장 공간을 절약하고 인터넷을 통한 데이터 전송 시간을 단축할 수 있어, 스트리밍 비디오나 스트리밍 오디오 서비스 등에서 널리 활용된다. 특히 인간의 시각이나 청각이 감지하기 어려운 정보를 제거하는 방식으로 작동하기 때문에 소리, 이미지, 비디오와 같은 멀티미디어 데이터 압축에 효과적이다.
하지만 정보가 손실되기 때문에 압축된 데이터를 원본과 완전히 동일하게 복원할 수는 없다. 이러한 특성 때문에 '비가역(irreversible)' 압축이라고도 불린다.[1] 압축 과정에서 원본에는 없던 압축 결함(artifact)이 발생하거나, 반복적인 압축 및 변환 과정에서 품질이 점차 저하되는 세대 손실 문제가 생길 수 있다.
4. 1. 장점
무손실 압축 방식과 비교했을 때, 손실 압축 방식의 가장 큰 장점은 훨씬 높은 압축률을 제공한다는 점이다. 즉, 원본 데이터에서 사람이 감지하기 어려운 일부 정보를 제거하는 대가로 컴퓨터 파일의 크기를 훨씬 작게 만들 수 있다.파일 크기가 작아지면 여러 가지 이점이 있다. 저장 장치에 더 많은 데이터를 보관할 수 있어 저장 공간을 효율적으로 활용할 수 있으며, 파일을 주고받는 데 필요한 대역폭이 줄어들어 네트워크 전송 속도를 높일 수 있다. 이는 한국처럼 인터넷 속도가 빠르고 스마트폰 등 모바일 기기 보급률이 높은 환경에서 특히 유용하다.
손실 압축은 주로 소리, 이미지, 비디오와 같은 멀티미디어 데이터 압축에 사용된다. 이는 인간의 시각이나 청각이 완벽하지 않아 약간의 정보 손실이나 불일치를 자연스럽게 받아들이거나 알아차리지 못하는 경우가 많기 때문이다. 이상적인 손실 압축은 원본과 압축된 결과물의 차이를 사람이 거의 또는 전혀 구별할 수 없는 투명한 상태를 목표로 한다.
이러한 특성 덕분에 손실 압축 기술은 넷플릭스와 같은 스트리밍 비디오 서비스나 스포티파이와 같은 스트리밍 오디오 서비스에 필수적이다. 제한된 네트워크 대역폭 환경에서도 고품질의 멀티미디어 콘텐츠를 실시간으로 전송할 수 있게 해주어, 오늘날 인터넷 기반 미디어 소비 환경의 핵심 기술로 자리 잡았다.
데이터 종류에 따라 일반적인 압축률에는 차이가 있다.
- 비디오: 시각적인 품질 저하를 거의 느끼지 못하게 하면서도 원본 대비 100분의 1 수준(100:1)까지 크기를 줄이는 등 매우 높은 압축이 가능하다.
- 오디오: 품질 손실을 거의 감지할 수 없는 수준에서 10분의 1(10:1) 정도로 압축될 수 있다.
- 정지 이미지: 오디오와 비슷하게 10:1 정도로 압축되는 경우가 많지만, 때로는 세부적으로 살펴보면 오디오보다 품질 저하가 더 눈에 띌 수 있다.
4. 2. 단점
손실 압축은 데이터를 압축하는 과정에서 원본 정보의 일부를 의도적으로 제거하므로, 압축된 데이터를 다시 원래 상태로 완벽하게 복원하는 것이 불가능하다. 이러한 특성 때문에 '비가역(irreversible)' 압축이라고도 불린다.[1] 이는 무손실 압축과의 근본적인 차이점으로, 정보의 일부 손실을 감수하는 대신 더 높은 압축률을 얻는 방식이다. 정보 손실의 정도는 사용자가 설정하는 압축률에 따라 달라지며, 압축률을 높일수록 더 많은 정보가 손실되어 원본과의 차이가 커질 수 있다.손실 압축된 파일을 다시 압축하거나 다른 형식으로 변환하는 과정(트랜스코딩)은 세대 손실(Generation Loss)을 유발하여 데이터의 품질이 점진적으로 저하된다. 이는 압축과 압축 해제를 거듭할수록 정보 손실이 누적되기 때문이다. 예를 들어, 이미 손실 압축된 JPEG 형식의 이미지를 편집한 후 다시 JPEG 형식으로 저장하면, 화질이 눈에 띄게 나빠지는 현상을 경험할 수 있다.
압축 과정에서 원본 데이터에는 없던 왜곡이나 잡음(noise)이 발생하는 압축 결함(Compression Artifact)이 나타날 수 있다. 이는 특히 압축률을 높게 설정했을 때 두드러지게 나타나는 경향이 있다. 이미지의 경우, 화면이 바둑판처럼 깨져 보이는 깍두기 현상(blocking), 색상이 부드럽게 이어지지 않고 경계가 생기는 색상 번짐(color banding), 이미지 경계 주변에 미세한 노이즈가 발생하는 모기 노이즈(mosquito noise) 등이 대표적인 압축 결함이다. 오디오의 경우에도 원본에는 없던 잡음이 들리거나 소리가 왜곡되는 등의 문제가 발생할 수 있다. 이러한 압축 결함은 사용자가 인지할 수 있는 수준의 품질 저하를 유발하기도 한다.
5. 손실 압축과 무손실 압축
데이터를 압축하는 방식은 크게 손실 압축과 무손실 압축으로 나눌 수 있다.
무손실 압축은 원본 데이터에 포함된 모든 정보를 보존하면서 컴퓨터 파일의 크기나 전송에 필요한 대역폭을 줄이는 방식이다. 예를 들어, 이미지 파일에서 동일한 색상의 영역이 반복될 경우, "빨간 점, 빨간 점, ..." 대신 "빨간 점 200개"와 같이 표현하여 데이터 손실 없이 파일 크기를 줄일 수 있다. 하지만 정보 이론에 따르면 원본 데이터가 가진 정보량에는 하한선이 존재하며, 데이터를 압축하면 엔트로피가 증가하므로 무한정 압축할 수는 없다. 압축된 ZIP 파일을 반복적으로 압축해도 크기가 계속 줄어들지 않는 것이 그 예이다. 대부분의 무손실 압축 알고리즘은 더 이상 압축이 효과가 없거나 오히려 파일 크기를 늘릴 수 있는 지점을 인식할 수 있다.
반면, 손실 압축은 원본 데이터의 일부 정보를 의도적으로 제거하여 훨씬 높은 압축률을 얻는 방식이다. 이는 많은 경우 원본 데이터가 사람이 인지할 수 있는 한계를 넘어서는 세부 정보를 포함하고 있다는 점에 착안한다. 예를 들어, 이미지는 사람이 눈으로 구별하기 어려운 세부 정보를 가질 수 있고, 오디오 파일은 큰 소리 속에서 잘 들리지 않는 미세한 소리를 포함할 수 있다. 손실 압축은 이러한 인간의 지각적 한계를 이용하여 불필요하다고 판단되는 정보를 제거함으로써 파일 크기를 획기적으로 줄인다. 일반적으로 수학적 모델링이나 예측 알고리즘으로 주요 데이터를 표현하고, 원본과의 오차를 변환(transform)한 뒤 양자화하여 데이터 양을 줄이는 방식을 사용한다. 영상 압축에서는 고주파 성분이나 색상 차이 정보를 줄이고,[15] 오디오 압축에서는 음향학 연구 결과를 바탕으로 사람이 잘 듣지 못하는 주파수 대역의 소리를 제거하는 방법을 사용한다.
손실 압축의 가장 큰 장점은 무손실 압축에 비해 훨씬 작은 파일을 만들 수 있다는 점이다. 이는 저장 공간을 절약하고 인터넷을 통한 데이터 전송 속도를 높이는 데 유리하여, 넷플릭스와 같은 스트리밍 비디오 서비스나 스포티파이와 같은 스트리밍 오디오 서비스에서 널리 활용된다. 이상적인 손실 압축은 원본과 거의 구별할 수 없는 '투명한' 결과를 목표로 하며, 이는 ABX 테스트 등을 통해 검증될 수 있다.
하지만 손실 압축은 데이터를 영구적으로 손실시키기 때문에 몇 가지 단점과 고려 사항이 있다. 가장 큰 특징은 세대 손실이 발생한다는 점이다. 손실 압축된 파일을 다시 압축하고 해제하는 과정을 반복하면 데이터 손실이 누적되어 점차 품질이 저하된다. 이는 원본 데이터를 언제든 완벽하게 복원할 수 있는 무손실 압축과의 중요한 차이점이다. 또한, '손실'이라는 용어의 부정적인 어감 때문에 의료 영상과 같이 정보의 정확성이 매우 중요한 분야에서는 '손실' 대신 '비가역(irreversible)', '무손실' 대신 '가역(reversible)'이라는 용어를 사용하기도 한다. 압축 과정에서 발생하는 왜곡(artifact)이 눈에 띄더라도 사용 목적에 따라 허용될 수 있으며, 때로는 원본과 시각적으로 구별하기 어려운 '시각적으로 무손실' 압축이나, 의료 진단에 영향을 주지 않는 수준의 손실을 허용하는 '진단적으로 허용 가능한 비가역 압축'(DAIC, Diagnostically Acceptable Irreversible Compression)[1] 개념이 적용되기도 한다.
손실 데이터 압축의 이론적 기반은 율-왜곡 이론(Rate-distortion theory)에서 찾을 수 있다. 이 이론은 정보 이론의 일부로, 압축률(rate)과 정보 왜곡(distortion) 사이의 관계를 설명한다. 율-왜곡 이론은 확률 개념을 사용하는 최적 코딩 이론과 마찬가지로, 베이즈 추정 이론 및 결정 이론을 활용하여 인간의 지각적 왜곡이나 미학적 판단까지 모델링하는 데 도움을 준다.
6. 손실 압축 파일 편집
손실 압축된 파일을 편집할 때는 주의해야 한다. 파일을 다시 저장하는 과정에서 재인코딩이 일어나 디지털 세대 손실이 발생하여 화질이 저하될 수 있기 때문이다. 이러한 문제를 피하려면, JPEG와 같은 손실 압축 파일 대신 (무손실) 원본 파일(RAW 이미지 형식 등)을 보존하고, 편집은 원본 파일의 복사본으로 진행하는 것이 좋다. 손실 압축된 데이터를 디코딩하여 무손실 형식으로 변환하더라도 이미 손실된 정보는 복구되지 않는다. 원본 파일을 유지하지 않으면, 나중에 다른 소프트웨어나 기기와의 호환성을 위해 형식 변환을 하거나, 특정 압축 기술의 소프트웨어 특허 문제를 피하기 위해 또 다른 변환이 필요할 수도 있다.
하지만 일부 편집 작업은 파일을 디코딩하고 재인코딩하는 과정 없이, 압축된 데이터를 직접 수정하여 품질 저하 없이 수행할 수 있다. 예를 들어, 파일 크기를 줄이기 위해 압축률을 더 높이는 편집도 추가적인 손실 없이 가능하다.
JPEG 파일의 경우, 다음과 같은 도구를 사용하여 무손실 편집을 할 수 있다.
- `jpegtran`: 기본적인 무손실 편집 기능 제공.
- `exiftran`: `jpegtran` 기반으로, Exif 메타데이터 정보를 보존하면서 편집 가능.
- `Jpegcrop`: 윈도우 환경에서 그래픽 인터페이스를 통해 쉽게 사용 가능.
이러한 도구들을 이용하면 이미지 자르기, 회전, 뒤집기, 좌우 반전 등의 작업을 화질 손상 없이 할 수 있다. 이미지를 그레이스케일로 변환하는 것(색상 정보인 색차 신호 채널을 제거)도 가능하다. 이 과정에서 원치 않는 부분의 정보는 제거되지만, 남은 부분의 품질은 그대로 유지된다.
또한, 동일한 인코딩 설정을 가진 여러 이미지를 격자 형태로 합치거나, 기존 이미지에 로고 같은 다른 이미지를 삽입하는 작업(`Jpegjoin` 사용), 또는 이미지 크기를 조절하는 등의 일부 다른 변환도 제한적으로 가능하다.[6]
압축 방식 자체를 변경하는 일부 작업도 재인코딩 없이 가능하다.
- 압축 최적화: 디코딩된 이미지는 동일하게 유지하면서 파일 크기만 줄인다.
- 점진적(progressive) 인코딩과 비점진적(baseline) 인코딩 간의 변환.
윈도우용 무료 소프트웨어인 IrfanView는 `JPG_TRANSFORM` 플러그인을 통해 일부 무손실 JPEG 편집 기능을 지원한다.
ID3 태그(MP3 파일 정보), Vorbis 주석(Ogg Vorbis 파일 정보), Exif 정보(이미지 촬영 정보)와 같은 메타데이터는 일반적으로 이미지나 오디오 데이터 자체를 수정하지 않고 자유롭게 편집하거나 제거할 수 있다.
참조
[1]
논문
Usability of irreversible image compression in radiological imaging. A position paper by the European Society of Radiology (ESR)
2011
[2]
웹사이트
Data compression
https://www.britanni[...]
2019-08-13
[3]
간행물
Discrete Cosine Transform
1974-01
[4]
웹사이트
T.81 – DIGITAL COMPRESSION AND CODING OF CONTINUOUS-TONE STILL IMAGES – REQUIREMENTS AND GUIDELINES
https://www.w3.org/G[...]
CCITT
2019-07-12
[5]
웹사이트
Masking and Perceptual Coding
http://www.noisebetw[...]
Victor Lombardi, noisebetweenstations.com
[6]
웹사이트
New jpegtran features
http://sylvana.net/j[...]
2019-09-20
[7]
논문
Reminiscences of the Early Work in DCT: Interview with K.R. Rao
http://ticsp.cs.tut.[...]
2019-10-13
[8]
서적
Techniques and Standards for Image, Video, and Audio Coding
Prentice Hall
1996
[9]
웹사이트
The Use of FFT and MDCT in MP3 Audio Compression
http://www.math.utah[...]
2019-07-14
[10]
웹사이트
MP3 and AAC Explained
http://graphics.ethz[...]
[11]
웹사이트
The inconvenient truth about Bluetooth audio
http://www.digitalau[...]
2018-01-13
[12]
웹사이트
What is Sony LDAC, and how does it do it?
http://www.avhub.com[...]
2018-01-13
[13]
웹사이트
aptX HD - lossless or lossy?
http://www.avhub.com[...]
2018-01-13
[14]
웹사이트
Semantic and Generative Models for Lossy Text Compression
http://compression.r[...]
The Computer Journal
2007-10-13
[15]
문서
경계선 검출을 이용하거나 경계선에 민감한 알고리즘들이 시도 되고 있다
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com