데이터 압축

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

데이터 압축은 데이터의 크기를 줄여 저장 공간을 절약하고 전송 효율을 높이는 기술로, 무손실 압축과 손실 압축으로 구분된다. 무손실 압축은 원본 데이터의 완전한 복원을 보장하며, 렘펠-지브(LZ) 방식, 부분 일치 예측, 산술 부호화 등이 사용된다. 손실 압축은 데이터의 일부를 제거하여 파일 크기를 더욱 줄이지만, 원본 데이터의 완전한 복원은 불가능하며, JPEG, MPEG, MP3 등이 대표적이다. 데이터 압축은 정보 이론에 기반하며, 머신 러닝, 데이터 차분 기술과도 밀접한 관련이 있다. 데이터 압축 기술은 이미지, 오디오, 비디오, 유전체 데이터 등 다양한 분야에서 활용되며, JPEG, MP3, H.264/MPEG-4 AVC 등 여러 표준과 형식이 개발되어 사용되고 있다.

더 읽어볼만한 페이지

컴퓨팅 - 페이로드 (컴퓨팅)
페이로드는 원래 선박 용어에서 유래되어 큰 데이터 덩어리에서 중요한 데이터를 구별하는 데 사용되는 용어로, 컴퓨터 프로그래밍에서는 프로토콜 오버헤드와 실제 데이터를 구별하고, 네트워크에서는 전송될 데이터를, 보안 분야에서는 악성 행위를 수행하는 멀웨어의 일부를 의미한다.
컴퓨팅 - 옥텟 (컴퓨팅)
옥텟은 8비트로 구성된 데이터 단위로, "바이트" 용어의 모호성을 피하고자 네트워크 프로토콜 매개변수 저장 크기 설명에 주로 쓰이며, 다양한 수 체계로 표현되고 인터넷 프로토콜 주소에도 활용된다.
자료 - 데이터 시각화
데이터 시각화는 데이터를 그래픽 요소로 표현하여 정보 전달, 패턴 파악, 데이터 탐색 및 분석을 용이하게 하는 방법으로, ETRI는 정보 조직화, 정보 시각화, 상호작용의 세 단계로 분류한다.
자료 - 더미 데이터
더미 데이터는 비디오 게임 롬 내부에 존재하는, 게임에 사용되지 않는 텍스처, 모델, 사운드, 코드 등의 데이터로, 숨겨진 콘텐츠나 이스터 에그로 발견되거나 게임 분석 및 연구에 활용된다.
유틸리티 소프트웨어 종류 - 바이러스 검사 소프트웨어
바이러스 검사 소프트웨어는 악성 소프트웨어의 감염을 탐지, 제거 또는 차단하는 소프트웨어로, 다양한 기술을 사용하여 악성코드를 식별하고 시스템을 감시하며, V3, 노턴 안티바이러스, 알약 등 다양한 종류가 존재한다.
유틸리티 소프트웨어 종류 - 컴파일러
컴파일러는 고급 프로그래밍 언어로 작성된 소스 코드를 컴퓨터가 이해할 수 있는 저급 언어로 변환하는 프로그램으로, 어휘 분석, 구문 분석, 의미 분석, 최적화, 코드 생성 등의 단계를 거쳐 목적 코드를 생성하며, 네이티브 컴파일러, 크로스 컴파일러 등으로 분류되어 다양한 분야에서 활용된다.

데이터 압축
기본 정보
유형	데이터 축소
방법	알고리즘
관련 분야	정보 이론, 코딩 이론, 신호 처리
목적
목적	데이터 크기 감소, 효율적인 저장 및 전송
압축 방식
손실 압축	일부 정보 손실 허용, 높은 압축률
무손실 압축	정보 손실 없이 원본 복원 가능, 비교적 낮은 압축률
주요 용어
정보 소스	압축 대상 데이터
데이터 압축기	데이터를 압축하는 장치 또는 프로그램
데이터 압축 해제기	압축된 데이터를 복원하는 장치 또는 프로그램
압축률
정의	원본 데이터 크기에 대한 압축 후 데이터 크기 비율
역사
초기 연구	클로드 섀넌 및 데이비드 허프만 등 정보 이론 개척자들 연구
발전	다양한 알고리즘 및 기술 발전 (예: 허프만 코딩, 렘펠-지브 알고리즘, 이산 코사인 변환)
알고리즘
허프만 코딩	가변 길이 코딩 기법
렘펠-지브 알고리즘	사전 기반 압축 기법 (LZ77, LZ78, LZW 등)
산술 코딩	확률 기반 압축 기법
이산 코사인 변환 (DCT)	JPEG 등의 손실 압축에 사용
응용 분야
파일 압축	ZIP, 7z, RAR 등
이미지 압축	JPEG, PNG, GIF 등
비디오 압축	MPEG, H.264, H.265 등
오디오 압축	MP3, AAC, FLAC 등
텍스트 압축	Gzip, Bzip2 등
데이터베이스	데이터 저장 공간 절약 및 효율적인 데이터 전송
통신	데이터 전송 시간 단축 및 대역폭 효율성 향상
기타
정보 이론	압축 한계 및 효율성 분석에 사용
코딩 이론	효과적인 압축 알고리즘 설계에 사용
신호 처리	오디오, 이미지, 비디오 압축에 사용
관련 기술	중복 제거

2. 무손실 압축

무손실 압축은 압축된 데이터를 복원했을 때 원래 데이터와 완벽하게 동일하게 복구되는 압축 방식이다. 이는 텍스트 파일, 실행 파일, 그리고 일부 이미지 및 오디오 파일 형식에 사용된다.

무손실 압축은 기본적으로 입력 데이터에 나타나는 통계적 중복성(자주 나오는 글자나 반복되는 패턴 등)을 활용하여 데이터를 더 작게 만든다. 예를 들어, 이미지에서 여러 픽셀에 걸쳐 같은 색이 반복되는 경우, "빨간 픽셀, 빨간 픽셀, ..." 대신 "279개의 빨간 픽셀"과 같이 표현하는 것이다. 이는 연속 길이 부호화의 한 예시이다.

이 외에도 엔트로피 부호화와 같이 자주 나오는 정보에는 짧은 코드를, 드물게 나오는 정보에는 긴 코드를 할당하여 전체 데이터 크기를 줄이는 방법이 있다. 허프만 부호화와 산술 부호화 등이 엔트로피 부호화의 구체적인 예시이다. 데이터를 여러 부분으로 나누어 각 부분에 다른 코드를 적용하거나, 여러 개의 연속된 문자열에 대해 코드를 할당하는 방법(확장 정보원) 등 다양한 방법이 사용된다.

아카이브 소프트웨어는 "사전 크기"를 조정하는 기능을 제공하는데, 사전 크기가 클수록 압축 및 압축 해제에 더 많은 램이 필요하지만, 파일 내용에 반복되는 패턴이 많을수록 더 높은 압축률을 얻을 수 있다.^[3]^[4]

2. 1. 주요 알고리즘

렘펠-지브(LZ) 압축 방식은 무손실 저장을 위한 가장 인기 있는 알고리즘 중 하나이다. DEFLATE는 압축 해제 속도와 압축률을 위해 최적화된 LZ의 변형이지만,^[1] 압축 속도는 느릴 수 있다. 렘펠-지브-웰치(LZW) 알고리즘은 GIF 이미지, PKZIP과 같은 프로그램 및 모뎀과 같은 하드웨어 장치에 사용된다.^[2] LZ 방식은 표 항목이 반복되는 데이터 문자열로 대체되는 표 기반 압축 모델을 사용한다. 대부분의 LZ 방식에서 이 표는 입력의 이전 데이터에서 동적으로 생성되며, 표 자체는 종종 허프만 부호화된다.

가장 강력한 최신 무손실 압축기는 부분 일치 예측과 같은 확률적 알고리즘을 사용한다. 버로우즈-휠러 변환은 통계적 모델링의 간접적인 형태로도 볼 수 있다. 산술 부호화는 유한 상태 기계의 수학적 계산을 사용하여 일련의 입력 데이터 기호로부터 인코딩된 비트 문자열을 생성하는 코딩 기술이다. 허프만 부호화와 같은 다른 기술에 비해 우수한 압축률을 달성할 수 있으며, 적응형 데이터 압축 작업에 특히 적합하다. 산술 부호화 사용의 초기 사례는 JPEG 이미지 코딩 표준의 선택적 기능에 있었고, 그 이후로 비디오 코딩을 위한 H.263, H.264/MPEG-4 AVC 및 HEVC를 포함한 다양한 다른 설계에 적용되었다.

문법 기반 부호는 동일하거나 밀접하게 관련된 종의 생물학적 데이터 수집, 방대한 버전 관리 문서 모음, 인터넷 아카이브 등과 같이 매우 반복적인 입력을 매우 효과적으로 압축할 수 있다. 문법 기반 부호의 기본 작업은 단일 문자열을 생성하는 맥락 자유 문법을 구성하는 것이다. 다른 실용적인 문법 압축 알고리즘으로는 시쿼터와 Re-Pair가 있다.

3. 손실 압축

JPG와 PNG 이미지 압축 비교. 왼쪽은 JPEG 이미지로 손실 압축으로 인한 인공물이 나타나고, 오른쪽은 PNG 이미지이다.

손실 압축은 필수적이지 않은 세부 정보를 버려 저장 공간을 절약하는 방식이다. 정보 보존과 크기 축소 사이에는 절충이 있다. 손실 데이터 압축 방식은 사람들이 해당 데이터를 어떻게 인지하는지에 대한 연구를 바탕으로 설계된다. 예를 들어, 인간의 눈은 색상 변화보다 휘도의 미묘한 변화에 더 민감하다. 많은 인기 있는 압축 형식은 소리의 경우 심리음향학, 이미지 및 비디오의 경우 심리시각을 포함하여 이러한 지각 차이를 이용한다.

손실 이미지 압축은 저장 용량을 늘리기 위해 디지털 카메라에 사용된다. DVD, 블루레이, 스트리밍 비디오는 손실 비디오 코딩 형식을 사용한다. 손실 압축은 비디오에서 광범위하게 사용된다.

손실 오디오 압축에서는 오디오 신호의 들리지 않는(또는 거의 들리지 않는) 구성 요소를 제거하기 위해 심리음향학 방법이 사용된다. 인간의 음성 압축은 종종 더욱 전문화된 기술을 사용하여 수행된다. 음성 코딩은 범용 오디오 압축과는 별도의 분야로 구분된다. 인터넷 전화에서 음성 코딩이 사용되고, 오디오 압축은 CD 리핑에 사용되며 오디오 플레이어에서 디코딩된다.

손실 압축은 세대 손실을 유발할 수 있다.

'''비가역 압축'''은 가역 압축과는 반대로, 데이터를 복원했을 때 완전히 원래대로 돌아오지 않는 압축 방식이다. 사람이 크게 인식하지 못하는 성분을 제거하여 데이터를 압축하는 방법이 많이 사용된다. 예를 들어 사람은 큰 소리와 작은 소리를 동시에 들었을 때 작은 소리를 잘 인식하지 못하며(마스킹 효과), 영상에서도 작은 색상 변화는 휘도 변화만큼 인식되지 않는다. 따라서 데이터를 푸리에 변환(혹은 그 일종인 이산 코사인 변환 등)하여 고주파 성분이나 저진폭 성분을 삭제하더라도, 수신자에게 주는 인상의 변화에 큰 차이가 나타나지 않는다. 물론 삭제하는 범위가 많으면 원 데이터와의 차이는 커지고, 차이를 눈치채는 사람도 늘어난다. 이미지 크기를 줄이거나, 동영상 프레임 레이트를 낮추는 것도 일종의 비가역 압축이라고 할 수 있다. 정보의 손실과 압축률은 트레이드오프 관계에 있다. 이러한 사람의 지각 특성을 이용한 비가역 압축은 음성, 이미지, 영상 등의 데이터에 자주 사용된다.

디지털 카메라에서는 화질 저하를 억제하면서 촬영 매수를 늘리기 위해 비가역 압축을 사용한다. DVD에서 사용하는 MPEG-2도 영상(동영상)의 비가역 압축 방식 중 하나이다.

음향 데이터의 비가역 압축에서는 청각심리학이 응용되어, 음향 신호 중 사람의 귀에 들리지 않는(들리기 어려운) 성분을 버리고 있다. 사람의 목소리 데이터 압축에는 더욱 전용 기법이 사용되는 경우가 많으며, 음성 부호화는 음향 압축과는 다른 영역으로 간주되는 경우가 있다. 음성 압축은 VoIP, 음향 압축은 CD의 리핑 등에서 사용된다.^[52]

3. 1. 주요 알고리즘 및 형식

이산 코사인 변환(DCT)은 1972년 나시르 아메드가 처음 제안한 방식으로,^[5] 이미지(JPEG, HEIF 등), 비디오(MPEG, AVC, HEVC 등), 오디오(MP3, AAC, 보르비스 등) 등 다양한 멀티미디어 형식에서 널리 사용되는 손실 압축 방식이다.

심리음향학은 오디오 신호 중 사람이 듣기 어렵거나 거의 들리지 않는 부분을 제거하는 데 사용되는 방법으로,^[20] 보르비스, MP3 등 다양한 오디오 압축 형식에 사용된다.

웨이블릿 압축은 웨이블릿을 사용하는 영상 압축 방식으로, DCT 부호화 이후에 개발되었다. JPEG 2000 표준은 이 방식을 사용하며,^[17]^[18] 특히 모션 JPEG 2000은 2004년 디지털 시네마의 비디오 부호화 표준으로 선정되었다.^[19]

4. 압축 이론

데이터 압축의 이론적 기반은 정보이론이며, 무손실 압축에는 알고리즘 정보 이론, 비가역 압축에는 rate–distortion theory|레이트 왜곡 이론^영어이 있다. 이러한 분야는 클로드 섀넌이 1940년대 후반부터 1950년대 전반에 걸쳐 발표한 기반 논문들을 통해 구축되었다. 부호 이론과 추측 통계학도 데이터 압축과 밀접하게 관련되어 있다.^[53]

4. 1. 정보 이론

압축의 이론적 기반은 정보이론, 더 구체적으로는 섀넌의 출처 부호화 정리에 의해 제공된다.^[53] 무손실 압축을 위한 알고리즘 정보 이론과 손실 압축을 위한 rate–distortion theory|레이트 왜곡 이론^영어이 영역별 이론이다.^[53] 이러한 연구 분야는 클로드 섀넌이 1940년대 후반과 1950년대 초에 발표한 기본적인 논문들을 통해 본질적으로 만들어졌다.^[53] 압축과 관련된 다른 주제로는 부호 이론과 통계적 추론이 있다.^[53]

4. 2. 알고리즘 정보 이론

압축의 이론적 기반은 정보이론과 더 구체적으로는 섀넌의 출처 부호화 정리에 의해 제공된다.^[53] 무손실 압축을 위한 알고리즘 정보 이론과 손실 압축을 위한 레이트 왜곡 이론이 영역별 이론으로 존재한다.^[53] 이러한 연구 분야는 클로드 섀넌이 1940년대 후반과 1950년대 초에 발표한 기본적인 논문들에 의해 본질적으로 만들어졌다.^[53] 부호 이론과 통계적 추론도 압축과 관련된 주제이다.^[53]

4. 3. 속도-왜곡 이론

정보이론과 더 구체적으로 섀넌의 출처 부호화 정리는 압축의 이론적 기반을 제공한다.^[53] 영역별 이론으로는 손실 압축을 위한 속도-왜곡 이론이 있다. 이러한 연구 분야는 클로드 섀넌이 1940년대 후반과 1950년대 초에 발표한 기본적인 논문들에 의해 본질적으로 만들어졌다.

5. 머신 러닝과 데이터 압축

머신 러닝과 데이터 압축은 밀접하게 관련되어 있다. 시퀀스의 전체 이력을 고려하여 사후 확률을 예측하는 시스템은 (출력 분포에 산술 부호화를 사용하여) 최적의 데이터 압축에 사용될 수 있다. 반대로, 최적의 압축기는 (이전 이력을 고려하여 가장 잘 압축되는 심볼을 찾음으로써) 예측에 사용될 수 있다. 이러한 등가성은 데이터 압축을 "일반 지능"의 벤치마크로 사용하는 근거로 사용되어 왔다.

압축 알고리즘은 문자열을 암시적인 특징 공간 벡터로 매핑하고, 압축 기반 유사도 측정은 이러한 특징 공간 내에서 유사도를 계산한다. 각 압축기 C(.)에 대해, C(.)가 벡터 놈 ||~x||에 해당하는 입력 문자열 x를 매핑하는 연관된 벡터 공간 ℵ을 정의한다. 모든 압축 알고리즘의 기본이 되는 특징 공간에 대한 철저한 조사는 공간 제약으로 인해 불가능하므로, 특징 벡터는 세 가지 대표적인 무손실 압축 방법인 LZW, LZ77 및 PPM을 조사하는 것을 선택한다.

AIXI 이론에 따르면, 후터 상에서 더 직접적으로 설명된 연결에서, x의 최상의 압축은 x를 생성하는 최소한의 소프트웨어이다. 예를 들어, 그 모델에서 zip 파일의 압축 크기에는 zip 파일과 압축 해제 소프트웨어가 모두 포함되는데, 둘 다 없이는 압축을 해제할 수 없기 때문이다. 하지만 더 작은 결합된 형태가 있을 수도 있다.

AI 기반 오디오/비디오 압축 소프트웨어의 예로는 NVIDIA Maxine, AIVC가 있다.^[6] AI 기반 이미지 압축을 수행할 수 있는 소프트웨어의 예로는 OpenCV, 텐서플로, MATLAB의 이미지 처리 도구 상자(IPT) 및 고충실도 생성 이미지 압축이 있다.^[7]

비지도 학습에서 k-평균 클러스터링은 유사한 데이터 포인트를 클러스터로 그룹화하여 데이터를 압축하는 데 사용될 수 있다. 이 기술은 미리 정의된 레이블이 없는 방대한 데이터셋을 처리하는 것을 단순화하며 이미지 압축과 같은 분야에서 널리 사용된다.^[8]

데이터 압축은 데이터 파일의 크기를 줄여 저장 효율을 높이고 데이터 전송 속도를 높이는 것을 목표로 한다. 비지도 기계 학습 알고리즘인 k-평균 클러스터링은 데이터셋을 지정된 수의 클러스터 k로 분할하는 데 사용되며, 각 클러스터는 해당 점의 중심점으로 표현된다. 이 프로세스는 방대한 데이터셋을 더욱 간결한 대표 점 집합으로 압축한다. 특히 영상 및 신호 처리에 유용한 k-평균 클러스터링은 데이터 포인트 그룹을 해당 중심점으로 대체하여 데이터 감소를 지원하므로 원래 데이터의 핵심 정보를 유지하면서 필요한 저장 공간을 크게 줄인다.^[9]

대규모 언어 모델(LLM)은 딥마인드의 Chinchilla 70B 모델 연구에서 입증된 바와 같이 무손실 데이터 압축도 수행할 수 있다. 딥마인드에서 개발한 Chinchilla 70B는 효과적으로 데이터를 압축하여 이미지의 휴대용 네트워크 그래픽(PNG) 및 오디오의 무손실 오디오 코덱(FLAC)과 같은 기존 방법보다 성능이 뛰어났다. 이미지 및 오디오 데이터의 압축률은 각각 원래 크기의 43.4% 및 16.4%에 달했다.^[10]

6. 데이터 차분

데이터 압축은 데이터 차이 계산의 특수한 경우로 볼 수 있다. 데이터 차이 계산은 '원본'과 '대상'이 주어졌을 때 '차이점'을 생성하는 것으로, 패치는 '원본'과 '차이점'이 주어졌을 때 '대상'을 재현한다. 데이터 압축에는 별도의 원본과 대상이 없으므로, 데이터 압축을 원본 데이터가 없는 데이터 차이 계산으로 간주할 수 있으며, 압축 파일은 아무것도 없는 것에서의 차이에 해당한다. 이는 절대 엔트로피(데이터 압축에 해당)를 초기 데이터가 없는 상대 엔트로피(데이터 차이 계산에 해당)의 특수한 경우로 간주하는 것과 같다.

'차등 압축'이라는 용어는 데이터 차이 계산과의 연관성을 강조하기 위해 사용된다.

7. 데이터 압축의 활용

데이터 압축은 다양한 분야에서 활용된다.

무손실 압축 알고리즘은 통계적 중복성을 이용하여 정보를 손실 없이 데이터를 표현하며, 이는 가역적이다. 예를 들어 이미지의 경우, 반복되는 색상 영역을 "279개의 빨간 픽셀"과 같이 표현하여 파일 크기를 줄일 수 있다. 렘펠-지브(LZ) 압축 방식은 무손실 저장을 위한 대표적인 알고리즘이며, DEFLATE는 압축 해제 속도와 압축률을 위해 최적화된 LZ의 변형이다.^[1] 렘펠-지브-웰치(LZW) 알고리즘은 GIF 이미지, PKZIP 등에 사용된다.^[2]

손실 압축 방식은 필수적이지 않은 정보를 제거하여 저장 공간을 절약하며, 정보 보존과 크기 축소 사이에는 절충이 필요하다. 이 방식은 인간의 시각 및 청각 인지 특성을 고려하여 설계된다. 예를 들어, JPEG 이미지 압축은 인간의 눈이 색상 변화보다 휘도 변화에 더 민감하다는 점을 이용하여 필수적이지 않은 정보 비트를 제거한다.

아카이브 소프트웨어는 "사전 크기"를 조정하여 압축 및 압축 해제 시 더 많은 램을 사용하지만, 파일 콘텐츠의 반복 패턴에 대해 더 강력하게 압축할 수 있도록 한다.^[3]^[4]

7. 1. 이미지 압축

1980년대 후반, 디지털 이미지가 보편화되면서 무손실 이미지 압축 표준이 등장했다. 1990년대 초반에는 손실 압축 방식이 널리 사용되기 시작했다. 손실 압축 방식은 필수적이지 않은 정보를 버려 저장 공간을 절약하므로, 정보 손실과 크기 축소 사이에 절충이 존재한다. 이러한 방식은 사람들이 데이터를 어떻게 인지하는지에 대한 연구를 바탕으로 설계된다. 예를 들어, 인간의 눈은 색상 변화보다 휘도의 미묘한 변화에 더 민감하다. JPEG 이미지 압축은 필수적이지 않은 정보 비트를 반올림하여 작동한다. 많은 인기 있는 압축 형식은 소리의 경우 심리음향학, 이미지 및 비디오의 경우 심리시각을 포함하여 이러한 지각 차이를 이용한다.

대부분의 손실 압축 방식은 이산 코사인 변환(DCT)을 기반으로 한다. DCT는 1972년 나시르 아메드가 처음 제안했으며, 1973년 T. 나타라잔과 K. R. 라오와 함께 작동 알고리즘을 개발한 후 1974년 1월에 소개되었다.^[5] DCT는 이미지(JPEG, HEIF 등), 비디오(MPEG, AVC, HEVC 등), 오디오(MP3, AAC, 보르비스 등) 멀티미디어 형식에 사용된다.

손실 이미지 압축은 저장 용량을 늘리기 위해 디지털 카메라에 사용된다. DVD, 블루레이, 스트리밍 비디오는 손실 비디오 코딩 형식을 사용한다.

엔트로피 부호화는 1940년대 섀넌-패노 부호화가 도입되면서 시작되었으며, 이는 1950년에 개발된 허프만 부호화의 기초가 되었다. 변환 부호화는 1960년대 후반에 1968년 고속 푸리에 변환(FFT) 부호화와 1969년 아다마르 변환이 도입되면서 시작되었다.

이산 코사인 변환(DCT)은 1970년대 초에 개발된 중요한 영상 압축 기술이다.^[5] DCT는 1992년 공동 사진 전문가 그룹(JPEG)에서 도입한 손실 압축 형식인 JPEG의 기반이다. JPEG는 영상을 나타내는 데 필요한 데이터 양을 크게 줄이며, 가장 널리 사용되는 영상 파일 형식이 되었다.^[11]^[12]

렘펠-지브-웰치(LZW)는 1984년에 개발된 무손실 압축 알고리즘으로, 1987년에 도입된 GIF 형식에 사용된다.^[14] 1996년에 명시된 무손실 압축 알고리즘인 DEFLATE는 휴대용 네트워크 그래픽(PNG) 형식에 사용된다.^[15]

웨이블릿 압축은 영상 압축에서 웨이블릿을 사용하는 것으로, DCT 부호화 개발 이후에 시작되었다. JPEG 2000 표준은 2000년에 도입되었다.^[16] JPEG 2000은 원래 JPEG 형식에서 사용하는 DCT 알고리즘과 달리, 이산 웨이블릿 변환(DWT) 알고리즘을 사용한다.^[17]^[18] 모션 JPEG 2000 확장을 포함하는 JPEG 2000 기술은 2004년 디지털 시네마의 비디오 부호화 표준으로 선정되었다.^[19]

대표적인 이미지 압축 형식으로는 인터넷 웹사이트에서 널리 사용되는 JPEG와 GIF가 있다. JPEG는 비가역 압축을 통해 고효율 압축을 수행하며, GIF는 무손실 압축을 사용한다.

JPEG는 데이터를 이산 코사인 변환(Discrete Cosine Transform, DCT) 연산으로 처리하여 부호화한다.

이미지 압축 알고리즘 평가는 레나와 같은 이미지 샘플이 널리 사용된다.

7. 2. 오디오 압축

오디오 코딩 형식 및 오디오 코덱과 혼동되어서는 안되는 오디오 데이터 압축은 오디오 데이터의 전송 대역폭 및 저장 요구 사항을 줄일 수 있다. 오디오 압축 형식 압축 알고리즘은 오디오 코덱으로서 소프트웨어에 구현된다. 손실 압축과 무손실 압축 모두에서 정보 중복성이 감소하는데, 부호화, 양자화, DCT 및 선형 예측과 같은 방법을 사용하여 압축되지 않은 데이터를 나타내는 데 사용되는 정보의 양을 줄인다.

손실 오디오 압축 알고리즘은 더 높은 압축률을 제공하며 보르비스 및 MP3를 포함한 수많은 오디오 응용 프로그램에 사용된다. 이러한 알고리즘은 거의 모두 심리음향학에 의존하여 잘 들리지 않는 소리의 충실도를 제거하거나 줄여 저장 또는 전송에 필요한 공간을 줄인다.^[20]

오디오 품질 손실과 전송 또는 저장 크기 사이의 허용 가능한 절충은 응용 프로그램에 따라 달라진다. 예를 들어, 640MB 콤팩트 디스크(CD)에는 약 1시간 분량의 압축되지 않은 하이파이 음악, 2시간 미만의 무손실로 압축된 음악 또는 중간 비트 전송률로 MP3 형식으로 압축된 7시간 분량의 음악이 들어 있다. 디지털 녹음기는 일반적으로 640MB에 약 200시간 분량의 명확하게 이해할 수 있는 음성을 저장할 수 있다.

무손실 오디오 압축은 원본의 정확한 디지털 복제본으로 디코딩할 수 있는 디지털 데이터의 표현을 생성한다. 압축률은 원본 크기의 약 50~60%이다. 이는 일반적인 무손실 데이터 압축과 유사하다. 무손실 코덱은 신호를 추정하기 위한 기반으로 곡선 피팅 또는 선형 예측을 사용한다. 추정 및 추정과 실제 신호 간의 차이를 설명하는 매개변수는 별도로 코딩된다.

여러 가지 무손실 오디오 압축 형식이 있다. 목록은 무손실 코덱 목록을 참조한다. 일부 형식은 슈퍼 오디오 CD에 사용되는 다이렉트 스트림 전송이나 DVD 오디오, 돌비 트루HD, 블루레이 및 HD DVD에 사용되는 메리디안 무손실 패킹과 같이 특정 시스템과 관련이 있다.

일부 오디오 파일 형식은 손실 형식과 무손실 보정의 조합을 특징으로 한다. 이를 통해 보정을 제거하여 손실 파일을 쉽게 얻을 수 있다. 이러한 형식에는 MPEG-4 SLS(Scalable to Lossless), WavPack 및 OptimFROG DualStream이 포함된다.

오디오 파일을 추가 압축하거나 편집하기 위해 처리할 때는 변경되지 않은 원본(압축되지 않거나 무손실로 압축됨)에서 작업하는 것이 바람직하다. 어떤 목적으로 손실 압축 파일을 처리하면 일반적으로 압축되지 않은 원본에서 동일한 압축 파일을 생성하는 것보다 열등한 최종 결과가 생성된다. 사운드 편집 또는 믹싱 외에도 무손실 오디오 압축은 종종 아카이브 저장 또는 마스터 복사본으로 사용된다.

무손실 및 여러 손실 압축 형식의 오디오 스펙트로그램 비교. 손실 스펙트로그램은 고주파수의 대역 제한을 보여주는데, 이는 손실 오디오 압축과 관련된 일반적인 기법이다.

손실 오디오 압축은 광범위한 응용 프로그램에 사용된다. MP3 플레이어나 컴퓨터에서 파일 재생과 같은 독립적인 오디오 전용 응용 프로그램 외에도, 디지털로 압축된 오디오 스트림은 대부분의 비디오 DVD, 디지털 텔레비전, 인터넷 스트리밍 미디어, 위성 및 케이블 라디오, 그리고 점점 더 지상파 라디오 방송에도 사용됩니다. 손실 압축은 일반적으로 심리음향학 최적화를 기반으로 중요하지 않은 데이터를 버림으로써 무손실 압축보다 훨씬 더 높은 압축률을 달성합니다.

심리음향학은 오디오 스트림의 모든 데이터가 인간의 청각 시스템에 의해 인지될 수 있는 것은 아니라는 것을 인식한다. 대부분의 손실 압축은 먼저 지각적으로 무관한 소리, 즉 듣기 매우 어려운 소리를 식별하여 중복성을 줄입니다. 일반적인 예로는 고주파수 또는 더 큰 소리와 동시에 발생하는 소리가 있다. 이러한 무관한 소리는 정확도가 낮게 코딩되거나 전혀 코딩되지 않습니다.

손실 알고리즘의 특성으로 인해 파일을 압축 해제하고 다시 압축하면 오디오 품질이 디지털 세대 손실을 입게 된다. 이로 인해 손실 압축은 사운드 편집 및 멀티트랙 레코딩과 같은 전문 오디오 엔지니어링 응용 프로그램에서 중간 결과를 저장하는 데 적합하지 않습니다. 그러나 MP3와 같은 손실 형식은 파일 크기가 원래 크기의 5~20%로 줄어들고 1메가바이트에 적절한 품질로 약 1분 분량의 음악을 저장할 수 있기 때문에 최종 사용자에게 매우 인기가 있다.

적응형 비트 전송률과 낮은 압축률을 사용하여 무손실 및 손실 알고리즘을 결합함으로써 더 높은 품질의 오디오 성능을 제공하는 여러 독점 손실 압축 알고리즘이 개발되었다. 예로는 aptX, LDAC, LHDC, MQA 및 SCL6가 있다.

7. 3. 비디오 압축

비디오 데이터는 일련의 정지 영상 프레임으로 표현될 수 있다. 이러한 데이터는 일반적으로 공간 및 시간적 중복성이 풍부하다. 비디오 압축 알고리즘은 중복성을 줄이고 정보를 더욱 간결하게 저장하려고 시도한다.

대부분의 비디오 압축 형식 및 코덱은 공간 및 시간적 중복성을 모두 활용한다(예: 움직임 보상을 사용한 차분 코딩). 유사점은 예를 들어 시간적으로 인접한 프레임(프레임 간 코딩) 또는 공간적으로 인접한 픽셀(프레임 내 코딩) 간의 차이만 저장하여 인코딩할 수 있다. 프레임 간 압축(시간적 델타 인코딩)은 현재 프레임을 설명하기 위해 시퀀스에서 하나 이상의 이전 또는 이후 프레임의 데이터를 (재)사용한다. 반면 프레임 내 코딩은 현재 프레임 내의 데이터만 사용하며, 사실상 정지 영상 압축이다.

캠코더 및 비디오 편집에서 사용되는 프레임 내 비디오 코딩 형식은 프레임 내 예측만 사용하는 간단한 압축을 사용한다. 이렇게 하면 편집자가 삭제한 데이터를 압축된 프레임이 참조하는 상황을 방지하여 비디오 편집 소프트웨어가 간소화된다.

비디오 코딩 표준에서 사용되는 두 가지 주요 비디오 압축 기술은 DCT와 움직임 보상(MC)이다. H.26x 및 MPEG 형식과 같은 대부분의 비디오 코딩 표준은 일반적으로 움직임 보상 DCT 비디오 코딩(블록 움직임 보상)을 사용한다.^[34]^[35]

대부분의 비디오 코덱은 오디오 압축 기술과 함께 사용되어 별도이지만 상호 보완적인 데이터 스트림을 소위 ''컨테이너 형식''을 사용하여 하나의 결합된 패키지로 저장한다.

동영상 압축 규격 연표
연도	규격	제정자	주요 구현 및 용도
1990	H.261	ITU-T	화상 회의, 화상 전화
1993	MPEG-1 Part 2	ISO, IEC	비디오 CD
1995	MPEG-2 Part 2	ISO, IEC, ITU-T	DVD-비디오, 블루레이, DVB, SVCD
1996	H.263	ITU-T	화상 회의, 화상 전화, 휴대전화 동영상 재생(3GP)
1999	MPEG-4 Part 2	ISO, IEC	3세대 휴대전화, 인터넷 동영상 (DivX, Xvid ...)
2003	H.264/MPEG-4 AVC	소니, 파나소닉, 삼성, ISO, IEC, ITU-T	블루레이, HD DVD, DVB, iPod Video, 애플 TV, 원세그
2013	H.265/HEVC	ISO, IEC, ITU-T	UHD(슈퍼 하이비전)

7. 4. 유전학

유전체 압축 알고리즘은 염기서열 데이터의 특성에 맞춰 개발된 최신 무손실 압축 알고리즘으로, 일반적인 압축 알고리즘과 유전학적 알고리즘을 모두 사용하여 데이터를 압축한다.

2012년, 존스 홉킨스 대학교 연구팀은 참조 유전체를 사용하지 않는 유전 압축 알고리즘을 발표했다. HAPZIPPER는 HapMap 데이터에 맞춰 설계되었으며, 20배 이상의 압축률(파일 크기 95% 감소)을 달성하여 주요 범용 압축 유틸리티보다 2~4배 더 나은 압축률을 보이며 계산 집약도도 낮았다. 연구팀은 SNP(단일염기 다형성)를 소수 대립유전자 빈도에 따라 정렬하여 데이터셋의 이질성을 줄이고 균질화하는 MAF 기반 인코딩(MAFE)을 도입했다.^[67]

2009년과 2013년에 개발된 다른 알고리즘(DNAZip 및 GenomeZip)은 최대 1200배의 압축률을 제공하여 60억 염기쌍의 이배체 인간 유전체를 2.5메가바이트에 저장할 수 있다(참조 유전체를 기준으로 하거나 많은 유전체에 걸쳐 평균).

8. 압축률 비교

다음은 다양한 데이터 압축 방식의 성능을 비교한 표이다. 텍스트 파일(.htm, .txt)은 압축률이 높은 경향이 있는 반면, 이미 압축된 파일(.rar, .zip, .mpg, .mp3, .jpg)은 추가 압축이 어렵다.^[68]^[69]

다른 방식의 데이터 압축 비교
파일	*.avi	*.dll	*.doc	*.exe	*.gif	*.htm	*.jpg	*.mp3	*.mpg	*.pdf	*.txt	*.wav	*.zip	표기	총합
파일 수	16	26	138	24	246	79	44	29	8	36	8	1	19		674
처음 크기	52,611,520억	52,542,200억	52,546,560억	52,540,560억	52,462,090억	52,611,870억	52,461,160억	52,504,320억	52,577,200억	52,578,760억	52,534,360억	52,560,240억	52,626,800억		683,157,640억
7z	4,524,067 (2)	1,543,179 (3)	147,690 (3)	3,910,541 (3)	4,620,354 (1)	341,996 (4)	4,770,061 (4)	5,053,813 (2)	4,879,067 (5)	4,258,863 (3)	1,270,884 (3)	3,670,225 (5)	5,226,742 (14)	16/20
arj	4,696,659 (9)	2,160,530 (15)	1,018,050 (17)	4,130,505 (11)	4,702,449 (12)	898,370 (17)	4,803,740 (11)	5,108,093 (17)	4,910,699 (16)	4,606,736 (15)	1,875,329 (16)	4,450,535 (12)	5,223,905 (13)	6.1/20
bh	4,703,291 (12)	2,156,986 (12)	1,010,284 (15)	4,128,594 (9)	4,693,021 (9)	889,650 (15)	4,806,914 (13)	5,105,811 (13)	4,904,209 (11)	4,601,545 (13)	1,848,972 (13)	4,451,648 (15)	5,201,639 (4)	7.5/20
bz2	4,720,926 (18)	2,095,832 (7)	573,721 (5)	4,273,885 (18)	4,896,084 (18)	645,243 (5)	4,743,918 (2)	5,069,593 (4)	4,888,293 (7)	4,444,829 (5)	1,531,448 (6)	3,771,508 (7)	5,238,677 (16)	11.7/20
bza	4,639,340 (6)	2,166,940 (17)	987,806 (11)	4,231,254 (17)	4,878,327 (17)	783,188 (8)	4,787,973 (7)	5,076,189 (5)	4,873,810 (2)	4,618,970 (17)	1,516,326 (5)	3,770,938 (6)	5,227,572 (15)	9.8/20
cab	4,701,113 (11)	2,148,386 (10)	893,796 (7)	4,127,044 (8)	4,678,810 (5)	842,129 (10)	4,798,500 (8)	5,099,787 (8)	4,900,314 (10)	4,584,969 (8)	1,846,233 (12)	4,451,857 (18)	5,201,717 (5)	10.8/20
gza	4,703,371 (13)	2,157,116 (13)	1,001,990 (13)	4,126,436 (7)	4,693,136 (10)	874,444 (12)	4,803,739 (10)	5,105,765 (12)	4,904,249 (12)	4,597,720 (11)	1,840,188 (11)	4,451,638 (14)	5,201,436 (3)	9.2/20
j	4,678,506 (8)	1,914,777 (5)	703,722 (6)	4,057,445 (5)	4,681,437 (6)	691,916 (6)	4,805,059 (12)	5,092,070 (7)	4,898,847 (8)	4,326,394 (4)	1,629,228 (8)	3,594,954 (4)	5,215,150 (12)	13/20
jar	4,704,088 (14)	2,158,273 (14)	1,017,205 (16)	4,129,816 (10)	4,705,456 (13)	893,622 (16)	4,809,136 (16)	5,107,254 (15)	4,904,615 (13)	4,603,367 (14)	1,849,394 (14)	4,451,718 (16)	5,202,611 (8)	6.2/20
lha	4,711,090 (16)	2,215,476 (18)	1,020,194 (18)	4,204,071 (15)	4,830,501 (15)	913,845 (18)	4,918,792 (19)	5,206,933 (19)	5,066,716 (19)	4,802,049 (19)	1,895,771 (17)	4,447,253 (10)	5,263,136 (18)	6.7/20
lzh	4,711,090 (16)	2,215,476 (18)	1,066,340 (19)	4,143,461 (14)	4,819,157 (14)	971,166 (19)	4,816,349 (18)	5,107,584 (16)	4,924,974 (18)	4,635,416 (18)	1,945,961 (19)	4,449,756 (11)	5,212,837 (11)	5.3/20
pkz	4,899,083 (20)	2,354,373 (20)	1,173,097 (20)	4,401,289 (20)	5,120,590 (19)	1,018,250 (20)	5,162,114 (20)	5,253,006 (20)	5,203,747 (20)	5,076,577 (20)	2,084,290 (20)	5,027,854 (20)	5,264,213 (19)	0.2/20
rar	4,634,009 (5)	1,693,150 (4)	173,313 (4)	3,948,241 (4)	4,639,881 (4)	318,269 (3)	4,780,095 (6)	5,081,085 (6)	4,887,973 (6)	4,258,775 (2)	1,318,381 (4)	2,657,731 (3)	5,202,579 (7)	15.5/20
rk	4,589,894 (3)	1,474,339 (2)	132,629 (1)	3,866,814 (1)	4,628,017 (3)	257,588 (1)	4,434,701 (1)	5,017,545 (1)	4,787,286 (1)	4,498,992 (6)	1,168,720 (1)	1,659,771 (1)	5,183,337 (1)	18.2/20
rs	4,625,725 (4)	2,137,145 (9)	937,954 (10)	4,221,864 (16)	4,850,493 (16)	768,711 (7)	4,776,635 (5)	5,066,886 (3)	4,878,852 (3)	4,612,537 (16)	1,560,879 (7)	3,804,335 (8)	5,240,116 (17)	10.7/20
sqx	4,662,560 (7)	2,078,866 (6)	991,992 (12)	4,105,933 (6)	4,699,518 (11)	878,469 (14)	4,808,697 (15)	5,102,452 (10)	4,908,341 (14)	4,590,245 (10)	1,836,245 (9)	4,415,575 (9)	5,208,275 (10)	9.8/20
gz	4,707,481 (15)	2,165,409 (16)	907,006 (8)	4,133,949 (12)	4,684,949 (7)	861,638 (11)	4,807,701 (14)	5,105,913 (14)	4,909,789 (15)	4,588,822 (9)	1,853,650 (15)	4,451,792 (17)	5,202,392 (6)	7.8/20
uha	4,498,275 (1)	1,474,005 (1)	136,880 (2)	3,879,360 (2)	4,625,014 (2)	284,363 (2)	4,760,572 (3)	5,104,837 (11)	4,879,047 (4)	4,237,400 (1)	1,233,812 (2)	2,435,124 (2)	5,187,408 (2)	17.3/20
yz1	4,814,935 (19)	2,128,899 (8)	924,706 (9)	4,279,162 (19)	4,686,669 (8)	804,198 (9)	4,810,966 (17)	5,124,596 (18)	4,922,886 (17)	4,568,274 (7)	1,901,300 (18)	4,561,179 (19)	5,207,874 (9)	6.4/20
zip	4,701,064 (10)	2,155,923 (11)	1,009,814 (14)	4,135,619 (13)	5,270,565 (20)	877,679 (13)	4,799,508 (9)	5,101,205 (9)	4,898,961 (9)	4,599,883 (12)	1,839,080 (10)	4,450,719 (13)	5,264,564 (20)	7.5/20
압축 크기 중간값	47,010,890억	21,521,550억	9,628,800억	41,301,600억	46,963,270억	8,518,840억	48,037,400억	51,036,450억	49,022,620억	45,939,830억	18,396,340억	44,485,050억	52,105,560억		485,195,590억
압축률 중간값	10.6 %	59.0 %	81.7 %	21.4 %	10.5 %	83.8 %	8.4 %	2.8 %	6.8 %	12.6 %	65.0 %	15.4 %	1.0 %		29.0 %

9. 아날로그 대역 압축

TV 방송에 사용되는 NTSC(NTSC), PAL(PAL) 등의 합성 비디오 신호는 대표적인 아날로그 대역 압축 방식이다. 합성 비디오 신호에서는 영상 신호를 휘도 성분과 색도 성분으로 분리한 후, 휘도 성분에는 충분한 대역폭을 주는 반면, 색도 성분은 그에 비해 대역폭을 좁게 한다. 결과적으로 원본 화질과 비교하면 색채의 미세한 변화가 손실되어, 흑백 사진에 색을 입힌 것과 비슷한 화질이 된다. 하지만 인간의 시각적 특성상, 일반적인 "자연 영상"이나 애니메이션 그림에서도 테두리의 검은 선의 휘도 성분의 도움을 받아 크게 신경 쓰이지 않는다.^[5]

중파~단파 AM 라디오 방송에서도 점유 대역을 너무 넓게 하지 않도록 4kHz 정도 이상을 잘라낸다. 전화는 효율적인 다중화를 위해 300 Hz - 3600 Hz 정도가 전달되면 되므로, 그 범위 이외를 잘라낸다.^[5]

10. 디지털 압축의 역사

1830년대에 발명된 모르스 부호는 일종의 압축 부호로, 문자 통신에서 자주 나타나는 알파벳에는 짧은 부호를, 드물게 나타나는 알파벳에는 긴 부호를 할당하여 통신에 필요한 노력을 줄였다.^[57] 하지만 일본어 모르스 부호는 이러한 방식을 따르지 않았다.

1967년, 청각 심리학적 마스킹 효과가 발표되었다.^[57]

이후, 컴퓨터의 발달과 함께 디지털 통신 및 파일 저장에서 데이터 압축의 중요성이 커지면서 연구가 진행되었다. 1970년대 후반부터는 데이터 압축의 요소 기술에 관한 중요한 특허도 출원되기 시작했다. 최근에도 오디오 압축에 사용되는 MP3나 웹사이트 이미지에 널리 사용되는 GIF 이미지의 라이선스 문제 등 특허 관련 분쟁이 발생하고 있으며, 이는 디지털 시대의 중요한 기간 기술임을 보여준다.

1980년대에는 음성 통신 분야의 디지털화가 시작되면서, 음성 압축 분야에서 ADPCM과 같은 초기 압축 방식이 실용화되었다.^[58] 또한, 퍼스널 컴퓨터와 퍼스널 컴퓨터 통신의 보급으로 온라인 소프트웨어 분야에서 현재도 널리 사용되는 파일 압축 방식인 ZIP이나 LHA가 등장했다. 1988년, 부에노스아이레스 대학교의 오스카르 보넬로(Oscar Bonello)는 IBM PC를 사용한 라디오 방송국용 자동 음성 압축 시스템을 개발했다.^[59]

1990년대 전반에는 음성 압축 및 영상 압축 분야에서 현재에도 널리 알려진 많은 데이터 압축 방식이 발표되었다. 음성(오디오) 분야에서는 1992년에 등장한 미니디스크(MD)에 탑재된 ATRAC 등이 있다. 영상 분야에서는 JPEG 압축 방식이 국제 표준 규격으로 권고되어 널리 보급되었다. 이러한 배경에는 집적 회로(IC) 생산 및 설계 기술의 발달로 고도의 처리를 할 수 있는 IC가 저렴한 제품에도 탑재될 수 있게 된 점과, 퍼스널 컴퓨터의 성능 향상으로 소프트웨어적인 영상 처리가 용이해진 점이 크다.

동영상 압축 분야에서는 TV 회의 시스템용 동영상 압축 방식(H.261)이나 비디오 CD의 압축 방식(MPEG-1)이 표준화되었다. 또한, 퍼스널 컴퓨터용으로 기업 고유의 압축 방식을 채택한 코덱도 등장하기 시작했다. 그러나 동영상 압축 분야는 음성 압축이나 영상 압축에 비해 더욱 고도의 기술이 요구되어, 당분간 업무용이나 제한적인 용도로 한정되었다. 동영상 압축 기술은 특허 권익에 얽힌 사정도 있어, 표준화까지 오랜 시간이 걸렸다.

1990년대 후반에는 동영상 압축 분야에서도 국제 표준 규격인 MPEG-2가 표준화되어 업무용 분야부터 널리 이용되기 시작했고, 1996년에 등장한 DVD 플레이어나, 2000년에 시작된 BS 디지털 방송 등 가전제품에도 채택되기 시작했다.

참조

_[1] 서적 Document Management - Portable document format - Part 1: PDF1.7 Adobe Systems Incorporated 2008-07-01
_[2] 서적 New Kind of Science https://www.wolframs[...]
_[3] 웹사이트 How to choose optimal archiving settings – WinRAR https://www.winrar-f[...]
_[4] 웹사이트 (Set compression Method) switch – 7zip https://sevenzip.osd[...] 2021-11-07
_[5] 학술지 How I Came Up With the Discrete Cosine Transform https://www.scribd.c[...] 1991-01-01
_[6] 웹사이트 What Is AI Video Compression? https://massive.io/f[...] 2023-04-06
_[7] arXiv High-Fidelity Generative Image Compression
_[8] 웹사이트 What is Unsupervised Learning? IBM https://www.ibm.com/[...] 2024-02-05
_[9] 웹사이트 Differentially private clustering for large-scale datasets https://blog.researc[...] 2023-05-25
_[10] 웹사이트 AI language models can exceed PNG and FLAC in lossless compression, says study https://arstechnica.[...] 2023-09-28
_[11] 웹사이트 The JPEG image format explained https://home.bt.com/[...] BT Group 2018-05-31
_[12] 뉴스 Copy protections could come to JPEGs https://www.bbc.co.u[...] 2015-10-15
_[13] 웹사이트 What Is a JPEG? The Invisible Object You See Every Day https://www.theatlan[...] 2013-09-24
_[14] 웹사이트 The GIF Controversy: A Software Developer's Perspective https://mike.pub/199[...] 1995-01-27
_[15] IETF DEFLATE Compressed Data Format Specification version 1.3 IETF 1996-05-01
_[16] 서적 JPEG2000 Image Compression Fundamentals, Standards and Practice: Image Compression Fundamentals, Standards and Practice https://books.google[...] Springer Science & Business Media 2012
_[17] 웹사이트 General characteristics and design considerations for temporal subband video coding https://www.itu.int/[...] Video Coding Experts Group 2003-12-08
_[18] 서적 The Essential Guide to Video Processing https://books.google[...] Academic Press 2009
_[19] 서적 Understanding Digital Cinema: A Professional Handbook https://books.google[...] Taylor & Francis 2005
_[20] 학술지 Subjective Evaluation of Music Compressed with the ACER Codec Compared to AAC, MP3, and Uncompressed PCM 2019
_[21] 학술지 Adaptive Quantization in Differential PCM Coding of Speech
_[22] 학술지 Adaptive quantization in differential PCM coding of speech 1973
_[23] 서적 Acoustics, Information, and Communication: Memorial Volume in Honor of Manfred R. Schroeder Springer 2014
_[24] 학술지 A History of Realtime Digital Speech on Packet Networks: Part II of Linear Predictive Coding and the Internet Protocol https://ee.stanford.[...] 2010
_[25] 웹사이트 The Use of FFT and MDCT in MP3 Audio Compression http://www.math.utah[...] 2012-05-01
_[26] 서적 Mobile Multimedia Broadcasting Standards: Technology and Practice https://books.google[...] Springer Science & Business Media 2008
_[27] 학술지 On Properties, Relations, and Simplified Implementation of Filter Banks in the Dolby Digital (Plus) AC-3 Audio Coding Standards 2011
_[28] 웹사이트 MP3 and AAC Explained http://graphics.ethz[...]
_[29] 학술지 ICASSP '87. IEEE International Conference on Acoustics, Speech, and Signal Processing
_[30] 학술지 Analysis/Synthesis filter bank design based on time domain aliasing cancellation
_[31] 뉴스 Ricardo Sametband, La Nación Newspaper "Historia de un pionero en audio digital" https://www.lanacion[...]
_[32] 웹사이트 Summary of some of Solidyne's contributions to Broadcast Engineering http://www.solidynep[...] Buenos Aires: Solidyne
_[33] 뉴스 Anuncio del Audicom, AES Journal, July-August 1992, Vol 40, # 7/8, pag 647 http://www.aes.org/e[...]
_[34] 서적 Design of Digital Video Coding Systems: A Complete Compressed Domain Approach https://books.google[...] CRC Press 2001
_[35] 서적 Proceedings of the International Computer Conference 2006 on Wavelet Active Media Technology and Information Processing: Chongqing, China, 29-31 August 2006 https://books.google[...] World Scientific 2006
_[36] 논문 Results of a prototype television bandwidth compression scheme IEEE 1967
_[37] 웹사이트 The History of Video File Formats Infographic — RealPlayer http://www.real.com/[...] 2012-04-22
_[38] 서적 Standard Codecs: Image Compression to Advanced Video Coding https://books.google[...] Institution of Engineering and Technology 2003
_[39] 웹사이트 Patent statement declaration registered as H261-07 https://www.itu.int/[...] 2019-07-11
_[40] 웹사이트 MPEG-2 Patent List https://www.mpegla.c[...] 2019-07-07
_[41] 웹사이트 MPEG-4 Visual - Patent List https://www.mpegla.c[...] 2019-07-06
_[42] 웹사이트 AVC/H.264 {{ndash}} Patent List https://www.mpegla.c[...] 2019-07-06
_[43] 웹사이트 Data Compression via Logic Synthesis https://infoscience.[...]
_[44] 서적 Signal coding and processing https://books.google[...] Cambridge University Press 2011-12-22
_[45] 논문 Implementation of Lempel-ZIV algorithm for lossless compression using VHDL https://doi.org/10.1[...] Springer India
_[46] 논문 A New Lossless Method of Image Compression and Decompression Using Huffman Coding Techniques http://www.jatit.org[...]
_[47] 논문 Implementing a Novel Approach an Convert Audio Compression to Text Coding via Hybrid Technique http://ijcsi.org/pap[...]
_[48] 논문 Optimized RTL design and implementation of LZW algorithm for high bandwidth applications http://pe.org.pl/art[...]
_[49] 논문 An Improved Data Compression Method for General Data http://www.ijser.org[...]
_[50] 논문 An Improved Data Compression Method for General Data http://www.ijser.org[...]
_[51] 웹사이트 On Compression http://www.coryarcan[...]
_[52] 논문 An Improved Data Compression Method for General Data http://www.ijser.org[...]
_[53] 웹사이트 On image compression http://www.ujoimro.c[...] University of Marne la Vallee
_[54] 웹사이트 Rationale for a Large Text Compression Benchmark http://cs.fit.edu/~m[...] Florida Institute of Technology
_[55] 웹사이트 RFC 3284: The VCDIFF Generic Differencing and Compression Data Format https://datatracker.[...] Internet Engineering Task Force
_[56] 서적 Vdelta: Differencing and Compression New York: John Wiley & Sons, Inc.
_[57] 서적 The Ear As A Communication Receiver http://asa.aip.org/b[...] Acoustical Society of America
_[58] 논문 http://www.jsac.ucsd[...]
_[59] 웹사이트 Summary of some of Solidyne's contributions to Broadcast Engineering http://www.solidynep[...] Buenos Aires: Solidyne
_[60] 서적 Three-Dimensional Model Analysis and Processing Springer
_[61] 웹사이트 Video Coding http://csip.ece.gate[...] Georgia Institute of Technology
_[62] 서적 Lossless Video Codecs Comparison http://compression.r[...] Moscow State University
_[63] 웹사이트 JPEG Image Compression FAQ, Part 1 http://www.faqs.org/[...] Independent JPEG Group 2023-10-11
_[64] 웹사이트 4.1 Video Compression http://shodh.inflibn[...] 2023-10
_[65] 서적 Audio-Video Engineering Nirali Prakashan
_[66] 논문 Discrete Cosine Transform http://ieeexplore.ie[...]
_[67] 논문 HapZipper: sharing HapMap populations just got easier http://nar.oxfordjou[...] 2012-07-27
_[68] 웹인용 압축파일 포맷별 압축률 비교(프랑스어) http://rlwpx.free.fr[...] 2010-02-01
_[69] 웹인용 Windows용 압축 프로그램별 압축률 비교(프랑스어) http://rlwpx.free.fr[...] 2010-02-01

본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com