MPEG-1 오디오 레이어 II
1. 개요
MPEG-1 오디오 레이어 II(MP2)는 1980년대 후반 유레카 147 프로젝트의 MUSICAM 오디오 코덱에서 파생된 오디오 코딩 방식이다. MPEG-1 오디오 표준의 일부로, 디지털 오디오 방송(DAB) 및 디지털 비디오 방송(DVB) 등 다양한 분야에서 사용된다. MP2는 서브 밴드 부호화를 통해 압축을 수행하며, 인간 청각 시스템의 특성을 고려한 지각 코딩 방식을 사용하여 데이터 양을 줄이면서도 음질을 유지한다. MP2는 디지털 오디오 라디오 서비스, DVD-Video, 비디오 CD 등 다양한 응용 분야에서 사용되며, 한국에서는 DAB 표준의 오디오 형식으로 채택되었다.
| 파일 확장자 | .mp2 |
|---|---|
| MIME 형식 | audio/mpeg, audio/MPA |
| 종류 | 손실 오디오 |
| 컨테이너 형식 | MPEG-ES |
| 표준 | ISO/IEC 11172-3, ISO/IEC 13818-3 |
| 공개 여부 | 예 |
| 무료 여부 | 예 |
| URL | MPEG-1 오디오 |
| 최초 릴리스 | 1991년 12월 6일 |
|---|---|
| 최신 릴리스 버전 | ISO/IEC 13818-3:1998 |
| 최신 릴리스 날짜 | 1998년 4월 |
-
오디오 코덱 -
NICAM
NICAM은 1970년대 BBC에서 개발된 디지털 오디오 방송 시스템으로, 32kHz 샘플링 주파수와 14비트 PCM을 사용하여 음성 신호를 인코딩하고 스테레오 음향, 이중 언어 방송, 데이터 채널 전송 등의 기능을 제공하며 아날로그 방송의 음성 전송 방식으로 사용되었으나 디지털 방송으로의 전환으로 사용이 줄어들었다. -
오디오 코덱 -
G.711
G.711은 8 kHz 표본 추출 주파수와 64 kbit/s의 비트 전송률을 갖는 파형 음성 코더로, μ-law와 A-law라는 두 가지 컴팬딩 알고리즘을 사용하며, 부록 I, II 및 확장 표준을 통해 네트워크 환경에서의 효율성과 음질을 높인다. -
MPEG -
ATSC
ATSC는 디지털 텔레비전 방송 표준을 개발하는 미국 기관으로, 1996년 ATSC 1.0 표준이 채택된 후 H.264 코덱을 지원하는 개정판이 승인되었으며, 미국을 비롯한 여러 국가에서 디지털 방송 전환에 사용되었으나 특허 문제와 기술적 한계, 국가별 적용 차이 등의 이슈가 있고, 최근에는 ATSC 3.0이 개발되어 도입되고 있다. -
MPEG -
고급 오디오 부호화
고급 오디오 부호화(AAC)는 MP3 후속 코덱으로 설계되어 더 나은 음질을 제공하며, ISO/IEC 표준으로 다양한 프로파일과 기술을 통해 발전하여 아이튠즈 스토어, 유튜브, 디지털 방송 등에서 널리 활용되는 디지털 오디오 데이터 압축 표준이다.
2. 역사
1980년대 후반, 국제 표준화 기구(ISO)의 MPEG(Moving Picture Experts Group)은 DAB, DMB, DVB 및 CD-ROM 등에 광범위하게 적용될 디지털 오디오 및 비디오 인코딩 표준화를 시작했다.
MPEG-1 오디오 표준은 MUSICAM 및 ASPEC 오디오 형식을 기반으로 했으며, 1989년 ISO에 제출된 MPEG-1 오디오 표준에 대한 14개의 제안 중 하나가 MUSICAM이었다. MPEG-1 오디오 표준에는 레이어 I (MP1), 레이어 II (MP2), 레이어 III (MP3)의 세 가지 오디오 레이어가 포함되었다.
MPEG-1 오디오 레이어 I, II 및 III의 모든 알고리즘은 1991년 ISO-11172 위원회 초안으로 승인되었고, 1992년에 MPEG-1의 일부로 최종 확정되어 1993년에 국제 표준 ISO/IEC 11172-3(MPEG-1 오디오 또는 MPEG-1 파트 3)으로 발표되었다.
1994년에는 MPEG 오디오에 대한 추가 작업이 완료되어 MPEG 표준의 두 번째 제품군인 MPEG-2가 국제 표준 ISO/IEC 13818-3(MPEG-2 파트 3 또는 하위 호환 MPEG-2 오디오 또는 MPEG-2 오디오 BC)로 1995년에 발표되었다. MPEG-2 파트 3은 MPEG-1 오디오 레이어 I, II 및 III에 대한 추가 비트 전송률 및 샘플링 속도를 정의했으며, 새로운 샘플링 속도는 원래 MPEG-1 오디오에 대해 정의된 속도의 절반이다. 또한 최대 5.1 멀티채널까지 오디오 프로그램을 코딩할 수 있도록 하여 MPEG-1의 오디오를 향상시켰다.
CCETT(프랑스), IRT(독일) 및 필립스(네덜란드)는 Musicam 또는 MPEG 오디오 레이어 II로 알려진 디지털 오디오 2채널 압축 시스템 개발로 2000년 공학 에미상을 수상했다.
2.1. MUSICAM
MUSICAM(Masking pattern adapted Universal Subband Integrated Coding And Multiplexing)은 1989년 방송 기술 연구소(IRT), 필립스(Philips), 공동 텔레비전 및 통신 연구 센터(CCETT)에서 개발한 오디오 코덱이다. MP2의 전신이며, 유레카 147 프로젝트의 일환으로 개발되었다. 유레카 147은 오디오 및 데이터를 고정형, 휴대형 또는 이동형 수신기로 방송하기 위한 시스템 개발을 위한 범유럽 정부 간 연구 개발 이니셔티브였다.
MUSICAM은 지각 코덱 기반 정수 산술 32 서브밴드 변환을 사용하여 높은 오디오 품질을 달성했다. 모노 채널당 64~192 kbit/s 범위의 비트 전송률에서 높은 오디오 품질을 제공했으며, 낮은 지연 시간, 낮은 복잡성, 오류 내성, 짧은 액세스 단위 등 방송, 통신 및 디지털 저장 매체에 기록하는 분야의 기술적 요구 사항을 충족하도록 설계되었다.
MUSICAM은 디지털 오디오 방송(DAB) 시스템에 사용되었다. 1991년 NAB 쇼(라스베이거스) 동안 라디오 캐나다 및 CRC 캐나다와 함께 현장에서 시연되었다.
1989~94년 ISO/Moving Pictures Expert Group(MPEG) 내에서 표준화 과정을 거쳤으며, MPEG-1 및 MPEG-2 오디오의 일부 코딩 방식의 기초로 사용되었다. 필터 뱅크, 시간 도메인 처리, 오디오 프레임 크기 등 MPEG-1 오디오의 주요 기능은 MUSICAM에서 직접 상속되었으나, 개선이 이루어졌으며 실제 MUSICAM 알고리즘은 최종 MPEG-1 오디오 레이어 II 표준에 사용되지 않았다.
2.2. MPEG Audio
MPEG-1 오디오 표준은 MUSICAM 및 ASPEC 오디오 형식을 기반으로 개발되었다. 1989년 ISO에 제출된 MPEG-1 오디오 표준에 대한 14개의 제안 중 하나였던 MUSICAM 오디오 코딩은 MPEG-1 및 MPEG-2 오디오 코딩 방식의 기초로 사용되었다. MPEG-1 오디오에는 레이어 I (MP1), 레이어 II (MP2), 레이어 III (MP3)의 세 가지 오디오 "레이어"(인코딩 기술)가 포함되었다.
MPEG-1 오디오 레이어 I, II 및 III의 모든 알고리즘은 1991년 ISO-11172 위원회 초안으로 승인되었고, 1992년에 MPEG의 첫 번째 표준 제품군인 MPEG-1의 일부로 최종 확정되어 1993년에 국제 표준 ISO/IEC 11172-3 (MPEG-1 오디오 또는 MPEG-1 파트 3)으로 발표되었다.
MPEG 오디오에 대한 추가 작업은 1994년 MPEG 표준의 두 번째 제품군의 일부로 완료되었으며, MPEG-2는 국제 표준 ISO/IEC 13818-3 (MPEG-2 파트 3 또는 하위 호환 MPEG-2 오디오 또는 MPEG-2 오디오 BC)로 1995년에 발표되었다. MPEG-2 파트 3 (ISO/IEC 13818-3)은 MPEG-1 오디오 레이어 I, II 및 III에 대한 추가 비트 전송률 및 샘플링 속도를 정의했다. 새로운 샘플링 속도는 원래 MPEG-1 오디오에 대해 정의된 속도의 절반이다. MPEG-2 파트 3은 또한 최대 5.1 멀티채널까지 두 개 이상의 채널로 오디오 프로그램을 코딩할 수 있도록 하여 MPEG-1의 오디오를 향상시켰다.
3. 기술 사양
MP2는 ISO/IEC 11172-3 (MPEG-1 파트 3) 및 ISO/IEC 13818-3 (MPEG-2 파트 3)에 정의되어 있다.
| MPEG-1 | MPEG-2 | |
|---|---|---|
| 샘플링 속도 | 32, 44.1, 48 kHz | 16, 22.05, 24 kHz |
| 비트 전송률 | 32, 48, 56, 64, 80, 96, 112, 128, 160, 192, 224, 256, 320, 384 kbit/s | 8, 16, 24, 40, 144 kbit/s |
* 채널 형식: 모노, 스테레오, 조인트 스테레오, 듀얼 채널
* 멀티채널 지원 (MPEG-2): 최대 5.1 채널
이 형식은 1152개의 연속적인 디지털 프레임 샘플링 간격에 기반한다.
3.1. 가변 비트 전송률 (VBR)
MP2는 가변 비트 전송률(VBR)을 사용할 수 있지만, 널리 지원되지는 않는다. 레이어 II는 비트 전송률 스위칭이라는 방식을 사용할 수 있는데, 각 프레임은 서로 다른 비트 전송률로 생성될 수 있다.
ISO/IEC 11172-3:1993, 섹션 2.4.2.3에 따르면, 가능한 가장 작은 지연과 복잡성을 제공하기 위해 (MPEG 오디오) 디코더는 레이어 I 또는 II에서 지속적으로 가변 비트 전송률을 지원할 필요가 없다.
4. 작동 원리
MP2는 서브 밴드 오디오 인코더로, 시간 도메인에서 압축이 이루어지며, 낮은 지연 필터 뱅크가 32개의 주파수 도메인 구성 요소를 생성한다. 이는 변환 오디오 인코더인 MP3와는 다른 방식이다.
MP2는 지각 코딩 방식을 사용하여 인간의 청각 시스템이 쉽게 인지하지 못하는 정보를 제거한다. 심리 음향학 연구에 따르면 특정 주파수에서 강한 신호가 있으면 강한 신호의 주파수에 가까운 주파수에서 약한 신호는 인간의 청각 시스템에 의해 인지될 수 없다. 이것을 주파수 마스킹이라고 한다. 지각 오디오 코덱은 인지할 수 없는 것으로 간주되는 주파수에서 정보를 무시하여 이러한 주파수 마스킹을 활용, 인지 가능한 주파수의 재생에 더 많은 데이터를 할당할 수 있도록 한다.
MP2는 입력 오디오 신호를 32개의 서브 밴드로 분할하는 반면, MP3는 입력 오디오 신호를 576개의 주파수 구성 요소로 주파수 도메인으로 변환한다. 따라서 MP3는 MP2보다 더 높은 주파수 해상도를 가지므로 심리 음향 모델을 MP2보다 더 선택적으로 적용할 수 있다.
MP2는 낮은 주파수 해상도로 인해 시간 도메인에서 MP3보다 더 나은 동작을 보인다. 이는 오디오 편집을 더 간단하게 만들 수 있는 더 적은 코덱 시간 지연과 디지털 녹음 과정 또는 전송 오류 중에 발생할 수 있는 오류에 대한 "견고성" 및 저항성을 의미한다.
MP2 서브 밴드 필터 뱅크는 또한 모체 필터의 특정 시간적 마스킹 효과로 인해 고유한 "과도 현상 은폐" 기능을 제공한다. 이러한 특성으로 인해 타악기 소리와 같이 에너지 변화가 빠른 오디오 신호에서 매우 좋은 음질을 제공한다.
5. 응용 분야
MPEG-1 오디오 레이어 II는 디지털 오디오 방송(DAB), 디지털 비디오 방송(DVB) 등 다양한 디지털 방송 표준의 오디오 형식으로 사용된다. 방송 산업에서 라이브 오디오 배포 및 디지털 재생 시스템에 널리 사용된다. NPR의 PRSS 콘텐츠 데포 프로그래밍 배포 시스템이 그 예이다.
또한, DVD-Video, 비디오 CD(VCD), 슈퍼 비디오 CD(SVCD), 멀티미디어 홈 플랫폼(MHP), HDV 캠코더 등 다양한 멀티미디어 형식 및 기기에서도 사용된다. 일부 휴대용 오디오 플레이어는 MP2 파일을 지원한다.