MP3
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
MP3는 MPEG-1 및 MPEG-2 표준의 일부로 설계된 오디오 압축 형식이다. 1991년 독일의 프라운호퍼 IIS에서 발명되었으며, 인간의 청각 심리를 이용하여 음질 저하를 최소화하면서 데이터를 압축한다. MP3는 CD 등에서 개인용 컴퓨터로 음악을 가져오는 데 널리 사용되었고, 무료 인코더 및 디코더 소프트웨어의 보급과 윈앰프 등의 MP3 플레이어의 등장으로 대중화되었다. MP3 기술 관련 특허는 여러 회사에서 관리했으며, 2017년 4월 특허 만료로 인해 퍼블릭 도메인이 되었다. AAC, 오푸스, Vorbis 등 MP3를 대체하는 다양한 압축 형식과 FLAC과 같은 무손실 압축 형식도 존재한다.
더 읽어볼만한 페이지
- MP3 - MP3 서라운드
- MP3 - 쥬얼 팟
쥬얼 팟은 반다이와 세가 토이즈가 공동 개발한 여아용 디지털 완구 시리즈로, 쥬얼 펫 애니메이션 연동, 미니 게임, 다양한 콜라보레이션 등을 통해 일본 시장에서 인기를 얻었다. - 오디오 파일 포맷 - 고급 오디오 부호화
고급 오디오 부호화(AAC)는 MP3 후속 코덱으로 설계되어 더 나은 음질을 제공하며, ISO/IEC 표준으로 다양한 프로파일과 기술을 통해 발전하여 아이튠즈 스토어, 유튜브, 디지털 방송 등에서 널리 활용되는 디지털 오디오 데이터 압축 표준이다. - 오디오 파일 포맷 - FLAC
FLAC은 조시 콜슨이 개발한 무손실 오디오 코덱으로, 원본 음질을 유지하면서 파일 크기를 줄이기 위해 오디오 데이터를 압축하며, 4~32비트 샘플 크기, 최대 8 채널을 지원하고, 미국 국립 문서 기록 관리청에서 디지털 오디오에 선호되는 형식으로 지정되었다. - 데이터 압축 - 해상도
해상도는 1인치당 픽셀 또는 점의 수를 나타내는 지표로, 이미지의 선명도를 결정하며 DPI와 PPI 단위를 사용하고, 높을수록 섬세한 표현이 가능하다. - 데이터 압축 - 손실 압축
손실 압축은 데이터 양을 줄이기 위해 사람이 인지하기 어려운 일부 정보를 제거하는 방식으로, 압축률을 높이지만 반복적인 압축 및 해제 시 품질 저하가 발생할 수 있다.
MP3 - [IT 관련 정보]에 관한 문서 | |
---|---|
일반 정보 | |
![]() | |
확장자 | .mp3 |
MIME 형식 | audio/mpeg audio/MPA audio/mpa-robust |
개발 | 프라운호퍼 협회 |
종류 | 오디오 파일 포맷 |
표준 | ISO/IEC 11172-3 ISO/IEC 13818-3 |
공개 여부 | 예 |
특허 만료 여부 | 예 |
기술 정보 | |
유형 | 손실 오디오 |
컨테이너 | MPEG-ES |
확장 대상 | mp3PRO MP3 Surround |
역사 | |
최초 발표일 | 1991년 12월 6일 |
최신 버전 발표일 | 1998년 4월 |
개발자 | |
개발자 | Karlheinz Brandenburg Ernst Eberlein Heinz Gerhäuser Bernhard Grill Jürgen Herre Harald Popp 프라운호퍼 협회 기타 |
2. 역사
MP3는 독일 프라운호퍼 연구소에서 개발되었으며, 1990년대 후반 인터넷의 발달과 함께 전 세계적으로 대중화되었다.
MP3를 포함한 최근의 손실 압축은 아르헨티나 부에노스아이레스 대학교 오스카 보넬로(Oscar Bonello) 교수의 초기 연구에 기반을 두고 있다.[18] 그는 1987년 IBM 개인용 컴퓨터에서 실시간으로 동작하는 세계 최초의 비트 압축 시스템 ECAM을 개발했다. ECAM은 1988년 오디컴(Audicom)이라는 이름으로 처음 전시되었고, 1990년 미국 애틀랜타의 국제 NAB 라디오 전시회를 통해 세계에 알려졌다. 보넬로는 이 기술과 관련하여 특허를 내지 않았다.
MPEG-1 Audio Layer 2 인코딩은 독일의 ''Deutsche Forschungs- und Versuchsanstalt für Luft- und Raumfahrt''(DFVLR, 이후 독일 항공우주 센터(DLR)로 변경) 소속 에곤 마이어-엥엘렌(Egon Meier-Engelen)이 관리하는 디지털 오디오 방송(DAB) 프로젝트로 시작되었다. 이 프로젝트는 EU-147(1987년부터 1994년까지 운영)로 알려진 유레카(EUREKA) 연구 프로그램의 일환으로 유럽 연합의 재정 지원을 받았다.
MP3의 직접적인 선행 기술은 "주파수 도메인에서의 최적 코딩"(OCF)과 지각 변환 코딩(PXFM)이었다. 이 두 코덱은 톰슨-브란트(Thomson-Brandt)의 블록 스위칭 기여와 함께 ASPEC이라는 코덱으로 병합되어 MPEG에 제출되었으나, 구현이 복잡하다는 이유로 거부되었다.
MP3 형식 및 기술의 또 다른 선행 기술은 심리 음향 모델 기반의 정수 산술 32 서브 밴드 필터 뱅크를 사용하는 지각 코덱 MUSICAM이다. 이는 주로 DAB 및 디지털 TV를 위해 설계되었으며, 1991년 IEEE-ICASSP 컨퍼런스에서 CCETT(프랑스)와 IRT(독일)에 의해 공개되었다. 1989년부터 마쓰시타 및 필립스와 함께 MUSICAM 작업을 해왔다.[19]
1994년 7월 7일, 프라운호퍼 협회는 I3enc라는 최초의 MP3 소프트웨어 인코더를 발표했다. 1995년 7월 14일, 프라운호퍼 팀은 .mp3라는 파일 확장자를 정의했다(이전에는 .bit 사용). 1995년 9월 9일, 최초의 실시간 MP3 플레이어 프로그램이 발표되면서 많은 사람들이 PC에서 MP3를 인코딩하고 재생할 수 있게 되었다. 당시에는 하드 디스크 용량이 작았기 때문에(~500MB) 컴퓨터에서 음악을 듣기 위해서는 비악기 기반 음악을 저장해야 했다.
오늘날 MP3에 사용되는 VBR(Variable Bit Rate) 기술은 프라운호퍼가 아닌 Xing에서 추가한 기술이다. Xing Encoder 1.5에서는 16kHz가 잘리는 버그가 있었으나, 이후 개선되었다.
MP3는 1411.2 kbps로 수록된 음악 CD 규격의 PCM 등을 임의의 비트 전송률·샘플링 주파수로 압축할 수 있다. 좁은 의미의 MP3는 MPEG-1의 오디오 규격으로 개발된 비가역 압축 방식이며, 이전 규격인 MP1 및 MP2를 개량한 것이다. 초기에는 "MPEG-1 Audio Layer-3"의 약칭이었지만, 이후 호환성을 가진 "MPEG-2 AudioBC (MPEG-2 Audio Layer-3)"가 추가되어 "MPEG-1/2 Audio Layer-3"라고도 한다. 비공식 규격인 "MPEG-2.5 Audio Layer-3"를 포함하기도 한다. MPEG-1 Audio Layer-3 사양은 ISO 11172-3 (JIS X 4323, 2011년 1월 20일 폐지)로 규격화되었으나, 규격서는 유료이며 상세 사양은 공개되지 않았다.
MP1 (MPEG-1 Audio Layer-1), MP2 (MPEG-1 Audio Layer-2)는 MP3의 전신 규격이며, MP3와 호환되지 않는다. MP3와 MP4는 명칭이 유사하여 MP4가 Audio Layer-4로 오해되기도 하지만, MP4는 MPEG-4의 관련 규격으로 직접적인 관련이 없다. MP3가 MPEG-3의 약칭으로 여겨지기도 하지만, MPEG-3는 MPEG-2 규격에 흡수되어 존재하지 않는다.
MP3는 소리의 들림 차이(주파수별 최소 가청값)나 큰 소리 직전, 직후, 또는 가까운 주파수의 작은 소리가 들리지 않는 현상(시간/주파수 마스킹) 등 인간의 청각 심리를 이용해 압축한다. 따라서 인코더의 구현(청각 심리 모델 조정)에 따라 압축 후 재생 품질이 크게 달라진다.
산요 전기 등 일부 제조사는 이전부터 MP3 형식 녹음이 가능한 보이스 레코더를 출시했으며, 독자 규격을 채용했던 파나소닉이나 소니도 범용성 등을 고려하여 MP3 형식 녹음 기종을 출시하기 시작했다.
압축된 데이터는 크기가 작아 취급이 용이하고 통신 회선을 통한 전송도 쉬워 인터넷 라디오 등에서 널리 사용된다. 그러나 저작권자가 재배포를 인정하지 않은 악곡의 부정 배포에 사용되기도 하여, "MP3에 디지털 저작권 관리 기능이 없기 때문"이라는 주장도 제기되었다.
MP3가 널리 보급된 요인 중 하나는 무료 인코더·디코더 소프트웨어를 쉽게 구할 수 있다는 점이다. 1998년 이후 독일 프라운호퍼 협회와 프랑스 톰슨사가 라이센스 보유를 주장했지만, 자유 소프트웨어 라이선스로 제공되는 LAME 등의 무료 인코더나 Windows Media Player 등의 무료 재생 소프트웨어가 있어 보급을 방해하지 않았다. Windows에서는 1999년 11월 출시된 Windows Media Player 6.4에서 MP3를 표준 지원하면서 폭발적으로 보급되었다.
MP3의 후속 규격으로는 AAC가 iTunes, mora, iPod, 착신 아리 등에서 사용되고 있다. MP3 대체 목적으로 개발된 WMA(마이크로소프트 개발), Vorbis(특허 제약 없는 자유 코덱), FLAC(가역 압축 코덱), ATRAC(소니 개발) 등도 있다.
WMA나 ATRAC은 디지털 저작권 관리 기능이 있어 인터넷 음악 배포 서비스 사업자들이 채용하는 경향이 있다. FLAC는 가역 압축 외에 하이레졸루션급 샘플링 주파수(주로 96kHz, 192kHz)·양자화 비트 수(주로 24bit)를 사용한 고음질 음악 배포가 가능하다는 이점이 있다.
2017년 4월 23일, 프라운호퍼 IIS 및 테크니컬러(구 톰슨)의 MP3 라이선스 프로그램이 기본 특허 존속 기간 만료로 종료되면서,[52][53] MP3 기본 기술은 퍼블릭 도메인이 되었다.
2. 1. 개발
1980년대 초, 독일의 에를랑겐-뉘른베르크 대학교 박사 과정 학생이었던 카를하인츠 브란덴부르크는 디지털 음악 압축 연구를 시작하여, 사람들이 음악을 어떻게 인식하는지에 초점을 맞췄다. 1989년 박사 학위를 받은 후, 에를랑겐-뉘른베르크 대학교에서 조교수가 되었으며, 이후 프라운호퍼 게셀샤프트(1993년 Karlheinz Brandenburg는 Fraunhofer Institute의 staff로 합류)에서 과학자들과 함께 음악 압축에 관한 연구를 이어나갔다.1991년, MPEG 오디오 표준에 대한 두 가지 제안이 평가되었다. 필립스(네덜란드), CETT(프랑스), Institut für Rundfunktechnik(독일)이 제안한 Musicam 기술은 고음질 압축 오디오 인코딩 시 계산 부담이 적고, 명료성과 오류 내구성이 뛰어나 채택되었다. 서브밴드 인코딩(sub-band encoding)에 기반을 둔 Musicam 포맷은 MPEG 오디오 압축 포맷(샘플 레이트, 프레임 구조, 헤더, 프레임 당 샘플 수)의 기반을 마련하는 데 중요한 역할을 했다.
이 기술과 아이디어들은 ISO MPEG Audio Layer I, Layer II, Layer III(MP3) 형식의 정의에 모두 추가되었다. Leon Van de Kerkhof(네덜란드), Gerhard Stoll(독일), 레오나르도 키아릴리오네(이탈리아), Yves-Franc,ois Dehery(프랑스), 카를하인츠 브란덴부르크(독일)로 구성된 연구 모임은 Musicam과 ASPEC으로부터 아이디어를 가져오는 한편, 자체 아이디어를 추가하여 192Kbps의 MP2와 같은 음질을 128kbps에서 구현하는 방법을 개발했다.
모든 알고리즘은 1991년에 승인되었으며, 1992년 MPEG의 첫 번째 표준 모음 중 하나로 완성되었다. 이후 1993년 ''International Organization for Standardization(ISO)/International Electrotechnical Commission(IEC) 11172-3''에서 국제 표준이 되었다.
카를하인츠 브란덴부르크는 MP3 압축 알고리즘 평가를 위해 수잔 베가의 노래 Tom's Diner를 선택했다. 이 노래는 부드럽고 단조로워 압축 포맷의 결함을 듣기 쉬웠기 때문이다. 일부 사람들은 농담 삼아 수잔 베가를 "MP3의 어머니"라고 부르기도 한다.
MPEG(Moving Picture Experts Group)은 MPEG-1과 이후 MPEG-2 표준의 일부로 MP3를 설계했다. MPEG-1 오디오(MPEG-1 파트 3)는 MPEG-1 오디오 레이어 I, II, III을 포함하며, 1991년에 ISO/IEC 표준 초안으로 승인되었고, 1992년에 최종 확정되었으며, 1993년에 ISO/IEC 11172-3:1993으로 출판되었다.
2. 2. 대중화
1990년대 후반, 윈앰프와 같은 MP3 플레이어와 냅스터와 같은 P2P 파일 공유 서비스가 확산되면서 MP3는 전 세계적으로 대중화되었다.[31] 1998년 대한민국 서울에 본사를 둔 새한정보시스템에서 세계 최초의 휴대용 솔리드 스테이트 디지털 오디오 플레이어 MPMan을 출시하며 MP3 대중화에 기여했다.MP3 파일의 작은 크기는 CD에서 리핑한 음악의 광범위한 파일 공유를 가능하게 했다. 최초의 대규모 P2P 파일 공유 네트워크인 냅스터는 1999년에 출시되었는데, MP3를 쉽게 만들고 공유할 수 있게 되면서 광범위한 저작권 침해가 발생했다. 주요 음반 회사는 냅스터와 파일 공유에 참여한 개별 사용자를 상대로 소송을 제기하는 방식으로 대응했다.
무단 MP3 파일 공유는 차세대 P2P 파일 공유 네트워크에서 계속되고 있다. Beatport, Bleep, Juno Records, eMusic, Zune Marketplace, Walmart.com, Rhapsody, 음반 업계가 승인한 냅스터의 재탄생, Amazon.com과 같은 일부 정식 서비스는 MP3 형식의 제한 없는 음악을 판매한다.
3. 기술적 특징
MP3는 PCM 오디오 데이터를 사람이 듣는 데 중요하지 않은 부분을 제거하여 압축하는 방식이다. 이는 음향심리학적 모델을 기반으로 하며, 청각 마스킹과 같은 인간 청각의 지각적 한계를 활용한다.[69]
MP3는 이산 코사인 변환(DCT)을 기반으로 한 수정 이산 코사인 변환(MDCT)을 사용한다. MDCT는 1987년에 개발되었으며, MP3 알고리즘의 핵심 기술이다.[17]
MP3의 주요 기술적 특징은 다음과 같다.
항목 | 규정 |
---|---|
알고리즘 | |
샘플링 주파수 | |
채널 수 | |
비트 전송률 | |
채널 커플링 | |
비트 전송률 제한 | |
MIME 타입 | |
스트리밍 | 미지원 |
체크섬 | 옵션 |
태그 정보 | ID3 태그 (ID3v1, ID3v2) |
MP3는 중첩된 MDCT 구조를 사용하며, 각 프레임은 1152개의 샘플로 구성된다. 이러한 샘플은 MDCT에 의해 주파수 도메인 샘플로 변환된다.[32] 과도 현상이 감지될 때는 더 짧은 블록을 사용하여 양자화 잡음의 시간적 확산을 제한한다. 그러나 필터 뱅크의 트리 구조로 인해 에코 문제가 발생할 수 있으며, 이는 "에일리어싱 보상" 단계에서 부분적으로 처리된다.
3. 1. 인코딩
MP3 인코딩은 사람이 듣는 데 중요하지 않은 소리 정보를 제거하여 오디오 데이터 크기를 줄이는 과정이다. 이 과정은 다음과 같은 주요 단계로 이루어진다.1. 시간-주파수 변환: 먼저, 오디오 신호를 작은 조각(프레임)으로 나누고, 각 프레임을 MDCT(수정 이산 코사인 변환)라는 기술을 사용하여 시간 영역에서 주파수 영역으로 변환한다. 이렇게 하면 소리를 다양한 주파수 성분으로 분해할 수 있다.
2. 심리음향 모델 적용: 심리음향 모델은 사람이 소리를 어떻게 인식하는지에 대한 연구를 바탕으로 만들어진 모델이다. 이 모델을 사용하여 각 주파수 성분 중 어떤 부분이 사람이 듣기에 덜 중요한지 판단한다. 예를 들어, 큰 소리 근처의 작은 소리나 사람이 들을 수 없는 높은 주파수는 제거 대상이 된다.
3. 양자화 및 허프만 부호화: 덜 중요한 정보는 제거하거나 정밀도를 낮추는 양자화 과정을 거친다. 그 후, 허프만 부호화라는 방법을 사용하여 데이터를 압축한다. 허프만 부호화는 자주 나타나는 데이터에 짧은 코드를 할당하고, 드물게 나타나는 데이터에 긴 코드를 할당하여 전체 데이터 크기를 줄인다.
이러한 과정을 거쳐 MP3 파일이 만들어진다.
MP3 인코더는 이러한 과정을 수행하는 소프트웨어 또는 하드웨어이다. 다양한 MP3 인코더가 존재하며, 각각 다른 알고리즘과 설정을 사용하여 MP3 파일을 생성한다. 따라서 같은 원본 오디오 파일이라도 어떤 인코더를 사용하느냐에 따라 음질과 파일 크기가 달라질 수 있다.
LAME은 현재 가장 발전된 MP3 인코더 중 하나로 평가받는다. LAME은 특히 가변 비트 전송률(VBR) 인코딩을 지원하여 음질을 유지하면서 파일 크기를 효율적으로 줄일 수 있다. VBR은 오디오의 복잡한 부분에는 높은 비트 전송률을 사용하고, 단순한 부분에는 낮은 비트 전송률을 사용하여 전체적인 파일 크기를 줄이는 방식이다.
3. 2. 파일 구조
HeaderSide information
Main Data
Ancillary Data