맨위로가기

MP3

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

MP3는 MPEG-1 및 MPEG-2 표준의 일부로 설계된 오디오 압축 형식이다. 1991년 독일의 프라운호퍼 IIS에서 발명되었으며, 인간의 청각 심리를 이용하여 음질 저하를 최소화하면서 데이터를 압축한다. MP3는 CD 등에서 개인용 컴퓨터로 음악을 가져오는 데 널리 사용되었고, 무료 인코더 및 디코더 소프트웨어의 보급과 윈앰프 등의 MP3 플레이어의 등장으로 대중화되었다. MP3 기술 관련 특허는 여러 회사에서 관리했으며, 2017년 4월 특허 만료로 인해 퍼블릭 도메인이 되었다. AAC, 오푸스, Vorbis 등 MP3를 대체하는 다양한 압축 형식과 FLAC과 같은 무손실 압축 형식도 존재한다.

더 읽어볼만한 페이지

  • MP3 - MP3 서라운드
  • MP3 - 쥬얼 팟
    쥬얼 팟은 반다이와 세가 토이즈가 공동 개발한 여아용 디지털 완구 시리즈로, 쥬얼 펫 애니메이션 연동, 미니 게임, 다양한 콜라보레이션 등을 통해 일본 시장에서 인기를 얻었다.
  • 오디오 파일 포맷 - 고급 오디오 부호화
    고급 오디오 부호화(AAC)는 MP3 후속 코덱으로 설계되어 더 나은 음질을 제공하며, ISO/IEC 표준으로 다양한 프로파일과 기술을 통해 발전하여 아이튠즈 스토어, 유튜브, 디지털 방송 등에서 널리 활용되는 디지털 오디오 데이터 압축 표준이다.
  • 오디오 파일 포맷 - FLAC
    FLAC은 조시 콜슨이 개발한 무손실 오디오 코덱으로, 원본 음질을 유지하면서 파일 크기를 줄이기 위해 오디오 데이터를 압축하며, 4~32비트 샘플 크기, 최대 8 채널을 지원하고, 미국 국립 문서 기록 관리청에서 디지털 오디오에 선호되는 형식으로 지정되었다.
  • 데이터 압축 - 해상도
    해상도는 1인치당 픽셀 또는 점의 수를 나타내는 지표로, 이미지의 선명도를 결정하며 DPI와 PPI 단위를 사용하고, 높을수록 섬세한 표현이 가능하다.
  • 데이터 압축 - 손실 압축
    손실 압축은 데이터 양을 줄이기 위해 사람이 인지하기 어려운 일부 정보를 제거하는 방식으로, 압축률을 높이지만 반복적인 압축 및 해제 시 품질 저하가 발생할 수 있다.
MP3 - [IT 관련 정보]에 관한 문서
일반 정보
MP3 로고
MP3 로고
확장자.mp3
MIME 형식audio/mpeg
audio/MPA
audio/mpa-robust
개발프라운호퍼 협회
종류오디오 파일 포맷
표준ISO/IEC 11172-3
ISO/IEC 13818-3
공개 여부
특허 만료 여부
기술 정보
유형손실 오디오
컨테이너MPEG-ES
확장 대상mp3PRO
MP3 Surround
역사
최초 발표일1991년 12월 6일
최신 버전 발표일1998년 4월
개발자
개발자Karlheinz Brandenburg
Ernst Eberlein
Heinz Gerhäuser
Bernhard Grill
Jürgen Herre
Harald Popp
프라운호퍼 협회
기타

2. 역사

MP3는 독일 프라운호퍼 연구소에서 개발되었으며, 1990년대 후반 인터넷의 발달과 함께 전 세계적으로 대중화되었다.

MP3를 포함한 최근의 손실 압축은 아르헨티나 부에노스아이레스 대학교 오스카 보넬로(Oscar Bonello) 교수의 초기 연구에 기반을 두고 있다.[18] 그는 1987년 IBM 개인용 컴퓨터에서 실시간으로 동작하는 세계 최초의 비트 압축 시스템 ECAM을 개발했다. ECAM은 1988년 오디컴(Audicom)이라는 이름으로 처음 전시되었고, 1990년 미국 애틀랜타의 국제 NAB 라디오 전시회를 통해 세계에 알려졌다. 보넬로는 이 기술과 관련하여 특허를 내지 않았다.

MPEG-1 Audio Layer 2 인코딩은 독일의 ''Deutsche Forschungs- und Versuchsanstalt für Luft- und Raumfahrt''(DFVLR, 이후 독일 항공우주 센터(DLR)로 변경) 소속 에곤 마이어-엥엘렌(Egon Meier-Engelen)이 관리하는 디지털 오디오 방송(DAB) 프로젝트로 시작되었다. 이 프로젝트는 EU-147(1987년부터 1994년까지 운영)로 알려진 유레카(EUREKA) 연구 프로그램의 일환으로 유럽 연합의 재정 지원을 받았다.

MP3의 직접적인 선행 기술은 "주파수 도메인에서의 최적 코딩"(OCF)과 지각 변환 코딩(PXFM)이었다. 이 두 코덱은 톰슨-브란트(Thomson-Brandt)의 블록 스위칭 기여와 함께 ASPEC이라는 코덱으로 병합되어 MPEG에 제출되었으나, 구현이 복잡하다는 이유로 거부되었다.

MP3 형식 및 기술의 또 다른 선행 기술은 심리 음향 모델 기반의 정수 산술 32 서브 밴드 필터 뱅크를 사용하는 지각 코덱 MUSICAM이다. 이는 주로 DAB 및 디지털 TV를 위해 설계되었으며, 1991년 IEEE-ICASSP 컨퍼런스에서 CCETT(프랑스)와 IRT(독일)에 의해 공개되었다. 1989년부터 마쓰시타 및 필립스와 함께 MUSICAM 작업을 해왔다.[19]

1994년 7월 7일, 프라운호퍼 협회는 I3enc라는 최초의 MP3 소프트웨어 인코더를 발표했다. 1995년 7월 14일, 프라운호퍼 팀은 .mp3라는 파일 확장자를 정의했다(이전에는 .bit 사용). 1995년 9월 9일, 최초의 실시간 MP3 플레이어 프로그램이 발표되면서 많은 사람들이 PC에서 MP3를 인코딩하고 재생할 수 있게 되었다. 당시에는 하드 디스크 용량이 작았기 때문에(~500MB) 컴퓨터에서 음악을 듣기 위해서는 비악기 기반 음악을 저장해야 했다.

오늘날 MP3에 사용되는 VBR(Variable Bit Rate) 기술은 프라운호퍼가 아닌 Xing에서 추가한 기술이다. Xing Encoder 1.5에서는 16kHz가 잘리는 버그가 있었으나, 이후 개선되었다.

MP3는 1411.2 kbps로 수록된 음악 CD 규격의 PCM 등을 임의의 비트 전송률·샘플링 주파수로 압축할 수 있다. 좁은 의미의 MP3는 MPEG-1의 오디오 규격으로 개발된 비가역 압축 방식이며, 이전 규격인 MP1 및 MP2를 개량한 것이다. 초기에는 "MPEG-1 Audio Layer-3"의 약칭이었지만, 이후 호환성을 가진 "MPEG-2 AudioBC (MPEG-2 Audio Layer-3)"가 추가되어 "MPEG-1/2 Audio Layer-3"라고도 한다. 비공식 규격인 "MPEG-2.5 Audio Layer-3"를 포함하기도 한다. MPEG-1 Audio Layer-3 사양은 ISO 11172-3 (JIS X 4323, 2011년 1월 20일 폐지)로 규격화되었으나, 규격서는 유료이며 상세 사양은 공개되지 않았다.

MP1 (MPEG-1 Audio Layer-1), MP2 (MPEG-1 Audio Layer-2)는 MP3의 전신 규격이며, MP3와 호환되지 않는다. MP3와 MP4는 명칭이 유사하여 MP4가 Audio Layer-4로 오해되기도 하지만, MP4는 MPEG-4의 관련 규격으로 직접적인 관련이 없다. MP3가 MPEG-3의 약칭으로 여겨지기도 하지만, MPEG-3는 MPEG-2 규격에 흡수되어 존재하지 않는다.

MP3는 소리의 들림 차이(주파수별 최소 가청값)나 큰 소리 직전, 직후, 또는 가까운 주파수의 작은 소리가 들리지 않는 현상(시간/주파수 마스킹) 등 인간의 청각 심리를 이용해 압축한다. 따라서 인코더의 구현(청각 심리 모델 조정)에 따라 압축 후 재생 품질이 크게 달라진다.

산요 전기 등 일부 제조사는 이전부터 MP3 형식 녹음이 가능한 보이스 레코더를 출시했으며, 독자 규격을 채용했던 파나소닉이나 소니도 범용성 등을 고려하여 MP3 형식 녹음 기종을 출시하기 시작했다.

압축된 데이터는 크기가 작아 취급이 용이하고 통신 회선을 통한 전송도 쉬워 인터넷 라디오 등에서 널리 사용된다. 그러나 저작권자가 재배포를 인정하지 않은 악곡의 부정 배포에 사용되기도 하여, "MP3에 디지털 저작권 관리 기능이 없기 때문"이라는 주장도 제기되었다.

MP3가 널리 보급된 요인 중 하나는 무료 인코더·디코더 소프트웨어를 쉽게 구할 수 있다는 점이다. 1998년 이후 독일 프라운호퍼 협회프랑스 톰슨사가 라이센스 보유를 주장했지만, 자유 소프트웨어 라이선스로 제공되는 LAME 등의 무료 인코더나 Windows Media Player 등의 무료 재생 소프트웨어가 있어 보급을 방해하지 않았다. Windows에서는 1999년 11월 출시된 Windows Media Player 6.4에서 MP3를 표준 지원하면서 폭발적으로 보급되었다.

MP3의 후속 규격으로는 AAC가 iTunes, mora, iPod, 착신 아리 등에서 사용되고 있다. MP3 대체 목적으로 개발된 WMA(마이크로소프트 개발), Vorbis(특허 제약 없는 자유 코덱), FLAC(가역 압축 코덱), ATRAC(소니 개발) 등도 있다.

WMA나 ATRAC은 디지털 저작권 관리 기능이 있어 인터넷 음악 배포 서비스 사업자들이 채용하는 경향이 있다. FLAC는 가역 압축 외에 하이레졸루션급 샘플링 주파수(주로 96kHz, 192kHz)·양자화 비트 수(주로 24bit)를 사용한 고음질 음악 배포가 가능하다는 이점이 있다.

2017년 4월 23일, 프라운호퍼 IIS 및 테크니컬러(구 톰슨)의 MP3 라이선스 프로그램이 기본 특허 존속 기간 만료로 종료되면서,[52][53] MP3 기본 기술은 퍼블릭 도메인이 되었다.

2. 1. 개발

1980년대 초, 독일의 에를랑겐-뉘른베르크 대학교 박사 과정 학생이었던 카를하인츠 브란덴부르크는 디지털 음악 압축 연구를 시작하여, 사람들이 음악을 어떻게 인식하는지에 초점을 맞췄다. 1989년 박사 학위를 받은 후, 에를랑겐-뉘른베르크 대학교에서 조교수가 되었으며, 이후 프라운호퍼 게셀샤프트(1993년 Karlheinz Brandenburg는 Fraunhofer Institute의 staff로 합류)에서 과학자들과 함께 음악 압축에 관한 연구를 이어나갔다.

1991년, MPEG 오디오 표준에 대한 두 가지 제안이 평가되었다. 필립스(네덜란드), CETT(프랑스), Institut für Rundfunktechnik(독일)이 제안한 Musicam 기술은 고음질 압축 오디오 인코딩 시 계산 부담이 적고, 명료성과 오류 내구성이 뛰어나 채택되었다. 서브밴드 인코딩(sub-band encoding)에 기반을 둔 Musicam 포맷은 MPEG 오디오 압축 포맷(샘플 레이트, 프레임 구조, 헤더, 프레임 당 샘플 수)의 기반을 마련하는 데 중요한 역할을 했다.

이 기술과 아이디어들은 ISO MPEG Audio Layer I, Layer II, Layer III(MP3) 형식의 정의에 모두 추가되었다. Leon Van de Kerkhof(네덜란드), Gerhard Stoll(독일), 레오나르도 키아릴리오네(이탈리아), Yves-Franc,ois Dehery(프랑스), 카를하인츠 브란덴부르크(독일)로 구성된 연구 모임은 Musicam과 ASPEC으로부터 아이디어를 가져오는 한편, 자체 아이디어를 추가하여 192Kbps의 MP2와 같은 음질을 128kbps에서 구현하는 방법을 개발했다.

모든 알고리즘은 1991년에 승인되었으며, 1992년 MPEG의 첫 번째 표준 모음 중 하나로 완성되었다. 이후 1993년 ''International Organization for Standardization(ISO)/International Electrotechnical Commission(IEC) 11172-3''에서 국제 표준이 되었다.

카를하인츠 브란덴부르크는 MP3 압축 알고리즘 평가를 위해 수잔 베가의 노래 Tom's Diner를 선택했다. 이 노래는 부드럽고 단조로워 압축 포맷의 결함을 듣기 쉬웠기 때문이다. 일부 사람들은 농담 삼아 수잔 베가를 "MP3의 어머니"라고 부르기도 한다.

MPEG(Moving Picture Experts Group)은 MPEG-1과 이후 MPEG-2 표준의 일부로 MP3를 설계했다. MPEG-1 오디오(MPEG-1 파트 3)는 MPEG-1 오디오 레이어 I, II, III을 포함하며, 1991년에 ISO/IEC 표준 초안으로 승인되었고, 1992년에 최종 확정되었으며, 1993년에 ISO/IEC 11172-3:1993으로 출판되었다.

2. 2. 대중화

1990년대 후반, 윈앰프와 같은 MP3 플레이어와 냅스터와 같은 P2P 파일 공유 서비스가 확산되면서 MP3는 전 세계적으로 대중화되었다.[31] 1998년 대한민국 서울에 본사를 둔 새한정보시스템에서 세계 최초의 휴대용 솔리드 스테이트 디지털 오디오 플레이어 MPMan을 출시하며 MP3 대중화에 기여했다.

MP3 파일의 작은 크기는 CD에서 리핑한 음악의 광범위한 파일 공유를 가능하게 했다. 최초의 대규모 P2P 파일 공유 네트워크인 냅스터1999년에 출시되었는데, MP3를 쉽게 만들고 공유할 수 있게 되면서 광범위한 저작권 침해가 발생했다. 주요 음반 회사는 냅스터와 파일 공유에 참여한 개별 사용자를 상대로 소송을 제기하는 방식으로 대응했다.

무단 MP3 파일 공유는 차세대 P2P 파일 공유 네트워크에서 계속되고 있다. Beatport, Bleep, Juno Records, eMusic, Zune Marketplace, Walmart.com, Rhapsody, 음반 업계가 승인한 냅스터의 재탄생, Amazon.com과 같은 일부 정식 서비스는 MP3 형식의 제한 없는 음악을 판매한다.

3. 기술적 특징

MP3는 PCM 오디오 데이터를 사람이 듣는 데 중요하지 않은 부분을 제거하여 압축하는 방식이다. 이는 음향심리학적 모델을 기반으로 하며, 청각 마스킹과 같은 인간 청각의 지각적 한계를 활용한다.[69]

MP3는 이산 코사인 변환(DCT)을 기반으로 한 수정 이산 코사인 변환(MDCT)을 사용한다. MDCT는 1987년에 개발되었으며, MP3 알고리즘의 핵심 기술이다.[17]

MP3의 주요 기술적 특징은 다음과 같다.

항목규정
알고리즘
샘플링 주파수
채널 수
비트 전송률
채널 커플링
비트 전송률 제한
MIME 타입
스트리밍미지원
체크섬옵션
태그 정보ID3 태그 (ID3v1, ID3v2)



MP3는 중첩된 MDCT 구조를 사용하며, 각 프레임은 1152개의 샘플로 구성된다. 이러한 샘플은 MDCT에 의해 주파수 도메인 샘플로 변환된다.[32] 과도 현상이 감지될 때는 더 짧은 블록을 사용하여 양자화 잡음의 시간적 확산을 제한한다. 그러나 필터 뱅크의 트리 구조로 인해 에코 문제가 발생할 수 있으며, 이는 "에일리어싱 보상" 단계에서 부분적으로 처리된다.

3. 1. 인코딩

MP3 인코딩은 사람이 듣는 데 중요하지 않은 소리 정보를 제거하여 오디오 데이터 크기를 줄이는 과정이다. 이 과정은 다음과 같은 주요 단계로 이루어진다.

1. 시간-주파수 변환: 먼저, 오디오 신호를 작은 조각(프레임)으로 나누고, 각 프레임을 MDCT(수정 이산 코사인 변환)라는 기술을 사용하여 시간 영역에서 주파수 영역으로 변환한다. 이렇게 하면 소리를 다양한 주파수 성분으로 분해할 수 있다.

2. 심리음향 모델 적용: 심리음향 모델은 사람이 소리를 어떻게 인식하는지에 대한 연구를 바탕으로 만들어진 모델이다. 이 모델을 사용하여 각 주파수 성분 중 어떤 부분이 사람이 듣기에 덜 중요한지 판단한다. 예를 들어, 큰 소리 근처의 작은 소리나 사람이 들을 수 없는 높은 주파수는 제거 대상이 된다.

3. 양자화 및 허프만 부호화: 덜 중요한 정보는 제거하거나 정밀도를 낮추는 양자화 과정을 거친다. 그 후, 허프만 부호화라는 방법을 사용하여 데이터를 압축한다. 허프만 부호화는 자주 나타나는 데이터에 짧은 코드를 할당하고, 드물게 나타나는 데이터에 긴 코드를 할당하여 전체 데이터 크기를 줄인다.

이러한 과정을 거쳐 MP3 파일이 만들어진다.

MP3 인코더는 이러한 과정을 수행하는 소프트웨어 또는 하드웨어이다. 다양한 MP3 인코더가 존재하며, 각각 다른 알고리즘과 설정을 사용하여 MP3 파일을 생성한다. 따라서 같은 원본 오디오 파일이라도 어떤 인코더를 사용하느냐에 따라 음질과 파일 크기가 달라질 수 있다.

LAME은 현재 가장 발전된 MP3 인코더 중 하나로 평가받는다. LAME은 특히 가변 비트 전송률(VBR) 인코딩을 지원하여 음질을 유지하면서 파일 크기를 효율적으로 줄일 수 있다. VBR은 오디오의 복잡한 부분에는 높은 비트 전송률을 사용하고, 단순한 부분에는 낮은 비트 전송률을 사용하여 전체적인 파일 크기를 줄이는 방식이다.

3. 2. 파일 구조

HeaderCRC사이드 인포메이션
Side information메인 데이터
Main Data부가 데이터
Ancillary Data



MP3 파일에는 메타데이터를 저장하기 위한 태그가 포함될 수 있다. 주요 태그 형식은 다음과 같다.

8 byteTAGTitle30 bytestyle="color:white; background-color:orange; width:60px;" |style="color:white; background-color:orange; width:60px;" |style="color:white; background-color:orange; width:60px;" |
16 bytestyle="color:white; background-color:orange; width:60px;" |style="color:white; background-color:orange; width:60px;" |style="color:white; background-color:orange; width:60px;" |style="color:white; background-color:orange; width:60px;" |style="color:white; background-color:orange; width:60px;" |style="color:white; background-color:orange; width:60px;" |style="color:white; background-color:orange; width:60px;" |style="color:white; background-color:orange; width:60px;" |
24 bytestyle="color:white; background-color:orange; width:60px;" |style="color:white; background-color:orange; width:60px;" |style="color:white; background-color:orange; width:60px;" |style="color:white; background-color:orange; width:60px;" |style="color:white; background-color:orange; width:60px;" |style="color:white; background-color:orange; width:60px;" |style="color:white; background-color:orange; width:60px;" |style="color:white; background-color:orange; width:60px;" |
32 bytestyle="color:white; background-color:orange; width:60px;" |style="color:white; background-color:orange; width:60px;" |style="color:white; background-color:orange; width:60px;" |style="color:white; background-color:orange; width:60px;" |style="color:white; background-color:orange; width:60px;" |style="color:white; background-color:orange; width:60px;" |style="color:white; background-color:orange; width:60px;" |style="color:white; background-color:orange; width:60px;" |
40 bytestyle="color:white; background-color:orange; width:60px;" |Artist30 bytestyle="color:white; background-color:yellow; width:60px;" |style="color:white; background-color:yellow; width:60px;" |style="color:white; background-color:yellow; width:60px;" |style="color:white; background-color:yellow; width:60px;" |style="color:white; background-color:yellow; width:60px;" |
48 bytestyle="color:white; background-color:yellow; width:60px;" |style="color:white; background-color:yellow; width:60px;" |style="color:white; background-color:yellow; width:60px;" |style="color:white; background-color:yellow; width:60px;" |style="color:white; background-color:yellow; width:60px;" |style="color:white; background-color:yellow; width:60px;" |style="color:white; background-color:yellow; width:60px;" |style="color:white; background-color:yellow; width:60px;" |
56 bytestyle="color:white; background-color:yellow; width:60px;" |style="color:white; background-color:yellow; width:60px;" |style="color:white; background-color:yellow; width:60px;" |style="color:white; background-color:yellow; width:60px;" |style="color:white; background-color:yellow; width:60px;" |style="color:white; background-color:yellow; width:60px;" |style="color:white; background-color:yellow; width:60px;" |style="color:white; background-color:yellow; width:60px;" |
64 bytestyle="color:white; background-color:yellow; width:60px;" |style="color:white; background-color:yellow; width:60px;" |style="color:white; background-color:yellow; width:60px;" |style="color:white; background-color:yellow; width:60px;" |style="color:white; background-color:yellow; width:60px;" |style="color:white; background-color:yellow; width:60px;" |style="color:white; background-color:yellow; width:60px;" |Album
72 byte30 bytestyle="color:white; background-color:green; width:60px;" |style="color:white; background-color:green; width:60px;" |style="color:white; background-color:green; width:60px;" |style="color:white; background-color:green; width:60px;" |style="color:white; background-color:green; width:60px;" |style="color:white; background-color:green; width:60px;" |style="color:white; background-color:green; width:60px;" |
80 bytestyle="color:white; background-color:green; width:60px;" |style="color:white; background-color:green; width:60px;" |style="color:white; background-color:green; width:60px;" |style="color:white; background-color:green; width:60px;" |style="color:white; background-color:green; width:60px;" |style="color:white; background-color:green; width:60px;" |style="color:white; background-color:green; width:60px;" |style="color:white; background-color:green; width:60px;" |
88 bytestyle="color:white; background-color:green; width:60px;" |style="color:white; background-color:green; width:60px;" |style="color:white; background-color:green; width:60px;" |style="color:white; background-color:green; width:60px;" |style="color:white; background-color:green; width:60px;" |style="color:white; background-color:green; width:60px;" |style="color:white; background-color:green; width:60px;" |style="color:white; background-color:green; width:60px;" |
96 bytestyle="color:white; background-color:green; width:60px;" |style="color:white; background-color:green; width:60px;" |style="color:white; background-color:green; width:60px;" |style="color:white; background-color:green; width:60px;" |style="color:white; background-color:green; width:60px;" |Year4 bytestyle="color:white; background-color:blue; width:60px;" |
104 bytestyle="color:white; background-color:blue; width:60px;" |Comment30 bytestyle="color:white; background-color:purple; width:60px;" |style="color:white; background-color:purple; width:60px;" |style="color:white; background-color:purple; width:60px;" |style="color:white; background-color:purple; width:60px;" |style="color:white; background-color:purple; width:60px;" |
112 bytestyle="color:white; background-color:purple; width:60px;" |style="color:white; background-color:purple; width:60px;" |style="color:white; background-color:purple; width:60px;" |style="color:white; background-color:purple; width:60px;" |style="color:white; background-color:purple; width:60px;" |style="color:white; background-color:purple; width:60px;" |style="color:white; background-color:purple; width:60px;" |style="color:white; background-color:purple; width:60px;" |
120 bytestyle="color:white; background-color:purple; width:60px;" |style="color:white; background-color:purple; width:60px;" |style="color:white; background-color:purple; width:60px;" |style="color:white; background-color:purple; width:60px;" |style="color:white; background-color:purple; width:60px;" |style="color:white; background-color:purple; width:60px;" |style="color:white; background-color:purple; width:60px;" |style="color:white; background-color:purple; width:60px;" |
128 bytestyle="color:white; background-color:purple; width:60px;" |style="color:white; background-color:purple; width:60px;" |style="color:white; background-color:purple; width:60px;" |style="color:white; background-color:purple; width:60px;" |style="color:white; background-color:purple; width:60px;" |style="color:white; background-color:purple; width:60px;" |style="color:white; background-color:purple; width:60px;" |Genre



MP3 파일은 일반적으로 다음과 같은 구조를 가진다.

ID3v2AAUAAU...AAUAPE TagsLyrics3v2ID3v1



여기서 AAU(Audio Access Unit)는 실제 음향 데이터를 담고 있는 블록이다. ID3v2 태그는 선택적으로 여러 개가 들어갈 수 있다.

MP3 표준은 메타데이터 태그 형식을 정의하지 않지만, 일반적으로 ID3v1, ID3v2, APEv2 태그 등이 사용된다. 이러한 태그는 MP3 프레임 데이터와는 별도로 파일의 시작 또는 끝에 위치하며, MP3 디코더는 이를 무시하거나 정보를 추출한다.

3. 3. 파일 구조 상세

MP3 파일은 헤더와 데이터 블록으로 구성된 MP3 프레임으로 구성된다. 이 프레임 시퀀스를 기본 스트림이라고 한다. 프레임은 "비트 저장소" 때문에 독립적인 항목이 아니며 임의의 프레임 경계에서 추출할 수 없는 경우가 많다. MP3 데이터 블록에는 주파수 및 진폭 측면에서 (압축된) 오디오 정보가 포함되어 있다.

MP3 파일 구조 다이어그램 (여기에 설명되지 않은 MPEG 버전 2.5는 동기화 워드의 마지막 비트를 "0"으로 변경하여 표시하며, 실제로 한 비트를 버전 필드로 이동한다.)


MP3 헤더는 유효한 프레임의 시작을 식별하는 데 사용되는 동기화 워드로 구성되어 있다. 그 다음에는 이것이 MPEG 표준임을 나타내는 비트와 레이어 3이 사용됨을 나타내는 두 개의 비트가 이어지는데, 이는 MPEG-1 오디오 레이어 3, 즉 MP3를 의미한다. 이후 값은 MP3 파일에 따라 달라진다. ''ISO/IEC 11172-3''은 헤더의 각 섹션에 대한 값 범위를 헤더 사양과 함께 정의한다.

오늘날 대부분의 MP3 파일에는 MP3 프레임 앞이나 뒤에 ID3 메타데이터가 포함되어 있다. 데이터 스트림에는 선택적 체크섬이 포함될 수 있다. 조인트 스테레오는 프레임 단위로만 수행된다.

3. 3. 1. AAU

HeaderCRC사이드 인포메이션
Side information메인 데이터
Main Data부가 데이터
Ancillary Data



AAU의 길이는 다음과 같다.

: AAU's size = 144 * bitrate / frequency + paddingbit (byte)

만약 비트 레이트가 448000 bit/s이고 주파수가 48000 Hz, 패딩 비트가 on(true 또는 1)이라면 AAU's size = 144 * 448000 / 48000 + 1 = 1345 byte가 된다.

비트레이트와 주파수, 패딩 비트 정보는 헤더로부터 가져올 수 있다.

3. 3. 2. APE Tag

APE 태그는 가수, 앨범명, 곡 제목 등의 메타데이터를 추가하기 위한 태그 포맷이다. 2010년 기준으로 가장 널리 사용되는 태그 형식은 ID3v1 및 ID3v2이며, 최근에 도입된 APEv2가 있다. 이러한 태그는 일반적으로 MP3 파일의 시작 또는 끝에 실제 MP3 프레임 데이터와 별도로 포함된다. MP3 디코더는 태그에서 정보를 추출하거나 무시 가능한 비 MP3 정크 데이터로 취급한다.

3. 3. 3. Lyrics3v2

Lyrics3v2 태그는 가사와 노래 정보등을 담기 위한 태그 포맷이다. 오디오 파일의 "태그"는 파일 내용에 대한 제목, 아티스트, 앨범, 트랙 번호 또는 기타 메타데이터와 같은 정보를 담고 있는 파일의 일부이다. MP3 표준은 MP3 파일에 대한 태그 형식을 정의하지 않으며, 메타데이터를 지원하고 태그의 필요성을 없앨 수 있는 표준 컨테이너 형식도 없다. 그러나 몇 가지 ''사실상의'' 태그 형식 표준이 존재한다. 2010년 기준으로 가장 널리 사용되는 것은 ID3v1 및 ID3v2이며, 최근에 도입된 APEv2이다. 이러한 태그는 일반적으로 실제 MP3 프레임 데이터와 별도로 MP3 파일의 시작 또는 끝에 포함된다. MP3 디코더는 태그에서 정보를 추출하거나 무시 가능한 비 MP3 정크 데이터로 취급한다.

재생 및 편집 소프트웨어에는 태그 편집 기능이 포함되어 있는 경우가 많지만, 이 목적으로 사용되는 태그 편집기 응용 프로그램도 있다. 오디오 콘텐츠에 대한 메타데이터 외에도 태그는 DRM에도 사용할 수 있다. ReplayGain은 MP3 파일의 음량(오디오 정규화)을 메타데이터 태그에 측정하고 저장하는 표준으로, ReplayGain 호환 플레이어가 각 파일에 대한 전체 재생 볼륨을 자동으로 조정할 수 있도록 한다. MP3Gain은 ReplayGain 측정을 기반으로 파일을 되돌릴 수 있게 수정하여 ReplayGain 기능이 없는 플레이어에서도 조정된 재생을 수행할 수 있도록 할 수 있다.

3. 3. 4. ID3v1

MP3 파일의 맨 끝에 존재하며 128바이트 길이의 태그이다. "TAG"라는 문자열로 시작하여 쉽게 찾을 수 있다.

바이트내용
1-3"TAG" 문자열
4-33제목 (30바이트)
34-63아티스트 (30바이트)
64-93앨범 (30바이트)
94-97연도 (4바이트)
98-127코멘트 (30바이트)
128장르 (1바이트)


3. 4. 음질

MP3 파일의 음질은 비트레이트로 지정되는 초당 킬로비트(kbit/s) 수와 인코더 알고리즘의 품질, 그리고 인코딩되는 신호의 복잡성에 따라 달라진다.[69] 일반적으로 비트 전송률이 높을수록 음질이 좋아지고 MP3 파일 크기도 커진다. 반대로 비트 전송률이 낮으면 파일 크기는 작아지지만 압축 아티팩트 (원본에 없는 소리)가 들릴 수 있다.

MP3 표준은 인코딩 알고리즘에 대해 상당한 자유를 허용하므로, 인코더마다 동일한 비트 전송률에서도 음질 차이가 발생할 수 있다. 예를 들어, 약 128 kbit/s로 설정된 초기 MP3 인코더 두 개를 비교한 공개 청취 테스트에서 한 인코더는 3.66점(5점 만점), 다른 인코더는 2.22점을 받았다. 이처럼 음질은 인코더와 인코딩 설정에 따라 달라진다.

고정 비트 전송률 (CBR) 방식은 전체 파일에 동일한 비트 전송률을 사용하는 반면, 가변 비트 전송률 (VBR) 방식은 파일 내에서 압축하기 쉬운 부분에는 낮은 비트 전송률을, 압축하기 어려운 부분에는 높은 비트 전송률을 사용하여 전체적인 파일 크기를 최적화한다.

박수 소리나 트라이앵글 소리와 같이 무작위성이 높고 날카로운 소리는 압축하기 어려워 낮은 비트 전송률에서 링잉이나 프리 에코 같은 압축 아티팩트가 발생하기 쉽다. 하지만, MP3 형식이 기반으로 하는 Layer II의 32 서브 밴드 필터뱅크의 시간 마스킹 기능 덕분에 타악기 소리에 의해 생성된 아티팩트는 거의 감지할 수 없다.

인식되는 음질은 청취 환경, 청취자의 주의력, 훈련 정도, 오디오 장비(사운드 카드, 스피커, 헤드폰) 등에 영향을 받는다. 스탠퍼드 대학교의 조나단 버거 교수는 학생들이 MP3 음질에 대한 선호도가 매년 증가하는 것을 발견했는데, 학생들은 MP3가 음악에 더하는 '지글거리는' 소리를 선호하는 경향을 보였다.

MP3 인코딩 시 16kHz 부근에서 저역 통과 필터(LPF)를 적용하는 경우가 많은데, 이는 형식상의 제약으로 인해 고주파 성분 기록에 많은 데이터가 필요하기 때문이다.[57] 높은 비트 전송률에서는 고주파 성분 기록에 여유가 생기므로, 비트 전송률에 따라 LPF의 컷오프 주파수를 변경하는 인코더가 많다.

4. 사회적 영향

MP3의 등장은 전 세계적으로 음악 산업에 큰 변화를 가져왔다. 1990년대 후반, MP3 파일은 인터넷을 통해 널리 퍼져나갔으며, 이는 종종 불법 복제된 노래 네트워크를 통해서 이루어졌다.[26][27][28][29] 1997년 11월, mp3.com은 독립 아티스트가 제작한 수천 개의 MP3를 무료로 제공하며 이러한 흐름을 가속화했다.

MP3 파일의 작은 크기는 CD에서 리핑한 음악의 광범위한 파일 공유를 가능하게 했으며, 이는 이전에는 거의 불가능했던 일이었다. 최초의 대규모 P2P 파일 공유 네트워크인 냅스터는 1999년에 출시되어 이러한 현상을 더욱 심화시켰다. MP3를 쉽게 만들고 공유할 수 있게 되면서 광범위한 저작권 침해가 발생했고, 주요 음반 회사는 이를 "음악 불법 복제"라고 부르며 냅스터와 파일 공유에 참여한 개인 사용자들을 상대로 소송을 제기했다.

그러나 무단 MP3 파일 공유는 차세대 P2P 파일 공유 네트워크에서 계속되었고, 동시에 Beatport, Bleep, Juno Records, eMusic 등과 같은 정식 서비스들이 MP3 형식의 제한 없는 음악을 판매하기 시작했다.

MP3는 인코딩·디코딩 소프트웨어를 무료로 입수 할 수 있다는 점도 널리 보급된 요인 중 하나이다. 1998년 이후에는 독일프라운호퍼 협회프랑스의 톰슨사가 라이센스의 보유를 주장하고 있지만, 자유 소프트웨어 라이센스로 제공되는 LAME 등의 무료 인코더나 Windows Media Player 등의 무료 재생 소프트웨어를 입수할 수 있었기 때문에 보급을 방해하지 않았다.

MP3는 음성 주파수 대역에서 극심한 음질 저하 없이 압축이 가능하여, 음악을 CD 등의 음원 매체에서 개인용 컴퓨터 (PC) 의 하드 디스크 드라이브 (HDD) 로 가져오는 용도로 널리 보급되었다. 또한, 보이스 레코더에서도 산요 전기 등 이전부터 MP3 형식으로 녹음 가능한 기종이 출시되었던 제조사 외에도, 파나소닉이나 소니제 보이스 레코더에서도 범용성 등의 관점에서 MP3 형식으로 녹음 가능한 기종이 나오기 시작했다.

2017년 4월 23일, 프라운호퍼 IIS 및 테크니컬러(구 톰슨)에 의한 MP3 라이선스 프로그램이 기본 특허의 존속 기간 만료로 종료되었다[52][53] 이에 따라, 이들 특허가 커버해 온 MP3의 기본 기술은 퍼블릭 도메인이 되었다.

4. 1. 대한민국에서의 MP3

MP3영어는 대한민국의 기술 발전과 밀접한 관련이 있는 디지털 오디오 형식이다. 대한민국은 1998년에 세계 최초의 휴대용 MP3영어 플레이어 MPMan을 출시하며 이 분야의 선두 주자로 나섰다. 이는 디지털 음악 시장의 혁신을 이끌었으며, 소비자들은 이전보다 훨씬 간편하게 음악을 즐길 수 있게 되었다.

하지만 MP3영어의 등장은 음악 불법 복제라는 새로운 문제를 야기했다. 냅스터와 같은 P2P 파일 공유 네트워크의 등장은 저작권 침해 문제를 심화시켰고, 음반 산업에 큰 타격을 입혔다. 특히, 소리바다와 같은 서비스는 불법 음원 공유 논란의 중심에 있었다. 이러한 상황은 저작권자와 소비자, 그리고 기술 제공자 간의 복잡한 법적 분쟁으로 이어졌다.

그럼에도 불구하고, MP3영어 기술은 대한민국에서 지속적으로 발전해왔다. 인터넷을 통한 음악 배포가 활성화되면서, Beatport, Bleep, Juno Records, eMusic 등과 같은 합법적인 음악 판매 서비스가 등장하여 소비자들에게 다양한 선택지를 제공하고 있다.

5. 관련 특허 및 법적 문제

MP3 기술과 관련된 특허는 여러 회사와 기관에 의해 복잡하게 얽혀 있었다. 프라운호퍼 협회테크니컬러(구 톰슨)는 MP3 특허 라이선스를 관리하며 수익을 얻었다.[52][53] 과거 알카텔-루슨트마이크로소프트 간의 특허 소송은 MP3 관련 법적 분쟁의 대표적인 사례이다.

2017년 4월 23일 MP3 관련 기본 특허의 존속 기간이 만료되면서 MP3 기술은 퍼블릭 도메인이 되었다.[52][53] 이에 따라 MP3의 기본 기술은 자유롭게 사용할 수 있게 되었다.

6. 대체 기술

MP3의 대체 기술로는 AAC, WMA, Vorbis, 오푸스 등 다양한 오디오 압축 형식이 존재한다. AAC는 MP3의 후속 형식으로 개발되었으며, 더 높은 압축 효율을 제공한다. AAC, WMA Pro, Vorbis, Opus와 같은 최신 오디오 압축 형식은 MP3 형식에 내재된 일부 제한이 없어, 어떤 MP3 인코더로도 극복할 수 없는 문제를 해결한다.[50]

mp3PRO, MP2와 같은 다른 손실 압축 형식도 존재한다. 이들은 MP3와 동일한 기술 계열에 속하며, 대략 유사한 심리음향 모델과 MDCT 알고리즘에 의존한다. MP3는 MDCT와 FFT의 하이브리드 코딩 방식을 사용하는 반면, AAC는 순수 MDCT를 사용하여 압축 효율을 상당히 향상시킨다.

오푸스 및 Vorbis와 같은 오픈 압축 형식도 있으며, 이는 무료로 제공되며 알려진 특허 제한이 없다.

손실 압축 방식 외에도, 무손실 형식은 MP3의 중요한 대안이며, 손실 압축에 비해 파일 크기가 증가하지만, 변경되지 않은 오디오 콘텐츠를 제공한다. 무손실 형식에는 FLAC (Free Lossless Audio Codec), 애플 무손실 등이 있다.

참조

[1] 웹사이트 The mp3 team https://www.mp3-hist[...] 2020-06-12
[2] 서적 Proceedings of the first ACM international conference on Multimedia - MULTIMEDIA '93 Association for Computing Machinery 2021-12-15
[3] 웹사이트 MP3 technology at Fraunhofer IIS https://www.iis.frau[...] 2020-06-12
[4] 간행물 MP3 (MPEG Layer III Audio Encoding) https://www.loc.gov/[...] Library of Congress 2021-12-01
[5] 웹사이트 '73. "Father" of the MP3, Karlheinz Brandenburg' https://www.youtube.[...] 2023-01-02
[6] 웹사이트 On the 20th Birthday of the MP3, An Interview With The "Father" of the MP3, Karlheinz Brandenburg https://www.internet[...] 2023-01-02
[7] 웹사이트 MP3 (MPEG Layer III Audio Encoding) https://www.loc.gov/[...] The Library of Congress 2017-07-27
[8] 서적 Acoustics, Information, and Communication: Memorial Volume in Honor of Manfred R. Schroeder Springer 2014
[9] 논문 A History of Realtime Digital Speech on Packet Networks: Part II of Linear Predictive Coding and the Internet Protocol https://ee.stanford.[...] 2019-07-14
[10] 서적 ICASSP '78. IEEE International Conference on Acoustics, Speech, and Signal Processing 1978
[11] 웹사이트 Digital Encoding of Speech Based on the Perceptual Requirement of the Auditory System (Technical Report 535) https://apps.dtic.mi[...] 1979-06-18
[12] 논문 How I Came Up With the Discrete Cosine Transform https://www.scribd.c[...] 2019-11-19
[13] Citation Discrete Cosine Transform 1974-01
[14] Citation Discrete Cosine Transform: Algorithms, Advantages, Applications Academic Press
[15] 문서 "Subband/transform coding using filter bank designs based on time domain aliasing cancellation" 1987
[16] 문서 Analysis/synthesis filter bank design based on time domain aliasing cancellation 1986
[17] 웹사이트 The Use of FFT and MDCT in MP3 Audio Compression http://www.math.utah[...] 2019-07-14
[18] 문서 Genesis of the MP3 Audio Coding Standard in IEEE Transactions on Consumer Electronics 2006-08
[19] 문서 A MUSICAM source codec for Digital Audio Broadcasting and storage 1991-05
[20] 웹사이트 A DAB commentary from Alan Box, EZ communication and chairman NAB DAB task force http://www.americanr[...]
[21] 서적 EBU SQAM CD Sound Quality Assessment Material recordings for subjective tests https://tech.ebu.ch/[...] 2017-02-08
[22] 서적 How Music Got Free: The End of an Industry, the Turn of the Century, and the Patient Zero of Piracy Penguin Books
[23] 문서 Digital Video and Audio Broadcasting Technology: A Practical Engineering Guide (Signals and Communication Technology)
[24] 웹사이트 The MP3: A History Of Innovation And Betrayal https://www.npr.org/[...] 2011-03-23
[25] 서적 A high-quality sound coding standard for broadcasting, telecommunications and multimedia systems. Elsevier Science BV
[26] 웹사이트 The heavenly jukebox https://www.theatlan[...] 2000
[27] 웹사이트 Pop Idols and Pirates: Mechanisms of Consumption and the Global Circulation ... https://books.google[...]
[28] 웹사이트 'Technologies of Piracy? - Exploring the Interplay Between Commercialism and Idealism in the Development of MP3 and DivX' http://ijoc.org/inde[...]
[29] 웹사이트 https://web.archive.[...]
[30] 웹사이트 About Internet Underground Music Archive https://archive.org/[...]
[31] 웹사이트 Winamp is back after revamp; nostalgia-inducing looks intact https://cybernews.co[...] 2023-12-08
[32] 웹사이트 LAME Technical FAQ https://lame.sourcef[...] 2023-12-09
[33] 서적 DSP - The Technology Behind Multimedia
[34] 웹사이트 Guide to command line options (in CVS) http://lame.cvs.sour[...] 2010-08-04
[35] 웹사이트 JVC RC-EX30 operation manual http://resources.jvc[...] 2004
[36] 웹사이트 DV-RW250H Operation-Manual GB https://www.sharp.co[...] 2004
[37] 웹사이트 Sound Quality Comparison of Hi-Res Audio vs. CD vs. MP3 https://www.sony.com[...] Sony 2020-08-11
[38] 웹사이트 lame(1): create mp3 audio files - Linux man page https://linux.die.ne[...] 2020-08-22
[39] 웹사이트 Linux Manpages Online - man.cx manual pages https://man.cx/lame 2020-08-22
[40] 웹사이트 Method and apparatus for encoding digital signals employing bit allocation using combinations of different threshold models to achieve desired bit rates https://patents.goog[...] 2023-01-21
[41] 웹사이트 mp3licensing.com – Patents http://mp3licensing.[...] 2008-05-10
[42] 웹사이트 Full MP3 support coming soon to Fedora https://fedoramagazi[...] 2017-05-05
[43] 웹사이트 SISVEL's MPEG Audio licensing programme http://www.sisvel.co[...] 2017-02-08
[44] 웹사이트 US MPEG Audio patents http://www.sisvel.co[...] Sisvel 2017-04-07
[45] 웹사이트 Licensing Programs - Legacy programs https://www.sisvel.c[...] 2023-09-15
[46] 웹사이트 Via Licensing Announces Updated AAC Joint Patent License https://www.business[...] 2009-01-05
[47] 웹사이트 AAC Licensors http://www.via-corp.[...] 2019-07-06
[48] 뉴스 NEWS WATCH; New Player from Sony Will Give a Nod to MP3 https://www.nytimes.[...] 1999-09-30
[49] 웹사이트 Sony NW-E105 Network Walkman https://www.cnet.com[...] 2020-09-24
[50] conference High-Quality, Low-Delay Music Coding in the Opus Codec 2013-10
[51] 웹사이트 What is mp3? https://www.mp3-hist[...] 2020-03-20
[52] 뉴스 MP3は本当に「死んだ」のか? 特許権消滅が意味するもの https://www.itmedia.[...] ITmedia 2017-05-29
[53] 웹사이트 Alive and Kicking – mp3 Software, Patents and Licenses https://www.audioblo[...] Fraunhofer IIS 2017-05-18
[54] 문서 https://datatracker.[...]
[55] 문서 https://datatracker.[...]
[56] 문서 https://datatracker.[...]
[57] 문서 Scalefactor band 21 problem http://www.mp3-tech.[...]
[58] 웹사이트 mp3ファイルの構造 http://www.cactussof[...] 2020-08-08
[59] 문서 MP4 _ 用語集 _ KDDI株式会社 2015-11-16
[60] 뉴스 Thomson、MP3のロスレスフォーマット「mp3HD」を発表 https://av.watch.imp[...] Impress AV Watch 2009-03-26
[61] conference OCF: Coding High Quality Audio with Data Rates of 64 kbit/s http://www.aes.org/e[...] 1988-11-03
[62] 웹사이트 mp3 https://www.iis.frau[...] フラウンホーファー 2017-04-23
[63] 웹사이트 "「MP3は死んだ」海外が報道 えっ、どういうこと?" https://www.huffingt[...] The Huffington Post Japan, Ltd. 2017-05-13
[64] 웹인용 The audio/mpeg Media Type — RFC 3003 http://tools.ietf.or[...] IETF 2000-11
[65] 웹인용 MIME Type Registration of RTP Payload Formats — RFC 3555 http://tools.ietf.or[...] IETF 2003-07
[66] 웹인용 A More Loss-Tolerant RTP Payload Format for MP3 Audio — RFC 5219 http://tools.ietf.or[...] IETF 2008-02
[67] 문서 MPEG-2 AudioBC (Backward Compatible)이 정식 명칭이다.
[68] 문서 MPEG-2 AudioBC (Backward Compatible)이 정식 명칭이다.
[69] 문서 http://blog.bjrn.se/[...]
[70] 문서 http://www.codeproje[...]
[71] 웹인용 MPEG Audio Frame Header - CodeProject https://www.codeproj[...] 2018-03-22
[72] 웹사이트 http://www.multiweb.[...]
[73] 논문 MP3 DECODER in Theory and Practice http://citeseerx.ist[...]
[74] 웹사이트 http://www.cs.columb[...]



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com