맨위로가기

MPEG-4

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
목차

1. 개요

MPEG-4는 1999년에 규격화된 멀티미디어 코딩 표준으로, 동영상 및 오디오 압축, 객체 지향 기능, 디지털 권한 관리 등을 지원한다. MPEG-1과 MPEG-2의 기능을 흡수하고, 3D 렌더링을 위한 VRML 지원, 객체 지향 복합 파일, 디지털 권한 관리 등을 추가했다. MPEG-4는 여러 파트로 나뉘며, MPEG-4 Part 2(DivX, Xvid 등 코덱)와 MPEG-4 Part 10(H.264/AVC, x264 등)이 주요 파트이다. 낮은 비트 전송률 비디오 통신을 목표로 시작되었으나, 멀티미디어 코딩 표준으로 범위가 확장되어 다양한 비트 전송률에서 효율적인 코딩, 혼합 미디어 데이터 인코딩, 오류 복원력, 시청각 장면 상호 작용 등의 기능을 제공한다. 2010년대 후반부터는 H.265, AV1과 같은 후속 및 대체 표준으로의 전환이 이루어지고 있다.

더 읽어볼만한 페이지

  • MPEG-4 - H.264/MPEG-4 AVC
    H.264/MPEG-4 AVC는 ITU-T와 ISO/IEC가 공동 개발한 비디오 코딩 표준으로, 높은 압축 효율과 다양한 기능을 제공하며, 블루레이 디스크, HD DVD 등에서 필수적인 비디오 압축 형식으로 사용된다.
  • MPEG-4 - HE-AAC
    HE-AAC는 낮은 비트 전송률에서 효율적인 오디오 압축을 제공하며, SBR 및 PS 기술을 사용하여 음질을 향상시키는 AAC-LC 기반의 코덱으로, 다양한 버전이 존재하며 여러 분야에서 활용된다.
  • MPEG - ATSC
    ATSC는 디지털 텔레비전 방송 표준을 개발하는 미국 기관으로, 1996년 ATSC 1.0 표준이 채택된 후 H.264 코덱을 지원하는 개정판이 승인되었으며, 미국을 비롯한 여러 국가에서 디지털 방송 전환에 사용되었으나 특허 문제와 기술적 한계, 국가별 적용 차이 등의 이슈가 있고, 최근에는 ATSC 3.0이 개발되어 도입되고 있다.
  • MPEG - MPEG-1 오디오 레이어 II
    MPEG-1 오디오 레이어 II (MP2)는 디지털 오디오 압축 표준으로, 디지털 오디오 방송, 디지털 멀티미디어 방송, 디지털 비디오 방송 등 다양한 분야에서 사용되며, MUSICAM 오디오 코덱을 기반으로 하고, MP3와 비교하여 시간 해상도가 높고 오류에 대한 강인성이 강한 특징을 가진다.
  • ISO/IEC 표준 - 프로젝트 관리
    프로젝트 관리는 제한된 자원 내에서 특정 목표를 달성하기 위해 상호 연관된 작업들을 계획, 실행, 모니터링 및 종료하는 일시적인 활동으로, 범위, 시간, 비용, 품질, 리스크 관리가 중요하며, 프로젝트 관리자는 표준 및 방법론을 활용하여 프로젝트의 성공을 책임진다.
  • ISO/IEC 표준 - ISO/IEC 646
    ISO/IEC 646는 ASCII 기반의 7비트 문자 인코딩 표준으로, 국가별 변형이 존재했으나, 최종 개정판은 ASCII와 호환되도록 정의되었고, 현재는 ITU-T 권고 T.50 IRA가 현행 표준으로 유지되고 있다.
MPEG-4
기본 정보
MPEG-4 로고
MPEG-4 로고
종류비디오 부호화 표준
개발 및 관리ISO/IEC JTC1/SC29/WG11 (MPEG 그룹)
확장자.mp4
.m4a
.m4v
MIME 형식video/mp4
audio/mp4
application/mp4
기술 정보
부호화 종류손실 압축
컨테이너 포맷ISO 기본 미디어 파일 포맷
특징객체 기반 부호화
확장성
다양한 프로파일 및 레벨 지원
역사
최초 발표1998년
표준화 기관ISO 와 IEC
주요 프로파일
단순 프로파일 (Simple Profile)기본적인 부호화 기능 제공
고급 단순 프로파일 (Advanced Simple Profile)B-프레임, 전역 움직임 보상 등 추가 기능 제공
고급 오디오 부호화 (Advanced Audio Coding, AAC)고음질 오디오 부호화
고급 비디오 부호화 (Advanced Video Coding, AVC/H.264)높은 압축 효율성
관련 기술
기반 기술DCT (Discrete Cosine Transform), 움직임 예측/보상
파생 기술H.264/MPEG-4 AVC, H.265/HEVC
활용 분야
사용 분야인터넷 스트리밍
디지털 방송
휴대용 기기
비디오 게임
기타
참고 표준MPEG-1, MPEG-2, H.263
관련 단체ITU-T (Video Coding Experts Group)

2. 역사

1999년에 MPEG-4 규격이 제정된 직후, 디지털 카메라에서 동영상을 장시간 기록하는 용도로 사용되기 시작했다. 초기에는 파일 포맷이 규격화되지 않아 마이크로소프트의 ASF 파일 포맷이 사용되었다. 이후 제3세대 휴대 전화의 동영상 포맷으로 채택되었고, PDA를 포함한 모바일 동영상 재생기에서 주요 포맷으로 자리잡았다.

방송 및 통신 분야에서는 사용권 문제로 인해 초기에는 활용 사례가 적었다. 그러나 MPEG-4 AVC (H.264)가 일본 지상파 디지털 방송의 휴대 단말기용 1세그먼트 방송을 비롯한 여러 모바일 방송 표준으로 채택되고, 블루레이 디스크 및 HD DVD의 비디오 코덱으로 승인되면서 응용 사례가 증가하기 시작했다.

2010년대 후반부터는 H.265와 같은 후속 표준 및 AV1과 같은 대체 표준으로의 점진적인 전환이 이루어지고 있다.

2. 1. 개발 배경

1999년에 표준화된 직후부터 디지털 카메라의 동영상 장시간 기록 기능으로 사용되었다. 처음에는 파일 형식이 표준화되지 않아 마이크로소프트사의 ASF 파일 형식이 사용되었다. 최근에는 제3세대 이동 전화의 동영상 형식으로 채택되어 PDA를 포함한 모바일 동영상 형식의 주류가 되어가고 있다. 특히 아이팟PSP가 이 형식에 대응하면서 폭발적으로 보급되었다. 이러한 동영상 부호화 기술은 현재 MPEG-4 Part 2이지만, 2000년 중반부터 MPEG-4 AVC도 사용되었다.

처음에는 방송 및 통신 분야에서 라이선스 문제로 인해 주요 사용 사례가 적었지만, MPEG-4 AVC(H.264)가 지상파 디지털 방송의 휴대 단말기용(1세그먼트) 방송에서 채택되고, 블루레이 디스크 및 HD DVD의 비디오 코덱으로 승인되는 등 2020년대에 이르기까지 폭넓게 응용되었다.

2010년대 후반부터 H.265와 같은 후속 표준 및 AV1과 같은 대체 표준에 의한 교체가 서서히 진행되고 있다.

2. 2. 표준화 과정

1999년에 표준화된 직후부터 동영상을 장시간 기록하는 용도로 디지털 카메라에 사용되었다. 당초에는 파일 포맷이 규격화되어 있지 않았기 때문에 마이크로소프트사의 ASF 파일 포맷이 사용되었다. 근래에는 제3세대 휴대 전화의 동영상 포맷으로서 채용되고 PDA를 포함한 모바일 동영상 재생기의 주요 포맷이 되고 있다. 특히 아이팟PSP가 이 형식에 대응하면서 폭발적으로 보급되었다. 이러한 동영상 부호화 기술은 현재 MPEG-4 Part 2이지만, 2000년 중반부터 MPEG-4 AVC도 사용되었다.

처음에는 방송 및 통신 분야에서 라이선스 문제로 인해 주요 사용 사례가 적었지만, MPEG-4 AVC(H.264)가 일본 지상파 디지털 방송의 휴대 단말기용(1세그먼트) 방송에서 채택되고, 블루레이 디스크 및 HD DVD의 비디오 코덱으로 승인되는 등 2020년대에 이르기까지 폭넓게 응용되었다.

2010년대 후반부터 H.265와 같은 후속 표준 및 AV1과 같은 대체 표준에 의한 교체가 서서히 진행되고 있다.

2. 3. 한국에서의 MPEG-4

1999년에 표준화된 직후부터 동영상을 장시간 기록하는 용도로 디지털 카메라의 기능으로 사용되었다. 처음에는 파일 형식이 표준화되지 않아 마이크로소프트사의 ASF 파일 형식이 사용되었다. 최근에는 제3세대 이동 전화의 동영상 형식으로 채택되어 PDA를 포함한 모바일 동영상 형식의 주류가 되어가고 있다. 특히 아이팟PSP가 이 형식에 대응하면서 폭발적으로 보급되었다. 이러한 동영상 부호화 기술은 현재 MPEG-4 Part 2이지만, 2000년 중반부터 MPEG-4 AVC도 사용되었다.

처음에는 방송 및 통신 분야에서 라이선스 문제로 인해 주요 사용 사례가 적었지만, MPEG-4 AVC(H.264)가 지상파 디지털 방송의 휴대 단말기용(1세그먼트) 방송에서 채택되고, 블루레이 디스크 및 HD DVD의 비디오 코덱으로 승인되는 등 2020년대에 이르기까지 폭넓게 응용되었다.

3. MPEG-4의 구성 (파트)

MPEG-4는 '파트'라고 불리는 여러 표준으로 구성되어 있다. 각 파트는 MPEG-4 표준의 특정 부분을 다루며, 동영상, 음향, 시스템, 적합성 테스트 등 다양한 멀티미디어 부호화 형식을 규정한다.

MPEG-4 파트[4][5]
파트번호최초 공개일 (초판)최신 공개일 (최신판)최신 수정본제목설명
파트 1ISO/IEC 14496-1[6]19992010[7]2014[8]시스템비디오와 오디오의 동기화 및 다중화에 대해 설명한다.
파트 2ISO/IEC 14496-2[14]19992004[15]2009비주얼시각 데이터(비디오, 정지 텍스처, 합성 이미지 등)를 위한 압축 형식으로, ASP(고급 단순 프로파일)을 포함한다.
파트 3ISO/IEC 14496-3[16]19992009[17]2017[18]오디오지각적 코딩을 위한 오디오 신호 압축 형식 집합으로, AAC의 변형과 다른 오디오/음성 코딩 형식 및 도구를 포함한다.
파트 4ISO/IEC 14496-4[19]20002004[20]2016적합성 테스트표준의 다른 파트에 대한 적합성을 테스트하는 절차를 설명한다.
파트 5ISO/IEC 14496-5[21]20002001[22]2017참조 소프트웨어표준의 다른 파트를 시연하고 명확하게 설명하기 위한 참조 소프트웨어를 제공한다.
파트 6ISO/IEC 14496-6[23]19992000[24]DMIF
파트 7ISO/IEC TR 14496-7[25]20022004[26]오디오-비주얼 객체 코딩을 위한 최적화된 참조 소프트웨어향상된 구현을 수행하는 방법에 대한 예제를 제공한다.
파트 8ISO/IEC 14496-8[27]20042004[28]IP 네트워크를 통한 ISO/IEC 14496 콘텐츠 전송IP 네트워크에서 MPEG-4 콘텐츠를 전송하는 방법을 지정한다.
파트 9ISO/IEC TR 14496-9[29]20042009[30]참조 하드웨어 설명표준의 다른 파트를 구현하는 방법을 시연하기 위한 하드웨어 설계를 제공한다.
파트 10ISO/IEC 14496-10[31]20032014[32]2016[33]AVCITU-T H.264 표준과 기술적으로 동일한 비디오 신호 압축 형식이다.
파트 11ISO/IEC 14496-11[34]20052015[35]장면 설명 및 응용 엔진2D 및 3D 버전을 포함한 여러 프로파일을 사용하여 풍부하고 상호작용적인 콘텐츠에 사용할 수 있다.
파트 12ISO/IEC 14496-12[37]20042015[38]2017[39]ISO 기본 미디어 파일 형식시간 기반 미디어 콘텐츠를 저장하기 위한 파일 형식이다.
파트 13ISO/IEC 14496-13[40]20042004[41]지적 재산 관리 및 보호 (IPMP) 확장공통 지적 재산권 관리 및 보호(IPMP) 처리, 구문 및 의미를 지정한다.
파트 14ISO/IEC 14496-14[51]20032003[52]2010[53]MP4 파일 형식파트 12를 기반으로 하는 MPEG-4 콘텐츠용으로 지정된 컨테이너 파일 형식이다.
파트 15ISO/IEC 14496-15[54]20042022[55]2023[56]ISO 기본 미디어 파일 형식에서 네트워크 추상화 계층(NAL) 유닛 구조화된 비디오 전송파트 10 비디오 저장을 위한 것이다.
파트 16ISO/IEC 14496-16[57]20042011[58]2016[59]애니메이션 프레임워크 확장 (AFX)3D 그래픽 콘텐츠를 표현하기 위한 MPEG-4 애니메이션 프레임워크 확장(AFX) 모델을 지정한다.
파트 17ISO/IEC 14496-17[60]20062006[61]스트리밍 텍스트 형식타임 텍스트 자막 형식이다.
파트 18ISO/IEC 14496-18[62]20042004[63]2014글꼴 압축 및 스트리밍파트 22에 정의된 Open Font Format용이다.
파트 19ISO/IEC 14496-19[64]20042004[65]합성 텍스처 스트림매우 낮은 비트 전송률의 합성 비디오 클립을 생성하는 데 사용된다.
파트 20ISO/IEC 14496-20[66]20062008[67]2010Lightweight Application Scene Representation (LASeR) 및 Simple Aggregation Format (SAF)W3C에서 정의한 SVG 형식을 기반으로 한다.
파트 21ISO/IEC 14496-21[69]20062006[70]MPEG-J 그래픽 프레임워크 확장(GFX)고급 대화형 멀티미디어 응용 프로그램을 위한 경량 프로그래밍 환경을 설명한다.
파트 22ISO/IEC 14496-22[73]20072015[74]2017Open Font FormatOpenType 버전 1.4 글꼴 형식 사양을 기반으로 한다.
파트 23ISO/IEC 14496-23[77]20082008[78]기호 음악 표현 (SMR)
파트 24ISO/IEC TR 14496-24[79]20082008[80]오디오 및 시스템 상호 작용MPEG-4 파일 형식과 MPEG-4 오디오의 원하는 결합된 동작을 설명한다.
파트 25ISO/IEC 14496-25[81]20092011[82]3D 그래픽 압축 모델MPEG-4 표준에 정의된 3D 그래픽 압축 도구를 다른 표준 또는 사양에 정의된 그래픽 기본 요소에 연결하기 위한 모델을 정의한다.
파트 26ISO/IEC 14496-26[83]20102010[84]2016오디오 적합성
파트 27ISO/IEC 14496-27[85]20092009[86]2015[87]3D 그래픽 적합성3D 그래픽 적합성은 요구 사항을 요약하고, 특성에 대한 교차 참조를 제공하며, 해당 요구 사항에 대한 적합성을 테스트하는 방법을 정의한다.
파트 28ISO/IEC 14496-28[88]20122012[89]복합 글꼴 표현
파트 29ISO/IEC 14496-29[90]20142015웹 비디오 코딩파트 10에서 파생되었으며 ISO/IEC 14496-10의 Constrained Baseline Profile과 호환되는 기술이다.
파트 30ISO/IEC 14496-30[91]20142014ISO 기본 미디어 파일 형식의 시간 텍스트 및 기타 시각적 오버레이W3C TTML (Timed Text Markup Language) 1.0, W3C WebVTT (Web Video Text Tracks)를 기반으로 한 파일에서 일부 형태의 타임 텍스트 및 자막 스트림을 전송하는 방식을 설명한다.



각 파트에는 프로파일(Profile)이 정의되어 있어, 특정 응용 분야에 필요한 기능 집합을 정의한다. 이를 통해 MPEG-4 표준 전체를 구현하지 않고도 필요한 부분만 구현할 수 있다.

MPEG-1, MPEG-2, MPEG-7, MPEG-21은 MPEG의 다른 표준들이다.

3. 1. 시스템 (파트 1)

MPEG-4는 여러 "파트"로 구성된 표준이며, 각 파트는 전체 사양의 특정 측면을 다룬다. 그 중 파트 1은 시스템에 관한 것으로, 비디오와 오디오의 동기화 및 다중화(multiplexing)를 다룬다.[6]

MPEG-4 시스템은 멀티미디어 데이터를 파일이나 기록 매체에 저장하거나 네트워크를 통해 전송하기 위해 동영상과 음성을 개별적으로 부호화한 후, 이를 통합(다중화)하고 동기화하는 메커니즘을 규정한다. 다중화되기 전의 동영상 및 음성 바이너리 데이터는 엘리멘터리 스트림(ES: Elementary Stream)이라고 불린다.

MPEG-4 시스템은 MPEG-1, MPEG-2 시스템과 유사하게 동영상과 음성의 엘리멘터리 스트림을 다중화하는 목적을 가지지만, 객체 부호화라는 개념이 있다는 점에서 차이가 있다. MPEG-4에서는 오디오, 비주얼(비디오) 데이터가 각각 하나의 객체로 취급되며, 시스템은 이러한 객체들을 다중화하고 동기화하는 역할을 한다.

MPEG-4의 동영상(비주얼 및 AVC) 및 음성 엘리멘터리 스트림 다중화에는 MPEG-4 시스템 외에 MPEG-2 전송 스트림(MPEG-2 TS)을 사용할 수도 있다. 예를 들어, 일본 지상파 디지털 텔레비전 방송의 1세그먼트 방송에서는 AVC와 AAC 전송에 MPEG-2 TS가 사용된다.

여러 객체를 조합하여 처리할 수 있도록 장면 묘사를 위한 사양으로, VRML97을 기반으로 한 BIFS(Binary Format for Scenes)가 규정되어 있다. 예를 들어, 인물이나 배경의 동영상 및 음성을 각각 별개의 객체로 부호화하고, 그것들을 겹쳐서 표시하거나, 사용자가 임의로 객체를 움직일 수 있는 애플리케이션을 만들 수 있다. 그러나 이러한 객체 부호화는 일반적인 사용을 위한 실용화가 이루어지지 않은 것이 현실이다.

객체 부호화 개념의 도입이나 BIFS 등으로 인해 MPEG-4 시스템의 내용이 방대해졌기 때문에, 파일 형식(MP4)에 관해서는 파트 14에서 별도로 규정하고 있다. 네트워크를 통한 전송에 관해서는 파트 8에서 규정되어 있다.

바이너리 형식인 BIFS를 쉽게 다룰 수 있도록 XML 기반의 기술 형식인 Extensible MPEG-4 Textual Format in XML (XMT)가 파트 11에서 규정되어 있다.

3. 2. 비주얼 (파트 2)

MPEG-4 파트 2 (ISO/IEC 14496-2)는 비디오, 정지 텍스처, 합성 이미지 등 시각 데이터를 위한 압축 코덱을 기술한다. ASP(고급 단순 프로파일)를 포함한 여러 프로파일(profile)이 있다.[14]

MPEG-4는 MPEG-1, MPEG-2 및 기타 관련 표준의 기능을 흡수하여 3D 렌더링을 위한 (확장된) VRML 지원, 객체 지향 복합 파일 (오디오, 비디오 및 VRML 객체 포함), 외부에서 지정된 디지털 권한 관리 지원, 다양한 유형의 상호 작용과 같은 새로운 기능을 추가했다.[2]

MPEG-4에 포함된 대부분의 기능은 구현 여부를 개별 개발자가 결정하도록 하며, 이는 전체 MPEG-4 표준 세트에 대한 완전한 구현이 없을 수 있음을 의미한다. 이를 위해 표준에는 "프로필" 및 "레벨" 개념이 포함되어 특정 기능 집합을 정의할 수 있다.

MPEG-4는 주로 낮은 비트 전송률 비디오 통신을 목표로 했지만, 이후 멀티미디어 코딩 표준으로 범위가 확장되어 초당 몇 킬로비트에서 수십 메가비트에 이르는 다양한 비트 전송률에서 효율적이다.

MPEG-4 파트 2는 DivX, Xvid, Nero Digital, RealMedia, 3ivx, H.263과 같은 코덱 및 QuickTime 6에서 사용되는 ASP를 포함한다.

MPEG-4 파트 2 비주얼 기술은 에러 내성 기술 외에도 임의 형상 기술, 스프라이트 부호화 기술, 얼굴 이미지 움직임 부호화(페이스 부호화) 기술, 확장성 기술 등을 포함했지만, 현재는 에러 내성 기술 외에는 거의 사용되지 않는다.

압축 알고리즘의 기본 원리는 MPEG-1, MPEG-2, H.263 등과 기본적으로 동일하며, 공간 변환, 프레임 간 예측, 양자화, 엔트로피 부호화를 채용하고 있다.

3. 3. 음향 (파트 3)

MPEG-4 파트 3은 음향 신호의 인지 코딩(perceptual coding)을 위한 압축 코덱을 다루며, AAC(Advanced Audio Coding)의 변형들을 비롯한 다양한 음향/육성 코딩 도구를 포함한다.[16]

MPEG-4의 음향 부호화 기술에는 널리 알려진 MPEG-4 AAC 외에도 다음과 같은 다양한 기술들이 규격화되어 있다.

  • MPEG-4 CELP
  • TwinVQ
  • HVXC(Harmonic Vector eXcitation Coding)
  • HILN(Harmonic and Individual Lines plus Noise)
  • TTSI(Text To Speech Interface)


MPEG-4 제3부에서 채택된 AAC 부호화에는 다음과 같은 종류가 있다.

  • Low Complexity Advanced Audio Coding (LC-AAC)
  • High-Efficiency Advanced Audio Coding (HE-AAC)
  • Scalable Sample Rate Advanced Audio Coding (AAC-SSR)
  • Bit Sliced Arithmetic Coding (BSAC)
  • Long Term Predictor (LTP)


MPEG-4 제3부 서브파트 11에서는 압축 시 음향 부호가 열화되지 않는 MPEG-4 ALS 기술이 규격화되었다.

MPEG-4 제3부 서브파트 12에서는, 압축 시 AAC 부분의 계층과, 보완하여 무손실이 되는 계층의 복수 계층으로 음향을 부호화할 수 있는 MPEG-4 SLS가 규격화되었다. SLS 부호화된 음향 신호는 SLS 재생기에서는 열화 없이 재생할 수 있으며, AAC 재생기에서도 재생할 수 있다는 특징을 가진다.

3. 4. 적합성 테스트 (파트 4)

표준의 다른 파트에 대한 적합성을 테스트하는 절차를 설명한다.[19]

MPEG-4 파트 4[4][5]
파트번호최초 공개일 (초판)최신 공개일 (최신판)최신 수정본제목설명
파트 4ISO/IEC 14496-4[19]20002004[20]2016적합성 테스트표준의 다른 파트들과의 정합성 테스트를 위한 과정을 기술한다.


3. 5. 참조 소프트웨어 (파트 5)

표준의 다른 파트를 시연하고 명확하게 설명하기 위한 참조 소프트웨어를 제공한다.[21]

MPEG-4 참조 소프트웨어[4][5]
파트번호최초 공개일 (초판)최신 공개일 (최신판)최신 수정본제목설명
파트 5ISO/IEC 14496-5[21]20002001[22]2017참조 소프트웨어표준의 다른 파트를 시연하고 명확하게 설명하기 위한 참조 소프트웨어를 제공한다.


3. 6. DMIF (파트 6)

DMIF (딜리버리 멀티미디어 통합 프레임워크)에 대해 기술한다.[23]

3. 7. 최적화된 참조 소프트웨어 (파트 7)

(예: 파트 5와 관련하여) 향상된 구현을 수행하는 방법에 대한 예제를 제공한다.[25]

3. 8. IP 네트워크 전송 (파트 8)

IP 네트워크에서 MPEG-4 콘텐츠를 전송하는 방법을 지정한다. 또한 RTP 페이로드 형식 설계, SDP를 사용하여 ISO/IEC 14496-1 관련 정보를 전송하는 데 대한 사용 규칙, MIME 형식 정의, RTP 보안 및 멀티캐스트에 대한 분석에 대한 지침도 포함한다.[27][28]

3. 9. 참조 하드웨어 (파트 9)

MPEG-4 표준의 파트 9는 참조 하드웨어에 대한 내용을 담고 있다.[29] 이 파트는 다른 파트들의 표준을 어떻게 구현할 수 있는지 보여주기 위해 하드웨어 설계를 예시로 제공한다.[29] 즉, 하드웨어 구현 방식을 제시하여 표준의 이해를 돕는다.

3. 10. 고급 영상 코딩 (파트 10)

파트 10 (ISO/IEC 14496-10): 고급 영상 코딩 (AVC)은 영상 신호 코덱으로, ITU-T H.264 표준과 기술적으로 동일하다. H.264/AVC라고도 불린다. H.264는 일반적인 동영상 압축 효율을 추구한다는 목표로 개발되었으며, MPEG-4 파트 2에서 사용되지 않았던 페이스 기술이나 스케일러블 기술은 제외되었다.

자세한 내용은 H.264 문서를 참조하면 된다.

3. 11. 장면 기술 (파트 11)

MPEG-4 파트 11은 장면 기술(Scene description)과 응용 프로그램 엔진을 다루며, ''BIFS''라고도 불린다. 이는 3D 콘텐츠나 자막 등에 사용될 수 있다.

MPEG-4 파트 11은 2D 및 3D 버전을 포함한 여러 프로파일을 통해 풍부하고 상호작용적인 콘텐츠를 제공한다. 이 파트는 응용 프로그램 엔진의 시스템 레벨을 설명하는데, 여기에는 다운로드 가능한 Java 바이트 코드 응용 프로그램의 전달, 수명 주기, 형식 및 동작이 포함된다. 또한, BIFS (Binary Format for Scene) 및 확장 가능한 MPEG-4 텍스트(XMT) 형식을 사용하여 MPEG-4 멀티미디어 콘텐츠를 텍스트로 표현하는 방식을 설명한다. XMT는 XML 등을 기반으로 한다.[36] BIFS, XMT, MPEG-J는 모두 MPEG-4 파트 11에서 다루는 내용이다. (MPEG-J는 MPEG-4 파트 21에서 정의되었다.)

3. 12. ISO 베이스 미디어 파일 포맷 (파트 12)

ISO 기본 미디어 파일 형식은 시간 기반 미디어 콘텐츠를 저장하기 위한 파일 형식이다. 이는 3GP, Motion JPEG 2000, MPEG-4 파트 14 등 여러 특정 파일 형식의 기반이 되는 일반적인 형식이다. JPEG 2000 이미지 코딩 시스템 – 파트 12 (ISO/IEC 15444-12)와 기술적으로 동일하다.[37]

3. 13. IPMP 확장 (파트 13)

MPEG-4 표준의 파트 13은 지적 재산권 관리와 보호(IPMP) 확장에 관한 것이다.[40] 이 파트는 비트스트림에서 IPMP 도구를 전송하고, IPMP 정보를 전달하며, IPMP 도구에 대한 상호 인증을 수행하고, 수정된 사양 지원에 필요한 등록 기관 목록(예: CISAC)을 제공하는 등 공통 지적 재산권 관리 및 보호(IPMP) 처리, 구문 및 의미를 규정한다.[42][43][44][45][46][47][48][49][50]

이는 음악이나 비디오와 같은 저작권으로 보호되는 디지털 콘텐츠를 보호하고 배포하기 위한 다양한 보호 메커니즘(다양한 DRM 시스템) 간의 상호 운용성이 부족했기 때문에 정의되었다.[42][43][44][45][46][47][48][49][50]

3. 14. MPEG-4 파일 포맷 (파트 14)

MP4 파일 형식은 애플의 퀵타임 파일 형식을 기반으로 개발되었다.[99] 퀵타임 파일 형식에서 채택된 파일 구조는 다양한 동영상이나 음성의 엘리멘터리 스트림을 유연하게 다중화할 수 있으며, 범용적인 파일 형식으로서 ISO 기반 미디어 파일 형식(Part 12)에 채택되었다. 이 Part 12에서 MPEG-4용 파일 형식으로 파생된 것이 MP4 파일 형식이다.

MPEG-4에서는 멀티미디어 데이터를 파일에 기록하기 위해 동영상과 음성의 엘리멘터리 스트림을 다중화해야 한다. 또한, 나중에 재생할 때 빨리 감기나 편집을 용이하게 하기 위해 프레임 단위로 액세스할 수 있도록 데이터를 구분하고, 추가로 액세스용 관리 데이터를 추가하는 것이 편리하다. 이를 위해 MP4 파일 형식을 규정하고 있다.

음성의 경우에는 파일 형식에 저장하지 않고, 부호화 데이터를 그대로 사용하는 경우도 있는데, MPEG-1 등에서 규정된 MP3가 이 예이다.

3. 15. AVC 파일 포맷 (파트 15)

MPEG-4 파트 15(ISO/IEC 14496-15)는 ISO 기본 미디어 파일 형식을 기반으로 AVC(파트 10) 비디오를 저장하기 위한 파일 형식이다.[54] 다른 파일 형식으로 저장하는 것도 허용한다. 2004년에 처음 공개되었고, 2022년에 최신판이 나왔으며, 2023년에 최신 수정본이 공개되었다.[55][56] 정식 명칭은 'ISO 기본 미디어 파일 형식에서 네트워크 추상화 계층(NAL) 유닛 구조화된 비디오 전송'이다.

3. 16. 애니메이션 프레임워크 확장 (파트 16)

MPEG-4 파트 16은 애니메이션 프레임워크 확장(AFX)을 다룬다.[57] 이는 3D 그래픽 콘텐츠를 표현하기 위한 모델로, 기하학, 텍스처, 애니메이션 및 전용 압축 알고리즘을 지정하기 위해 상위 수준의 합성 객체로 MPEG-4를 확장한다.[59]

3. 17. 스트리밍 텍스트 포맷 (파트 17)

MPEG-4 파트 17 (ISO/IEC 14496-17)은 시간에 맞춰 자막을 띄우는 포맷이다.[60] 2006년에 최초 공개되었다.[61]

3. 18. 글꼴 압축 및 스트리밍 (파트 18)

OpenType영어 글꼴의 압축 및 스트리밍에 대한 내용을 담고 있다.[62] 파트 22에 정의된 Open Font Format용으로 사용된다.[63]

3. 19. 합성 텍스처 스트림 (파트 19)

합성 텍스처 스트림은 매우 낮은 비트 전송률의 합성 비디오 클립을 생성하는 데 사용된다.[64]

3. 20. LASeR (파트 20)

MPEG-4 파트 20은 LASeR (Lightweight Application Scene Representation, 경량 응용 장면 표현) 및 SAF (Simple Aggregation Format, 단순 집합 형식)를 다룬다.[66] LASeR의 요구 사항 (압축 효율성, 코드 및 메모리 공간)은 W3C에서 정의한 SVG 형식을 기반으로 충족된다.[68]

3. 21. MPEG-J GFX (파트 21)

MPEG-J 그래픽 프레임워크 확장(GFX)은 고급 대화형 멀티미디어 응용 프로그램을 위한 경량 프로그래밍 환경을 설명한다. 이는 MPEG 표준 Java 응용 프로그램 환경(MPEG-J)의 하위 집합을 Java API와 결합한 프레임워크이다.[36][70][71][72] (2005년 7월 "FCD" 단계, 2006년 1월 FDIS, 2006년 11월 22일에 ISO 표준으로 게시됨).

3. 22. 오픈 폰트 포맷 규격 (파트 22)

MPEG-4 표준의 파트 22는 OpenType 버전 1.4 글꼴 형식 사양을 기반으로 하는 오픈 폰트 포맷(Open Font Format, OFFS) 규격을 정의한다.[73] 이 규격은 기술적으로 OpenType 사양과 동일하다.[75][76] 2005년 7월에 "CD" 단계에 도달했으며, 2007년에 ISO 표준으로 게시되었다.[74] 파트 18은 파트 22에 정의된 Open Font Format용 글꼴 압축 및 스트리밍을 다룬다.[62]

3. 23. SMR (파트 23)

MPEG-4 표준의 파트 23은 SMR(Symbolic Music Representation, 기호 음악 표현)을 다룬다.[77] 2006년 10월에 "FCD" 단계에 도달했으며, 2008년 1월 28일에 ISO 표준(ISO/IEC 14496-23)으로 게시되었다.[78]

3. 24. 오디오 및 시스템 상호작용 (파트 24)

MPEG-4 파일 형식과 MPEG-4 오디오의 결합된 동작을 설명한다.[79]

3. 25. 3D 그래픽스 압축 모델 (파트 25)

MPEG-4 표준의 파트 25는 3D 그래픽 압축 모델을 정의한다.[81] 이 모델은 MPEG-4 표준에 정의된 3D 그래픽 압축 도구를 다른 표준이나 사양에 정의된 그래픽 기본 요소에 연결하는 방식을 제공한다.[81]

3. 26. 오디오 적합성 (파트 26)

MPEG-4 파트 26 (ISO/IEC 14496-26)은 오디오 적합성에 대한 내용을 담고 있다.[83] 2010년에 처음 공개되었으며, 2016년에 최신 수정본이 공개되었다.[84]

3. 27. 3D 그래픽 적합성 (파트 27)

MPEG-4 표준의 파트 27은 3D 그래픽 적합성(3D Graphics conformance)을 다룬다.[85] 3D 그래픽 적합성은 요구 사항을 요약하고, 특성에 대한 상호 참조를 제공하며, 해당 요구 사항에 대한 적합성을 테스트하는 방법을 정의한다. 디코더 적합성을 확인하기 위한 테스트 구성 지침도 제공된다.[87]

3. 28. 복합 글꼴 표현 (파트 28)

MPEG-4 표준의 파트 28은 복합 글꼴 표현(Composite font representation)을 다룬다.[88] 이 파트의 ISO/IEC 표준 번호는 ISO/IEC 14496-28이며,[88] 2012년에 처음 공개되었고, 같은 해에 최신 버전이 공개되었다.[89]

3. 29. 웹 비디오 코딩 (파트 29)

MPEG-4 표준의 파트 29는 웹 비디오 코딩에 관한 내용을 담고 있다.[90] 파트 29의 내용은 파트 10 (ISO/IEC 14496-10, 고급 영상 코딩)에서 파생되었으며, ISO/IEC 14496-10의 Constrained Baseline Profile과 호환되는 기술이다.[90] Constrained Baseline Profile에 대한 Annex A에 명시된 하위 집합은 규범적 사양이며, 나머지 부분은 정보를 제공한다.[90]

3. 30. 타이밍 맞춘 텍스트 (파트 30)

Timed Text영어 및 기타 시각적 오버레이는 ISO 기본 미디어 파일 형식 (파트 12)을 기반으로 하는 파일에서 특정 형태의 타임 텍스트 및 자막 스트림을 전송하는 방식을 설명한다. 여기에는 W3C TTML (Timed Text Markup Language) 1.0, W3C WebVTT (Web Video Text Tracks) 등이 포함된다.[91] 이러한 형식의 문서는 타임 텍스트 또는 자막 전송에 대한 다른 정의를 배제하지 않는다. 예를 들어, 3GPP Timed Text (3GPP TS 26.245)를 참조할 수 있다.

4. 기술 개요

MPEG-4는 개발자, 서비스 제공업체, 최종 사용자 모두에게 다양한 기술을 제공하는 멀티미디어 표준이다.


  • 개발자: 디지털 텔레비전, 애니메이션 그래픽, 월드 와이드 웹 등에서 더 나은 적응성과 유연성을 가진 멀티미디어 객체를 만들 수 있다.
  • 데이터 네트워크 제공업체: 데이터 투명성을 위해 MPEG-4를 사용할 수 있으며, 표준 절차를 통해 데이터를 해석하고 다른 신호 유형으로 변환할 수 있다.
  • 최종 사용자: 다양한 애니메이션 객체와 상호 작용할 수 있다.
  • 표준화된 디지털 권한 관리(IPMP): 콘텐츠 저작권을 보호한다.


MPEG-4 형식은 다음과 같은 기능을 수행한다.

  • 미디어 객체와 관련된 데이터를 다중화하고 동기화하여 네트워크 채널을 통해 효율적으로 전송한다.
  • 수신 측에서 형성되는 시청각 장면과 상호 작용한다.

4. 1. 동영상 부호화

MPEG-4는 1999년에 확정된 Part 2 방식(MPEG-4 비주얼)과 2003년에 확정된 Part 10 방식(MPEG-4 AVC) 두 가지 주요 동영상 인코딩 방식을 규정하고 있다. MPEG-4 기술은 주로 인코딩 기술로 알려져 있지만, 실제 규격에는 인코딩된 데이터를 해독하는 디코딩 과정만 명시되어 있고, 인코딩 방식에 대한 규정은 없다.

MPEG-4는 MPEG-1, MPEG-2 등의 기능을 흡수하고, 3D 렌더링을 위한 VRML 지원, 객체 지향 복합 파일, 디지털 권한 관리, 다양한 상호 작용 기능 등을 추가했다. AAC는 MPEG-4 이전에 MPEG-2의 부속물로 표준화되었다.

MPEG-4는 지속적으로 발전하는 표준이며, 여러 부분으로 나뉜다. MPEG-4 호환성을 홍보하는 회사들은 어떤 "파트" 수준의 호환성을 언급하는지 명확히 밝히지 않는 경우가 많다. 주요 파트로는 MPEG-4 Part 2(DivX, Xvid, Nero Digital 등)와 MPEG-4 part 10(H.264, x264 등)이 있다.

MPEG-4는 낮은 비트 전송률 비디오 통신을 목표로 시작했지만, 멀티미디어 코딩 표준으로 범위가 확장되었다. 초당 몇 킬로비트에서 수십 메가비트까지 다양한 비트 전송률에서 효율적이다. MPEG-4는 다음과 같은 기능을 제공한다.[2]

  • 혼합 미디어 데이터(비디오, 오디오, 음성) 인코딩 기능
  • 오류 복원력
  • 수신 측에서 생성된 시청각 장면과 상호 작용 기능


MPEG-4는 개발자, 서비스 제공업체, 최종 사용자에게 다음과 같은 기술을 제공한다.

  • 개발자는 디지털 텔레비전, 애니메이션 그래픽, 월드 와이드 웹 등에서 더 나은 적응성과 유연성을 갖춘 멀티미디어 객체를 만들 수 있다.
  • 데이터 네트워크 제공업체는 데이터 투명성을 위해 MPEG-4를 사용할 수 있다.
  • 최종 사용자는 다양한 애니메이션 객체와 상호 작용할 수 있다.
  • 표준화된 디지털 권한 관리 신호(IPMP)를 제공한다.


MPEG-4 형식은 다음과 같은 기능을 수행할 수 있다.

  • 미디어 객체와 관련된 데이터를 다중화, 동기화하여 네트워크 채널을 통해 효율적으로 전송한다.
  • 수신 측에서 형성되는 시청각 장면과 상호 작용한다.


MPEG-4는 MPEG-1비디오 CD에, MPEG-2가 HDTV에 사용되는 것과 달리, 낮은 비트 전송률에서의 사용까지 고려하여 규격화되었다. H.263을 기반으로 B 프레임 채용, DCT 계수의 AC/DC 예측 도입 등 몇 가지 도구를 추가했다.

MPEG-4 비주얼 기술은 오류 내성 기술 외에도 임의 형상 기술, 스프라이트 부호화 기술, 얼굴 이미지 움직임 부호화 기술, 확장성 기술 등을 포함했지만, 현재는 오류 내성 기술 외에는 거의 사용되지 않는다.

압축 알고리즘은 MPEG-1, MPEG-2, H.263 등과 기본적으로 동일하며, 공간 변환, 프레임 간 예측, 양자화, 엔트로피 부호화를 사용한다. MPEG-4에서는 공간 변환에 이산 코사인 변환이 사용된다. 8×8 화소 블록 단위로 원본 이미지 또는 프레임 간 예측의 예측 오차 이미지의 DCT 계수를 구하고, 그 계수를 양자화한다.

프레임 간 예측에서 참조 프레임으로 I 프레임, P 프레임, B 프레임을 지정할 수 있다. P 프레임은 시간 축에서 앞쪽 프레임 1장의 이미지를, B 프레임은 앞뒤 2장의 이미지를 사용하여 부호화를 수행한다. 움직임 보상의 정밀도는 기본적으로 1/2 화소 정밀도까지, MPEG-4 ASP에서는 1/4 화소 정밀도 움직임 보상도 사용 가능하다.

4. 1. 1. MPEG-4 (Part 2)

1999년에 처음 규격이 확정된 MPEG-4 비주얼(MPEG-4 Part 2)은 H.263을 기반으로 몇 가지 도구를 추가하여 구성되었다. MPEG-1비디오 CD에, MPEG-2가 방송 및 HDTV에 사용되는 것을 상정했던 것과 달리, MPEG-4는 낮은 비트 전송률에서의 사용까지 용도를 확대하는 것을 목표로 했다.[2] H.263과의 차이점으로는, 프레임 간 예측에서 B프레임을 채용하고, DCT 계수의 AC/DC 예측을 도입한 점 등이 있다.

이 비주얼 기술은 오류 톨러런스 기술 외에도 임의 형상 기술, 스프라이트 인코딩 기술, 얼굴 움직임을 인코딩하는 페이스(Face) 인코딩 기술, 스케일러빌러티 기술 등을 포함했지만, 현재는 오류 톨러런스 기술 외에는 거의 사용되지 않는다.

압축 알고리즘의 기본 원리는 MPEG-1, MPEG-2, H.263 등과 기본적으로 동일하며, 공간 변환, 프레임 간 예측, 양자화, 엔트로피 부호화를 채용한다. MPEG-4에서는 공간 변환에 이산 코사인 변환이 사용된다. 8×8 화소 블록 단위로 원본 이미지 또는 프레임 간 예측의 예측 오차 이미지의 DCT 계수를 구하고, 그 계수를 양자화한다.

프레임 간 예측에서 참조 프레임으로 지정할 수 있는 프레임에는 I 프레임, P 프레임, B 프레임이 있다. P 프레임에서는 시간 축에서 앞쪽 프레임 1장의 이미지를 사용하여 부호화를 수행하지만, B 프레임에서는 앞쪽·뒤쪽 2장의 이미지를 사용하여 부호화를 수행한다. 움직임 보상의 정밀도로는 기본적으로 1/2 화소 정밀도까지 사용할 수 있으며, MPEG-4 ASP(Advanced Simple Profile)에서는 1/4 화소 정밀도 움직임 보상도 채용하고 있다.

4. 1. 2. MPEG-4 AVC (Part 10)

2003년에 규격이 된 Part 10 방식은 MPEG-4 AVC라고 불린다. ITU-T와 공동으로 규격화한 것으로 H.264와 같다. H.264/AVC라고도 불린다.[2] Part 2에서 규격의 범위가 너무 커져 버렸다는 반성으로, 통상적인 영상 압축률에 만족하자는 방침으로 개발이 진행되었다(Part 2에서 사용되는 일이 없었던 페이스 기술, 스케일러빌러티 기술은 빼버림).[2]

4. 2. 음향 인코딩 (Part 3)

MPEG-4의 음향 인코딩 기술에서는 CELP 인코딩, AAC, TwinVQ, BSAC 등이 채용되었다. 특히 기존에 사용되던 CELP, MPEG-2에서 정의된 AAC, MPEG-4에서 새롭게 정의된 TwinVQ, BSAC 등 많은 객체를 가지며 이러한 객체의 조합을 이용하여 프로파일을 생성하고, 이를 이용한다. 또한, 압축뿐만 아니라 TTS 등과 같은 저전송률을 이용한 음성 복원 기능까지 가지고 있다.[2]

MPEG-4 Part 3

MPEG-4의 음향 부호화 기술에서는 가장 널리 알려진 MPEG-4 AAC 외에도 MPEG-4 CELP, TwinVQ, HVXC(Harmonic Vector eXcitation Coding), HILN(Harmonic and Individual Lines plus Noise), TTSI(Text To Speech Interface) 등 다양한 음향 부호화 기술이 규격화되어 있다. MPEG-4 제3부에서 채택된 AAC 부호화에는 다음과 같은 종류가 있다.

  • Low Complexity Advanced Audio Coding (LC-AAC)
  • High-Efficiency Advanced Audio Coding (HE-AAC)
  • Scalable Sample Rate Advanced Audio Coding (AAC-SSR)
  • Bit Sliced Arithmetic Coding (BSAC)
  • Long Term Predictor (LTP)


MPEG-4 제3부 서브파트 11에서 압축 시 음향 부호가 열화되지 않는 MPEG-4 ALS 기술이 규격화되었다. MPEG-4 제3부 서브파트 12에서, 압축 시 AAC 부분의 계층과, 보완하여 무손실이 되는 계층의 복수 계층으로 음향을 부호화할 수 있는 MPEG-4 SLS가 규격화되었다. SLS 부호화된 음향 신호는 SLS 재생기에서는 열화 없이 재생할 수 있으며, AAC 재생기에서도 재생할 수 있다는 특징을 가진다.

4. 3. 시스템 (Part 1)

멀티미디어 데이터를 파일이나 기록 매체에 보존하거나 네트워크에서 전송하기 위해서는 영상과 음성 각각 따로 인코딩한 데이터를 합쳐서 보내는 것(멀티플렉싱, 다중화)과 동기화를 위한 방법이 필요하다. 이러한 다중화 방식을 규정하는 것이 시스템이다. 또, 시스템에 의해 다중화되기 이전의 영상, 음성 바이너리를 엘리멘터리 스트림(ES: Elementary Stream)이라 한다.

동영상과 음성의 엘리멘터리 스트림을 다중화한다는 목적에는 MPEG-1이나 MPEG-2의 시스템과 같지만 MPEG-4에는 객체 인코딩이라는 개념이 있어 차이가 있다. MPEG-4에서 음향, 비주얼(비디오)의 데이터는 각 1개의 객체로서 다루어져 이러한 객체를 다중화·동기화하는 것이 시스템의 역할이다. 더불어 MPEG-4의 동화상(비주얼 및 AVC)이나 음성의 엘리멘터리 스트림의 다중화에는 MPEG-4 시스템뿐 아니라, MPEG-2 트랜스포트 스트림(MPEG-2 TS)을 이용해도 되고, 지상파 디지털 텔레비전 방송의 1 세그먼트 방송에서는 AVC와 AAC의 전송에 MPEG-2 TS가 이용된다.

게다가 여러 개의 객체를 조합해 다루기 위한 씬 기술을 위한 사양으로 VRML97를 기반으로 한 BIFS(Binary Format for Scenes)가 규정되어 있다. 이를테면, 인물이나 배경의 동영상 및 음성을 각각 별개의 객체로서 인코딩해서 각각의 객체들을 겹쳐서 표시하거나 사용자가 임의의 객체를 움직이게 할 수 있는 애플리케이션을 만들 수 있다. 그러나 이러한 객체 인코딩은 일반적으로는 실용화되어 있지 않았다.

객체 인코딩 개념의 도입이나 BIFS 등에 의해 MPEG-4 시스템의 내용이 비대해졌기 때문에 파일 포맷(MP4)에 관해서는 뒤에 서술할 Part 14로 독립해 규정하고 있다. 덧붙여 네트워크상에서의 전송에 관해서는 Part 8 및 RFC 3640으로 규정하고 있다.

바이너리 형식인 BIFS를 쉽게 다룰 수 있도록 하기 위해, XML 준거의 기술 형식으로서, Extensible MPEG-4 Textual Format in XML (XMT)이 Part 11에서 규정되어 있다.

4. 4. 파일 포맷 (Part 12, 14)

멀티미디어 데이터를 파일에 기록하려면 동영상과 음성 엘리멘터리 스트림을 다중화해야 한다. 하지만 나중에 재생할 때 빨리 감기나 편집을 쉽게 하기 위해 프레임 단위로 접근할 수 있도록 데이터를 구분하고, 접근 관리 데이터를 추가하는 것이 편리하다. MPEG-4는 이를 위한 포맷으로 MP4 파일 포맷을 규정하고 있다.[99]

음성은 파일 포맷에 맞추지 않고 인코딩된 데이터를 그대로 사용하기도 한다. MPEG-1 등에서 규정된 MP3가 좋은 예이다.

MP4 파일 포맷은 애플의 퀵타임 파일 포맷을 기반으로 개발되었다.[99] 퀵타임 파일 포맷으로 채용되고 있는 파일 구조는 다양한 동영상이나 음성의 엘리멘터리 스트림을 유연하게 다중화할 수 있어 범용의 파일 포맷으로서 ISO 베이스 미디어 파일 포맷(Part 12)에 채용되었다. 이 Part 12로부터 MPEG-4용 파일 포맷으로서 파생된 것이 MP4 파일 포맷이다.

4. 5. 프로파일, 레벨

비주얼, 음향 공히 그 규격 안에 프로파일과 레벨이란 개념이 규정되고 있다. 프로파일이란 사용할 수 있는 도구를 나타내는 것이며, 레벨이란 사용할 수 있는 파라미터의 범위를 규정하는 것이다.[3] 예를 들면, MPEG-4 Part 2에서는 심플 프로파일(SP), 어드벤스드 심플 프로파일(ASP), 메인 프로파일(MP) 등이 규정되어 각각 사용 가능한 도구가 다르다. MPEG-4 AVC에서는 베이스라인 프로파일, 메인 프로파일, 확장(Extended) 프로파일의 세 종류가 규정되고 있으며, 추가로 하이 프로파일 등의 몇 가지가 추가되었다. 레벨은 수치로 나타난다. 통상 프로파일과 레벨을 합쳐서 간단하게 SP@L3(심플 프로파일 레벨 3) 등으로 표현한다.[2]

프로파일 및 레벨 조합을 통해 다음을 수행할 수 있다.[3]

  • 코덱 빌더가 동일한 조합을 구현하는 다른 MPEG-4 장치와의 상호 작용을 유지하면서 필요한 표준의 하위 집합만 구현할 수 있다.
  • MPEG-4 장치가 표준을 준수하는지 확인하는 것으로, 이를 적합성 테스트라고 한다.

5. 라이선싱

MPEG-4는 특허 기술을 포함하고 있으며, 이 기술을 사용하려면 소프트웨어 특허를 인정하는 국가에서 라이선스가 필요하다. 24개 이상의 회사들이 MPEG-4를 포괄하는 특허를 가지고 있다고 주장한다. MPEG LA[95]는 다양한 회사로부터 MPEG-4 Part 2 Visual에 필요한 특허를 라이선스하며(오디오는 별도로 라이선스됨) 해당 사이트에 모든 라이선스 제공자 및 라이선스 사용자를 나열한다. MPEG-4 System 특허에 대한 새로운 라이선스가 개발 중이며[96], 이전 MPEG-4 Systems 라이선스 보유자가 해당 라이선스 조건에 따라 나열된 특허를 여전히 사용하는 동안에는 새로운 라이선스가 제공되지 않는다.[97]

MPEG-4 Visual 형식에 사용되는 특허의 대부분은 미쓰비시 전기(255개 특허), 히타치(206개 특허), 파나소닉(200개 특허) 등 세 개의 일본 회사가 보유하고 있다.

6. MPEG-4 압축 동영상의 콘텐츠 분석 기술

MPEG-4 동영상의 콘텐츠 분석 기술은 활발하게 연구되어 왔다. 이는 동영상의 장면을 자동으로 분할하는 기술, 동영상으로부터 객체를 자동으로 인식하고 추적하는 기술 및 콘텐츠 정보의 표준화 등을 포함한다. 동영상의 픽셀 정보를 이용하기 때문에 처리 속도가 느려 고성능 하드웨어에 의존해야 했던 기존의 컴퓨터 비전 기술과 달리, 대부분의 압축 영역에서의 객체 인식 및 추적 기술은 압축 데이터에 포함된 모션 벡터, 잔여 신호(DCT 또는 Integer coefficients), 및 매크로블록 타입 같은 기타 정보를 이용하여 일반 컴퓨터에서도 빠른 속도로 처리하는 것을 지향한다. 대표적인 알고리즘으로 MRF 기반 모델, 비유사성 최소화 알고리즘(dissimilarity minimization), 확률적 데이터 연관 필터링 알고리즘 (probabilistic data association filtering, PDAF), 및 확률적 시공간 매크로블록 필터링 알고리즘(probabilistic spatiotemporal macroblock filtering, PSMF) 등이 있다.

참조

[1] 서적 The MPEG-4 Book https://books.google[...] Prentice Hall Professional 2002
[2] 간행물 Overview of the H.264/AVC video coding standard 2003
[3] 간행물 RFC 3640 http://tools.ietf.or[...] IETF 2003-12
[4] 웹사이트 MPEG standards – Full list of standards developed or under development http://mpeg.chiarigl[...] Chiariglione 2010-02-09
[5] 웹사이트 Programme of Work – MPEG-4 (Coding of audio-visual objects) http://kikaku.itscj.[...] 2009-11-09
[6] ISO ISO/IEC 14496-1 https://www.iso.org/[...]
[7] 웹사이트 ISO/IEC 14496-1:2010 – Information technology — Coding of audio-visual objects — Part 1: Systems https://www.iso.org/[...] 2017-08-30
[8] 웹사이트 ISO/IEC 14496-1:2010/Amd 2:2014 – Support for raw audio-visual data https://www.iso.org/[...] 2017-08-30
[9] 간행물 ISO/IEC 14496-1:2004 – Third edition 2004-11-15 – Information technology — Coding of audio-visual objects — Part 1: Systems http://webstore.iec.[...] 2004-11-15
[10] 웹사이트 Overview of the MPEG-4 Standard http://mpeg.chiarigl[...] 2002-03
[11] 간행물 Text for CD 14496-1 Systems http://www.ece.cmu.e[...] 1997-11-21
[12] 웹사이트 MPEG-4 Systems Elementary Stream Management (ESM) http://mpeg.chiarigl[...] 2001-07
[13] 웹사이트 MPEG Systems (1-2-4-7) FAQ, Version 17.0 http://mpeg.chiarigl[...] 2001-07
[14] ISO ISO/IEC 14496-2 https://www.iso.org/[...]
[15] 웹사이트 ISO/IEC 14496-2:2004 – Information technology — Coding of audio-visual objects — Part 2: Visual https://www.iso.org/[...] ISO 2017-08-30
[16] ISO ISO/IEC 14496-3 https://www.iso.org/[...]
[17] 웹사이트 ISO/IEC 14496-3:2009 – Information technology — Coding of audio-visual objects — Part 3: Audio https://www.iso.org/[...] ISO 2017-08-30
[18] 웹사이트 ISO/IEC 14496-3:2009/Amd 6:2017, Profiles, levels and downmixing method for 22.2 channel programs https://www.iso.org/[...] ISO 2017-08-30
[19] ISO ISO/IEC 14496-4 https://www.iso.org/[...]
[20] 웹사이트 ISO/IEC 14496-4:2004 – Information technology — Coding of audio-visual objects — Part 4: Conformance testing https://www.iso.org/[...] ISO 2017-08-30
[21] ISO ISO/IEC 14496-5 https://www.iso.org/[...]
[22] 웹사이트 ISO/IEC 14496-5:2001 – Information technology — Coding of audio-visual objects — Part 5: Reference software https://www.iso.org/[...] ISO 2017-08-30
[23] ISO ISO/IEC 14496-6 https://www.iso.org/[...]
[24] 웹사이트 ISO/IEC 14496-6:2000 – Information technology — Coding of audio-visual objects — Part 6: Delivery Multimedia Integration Framework (DMIF) https://www.iso.org/[...] ISO 2017-08-30
[25] ISO ISO/IEC TR 14496-7 https://www.iso.org/[...]
[26] 웹사이트 ISO/IEC TR 14496-7:2004 – Information technology — Coding of audio-visual objects — Part 7: Optimized reference software for coding of audio-visual objects https://www.iso.org/[...] ISO 2017-08-30
[27] ISO ISO/IEC 14496-8 https://www.iso.org/[...]
[28] 웹사이트 ISO/IEC 14496-8:2004 – Information technology — Coding of audio-visual objects — Part 8: Carriage of ISO/IEC 14496 contents over IP networks https://www.iso.org/[...] ISO 2017-08-30
[29] ISO ISO/IEC TR 14496-9 https://www.iso.org/[...]
[30] 웹사이트 ISO/IEC TR 14496-9:2009 – Information technology — Coding of audio-visual objects — Part 9: Reference hardware description https://www.iso.org/[...] ISO 2017-08-30
[31] ISO ISO/IEC 14496-10 https://www.iso.org/[...]
[32] 웹사이트 ISO/IEC 14496-10:2014 – Information technology — Coding of audio-visual objects — Part 10: Advanced Video Coding https://www.iso.org/[...] ISO 2017-08-30
[33] 웹사이트 ISO/IEC 14496-10:2014/Amd 3:2016 – Constrained Additional supplemental enhancement information https://www.iso.org/[...] ISO 2017-08-30
[34] ISO ISO/IEC 14496-11 https://www.iso.org/[...]
[35] 웹사이트 ISO/IEC 14496-11:2015 – Information technology — Coding of audio-visual objects — Part 11: Scene description and application engine https://www.iso.org/[...] ISO 2017-08-30
[36] 웹사이트 MPEG-J White Paper http://mpeg.chiarigl[...] 2005-07
[37] 웹사이트 ISO/IEC 14496-12 https://www.iso.org/[...] 2023-01-27
[38] 웹사이트 ISO/IEC 14496-12:2015 – Information technology — Coding of audio-visual objects — Part 12: ISO base media file format https://www.iso.org/[...] ISO 2014-01-19
[39] 웹사이트 ISO/IEC 14496-12:2015/Amd 1:2017 – DRC Extensions https://www.iso.org/[...] 2017-08-30
[40] 웹사이트 ISO/IEC 14496-13 https://www.iso.org/[...] 2017-08-30
[41] 웹사이트 ISO/IEC 14496-13:2004 – Information technology — Coding of audio-visual objects — Part 13: Intellectual Property Management and Protection (IPMP) extensions https://www.iso.org/[...] ISO 2017-08-30
[42] 간행물 FPDAM ISO/IEC 14496-1:2001 / AMD3 (Final Proposed Draft Amendment) http://kikaku.itscj.[...] 2002-03
[43] 웹사이트 MPEG-4 IPMPX white paper http://mpeg.chiarigl[...] MPEG 2010-08-01
[44] 웹사이트 MPEG Intellectual Property Management and Protection http://mpeg.chiarigl[...] MPEG 2010-08-01
[45] 간행물 MPEG-4 IPMP Extension – For Interoperable Protection of Multimedia Content http://www.cs.missou[...] 2010-08-01
[46] 웹사이트 MPEG Registration Authority – IPMP http://www.mpegra.or[...] MPEG RA International Agency (Confédération Internationale des Sociétés d´Auteurs et Compositeurs) 2010-08-01
[47] 웹사이트 MPEG RA – FAQ IPMP http://www.mpegra.or[...] MPEG RA International Agency (Confédération Internationale des Sociétés d´Auteurs et Compositeurs) 2010-08-01
[48] 웹사이트 Intellectual Property Management and Protection Registration Authority http://www.ipmp-ra.o[...] Confédération Internationale des Sociétés d´Auteurs et Compositeurs 2004-12-05
[49] 간행물 Digital media: Can content, business and users coexist? http://leonardo.chia[...] Telecom Italia Lab 2010-08-01
[50] 간행물 IPMP in MPEG – W3C DRM workshop 22/23 January 2001 http://www.w3.org/20[...] 2010-08-01
[51] 웹사이트 ISO/IEC 14496-14 https://www.iso.org/[...] 2023-03-30
[52] 웹사이트 ISO/IEC 14496-14:2003 – Information technology — Coding of audio-visual objects — Part 14: MP4 file format https://www.iso.org/[...] 2017-08-30
[53] 웹사이트 ISO/IEC 14496-14:2003/Amd 1:2010 – Handling of MPEG-4 audio enhancement layers https://www.iso.org/[...] ISO 2017-08-30
[54] 웹사이트 ISO/IEC 14496-15 https://www.iso.org/[...] 2023-12-07
[55] 웹사이트 ISO/IEC 14496-15:2022 – Information technology — Coding of audio-visual objects — Part 15: Carriage of network abstraction layer (NAL) unit structured video in the ISO base media file format https://www.iso.org/[...] ISO 2023-12-07
[56] 웹사이트 ISO/IEC 14496-15:2022/Amd 1:2023 - Information technology — Coding of audio-visual objects — Part 15: Carriage of network abstraction layer (NAL) unit structured video in the ISO base media file format — Amendment 1: Support for LCEVC https://www.iso.org/[...] ISO 2023-12-07
[57] 웹사이트 ISO/IEC 14496-16 https://www.iso.org/[...] 2017-08-30
[58] 웹사이트 ISO/IEC 14496-16:2011 – Information technology — Coding of audio-visual objects — Part 16: Animation Framework eXtension (AFX) https://www.iso.org/[...] ISO 2017-08-30
[59] 웹사이트 ISO/IEC 14496-16:2011/Amd 3:2016 – Printing material and 3D graphics coding for browsers https://www.iso.org/[...] 2017-08-30
[60] 웹사이트 ISO/IEC 14496-17 https://www.iso.org/[...] 2017-08-30
[61] 웹사이트 ISO/IEC 14496-17:2006 – Information technology — Coding of audio-visual objects — Part 17: Streaming text format https://www.iso.org/[...] ISO 2017-08-30
[62] 웹사이트 ISO/IEC 14496-18 https://www.iso.org/[...] 2017-08-30
[63] 웹사이트 ISO/IEC 14496-18:2004 – Information technology — Coding of audio-visual objects — Part 18: Font compression and streaming https://www.iso.org/[...] ISO 2017-08-30
[64] 웹사이트 ISO/IEC 14496-19 https://www.iso.org/[...] 2017-08-30
[65] 웹사이트 ISO/IEC 14496-19:2004 – Information technology – Coding of audio-visual objects — Part 19: Synthesized texture stream https://www.iso.org/[...] ISO 2017-08-30
[66] 웹사이트 ISO/IEC 14496-20 https://www.iso.org/[...] 2017-08-30
[67] 웹사이트 ISO/IEC 14496-20:2008 – Information technology — Coding of audio-visual objects — Part 20: Lightweight Application Scene Representation (LASeR) and Simple Aggregation Format (SAF) https://www.iso.org/[...] ISO 2017-08-30
[68] 웹사이트 MPEG-4 LASeR white paper http://mpeg.chiarigl[...] 2005-07
[69] 웹사이트 ISO/IEC 14496-21 https://www.iso.org/[...]
[70] 웹사이트 ISO/IEC 14496-21:2006 – Information technology — Coding of audio-visual objects — Part 21: MPEG-J Graphics Framework eXtensions (GFX) https://www.iso.org/[...] ISO 2017-08-30
[71] 웹사이트 MPEG-4 Systems MPEG-J http://mpeg.chiarigl[...] 2001-07
[72] 웹사이트 MPEG-J GFX white paper http://mpeg.chiarigl[...] 2005-07
[73] ISO ISO/IEC 14496-22 https://www.iso.org/[...]
[74] 웹사이트 ISO/IEC 14496-22:2009 – Information technology — Coding of audio-visual objects — Part 22: Open Font Format https://www.iso.org/[...] ISO 2017-08-30
[75] 웹사이트 ISO/IEC 14496-22 "Open Font Format" http://mpeg.chiarigl[...] Chiariglione 2008-07
[76] 웹사이트 ISO/IEC 14496-22 Information technology — Coding of audio-visual objects — Part 22: Open Font Format http://standards.iso[...] 2007-03-15
[77] ISO ISO/IEC 14496-23 https://www.iso.org/[...]
[78] 웹사이트 ISO/IEC 14496-23:2008 – Information technology — Coding of audio-visual objects — Part 23: Symbolic Music Representation https://www.iso.org/[...] ISO 2017-08-30
[79] ISO ISO/IEC TR 14496-24 https://www.iso.org/[...]
[80] 웹사이트 ISO/IEC TR 14496-24:2008 – Information technology — Coding of audio-visual objects — Part 24: Audio and systems interaction https://www.iso.org/[...] ISO 2017-08-30
[81] ISO ISO/IEC 14496-25 https://www.iso.org/[...]
[82] 웹사이트 ISO/IEC 14496-25:2011 – Information technology — Coding of audio-visual objects — Part 25: 3D Graphics Compression Model https://www.iso.org/[...] ISO 2017-08-30
[83] ISO ISO/IEC 14496-26 https://www.iso.org/[...]
[84] 웹사이트 ISO/IEC 14496-26:2010 – Information technology — Coding of audio-visual objects — Part 26: Audio conformance https://www.iso.org/[...] ISO 2017-08-30
[85] ISO ISO/IEC 14496-27 https://www.iso.org/[...]
[86] 웹사이트 ISO/IEC 14496-27:2009 – Information technology — Coding of audio-visual objects — Part 27: 3D Graphics conformance https://www.iso.org/[...] ISO 2017-08-30
[87] 웹사이트 ISO/IEC 14496-27:2009/Amd 6:2015 – Pattern-based 3D mesh coding conformance https://www.iso.org/[...] 2017-08-30
[88] ISO ISO/IEC 14496-28 https://www.iso.org/[...]
[89] 웹사이트 ISO/IEC CD 14496-28 – Information technology — Coding of audio-visual objects — Part 28: Composite font representation https://www.iso.org/[...] ISO 2017-08-30
[90] ISO ISO/IEC 14496-29 https://www.iso.org/[...]
[91] ISO ISO/IEC 14496-30 https://www.iso.org/[...]
[92] ISO ISO/IEC 14496-31 https://www.iso.org/[...]
[93] ISO ISO/IEC CD 14496-32 https://www.iso.org/[...]
[94] ISO ISO/IEC FDIS 14496-33 https://www.iso.org/[...]
[95] 웹사이트 MPEG Licensing Authority – MPEG-4 Visual: Introduction http://www.mpegla.co[...] 2011-01-07
[96] 웹사이트 MPEG Licensing Authority – MPEG-4 Systems: Introduction http://www.mpegla.co[...] 2011-01-07
[97] 웹사이트 MPEG LA – Patent List https://web.archive.[...]
[98] 웹사이트 情報源符号化部 H.264 | MPEG-4 AVC 規格の概要 https://www.soumu.go[...] 社団法人 電波産業会 2006-02-24
[99] 웹사이트 米Generic Mediaインタビュー──Peter Hoddie氏 https://www.itmedia.[...] 2018-12-29



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com