파라메트릭 스테레오

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

파라메트릭 스테레오(PS)는 낮은 비트 전송률의 스테레오 오디오 코딩 효율을 높이기 위해 개발된 기술이다. 스테레오 오디오를 모노로 다운믹싱하고, 2–3 kbit/s의 사이드 정보와 함께 디코더에서 공간 강도 스테레오 생성 및 앰비언스 재생을 설명한다. 이 기술은 HE-AAC v2에 통합되어 MPEG-4 오디오의 기능 세트에 포함되었다. 필립스와 코딩 테크놀로지스에 의해 개발되었으며, 낮은 비트 전송률에서 스테레오 인상을 주어 체감 품질을 향상시키지만, 투명성을 달성하지는 못한다. MPEG-4 구현은 혼합된 모노 오디오에서 각 주파수 대역별로 좌우 채널의 상대적인 양, 지연 및 상관 관계를 지정하는 것을 기반으로 한다.

파라메트릭 스테레오
📚 더 읽어볼만한 페이지
  • 음향 기술 - 스테레오
    스테레오는 입체적인 음향을 재현하는 녹음 및 재생 방식으로, 자연스러운 잔향을 포함한 실제 소리를 재현하는 자연스러운 스테레오와 인공적인 방향감을 만드는 인공 스테레오로 나뉘며, 두 채널 스테레오 녹음은 두 개의 마이크로 소리를 녹음하여 청취자가 음원의 위치를 인지하도록 하는 기술이다.
  • 음향 기술 - 스카이워커 사운드
    1987년 설립된 스카이워커 사운드는 캘리포니아 스카이워커 랜치에 위치한 영화 음향 제작 회사로, 아카데미 음향상에서 뛰어난 성과를 거두었으며, 다양한 블록버스터 작품의 음향 제작에 참여하여 영화 음향 기술 발전에 기여했고, 현재는 디즈니 자회사이다.
  • 그리스어계 외래어 - 리듬
    리듬은 음악, 무용, 언어 등에서 나타나는 시간적 패턴으로, 음악에서는 펄스, 비트, 마디 등의 시간 단위가 결합하여 형성되며, 언어학에서는 강세, 음절 등을 기준으로 분류된다.
  • 그리스어계 외래어 - 다이아몬드
    다이아몬드는 높은 경도, 열전도율, 광학적 투명도, 굴절률을 지닌 탄소 동소체로 보석 및 산업용으로 사용되지만, 채굴 과정에서 윤리적 문제가 발생하기도 하며 최근에는 합성 다이아몬드가 대체재로 부상하고 있다.
  • 영어계 외래어 - 텔레비전
    텔레비전은 움직이는 영상과 소리를 전기 신호로 변환하여 전송하고 수신 측에서 다시 영상과 소리로 바꾸는 기술을 이용한 매체로, 닙코프 원판을 이용한 초기 기계식 방식에서 음극선관 발명을 통해 전자식으로 발전하여 디지털 기술과 다양한 디스플레이 기술 발전을 거쳐 현재에 이르렀으며 사회, 문화, 경제적으로 큰 영향을 미치지만 건강 문제 및 부정적 콘텐츠 노출 등의 부작용도 존재한다.
  • 영어계 외래어 - 파이
    파이는 다양한 재료로 만들 수 있는 구운 요리이며, 쇼트 페이스트 반죽을 사용하여 짭짤하거나 달콤하게 만들 수 있고, 문화적 의미와 유머의 소재로도 사용된다.

2. 역사

파라메트릭 스테레오 개발은 낮은 대역폭의 스테레오 미디어에서 오디오 코딩 효율을 더욱 향상시키기 위한 필요성에 의해 이루어졌다. 여러 번의 반복과 개선을 거쳐 MPEG-4 오디오의 기능 세트에 포함되면서 알고리즘으로 표준화되었다. 파라메트릭 스테레오는 원래 스웨덴 스톡홀름에서 필립스와 코딩 테크놀로지스에 의해 개발되었으며, 2004년 이탈리아 나폴리에서 열린 제7회 국제 디지털 오디오 효과 컨퍼런스(DAFx'04)에서 처음 공개되었다.

2.1. 배경

고급 오디오 코딩 로우 컴플렉시티(AAC LC)에 스펙트럼 대역 복제(SBR)와 파라메트릭 스테레오(PS)를 결합한 것을 HE-AAC v2로 정의한다. HE-AAC v1 디코더는 HE-AAC v2 비트스트림을 디코딩할 때 모노 사운드만 제공하는 한계가 있다. 파라메트릭 스테레오는 주파수 영역에서 SBR이 수행하는 것과 유사하게 공간 영역에서 희소 코딩을 수행한다. AAC HE v2 비트스트림은 인코더에서 스테레오 오디오를 모노로 다운믹싱하고 2–3 kbit/s의 파라메트릭 스테레오 정보를 추가하여 디코더에서 공간 강도 스테레오 생성 및 앰비언스 재생을 가능하게 한다. 파라메트릭 스테레오 정보와 모노 오디오 스트림을 함께 사용함으로써 디코더는 매우 낮은 비트 전송률에서도 원본 스테레오 파노라마에 대한 충실한 공간 근사치를 재생할 수 있다. 단일 오디오 채널과 파라메트릭 정보만 전송되므로 파라메트릭 스테레오를 사용하는 24 kbit/s 코딩된 오디오 신호는 기존 방식으로 인코딩된 개별 스테레오 오디오 신호에 비해 품질이 상당히 향상된다. 그러나 이 기술은 매우 낮은 비트 전송률(약 16–48 kbit/s, DRM에서 사용되는 xHE-AAC의 14.4 kbps)에서 좋은 스테레오 인상을 주기 위해서만 유용하며, 일반적으로 투명성을 달성하지 못한다. 비트 전송률에 관계없이 오디오의 스테레오 역학을 시뮬레이션하는 데 제한이 있어 체감 품질이 저하될 수 있다.

2.2. 개발

파라메트릭 스테레오 개발은 낮은 대역폭의 스테레오 미디어에서 오디오 코딩 효율을 더욱 향상시키기 위한 필요성에 의해 이루어졌다. 여러 번의 반복과 개선을 거쳐 MPEG-4 오디오의 기능 세트에 포함되면서 알고리즘으로 표준화되었다. 파라메트릭 스테레오는 원래 스웨덴 스톡홀름에서 필립스와 코딩 테크놀로지스에 의해 개발되었으며, 2004년 이탈리아 나폴리에서 열린 제7회 국제 디지털 오디오 효과 컨퍼런스(DAFx'04)에서 처음 공개되었다.

3. 접근 방식 (Approaches)

MPEG-4에서의 구현은 혼합된 모노 오디오에서 각 주파수 대역별로 좌우 채널의 상대적인 양, 지연 및 상관 관계(일관성)를 지정하는 것을 기반으로 한다. 이 접근 방식은 과도 신호에 대한 특별한 처리를 통해 지연 문제를 완화한다. PS는 강도 스테레오 코딩에 비해 더 많은 주변감을 제공할 수 있다. MPEG 서라운드는 PS와 관련된 기술을 사용한다.

3.1. 개선 사항

파라메트릭 스테레오(PS)에 대한 개선이 계속 제안되고 있다.

* 2006년의 한 컨퍼런스 보고서에서는 다운믹싱 시 진폭 손실을 완화하는 방법을 설명한다.
* 2009년 논문에서는 PS에 파일럿 기반 코딩을 추가하는 방법을 제안한다.
* 2011년 컨퍼런스 논문에서는 PS 인공물을 기록하고 제거하기 위해 추가적인 "잔여 정보"를 사용하는 것을 설명한다.

4. 관련 기술

MPEG 서라운드는 파라메트릭 스테레오(PS) 관련 기술을 사용한다.