스펙트럼 대역 복제
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
스펙트럼 대역 복제(SBR)는 낮은 주파수 정보를 사용하여 높은 주파수 정보를 복원하는 기술이다. 1970년대부터 오럴 엑사이저와 같은 이펙터와 음성 부호화 분야에서 고역 주파수 복원 연구가 진행되었으며, SBR 기술은 이러한 연구의 연장선상에 있다. 코딩 테크놀로지스는 SBR 기술을 개발하여 MPEG-2 AAC 파생 코덱인 aacPlus에 적용했고, 이는 MPEG-4 HE-AAC 표준의 기초가 되었다. SBR은 MPEG-4 HE-AAC, mp3PRO 등 다양한 코덱에 사용되며, 디지털 라디오 기술인 DAB+, DRM+, HD Radio, XM 위성 라디오 등에서도 활용된다.
더 읽어볼만한 페이지
- 오디오 코덱 - NICAM
NICAM은 1970년대 BBC에서 개발된 디지털 오디오 방송 시스템으로, 32kHz 샘플링 주파수와 14비트 PCM을 사용하여 음성 신호를 인코딩하고 스테레오 음향, 이중 언어 방송, 데이터 채널 전송 등의 기능을 제공하며 아날로그 방송의 음성 전송 방식으로 사용되었으나 디지털 방송으로의 전환으로 사용이 줄어들었다. - 오디오 코덱 - G.711
G.711은 8 kHz 표본 추출 주파수와 64 kbit/s의 비트 전송률을 갖는 파형 음성 코더로, μ-law와 A-law라는 두 가지 컴팬딩 알고리즘을 사용하며, 부록 I, II 및 확장 표준을 통해 네트워크 환경에서의 효율성과 음질을 높인다.
스펙트럼 대역 복제 |
---|
2. 역사
낮은 주파수 정보로부터 높은 주파수 정보를 복원하는 아이디어는 오래전부터 존재했다.
코딩 테크놀로지스(2007년 돌비에 인수)는 스펙트럼 대역 복제(SBR) 기술을 사용하는 HE-AAC 코덱을 개발했다.
"일반" 압축 오디오 데이터와 함께 전송된 사이드 정보를 사용할 수 없는 경우, "베이스밴드" 데이터(예: 44.1kHz 대신 22.05kHz로 샘플링됨)를 평소처럼 재생할 수 있으며, 고주파수가 누락되어 둔탁하지만 다른 면에서는 대부분 허용 가능한 소리가 난다. 이는 SBR 정보를 활용할 수 없는 MP3 소프트웨어로 mp3PRO 파일을 재생하는 경우에 해당한다.
Opus의 CELT 부분은 MDCT 빈 레벨에서 ''스펙트럼 폴딩''을 수행하며, 이는 SBR에 비해 덜 발전되었지만 지연 시간이 짧은 기술이다.[6]
돌비 디지털 플러스(E-AC3)는 ''스펙트럼 확장''(SPX)을 수행한다. SPX는 고주파 구성 요소를 메타데이터로 줄이며 E-AC3 멀티채널 커플링 계산과 유사하다.[7] 돌비 AC-4는 이 기술을 어드밴스드 스펙트럼 확장(A-SPX)으로 확장하여, 시간 또는 주파수 도메인에서 일반적이고 확장되지 않은 데이터와 인터리빙하는 옵션을 제공한다. 결과적으로, SPX는 어려운 부분에 대해 선택적으로 비활성화될 수 있다.[8]
2. 1. 초기 아이디어
1970년대 스튜디오 녹음에서 사용되던 이펙터인 오럴 엑사이저는 필터 회로와 비선형 처리를 통해 배음을 추가하여 보컬을 명료하게 만드는 데 사용되었으며, 높은 주파수 정보를 강화하는 효과가 있었다. 음성 부호화 분야에서도 1970년대부터 고역 주파수 복원 재생(High-Frequency Regeneration, HFR) 연구가 진행되었다.2. 2. SBR 기술 개발
코딩 테크놀로지스(2007년 돌비에 인수)는 2001년에 처음 등장한 aacPlus라는 MPEG-2 AAC 파생 코덱에서 SBR 사용을 개발하고 개척했다. 이 코덱은 MPEG에 제출되었고 2003년에 표준화된 MPEG-4 고효율 AAC(HE-AAC)의 기초를 형성했다.[2] 라르스 릴리에리드, 크리스토퍼 쾨르링, 마틴 디에츠는 HE-AAC 개발 및 마케팅에 기여한 공로로 2013년 IEEE 마사루 이부카 소비자 전자상 어워드를 수상했다.[3][4] 코딩 테크놀로지스의 SBR 방식은 WMA 10 Professional과 함께 WMA 10 Pro LBR을 만들고, MP3와 함께 mp3PRO를 만드는 데 사용되었다.SBR을 사용하는 HE-AAC는 DAB+, Digital Radio Mondiale(xHE-AAC 포함), HD 라디오, XM 위성 라디오와 같은 방송 시스템에서 사용된다.[5]
3. 기술 방식
SBR은 낮은 주파수 정보와 높은 주파수 정보 간의 상관관계를 이용한다. SBR은 인코딩과 디코딩 과정을 거친다.[9][10]
3. 1. 인코딩
SBR 인코딩 과정에서는 다운샘플링된 (일반적으로 2:1) 오디오 신호와 안내 정보를 생성한다. 초기에는 직교 거울 필터(QMF) 분석 및 엔벨로프 추정기를 사용하여 안내 데이터를 생성했다.[9]3. 2. 디코딩
SBR 디코딩에는 하모닉스를 전치해야 하는데, 이는 오디오 시간 늘이기 및 피치 스케일링의 한 예이다.[10]- 전통적인 접근 방식: 이산 푸리에 변환(DFT)을 짧게 수행하고, 위상을 조정한 뒤, IDFT를 거쳐 오버랩-애드(Overlap-Add)로 마무리한다. 이 방법은 과도 신호에 민감하여 에코를 발생시킬 수 있으며, DFT에 약간의 패딩(USAC의 경우 50%)이 필요하다.
- 새로운 접근 방식: 직교 거울 필터(QMF)를 사용한다. 하나의 필터 뱅크가 전체 시간 늘이기 및 피치 스케일 조작을 모두 수행하여 계산 복잡성을 줄일 수 있다.
4. 코덱
SBR 기술은 다양한 오디오 코덱과 결합하여 사용될 수 있다. 코딩 테크놀로지스의 SBR 방식은 WMA 10 Professional과 함께 WMA 10 Pro LBR을 만드는 데 사용되었다.
Opus의 CELT 부분은 MDCT 빈 레벨에서 ''스펙트럼 폴딩''을 수행하며, 이는 SBR에 비해 덜 발전되었지만 지연 시간이 짧은 기술이다.[6]
돌비 디지털 플러스(E-AC3)는 ''스펙트럼 확장''(SPX)을 수행한다. SPX는 고주파 구성 요소를 메타데이터로 줄이며 E-AC3 멀티채널 커플링 계산과 유사하다.[7] 돌비 AC-4는 이 기술을 어드밴스드 스펙트럼 확장(A-SPX)으로 확장하여, 시간 또는 주파수 도메인에서 일반적이고 확장되지 않은 데이터와 인터리빙하는 옵션을 제공한다. 결과적으로, SPX는 어려운 부분에 대해 선택적으로 비활성화될 수 있다.[8]
4. 1. MPEG 코덱
코딩 테크놀로지스(2007년 돌비에 인수)는 2001년에 처음 등장한 aacPlus라는 AAC 파생 코덱에서 SBR 기술을 개발했다. 이 코덱은 MPEG에 제출되었고 2003년에 표준화된 고효율 AAC(HE-AAC)의 기초를 형성했다.[2] 라르스 릴리에리드, 크리스토퍼 쾨르링, 마틴 디에츠는 HE-AAC 개발 및 마케팅에 기여한 공로로 2013년 IEEE 마사루 이부카 소비자 전자상 어워드를 수상했다.[3][4] 코딩 테크놀로지스의 SBR 방식은 MP3와 함께 mp3PRO를 만드는 데 사용되었다.SBR을 사용하는 HE-AAC는 DAB+, Digital Radio Mondiale(xHE-AAC 포함), HD 라디오, XM 위성 라디오와 같은 방송 시스템에서 사용된다.[5]
4. 2. 디지털 라디오
SBR을 사용하는 HE-AAC는 DAB+, Digital Radio Mondiale(xHE-AAC 포함), HD 라디오, XM 위성 라디오와 같은 방송 시스템에서 사용된다.[5]SBR 정보를 활용할 수 없는 MP3 소프트웨어로 mp3PRO 파일을 재생하는 경우처럼, 플레이어가 "일반" 압축 오디오 데이터와 함께 전송된 사이드 정보를 사용할 수 없는 경우에는 "베이스밴드" 데이터(예: 44.1kHz 대신 22.05kHz로 샘플링됨)를 평소처럼 재생할 수 있다. 이때 고주파수가 누락되어 둔탁하게 들리지만, 다른 면에서는 대부분 허용 가능한 소리가 난다.
5. 한국에서의 활용
(이전 답변에서 원문 소스가 제공되지 않아 섹션 내용을 작성할 수 없다고 말씀드렸습니다. 수정 또한 원문 소스가 있어야 가능합니다. 원문 소스를 제공해주시면 지침에 따라 수정해 드리겠습니다.)
참조
[1]
웹사이트
Spectral Band Replication and aacPlus Coding - An Overview
http://www.telos-sys[...]
2010-02-08
[2]
웹사이트
Bandwidth extension, ISO/IEC 14496-3:2001/Amd 1:2003
http://www.iso.org/i[...]
ISO
2009-10-13
[3]
웹사이트
IEEE Masaru Ibuka Consumer Electronics Award
http://www.ieee.org/[...]
2015-07-07
[4]
웹사이트
Interview with Martin Dietz, Kristofer Kjörling, and Lars Liljeryd
https://www.youtube.[...]
2015-07-07
[5]
웹사이트
XM Radio – Fast Facts
http://sounds.xmradi[...]
2010-02-08
[6]
웹사이트
High-Quality, Low-Delay Music Coding in the Opus Codec
http://jmvalin.ca/pa[...]
Xiph.Org Foundation
2013-10-17
[7]
웹사이트
Introduction to Dolby Digital Plus, an Enhancement to the Dolby Digital Coding System
https://www.dolby.co[...]
2004-10-01
[8]
웹사이트
Dolby® AC-4: Audio delivery for next-generation entertainment services
https://professional[...]
[9]
웹사이트
Bandwidth extension of audio signals by spectral band replication
https://www.esat.kul[...]
2022-11
[10]
웹사이트
QMF Based Harmonic Spectral Band Replication
https://www.aes.org/[...]
Audio Engineering Society
2011-10-19
[11]
간행물
Spectral Band Replication, a novel approach in audio coding
112th AES Convention, Munich
2002
[12]
웹사이트
Dolby Laboratories to Acquire Coding Technologies
http://investor.dolb[...]
2010-06-08
[13]
간행물
Aural Exciter and Loudness Maximizer: What's psychoacoustic about "Psychoacoustic Processors" ?
109th AES Convention, Los Angeles
2000
[14]
간행물
High-Frequency Regeneration in Speech Coding Systems
IEEE Proc. ICASSP, pp.428-431
1979
[15]
웹사이트
Bandwidth extension, ISO/IEC 14496-3:2001/Amd 1:2003
http://www.iso.org/i[...]
ISO
2003
[16]
웹사이트
Spectral Band Replication and aacPlus Coding - An Overview
http://www.telos-sys[...]
2010-06-08
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com