맨위로가기

G.729.1

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

G.729.1은 G.729 코덱을 기반으로 하여 여러 음성 부호화 방식을 계층적으로 결합하여 비트 전송률과 대역폭의 유연성을 향상시킨 기술 규격이다. 50 Hz-7 kHz의 음성/오디오 신호를 입력으로 받아 8 kbps에서 32 kbps까지 12 종류의 비트 전송률로 부호화할 수 있으며, 12계층의 임베디드 구조를 통해 필요한 계층만 추출하여 사용할 수 있다. 핵심 계층은 G.729와 동일한 ACELP 알고리즘을 사용하며, G.729, G.729.A, G.729.B와 상호 운용성을 제공한다. G.729.1은 음성 및 음악 등 일반적인 오디오를 지원하며, 16 kHz/16 bit의 샘플링 주파수를 사용하고, 20ms의 프레임 길이를 가진다. 부호화된 데이터는 실시간 전송 프로토콜(RTP)을 통해 인터넷으로 전송할 수 있으며, IETF 표준 RFC 4749 및 RFC 5459에서 관련 데이터 형식을 정의하고 있다.

더 읽어볼만한 페이지

  • ITU-T G 시리즈 권고 - G.711
    G.711은 8 kHz 표본 추출 주파수와 64 kbit/s의 비트 전송률을 갖는 파형 음성 코더로, μ-law와 A-law라는 두 가지 컴팬딩 알고리즘을 사용하며, 부록 I, II 및 확장 표준을 통해 네트워크 환경에서의 효율성과 음질을 높인다.
  • ITU-T G 시리즈 권고 - HDSL
    HDSL은 T1 및 E1 서비스용 디지털 가입자 회선 기술 표준으로, 에코 제거 방식을 통해 전이중 통신을 지원하며, 이후 새로운 대칭 DSL 기술로 대체되었다.
  • 음성 코덱 - G.711
    G.711은 8 kHz 표본 추출 주파수와 64 kbit/s의 비트 전송률을 갖는 파형 음성 코더로, μ-law와 A-law라는 두 가지 컴팬딩 알고리즘을 사용하며, 부록 I, II 및 확장 표준을 통해 네트워크 환경에서의 효율성과 음질을 높인다.
  • 음성 코덱 - G.729
    G.729는 ITU-T에서 표준화한 8kbps의 음성 코덱으로, ACELP 코딩 방식을 사용하여 VoIP, 화상 회의 등 다양한 통신 시스템에서 활용되며, G.729a(낮은 복잡도), G.729b(음성 활동 감지 및 불연속 전송 기능) 등의 부록을 가진다.
  • ITU-T 권고 - 비대칭 디지털 가입자 회선
    비대칭 디지털 가입자 회선(ADSL)은 전화선을 이용하여 다운로드 속도가 더 빠른 비대칭적인 고속 데이터 통신을 제공하는 기술로, 주파수 분할 이중 방식과 이산 다중톤 변조 방식을 사용하며 거리와 잡음에 따라 속도 저하가 발생할 수 있고 광섬유 인터넷의 발전으로 서비스가 축소되고 있다.
  • ITU-T 권고 - 팩시밀리
    팩시밀리는 문서나 그림을 전기 신호로 원격 전송하고 복제하는 기술 및 장치이며, 유선, 무선, 전화선을 이용한 전송 방식으로 발전해왔고, 기술적 분류를 거쳐 소형화, 고속화되었으며, 21세기에는 사용량이 감소했으나 특정 분야에서 활용된다.
G.729.1
G.729.1
공식 명칭G.729 기반 임베디드 가변 비트 전송률 코더
긴 명칭G.729 기반 임베디드 가변 비트 전송률 코더: G.729와 상호 운용 가능한 8-32kbit/s 확장 가능 광대역 코더 비트스트림
상태시행 중
시작 연도2006년
버전(03/13)
버전 날짜2013년 3월
조직ITU-T
위원회ITU-T Study Group 16
기반 표준해당 사항 없음
관련 표준G.711
G.729
약어해당 사항 없음
도메인오디오 압축
라이선스비자유
웹사이트G.729.1

2. 기술 규격

G.729를 핵심 코덱으로 하여, 여러 음성 부호화 방식을 계층적으로 결합하여 비트 전송률, 대역폭의 유연성을 향상시킨 것이다.

일반적인 전화 인터페이스의 2배의 대역폭을 가진 50 Hz-7 kHz(샘플링 주파수 16 kHz)의 음성/오디오 신호를 입력으로 하여, 50 Hz-4 kHz의 대역폭을 가진 신호를 8~12 kbps로, 50 Hz-7 kHz의 대역폭을 가진 신호를 14~32 kbps로 부호화할 수 있다.[3]

G.729.1이 지원하는 8 kbps~32 kbps까지의 12 종류의 비트 전송률에 대응하여 코덱이 출력하는 비트열은 12 계층의 임베디드 구조로 되어 있다. 부호화된 비트열에서 필요한 계층만 쉽게 꺼낼 수 있다.[4]

비트 전송률 8 kbps에 대응하는 것이 핵심 계층인 제1계층으로, G.729와 동일한 부호화 알고리즘을 사용하며, 출력 비트열은 G.729, G.729.A, G.729.B와 완전한 상호 운용성을 갖는다. 제2계층은 4 kbps의 G.729의 확장 계층이다. 제3계층부터 12계층까지는 50 Hz-7 kHz의 광대역 음성/오디오 신호를 처리할 수 있다. 2 kbps 단위로 정보가 증가하며, 그에 따라 음질이 향상된다. 각 계층과 사용하는 알고리즘은 다음과 같다.

G.729.1의 전체 구성
계층알고리즘대역폭최종 비트 전송률설명
1ACELP (algebraic CELP)50 Hz-4 kHz8 kbps핵심 계층
2ACELP (algebraic CELP)50 Hz-4 kHz12 kbps핵심 계층의 추가 부분
3TDBWE (time-domain bandwidth extension)4 kHz-7 kHz14 kbps거친 매개변수화된 고역 성분
4-12TDAC (time-domain aliasing cancellation)50 Hz-7 kHz16-32 kbps (2 kbps 단위)부가 정보



부호화된 정보는 제1계층에서 제12계층까지 순서대로 비트열을 나열한 형태로 표현되며, 비트 전송률과 음질의 조정은 단순히 비트열을 잘라내는 것으로 가능하다.

G.729.1의 특징은 다음과 같다.


  • 음성과 음악 등 일반적인 오디오를 모두 지원
  • 입출력 샘플링 주파수 16 kHz/16 bit
  • 8~32 kbps까지의 12 종류의 비트 전송률 (50 Hz-4 kHz를 8-12 kbps, 50 Hz-7 kHz를 14-32 kbps로 부호화)
  • 12 계층의 임베디드 구조 비트스트림
  • 8 kbps의 핵심 계층은 G.729, G.729.A, G.729.B와 상호 운용성이 있음
  • 20 ms의 프레임 길이, 부호화 지연 48.9375 ms
  • 3 종류의 음성 부호화 알고리즘의 계층적 조합


G.729.1의 부호화 데이터를 실시간 전송 프로토콜 (RTP)을 이용하여 인터넷으로 전송하기 위한 데이터 형식은 IETF 표준 RFC 4749, RFC 5459에서 정의되어 있다.[5][6]

3. 알고리즘

G.729.1은 G.729와 유사한 알고리즘을 핵심으로 하는 3가지 종류의 음성 부호화 알고리즘의 계층적 조합으로 구성된다. 핵심 알고리즘으로 입력 신호를 부호화하고, 부호화할 수 없었던 나머지 부분을 다른 두 알고리즘을 사용하여 부가 정보로 추가한다.

핵심에는 음성 부호화의 대표적인 알고리즘인 CELP의 일종인 '''ACELP'''(algebraic code excited linear prediction)를 사용한다. 4 kHz-7 kHz까지의 높은 주파수 성분 부호화에는 '''TDBWE'''(time-domain bandwidth extension)라는 파라미터 부호화 알고리즘을 사용한다. 음성의 저역 성분과 비교하면 고역 성분에는 많은 정보가 포함되어 있지 않기 때문에, 이 알고리즘에서는 시간 영역엔벨로프주파수 영역엔벨로프를 꽤 거칠게 파라미터화하여 부호화를 수행한다.

이 이상의 비트 전송률의 경우, 핵심 부분에서 부호화할 수 없었던 신호 성분만을 별도로 부호화하여 부가 정보로 제4계층 이상에 추가한다. 핵심 부분에서 부호화할 수 있었던 성분과 원래 신호와의 차이는 '''TDAC'''(time-domain aliasing cancellation) 알고리즘을 사용하여 부호화한다. TDAC에서는 입력 신호를 MDCT(수정 이산 코사인 변환)에 의해 주파수 영역의 파라미터로 변환한 후 18개의 서브밴드로 분할하고, 서브밴드별 게인과 스펙트럼 모양을 각각 벡터 양자화한다. 에너지가 작은 서브밴드와 같이 청감상 중요도가 낮은 서브밴드에 적은 비트를 할당하여 정보 압축을 수행하며, 청감상 중요도가 높은 서브밴드일수록 계층이 낮은 층에 부호화하여 정보의 계층화를 수행한다.

G.729.1은 IP 네트워크와 같은 패킷 손실이나 패킷 지연이 많은 환경에서의 이용을 상정하고 있기 때문에, 부호화 알고리즘의 결과와는 별도로, 통신로에서의 정보 손실 시 음질 저하를 피하기 위한 보조 정보도 각 계층에 저장되어 있으며, 필요에 따라 복호 시에 사용된다.

3. 1. 핵심 계층 (8 kbps)

G.729와 동일한 부호화 알고리즘을 사용하며, 출력 비트열은 G.729, G.729A, G.729B와 완전한 상호 운용성을 갖는다.[4] 핵심 계층은 50 Hz-4 kHz의 입력 신호를 8 kbps로 부호화한다. 핵심에는, 음성 부호화의 대표적인 알고리즘인 CELP의 일종인 '''ACELP'''(algebraic code excited linear prediction)를 사용하는데, 이는 G.729에서 사용되는 것과 동일한 알고리즘이다.

3. 2. 확장 계층 (12 kbps)

G.729의 확장 계층으로, 핵심 계층에 4kbps를 추가하여 음질을 향상시킨다. 이 계층은 ACELP 알고리즘을 사용한다.

3. 3. 광대역 확장 계층 (14 kbps)

TDBWE (Time-Domain Bandwidth Extension)는 4 kHz에서 7 kHz까지의 고주파 성분을 담당하는 알고리즘이다. 이 알고리즘은 시간 영역주파수 영역엔벨로프를 꽤 거칠게 파라미터화하여 부호화를 수행한다. TDBWE는 핵심 부분과 조합하여 50 Hz-7 kHz의 입력을 14 kbps로 부호화한다.

3. 4. 추가 계층 (16-32 kbps)

G.729.1의 추가 계층(16-32 kbps)에서는 TDAC (Time-Domain Aliasing Cancellation) 알고리즘을 사용하여 핵심 계층에서 부호화하지 못한 신호 성분을 부호화한다. TDAC는 변환 예측 부호화(transform predictive coding) 기법 중 하나이다.

TDAC는 입력 신호를 MDCT(수정 이산 코사인 변환)를 통해 주파수 영역 파라미터로 변환한 후, 18개의 서브밴드로 분할한다. 각 서브밴드별 게인과 스펙트럼 모양을 벡터 양자화한다. 에너지가 작아 청감상 중요도가 낮은 서브밴드에는 적은 비트를 할당하여 정보 압축을 수행한다. 또한, 청감상 중요도가 높은 서브밴드일수록 낮은 계층에 부호화하여 정보의 계층화를 수행한다. 예를 들어, 가장 중요한 서브밴드의 정보는 제4계층에 저장되고, 중요도가 낮은 서브밴드는 그보다 높은 계층에 저장된다.

4. 계층 구조

G.729.1은 G.729를 핵심 코덱으로 하여, 여러 음성 부호화 방식을 계층적으로 결합하여 비트 전송률, 대역폭의 유연성을 향상시킨 것이다. 비트 전송률 8kbps에 대응하는 것이 핵심 계층인 제1계층으로, G.729와 동일한 부호화 알고리즘을 사용하며, 출력 비트열은 G.729, G.729.A, G.729.B와 완전한 상호 운용성을 갖는다.[4] 제2계층은 4kbps의 G.729 확장 계층이다. 제3계층부터 12계층까지는 50Hz-7kHz의 광대역 음성/오디오 신호를 처리할 수 있다. 2kbps 단위로 정보가 증가하며, 그에 따라 음질이 향상된다.

각 계층과 사용하는 알고리즘은 다음과 같다.

G.729.1의 전체 구성
계층알고리즘대역폭최종 비트 전송률설명
1ACELP (algebraic CELP)50 Hz-4 kHz8 kbps핵심 계층
2ACELP (algebraic CELP)50 Hz-4 kHz12 kbps핵심 계층의 추가 부분
3TDBWE (time-domain bandwidth extension)4 kHz-7 kHz14 kbps거친 매개변수화된 고역 성분
4-12TDAC (time-domain aliasing cancellation)50 Hz-7 kHz16-32 kbps (2 kbps 단위)부가 정보


참조

[1] 웹사이트 G.729.1: G.729-based embedded variable bit-rate coder: An 8-32 kbit/s scalable wideband coder bitstream interoperable with G.729 https://www.itu.int/[...] 2021-04-06
[2] 서적 VoIP Voice and Fax Signal Processing https://books.google[...] John Wiley & Sons 2008
[3] 간행물 G.729-based embedded variable bit-rate coder:An 8-32 kbit/s scalable wideband coder bitstream interoperable with G.729 ITU-T 2006-05
[4] 서적 Springer Handbook of Speech Processing Springer 2007
[5] 웹사이트 RTP Payload Format for the G.729.1 Audio Codec https://datatracker.[...] IETF Network Working Group. 2006
[6] 웹사이트 G.729.1 RTP Payload Format Update:Discontinuous Transmission (DTX) Support https://datatracker.[...] IETF Network Working Group. 2009



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com