G.719
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
G.719는 MP3나 AAC와 유사하게 MDCT(수정 이산 코사인 변환)를 사용하는 오디오 압축 방식이다. 48kHz로 샘플링된 신호를 주파수 영역 파라미터로 변환하고, 스펙트럼 평준화, 격자 벡터 양자화 및 부호화, 잡음 레벨 조정을 거쳐 부호화하며, 복호화는 부호화 과정의 역순으로 진행된다. 이 코덱은 고음질 IP 전화, 화상 회의 시스템, 음악 스트리밍 등 다양한 분야에 활용될 수 있으며, 사용을 위해서는 폴리콤과 에릭슨의 라이선스가 필요하다.
더 읽어볼만한 페이지
- ITU-T G 시리즈 권고 - G.711
G.711은 8 kHz 표본 추출 주파수와 64 kbit/s의 비트 전송률을 갖는 파형 음성 코더로, μ-law와 A-law라는 두 가지 컴팬딩 알고리즘을 사용하며, 부록 I, II 및 확장 표준을 통해 네트워크 환경에서의 효율성과 음질을 높인다. - ITU-T G 시리즈 권고 - HDSL
HDSL은 T1 및 E1 서비스용 디지털 가입자 회선 기술 표준으로, 에코 제거 방식을 통해 전이중 통신을 지원하며, 이후 새로운 대칭 DSL 기술로 대체되었다. - 음성 코덱 - G.711
G.711은 8 kHz 표본 추출 주파수와 64 kbit/s의 비트 전송률을 갖는 파형 음성 코더로, μ-law와 A-law라는 두 가지 컴팬딩 알고리즘을 사용하며, 부록 I, II 및 확장 표준을 통해 네트워크 환경에서의 효율성과 음질을 높인다. - 음성 코덱 - G.729
G.729는 ITU-T에서 표준화한 8kbps의 음성 코덱으로, ACELP 코딩 방식을 사용하여 VoIP, 화상 회의 등 다양한 통신 시스템에서 활용되며, G.729a(낮은 복잡도), G.729b(음성 활동 감지 및 불연속 전송 기능) 등의 부록을 가진다. - ITU-T 권고 - 비대칭 디지털 가입자 회선
비대칭 디지털 가입자 회선(ADSL)은 전화선을 이용하여 다운로드 속도가 더 빠른 비대칭적인 고속 데이터 통신을 제공하는 기술로, 주파수 분할 이중 방식과 이산 다중톤 변조 방식을 사용하며 거리와 잡음에 따라 속도 저하가 발생할 수 있고 광섬유 인터넷의 발전으로 서비스가 축소되고 있다. - ITU-T 권고 - 팩시밀리
팩시밀리는 문서나 그림을 전기 신호로 원격 전송하고 복제하는 기술 및 장치이며, 유선, 무선, 전화선을 이용한 전송 방식으로 발전해왔고, 기술적 분류를 거쳐 소형화, 고속화되었으며, 21세기에는 사용량이 감소했으나 특정 분야에서 활용된다.
G.719 | |
---|---|
G.719 | |
![]() | |
다른 이름 | Polycom Siren 22 |
개발자 | Polycom |
일반 | |
유형 | 풀밴드 오디오 코덱 |
코딩 유형 | 변환 코딩 |
샘플링 속도 | 48 kHz |
비트 전송률 | 32 kbit/s에서 128 kbit/s까지 |
프레임 크기 | 20 ms |
프레임당 샘플 수 | 960 |
지연 시간 | 25 ms |
대역폭 | 20 Hz에서 20 kHz |
표준 | ITU-T G.719 |
특징 | |
복잡성 | 낮음 |
용도 | 고품질 회화 애플리케이션 |
설명 | 로열티가 없는 최초의 풀밴드 오디오 코덱 |
기술 | |
변환 코딩 | 시간 영역에서 주파수 영역으로 신호를 변환하여 주파수 성분을 코딩하는 방식 |
MDCT | 수정 이산 코사인 변환을 사용하여 주파수 분석 수행 |
양자화 | 대수 벡터 양자화 방식을 사용하여 주파수 성분 양자화 |
2. 기술적 특징
G.719는 샘플링 주파수 48kHz, 16비트 길이의 입출력을 가지며, 인간의 청각 가청 영역인 20Hz-20kHz의 풀 밴드 음성/오디오 신호를 부호화할 수 있다.
G.719의 부호화 알고리즘은 지각 부호화(perceptual audio coding)의 일종인 변환 부호화(transform coding)를 기반으로 한다. MDCT(modified discrete cosine transform, 수정 이산 코사인 변환)를 사용하여 주파수 영역의 계수로 변환하고, 적응 비트 할당과 격자 벡터 양자화(lattice vector quantization)를 수행한다. 입력 신호 내용에 따라 이산 코사인 변환의 시간 분해능을 변화시켜 변화가 심한 소리에 대한 음질 향상을 도모한다.
G.719는 다음과 같은 특징을 가진다.
- 고품질의 음성/오디오를 모두 지원한다.
- MP3(100MIPS 이상), MPEG4 AAC-LD(130MIPS 이상)에 비해 부호화/복호화 연산량이 17.7MIPS 정도로 낮다.
- 입출력 샘플링 주파수는 48kHz/16bit, 대역폭은 20Hz-20kHz이다.
- 32에서 128kbps까지 20종류의 비트율을 지원한다. (32-88kbps는 4kbps 단계, 88kbps-128kbps는 8kbps 단계)
- 프레임 길이는 20ms, 부호화 지연은 40ms이다.
2. 1. 알고리즘
G.719 코덱은 MP3, AAC와 같이 MDCT(수정 이산 코사인 변환)를 이용한 변환 부호화 방식을 사용한다. 부호화와 복호화 과정은 신호를 주파수 영역으로 변환하고, 효율적인 압축을 위해 양자화 및 잡음 레벨 조정 등의 단계를 거친다. 부호화 및 복호화 과정은 하위 섹션에서 자세히 설명한다.2. 1. 1. 부호화
G.719는 MP3, AAC 등과 같은 오디오 압축 방식과 마찬가지로, MDCT(수정 이산 코사인 변환)를 사용한 변환 부호화를 통해 부호화와 복호화를 수행한다.부호화는 48kHz로 샘플링된 신호에 대해 대략적으로 다음 단계로 진행된다.
1. 주파수 영역의 파라미터로 변환
- 신호의 과도 상태 검출
- 신호의 수정 이산 코사인 변환 (과도 상태 부분은 시간 분해능을 높임)
2. 스펙트럼 평준화
- 복수의 주파수 영역으로 나누어, 각 영역의 평균 에너지 레벨(노름)을 추정, 양자화
- 추정한 노름으로 스펙트럼을 평준화
3. 격자 벡터 양자화와 부호화
- 노름에 기초한 적응 비트 할당
- 고속 격자 벡터 양자화
4. 잡음 레벨 조정
처음에는 MDCT(수정 이산 코사인 변환)을 통해 신호를 주파수 영역의 파라미터로 변환한다. 통상적인 처리 시의 프레임 길이는 20ms이지만, 신호의 평균 에너지가 급변하는 부분(과도 상태 부분)을 검출하고 프레임 길이를 5ms로 변경하여 시간 분해능을 높임으로써 음질의 열화를 피한다. 과도 상태 부분 이외에서는 주파수 분해능을 우선시하여 긴 프레임 길이를 사용한다. 구한 계수는 4개의 밴드(0-3.2kHz, 3.2-6.4kHz, 6.4-13.6kHz, 13.6-20kHz)로 분할되며, 각 밴드 내의 MDCT 계수는 다시 계수의 그룹인 서브 벡터로 분할된다. 주파수가 높아질수록 주파수 분해능이 낮아지는 인간의 청감 특성에 맞춰, 주파수가 높아질수록 1개의 서브 벡터에 포함되는 계수는 많아진다. 즉, 1개의 서브 벡터가 커버하는 주파수 범위가 높은 주파수일수록 넓어진다.
다음 단계인 스펙트럼 평준화에서는, 처음에 서브 벡터별 평균 에너지 레벨(노름)을 추정하여 양자화한다. 그 후 MDCT 계수를 노름으로 나눔으로써, 전체 스펙트럼 평준화를 수행한다. 서브 벡터의 각 계수는 신호의 변동에 따라 동일하게 변화하는 경향이 있으므로, 스펙트럼 평준화를 통해 각 계수는 더 좁은 범위에 분포하게 된다. 이는 양자화와 정보 압축을 용이하게 한다.
이어서, 서브 벡터별로 비트 수 할당을 수행하고, 평준화된 각 MDCT 계수의 양자화와 부호화를 진행한다. 비트 수 할당은 앞에서 계산한 노름을 기반으로 적응적으로 수행된다. 평균 에너지 레벨이 높은(즉, 청감상 중요한) 서브 벡터에는 충분한 비트를 할당하고, 그렇지 않은 부분은 비트 수를 줄이거나 전혀 할당하지 않음으로써 정보를 압축한다.
서브 벡터에 포함된 MDCT 계수의 양자화 방법으로, 벡터 양자화의 일종인 격자 벡터 양자화(lattice vector quantization영어)를 사용한다. 격자 벡터 양자화는 벡터 양자화에서의 코드북을 격자상의 점으로 제한한 것으로, 통상의 벡터 양자화와 비교하면 양자화 특성은 떨어지지만 양자화에 필요한 계산량과 코드북에 필요한 메모리를 대폭 줄일 수 있으며, 또한 단순한 스칼라 양자화와 비교하면 양자화 특성이 우수하다. G.719에서는 고속 격자 벡터 양자화(fast lattice vector quantization영어)라는 알고리즘을 사용하여, 처리에 필요한 연산량 감소를 수행하고 있다.
마지막으로, 잡음 레벨 조정은 배경 잡음을 적절한 레벨로 조정하기 위한 것이다. 에너지 레벨이 낮은 서브 벡터(주파수 영역)에는 부호화 시에 비트가 할당되지 않으므로, 그러한 영역에서는 배경 잡음도 부호화되지 않는다. 디코더 측에서는 비트가 할당되지 않는 주파수 영역에서의 배경 잡음을 추정하여 재생하지만, 그 때 필요한 추정 잡음 레벨을 대략적으로 양자화한다.
2. 1. 2. 복호화
G.719의 복호화 과정은 부호화 과정의 역순으로 진행된다.1. 격자 복호화:
- 노름 복호화
- 스펙트럼 계수의 복호화
2. 잡음 레벨 조정:
- 추정 잡음 레벨을 사용하여 배경 잡음을 재생
3. 스펙트럼 엔벨로프 쉐이핑:
- 노름과 스펙트럼 계수로부터 실제 MDCT 계수를 복원
4. 시간 영역의 신호로 역변환:
- 역 MDCT를 수행
먼저 격자 벡터 양자화된 각 계수를 복호화한다. 이후, 부호화 시에 비트가 할당되지 않은 영역은 잡음 레벨을 추정하고, 낮은 주파수의 스펙트럼 성분을 부호화되지 않은 높은 주파수 측에 복사하여 배경 잡음의 레벨을 조정한다.
각 서브 벡터는 정규화되어 동일한 에너지 레벨로 맞춰져 있으므로, 이어서 복호화된 노름과 스펙트럼 계수로부터 실제 스펙트럼 엔벨로프를 복원한다.
마지막으로 복원된 각 MDCT 계수를 역변환하여 48kHz로 샘플링된 시간 영역의 신호를 얻는다.
2. 2. 주요 특징
ITU-T가 2008년 6월에 권고한 G.719는[7] 화상 회의 및 원격 회의 시스템에서 고품질 음성/오디오 통신을 지원한다. 주요 특징은 다음과 같다.- 고품질의 음성/오디오를 모두 지원한다.
- MP3 (100MIPS 이상), MPEG4 AAC-LD (130MIPS 이상)에 비해 부호화/복호화 연산량이 17.7MIPS 정도로 낮다.
- 입출력 샘플링 주파수는 48 kHz/16 bit이며, 대역폭은 20 Hz-20 kHz이다.
- 32~128 kbps까지 20 종류의 비트율을 지원한다. (32~88 kbps는 4 kbps 단계, 88~128 kbps는 8 kbps 단계)
- 프레임 길이는 20 ms, 부호화 지연은 40 ms이다.
G.719의 부호화 알고리즘은 지각 부호화의 일종인 변환 부호화에 기반한다. MDCT(수정 이산 코사인 변환)를 사용하여 주파수 영역의 계수로 변환하고, 적응 비트 할당과 격자 벡터 양자화를 수행한다.
인터넷 상의 RTP에 의한 G.719의 페이로드 형식은 RFC 5404에서 정의되어 있으며,[8] ISO 베이스 미디어 파일 포맷 형식은 G.719 ANNEX A의 사양으로 정의되어 있다.
3. 활용 분야
4. 라이선스
G.719를 사용하려면 폴리콤과 에릭슨 양사의 라이선스가 필요하다. 폴리콤 라이선스는 Siren7(G.722.1 관련)과 Siren14(G.722.1 부록 C 관련) 라이선스도 포함한다.[9]
참조
[1]
웹사이트
G.719: Low-complexity, full-band audio coding for high-quality, conversational applications
https://www.itu.int/[...]
2021-06-13
[2]
서적
Cosine-/Sine-Modulated Filter Banks: General Properties, Fast Algorithms and Integer Approximations
https://books.google[...]
Springer
2017
[3]
웹사이트
Polycom Siren 22
http://www.polycom.c[...]
Polycom, Inc.
2009-09-07
[4]
웹사이트
G.719: The First ITU-T Standard for Full-Band Audio
http://www.polycom.c[...]
Polycom, Inc.
2009-04-00
[5]
문서
RFC 5404 - RTP Payload Format for G.719
http://tools.ietf.or[...]
2009-06-17
[6]
간행물
Low-complexity, full-band audio coding for high-quality, conversational applications
ITU-T
2008-06-00
[7]
웹사이트
G.719: The First ITU-T Standard for Full-Band Audio
http://www.polycom.c[...]
Polycom, Inc.
2009-04-00
[8]
웹사이트
RTP Payload Format for G.719
https://datatracker.[...]
IETF Network Working Group.
2009-01-00
[9]
웹사이트
Siren7/Siren14/G.719 License Agreement
http://www.polycom.c[...]
Polycom, Inc.
2008-08-00
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com