AMR (코덱)
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
AMR 코덱은 4.75 kbit/s에서 12.2 kbit/s까지 다양한 비트 전송률을 지원하는 음성 코덱으로, 불연속 전송(DTX), 음성 활동 감지(VAD) 및 컴포트 노이즈(CNG) 등의 기술을 사용하여 대역폭 사용량을 줄인다. 무선 채널 및 용량 요구 사항에 따라 최적의 코덱 모드를 선택하는 링크 적응 기능을 제공하며, 하이브리드 음성 코더로 선형 예측 부호화(LPC)와 대수 코드 여기 선형 예측(ACELP)을 사용한다. AMR 코덱은 다양한 소프트웨어 및 장치에서 지원되며, 라이선스 및 특허와 관련된 문제가 있다.
AMR 코덱은 4.75 kbit/s에서 12.2 kbit/s까지 8개의 소스 코덱을 사용하여 다양한 비트 전송률을 지원한다.[1] 각 프레임은 160개의 샘플을 포함하며 길이는 20ms이다.[1] 샘플링 주파수는 8kHz/13비트이며, 200~3400Hz로 필터링된다.[1]
AMR은 무선 채널 및 용량 요구 사항에 따라 최적의 코덱 모드를 선택하는 링크 적응 기능을 제공한다. 무선 조건이 좋지 않은 경우, 소스 코딩을 줄이고 채널 코딩을 늘려 네트워크 연결의 품질과 견고성을 향상시킨다. 네트워크 운영자는 기지국별로 용량 또는 품질의 우선 순위를 정할 수 있다.[1]
AMR은 하이브리드 음성 코더로, 음성 파라미터와 파형 신호를 모두 전송한다. 선형 예측 부호화(LPC)는 잔여 파형에서 음성을 합성하는 데 사용되며, LPC 파라미터는 선 스펙트럼 쌍(LSP)으로 인코딩된다. 잔여 파형은 대수 코드 여기 선형 예측(ACELP)을 사용하여 코딩된다.[1] 알고리즘 지연 시간은 프레임당 20ms이며, 12.2 kbit/s 비트 전송률에서는 "알고리즘" 룩어헤드 지연이 없다. 다른 전송률의 경우 룩어헤드 지연은 5ms이다.[1] 알고리즘 복잡도는 5로 평가되는데, 이는 G.711이 1, G.729a가 15인 상대적 척도를 사용한 것이다.[1] [1]
AMR 코덱은 노키아, 에릭슨, NTT, 그리고 보이스에이지(VoiceAge)의 여러 특허를 포함하고 있다.[7][8] 보이스에이지는 AMR 특허 풀의 라이선스 관리자이다.[9][10]
3GPP TS 26.073 AMR 음성 코덱 참조 구현(C 소스 코드)이 있다.[11]
2. 특징
AMR은 불연속 전송(DTX), 음성 활동 감지(VAD), 컴포트 노이즈(CNG) 등의 기술을 사용하여 무음 구간 동안 대역폭 사용량을 줄인다.[1] 또한, 선형 예측 부호화(LPC)를 통해 잔여 파형에서 음성을 합성하고, 대수 코드 여기 선형 예측(ACELP)을 사용하여 잔여 파형을 코딩하는 하이브리드 음성 코더이다.[1]
AMR의 알고리즘 복잡도는 5로 평가되는데, 이는 G.711 (1)이나 G.729a (15)에 비해 상대적으로 낮은 수치이다.[1] 이상적인 조건에서 PSQM 테스트 결과, AMR(12.2kbit/s)의 평균 의견 점수(MOS)는 4.14로, G.711 (μ-law)의 4.45보다 약간 낮게 나타났다.[1] 네트워크 스트레스 환경에서는 AMR(12.2kbit/s)의 MOS는 3.79, G.711 (μ-law)는 4.13으로 나타났다.[1]
3. 사용
3. 1. AMR 모드
AMR 코덱에는 총 14가지 모드가 있으며, 8개는 전체 속도 채널(FR)에서 사용할 수 있고 6개는 반 속도 채널(HR)에서 사용할 수 있다.[1]모드 비트 전송률 (kbit/s) 채널 호환 가능 AMR_12.20 12.20 FR ETSI GSM 향상된 전체 속도 AMR_10.20 10.20 FR AMR_7.95 7.95 FR/HR AMR_7.40 7.40 FR/HR TIA/EIA IS-641 TDMA 향상된 전체 속도 AMR_6.70 6.70 FR/HR ARIB 6.7 kbit/s 향상된 전체 속도 AMR_5.90 5.90 FR/HR AMR_5.15 5.15 FR/HR AMR_4.75 4.75 FR/HR AMR_SID 1.80 FR/HR
4. 기술적 세부 사항
AMR 코덱은 12.2, 10.2, 7.95, 7.40, 6.70, 5.90, 5.15 및 4.75kbit/s의 비트 전송률을 가진 8개의 소스 코덱을 사용한다.[1] 샘플링 주파수는 8kHz/13비트(20ms 프레임당 160 샘플)이며, 200~3400Hz로 필터링된다.[1] AMR은 불연속 전송(DTX)을 활용하며, 음성 활동 감지(VAD) 및 컴포트 노이즈(CNG)를 사용하여 무음 구간 동안 대역폭 사용량을 줄인다.[1]
AMR FR 비트 전송률에 따른 프레임 길이는 다음과 같다.비트 전송률 (kbit/s) 프레임 길이 (비트) 4.75 95 5.15 103 5.90 118 6.70 134 7.40 148 7.95 159 10.2 204 12.2 244
이상적인 조건에서 PSQM 테스트는 AMR(12.2kbit/s)에 대해 4.14의 평균 의견 점수(MOS)를, G.711 (μ-law)에 대해 4.45를 생성한다. 네트워크 스트레스 환경에서 PSQM 테스트는 AMR(12.2kbit/s)에 대해 3.79의 MOS를, G.711 (μ-law)에 대해 4.13을 생성한다.[1]
5. 라이선스 및 특허 문제
전문 콘텐츠 제작 도구 및 "실시간 채널" 제품에 대한 초기 수수료는 6500USD이다. 연간 최소 로열티는 10000USD이며, 첫 해에는 초기 수수료가 제외된다. 채널별 라이선스 수수료는 수량에 따라 0.99USD에서 0.5달러로 감소하며, 연간 최대 200만달러까지이다.[7][8]
개인용 컴퓨터 제품(예: 미디어 플레이어)의 경우 AMR 디코더는 무료로 라이선스가 제공된다. 판매된 인코더의 라이선스 수수료는 수량에 따라 0.4달러에서 0.3달러로 감소하며, 연간 최대 300000USD까지이다. 최소 연간 로열티는 개인용 컴퓨터 제품 범주에 속하며 무료 디코더만 사용하는 라이선스 제품에는 적용되지 않는다.[7][8]
6. 소프트웨어 지원
다음은 AMR 코덱을 지원하는 소프트웨어 목록이다.
참조
[1]
웹사이트
3GPP TS 26.090 - Mandatory Speech Codec speech processing functions; Adaptive Multi-Rate (AMR) speech codec; Transcoding functions
http://www.3gpp.org/[...]
3GPP
2010-07-21
[2]
웹사이트
3GPP TS 26.071 - Mandatory speech CODEC speech processing functions; AMR speech Codec; General description
http://www.3gpp.org/[...]
3GPP
2010-07-21
[3]
웹사이트
What's toll-quality voice?
https://www.itworld.[...]
2000-12-13
[4]
문서
RFC 4867 - RTP Payload Format and File Storage Format for the Adaptive Multi-Rate (AMR) and Adaptive Multi-Rate Wideband (AMR-WB) Audio Codecs
http://tools.ietf.or[...]
Page 35
[5]
웹사이트
Sorting Through GSM Codecs: A Tutorial
http://www.eetimes.c[...]
2003-07-11
[6]
문서
RFC 4867 - RTP Payload Format and File Storage Format for the Adaptive Multi-Rate (AMR) and Adaptive Multi-Rate Wideband (AMR-WB) Audio Codecs
http://tools.ietf.or[...]
Page 35
[7]
웹사이트
AMR Licensing Terms
http://www.voiceage.[...]
VoiceAge Corporation
2007-10-14
[8]
웹사이트
AMR Licensing Terms
http://www.voiceage.[...]
VoiceAge Corporation
2007-06
[9]
웹사이트
Licensing - Patent Calls
http://www.voiceage.[...]
VoiceAge Corporation
[10]
웹사이트
Licensing - Patent Calls
http://www.voiceage.[...]
2007-10-14
[11]
간행물
3GPP TS 26.073 - AMR speech Codec
http://www.3gpp.org/[...]
2008-12-11
[12]
문서
2010-02-28
[13]
문서
FFmpeg General Documentation - AMR external library
http://www.ffmpeg.or[...]
[14]
문서
Android AMR codecs
https://web.archive.[...]
2009-02-18
[15]
문서
KMPlayer Internal Audio Decoder Preferences
https://web.archive.[...]
2014-10-22
[16]
웹인용
3GPP TS 26.090 - Mandatory Speech Codec speech processing functions; Adaptive Multi-Rate (AMR) speech codec; Transcoding functions
http://www.3gpp.org/[...]
2010-07-21
[17]
웹인용
3GPP TS 26.071 - Mandatory speech CODEC speech processing functions; AMR speech Codec; General description
http://www.3gpp.org/[...]
2010-07-21
[18]
문서
RFC 4867 - RTP Payload Format and File Storage Format for the Adaptive Multi-Rate (AMR) and Adaptive Multi-Rate Wideband (AMR-WB) Audio Codecs
http://tools.ietf.or[...]
Page 35
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com