사이렌 (코덱)

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

사이렌(Siren)은 음성 통신에 사용되는 오디오 코덱 제품군으로, 사이렌 7, 사이렌 14, 사이렌 22의 세 가지 종류가 있다. 각 코덱은 서로 다른 오디오 대역폭, 샘플링 주파수, 비트 전송률을 지원하며, ITU-T G.722.1 및 G.719 표준의 기반이 되었다. 사이렌 7은 화상 회의 시스템과 마이크로소프트 오피스 커뮤니케이터 등에서 사용되며, 윈도우 운영체제에서 지원된다. FreeSWITCH, aMSN 등에서도 사이렌 코덱을 지원하며, 사용에는 폴리콤의 특허 라이선스가 필요하다.

사이렌 (코덱)
기본 정보
종류오디오 코덱
개발사폴리콤
파일 확장자.wav, .raw
기술 정보
코딩 방식손실 압축
특징광대역 오디오 코덱
샘플링 속도16 kHz
비트 전송률16 kbit/s, 24 kbit/s, 32 kbit/s
용도VoIP
화상 회의
오디오 스트리밍
관련 정보
관련 기술G.722
G.722.1
MPEG-4 HE-AAC
라이선스독점 라이선스
📚 더 읽어볼만한 페이지
  • 오디오 코덱 - NICAM
    NICAM은 1970년대 BBC에서 개발된 디지털 오디오 방송 시스템으로, 32kHz 샘플링 주파수와 14비트 PCM을 사용하여 음성 신호를 인코딩하고 스테레오 음향, 이중 언어 방송, 데이터 채널 전송 등의 기능을 제공하며 아날로그 방송의 음성 전송 방식으로 사용되었으나 디지털 방송으로의 전환으로 사용이 줄어들었다.
  • 오디오 코덱 - G.711
    G.711은 8 kHz 표본 추출 주파수와 64 kbit/s의 비트 전송률을 갖는 파형 음성 코더로, μ-law와 A-law라는 두 가지 컴팬딩 알고리즘을 사용하며, 부록 I, II 및 확장 표준을 통해 네트워크 환경에서의 효율성과 음질을 높인다.

2. 종류 및 기술적 특징

사이렌 코덱은 주로 세 가지 주요 버전으로 개발되었으며, 각 버전은 지원하는 오디오 대역폭, 샘플링 주파수, 비트 전송률 등에서 차이를 보인다. 주요 버전별 기술적 특징은 다음과 같다.

👆
좌우로 밀어서 보기
사이렌 코덱 버전별 주요 기술 사양 비교
코덱 종류오디오 대역폭샘플링 주파수비트 전송률 (모노)비트 전송률 (스테레오)관련 ITU-T 표준
사이렌 7 (Siren7)7 kHz16 kHz16, 24, 32 kbit/s-G.722.1
사이렌 14 (Siren14)14 kHz32 kHz24, 32, 48 kbit/s48, 64, 96 kbit/sG.722.1C
사이렌 22 (Siren22)22 kHz48 kHz32, 48, 64 kbit/s64, 96, 128 kbit/sG.719


사이렌 7은 PictureTel의 PT716plus 알고리즘에서 파생되었으며, ITU-T G.722.1 표준의 기반이 되었다. 사이렌 14는 모노스테레오 오디오를 지원하고 변환 부호화 기술을 사용하며, 모노 버전은 G.722.1C 표준으로 채택되었다. 사이렌 22는 폴리콤과 에릭슨의 기술을 기반으로 G.719 전 대역 코덱 표준으로 이어졌다.

2.1. 사이렌 7 (Siren7)

사이렌 7(Siren7 또는 간단히 Siren)은 7kHz 오디오, 비트 전송률 16, 24, 32 kbit/s 및 샘플링 주파수 16 kHz를 제공한다. 사이렌은 PictureTel의 PT716plus 알고리즘에서 파생되었다. 1999년, 국제 전기 통신 연합(ITU-T)은 사이렌 7 알고리즘을 기반으로 하는 G.722.1 권고안을 승인했다. 이 권고안은 광범위한 테스트를 포함하는 4년의 선택 과정을 거쳐 승인되었다. G.722.1은 24 및 32 kbit/s의 비트 전송률만 제공하며 사이렌 7의 비트 전송률 16 kbit/s를 지원하지 않는다. 사이렌 7의 알고리즘은 후속 버전인 G.722.1과 동일하지만 데이터 형식은 약간 다르다.

2.2. 사이렌 14 (Siren14)

사이렌 14 (Siren14)는 14 kHz 오디오, 모노의 경우 비트 전송률 24, 32, 48 kbit/s, 스테레오의 경우 48, 64, 96 kbit/s 및 샘플링 주파수 32 kHz를 제공한다. 사이렌 14는 스테레오 및 모노 오디오를 지원한다. 20밀리초 프레임 길이를 사용하여 40밀리초 알고리즘 지연을 제공한다. 사이렌 14의 모노 버전은 2005년 4월에 ITU-T G.722.1C (14 kHz, 24/32/48 kbit/s)가 되었다. 이 알고리즘은 변환 부호화 기술을 기반으로 하며, 변형 이산 코사인 변환 (MLT), 일종의 이산 코사인 변환 (DCT) 또는 수정된 이산 코사인 변환 (MDCT)을 사용한다.

2.3. 사이렌 22 (Siren22)

사이렌 22(Siren22)는 22 kHz 오디오 대역폭과 48 kHz의 샘플링 주파수를 제공하는 오디오 코덱이다. 비트 전송률은 스테레오의 경우 64, 96, 128 kbit/s를 지원하며, 모노의 경우 32, 48, 64 kbit/s를 지원한다. 20 ms의 프레임 길이를 사용하여 40 ms의 알고리즘 지연 시간을 가진다. 2008년 5월, ITU-T는 폴리콤의 사이렌 22 오디오 기술과 에릭슨의 고급 오디오 기술을 기반으로 하는 새로운 G.719 전 대역 코덱을 승인했다.

3. 소프트웨어 지원

사이렌 7은 화상 회의 시스템에서 일반적으로 사용되며, 마이크로소프트 오피스 커뮤니케이터 및 마이크로소프트 오피스 커뮤니케이션 서버에서도 오디오 회의 기능을 위해 활용된다. 기본적으로 오피스 커뮤니케이터 클라이언트 간의 지점 간 오디오 통화는 마이크로소프트의 독점 코덱인 RTAudio를 사용하지만, 참가자가 3명 이상이 되어 오디오 회의로 전환되면 성능상의 이유로 코덱이 즉시 사이렌 7으로 변경된다. 회의 참가자 수가 다시 3명 미만으로 줄어도, 오피스 커뮤니케이션 서버(OCS)는 통화 방식을 지점 간 통신으로 되돌리지 않고 회의가 종료될 때까지 사이렌 7 코덱을 계속 사용한다.

윈도우 XP 및 이후 버전의 윈도우 운영체제에는 사이렌 7 코덱이 `%systemroot%\system32\SIRENACM.DLL` 파일에 구현되어 있다. 이 코덱은 MSN 메신저와 윈도우 라이브 메신저에서 음성 클립 전송 기능과 '컴퓨터 통화' 기능에 사용 가능한 코덱 중 하나였다.

오픈 소스 통신 소프트웨어인 FreeSWITCH는 사이렌 7(G.722.1) 및 사이렌 14(G.722.1C) 오디오 형식의 트랜스코딩, 회의, 브리징 기능을 지원한다.

또한, 오픈 소스 윈도우 라이브 메신저 클론인 aMSN은 사이렌 오디오 압축 및 압축 해제를 위해 "libsiren"이라는 라이브러리를 사용한다. 이 라이브러리는 aMSN 개발자 Youness Alaoui (KaKaRoTo)가 작성한 사이렌 코덱의 오픈 소스 구현체이다. libsiren 라이브러리는 이후 libmsn과 Pidgin, Adium과 같은 다른 인스턴트 메시징 클라이언트에서도 플러그인 형태로 사용되었다.

4. 라이선스

사이렌 7 및 사이렌 14 오디오 코딩 형식의 사용은 대부분의 국가에서 폴리콤의 특허 라이선스를 필요로 한다. 사이렌 7 및 사이렌 14에 대한 로열티 프리 라이선스는 몇 가지 기본적인 조건을 충족하면 폴리콤에서 제공된다.

사이렌 22의 사용 또한 폴리콤의 특허 라이선스를 필요로 한다.