Sinsy
1. 개요
Sinsy는 음성 합성 기술로, 은닉 마르코프 모델(HMM)을 채택하여 적은 메모리에서도 동작하도록 설계되었다. MusicXML 형식의 악보 데이터를 입력받아 WAV 파일 형식의 음성을 생성하며, 온라인 버전과 오픈 소스 버전으로 제공된다. 온라인 버전은 일본어, 영어, 중국어를 지원하며, 다양한 음성을 제공한다. 오픈 소스 버전은 리눅스 환경에서 사용 가능하며, 수정된 BSD 라이선스로 배포된다.
| 이름 | Sinsy |
|---|---|
| 개발자 | 나고야 공업대학 |
| 최신 버전 | 0.92 |
| 최신 평가 버전 | 3.9 |
| 최신 평가 버전 출시일 | 2017/12/25 |
| 운영 체제 | 리눅스 |
| 언어 | 일본어, 영어, 중국어 |
| 장르 | 보컬 신시사이저 애플리케이션 |
| 라이선스 | 수정된 BSD 라이선스 |
| 웹사이트 | Sinsy 공식 웹사이트 |
| 리포지토리 | SourceForge 리포지토리 |
-
음성 합성 소프트웨어 -
보컬로이드
보컬로이드는 야마하에서 개발한 음성 합성 소프트웨어로, 사람 목소리 데이터 기반 가수 라이브러리와 합성 엔진을 통해 사용자가 입력한 가사와 멜로디로 노래를 만들 수 있으며, 하츠네 미쿠 같은 캐릭터 보컬 시리즈는 가상 아이돌 문화를 형성하며 인기를 얻었다. -
음성 합성 소프트웨어 -
보카리나
보카리나는 ㈜티젠스에서 개발한 음성 합성 프로그램 엔진으로, 보라와 카일린 캐릭터 가수를 통해 노래 제작 및 가수 설정 기능을 제공했으나 2018년에 서비스가 종료되었으며, VOCALOID와 유사하지만 직접적인 관련은 없고, 음높이, 다이내믹스, 바이브레이션 조절 및 배경음악 믹싱 기능을 지원했다.
2. 기술적 특징
Sinsy는 은닉 마르코프 모델(HMM)을 합성 기술로 채택하여 적은 메모리에서도 동작하는 것이 특징이다. 2016년 12월부터는 온라인 버전에서 심층 신경망(DNN)을 사용한 일본어 라이브러리가 공개되어 더욱 자연스러운 음성 합성이 가능해졌다.
3. 버전
Sinsy는 온라인 버전과 오픈 소스 버전으로 제공된다. 온라인 버전은 웹사이트에서 무료로 이용 가능하며, MusicXML 형식의 악보를 업로드하여 WAV 파일 형식의 음성을 생성할 수 있다. 오픈 소스 버전은 SourceForge에서 수정된 BSD 라이선스로 공개되어 있으며, 리눅스 환경에서 빌드하여 사용할 수 있다.
3.1. 온라인 버전
Sinsy는 공식 웹사이트에서 공개되어 누구나 무료로 이용할 수 있다. 서버 부하 경감을 위해 곡 길이는 HMM 버전은 최대 7분, DNN 버전은 최대 5분으로 제한되어 있다. 사용자는 MusicXML 형식의 데이터를 업로드하며, Sinsy는 WAV 파일 형식으로 음성을 생성한다. 출력 전에 성별 요인, 비브라토 강도, 피치 시프트를 조정할 수 있다.
3.2. 오픈 소스 버전
SourceForge에서 리눅스 버전의 소스 코드가 수정된 BSD 라이선스로 공개되어 있다. 이용하려면 빌드가 필요하다. 라이선스에 따라 라이브러리 형태로 다른 소프트웨어에 통합하는 것도 가능하다.
온라인 버전과는 달리, DNN에 의한 노래 합성에는 대응하지 않는다.
4. 제공 음성
Sinsy는 다양한 음성을 제공하며, 지속적으로 새로운 음성이 추가되고 있다. 제공되는 음성은 다음과 같다.
| 언어 | 이름 | 성별 | 비고 |
|---|---|---|---|
| 일본어 | 요코(謡子) | 여성 | 베타 버전, 정식 출시 버전 |
| 일본어 | 샹링(香鈴) | 여성 | |
| 일본어 | 나미네 리츠 S(波音リツS) | 남성 | 베타 버전, UTAU용으로 제작, 2013년 12월 25일 출시 |
| 일본어 | 미확인 | 불명 | |
| 일본어 | 미확인 | 불명 | |
| 영어 | 샹링(香鈴) | 여성 | 2015년 크리스마스에 추가 |
| 영어 | 마츠오P | 남성 | |
| 중국어 | 샹링(香鈴) | 여성 |
4.1. 일본어 음성
* 요코(謡子): 일본어 여성 보컬이다. 현재 베타 버전과 정식 출시 버전, 두 가지 버전이 제공된다.
* 샹링(香鈴): 일본어 여성 보컬이다.
* 나미네 리츠 S(波音リツS): 일본어 남성 보컬로, 현재 베타 버전이다. 원래 UTAU용으로 제작되었으며 2013년 12월 25일에 출시되었다.
* 미확인: 일본어 보컬이다.
* 미확인: 또 다른 일본어 보컬이다.