우타우

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

UTAU는 사용자가 직접 녹음한 음성이나 다른 사람이 제작한 음성 라이브러리를 사용하여 노래를 만들 수 있는 무료 음성 합성 소프트웨어이다. 2007년 하츠네 미쿠의 발매 이후, 인력 보컬로이드 영상 제작에 어려움을 느낀 아메야/쇼우부에 의해 개발이 시작되었으며, 2008년 UTAU라는 이름으로 공개되었다. UTAU는 음성 라이브러리, 에디터, 엔진으로 구성되며, 다양한 플러그인과 확장성을 제공한다. UTAU는 저작권 문제와 윤리적 고려 사항을 가지며, 보컬로이드와 함께 사용되기도 하고, 대중문화에도 영향을 미쳤다. 특히, UTAU는 니코니코 동화와 유튜브 등에서 많은 음악 제작자들이 사용하며, 보컬로이드의 대안으로도 선택되고 있다.

더 읽어볼만한 페이지

우타우 - 카사네 테토
카사네 테토는 2008년 만우절 장난으로 시작되었지만 UTAU를 통해 음성 데이터를 기반으로 만들어진 붉은 트윈테일의 15세 가상 캐릭터로, Synthesizer V AI 음성 데이터베이스로도 발매되었고 다양한 미디어에서 활용되며 홋카이도 방송의 PR 어시스턴트로도 활동했다.
음성 합성 소프트웨어 - 보컬로이드
보컬로이드는 야마하에서 개발한 음성 합성 소프트웨어로, 사람 목소리 데이터 기반 가수 라이브러리와 합성 엔진을 통해 사용자가 입력한 가사와 멜로디로 노래를 만들 수 있으며, 하츠네 미쿠 같은 캐릭터 보컬 시리즈는 가상 아이돌 문화를 형성하며 인기를 얻었다.
음성 합성 소프트웨어 - 보카리나
보카리나는 ㈜티젠스에서 개발한 음성 합성 프로그램 엔진으로, 보라와 카일린 캐릭터 가수를 통해 노래 제작 및 가수 설정 기능을 제공했으나 2018년에 서비스가 종료되었으며, VOCALOID와 유사하지만 직접적인 관련은 없고, 음높이, 다이내믹스, 바이브레이션 조절 및 배경음악 믹싱 기능을 지원했다.
셰어웨어 - WinRAR
WinRAR은 RAR 및 ZIP 등 다양한 파일 형식을 지원하며, 압축 파일 복구, 강력한 암호화 등의 기능을 제공하는 셰어웨어 압축 유틸리티이다.
셰어웨어 - 윈집
윈집은 ZIP 파일 압축 포맷 기반의 압축 프로그램으로, 윈도우용으로 처음 출시되어 다양한 기능 업데이트와 플랫폼 확장을 통해 macOS, iOS, Android 버전도 출시되었으며, 유료 소프트웨어로서 경쟁 제품과 비교되기도 한다.

우타우 - [IT 관련 정보]에 관한 문서
개요
종류	음성 합성 소프트웨어
개발자	아메야/아야메
라이선스	셰어웨어 (기부를 통해)
최신 버전 (윈도우)	v0.4.19(c)
최신 버전 (맥)	1.0.0b21
최신 버전 출시일 (윈도우)	2024년 5월 24일
최신 버전 출시일 (맥)	2024년 5월 24일
프로그래밍 언어	비주얼 베이직 (클래식) V6
운영 체제	윈도우 2000 / 윈도우 XP / 윈도우 비스타 / 윈도우 7 / 윈도우 8 / 윈도우 10 / macOS
플랫폼	윈도우, macOS
언어	일본어, 영어 (패치 파일을 통해 다른 언어 지원)
장르	음악 합성 애플리케이션 (뮤직 시퀀서)
웹사이트	UTAU 공식 웹사이트
웹사이트 (새 버전)	UTAU-Synth 공식 웹사이트
개발
개발자 (일본어)	(아메야/아야메)

2. 역사

2008년 3월, 아메야/쇼우부(Ameya/Ayame)는 UTAU를 출시했다. UTAU는 공식 웹사이트에서 다운로드할 수 있는 무료 셰어웨어 소프트웨어이다. UTAU (歌う|우타우^일본어)는 일본어로 '노래하다'라는 뜻이며, 보컬로이드와 유사한 노래 음성을 만드는 人力ボーカロイド|진리키 보카로이도|수동 보컬로이드^일본어 활동에서 유래되었다.^[1] UTAU는 사용자가 제공한 WAV 파일을 사용하여 노래 가사와 멜로디를 입력함으로써 노래 음성을 합성할 수 있다. 초기 출시 시 기본 음성 라이브러리인 우타네 우타(데포코)의 음성 샘플을 합성하기 위해 AquesTalk를 사용했다.^[1] UTAU를 위해 만들어진 음성은 "UTAU"라고도 불리지만, "UTAUloids"라고도 불린다. 또한 "음성 라이브러리"라고도 불린다. 수많은 음성 라이브러리가 독립 사용자에 의해 개발되어 배포되거나 상업 프로젝트의 일부로 판매된다.

UTAU는 주로 일본어 프로그램이지만, 사용자가 직접 음성 라이브러리를 만들 수 있기 때문에 일본어 이외의 언어로도 노래할 수 있다. X-SAMPA 형식은 영어 또는 기타 비일본어 음성 라이브러리에 자주 사용되지만, ARPABET 및 다양한 사용자 정의 음성 체계와 같은 다른 음성 체계가 사용되기도 한다.^[1] UTAU의 프로젝트 파일은 .ust (Utau Sequence Text) 확장자로 저장되며, 자유롭게 배포될 수 있다.^[2] 또한 MIDI 형식과 .vsq 형식을 지원한다.

피아노 롤 위에 노트를 삽입하고 움직여 완성된 악보의 노트에 있는 문자로 음성 파일을 사용하여 결합하여 하나의 음성 파일을 만들 수 있는 소프트웨어이다. 소프트웨어 분류로는 음성 합성의 한 부류에 해당하지만, 굳이 말하자면 가창에 특화된 "가창 합성"(파형 접속형)으로 분류된다. UTAU의 기능은 "음성을 정리한 파일을 사용해 포먼트를 유지하면서 피치를 변경할 수 있고, 타임 스트레치에 대응하는 음성 결합 도구" 중 하나이다.

공개 이후 니코니코 동화나 유튜브에서 악곡의 보컬에 UTAU로 제작한 노래를 더한 동영상 등이 투고되었고, UTAU에서 사용되는 것을 목적으로 한 음성 파일이 조금씩 업로드되어 하나의 커뮤니티를 만들어냈다. 2009년에는 창의 숲 대상에서 금상을 수상했다.

2011년 1월 19일, 벨소리나 음성 배신 업무도 담당하고 있는 도완고에 음성 파일의 간이 생성용으로 사양을 변경한 엔진의 개발·제공을 하여, '노래하는 @mobile' 서비스가 이루어지고 있다. 또한, UTAU를 보컬로 사용한 CD 악곡도 상업 유통으로 판매되고 있다.

2. 1. 개발 배경

2007년 9월, 하츠네 미쿠가 발매되면서 큰 화제가 되었고, 니코니코 동화에는 기존 곡과 오리지널 곡이 많이 업로드되었다. 이전부터 니코니코 동화에 THE IDOLM@STER 관련 MAD 작품을 발표했던, 이른바 "장인"이라고 불리는 유저들은 THE IDOLM@STER의 많은 노래에서 곡의 한 음 한 음을 잘라 붙여 다른 노래로 만들고, 이를 니코니코 동화에 업로드하여 그 솜씨를 겨루었다. THE IDOLM@STER는 짧은 기간에 대량의 곡이 만들어져 1명의 아티스트의 방대한 음성 데이터를 쉽게 수집할 수 있었기 때문에 이러한 작업이 가능했다. 이러한 수작업으로 소리를 연결하여 노래를 제작하는 것을 "인력 Vocaloid"라고 칭하며 즐겼다.

이러한 흐름 속에서, 니코니코 동화에 자작 랩을 투고하는 등의 활동을 하던 뮤지션 중 한 명이었던 LOLI.COM은 자신의 목소리를 녹음한 음성 파일을 인력 Vocaloid용 소재로 하여 "로리 음 콤"이라고 칭하며 공개했다. UTAU의 제작자가 된 아메야/쇼우부도 로리 음 콤을 사용하여 동영상을 투고했다. 아메야/쇼우부는 분해된 소재에서 가사로 재결합하는 데 Audacity, Audacity로 만든 음원을 악곡의 음높이에 맞추기 위한 Melodyne 체험판, 그리고 그에 따라 만들어진 음성의 녹음에 윈도우 부속 사운드 레코더를 사용하여 작품을 만들었고, 이 과정이 상당한 수고가 든다는 것을 동영상 내에서 언급했다. 이처럼 인력 Vocaloid로 노래하게 하려면 막대한 수고가 들기 때문에 잘라 붙이기를 쉽게 할 수 있는 "인력 Vocaloid 지원 도구"로서 UTAU가 개발되었다.^[36], ^[37], ^[38], ^[39]

2. 2. 초기 개발 및 공개 (2008년)

2008년 1월 11일, 아메야/쇼우부는 니코니코 동화에서 UTAU의 초기 버전을 발표했다.^[36] 당시에는 커맨드 라인 도구와 배치 파일을 사용하는 형태였으며, 음성 파일의 시간 지정 조절, 엔벨로프 변경 등이 가능했다.

2008년 2월 5일, GUI(그래픽 사용자 인터페이스)를 추가한 버전의 동영상이 공개되었다.^[4] 이 버전에서는 샘플의 시간 늘이기, oto.ini 파일 생성, 음표의 피치 벤드 조정 기능이 추가되었다. 이후 2월 20일에는 단음 신축 기능과 음높이 변경 기능이 추가된 동영상이 공개되었다.^[36]

2008년 3월 5일, 프로그램의 사양을 설명하는 동영상이 니코니코 동화에 공개되었고,^[5] 3월 15일에 이 도구는 UTAU라는 이름으로 정식 발표되었다.^[36] 이 시점에서 UTAU는 현재와 유사한 기능을 갖추게 되었다.

아메야/쇼우부는 2008년 6월에 UTAU에 대해 "인력 보컬로이드"라는 명칭을 사용하지 않고, 대신 노래 음성 합성 소프트웨어라는 명칭을 사용하기로 밝혔다.^[7]^[39]

2. 3. 발전 및 확장

UTAU는 2008년 3월 Ameya/Ayame에 의해 출시된 이후 지속적으로 개선 및 확장되었다. 초기에는 AquesTalk 음성 합성기를 사용하여 기본 음성 라이브러리인 우타네 우타(데포코)를 제공했다.^[1] 이후 개발자가 직접 음성 라이브러리를 제작할 수 있게 되면서, 다양한 음성 라이브러리가 등장했다.

프로듀서들은 여러 가지 방법을 통해 음성 라이브러리를 제작했고, 그 결과 다양한 음성 표현이 가능해졌다.^[2] UTAU는 X-SAMPA 형식을 지원하여 영어와 같은 비일본어 음성 라이브러리도 제작되었으며, ARPABET과 같은 다른 음성 체계도 사용되었다.^[1]

2011년에는 UTAU-Synth라는 Mac 버전이 출시되었다. 또한, Ameya는 트위터를 통해 UTAU의 새로운 버전에 유니코드 지원을 추가할 것이라고 발표했다. 2020년 9월 현재 프런트엔드 지원은 아직 출시되지 않았지만, 백엔드 지원, 테일 고정 영역 및 여러 다른 오디오 인코딩은 이미 출시되었다. Ameya는 또한 UTAU를 64비트 시스템과 호환되도록 업데이트했다.

UTAU의 개발은 Ameya가 Audacity와 Melodyne을 사용하여 다른 가수의 샘플을 재조합하고 피치를 수정하는 "인력 VOCALOID" 작업을 하면서 시작되었다. 이 과정을 자동화하기 위해 개발된 UTAU는 2008년 1월 11일 니코니코 동화에서 처음 발표되었다.^[4] 초기에는 사운드 타이밍 조정, 음표 엔벨로프 변경, 배치 파일 생성 등의 기능이 있었다. 이후 GUI가 공개되었고,^[4] 2008년 3월 15일, UTAU라는 이름으로 정식 출시되었다.^[5]

Ameya는 프로그래머였지만 보컬 합성 전문가는 아니었음에도 불구하고, 이전 지식을 바탕으로 UTAU를 개발했다.^[6] UTAU 출시 이후, Ameya는 다른 텍스트 음성 변환 개발자들과 협력하여 UTAU를 계속 개선해왔다.^[6]

3. 구성

UTAU는 2008년 3월에 Ameya/Ayame에 의해 출시된 셰어웨어 소프트웨어이다. UTAU는 사용자가 제공한 WAV 파일을 사용하여 노래 가사와 멜로디를 입력함으로써 노래 음성을 합성할 수 있다. UTAU는 주로 일본어 프로그램이지만, 사용자 기반은 일본어 이외의 언어로 노래할 수 있도록 음성 라이브러리를 사용하는 방법을 고안했다.^[1] UTAU의 프로젝트 파일은 "" (Utau Sequence Text) 확장자로 저장되며, 자유롭게 배포될 수 있다.

UTAU는 크게 다음 세 가지로 구성된다.

음성 라이브러리: 녹음(샘플링)한 음성 데이터와 UTAU에서 읽어들일 때 사용하는 설정 데이터를 정리한 것이다.
에디터: 피아노 롤 상에서 노트(음표)를 배치하고 단어를 입력하여 피치, 음량 등의 설정을 조작하는 곳이다.
음성 신축 엔진: 라이브러리 데이터를 읽어들여 GUI로 작성한 악보 데이터를 바탕으로 resampler, 또는 처리가 유사한 가공 기기로 가공하는 부분이다.

음성 라이브러리는 외부 데이터, GUI와 엔진은 코어라는 형태로 분류된다. 음성 라이브러리에는 아퀘스트의 텍스트 읽기용 소프트웨어 AquesTalk에서 생성한 것을 기본 음성^[31]으로 함께 제공하고 있다.

UTAU 에디터 상에서 노트에 입력된 문자 기호와 라이브러리 내의 음성 파일명을 대조하여 음성 파일을 불러온다. 단, prefix.map이라는 설정 파일에 의해 음고에 따라 읽어들이는 파일이 설정되어 있는 경우에는, 그에 따라 음성 파일명을 대조한다. 라이브러리 내의 음성 파일에는 각각 음고가 설정되어 있다. 합성되는 노래 소리는 원본 음성 파일과 UTAU 에디터 상의 음고(실제로 발성되는 음고)와의 차이에 따라 음고가 조정된다. 음고 조정 시에는 포먼트를 가공하여 음질의 극단적인 변화를 방지하며, 포먼트 필터는 임의로 사용하지 않도록 하는 것도 가능하다.

3. 1. 음성 라이브러리

UTAU의 음성 라이브러리는 녹음된 음성 데이터(.wav 파일)와 UTAU에서 사용하기 위한 설정 데이터로 구성된다. 여기에는 다음이 포함된다.

파일 종류	설명
음성 파일 (.wav)	UTAU에서 사용되는 실제 음성 데이터이다.
원음 설정표 (oto.ini)	각 샘플의 타이밍과 구성을 결정한다. UTAU-SYNTH에서는 `oto_ini.txt`이다.
주파수표 (.frq)	편집기에서 피치를 변경할 때 파형을 처리하는 데 사용된다. 일부 리샘플러는 다른 파일 형식을 사용한다.
아이콘 이미지 파일	일반적으로 .bmp 형식이며, 음성 라이브러리를 시각적으로 나타낸다.
character.txt	보이스뱅크 제작자, 이름, 샘플 파일, 보이스뱅크 이미지 등 GUI에 표시되는 정보를 담고 있다. "genre"와 같은 제작자가 지정한 다른 매개변수를 포함할 수도 있다.
readme.txt	음원의 설명, 표현, 이용에 대한 규약 텍스트 파일이다.
prefix.map	다른 음고의 음성으로 동명의 파일을 혼재한 식별 정보이다.

UTAU는 다양한 형식의 음성 라이브러리를 지원한다.^[3]

단독음 (CV): 자음-모음(Consonant-Vowel) 구조로, 가장 기본적인 형태이다.
연속음 (VCV): 모음-자음-모음(Vowel-Consonant-Vowel) 구조로, 트라이폰(triphone)을 사용하여 더 부드러운 소리를 생성한다. CV 보이스뱅크보다 약 7배 더 크고 제작에 더 많은 시간과 노력이 필요하지만, 더 자연스러운 결과를 얻을 수 있다.
CVVC: CV 음소 사이에 VC 음소를 배치하는 방식으로, 일본어 외의 언어를 지원하기 위해 개발되었다.
VCCV: CVVC를 기반으로 하지만, 유성 및 무성 VC, 자음 클러스터 지원 등 몇 가지 차이점이 있다.
CVC: 자음-모음-자음(Consonant-Vowel-Consonant) 구조를 사용하여 프로그램에서 분할된다.
렌탄주츠 (れんたんじゅつ|렌탄주츠^일본어): 여러 wav 파일에 일련의 CV 음절을 녹음하여 전체 VCV를 사용하지 않고도 더 부드러운 결과를 얻는 방법이다.

이러한 다양한 형식 덕분에 UTAU는 일본어뿐만 아니라 다양한 언어를 지원할 수 있게 되었다.^[35]

음성 파일은 독립적인 파일이므로, DAW와 같은 다른 소프트웨어에서도 사용할 수 있다. UTAU는 WAV 파일을 사용하므로, 기존 사람의 목소리를 데이터로 사용할 수 있다. 배우, 가수, 유명인의 목소리 클립이 UTAU에서 사용하기 위해 재사용되는 경우가 많다.

UTAU의 기본 음성 뱅크 "데포코"(우타네 우타)는 A-quest에서 제작한 "AquesTalk Female-1" 음성을 빌려왔으며, 무료 배포 허가를 받았다.^[21] 우타의 여동생인 우타네 코에도 AquesTalk 소프트웨어에서 음성을 빌려왔다. UTAU용으로 처음 제작된 음성 뱅크인 나미네 리츠(波音リツ|나미네 리츠^일본어)는 나중에 Sinsy라는 다른 소프트웨어에도 추가되었다.

3. 2. 에디터

UTAU 에디터는 피아노 롤 인터페이스를 통해 음표를 배치하고 가사를 입력하며, 음성 파라미터를 조정하는 기능을 제공한다.^[31] 피치, 음량, 엔벨로프, 비브라토 등 다양한 요소를 조절할 수 있다.

기본적으로 피아노 롤에는 음표만 표시되지만, 표시 설정을 변경하여 피치 곡선, 볼륨 강도, 엔벨로프 및 플래그를 표시할 수 있다. UTAU는 플래그를 사용하여 로우패스 및 하이패스 필터와 같이 음성의 측면을 변경하고, 숨소리를 줄이거나 추가하는데, 이러한 플래그는 사용되는 리샘플러에 따라 다르다.

자음 자동 병합을 할 수 있는 내장 플러그인(컴퓨팅)이 있으며, 파일 전체에 자동 피치 및 비브라토를 추가할 수 있는 "오마카세/A la carte" 설정도 있다. 사용자가 만든 다른 플러그인도 소프트웨어에 추가할 수 있다. 에디터의 색상은 setting.ini 파일에서 변경할 수도 있다.

에디터에서는 플러그인을 사용할 수 있으며, 이를 통해 편리한 확장 기능을 사용할 수 있다. 플러그인은 뜻있는 사람들이 제작한 것이 특정 장소에서 배포되고 있다.

3. 3. 엔진

엔진부는 편집기부에서 생성한 가공 데이터와 음성 라이브러리를 사용하여 음성 파일을 출력하는 부분이다. 신축기(resampler) 및 결합기(wavtool)로 구성되어 있다. 기본적으로 신축부의 resampler와 결합부의 wavtool이 각각 함께 제공된다.^[31]

출력할 음성 파일은 편집기부에서 범위 지정한 부분을 재생하는 것도 가능하다. 엔진 자체는 독립적인 것이므로, 유사한 합성을 수행하는 것이라면 엔진부만 교체하는 것도 가능하다. 엔진부는 제작자가 공개한 것 외에 유저가 제작한 것도 있다. 기본적으로 탑재된 음성 신축 엔진인 resampler도 처리 방식이 다소 다른 버전이 여러 개 있다. 기본적으로 사용할 수 있는 엔진은 편집기부에서 입력한 ust 파일에 대해 1개이지만, 툴을 병용하여 여러 엔진을 노트별로 지정하고 전환하는 것도 가능하다.^[31]

엔진에 따라 생성되는 음성의 음질 및 가공 결과가 다를 뿐만 아니라, 결합 파일이 생성되기까지의 처리 시간이 다르거나, 처리 사양에 맞춰 고유의 파형 가공용 플래그 옵션을 추가할 수도 있다. 단, 엔진의 처리 사양에 적합한 원음 사양과의 궁합이 있으며, 적합하지 않은 엔진과 음원에서는 음질이 악화되거나 이상 처리가 발생할 수도 있다.^[31]

생성 방법은 배치 처리로 데이터를 묶어서 생성하므로, 우타우의 편집기에서 자동 스크롤을 하는 경우에는 한 번 캐시 파일을 생성해야 한다. 엔진에 따라 처리 과정에서 생성되는 캐시 파일의 양이 증가할 수도 있다. 출력 시에는 사양상 단일 처리를 수행하지만, DLL 사용 및 멀티 스레드 지원 툴의 사용으로 고속화가 가능하게 되어 있다.^[31]

4. 특징

UTAU는 피아노 롤 위에 노트를 삽입하고 움직여 악보를 완성하고, 이 노트에 있는 문자를 음성 파일과 결합하여 하나의 음성 파일을 만드는 소프트웨어이다. 음성 합성의 한 종류이지만, 가창에 특화된 "가창 합성"(파형 접속형)으로 분류된다. UTAU는 "음성을 정리한 파일을 사용해 포먼트를 유지하면서 피치를 변경할 수 있고, 타임 스트레치에 대응하는 음성 결합 도구" 중 하나이다.

VOCALOID와 같은 3부 구조를 가지며, 사용자가 이러한 구성 내용을 변경할 수 있다는 특징이 있다.

니코니코 동화나 유튜브 등에서 UTAU로 제작한 노래를 더한 동영상이 투고되었고, UTAU에서 사용되는 음성 파일이 업로드되면서 하나의 커뮤니티를 형성했다. 2009년에는 창의 숲 대상에서 금상을 수상했다.

2011년 1월 19일, 도완고에 음성 파일 간이 생성용 엔진을 제공하여 '노래하는 @mobile' 서비스가 이루어지고 있다. 또한, UTAU를 보컬로 사용한 CD 악곡도 상업 유통으로 판매되고 있다.

4. 1. 자유로운 음성 사용

UTAU는 사용자가 직접 녹음한 음성이나 다른 사람이 제작한 음성 라이브러리를 자유롭게 사용할 수 있다. 저작권 문제가 없는 한, 어떤 음성이든 사용할 수 있다.

사용자는 직접 필요한 음성 데이터를 채집하여 음성 라이브러리를 제작하고 사용할 수 있다. 사람의 목소리일 필요는 없으며, 악기 소리나 고양이 울음소리로 소리를 연주하거나 노래하게 하는 등의 사용법도 등장하고 있다. 이러한 제작된 라이브러리는 자원 봉사자에 의해 몇몇 무상 음성 데이터가 제공되는 경우도 있으며(여러 해외에서는 배포 사이트를 보이스뱅크(VoiceBank)라고 부른다), 상업 관련 기획이나 서클 활동의 일환으로 제작되어 판매되는 것도 있다. 캐릭터 보컬 시리즈를 본떠 (주로 UTAU용) 캐릭터 설정을 부가하는 곳도 있다.^[35]

음성 라이브러리는 다중 음성이나 속삭이는 소리, 자음만 등과 같은 음성 파일을 준비함으로써 표현력을 높이는 것도 가능해졌다. 일본어에 없는 발음을 포함하는 언어에 대응하는 라이브러리를 만들 경우, X-SAMPA 등의 음성 기호를 사용함으로써 다국어에 대응하는 라이브러리도 존재한다.^[35]

4. 2. 다양한 음성 라이브러리

UTAU는 단독음, 연속음 등 다양한 형식의 음성 라이브러리를 지원하여 자연스러운 발음 표현이 가능하다. 일본어뿐만 아니라 영어, 한국어 등 다양한 언어를 지원하는 음성 라이브러리가 존재한다.^[3]

일반적으로 "CV"(자음-모음)라고 불리는 단음절 음성 라이브러리와, 더 부드러운 소리를 위해 트라이폰을 사용하는 "VCV"(모음-자음-모음) 음성 라이브러리가 있다. VCV 라이브러리는 CV 라이브러리보다 제작에 더 많은 시간과 노력이 필요하지만, 더 자연스러운 결과를 얻을 수 있다.^[3]

이후에는 일본어 이외의 언어를 지원하기 위해 모음+자음(VC) 음소를 포함하는 음성 라이브러리도 등장했다. 이러한 라이브러리는 "CVVC" (두 CV 음소 사이에 VC 음소가 배치됨) 또는 "VCCV" 방식으로 사용된다.

CVC (자음-모음-자음) 방식과 rentan-jutsu|렌탄주쓰^일본어라는, 여러 wav 파일에 일련의 CV 음절을 녹음하여 VCV를 사용하지 않고도 부드러운 결과를 얻는 방법도 있다.

음성 라이브러리는 사용자가 직접 음성 데이터를 수집하여 제작할 수 있다. 사람의 목소리뿐만 아니라 악기 소리나 동물 소리 등으로도 만들 수 있으며, 표현력을 높이기 위해 다중 음성, 속삭이는 소리, 자음만 포함하는 등의 음성 파일을 추가할 수도 있다. X-SAMPA 등의 음성 기호를 사용하여 다국어에 대응하는 라이브러리도 제작 가능하다.^[35]

4. 3. 확장성

UTAU는 내장 플러그인(컴퓨팅)으로 자음 자동 병합을 할 수 있으며, 파일 전체에 자동 피치 및 비브라토를 추가할 수 있는 "오마카세/A la carte" 설정도 있다. 사용자가 만든 다른 플러그인을 소프트웨어에 추가할 수도 있다. 편집기의 색상은 setting.ini 파일에서 변경할 수 있다. UTAU는 VOCALOID와 같은 3부 구조를 가지며, 이러한 구성 내용에 사용자가 손을 댈 수 있다는 것도 특징이다.^[1]

UTAU|우타우^일본어는 모든 음성을 사용하여 노래를 만들 수 있지만, 저작권이 있는 음성을 무단으로 사용하면 문제가 발생할 수 있다. 배우, 가수, 유명인의 목소리가 UTAU|우타우^일본어에서 사용하기 위해 재사용되는 경우가 많다. 실제로 제작자인 아메야(Ameya)는 한때 성우의 CD 데이터를 사용하여 목소리를 만들기도 했다.^[8]

2008년 5월, 아메야/쇼우부는 저작권 문제로 인해 허가 없이 음성 데이터를 사용하는 것을 중단하겠다고 밝혔다.^[8] 아메야/쇼우부는 HAND MAID 메이의 보이스 드라마 CD의 일부를 사용하여 데모를 진행했었다. 이러한 배경을 바탕으로 권리 관계가 정리되지 않는 한, 당분간 해당 음성 데이터를 사용한 데모를 진행하지 않겠다고 밝혔다.^[40]

UTAU는 모든 음성을 사용하여 노래를 만들 수 있지만, 저작권이 있는 음성을 무단으로 사용하면 문제가 발생할 수 있다. 배우, 가수, 유명인의 목소리가 UTAU에서 사용하기 위해 재사용되는 경우가 많다. 실제로 제작자인 아메야(Ameya)는 한때 성우의 CD 데이터를 사용하여 목소리를 만들기도 했다.^[8]

2008년 5월, 아메야/쇼우부는 저작권 문제로 인해 허가 없이 음성 데이터를 사용하는 것을 중단하겠다고 밝혔다.^[8] UTAU는 TV 프로그램, CD, DVD 소프트웨어에서 기존 인물의 음성을 채취하여 데이터를 사용할 수 있는데, 아메야/쇼우부도 처음에는 HAND MAID 메이의 보이스 드라마 CD의 일부를 사용하여 데모를 진행했었다. 이러한 배경을 바탕으로 아메야/쇼우부는 권리 관계가 정리되지 않는 한, 당분간 해당 음성 데이터를 사용한 데모를 진행하지 않겠다고 밝혔다.^[40]

6. 문화적 영향

UTAU는 인터넷에서 무료로 배포되며, 사용자가 자신의 목소리를 데이터베이스에 넣어 음악에 사용할 수 있게 해 주었다. 이는 사용자가 자신의 음악을 더 발전시킬 수 있는 길을 열어주었다.^[17] UTAU는 니코니코 동화 및 유튜브와 같은 사이트에서 음악 제작자들이 UTAU를 사용한 작품을 만들도록 이끌었다. 사용자들은 또한 고가의 보컬로이드 소프트웨어의 대안으로 UTAU를 사용한다. UTAU는 방대한 데이터베이스를 통해 원하는 목소리를 제공할 가능성이 더 크기 때문이다. 그러나 UTAU는 보컬로이드보다 훨씬 적은 제작자가 사용하고 있다.^[17]

한 라디오 방송국에서는 보컬로이드 및 UTAU 기반 음악만으로 구성된 1시간짜리 프로그램을 편성하기도 했다.^[18] 또한, 2012년 7월 19일부터는 'The UTAU M@STER'라는 행사가 정기적으로 개최되고 있다. 이 행사는 2007년부터 존재해온 보컬로이드 관련 행사 'THE VOC@LOID M@STER'와 유사한 방식으로, 그룹이나 서클의 주요 모임이었다.^[19]

6. 1. 대중문화에 미친 영향

UTAU는 니코니코 동화와 유튜브와 같은 사이트에서 인기를 얻으며 수많은 음악 제작자들이 UTAU를 사용한 창작물을 만들었다.^[17] 특히, 2008년 카사네 테토의 제작자가 만우절 장난으로 테토를 보컬로이드 캐릭터로 위장해 공개하면서 UTAU가 처음 유명해졌다.

보컬로이드의 영향으로 UTAU와 보컬로이드는 함께 사용되는 경우가 많다. 카사네 테토와 같은 인기있는 UTAU 마스코트는 ''메이커 비공식 하츠네 믹스''나 하츠네 미쿠 -Project DIVA-와 같은 보컬로이드 기반 미디어에도 등장했다.

6. 2. 관련 소프트웨어

UTAU는 보컬로이드와 함께 사용되는 경우가 많으며, 서로 영향을 주고받았다. Macne 시리즈(Mac音シリーズ)는 UTAU와 Reason, GarageBand 등에서 사용할 수 있는 음성 라이브러리를 제공했다.^[20] Synthesizer V, OpenUTAU 등 UTAU의 영향을 받은 다른 음성 합성 소프트웨어도 개발되었다.

Macne 시리즈의 Macne Nana는 UTAU 음성과 보컬로이드 음성을 모두 가지게 되었다.^[20] 영어 보컬로이드 Ruby의 음성 제공자인 Misha는 이전에 일본어 UTAU인 마쿠네 하치(MAKU音ハチ)를 제작했다. 덱스(Dex)의 보컬리스트 켄지-B(Kenji-B)는 UTAU용으로 배음음 켄지(倍音音ケンジ)를 만들었고, 덱스의 파트너 다이나(Daina)의 보컬리스트 아키글랜시(AkiGlancy)는 UTAU 나미다에게 자신의 목소리를 제공했다. Mac네 코코 화이트와 블랙 (참조: Macne 시리즈)의 성우인 이노우에 키쿠코는 하노소라(桜乃そら)라는 이름의 보컬로이드5 제품의 성우를 맡았다.^[11]

보컬로이드 3 보컬 토호쿠 즌코가 출시된 후, 그녀의 두 자매인 토호쿠 이타코와 토호쿠 키리탄이 UTAU 보컬을 받았다.^[12] 키리탄은 나중에 Voiceroid가 되기 위한 크라우드 펀딩 캠페인을 진행했다.^[13]

UTAU를 위해 처음 제작된 음성 뱅크인 Namine Ritsu(波音リツ^일본어)는 나중에 "Namine Ritsu S"라는 이름으로 Sinsy라는 다른 소프트웨어에도 추가되었다. UTAU 소프트웨어를 위해 처음 개발된 또 다른 음성 뱅크인 Yamine Renri(闇音レンリ^일본어)도 나중에 Synthesizer V에 추가되었다. 인기 있는 UTAU 캐릭터 카사네 테토는 2023년 4월 27일에 Synthesizer V AI 음성 데이터베이스로 출시되었다.^[22]

UTAU의 영향을 받아 개발된 Synthesizer V는 UTAU 리샘플러인 Moresampler의 개발에서 비롯되었으며, 두 소프트웨어 모두 Kanru Hua가 개발했다.^[14]^[15]^[16]

OpenUTAU는 2021년 11월에 베타 버전이 출시된 보컬로이드 프로듀서 StAkira가 개발한 UTAU의 비공식 오픈 소스 후속작이다. UTAU와 달리 제대로 작동하기 위해 일본어 시스템 로캘이 필요하지 않다.^[27]

7. 한국에서의 UTAU

이전의 결과물은 빈 텍스트였습니다. 따라서 수정할 내용이 없습니다.

참조

_[1] 웹사이트 Phoneme Chart https://arpasing.neo[...] 2024-04-06
_[2] 웹사이트 '"Continuous Sound" Recording: UTAU Upgrades Realism – Vocaloidism' https://web.archive.[...] 2016-04-27
_[3] 웹사이트 '"Continuous Sound" Recording: UTAU Upgrades Realism – Vocaloidism' https://web.archive.[...] 2016-04-27
_[4] 웹사이트 自作ツールを使ってテキスト読み上げソフトに『片道キャッチボール』を https://www.nicovide[...] 2008-02-05
_[5] 웹사이트 人力ボーカロイド支援ツールらしきものを作ってみたその１導入編 https://nico.ms/sm25[...] 2008-03-06
_[6] 웹사이트 あなたの声で歌うソフト「UTAU」の奇妙な世界 https://ascii.jp/ele[...] 2021-06-29
_[7] 웹사이트 "真の人力Vocaloid"とは http://utau2008.blog[...] 2021-06-29
_[8] 웹사이트 テト声の調整に本腰が入った理由 (Why I got serious about adjusting the Teto voice) http://utau2008.blog[...] 2021-07-31
_[9] 웹사이트 crypton_wat https://twitter.com/[...] 2016-04-27
_[10] 웹사이트 crypton_wat https://twitter.com/[...] 2016-04-29
_[11] 웹사이트 井上喜久子のVOCALOID、VOICEROIDがついに登場！新VOCALOID5に対応！『VOCALOID 桜乃そら』『VOICEROID2 桜乃そら』 2018年7月26日発売 https://www.ah-soft.[...] AH-Software 2021-06-29
_[12] 웹사이트 東北イタコ、きりたんのUTAU音源 http://zunko.jp/con_[...] 2016-04-27
_[13] 웹사이트 クラウド出版 https://greenfunding[...] 2016-04-27
_[14] 간행물 libllsm2 https://github.com/S[...] 2022-09-23
_[15] 웹사이트 libllsm2 Release – Kanru Hua's Website https://webhost.engr[...] 2018-10-08
_[16] 웹사이트 Moresampler – Kanru Hua's Website https://webhost.engr[...] 2018-10-08
_[17] 웹사이트 How Big Is The Japanese Vocaloid Community? https://web.archive.[...]
_[18] 웹사이트 NHK の本気!ボカロラジオ「エレうた」の高き志 http://ascii.jp/elem[...] ASCII Media Works 2011-02-05
_[19] 웹사이트 「THE UTAU M@STER」UTAU only event http://ketto.com/uta[...] 2016-04-27
_[20] 웹사이트 Mac音ナナシリーズ https://web.archive.[...] Act2 2010-07-09
_[21] 웹사이트 音声合成ライブラリ製品の紹介 - 株式会社アクエスト http://www.a-quest.c[...] 2016-04-27
_[22] 웹사이트 Synthesizer V AI 重音テト https://www.ah-soft.[...] 2023-04-02
_[23] 웹사이트 Controversy Concerns/POCALOID and illegal modifications https://vocaloid.fan[...] 2019-09-01
_[24] 웹사이트 Macで動くボーカルシンセを作る http://sugarcape.net[...] 2016-04-27
_[25] 웹사이트 UTAU for Mac: UTAU-Synth https://web.archive.[...] 2016-04-27
_[26] 웹사이트 "@chipspeech 5:19 p.m.—Nov 10, 2017 Tweet" https://twitter.com/[...] 2017-12-01
_[27] 웹사이트 What is OpenUTAU? https://studio-ogien[...] 2021-11-16
_[28] 웹사이트 Kasane Teto "Graduation from Lie" http://karent.jp/spe[...] Crypton Future Media 2010-10-02
_[29] 문서 窓の杜 - 2009年窓の杜大賞 https://forest.watch[...]
_[30] 문서 “UTAU”のモバイル版『歌う@mobile』 http://utau2008.blog[...]
_[31] 문서 音源名「UTAUデフォルト」。キャラクタ名は'''唄音ウタ'''、通称'''デフォ子'''。
_[32] 문서 原音の周波数が極端に高い、低い場合は設定値の限界に追い付かず、また[[デスボイス]]を始めとした息成分(ノイズ)が濃厚で基音が正常に検出されにくい音源は、手動で周波数表を修正しないと正しく再生されない、または音高がおかしくなる場合がある。
_[33] 문서 母音と子音+母音で構成される音源は、上記連続音と区別するため「単独音」と呼ばれる事もある。
_[34] 문서 使用する場合、音素同士を接続する部分でクロスフェードさせる必要がある。CVVC音源でも同様。
_[35] Youtube http://www.youtube.c[...]
_[36] 문서 Resamplerに該当する。音高変更で用いるフォルマント処理に関しては彼独自のアルゴリズムで制作された。
_[37] 웹사이트 AquesTalkのエンジンを使用したテキスト読み上げソフト。 https://web.archive.[...]
_[38] 웹사이트 あなたの声で歌うソフト「UTAU」の奇妙な世界 https://ascii.jp/ele[...] 2010-08-14
_[39] 웹사이트 “真の人力Vocaloid”とは http://utau2008.blog[...] 2008-06-01
_[40] 웹사이트 http://utau2008.blog[...]
_[41] 웹인용 歌声合成ツールUTAU http://utau2008.web.[...] Utau 2010-07-09

본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com

우타우