맨위로가기

구글 텍스트 음성 변환

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

구글 텍스트 음성 변환은 구글에서 제공하는 텍스트를 음성으로 변환하는 기술이다. 안드로이드 애플리케이션과 구글 클라우드 음성 변환 서비스를 통해 다양한 언어를 지원하며, 한국어를 포함하여 알바니아어, 아랍어, 벵골어, 중국어, 영어, 프랑스어, 독일어, 힌디어, 일본어, 스페인어 등을 지원한다. 2023년에는 '음성 인식 및 합성'으로 서비스 이름이 변경되었다. 이 기술은 딥마인드의 WaveNet을 기반으로 하며, 인간과 유사한 강세와 억양을 사용하여 음성을 합성하는 것이 특징이다.

더 읽어볼만한 페이지

  • 스크린 리더 - 내레이터 (윈도우)
    윈도우 내레이터는 시각 장애인을 위해 윈도우 운영체제에 내장된 접근성 기능으로, 텍스트를 음성으로 변환하여 컴퓨터 사용을 돕고 다양한 운영체제 버전을 거치면서 언어 지원, 음성 품질, 사용자 인터페이스 등 사용성이 향상되었다.
  • 스크린 리더 - 보이스오버 (소프트웨어)
    애플의 보이스오버는 시각 장애인 사용자를 위해 개발된 스크린 리더 기능으로, 음성 안내와 제스처를 통해 애플 기기 사용을 돕고, 텍스트 음성 변환, 점자 디스플레이 지원 등의 다양한 기능을 제공한다.
  • 구글의 서비스 - 유튜브
    유튜브는 2005년 설립되어 다양한 비디오 콘텐츠를 공유하는 세계 최대 온라인 동영상 플랫폼으로 성장, 구글에 인수된 후 다양한 서비스를 출시하고 기술적 발전을 이루었으나, 저작권 문제, 극단주의 콘텐츠 확산, 개인정보보호 논란 등 사회적 문제에 직면해 광고 차단 프로그램 단속 강화 정책을 시행하고 있다.
  • 구글의 서비스 - 구글 검색
    구글 검색은 래리 페이지와 세르게이 브린이 개발한 검색 엔진으로, 페이지랭크 알고리즘을 사용하며 검색 품질 개선을 위한 다양한 업데이트를 진행해 왔으나, 개인 정보 보호, 편향성 등의 문제로 비판받기도 한다.
구글 텍스트 음성 변환 - [IT 관련 정보]에 관한 문서
개요
개발사구글
출시일2013년 10월 10일
최신 버전20241030.02/p3 (빌드 702043126)
최신 버전 출시일2024년 12월 2일
운영체제안드로이드
종류스크린 리더

2. 지원 언어

구글 텍스트 음성 변환은 전 세계 사용자들이 사용할 수 있도록 다양한 언어를 지원한다.[8][9] 지원하는 언어는 다음과 같다.

지원 언어국가
아프리칸스어|아프리칸스어af남아프리카 공화국
알바니아어|알바니아어sq알바니아
암하라어|암하라어am에티오피아
아랍어사우디아라비아
아삼어|아삼어as인도
바스크어|바스크어eu스페인
벵골어|벵골어bn방글라데시, 인도
보도어|보도어brx인도
보스니아어|보스니아어bs보스니아 헤르체고비나
불가리아어|불가리아어bg불가리아
버마어|버마어my미얀마
광둥어|광둥어yue홍콩
카탈루냐어|카탈루냐어ca스페인
중국어|중국어중국어중국, 대만
크로아티아어|크로아티아어hr크로아티아
체코어|체코어cs체코
덴마크어|덴마크어da덴마크
도그리어|도그리어doi인도
네덜란드어|네덜란드어nl벨기에, 네덜란드
영어호주, 나이지리아, 인도, 영국, 미국
에스토니아어|에스토니아어et에스토니아
필리핀어|필리핀어fil필리핀
핀란드어|핀란드어fi핀란드
프랑스어캐나다, 프랑스
갈리시아어|갈리시아어gl스페인
독일어|독일어de독일
그리스어|그리스어el그리스
구자라트어|구자라트어gu인도
하우사어|하우사어ha나이지리아
히브리어|히브리어he이스라엘
힌디어|힌디어hi인도
헝가리어|헝가리어hu헝가리
아이슬란드어|아이슬란드어is아이슬란드
인도네시아어|인도네시아어id인도네시아
이탈리아어|이탈리아어it이탈리아
일본어|일본어일본어일본
자바어|자바어jv인도네시아
칸나다어|칸나다어kn인도
카슈미르어|카슈미르어ks인도
크메르어|크메르어km캄보디아
콘칸어|콘칸어kok인도
한국어|한국어한국어대한민국
라틴어|라틴어la바티칸 시국
라트비아어|라트비아어lv라트비아
리투아니아어|리투아니아어lt리투아니아
마이틸리어|마이틸리어mai인도
말레이어|말레이어ms말레이시아
말라얄람어|말라얄람어ml인도
마니푸리어|마니푸리어mni인도
마라티어|마라티어mr인도
네팔어|네팔어ne네팔
노르웨이어|노르웨이어nb노르웨이
오디아어|오디아어or인도
폴란드어|폴란드어pl폴란드
포르투갈어브라질, 포르투갈
펀자브어|펀자브어pa인도
루마니아어|루마니아어ro루마니아
러시아어|러시아어ru러시아
산스크리트어|산스크리트어sa인도
산탈어|산탈어sat인도
세르비아어|세르비아어sr세르비아
신디어|신디어sd인도
싱할라어|싱할라어si스리랑카
슬로바키아어|슬로바키아어sk슬로바키아
슬로베니아어|슬로베니아어sl슬로베니아
스페인어스페인, 미국
순다어|순다어su인도네시아
스와힐리어|스와힐리어sw케냐
스웨덴어|스웨덴어sv스웨덴
타밀어|타밀어ta인도
텔루구어|텔루구어te인도
태국어|태국어th태국
터키어|터키어tr터키
우크라이나어|우크라이나어uk우크라이나
우르두어|우르두어ur파키스탄, 인도
베트남어|베트남어vi베트남
웨일스어|웨일스어cy영국


2. 1. 구글 음성 변환 안드로이드 애플리케이션

안드로이드 애플리케이션에서는 한국어|한국어한국어(대한민국)를 포함하여 다음과 같은 다양한 언어를 지원한다.[8]

지원 언어국가
알바니아어|알바니아어sq알바니아
아랍어사우디아라비아
아삼어|아삼어as인도
바스크어|바스크어eu스페인
벵골어|벵골어bn방글라데시, 인도
보도어|보도어brx인도
보스니아어|보스니아어bs보스니아 헤르체고비나
불가리아어|불가리아어bg불가리아
버마어|버마어my미얀마
광둥어|광둥어yue홍콩
카탈루냐어|카탈루냐어ca스페인
중국어|중국어중국어중국, 대만
크로아티아어|크로아티아어hr크로아티아
체코어|체코어cs체코
덴마크어|덴마크어da덴마크
도그리어|도그리어doi인도
네덜란드어|네덜란드어nl벨기에, 네덜란드
영어호주, 나이지리아, 인도, 영국, 미국
에스토니아어|에스토니아어et에스토니아
필리핀어|필리핀어fil필리핀
핀란드어|핀란드어fi핀란드
프랑스어캐나다, 프랑스
갈리시아어|갈리시아어gl스페인
독일어|독일어de독일
그리스어|그리스어el그리스
구자라트어|구자라트어gu인도
하우사어|하우사어ha나이지리아
히브리어|히브리어he이스라엘
힌디어|힌디어hi인도
헝가리어|헝가리어hu헝가리
아이슬란드어|아이슬란드어is아이슬란드
인도네시아어|인도네시아어id인도네시아
이탈리아어|이탈리아어it이탈리아
일본어|일본어일본어일본
자바어|자바어jv인도네시아
칸나다어|칸나다어kn인도
카슈미르어|카슈미르어ks인도
크메르어|크메르어km캄보디아
콘칸어|콘칸어kok인도
한국어|한국어한국어대한민국
라틴어|라틴어la바티칸 시국
라트비아어|라트비아어lv라트비아
리투아니아어|리투아니아어lt리투아니아
마이틸리어|마이틸리어mai인도
말레이어|말레이어ms말레이시아
말라얄람어|말라얄람어ml인도
마니푸리어|마니푸리어mni인도
마라티어|마라티어mr인도
네팔어|네팔어ne네팔
노르웨이어|노르웨이어nb노르웨이
오디아어|오디아어or인도
폴란드어|폴란드어pl폴란드
포르투갈어브라질, 포르투갈
펀자브어|펀자브어pa인도
루마니아어|루마니아어ro루마니아
러시아어|러시아어ru러시아
산스크리트어|산스크리트어sa인도
산탈어|산탈어sat인도
세르비아어|세르비아어sr세르비아
신디어|신디어sd인도
싱할라어|싱할라어si스리랑카
슬로바키아어|슬로바키아어sk슬로바키아
슬로베니아어|슬로베니아어sl슬로베니아
스페인어스페인, 미국
순다어|순다어su인도네시아
스와힐리어|스와힐리어sw케냐
스웨덴어|스웨덴어sv스웨덴
타밀어|타밀어ta인도
텔루구어|텔루구어te인도
태국어|태국어th태국
터키어|터키어tr터키
우크라이나어|우크라이나어uk우크라이나
우르두어|우르두어ur파키스탄, 인도
베트남어|베트남어vi베트남
웨일스어|웨일스어cy영국


2. 2. 구글 클라우드 음성 변환

구글 클라우드 음성 변환 서비스는 한국어를 포함하여 다양한 언어를 지원한다.[9] 지원되는 언어는 다음과 같다.

지원 언어


3. 역사

현대차는 2015년에 Android Auto 앱에 텍스트 음성 변환(Text-to-Speech) 기능을 적용한다고 발표했다.[4] 이후 textPlus, WhatsApp과 같은 앱들도 텍스트 음성 변환 기술을 활용하여 알림을 읽어주거나 음성 응답 기능을 제공하기 시작했다.

3. 1. 딥마인드 WaveNet 기술

구글 클라우드 텍스트 음성 변환은 구글의 영국 기반 AI 자회사인 DeepMind가 만든 소프트웨어인 WaveNet을 기반으로 한다.[5] DeepMind는 2014년 구글에 인수되었다.[6] 이 서비스는 경쟁사인 아마존 및 마이크로소프트와 차별화를 시도한다.[7]

대부분의 음성 합성기(애플의 Siri 포함)는 프로그램을 통해 개별 음소를 저장한 다음 이를 조합하여 단어와 문장을 형성하는 연쇄 합성을 사용한다.[5] 반면 WaveNet은 음절, 음소 및 단어에 인간과 유사한 강세와 억양을 사용하여 음성을 합성한다.

대부분의 다른 텍스트 음성 변환 시스템과 달리, WaveNet 모델은 처음부터 원시 오디오 파형을 생성한다. 이 모델은 방대한 양의 음성 샘플을 사용하여 훈련된 신경망을 사용한다. 훈련 과정에서 네트워크는 어떤 음이 서로 뒤따르는지, 현실적인 음성 파형이 어떻게 보이는지 등 음성의 기본 구조를 추출한다. 훈련된 WaveNet 모델은 텍스트 입력을 받으면 초당 최대 24,000개의 샘플로 개별 소리 간에 부드럽게 전환하면서 해당 음성 파형을 처음부터 한 번에 하나씩 생성할 수 있다.[5]

3. 2. 서비스 발전

DeepMind가 개발한 WaveNet을 기반으로 구글 클라우드 텍스트 음성 변환 서비스가 제공되기 시작했다.[5] DeepMind는 2014년 구글에 인수된 영국의 AI 전문 기업이다.[6] 이 서비스는 아마존, 마이크로소프트의 서비스와 차별화를 시도한다.[7]

대부분의 음성 합성기는 연쇄 합성 방식을 사용한다. 이 방식에서는 개별 음소를 미리 저장해 둔 다음, 이를 조합하여 단어와 문장을 구성한다. Siri도 이 방식을 사용한다.[5] WaveNet은 음절, 음소, 단어에 사람과 비슷한 강세와 억양을 넣어 음성을 합성한다.

대부분의 다른 텍스트 음성 변환 시스템과 달리, WaveNet 모델은 처음부터 원시 오디오 파형을 생성한다. 이 모델은 방대한 양의 음성 샘플을 사용하여 훈련된 신경망을 사용한다. 훈련 과정에서 네트워크는 어떤 소리가 서로 뒤따르는지, 실제 음성 파형이 어떻게 보이는지 등 음성의 기본 구조를 추출한다. 훈련된 WaveNet 모델은 텍스트 입력을 받으면 초당 최대 24,000개의 샘플로 개별 소리 간에 부드럽게 전환하면서 해당 음성 파형을 처음부터 한 번에 하나씩 생성할 수 있다.[5]

2023년, 이 서비스는 '음성 인식 및 합성'으로 이름이 변경되었다.

참조

[1] 웹사이트 Speech Recognition & Synthesis https://play.google.[...] 2024-12-11
[2] 웹사이트 Speech Recognition & Synthesis googletts.google-speech-apk_20241125.02_p2.702443970 https://www.apkmirro[...] 2024-12-11
[3] 웹사이트 You'll never guess the latest Google app to cross 10 billion installs (seriously) https://www.androidp[...] 2021-11-08
[4] 웹사이트 Google, Hyundai show off new third-party Android Auto apps http://www.cnet.com/[...] CBS Interactive 2015-01-17
[5] 웹사이트 WaveNet https://www.deepmind[...] 2023-06-22
[6] 뉴스 Google buys UK artificial intelligence startup Deepmind for £400m https://www.theguard[...] 2014-01-27
[7] 웹사이트 Text-to-Speech AI: Lifelike Speech Synthesis https://cloud.google[...] 2023-06-22
[8] Google Play Google Text-to-Speech https://play.google.[...]
[9] 문서 Supported voices and languages | Cloud Text-to-Speech Documentation https://cloud.google[...]



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com