Common Voice
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
Common Voice는 다양한 음성 샘플을 제공하는 것을 목표로 하는 모질라 재단의 오픈 소스 프로젝트이다. 기존 음성 데이터 세트의 편향성을 개선하고, 다양한 언어와 억양을 가진 화자의 음성 데이터를 확보하는 데 중점을 둔다. 2017년 시작되어, 2022년 10월 기준 100개 이상의 언어에 대한 음성 데이터를 수집하며, 자유롭게 접근 가능한 대규모 음성 데이터베이스를 구축했다.
더 읽어볼만한 페이지
Common Voice - [IT 관련 정보]에 관한 문서 | |
---|---|
개요 | |
![]() | |
웹사이트 | 커먼 보이스 공식 웹사이트 |
상세 정보 | |
언어 | 다국어 (지원 언어 목록) |
개발 | 모질라 재단 |
출시일 | 2017년 6월 19일 |
저장소 | GitHub 저장소 |
라이선스 | Creative Commons CC0 |
2. 목표
Common Voice는 다양한 음성 샘플을 제공하는 것을 목표로 한다. 모질라의 카타리나 보르처트에 따르면, 많은 기존 프로젝트들은 공영 라디오에서 데이터를 가져오거나, 여성과 뚜렷한 억양을 가진 사람들의 음성 데이터를 충분히 포함하지 못하는 데이터 세트를 가지고 있었다.[2]
2017년 11월 29일, 커먼 보이스 프로젝트의 첫 번째 데이터가 공개되었을 때, 전 세계 2만 명 이상의 사용자가 40만 개의 검증된 문장을 등록하여 총 500시간 분량의 영어 음성 데이터가 구축되었다.[15]
Common Voice 데이터베이스는 LibriSpeech 다음으로 자유롭게 접근 가능한 두 번째로 큰 음성 데이터베이스이다.[15] 2017년 11월 29일에 첫 번째 데이터가 게시되었을 당시 전 세계 20,000명 이상의 사용자가 400,000개의 유효 문장을 등록했으며 총 길이는 500시간이었다.[15]
3. 역사
2019년 2월, 영어, 프랑스어, 독일어, 중국어를 포함한 18개 언어의 음성 데이터가 첫 번째 버전으로 출시되었다. 여기에는 웨일스어, 카빌어 등 소수 언어도 포함되었으며, 총 42,000명 이상의 기여자가 약 1,400시간 분량의 음성 데이터를 제공했다.[16]
2020년 12월 기준, 60개 언어, 9283h의 음성 기록이 데이터베이스에 축적되었으며, 그중 7335h 분량이 자원 봉사자에 의해 검증되었다.[13]
2022년 초, 벵골어.AI는 기계가 벵골어를 이해하도록 돕는 "방글라 음성 인식" 프로젝트를 위해 커먼 보이스와 협력하여 2000h의 음성 데이터를 수집했다.[3]
4. 음성 데이터베이스
2019년 2월에는 영어, 프랑스어, 독일어, 중국어를 포함한 18개 언어의 첫 번째 배치가 출시되었으며, 웨일스어, 카빌어와 같이 널리 사용되지 않는 언어도 포함되었다. 여기에는 총 42,000명 이상의 기부자로부터 약 1,400시간의 녹음된 음성 데이터가 포함되었다.[16] 모질라의 카타리나 보르처트에 따르면, 많은 기존 프로젝트들은 공영 라디오에서 데이터를 가져오거나, 여성과 뚜렷한 억양을 가진 사람들을 제대로 대표하지 못하는 데이터 세트를 가지고 있었다.[2]
2020년 7월 기준으로 데이터베이스에는 54개 언어로 총 7,226시간의 음성 녹음이 축적되었으며, 이 중 5,591시간은 자원봉사자가 검증했다.[6] 2021년 5월에는 키냐르완다어를 추가하는 작업을 마친 후, 스와힐리어를 추가하기 위한 보조금을 받았다.[7] 2022년 9월에는 가나의 트위어가 모질라 커먼 보이스 데이터베이스에 추가된 100번째 언어라는 발표가 있었다.[8]
4. 1. 지원 언어 목록 (2022년 10월 기준)
Common Voice영어는 2022년 10월 기준으로 다음과 같은 언어에 대한 음성 데이터를 공식적으로 수집한다.[9]
참조
[1]
웹사이트
Mozilla Common Voice
https://commonvoice.[...]
2024-10-06
[2]
뉴스
Why do we gender AI? Voice tech firms move to be more inclusive
https://www.theguard[...]
2020-01-11
[3]
웹사이트
Bengali.AI: Democratising AI research in Bangla
https://www.tbsnews.[...]
2022-12-25
[4]
웹사이트
Announcing the Initial Release of Mozilla’s Open Source Speech Recognition Model and Voice Dataset
https://blog.mozilla[...]
2019-11-19
[5]
웹사이트
Mozilla updates Common Voice dataset with 1,400 hours of speech across 18 languages
https://venturebeat.[...]
2019-11-19
[6]
웹사이트
Mozilla Common Voice updates will help train the ‘Hey Firefox’ wakeword for voice-based web browsing
https://venturebeat.[...]
2020-07-01
[7]
웹사이트
Mozilla Common Voice Receives $3.4 Million Investment to Democratize and Diversify Voice Tech in East Africa
https://foundation.m[...]
2021-06-03
[8]
웹사이트
Ghana’s most popular language is now on Mozilla Common Voice
https://qz.com/ghana[...]
2022-09-23
[9]
웹사이트
Languages
https://commonvoice.[...]
2022-10-04
[10]
뉴스
Why do we gender AI? Voice tech firms move to be more inclusive
https://www.theguard[...]
2020-01-11
[11]
웹사이트
Announcing the Initial Release of Mozilla’s Open Source Speech Recognition Model and Voice Dataset
https://blog.mozilla[...]
2021-05-04
[12]
웹사이트
Mozilla updates Common Voice dataset with 1,400 hours of speech across 18 languages
https://venturebeat.[...]
2021-05-04
[13]
웹사이트
Common Voiceデータセット
https://commonvoice.[...]
2021-05-04
[14]
뉴스
Why do we gender AI? Voice tech firms move to be more inclusive
https://www.theguard[...]
2020-04-19
[15]
웹인용
Announcing the Initial Release of Mozilla’s Open Source Speech Recognition Model and Voice Dataset
https://blog.mozilla[...]
2017-11-29
[16]
웹인용
Mozilla updates Common Voice dataset with 1,400 hours of speech across 18 languages
https://venturebeat.[...]
2019-02-28
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com