LibriVox
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
LibriVox는 자원봉사자들이 녹음한 저작권이 만료된 도서를 팟캐스트 형식으로 제공하는 프로젝트이다. 2005년 휴 맥과이어에 의해 시작되었으며, '책의 목소리'라는 의미를 지닌다. LibriVox는 자원봉사로 운영되며, 웹사이트 호스팅 비용을 충당하기 위한 모금 활동을 진행했다. 완성된 오디오북은 웹사이트 및 인터넷 아카이브에서 이용 가능하며, MP3 파일로 제공된다. 미국 퍼블릭 도메인 자료만 녹음하며, 다양한 언어로 제공된다. LibriVox는 음성 신호 처리를 위한 코퍼스로도 활용되며, LibriSpeech, LibriTTS 등 파생 코퍼스가 개발되었다.
더 읽어볼만한 페이지
- 오디오북 - 데이지 (기술 표준)
데이지는 접근성이 필요한 사람들을 위해 설계된 디지털 오디오 북 표준으로, 다양한 미디어를 통합하여 텍스트와 오디오를 동기화하고 탐색 기능과 맞춤 설정을 제공하며 접근성 향상에 기여한다. - 책 웹사이트 - 굿리즈
굿리즈는 사용자들이 책에 대한 서평을 작성, 공유하고 독서 목록을 관리하며 소통하는 도서 소셜 네트워크 서비스로, 다양한 기능을 제공하지만 리뷰 공정성 및 추천 알고리즘에 대한 비판도 있다. - 책 웹사이트 - 팝매터스
팝매터스는 사라 줍코가 설립한 온라인 잡지로 다양한 미디어 제품에 대한 에세이, 리뷰, 비평을 제공하며 시작하여 주 5일 발행 잡지 형식으로 발전했고, 신디케이트 칼럼 제공 및 자체 서적 출판과 함께 다양한 배경의 기고자들이 참여하고 있다. - 퍼블릭 도메인 책 - 일리아스
《일리아스》는 호메로스에 의해 쓰여진 고대 그리스의 서사시로, 트로이 전쟁 막바지를 배경으로 아킬레우스의 분노를 중심으로 전개되며, 인간의 보편적인 감정과 삶의 의미를 탐구한다. - 퍼블릭 도메인 책 - 나의 투쟁
《나의 투쟁》은 아돌프 히틀러가 집필한 자서전이자 나치즘의 핵심 이념을 담은 책으로, 히틀러의 유년 시절, 나치당 창당 과정, 인종주의, 반유대주의, 레벤스라움 등의 정치적 신념을 상세히 묘사하고 있다.
LibriVox - [지명]에 관한 문서 | |
---|---|
일반 정보 | |
위치 | 전 세계 (미국 기반) |
설립일 | 2005년 8월 |
소장 자료 수 | 18,900 (2023년 12월 31일 기준) |
회원 | 전 세계 자원 봉사자 |
예산 | 5,000 미국 달러/년 (2010년 기준) |
관리자 | 해당 없음 (커뮤니티 공유) |
웹사이트 | LibriVox 웹사이트 |
온라인 정보 | |
사이트 이름 | LibriVox |
URL | librivox.org/ |
유형 | 무료 오디오북 녹음 및 배포 |
사용 언어 | 주로 영어 |
항목 수 | 1000개 이상의 오디오북 |
청취 | 무료 |
저작권 | 퍼블릭 도메인 |
운영 | 자금 없음 오디오 파일 배포: Internet Archive에서 무상 지원 웹사이트 호스팅: nyip.net에서 무상 지원 |
영리성 | 없음 |
설립자 | 휴 맥과이어 (Hugh McGuire) |
2. 역사
LibriVox는 퍼블릭 도메인 텍스트를 낭독하고 녹음하여 무료 오디오북을 제작하는 세계적인 자원봉사 프로젝트 중 하나이다. 웹사이트나 다른 디지털 도서관 호스팅 사이트에서 누구나 오디오북을 다운로드할 수 있도록 제공한다. 2005년 휴 맥과이어(Hugh McGuire)에 의해 시작되었으며[34][35], 그 목적은 "퍼블릭 도메인 서적의 음향적 해방"이다. 퍼블릭 도메인이 된 모든 서적에 대해, LibriVox는 음성 파일 형식으로 인터넷상에서 무상으로 제공하는 것을 목표로 하고 있다.
이 프로젝트는 꾸준히 성장하여 2016년 8월 6일 기준으로 10,000개, 2021년 2월 14일 기준으로 15,000개의 오디오북을 완성했다. 공개된 작품의 대부분은 영어를 사용하지만, 영어 이외의 언어로 된 작품도 다수 포함하고 있다. LibriVox는 프로젝트에서 사용하는 텍스트의 일부를 프로젝트 구텐베르크에서 얻고 있으며, 완성된 작품은 인터넷 아카이브가 호스팅하는 등 관련 프로젝트와 긴밀하게 협력하고 있다.
2. 1. 설립 배경

LibriVox는 2005년 8월 몬트리올에 거주하는 작가 휴 맥과이어가 시작했다.[4][5] 그는 자신의 블로그에 다음과 같은 질문을 던지며 프로젝트를 구상했다.[4][5]
네트워크가 자원봉사자들을 활용하여 팟캐스트를 통해 저작권이 소멸된 책에 생명을 불어넣을 수 있을까?[4][5]
최초로 녹음된 책은 조지프 콘래드의 ''비밀 요원''이었다.[6]
LibriVox의 기본적인 운영 방식은 프로젝트 시작 이후 크게 변하지 않았지만, 웹 개발 기술을 가진 자원봉사자들의 노력 덕분에 이를 지원하는 기술은 꾸준히 개선되었다.
3. 명칭 (Etymology of LibriVox)
'LibriVox'는 라틴어 단어에서 영감을 얻어 만들어진 이름이다. liber|리베르la(책)의 소유격 형태인 libri|리브리la와 vox|복스la(목소리)를 결합하여 '책의 목소리'라는 의미를 가진다.
이 단어는 다른 의미도 함께 담고 있는데, liber|리베르la는 '아이' 또는 '자유로운, 독립적인, 제한 없는'이라는 뜻도 가지고 있다. LibriVox 포럼에서는 이와 관련하여 "우리는 LibriVox가 '목소리의 아이'나 '자유로운 목소리'로도 해석될 수 있다고 생각한다. 또한 우리가 좋아하는 다른 연관성은 '도서관'이므로, '목소리의 도서관'이라는 의미로도 상상할 수 있다."라고 설명한다.
LibriVox라는 이름의 공식적인 발음은 창립자나 자원봉사자 커뮤니티 내에서 정해진 바가 없다. 따라서 어떤 방식으로 발음하든 정확한 것으로 받아들여진다.
4. 운영 및 재정 (Organization and funding)
LibriVox는 자원 봉사로 운영되는, 무료 콘텐츠, 퍼블릭 도메인 프로젝트이다. 예산이나 법인은 없다. 프로젝트 개발은 인터넷 포럼을 통해 관리되며, 검색 가능한 완성된 작품 데이터베이스를 유지 관리하는 관리자 팀이 지원한다.
2010년 초, LibriVox는 웹사이트 호스팅 비용인 연간 약 5천달러를 충당하고 프런트엔드 및 백엔드 사용성을 개선하기 위해 2만달러를 모금하는 활동을 진행했다.[9] 목표는 13일 만에 달성되었고, 모금 활동은 종료되었으며 LibriVox는 후원자들에게 프로젝트 구텐베르크[10] 및 인터넷 아카이브[11]와 같은 제휴사 및 파트너에게 기부를 고려하도록 제안했다.
5. 제작 과정 (Production process)
LibriVox의 오디오북 제작은 전 세계 자원봉사자들의 참여로 이루어진다. 기본적인 운영 방식은 프로젝트 초기부터 크게 변하지 않았으나, 웹 기술의 발전에 따라 자원봉사자들의 노력으로 지원 기술은 꾸준히 개선되었다.
자원봉사자는 퍼블릭 도메인 텍스트를 직접 선택하여 새로운 녹음 프로젝트를 시작하거나, 다른 사람이 이미 시작한 프로젝트에 참여하여 특정 부분을 낭독하고 녹음할 수 있다. 자원봉사자가 녹음 파일을 제출하면, 해당 내용은 LibriVox 커뮤니티의 다른 구성원들에 의해 검토 과정을 거친다. 이 과정을 통해 오디오 품질과 원문 충실도 등을 확인한다.
검토가 완료된 오디오 파일은 LibriVox 웹사이트에 업로드되어 최종적으로 완성된 오디오북 형태로 제공된다. 완성된 오디오북은 LibriVox 웹사이트뿐만 아니라, MP3 파일 형태로 인터넷 아카이브에서도 들을 수 있다.[4][5] 또한 유튜브나 아이튠즈 같은 다양한 플랫폼을 통해서도 접할 수 있다.[4][5] LibriVox의 모든 오디오북은 퍼블릭 도메인에 해당하므로 저작권 제약 없이 누구나 자유롭게 다운로드하고 공유하며, 심지어 상업적으로도 이용할 수 있다. 이 때문에 LibriVox와는 별개로 인터넷 여러 곳에서 독립적으로 배포되기도 한다.[4][5]
6. 콘텐츠 (Content)
리브리복스는 미국에서 퍼블릭 도메인에 속하는 자료만을 녹음하며, 이렇게 제작된 모든 오디오북 역시 퍼블릭 도메인으로 공개된다.[12] 이러한 저작권 정책 때문에 현대 도서는 상대적으로 찾아보기 어렵지만, 미국 연방 정부의 저작물로서 퍼블릭 도메인에 속하는 ''9·11 테러 보고서''와 같은 예외적인 경우도 있다.
리브리복스가 제공하는 콘텐츠는 매우 다양하다. 널리 알려진 고전 소설뿐만 아니라, 이마누엘 칸트의 ''순수 이성 비판''과 같이 내용이 어려운 텍스트나 원주율의 첫 500자리를 읽은 녹음 등 독특한 자료도 포함하고 있다. 컬렉션에는 시, 희곡, 종교 텍스트(예: 코란의 영어 번역본, 다양한 성경 번역본), 그리고 여러 분야의 논픽션 저작물들이 있다. 2009년 1월 기준으로, 리브리복스 카탈로그는 녹음된 작품 수를 기준으로 소설과 드라마가 약 55%, 논픽션이 25%, 시가 20%를 차지했다.
2023년 말 기준으로 가장 많이 조회된 오디오북은 모이라 포가티(Moira Fogarty)가 2006년에 낭독한 손자의 ''손자병법''으로, 총 2,270만 회의 조회수를 기록했다. 그 뒤를 이어 여러 사람이 함께 낭독한 ''이상한 나라의 앨리스''(2006년)가 2,240만 회의 조회수를 기록하며 많은 인기를 얻었다.[25]
6. 1. 언어별 구성
리브리복스 카탈로그의 약 90%는 영어로 녹음되어 있지만, 80개 이상의 언어로 된 녹음이 존재한다. 중국어, 프랑스어, 독일어가 자원봉사자들 사이에서 영어 외에 가장 인기 있는 언어이며, 우르두어 및 타갈로그어를 포함한 다양한 언어로도 녹음이 제작되고 있다.7. 평가 (Reputation)
LibriVox는 자원봉사자가 주도하는 콘텐츠 제작 방식과 인터넷에서의 저작권 소유에 대한 대안적 접근 방식으로 상당한 주목을 받았다. 인터넷 아카이브와 프로젝트 구텐베르크로부터 지원을 받고 있다. 지적 자유와 공유지를 지지하는 마이크 링크스베이어는 2008년 LibriVox를 "위키백과 다음으로 가장 흥미로운 협업 문화 프로젝트일 것"이라고 평가했다.[13]
이 프로젝트는 전 세계 여러 언론 매체에도 소개되었다. BBC의 '클릭', MSNBC의 '투데이 쇼', '리즌',[14] '와이어드',[15] 미국의 ''PC 매거진'', 영국의 '메트로'와 '더 선데이 타임스'[16] 등이 LibriVox를 다루었다.
8. 품질 (Quality)
청취자들이 자주 우려하는 점 중 하나는 리브리복스의 녹음 정책이다. 리브리복스는 녹음 내용이 이해 가능하고 원본 텍스트에 충실하다면 모든 녹음을 게시하는 것을 허용한다.[17] 이 정책 때문에 일부 녹음은 전문 오디오북에 비해 오디오 품질이 낮을 수 있다. 예를 들어 배경 소음이 섞여 있거나, 비원어민의 억양이 나타나거나, 그 외 다른 결함이 있을 수 있다.[18][19]
또한, 한 권의 책을 여러 독자가 나누어 읽는 경우도 있는데, 일부 청취자는 이를 선호하지 않을 수 있다.[20] 반면, 다른 청취자들은 이를 문제 삼지 않거나 오히려 리브리복스만의 특징으로 여기기도 한다.[21][22][23] 물론, 많은 책은 한 명의 독자가 전체를 낭독한다.
리브리복스의 낭독은 일종의 아웃사이더 아트로 평가받기도 한다.[24] 와이어드지의 존 아다미안(John Adamian)은 리브리복스 낭독에 대해 다음과 같이 묘사했다.
:가끔 듣다 보면 이상하고 과장된 오디션을 엿듣는 기분이 들 때가 있는데, 야심 찬 배우가 억양을 시도하고 포기하거나, 목소리의 음높이를 너무 많이 조정하거나, 가상의 뉴잉글랜드 선장이나 거친 요크셔 산업가, 또는 런던의 망명 독일 유대인의 목소리에 몰입하기 위해 모음을 과도하게 늘리는 경우를 말한다.
일부 낭독은 딱딱하지만, 일단 공연에 적응하면 자체적으로 흥미로운 예술적 선택처럼 보이는 무감정함이 있다.[24]
9. 파생 코퍼스 (Derivative Corpus)
오디오북은 텍스트 읽기의 일종이므로 LibriVox는 방대한 음성/텍스트 쌍이라고 할 수 있다. 이러한 특성으로 인해 LibriVox는 음성 신호 처리를 위한 코퍼스로도 주목받아 왔으며, LibriVox의 일부를 개선한 다양한 파생 코퍼스가 제안되었다. 주요 파생 코퍼스는 다음과 같다.
명칭 | 콘텐츠 | 특징 | 논문 |
---|---|---|---|
LibriSpeech | 음성/스크립트, 982시간, 2484 화자 | 음성 인식(ASR)용, 음질 clean/other 분류 | Panayotov 2015[37] |
LibriTTS | 음성/스크립트, 586시간, 2456 화자[38] | LibriSpeech의 TTS용 엄선/고품질 버전 | Zen 2019[39] |
LibriTTS-R | 음성/스크립트, 586시간, 2456 화자 | LibriTTS의 음성 품질 개선 버전 | Koizumi 2023[40] |
Libri-light | [41] |
9. 1. LibriSpeech
LibriVox는 오디오북 녹음 프로젝트의 결과물로서 방대한 양의 음성과 해당 텍스트 쌍 데이터를 제공한다. 이러한 특징 덕분에 LibriVox는 음성 신호 처리 연구를 위한 코퍼스로 활용될 가능성을 주목받았다.[37] LibriSpeech는 이러한 LibriVox 데이터를 기반으로 만들어진 파생 코퍼스 중 하나이다.[37]LibriSpeech는 특히 음성 인식(ASR) 시스템 개발 및 평가를 위해 구축되었다.[37] 총 982시간 분량의 영어 음성 데이터와 해당 스크립트로 구성되어 있으며, 2,484명의 서로 다른 화자의 목소리를 담고 있다.[37] 데이터는 음질에 따라 상대적으로 잡음이 적은 'clean' 데이터와 그렇지 않은 'other' 데이터로 분류되어 제공된다.[37] 이는 다양한 음성 환경에서의 인식 성능을 평가하고 개선하는 데 도움을 준다. LibriSpeech 코퍼스에 대한 자세한 내용은 2015년 Panayotov 등이 발표한 논문에서 확인할 수 있다.[37]
9. 2. LibriTTS
LibriTTS는 LibriSpeech 코퍼스를 기반으로 만들어진 텍스트 음성 합성(TTS)용 코퍼스이다.[39] 이는 LibriVox 프로젝트에서 파생된 데이터셋 중 하나로, 기존 LibriSpeech 데이터셋 중에서 TTS 연구에 더 적합하도록 음성 품질이 좋은 데이터를 엄선하여 구성되었다. LibriTTS는 총 586시간 분량의 음성 데이터와 해당 스크립트로 이루어져 있으며, 2456명의 서로 다른 화자의 목소리를 포함하고 있다.[38]9. 3. LibriTTS-R
LibriTTS의 음성 품질을 개선한 버전이다. 이 코퍼스는 586시간 분량의 음성 및 해당 스크립트로 구성되어 있으며, 총 2456명의 화자 데이터를 포함한다. LibriTTS-R에 대한 자세한 내용은 Koizumi 등의 2023년 연구에서 찾아볼 수 있다.[40]9. 4. Libri-light
Libri-light는 LibriVox에서 파생된 코퍼스 중 하나이다.[41]참조
[1]
웹사이트
LibriVox Author
https://librivox.org[...]
2015-04-16
[2]
웹사이트
Objective LibriVox
http://librivox.org/[...]
2011-08-24
[3]
웹사이트
Another LibriVox Milestone: 10,000 projects!
https://librivox.org[...]
2016-09-03
[4]
웹사이트
Welcome to LibriVox
http://librivox.org/[...]
LibriVox.org
2005-08-09
[5]
웹사이트
Clarity (blog entry)
http://hughmcguire.n[...]
HughMcGuire.net
2007-02-12
[6]
웹사이트
The Secret Agent
https://librivox.org[...]
2014-03-31
[7]
웹사이트
What does LibriVox mean?
https://forum.libriv[...]
2013-09-29
[8]
웹사이트
'Pronunciation of "LibriVox"'
http://wiki.librivox[...]
2011-11-21
[9]
웹사이트
LibriVox Needs Your Help
http://librivox.org/[...]
24 February 2010
2011-08-24
[10]
웹사이트
Gutenberg Affiliates
https://web.archive.[...]
2015-04-19
[11]
웹사이트
Archive.org partners
https://archive.org/[...]
2015-04-19
[12]
웹사이트
Public Domain
https://librivox.org[...]
2018-11-11
[13]
웹사이트
LibriVox: 1500 public domain audio books
https://creativecomm[...]
2008-06-02
[14]
웹사이트
The Wealth of LibriVox
http://reason.com/ar[...]
2007-05
[15]
간행물
The Web Will Read You a Story
http://www.wired.com[...]
2005-12-16
[16]
웹사이트
Public Domain Books, Ready for Your iPod
https://www.nytimes.[...]
2015-04-19
[17]
웹사이트
Quality of Delivery?
https://forum.libriv[...]
2011-11-22
[18]
웹사이트
The Return of the Native Audiobook (Librivox)
http://www.reviewsan[...]
2011-11-22
[19]
웹사이트
On the absence of ratings at LibriVox
http://piratelibrary[...]
2011-11-22
[20]
웹사이트
Librivox – free audio books
http://www.reviewstr[...]
2011-11-22
[21]
웹사이트
Librivox (free audio books)
http://www.thesoapbo[...]
2011-11-22
[22]
웹사이트
Librivox
http://www.m-e-wood.[...]
2011-11-22
[23]
웹사이트
My Favorite LibriVox Readers
http://hcforgottencl[...]
2011-11-22
[24]
간행물
The Weird, Obsessive World of DIY Audiobooks
https://www.wired.co[...]
2015-10-05
[25]
웹사이트
The LibriVox Free Audiobook Collection
https://archive.org/[...]
2023-12-31
[26]
웹사이트
LibriVox Celebrates 15,000 Audiobooks!
https://librivox.org[...]
2021-02-14
[27]
웹사이트
LibriVox reaches 1,000!
http://librivox.org/[...]
2007-11-07
[28]
웹사이트
FREQUENTLY ASKED QUESTIONS
http://librivox.org/[...]
2007-11-07
[29]
웹사이트
FREQUENTLY ASKED QUESTIONS
http://librivox.org/[...]
2007-11-07
[30]
웹사이트
LibriVox
https://librivox.org[...]
2022-05-04
[31]
웹사이트
'About LibriVox ! LibriVox About LibriVox ! free public domain audiobooks'
https://librivox.org[...]
2022-05-04
[32]
웹사이트
'Another LibriVox Milestone: 10,000 projects! ! LibriVox Another LibriVox Milestone: 10,000 projects! ! free public domain audiobooks'
https://librivox.org[...]
2022-05-04
[33]
웹사이트
'LibriVox Celebrates 15,000 Audiobooks! ! LibriVox LibriVox Celebrates 15,000 Audiobooks! ! free public domain audiobooks'
https://librivox.org[...]
2022-05-04
[34]
웹사이트
'Welcome to LibriVox ! LibriVox Welcome to LibriVox ! free public domain audiobooks'
https://librivox.org[...]
2022-05-04
[35]
웹사이트
LibriVox&action
https://hughmcguire.[...]
2007-02-12
[36]
웹사이트
LibriVox
https://librivox.org[...]
2022-05-04
[37]
논문
Librispeech: An ASR corpus based on public domain audio books
https://ieeexplore.i[...]
2015
[38]
문서
train-clean-100/360: 247話者/904話者 train-other-500: 1160話者
[39]
논문
LibriTTS: A Corpus Derived from LibriSpeech for Text-to-Speech
http://arxiv.org/abs[...]
2019
[40]
논문
LibriTTS-R: A Restored Multi-Speaker Text-to-Speech Corpus
http://arxiv.org/abs[...]
2023
[41]
논문
Libri-Light: A Benchmark for ASR with Limited or No Supervision
http://arxiv.org/abs[...]
2019
[42]
웹사이트
Another LibriVox Milestone: 10,000 projects!
https://librivox.org[...]
2016-08-06
[43]
웹사이트
Offerings LibriVox
https://archive.org/[...]
2015-04-17
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com