음향음성학
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
음향음성학은 음성의 물리적 특성을 연구하는 학문 분야이다. 에디슨의 축음기 발명 이후, 음성 신호 분석이 가능해지면서 19세기 후반에 발전하기 시작했다. 벨 연구소의 분광기 개발, 로만 야콥슨 등의 연구를 통해 음향음성학은 음운론과 결합하며 발전했다. 주요 연구 분야로는 시간 및 주파수 영역 분석, 조음음성학, 청각음성학, 음운론과의 관계 등이 있으며, 음성 인식, 언어 병리학, 외국어 교육 등 다양한 분야에 응용된다.
더 읽어볼만한 페이지
음향음성학 | |
---|---|
개요 | |
학문 분야 | 음성학 |
하위 분야 | 음향학, 언어학 |
연구 대상 | 말소리의 물리적 특성 (음파) |
연구 방법 | 음향 분석, 분광분석, 전기신호 처리 |
관련 도구 | 스펙트로그램, 피치 트래커, LPC 분석기 |
역사 | |
초기 연구 | 음성 파형 분석 (19세기 말) |
발전 | 전기 통신 기술 발전과 함께 |
현대 연구 | 컴퓨터 기술 및 디지털 신호 처리 발전 |
음향 변수 | |
주파수 | 소리의 높낮이 (피치) |
강도 | 소리의 크기 (진폭) |
지속 시간 | 소리의 길이 |
스펙트럼 | 주파수 성분 분포 |
분석 방법 | |
스펙트로그램 분석 | 시간 경과에 따른 주파수 변화 시각화 |
멜-주파수 켑스트럴 계수 (MFCC) | 음성 인식에 사용되는 특징 추출 방법 |
선형 예측 코딩 (LPC) | 음성 합성 및 분석에 사용되는 방법 |
응용 분야 | |
음성 인식 | 인공지능, 자동 응답 시스템 |
음성 합성 | TTS (Text-to-Speech) 시스템 |
화자 인식 | 보안 시스템, 법의학 |
언어 교육 | 발음 교정, 외국어 학습 |
음성 질환 진단 | 음성 분석을 통한 질병 감별 |
추가 정보 | |
관련 학문 | 언어학, 물리학, 전기공학, 컴퓨터 과학 |
참고 자료 | 음성학 교재, 학술 논문 |
2. 역사
음향음성학 연구는 19세기 후반 에디슨의 축음기 발명으로 획기적인 전환점을 맞이했다. 축음기를 통해 음성 신호를 기록, 재생, 분석하는 것이 가능해졌으며, 이는 음성의 스펙트럼 특성 연구에 큰 영향을 미쳤다.
이론적인 수준에서 발화 음향은 전기 회로와 유사한 방식으로 모델링할 수 있다. 레일리 경은 새로운 전기 이론이 음향학에 사용될 수 있다는 것을 처음 인지한 인물이었지만, 1941년 지바 츠토무와 가지야마 마사토의 저서 『모음: 그 특성과 구조』에서 회로 모델이 효과적으로 사용되기 전까지 사용되지 않았다.
1995년 T. V. Ananthapadmanabha에 의해 제안된 적분 선형 예측 잔차(Integrated linear prediction residuals, ILPR)는 음원 신호에 매우 근사한 효과적인 특징이다.[6] 이는 성문이 닫히는 순간을 정확하게 추정하는 데 매우 유용하다.[7] A. G. Ramakrishnan 등은 ILPR의 이산 코사인 변환 계수에는 멜 주파수 켑스트럼 계수를 보완하는 화자 정보가 포함되어 있음을 보였다.[8] Plosion 지수는 T. V. Ananthapadmanabha 등에 의해 폐쇄-파열 변화를 특징짓기 위해 도입된 시간 영역 특징이다.[9]
2. 1. 19세기 후반 ~ 20세기 초
에디슨의 축음기 발명은 19세기 후반 음향음성학 연구에 큰 발전을 가져왔다. 축음기를 통해 음성 신호를 기록하고, 처리 및 분석하는 것이 가능해졌다. 같은 음성 신호를 여러 번 재생하고, 매번 다른 대역 통과 필터로 필터링하여 음성 발화의 스펙트로그램을 구축할 수 있었다. 19세기 말 20년 동안 Pflügers Archiv에 발표된 루디마르 헤르만(Ludimar Hermann)의 일련의 논문은 에디슨의 축음기를 사용하여 모음과 자음의 스펙트럼 특성을 조사했으며, 여기서 ''포먼트''라는 용어가 처음 도입되었다. 헤르만은 윌리스(Willis)와 휘트스톤의 모음 생성 이론을 구별하기 위해 에디슨의 축음기를 사용하여 다른 속도로 녹음한 모음을 재생했다.[6]알렉산더 그레이엄 벨을 중심으로 전화 산업이 발전하면서 음향음성학은 더욱 발전했다. 알렉산더 그레이엄 벨의 아버지인 알렉산더 멜빌 벨은 음성학자이다. 제2차 세계 대전 중 벨 연구소는 분광기를 개발했으며, 이를 통해 주기적 및 비주기적 언어음, 성도의 공명, 모음의 포먼트, 발성, 프로소디 등의 스펙트럼 특성에 대한 체계적인 연구가 크게 진전되었다.[7]
1952년, 로만 야콥슨, 군나르 판트(Gunnar Fant), 모리스 할레는 "Preliminaries to Speech Analysis"를 저술하여 음향음성학과 음운론을 결합시켰다. 1960년에 출판된 판트의 "Acoustic Theory of Speech Production"은 오랫동안 학계와 산업계 모두에서 발화 음향학의 주요 이론적 기초였다.[8] 이 분야를 형성한 중요한 인물로는 "Acoustic Phonetics"를 저술한 케네스 스티븐스와 후지무라 야스지, 피터 래디포지드가 있다.[9]
2. 2. 20세기 중반 ~ 현재
제2차 세계 대전 중 벨 연구소에서 분광기를 개발하면서 음향음성학 연구는 획기적인 발전을 이루었다. 분광기 개발 이전에는 주기적 및 비주기적 언어음, 성도의 공명, 모음의 포먼트, 발성, 프로소디 등 음성 요소의 스펙트럼 특성에 대한 체계적인 연구가 어려웠지만, 분광기 개발 이후 이러한 요소들에 대한 정밀한 분석이 가능해졌다.[6][7][8][9]1952년, 로만 야콥슨, 군나르 판트, 모리스 할레는 "Preliminaries to Speech Analysis"를 저술하여 음향음성학과 음운론을 통합하는 데 기여했다. 1960년에는 군나르 판트의 "Acoustic Theory of Speech Production"이 출판되었는데, 이 책은 오랫동안 학계와 산업계 모두에서 음향음성학의 주요 이론적 기초로 자리 잡았다.
이 분야의 발전에 크게 기여한 주요 인물로는 "Acoustic Phonetics"를 저술한 케네스 스티븐스, 후지무라 야스지, 피터 래디포지드 등이 있다.
3. 주요 연구 분야 및 개념
음향음성학은 파형의 평균 제곱 진폭, 지속 시간, 기본 주파수와 같은 시간 영역의 특징이나 주파수 스펙트럼 등의 주파수 영역의 특징, 그리고 시간과 주파수를 조합한 스펙트럼 변화와 조음음성학, 청각음성학 등 음성학의 다른 분야와의 관계를 조사하여 단음, 구, 발음 등의 언어학적 개념을 추상화한다.[1]
화자가 음성을 전달할 때, 조음 기관의 움직임보다는 어떤 음파를 전달하는지가 더 중요하다.[1]
3. 1. 시간 영역 분석
음향음성학은 파형의 평균 제곱 진폭, 지속 시간, 기본 주파수와 같은 시간 영역의 특징이나 주파수 스펙트럼 등의 주파수 영역의 특징, 시간과 주파수를 조합한 스펙트럼 경시(經時) 및 이러한 특성과 음성학의 다른 분야(조음음성학, 청각음성학)와의 관계를 조사하여, 단음, 구, 발음 등의 언어학적 개념을 추상화한다.3. 2. 주파수 영역 분석
주파수 스펙트럼 등 주파수 영역의 특징이나 시간과 주파수를 조합한 스펙트럼 경시(經時) 및 이러한 특성과 조음음성학, 청각음성학과의 관계를 조사하여, 단음, 구, 발음 등의 언어학적 개념을 추상화한다.[1]화자가 음성을 듣는 이에게 전달하는 과정에서, 조음 기관을 어떻게 움직이는가보다 어떤 음파를 전달하는지가 더 중요하다.[1]
3. 3. 조음음성학과의 관계
음향음성학은 파형의 평균 제곱 진폭, 그 지속 시간, 기본 주파수와 같은 시간 영역의 특징이나 주파수 스펙트럼 등의 주파수 영역의 특징, 시간과 주파수를 조합한 스펙트럼 경시(經時) 및 이러한 특성과 음성학의 다른 분야(조음음성학, 청각음성학)와의 관계까지 조사한다.[1]화자가 음성을 듣는 이에게 전달하는 전달 행위에서는, 화자가 조음 기관의 어느 부분을 어떻게 움직여서 음성을 전달하는가보다는 어떤 음파를 듣는 이에게 전달하고 있는지가 더 중요하다.[1]
3. 4. 청각음성학과의 관계
음향음성학은 청자가 음성을 인지하는 과정과 음향 신호 사이의 관계를 연구하며, 조음음성학, 청각음성학 등 음성학의 다른 분야와도 관련있다.3. 5. 음운론과의 관계
음향음성학은 파형의 평균 제곱 진폭, 그 지속 시간, 기본 주파수와 같은 시간 영역의 특징이나 주파수 스펙트럼 등의 주파수 영역의 특징, 시간과 주파수를 조합한 스펙트럼 경시(經時) 및 이러한 특성과 음성학의 다른 분야(조음음성학, 청각음성학)와의 관계까지 조사하여, 단음, 구, 발음 등의 언어학적 개념을 추상화한다.화자가 음성을 듣는 이에게 전달하는 전달 행위에서는, 화자가 조음 기관의 어느 부분을 어떻게 움직여서 음성을 전달하는가보다는 어떤 음파를 전달하고 있는가 하는 점이 더 중요하다.
4. 응용 분야
음향음성학은 다양한 분야에 응용된다.
참조
[1]
서적
Acoustic factors determining perceived voice quality
Singualr publishing group
1995
[2]
논문
Epoch extraction based on integrated linear prediction residual using plosion index
2013
[3]
논문
Voice source characterization using pitch synchronous discrete cosine transform for speaker identification
2015
[4]
논문
Detection of the closure-burst transitions of stops and affricates in continuous speech using the plosion index
2015
[5]
서적
最新の音声学・音韻論 - 現代英語を中心に -
研究社出版株式会社
1987-05-08
[6]
서적
Acosutic factors determining perceived voice quality
Singualr publishing group
1995
[7]
논문
Epoch extraction based on integrated linear prediction residual using plosion index
2013
[8]
논문
Voice source characterization using pitch synchronous discrete cosine transform for speaker identification
2015
[9]
논문
Detection of the closure-burst transitions of stops and affricates in continuous speech using the plosion index
2015
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com