맨위로가기

전사 (언어학)

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

전사(Transcription)는 구어(spoken language)를 문자 형태로 기록하는 것을 의미하며, 크게 음성 전사와 정서법 전사로 나뉜다. 음성 전사는 음성적 특징에 초점을 맞춰 국제 음성 기호(IPA)와 같은 기호를 사용하고, 정서법 전사는 언어의 맞춤법에 따라 구어를 표기한다. 전사 시스템은 음성 전사 시스템과 정서법 전사 시스템으로 구분되며, 대화 분석(CA), 담화 전사(DT), 대화 분석 전사 시스템(GAT), 반해석적 작업 전사(HIAT) 등이 있다. 전사 과정은 수동으로 이루어지다가 현재는 전사 소프트웨어를 사용하여 자동화되고 있으며, 수동 전사 소프트웨어와 자동 전사 소프트웨어가 존재한다.

더 읽어볼만한 페이지

  • 전자법 - 속기
    속기는 말이나 연설을 신속하고 정확하게 기록하는 기술이며, 고대부터 존재해 온 속기법은 17세기 이후 근대적인 이론과 체계를 갖추고, 다양한 속기법과 속기 도구 발전을 통해 실시간 자막 방송 등 다양한 분야에 활용되고 있다.
  • 전자법 - 국제화와 지역화
    국제화는 소프트웨어를 다양한 언어와 지역을 지원하도록 설계하는 과정이며, 지역화는 특정 언어와 지역에 맞춰 조정하는 과정으로, 문자 인코딩, 날짜/시간 형식, 통화, 법적 규제, 문화적 차이 등을 고려하여 제품을 적응시키는 것을 의미한다.
  • 음성학 - 음성 인식
    음성 인식은 음성 신호를 텍스트로 변환하는 기술로, 인공지능과 심층 학습의 발전으로 인식 정확도가 향상되어 다양한 분야에 활용되고 있지만 보안 문제가 남아있다.
  • 음성학 - 음성 합성
    음성 합성은 텍스트를 음성으로 변환하는 기술(TTS)로, 기계 장치에서 컴퓨터 기반 시스템으로 발전해왔으며 통계적 모델과 심층 학습 기반 기술 발전을 거쳐 다양한 분야에서 활용되지만 윤리적 문제와 기술적 과제도 안고 있다.
전사 (언어학)

2. 전사의 종류

언어적 전사에는 크게 음성 전사와 정서법 전사 두 가지 유형이 있다. 음성 전사는 발음되는 소리의 특징에, 정서법 전사는 언어의 정서법(맞춤법)에 초점을 맞춘다.

전사의 유형은 사용 목적에 따라 선택된다. 음성 전사는 언어의 소리, 즉 음성을 분석하는 데 주로 사용된다. 반면 정서법 전사는 단어의 의미를 파악하는 데 더 편리하다. 음성 전사는 더 체계적이지만 배우고 사용하는 데 시간이 더 걸린다는 단점이 있다.

전사에는 음성적 전사와 음운적 전사도 있다. 예를 들어 한국어 단어 "바보"에서 첫 번째 "ㅂ"은 p ㅍ|/ㅍ/한국어이음이다. 따라서 음성에 기초한 전사에서는 pabo|파보영어가 되고, 음운에 기초한 전사에서는 papo|파포한국어가 된다. 언어학에서 음성 전사는 대괄호([ ])로, 음운 전사는 사선(/ /)으로 묶는다.[2]

2. 1. 음성 전사

음성 전사는 구어의 음성적 및 음운론적 속성에 초점을 맞춘다. 음성 전사 시스템은 개별 소리 또는 음소를 문자로 매핑하기 위한 규칙을 제공한다. 주로 음성학적 또는 음운론적 분석에 사용된다. 음성 전사는 국제 음성 기호(IPA)와 같은 특별히 정의된 문자 집합으로 작동한다.

음성적 전사는 국제 음성 기호(IPA)와 같은 음성 기호에 의한 정밀한 것부터, 가타카나 등에 의한 비정밀한 것까지 존재한다. 예를 들어, 영어의 "right"와 "light"를 가타카나로 전사하는 경우, 둘 다 "라이토"가 되지만, 이는 "r"과 "l"의 차이를 나타낼 수 없는 비정밀한 음성 전사이다.[2]

2. 2. 정서법 전사

정서법 전사는 주어진 언어의 정서법(맞춤법)에 따라 구어를 문자로 표기하는 방식이다. 정서법 전사는 음성적 요소뿐만 아니라 형태적, 어휘적 요소도 함께 고려한다(어떤 요소가 어느 정도 반영되는지는 언어와 정서법에 따라 다름). 따라서 의미론적 측면이 중요한 경우에 정서법 전사가 더 유용하다. 음성 전사는 과학적 의미에서 더 체계적이지만, 정서법 전사에 비해 배우기 어렵고, 작성하는 데 시간이 더 오래 걸리며, 널리 적용되지 않는다는 단점이 있다.

3. 전사 이론

말해진 언어를 문자로 옮기는 과정은 처음 보기에 생각만큼 간단하지 않다. 문어는 명확하게 구별되고 뚜렷한 개별 기호로 구성된 이상적인 형태이다. 반면에 구어는 잠재적으로 무제한의 구성 요소로 이루어진 연속적인(이산적이지 않은) 현상이다. 이러한 구성 요소를 구별하고 분류하기 위한 미리 결정된 시스템은 없으며, 결과적으로 이러한 구성 요소를 문자로 매핑하는 미리 설정된 방법도 없다.

문헌들은 전사(轉寫) 관행의 비(非)중립성을 지적하는 데 비교적 일관적이다. 중립적인 전사 시스템은 존재하지 않으며 존재할 수도 없다. 사회 문화에 대한 지식이 전사를 만드는 데 직접적으로 관여한다.

전사에는 음성적 전사와 음운적 전사, 두 종류가 있다. 예를 들어, 한국어의 "바보"에 있어서 첫 번째 "ㅂ"은 p로 발음되고, 두 번째 "ㅂ"은 b로 발음되지만, 음운론적으로는 둘 다 단일 음소 p의 이음이다. 따라서, 음성에 기초한 전사에서는 pabo|파보한국어가 되고, 음운에 기초한 전사에서는 papo|파포한국어가 된다. (언어학에서는 음성 전사는 [ ]로, 음운 전사는 / /로 각각 묶는다.)

음운적인 전사는 하나의 음소에 하나의 문자를 대응시키기 때문에 정밀해질 수밖에 없지만, 음성적인 전사는 국제 음성 기호(IPA)와 같은 음성 기호에 의한 정밀한 것부터, 가타카나 등에 의한 비정밀한 것까지 존재한다. 예를 들어, 영어의 "right"와 "light"를 가타카나로 전사하는 경우, 둘 다 "라이토"가 되지만, 이는 "r"과 "l"의 차이를 나타낼 수 없는 비정밀한 음성 전사이다.

4. 전사 시스템

전사 시스템은 구어를 문자 기호로 표현하는 방법을 정의하는 규칙의 집합이다. 전사에는 음성적 전사와 음운적 전사, 두 종류가 있다. 예를 들어, 한국어의 "바보"에서 첫 번째 "ㅂ"은 로 발음되고, 두 번째 "ㅂ"은 로 발음되지만, 음운론적으로는 둘 다 단일 음소이음이다. 따라서, 음성에 기초한 전사에서는 가 되고, 음운에 기초한 전사에서는 가 된다 (언어학에서 음성 전사는 로, 음운 전사는 로 각각 묶는다).

음운적인 전사는 하나의 음소에 하나의 문자를 대응시키기 때문에 정밀해질 수밖에 없지만, 음성적인 전사는 국제 음성 기호(IPA)와 같은 음성 기호에 의한 정밀한 것부터, 가타카나 등에 의한 비정밀한 것까지 존재한다. 예를 들어, 영어의 "right"와 "light"를 가타카나로 전사하는 경우, 둘 다 "라이토"가 되지만, 이는 "r"과 "l"의 차이를 나타낼 수 없는 비정밀한 음성 전사이다.

4. 1. 음성 전사 시스템

국제 음성 기호(IPA)를 기반으로 하는 음성 기록 시스템은 구어체를 문자 기호로 표현하는 방법을 정의하는 규칙 집합이다. 대부분의 음성 기록 시스템은 국제 음성 기호를 기반으로 하며, 특히 음성 기술 분야에서는 그 파생물인 SAMPA를 기반으로 한다.

4. 2. 정서법 전사 시스템

정서법 전사 시스템에는 대화 분석(CA), 담화 전사(DT), 대화 분석 전사 시스템(GAT), 반해석적 작업 전사(HIAT) 등 다양한 종류가 있다.[1][2][4][5]

4. 2. 1. 대화 분석 (CA)

대화 분석(CA)은 색스 등이 처음 고안했으며,[1] 이후 맥휘니에 의해 컴퓨터로 읽을 수 있는 말뭉치에서 사용하기 위해 'CA-CHAT'로 개조된 최초의 시스템이라고 할 수 있다.[2] 대화 분석 분야는 여러 가지 전사 방식과 전사 규칙을 포함하며, 여기에는 제퍼슨 표기법 등이 포함된다. 대화를 분석하기 위해 녹음된 데이터는 일반적으로 분석가가 사용할 수 있는 형태로 텍스트로 전사된다. 좁은 전사와 넓은 전사 두 가지 일반적인 방식이 있다. 좁은 전사는 어떤 특정 단어가 강조되었는지, 어떤 단어가 더 큰 소리로 말해졌는지, 대화가 겹치는 지점, 특정 단어가 어떻게 발음되었는지 등과 같은 대화 상호 작용의 세부 사항을 포착한다. 만약 이러한 세부 사항이 덜 중요하다면, 분석가가 대화의 전반적인 구조나 참여자 간의 발화 턴의 상대적인 분포에 더 관심이 있기 때문일 경우, 넓은 전사로 충분할 수 있다.[3]

4. 2. 2. 담화 전사 (DT)

(DuBois 외 1992)에 설명된 시스템은, 산타바바라 구어 미국 영어 코퍼스(SBCSAE)의 전사에 사용되었으며[3], 이후 ''DT2''로 발전했다.

4. 2. 3. 대화 분석 전사 시스템 (GAT)

운율 지향적인 대화 분석 및 상호작용 언어학 연구를 위해 독일어권 국가에서 널리 사용되는 GAT(Gesprächsanalytisches Transkriptionssystem, 대화 분석 전사 시스템)는 젤팅(Selting) 등이 1998년에 설명한 시스템으로, 이후 GAT2(Selting 등, 2009)로 발전되었다.[4][5]

4. 2. 4. 반해석적 작업 전사 (HIAT)

화용론에서 널리 사용되는 이 시스템은 엘리히(Ehlich)와 레바인(Rehbein)이 1976년에 처음 기술하였으며, 이후 컴퓨터로 읽을 수 있는 코퍼스(corpus)에서 사용하기 위해 레바인(Rehbein) 등이 2004년에 개정하였다.

5. 전사 소프트웨어

전사는 원래 연필과 종이를 사용하여 수동으로 수행되는 과정, 즉, 예를 들어 컴팩트 카세트에 저장된 아날로그 음성 녹음을 사용하는 과정이었다. 요즘에는 대부분의 전사가 컴퓨터에서 수행된다. 녹음은 일반적으로 디지털 오디오 파일 또는 비디오 파일이며, 전사본은 전자 문서이다. 디지털 녹음에서 디지털 전사를 효율적으로 생성하는 데 도움이 되는 특수 컴퓨터 소프트웨어가 존재한다.[9]

전사 소프트웨어는 수동 전사를 용이하게 하는 소프트웨어와 자동 전사 소프트웨어 두 가지 유형이 있다. 수동 전사 소프트웨어의 경우, 작업은 여전히 녹음을 듣고 컴퓨터에 들리는 내용을 입력하는 인간 전사자가 수행하며, 이러한 유형의 소프트웨어는 종종 재생 또는 속도 변경과 같은 기능을 갖춘 멀티미디어 플레이어이다. 자동 전사 소프트웨어의 경우, 자동 전사는 오디오 또는 비디오 파일을 전자 텍스트로 변환하는 음성 인식 엔진에 의해 수행된다. 일부 소프트웨어에는 주석 기능도 포함될 수 있다.[9]

참조

[1] 웹사이트 Gail Jefferson Obituary • 1938-2008 • Quotes from authorities, colleagues, friends http://www.gail-jeff[...]
[2] 간행물 Independent writing in current approaches to writing instruction: What have we overlooked? http://edlinked.soe.[...] English Teaching: Practice and Critique 2007
[3] 웹사이트 https://www.linguist[...]
[4] 서적 Gesprächsanalytisches Transkriptionssystem (GAT) Linguistische Berichte 1998
[5] 간행물 Gesprächsanalytisches Transkriptionssystem 2 (GAT 2) http://www.gespraech[...] Gesprächsforschung 2009
[6] 서적 HIAT - a Transcription System for Discourse Data Talking Data – Transcription and Coding in Discourse Research. Hillsdale: Erlbaum 1992
[7] 간행물 Halbinterpretative Arbeitstranskriptionen (HIAT) https://exmaralda.or[...] Linguistische Berichte 1976
[8] 서적 Handbuch für das computergestützte Transkribieren nach HIAT Arbeiten zur Mehrsprachigkeit, Folge B 2004
[9] 논문 Transcribear – Introducing a secure online transcription and annotation tool https://academic.oup[...] 2019
[10] 문서 情報の音声化を意味する「音訳」とは異なる。
[11] 문서 ほかに「転写」の意味で、「転記」の語を用いる例があるが、本来そのような意味はない。



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com