형태소
1. 개요
형태소는 언어의 최소 의미 단위로, 의미나 기능, 자립성에 따라 다양한 방식으로 분류된다. 기능에 따라 어휘 형태소(실질 형태소)와 문법 형태소(형식 형태소)로 나뉘며, 자립성에 따라 자립 형태소와 의존 형태소로 구분된다. 형태소는 단어 형성에 참여하는 근원 형태소, 특정한 형태소와만 결합하는 불구 형태소, 형태는 다르지만 의미가 유사한 이형태, 그리고 음성적으로 나타나지 않는 영형태소로 세분화될 수 있다. 자연어 처리에서 형태소 분석은 문장을 형태소 열로 분할하는 과정이며, 한국어는 교착어 특성상 형태소 분석이 텍스트의 의미를 파악하는 데 매우 중요하다. 생성 문법에서는 형태소 정의가 통사 트리의 구조에 따라 달라진다.
-
형태론 -
첩어
-
형태론 -
어근
어근은 단어 의미의 핵심 형태소로서, 어미 없는 어간과 달리 최소 의미 단위이며, 인도유럽어족의 모음 교체, 셈어족의 자음 결합 등 언어별 특징을 보이고, 어원 연구의 중요 요소이자 범주 중립적 요소로 간주되며 언어 유형에 따라 해석이 달라진다. -
글로벌세계대백과를 인용한 문서/{{{분류3 -
공 (악기)
공은 금속으로 제작된 타악기로, 다양한 문화권에서 의식, 신호, 음악 연주 등에 사용되며, 형태와 용도에 따라 여러 종류로 나뉜다. -
글로벌세계대백과를 인용한 문서/{{{분류3 -
국무회의
국무회의는 대한민국 대통령을 의장으로, 예산, 법률안, 외교, 군사 등 국정 현안을 심의하는 중요한 기관이며, 대통령, 국무총리, 국무위원으로 구성되고, 정례회의는 매주 1회, 임시회의는 필요에 따라 소집된다. -
글로벌세계대백과를 인용한 문서 -
공 (악기)
공은 금속으로 제작된 타악기로, 다양한 문화권에서 의식, 신호, 음악 연주 등에 사용되며, 형태와 용도에 따라 여러 종류로 나뉜다. -
글로벌세계대백과를 인용한 문서 -
국무회의
국무회의는 대한민국 대통령을 의장으로, 예산, 법률안, 외교, 군사 등 국정 현안을 심의하는 중요한 기관이며, 대통령, 국무총리, 국무위원으로 구성되고, 정례회의는 매주 1회, 임시회의는 필요에 따라 소집된다.
2. 분류
형태소는 의미와 기능, 그리고 자립성에 따라 다양하게 분류할 수 있다.
* 의미·기능에 따른 분류
* 실질형태소: 어휘적 의미가 있는 형태소이다. 명사, 동사, 형용사, 부사 등이 있다.
* 형식형태소: 문법적 의미가 있는 형태소이다. 한국어에서는 대표적으로 조사, 어미가 이에 속한다.
* 자립성 유무에 따른 분류
* 자립형태소: 홀로 쓰일 수 있는 형태소이다. 명사, 대명사, 수사, 관형사, 부사, 감탄사 등이 있다.
* 의존형태소: 반드시 다른 형태소와 함께 쓰이는 형태소이다. 조사, 어미, 용언의 어간 등이 있다.
* 기타 분류
* 근원형태소: 단어 형성에 참여하는 형태소로, 실질형태소와 형식형태소, 자립형태소와 의존형태소를 모두 포함한다.
* 불구형태소(특이형태소): 특정 형태소와만 결합하는 형태소이다. "가랑비"의 "가랑", "오솔길"의 "오솔" 등이 있다.
"한나가 책을 보았다."를 예로 들면 다음과 같이 분석할 수 있다.
| 분류 기준 | 해당 형태소 |
|---|---|
| 자립 형태소 | 한나, 책 |
| 의존 형태소 | 가, 을, 보, 았, 다 |
| 실질 형태소 | 한나, 책, 보 |
| 형식 형태소 | 가, 을, 았, 다 |
2.1. 기능에 따른 분류
형태소는 의미나 기능에 따라 실질형태소(어휘형태소)와 형식형태소(문법형태소)로 나눌 수 있다.
실질형태소는 어휘적 의미를 가지며, 어떤 대상이나 상태, 동작을 가리킨다. 반면 형식형태소는 문법적 의미를 가지며, 실질형태소와 함께 쓰여 그들 사이의 관계를 나타낸다.
예를 들어 "위키백과에는 좋은 정보가 많다."라는 문장에서 "위키", "백과", "좋-", "정보", "많-"은 실질형태소이고, "-에", "-는", "-은", "-가", "-다"는 형식형태소이다.
영어에서는 내용 형태소(content morpheme)와 기능 형태소(function morpheme)로 구분하기도 한다. 내용 형태소는 구체적인 의미를 표현하고, 기능 형태소는 문법적인 역할을 한다. 예를 들어, "빠른(fast)"과 "슬픈(sad)"은 내용 형태소이고, 과거 시제를 나타내는 접미사 "-ed"는 기능 형태소이다.
일본어에서는 어휘적인 의미를 갖는 형태소를 어근(root/radical)이라고 하며, 기능적 또는 문법적인 의미를 갖는 형태소를 기능 형태소(機能形態素) 또는 문법 형태소(文法形態素)라고 한다.
2.1.1. 실질형태소 (어휘형태소)
실질형태소는 구체적인 대상, 상태, 동작 등을 나타내는 어휘적 의미를 가진 형태소이다. 내용 형태소라고도 불린다.
영어에서는 명사, 부사, 형용사, 주요 동사인 자유 형태소와, 결합된 어근 및 파생 접사인 결합 형태소가 내용 형태소에 포함된다.
한국어에서는 명사, 동사, 형용사, 부사 등이 이에 속한다. 예를 들어 "위키백과에는 좋은 정보가 많다."라는 문장에서 "위키", "백과", "좋-", "정보", "많-" 등이 실질형태소이다.
2.1.2. 형식형태소 (문법형태소)
형식형태소는 문법적 의미를 나타내는 형태소로, 실질형태소 사이의 관계를 나타내는 기능을 한다. 한국어에서는 조사, 어미 등이 이에 속한다. 예를 들어 "위키백과에는 좋은 정보가 많다."라는 문장에서 "-에", "-는", "-은", "-가", "-다" 등이 형식형태소이다.
영어에서는 기능 형태소(function morpheme)라고도 불리며, 전치사, 대명사, 한정사, 조동사, 접속사, 굴절 접사 등이 해당된다. 예를 들어 전치사 "over"와 한정사 "your"는 구체적인 의미를 갖는 것처럼 보이지만, 아이디어를 문법적으로 연결하는 역할을 하기 때문에 기능 형태소로 간주된다.
일본어에서는 기능 형태소(機能形態素) 또는 문법 형태소(文法形態素)라고도 불린다.
2.2. 자립성에 따른 분류
형태소는 다른 형태소와의 의존 관계 유무에 따라 자립 형태소와 의존 형태로 나뉜다.
* 자립 형태소: 다른 형태소 없이 홀로 어절을 이루어 사용될 수 있는 형태소이다.
* 의존 형태소: 문장에서 반드시 다른 형태소와 함께 쓰여서 어절을 이루는 형태소이다. 한국어에서는 조사와 어미는 물론이고, 용언의 어간, 즉 동사, 형용사의 어간이 이에 속한다. 예를 들어 "좋-"이나 "많-" 같은 용언의 어간은 "-은"이나 "-다" 같은 어미와 결합하지 않고서는 말을 이룰 수 없다.
"한나가 책을 보았다."를 예로 들어 분석하면 다음과 같다.
| | 예시 | |
|---|---|
| 자립 형태소 | 한나, 책 |
| 의존 형태소 | 가, 을, 보, 았, 다 |
하나의 형태소가 여러 현상 방식을 보일 수 있는데, 예를 들어 "아메후리", "아마야도리", "키리사메"에 포함된 "아메", "아마", "사메"는 같은 "비"라는 의미를 갖는 형태소에 속하며, 이들은 서로 이형태라고 한다.
2.2.1. 자립형태소
자립형태소는 다른 형태소 없이 홀로 사용될 수 있는 형태소이다. 한국어에서는 명사, 대명사, 수사, 관형사, 부사, 감탄사 등이 이에 속한다. 예를 들어 "위키", "백과", "정보"는 각각 자립 형태소이며, "위키백과에는 좋은 정보가 많다."라는 문장에서 홀로 사용될 수 있다.
영어에서는 자립 형태소를 자유 형태소(free morpheme)라고 한다. 자유 형태소는 town, dog처럼 단어로서 독립적으로 기능할 수 있으며, town hall, doghouse처럼 어휘소 내에 나타날 수도 있다. 「야마」처럼 단독으로 단어(일본어 문법에서는 문절)로 나타나는 것이 이에 해당한다. 「오금」의 「오-」처럼 단독으로 사용되지 않고 반드시 다른 형태소와 함께 나타나는 것은 구속 형태소이다. 예를 들어, 영어의 {boy}, {fly} 등의 형태소는 실질적인 의미를 가지며, 단독으로 사용되므로 자유 형태소이다.
어근은 자유 형태소일 수도, 구속 형태소일 수도 있다. 「타카-사」「타카-이」의 「타카-」는 단독으로 단어로 나타나는 일이 없으므로 구속 형태소이며, 한편 「야마」「아오」와 같은 어근은 단독으로 단어가 되는 자유 형태소이다.
2.2.2. 의존형태소
의존형태소는 단어의 일부로만 나타나며, 항상 어근과 함께, 때로는 다른 의존 형태소와 함께 사용된다. 예를 들어, 'un-'은 다른 형태소와 결합하여 단어를 형성할 때만 나타난다. 영어의 대부분의 의존 형태소는 접사이며, 특히 접두사와 접미사이다. 접미사의 예로는 '-tion', '-sion', '-tive', '-ation', '-ible', '-ing'가 있다.
한국어에서 '오금'의 '오-'와 같이 단독으로 사용되지 않고 반드시 다른 형태소와 함께 나타나는 형태소를 의존형태소라고 하며, 구속 형태소 또는 속박 형태소라고도 한다.
2.3. 기타 분류
형태소는 의미나 기능, 의존성 유무, 결합 관계 등에 따라 다양하게 분류할 수 있다.
* 의미·기능에 따른 분류
* [[실질형태소]]: 어휘적 의미를 가진 형태소로, 명사, 동사, 형용사, 부사 등이 있다. 예를 들어 "위키백과에는 좋은 정보가 많다"에서 "위키", "백과", "좋-", "정보", "많-" 등이 실질형태소이다.
* [[형식형태소]]: 문법적 의미를 가진 형태소로, 조사, 어미 등이 있다. 위의 예에서 "-에", "-는", "-은", "-가", "-다" 등이 형식형태소이다.
* 의존성 유무에 따른 분류
* [[자립형태소]]: 홀로 쓰일 수 있는 형태소로, 명사, 대명사, 수사, 관형사, 부사, 감탄사 등이 있다. 위의 예에서 "위키", "백과", "정보" 등이 자립형태소이다.
* [[의존형태소]]: 반드시 다른 형태소와 함께 쓰이는 형태소로, 조사, 어미, 용언의 어간 등이 있다. 위의 예에서 "좋-", "많-" 등은 의존형태소이다.
* 결합 참여 여부에 따른 분류
* [[근원형태소]]: 단어 형성에 참여하는 형태소로, 실질형태소와 형식형태소, 자립형태소와 의존형태소를 모두 포함한다. 예를 들어 "바람이 휘몰아친다"에서 "휘-", "몰-", "-아", "치-"는 모두 근원형태소이다.
* 결합 관계의 제한성에 따른 분류
* [[불구형태소]]: 특정 형태소와만 결합하는 형태소로, '특이형태소' 또는 '유일형태소'라고도 한다. 예를 들어 "가랑비"의 "가랑", "오솔길"의 "오솔" 등이 있다.
"한나가 책을 보았다"를 예로 들면 다음과 같이 분석할 수 있다.
| 분류 기준 | 해당 형태소 |
|---|---|
| 자립 형태소 | 한나, 책 |
| 의존 형태소 | 가, 을, 보, 았, 다 |
| 실질 형태소 | 한나, 책, 보 |
| 형식 형태소 | 가, 을, 았, 다 |
2.3.1. 접어
일본어 문법에서, 구조상 단어로서 행동하는 구속 형태소를 접어라고 한다.
2.3.2. 이형태
이형태는 형태는 다르지만 의미가 같은 형태소의 변이형이다. 예를 들어, 영어에서 복수를 나타내는 표지는 -s인데, 이 표지는 세 가지 이형태를 가진다. /z/ (bugs), /s/ (bats), /ɪz, əz/ (buses)가 그것이다. 이는 이음과 음소의 관계와 유사하다.
또 다른 예로, "비"라는 의미를 갖는 형태소는 「아메후리」, 「아마야도리」, 「키리사메」와 같이 "아메"(雨), "아마"(雨), "사메"(雨)와 같은 여러 형태로 나타난다. 이때 "아메", "아마", "사메"는 동일한 형태소에 속하는 이형태이다.
2.3.3. 영형태소
영형태소는 의미를 가지지만 청각 음소로 표현되지 않는 형태소의 한 유형이다. 영형태소를 가진 단어는 문법적인 목적으로 형태소를 가지는 것으로 분석되지만, 이 형태소는 발화에서 실현되지 않는다. 영형태소는 종종 주석 내에서 /∅/로 표시된다.
일반적으로 이러한 형태소는 눈에 띄는 변화가 없다. 예를 들어, sheep(양)은 명사의 단수형과 복수형 모두를 나타낸다. 일반적인 복수 접미사 -s를 사용하여 가상의 *sheeps(양들)를 만드는 대신, 복수는 sheep + -∅, 즉 무형의 복수 접미사로 구성된 것으로 분석된다. 따라서 의도된 의미는 공기-출현 결정자(이 경우 "some-" 또는 "a-")에서 파생된다.
어떤 경우에는 영형태소가 가청 형태소를 포함하는 단어의 다른 굴절 형태와 대조하기 위해 사용될 수도 있다. 예를 들어, 영어의 복수 명사 cats(고양이들)는 어근 cat(고양이)과 복수 접미사 -s로 구성되므로, 단수 cat(고양이)은 무형 단수 접미사 -∅로 굴절된 어근으로 분석될 수 있다.
3. 형태소 분석
형태소 분석은 자연어 처리에서 문장을 형태소 단위로 분할하는 과정이다. 특히, 한국어, 일본어, 중국어와 같이 띄어쓰기가 단어의 경계를 명확하게 나타내지 않는 언어에서 중요한 과정이다.
형태소 분석의 목적은 유사한 형태의 비교를 통해 언어의 최소 의미 단위(형태소)를 결정하는 것이다. 예를 들어 "She is walking"과 "They are walking"을 서로 비교하고 "You are reading"과 같은 덜 유사한 형태와는 비교하지 않는다. 이러한 형태는 효과적으로 부분으로 나눌 수 있으며, 서로 다른 형태소를 구별할 수 있다.
의미와 형태는 형태소 식별에 똑같이 중요하다. 행위 주체 형태소는 영어에서 동사를 명사로 변환하는 접사(예: "teach" → "teacher")와 같다. 영어에는 발음(및 표기)이 동일하지만 관련 없는 의미와 기능을 가진 또 다른 형태소(morpheme영어)가 있다. 이는 형용사를 비교급으로 변경하는 비교 형태소이다(하지만 동일한 형용사로 유지됨)(예: "small" → "smaller"). 반대의 경우도 발생할 수 있다. 즉, 의미는 동일하지만 형태가 다른 형태소 쌍이 있을 수 있다.
3.1. 형태소 분석의 중요성 (한국어)
한국어는 교착어이므로, 형태소 분석은 텍스트의 의미를 파악하는 데 필수적이다. 형태소 분석은 품사 태깅, 구문 분석, 의미 분석 등 다양한 자연어 처리 작업의 기반이 된다. 한국어는 특성상 동일한 형태소가 다양한 문맥에서 다른 의미를 가지거나, 동일한 의미를 가진 형태소가 다양한 형태로 나타날 수 있으므로, 형태소 분석은 더욱 복잡하고 중요한 과제이다.
4. 생성 문법에서의 형태소
생성 문법에서 형태소의 정의는 통사 트리(syntax tree)가 형태소를 잎(leaf) 노드로 갖는지, 아니면 특징(feature)을 잎으로 갖는지에 따라 달라진다.
* 어휘 기능 문법(LFG)에서는 잎 노드가 단어이다.
* 분산 형태론에서는 잎 노드가 형태소이다.
* 급진적 최소주의 및 나노통사론에서는 잎 노드가 "나노"(작은) 형태 통사적 특징이다.