파스 트리
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
파스 트리는 문장이나 구의 문법적 구조를 나타내는 트리 구조이다. 노드와 가지로 구성되며, 루트 노드에서 시작하여 잎 노드에서 끝나는 형태를 갖는다. 파스 트리는 구 구조 기반과 의존성 기반으로 나뉘며, 구 구조 기반 파스 트리는 단말 노드와 비단말 노드를 구분하는 반면, 의존성 기반 파스 트리는 모든 노드를 단말 노드로 간주한다. 구문 표시는 파스 트리를 트리 또는 괄호 표현식 형태로 나타낸 것으로, 문장의 심층 구조를 보여준다.
더 읽어볼만한 페이지
- 전산언어학 - 알고리즘
알고리즘은 문제 해결을 위한 명확하고 순서화된 유한 개의 규칙 집합으로, 알콰리즈미의 이름에서 유래되었으며, 수학 문제 해결 절차로 사용되다가 컴퓨터 과학에서 중요한 역할을 하며 다양한 방식으로 표현되고 효율성 분석을 통해 평가된다. - 전산언어학 - 단어 의미 중의성 해소
단어 의미 중의성 해소(WSD)는 문맥 내 단어의 의미를 파악하는 계산 언어학 과제로, 다양한 접근 방식과 외부 지식 소스를 활용하여 연구되고 있으며, 다국어 및 교차 언어 WSD 등으로 발전하며 국제 경연 대회를 통해 평가된다.
파스 트리 | |
---|---|
파싱 트리 (구문 분석 트리) | |
유형 | 트리 구조 |
분야 | 이론 컴퓨터 과학, 컴파일러, 언어학 |
개요 | |
목적 | 문자열의 구문 구조 시각화 및 표현 |
표현 대상 | 프로그래밍 언어의 구문 자연어의 구문 |
특징 | |
노드 | 문법의 비단말 또는 단말을 나타냄 |
루트 노드 | 문장 또는 프로그램의 시작 기호 |
내부 노드 | 구문 규칙 적용 결과 |
잎 노드 (단말 노드) | 입력 문자열의 실제 단어 또는 기호 |
활용 | |
컴파일러 | 구문 분석 단계에서 중간 표현으로 사용 |
언어학 | 문장의 구문 구조 분석 및 의미 해석 |
응용 분야 | 기계 번역 자동 요약 질의 응답 시스템 |
관련 개념 | |
추상 구문 트리 (AST) | 파싱 트리의 추상화된 형태, 불필요한 정보 제거 |
문맥 자유 문법 (CFG) | 파싱 트리 생성 규칙 정의 |
파서 | 입력 문자열을 파싱하여 파싱 트리 생성 |
추가 정보 | |
참고 자료 | Noam Chomsky, Aspects of the Theory of Syntax |
2. 용어
파스 트리는 노드(node)와 가지(branch)로 구성된다.[4]
- 루트 노드(root node): 트리 구조에서 최상위 노드이며, 보통 문장 전체를 나타낸다.
- 가지 노드(branch node): 루트 노드와 잎 노드 사이의 중간 노드이며, 구(phrase)나 절(clause) 등을 나타낸다.
- 잎 노드(leaf node): 트리 구조에서 최하위 노드이며, 개별 단어(형태소)를 나타낸다.
- 비단말 노드(non-terminal node): 가지 노드를 가리킨다.
- 단말 노드(terminal node): 잎 노드를 가리킨다.
- 부모 노드(parent node): 특정 노드의 상위 노드를 의미한다.
- 자식 노드(child node): 특정 노드의 하위 노드를 의미한다.

구 문법에서 구조 기반 트리는 단말 노드와 비단말 노드를 구분한다. 안쪽에 있는 노드는 비단말 노드로, 잎 노드는 단말 노드로 분류한다. "John hit the ball"이라는 문장을 예로 들면 다음과 같다.
- S: 문장(sentence) 전체를 나타내는 루트 노드이다.
- NP (명사구, noun phrase)와 VP (동사구, verb phrase): 가지 노드이다.
- John (명사, N), hit (동사, V), the (관사, D), ball (명사, N): 잎 노드이자 단말 노드이다.
S는 N과 VP 모두의 부모 노드이고, hit은 V의 자식 노드이다.
3. 구 구조 기반 파스 트리
구 구조 문법(구 구조 문법)에 기반한 파스 트리는 단말 노드와 비단말 노드를 구분한다. 내부 노드는 비단말 노드로, 잎 노드(리프 노드)는 단말 노드로 분류한다.[5] 예를 들어, "John hit the ball"이라는 영어 문장의 구 구조 기반 파스 트리는 다음과 같다.
파스 트리는 S(문장)로 시작하여 각각의 잎 노드(John, hit, the, ball)로 끝나는 전체 구조이다. 여기서 사용되는 약어는 다음과 같다.
- S: 문장 (sentence), 최상위 레벨 구조
- NP: 명사구 (noun phrase), 주어 또는 목적어 역할을 한다.
- VP: 동사구 (verb phrase), 술어 역할을 한다.
- V: 동사 (verb)
- D: 결정사 (determiner)
- N: 명사 (noun)
트리의 각 노드는 루트 노드, 가지 노드(브랜치 노드), 잎 노드(리프 노드) 중 하나이다.[5] S는 루트 노드, NP와 VP는 가지 노드, John(N), hit(V), the(D), ball(N)은 모두 잎 노드이다. 잎 노드는 문장의 어휘 토큰이다.
4. 의존성 기반 파스 트리
의존 문법의 의존성 기반 트리는 모든 노드를 단말 노드로 본다. 즉, 단말 노드와 비단말 노드의 구분을 인정하지 않는다. 구 구조 기반 파스 트리에 비해 노드 수가 적어 구조가 간단하다. 영어 문장 "John hit the ball"의 의존성 기반 파스 트리는 다음과 같다.[6]
이 파스 트리는 구 구조 기반 파스 트리에 존재하는 구 분류(S, VP, NP)가 없다. 구성 성분 구조는 인정된다. 트리에서 완전한 하위 트리(subtree)는 구성 성분이다. 따라서 이 의존성 기반 파스 트리는 구 구조 기반 파스 트리와 같이 주어 명사 'John'과 목적어 명사구 'the ball'을 구성 성분으로 인정한다.
구와 의존성을 구별하는 것은 광범위하다. 구 기반 파스 트리와 관련된 추가적인 구문 구조가 필요하거나 유익한지의 여부는 논쟁의 여지가 있다.
5. 구문 표지
구문 표지(P-marker)는 노엄 촘스키 등이 개발한 초기 변형 생성 문법에서 도입된 개념이다. 문장의 심층 구조를 나타내는 구문 표지는 구조 규칙을 적용하여 생성된다.
구문 표시는 트리 형태로 나타낼 수 있지만, 메모리 공간을 덜 차지하는 "괄호 표현식" 형태로 나타내기도 한다. 예를 들어, 구성 요소 기반 트리에 해당하는 괄호 표현식은 다음과 같을 수 있다.
:
트리와 마찬가지로, 표현식의 구성과 세부 정보는 적용되는 이론과 설명하고자 하는 내용에 따라 달라질 수 있다.
6. 예시
6. 1. 영어 파스 트리 예시
파스 트리는 S에서 시작하여 각 리프 노드(''John'', ''hit'', ''the'', ''ball'')에서 끝나는 전체 구조이다. 트리에서 사용되는 약어는 다음과 같다.
- S는 이 예에서 최상위 구조인 문장을 나타낸다.
- NP는 명사구를 나타낸다. 첫 번째(가장 왼쪽) NP인 단일 명사 "John"은 문장의 주어 역할을 한다. 두 번째 NP는 문장의 목적어이다.
- VP는 동사구를 나타내며, 술어 역할을 한다.
- V는 동사를 나타낸다. 이 경우, 타동사 ''hit''이다.
- D는 결정사를 나타내며, 이 경우 정관사 "the"이다.
- N은 명사를 나타낸다.
트리의 각 노드는 ''루트'' 노드, ''분기'' 노드 또는 ''리프'' 노드 중 하나이다.[5] 루트 노드는 상위에 분기가 없는 노드이다. 문장 내에는 항상 하나의 루트 노드만 있다. 분기 노드는 둘 이상의 자식 노드에 연결되는 부모 노드이다. 리프 노드는 트리에서 다른 노드를 지배하지 않는 터미널 노드이다. S는 루트 노드, NP와 VP는 분기 노드, ''John''(N), ''hit''(V), ''the''(D), ''ball''(N)은 모두 리프 노드이다. 리프 노드는 문장의 어휘 토큰이다. 부모 노드는 그 아래에 분기로 연결된 다른 노드가 하나 이상 있는 노드이다. 예시에서 S는 N과 VP의 부모이다. 자식 노드는 트리 분기로 연결된 노드가 하나 이상 직접 위에 있는 노드이다. 예시에서 ''hit''는 V의 자식 노드이다. "어머니"와 "딸"이라는 용어도 이 관계에 사용되기도 한다.
6. 2. 일본어 파스 트리 예시
참조
[1]
서적
Chiswell and Hodges
2007
[2]
서적
Aspects of the Theory of Syntax
https://books.google[...]
MIT Press
2014-12-26
[3]
논문
The structure of shared forests in ambiguous parsing
https://hal.inria.fr[...]
[4]
웹사이트
The parsetree Package for Drawing Trees in LaTeX
https://www1.essex.a[...]
University of Essex
[5]
서적
Carnie
2013
[6]
간행물
Ágel et al
2003/2006
[7]
서적
Chiswell and Hodges
2007
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com