맨위로가기

핵중심구구조문법

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

핵심 중심 구 구조 문법(HPSG)은 유형 계층과 속성-값 행렬(AVM)로 표현되는 내부 기능 구조를 결합하여 문자열을 생성하는 문법 이론이다. AVM은 언어학적 자질을 나타내며, 문법 규칙은 기호가 서로에게 부과하는 제약을 통해 표현된다. HPSG는 다양한 언어의 문법을 구현하기 위한 파서 개발을 지원하며, DELPH-IN 프로젝트를 통해 영어, 독일어, 일본어 등 여러 언어에 대한 대규모 문법이 오픈 소스로 제공된다.

더 읽어볼만한 페이지

  • 통사론 - 관계절
    관계절은 주절 내 명사를 수식하는 절로, 제한적/계속적 관계절, 종속/자유 관계절 등으로 나뉘며 언어별 구성 방식에 따라 여러 유형으로 분류된다.
  • 통사론 - 구 (언어학)
    구는 언어학에서 핵과 수식 요소로 구성되어 명사구, 동사구 등으로 나뉘며, 문장 구조 분석에 사용되는 문법 단위이다.
  • 문법 - 접속사
    접속사는 문장, 절, 구, 단어와 같은 언어 요소들을 연결하여 논리적 관계를 나타내는 품사로, 등위 접속사, 종속 접속사, 상관 접속사 등으로 나뉘며, 언어에 따라 다양한 형태로 나타난다.
  • 문법 - 품사
    품사는 형태, 기능, 의미에 따라 단어를 분류하는 언어학적 범주로, 언어별 특징과 문법화 과정에 따라 분류 체계와 구성원이 달라지며, 품사 간 경계가 모호한 경우도 있어 여러 언어에서 다양한 논의가 이루어지고 있다.
핵중심구구조문법
개요
종류구 구조 문법
개발자칼 폴락
영향을 준 이론변형 생성 문법
범주 문법
렉시컬 기능 문법
영향을 받은 이론구성 요소 문법
최소주의 프로그램
특징
핵심 개념자질 구조
유형 계층
어휘주의
구문 분석제약 기반 구문 분석
형식통합 기반 형식
이론적 배경
목표언어학적 보편성 설명
다양한 언어 현상 설명
접근 방식엄격한 형식주의
계산 언어학적 적용 용이
핵심 원리주도 규칙
응용
자연어 처리구문 분석기 개발
의미 분석기 개발
전산 언어학언어 모델링
기계 번역
장점
형식적 엄밀성명확하고 일관된 언어 기술
자동화된 추론 및 검증 가능
어휘 중심어휘 항목의 중요성 강조
다양한 언어 현상에 대한 유연한 설명
통합성구문, 의미, 화용 정보의 통합적 처리
단점
복잡성복잡한 자질 구조 및 유형 계층
학습 및 적용의 어려움
계산 비용제약 기반 구문 분석의 높은 계산 비용
대규모 언어 처리에 대한 제약
관련 연구
연구 분야구문론
의미론
전산 언어학
연구 동향확률적 HPSG
심층 학습 기반 HPSG
참고 문헌
주요 서적http://langsci-press.org/catalog/book/259

2. HPSG의 기본 원리

HPSG는 유형 계층 내 위치와 속성-값 행렬(AVM)로 표현되는 내부 기능 구조로 정의된 기호를 결합하여 문자열을 생성한다.[5][6] 기능은 유형 또는 유형 목록을 값으로 가지며, 이러한 값은 자체 기능 구조를 가질 수 있다. 문법 규칙은 기호가 서로에게 부과하는 제약을 통해 크게 표현된다. 기호의 기능 구조는 음운론적, 구문론적, 의미론적 속성을 설명한다. HPSG의 실제 문법은 기능 구조로만 구성되지만, 언어학자들은 AVM이 다루기 어려울 때 기호의 통합을 나타내기 위해 트리 구조를 사용하기도 한다.

center

2. 1. 속성-값 행렬 (AVM)

HPSG에서 언어 정보는 속성-값 행렬(AVM)을 통해 표현된다.[5][6] AVM은 기능과 값의 쌍으로 구성되며, 언어학적 자질을 나타낸다. 기능은 유형 또는 유형 목록을 값으로 가지며, 이러한 값은 자체 기능 구조를 가질 수 있다. 문법 규칙은 기호가 서로에게 부과하는 제약을 통해 크게 표현된다. 기호의 기능 구조는 음운론적, 구문론적, 의미론적 속성을 설명한다. 일반적인 표기법에서 AVM은 대문자로 표시된 기능과 이탤릭체 소문자로 표시된 유형으로 작성된다. AVM의 번호가 매겨진 색인은 토큰 동일 값을 나타낸다.

"walks" (이 경우 "주말을 위한 멋진 산책"과 같이 명사가 아닌 동사)에 대한 단순화된 AVM은 다음과 같다.



"Walks"는 유형이 ''word''이고, head가 ''verb''인 기호이다. 자동사로서 "walks"는 보어가 없지만 3인칭 단수 명사인 주어를 필요로 한다. 주어의 의미 값(CONTENT)은 동사의 유일한 인수(걷는 개체)와 동일하게 색인된다. "she"에 대한 다음 AVM은 이러한 요구 사항을 충족할 수 있는 SYNSEM 값을 가진 기호를 나타낸다.



''phrase'' 유형의 기호는 하나 이상의 자식과 통합하고 정보를 위로 전파한다. 다음 AVM은 두 개의 자식(head 자식(동사)과 동사의 SUBJ 제약을 충족하는 비 head 자식)이 필요한 ''head-subj-phrase''에 대한 즉시 지배 규칙을 인코딩한다.



최종 결과는 동사 head, 빈 하위 범주화 기능, 두 자식의 순서를 지정하는 음운론적 값을 가진 기호이다.

3. HPSG 문법의 예시

"walks"(이 경우 "주말을 위한 멋진 산책"과 같이 명사가 아닌 동사)에 대한 단순화된 AVM에서 동사의 범주 정보(CAT)는 이를 설명하는 기능(HEAD)과 인수를 설명하는 기능(VALENCE)으로 나뉜다.

"Walks"는 유형이 ''word''이고, head가 ''verb''인 기호이다. 자동사로서 "walks"는 보어가 없지만 3인칭 단수 명사인 주어를 필요로 한다. 주어의 의미 값(CONTENT)은 동사의 유일한 인수(걷는 개체)와 동일하게 색인된다. "she"에 대한 다음 AVM은 이러한 요구 사항을 충족할 수 있는 SYNSEM 값을 가진 기호를 나타낸다.

''phrase'' 유형의 기호는 하나 이상의 자식과 통합하고 정보를 위로 전파한다. 다음 AVM은 두 개의 자식(head 자식(동사)과 동사의 SUBJ 제약을 충족하는 비 head 자식)이 필요한 ''head-subj-phrase''에 대한 즉시 지배 규칙을 인코딩한다.

최종 결과는 동사 head, 빈 하위 범주화 기능, 두 자식의 순서를 지정하는 음운론적 값을 가진 기호이다.

HPSG의 실제 문법은 전적으로 기능 구조로 구성되어 있지만, 언어학자들은 동등한 AVM이 다루기 어려울 때 기호의 통합을 나타내기 위해 트리를 자주 사용한다.


4. HPSG 구현 및 파서

HPSG 형식에 기반한 다양한 파싱 파서가 작성되었으며 현재 최적화가 연구되고 있다.[7] 자유 베를린 대학교 문법 그룹의 CoreGram[8] 프로젝트는 TRALE 시스템으로 구현된 오픈 소스 문법을 제공한다. 현재 독일어,[9] 덴마크어,[10] 중국어,[11] 몰타어,[12]페르시아어[13] 문법이 공통된 핵심을 공유하며 공개적으로 이용 가능하다.

4. 1. DELPH-IN

HPSG 이니셔티브를 이용한 심층 언어 처리(DELPH-IN)는 다양한 언어의 대규모 HPSG 문법 개발을 지원한다.[14] 영어,[15] 독일어,[16] 일본어[17]에 대한 광범위한 문법이 오픈 소스 라이선스로 제공된다. 이러한 문법은 LKB, PET,[18] Ace,[19] 및 ''agree''[20]와 같은 다양한 오픈 소스 HPSG 파서와 함께 사용할 수 있다. 이들 모두는 “최소 재귀 의미론(Minimal Recursion Semantics, MRS)” 형식으로 의미 표현을 생성한다.[21] HPSG 형식의 선언적 특성은 이러한 계산 문법이 일반적으로 파싱과 생성(의미 입력으로부터 표면 문자열 생성) 모두에 사용될 수 있음을 의미한다. DELPH-IN에서 배포하는 트리뱅크는 문법 개발 및 테스트뿐만 아니라, 파싱(또는 생성 시 실현) 시 그럴듯한 해석을 결정하기 위한 순위 모델을 훈련하는 데 사용된다.

4. 2. Enju

''Enju''는 일본 도쿄 대학의 쓰지이 연구실에서 개발한 영어에 대한 자유롭게 사용 가능한 광범위한 확률적 HPSG 파서이다.[22]

참조

[1] 웹사이트 HPSG https://www.acsu.buf[...]
[2] 서적 Head-Driven Phrase Structure Grammar: The handbook http://langsci-press[...] Language Science Press 2021
[3] 논문 Information-based syntax and semantics. Volume 1. Fundamentals 1987
[4] 간행물 English Relative Clause Constructions https://www.academia[...] 1997
[5] 서적 Head-driven phrase structure grammar https://books.google[...] University of Chicago Press 1994
[6] 서적 Syntactic theory: a formal introduction University of Chicago Press 2003
[7] 웹사이트 The Babel-System: HPSG Interactive http://hpsg.hu-berli[...]
[8] 웹사이트 The CoreGram Project http://hpsg.hu-berli[...]
[9] 웹사이트 Berligram http://hpsg.hu-berli[...]
[10] 웹사이트 DanGram http://hpsg.hu-berli[...]
[11] 웹사이트 Chinese http://hpsg.hu-berli[...]
[12] 웹사이트 Maltese http://hpsg.hu-berli[...]
[13] 웹사이트 Persian http://hpsg.hu-berli[...]
[14] 웹사이트 DELPH-IN: Open-Source Deep Processing http://www.delph-in.[...]
[15] 웹사이트 English Resource Grammar and Lexicon https://archive.toda[...]
[16] 웹사이트 Berthold Crysmann https://web.archive.[...]
[17] 웹사이트 JacyTop - Deep Linguistic Processing with HPSG (DELPH-IN) http://www.delph-in.[...]
[18] 웹사이트 DELPH-IN PET parser http://heartofgold.d[...]
[19] 웹사이트 Ace: the Answer Constraint Engine http://sweaglesw.org[...]
[20] 웹사이트 agree grammar engineering http://www.agree-gra[...]
[21] 논문 Minimal recursion semantics: An introduction https://link.springe[...] 2005
[22] 웹사이트 Tsuji Lab: Enju parser home page http://www-tsujii.is[...] 2010-03-07
[23] URL http://www.cl.uni-br[...]
[24] URL http://www.let.rug.n[...]
[25] URL http://www.delph-in.[...]
[26] URL http://gg.dfki.de/
[27] URL http://www.delph-in.[...]
[28] URL http://www.delph-in.[...]
[29] 논문 Information-based syntax and semantics. Volume 1. Fundamentals 1987
[30] 서적 Head-driven phrase structure grammar University of Chicago Press 1994
[31] 간행물 English Relative Clause Constructions 1997



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com