어절

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

어절은 문법 단위의 하나로, 특히 일본어 문법에서 사용된다. 하시모토 문법에서 "문을 끊어 발음하면서, 실제 언어로는 그 이상 끊을 수 없는 개개의 부분"으로 정의되며, 자립어에 부속어와 접사가 결합하여 구성된다. 초기에는 문절이 연결된 구조로 보았으나, 연문절 개념을 도입하여 여러 문절이 모여 하나의 문절 역할을 하는 경우도 인정한다. 일본어 자연어 처리에서는 띄어쓰기를 하지 않는 특성상 형태소 분석 후 청킹 과정을 거쳐 문절을 추출하며, 생략이 많아 청킹 시 어려움이 존재한다.

어절
📚 더 읽어볼만한 페이지
  • 글로벌세계대백과를 인용한 문서/{{{분류3 - 공 (악기)
    공은 금속으로 제작된 타악기로, 다양한 문화권에서 의식, 신호, 음악 연주 등에 사용되며, 형태와 용도에 따라 여러 종류로 나뉜다.
  • 글로벌세계대백과를 인용한 문서/{{{분류3 - 국무회의
    국무회의는 대한민국 대통령을 의장으로, 예산, 법률안, 외교, 군사 등 국정 현안을 심의하는 중요한 기관이며, 대통령, 국무총리, 국무위원으로 구성되고, 정례회의는 매주 1회, 임시회의는 필요에 따라 소집된다.
  • 글로벌세계대백과를 인용한 문서 - 공 (악기)
    공은 금속으로 제작된 타악기로, 다양한 문화권에서 의식, 신호, 음악 연주 등에 사용되며, 형태와 용도에 따라 여러 종류로 나뉜다.
  • 글로벌세계대백과를 인용한 문서 - 국무회의
    국무회의는 대한민국 대통령을 의장으로, 예산, 법률안, 외교, 군사 등 국정 현안을 심의하는 중요한 기관이며, 대통령, 국무총리, 국무위원으로 구성되고, 정례회의는 매주 1회, 임시회의는 필요에 따라 소집된다.
  • 글로벌세계대백과를 인용한 문서/{{{분류2 - 공 (악기)
    공은 금속으로 제작된 타악기로, 다양한 문화권에서 의식, 신호, 음악 연주 등에 사용되며, 형태와 용도에 따라 여러 종류로 나뉜다.
  • 글로벌세계대백과를 인용한 문서/{{{분류2 - 국무회의
    국무회의는 대한민국 대통령을 의장으로, 예산, 법률안, 외교, 군사 등 국정 현안을 심의하는 중요한 기관이며, 대통령, 국무총리, 국무위원으로 구성되고, 정례회의는 매주 1회, 임시회의는 필요에 따라 소집된다.

2. 한국어의 문절

3. 일본어의 문절

문법의 이른바 4대 문법 모두에서 대체로 마찬가지로 구분되지만, "문절"이라는 이름으로 그 단위를 명확히 한 것은 하시모토 문법이다. 하시모토 문법에서는 문절을 "문을 끊어 발음하면서, 실제 언어로는 그 이상 끊을 수 없는 개개의 부분"으로 정의하고 있다. 학교 문법에서의 지도 등에서는 "さ(사)","よ(요)","な(나)","ら(라)","ぞ(조)","ね(네)" 등을 끼워 넣을 수 있는 곳에서 끊는다고 설명하고 있다.

문절은, 1개의 자립어(혹은 "사", 명사동사 등. 품사#일본어도 참조)에, 0개 이상의 부속어(혹은 "사", 조사와 조동사. 품사#일본어도 참조), 그리고 접사(존칭어의 "お-")에 의해 구성된다(혹은, 그것들로 분해할 수 있다).

초기의 하시모토 문법에서는, 문을, 문절이 마치 1개의 열처럼 연결된 것과 같은 구조로 취급했지만, 후에 "연문절"에 의해, 언어학에서 말하는 "구"와 같은, "복수 개의 문절이 모여 1개의 문절과 같은 역할을 하는 것"이 도입되었다. 학교 문법에서도 연문절을 도입하는 경우도 있다

3.1. 하시모토 문법

하시모토 문법에서는 문절을 "문을 끊어 발음하면서, 실제 언어로는 그 이상 끊을 수 없는 개개의 부분"으로 정의한다. 학교 문법에서는 "사(さ)", "요(よ)", "나(나)", "라(ら)", "조(조)", "네(ね)" 등을 끼워 넣을 수 있는 곳에서 끊는다고 설명한다.

문절은 1개의 자립어(혹은 "사", 명사나 동사 등. 품사#일본어도 참조)에, 0개 이상의 부속어(혹은 "사", 조사와 조동사 (국어 문법)|조동사. 품사#일본어도 참조), 그리고 접사(경어|존칭어의 "お-")에 의해 구성된다(혹은, 그것들로 분해할 수 있다).

초기의 하시모토 문법에서는 문을, 문절이 마치 1개의 열처럼 연결된 것과 같은 구조로 취급했지만, 후에 "연문절"에 의해, 언어학에서 말하는 "구 (문법)|구"와 같은, "복수 개의 문절이 모여 1개의 문절과 같은 역할을 하는 것"이 도입되었다. 학교 문법에서도 연문절을 도입하는 경우도 있다.

3.2. 연문절

초기 하시모토 문법에서는 문을 문절이 연결된 구조로 보았지만, 후에 연문절 개념을 도입하여 복수 개의 문절이 모여 하나의 문절과 같은 역할을 하는 것을 인정하였다. 이는 언어학에서 말하는 구와 유사한 개념이다. 학교 문법에서도 연문절을 도입하는 경우가 있다.

4. 자연어 처리와 문절

영어 등에서는 문절에 해당하는 단어로 먼저 구분하고, 이를 형태소 단위로 세분화하는 반면, 일본어의 자연어 처리에서는 일본어가 주로 띄어쓰기 등을 하지 않고 붙여 쓰기 때문에, 일본어에서는 먼저 형태소 분석을 수행하고, 다음으로 하향식 처리를 수행하여, 그 조정 결과로부터 문절이 되는 덩어리를 잘라내는 청킹이 필요하다.

자연어 분석의 하위 분류로서의 일본어 처리에서는 구문 분석은 문절 간의 수식 관계를 해결하는 것이고, 개별 문절의 성립을 분석하는 것이 형태소 분석이다. 하지만, 일본어는 생략이 많기 때문에, 청킹 시에 생략된 부분을 추정할 필요가 있으며, 이 추정의 정밀도가 낮으면 형태소 분석에 사용되는 기술 문법에도 모순이 생기므로, 청킹의 정밀도를 확보하는 것이 어렵다는 어려움도 있다. 예를 들어, "아름답습니다"의 "아름다운"은 연체형이고, "입니다"는 체언에 이어지는 용언이므로, "아름다운 무언가입니다"의 약어로 생각하지 않으면 연체형연용형의 구분에 모순이 발생한다.

4.1. 일본어 자연어 처리 과정

일본어는 띄어쓰기를 하지 않고 주로 붙여 쓰기 때문에, 영어 등과는 달리 자연어 처리를 할 때 먼저 형태소 분석을 수행한다. 그 후, 하향식 처리를 통해 문절이 되는 덩어리를 추출하는 청킹 과정을 거친다.

일본어 처리에서 구문 분석은 문절 간의 수식 관계를 해결하는 것이고, 형태소 분석은 개별 문절의 성립을 분석하는 것이다. 하지만 일본어는 생략이 많아 청킹 시 생략된 부분을 추정해야 하는데, 이 과정에서 정밀도가 낮으면 기술 문법에 모순이 생기는 등 어려움이 있다. 예를 들어 "아름답습니다"는 "아름다운 무언가입니다"의 약어로 보아야 연체형연용형 구분에 모순이 발생하지 않는다.

4.2. 일본어 자연어 처리의 어려움

일본어는 띄어쓰기를 하지 않고 붙여 쓰기 때문에 영어 등과는 달리 자연어 처리를 할 때 먼저 형태소 분석을 수행하고, 하향식 처리를 통해 문절이 되는 덩어리를 잘라내는 청킹이 필요하다.

일본어는 생략이 많아 청킹 시에 생략된 부분을 추정해야 하는데, 이 과정에서 오류가 발생하기 쉽다. 예를 들어 "아름답습니다"는 "'아름다운 무언가입니다"의 약어로 생각해야 연체형연용형의 구분에 모순이 생기지 않는다. 이러한 이유로 청킹의 정밀도를 확보하는 것은 형태소 분석의 정확도에도 영향을 미치므로 매우 중요하다.