맨위로가기

어절

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

어절은 문법 단위의 하나로, 특히 일본어 문법에서 사용된다. 하시모토 문법에서 "문을 끊어 발음하면서, 실제 언어로는 그 이상 끊을 수 없는 개개의 부분"으로 정의되며, 자립어에 부속어와 접사가 결합하여 구성된다. 초기에는 문절이 연결된 구조로 보았으나, 연문절 개념을 도입하여 여러 문절이 모여 하나의 문절 역할을 하는 경우도 인정한다. 일본어 자연어 처리에서는 띄어쓰기를 하지 않는 특성상 형태소 분석 후 청킹 과정을 거쳐 문절을 추출하며, 생략이 많아 청킹 시 어려움이 존재한다.

더 읽어볼만한 페이지

  • 한국어 - 문장 부호
    문장 부호는 문장의 구조와 의미를 명확하게 하기 위해 사용하는 기호로, 마침표, 물음표, 느낌표, 쉼표 등 다양한 기호와 각 기호의 명칭(북한 명칭 포함) 및 사용법을 포함한다.
  • 한국어 - 한자 부활
    한자 부활은 과거 한자 문화권 국가에서 한자 사용을 확대하려는 움직임이나 주장을 의미하며, 대한민국에서는 한글 전용법 이후 제한된 한자 사용에 대한 논쟁이, 조선민주주의인민공화국에서는 한자 교육 부활에도 불구하고 일반적인 한자 미사용이, 베트남에서는 로마자 보급 후 감소한 한자 사용에 대한 부활 주장이 나타나고 있다.
  • 한국어에 관한 - 문장 부호
    문장 부호는 문장의 구조와 의미를 명확하게 하기 위해 사용하는 기호로, 마침표, 물음표, 느낌표, 쉼표 등 다양한 기호와 각 기호의 명칭(북한 명칭 포함) 및 사용법을 포함한다.
  • 한국어에 관한 - 이두
    이두는 한자의 음과 훈을 빌려 한국어를 표기하는 방식으로, 신라 시대에 시작되어 한국어의 형태소와 문법 요소를 나타내는 데 활용되었으며 훈민정음 창제 이후 사용이 줄었지만 한국어 표기법 발전에 영향을 미쳤다.
  • 음운론 - 성조
    성조는 음절의 높낮이 변화로 단어의 의미를 구별하는 언어 현상으로, 중국어, 베트남어, 태국어 등에서 나타나며, 단계성조, 곡선성조, 단어성조 등으로 분류되고 성조 변화, 성조 테라싱, 부유 톤 등의 현상을 보이며 다양한 표기법이 사용된다.
  • 음운론 - 보상적 장음화
    보상적 장음화는 자음 탈락으로 인해 앞선 모음이 장음으로 변하는 음운 현상이다.
어절

2. 한국어의 문절

3. 일본어의 문절

문법의 이른바 4대 문법 모두에서 대체로 마찬가지로 구분되지만, "문절"이라는 이름으로 그 단위를 명확히 한 것은 하시모토 문법이다. 하시모토 문법에서는 문절을 "문을 끊어 발음하면서, 실제 언어로는 그 이상 끊을 수 없는 개개의 부분"으로 정의하고 있다. 학교 문법에서의 지도 등에서는 "さ(사)","よ(요)","な(나)","ら(라)","ぞ(조)","ね(네)" 등을 끼워 넣을 수 있는 곳에서 끊는다고 설명하고 있다.

문절은, 1개의 '''자립어'''(혹은 "사", 명사동사 등. 품사#일본어도 참조)에, 0개 이상의 '''부속어'''(혹은 "사", 조사와 조동사. 품사#일본어도 참조), 그리고 접사(존칭어의 "お-")에 의해 구성된다(혹은, 그것들로 분해할 수 있다).

초기의 하시모토 문법에서는, 문을, 문절이 마치 1개의 열처럼 연결된 것과 같은 구조로 취급했지만, 후에 "'''연문절'''"에 의해, 언어학에서 말하는 "구"와 같은, "복수 개의 문절이 모여 1개의 문절과 같은 역할을 하는 것"이 도입되었다. 학교 문법에서도 연문절을 도입하는 경우도 있다[1]

3. 1. 하시모토 문법

하시모토 문법에서는 문절을 "문을 끊어 발음하면서, 실제 언어로는 그 이상 끊을 수 없는 개개의 부분"으로 정의한다. 학교 문법에서는 "사(さ)", "요(よ)", "나(나)", "라(ら)", "조(조)", "네(ね)" 등을 끼워 넣을 수 있는 곳에서 끊는다고 설명한다.

문절은 1개의 자립어(혹은 "사", 명사나 동사 등. 품사#일본어도 참조)에, 0개 이상의 부속어(혹은 "사", 조사와 조동사 (국어 문법)|조동사. 품사#일본어도 참조), 그리고 접사(경어|존칭어의 "お-")에 의해 구성된다(혹은, 그것들로 분해할 수 있다).

초기의 하시모토 문법에서는 문을, 문절이 마치 1개의 열처럼 연결된 것과 같은 구조로 취급했지만, 후에 "연문절"에 의해, 언어학에서 말하는 "구 (문법)|구"와 같은, "복수 개의 문절이 모여 1개의 문절과 같은 역할을 하는 것"이 도입되었다. 학교 문법에서도 연문절을 도입하는 경우도 있다.

3. 2. 연문절

초기 하시모토 문법에서는 문을 문절이 연결된 구조로 보았지만, 후에 '''연문절''' 개념을 도입하여 복수 개의 문절이 모여 하나의 문절과 같은 역할을 하는 것을 인정하였다. 이는 언어학에서 말하는 구와 유사한 개념이다. 학교 문법에서도 연문절을 도입하는 경우가 있다.

4. 자연어 처리와 문절

영어 등에서는 문절에 해당하는 단어로 먼저 구분하고, 이를 형태소 단위로 세분화하는 반면, 일본어의 자연어 처리에서는 일본어가 주로 띄어쓰기 등을 하지 않고 붙여 쓰기 때문에, 일본어에서는 먼저 형태소 분석을 수행하고, 다음으로 하향식 처리를 수행하여, 그 조정 결과로부터 문절이 되는 덩어리를 잘라내는 청킹이 필요하다.

자연어 분석의 하위 분류로서의 일본어 처리에서는 구문 분석은 문절 간의 수식 관계를 해결하는 것이고, 개별 문절의 성립을 분석하는 것이 형태소 분석이다. 하지만, 일본어는 생략이 많기 때문에, 청킹 시에 생략된 부분을 추정할 필요가 있으며, 이 추정의 정밀도가 낮으면 형태소 분석에 사용되는 기술 문법에도 모순이 생기므로, 청킹의 정밀도를 확보하는 것이 어렵다는 어려움도 있다. 예를 들어, "아름답습니다"의 "아름다운"은 연체형이고, "입니다"는 체언에 이어지는 용언이므로, "아름다운 '''무언가'''입니다"의 약어로 생각하지 않으면 연체형연용형의 구분에 모순이 발생한다.

4. 1. 일본어 자연어 처리 과정

일본어는 띄어쓰기를 하지 않고 주로 붙여 쓰기 때문에, 영어 등과는 달리 자연어 처리를 할 때 먼저 형태소 분석을 수행한다. 그 후, 하향식 처리를 통해 문절이 되는 덩어리를 추출하는 청킹 과정을 거친다.

일본어 처리에서 구문 분석은 문절 간의 수식 관계를 해결하는 것이고, 형태소 분석은 개별 문절의 성립을 분석하는 것이다. 하지만 일본어는 생략이 많아 청킹 시 생략된 부분을 추정해야 하는데, 이 과정에서 정밀도가 낮으면 기술 문법에 모순이 생기는 등 어려움이 있다. 예를 들어 "아름답습니다"는 "아름다운 '''무언가'''입니다"의 약어로 보아야 연체형연용형 구분에 모순이 발생하지 않는다.

4. 2. 일본어 자연어 처리의 어려움

일본어는 띄어쓰기를 하지 않고 붙여 쓰기 때문에 영어 등과는 달리 자연어 처리를 할 때 먼저 형태소 분석을 수행하고, 하향식 처리를 통해 문절이 되는 덩어리를 잘라내는 청킹이 필요하다.

일본어는 생략이 많아 청킹 시에 생략된 부분을 추정해야 하는데, 이 과정에서 오류가 발생하기 쉽다. 예를 들어 "아름답습니다"는 "'아름다운 '''무언가'''입니다"의 약어로 생각해야 연체형연용형의 구분에 모순이 생기지 않는다. 이러한 이유로 청킹의 정밀도를 확보하는 것은 형태소 분석의 정확도에도 영향을 미치므로 매우 중요하다.


본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com