CJK
1. 개요
CJK는 중국어, 일본어, 한국어 등 한자 문화권 언어를 통칭하는 용어이다. 이들 언어는 한자를 공유하며, 많은 문자를 사용하므로 멀티바이트 문자를 사용한다. 키보드 입력 방식은 언어별로 다르며, 특히 한자 입력은 읽기를 입력하고 변환하는 방식이 일반적이다. CJK 언어는 전통적으로 세로쓰기를 사용하며, 조판 시 격자 위에 문자를 배치하는 기능이 요구된다. CJK 문자는 국가별로 다른 문자 인코딩을 사용했으나, 유니코드의 CJK 통합 한자를 통해 통합 표현이 가능해졌다.
-
베트남어 -
한자 부활
한자 부활은 과거 한자 문화권 국가에서 한자 사용을 확대하려는 움직임이나 주장을 의미하며, 대한민국에서는 한글 전용법 이후 제한된 한자 사용에 대한 논쟁이, 조선민주주의인민공화국에서는 한자 교육 부활에도 불구하고 일반적인 한자 미사용이, 베트남에서는 로마자 보급 후 감소한 한자 사용에 대한 부활 주장이 나타나고 있다. -
베트남어 -
베트남 문학
베트남 문학은 베트남의 역사, 문화, 사회상을 반영하는 문학 작품들을 통칭하며, 한문 문학, 쯔놈 문학, 쯔꾸옥응 문학으로 구분되고, 격동의 역사를 거치면서 다양한 주제와 기법으로 발전해 왔다. -
한중일 -
동아시아 정상회의
동아시아 정상회의(EAS)는 아세안 10개국과 주변 국가들이 참여하는 연례 회의로, 경제 협력 및 지역 안보 현안을 논의하며 동아시아 공동체 구축을 목표로 하지만, 회원국 간 이해관계 및 협력 구도의 복잡성으로 과제에 직면하고 있다. -
한중일 -
동아시아
동아시아는 중국, 일본, 한국, 몽골을 포함하는 지역으로 정의가 다양하며, 지리적으로 복잡한 지형과 다양한 기후대를 가지고 있고, 역사적으로 문화 교류가 활발했으나 근대에는 갈등을 겪었으며, 현재는 경제적 통합과 함께 해결해야 할 과제들이 남아있다. -
중국어 -
한문
한문은 고대 중국어 문법에 기반한 문어체로, 동아시아 각국에서 현지화되었으며, 한자의 특성상 해석이 다양할 수 있고, 외교 및 문화 교류를 통해 수용되어, 현대에는 학술 연구, 고전 문학 등에서 사용되며 동아시아 문화와 역사를 이해하는 데 중요한 역할을 한다. -
중국어 -
백화문
백화문은 20세기 초 신문화운동과 5·4 운동의 영향으로 구어체를 기반으로 형성되어 현대 중국어의 표준이 된 문체이며, 후스와 천두슈 등의 문학혁명론과 루쉰의 백화문 소설 등이 정착에 기여하여 언어 민주화와 사회 발전에 중요한 역할을 했다.
2. 특징
CJK 언어들은 컴퓨터 처리 관점에서 몇 가지 공통적인 특징을 갖는다. CJK 인코딩은 국가별로 다르게 개발되어 서로 호환되지 않지만, 유니코드를 지원하는 인코딩이 시도된 적은 있다. 이러한 인코딩은 적어도 한자, 한글, 병음, 보포모포, 가나를 지원해야 한다.
2.1. 멀티바이트 문자
CJK에 속하는 언어들은 모두 한자의 영향을 조금이나마 받았다는 특징이 있다. 중국어는 일상생활에 적어도 4000자, 완전한 문자 생활을 위해서는 40000자까지의 한자가 필요하다. 일본어는 가나와 함께 한자를 사용하며, 일반적인 문자 생활에서는 2000자 정도의 한자가 필요하지만 고유 명사를 위해서는 더 많은 글자가 필요하다. 한국어에서는 한자 사용이 감소하고 있지만, 전문 용어, 고유 명사 등을 위해 보조적인 역할을 한다. 한글은 조합형 문자이기 때문에, 조합 가능한 글리프 수는 11,172자이며, 옛한글까지 포함하면 1,638,750자로 세계 최대이다.
이러한 문자적 특징 때문에 한중일 언어들에 필요한 모든 문자들은 적어도 16비트 고정폭 문자 인코딩이나 가변폭 문자 인코딩이 필요하다. 8비트 인코딩에서 사용할 수 있는 256자보다 이 언어의 문자 조합이 훨씬 많기 때문이다. 유니코드나 GB18030(중화인민공화국에서 제안한 인코딩)같은 특수한 문자 집합이 필요하다.
중국어, 일본어, 한국어를 컴퓨터로 다루는 경우, 영숫자와 프로그래밍 및 조작에 사용되는 기호 외에, 한자, 히라가나, 가타카나, 한글이 필요하다. 이러한 문자 집합은, 서구 언어의 대부분이 사용하는 알파벳과는 달리, 1 바이트 (8비트)로 표현할 수 있는 문자 총수를 크게 넘어선다. 이 때문에, 이러한 언어에서는 멀티바이트 문자를 사용하게 된다.
2.2. 문자 입력
한자, 히라가나, 가타카나, 한글(특히 한자)은 문자 집합이 커서 모든 문자를 키보드에 직접 할당하기 어렵다. 따라서 현재는 영문 키보드나 여기에 몇 개의 키를 추가한 키보드와 소프트웨어를 이용한 입력 방식을 사용하여 입력하는 것이 일반적이다.
2.2.1. 한자 입력 방식 (중국어, 일본어)
일본어와 중국어에서는 한자를 입력할 때 주로 발음을 입력하고 소프트웨어를 통해 변환하는 방식을 사용한다. (\[\[Microsoft IME]], \[\[Google 일본어 입력]], ATOK, SKK 등). 발음을 이용한 입력 방식은 변환 단위에 따라 한 글자씩 변환하는 단어 변환과 여러 구절을 한 번에 변환하는 연문절 변환 등으로 나뉜다. 중국어에서는 글자 모양을 기반으로 한 입력 방식인 Wubi Method영어 등도 사용된다.
2.2.2. 한글 입력 방식 (한국어)
한글은 자모 단위로 입력하는 방법이 일반적이다.
2.3. 조판
CJK 언어는 주로 종이 문서를 만들 때 서구 언어와 다른 조판 방식이 필요하다. CJKV 조판에서는 세로쓰기와 가로쓰기 모두 정방형 격자 위에 문자를 배치하는 기능이 필요하며, 일부 기호나 라틴 문자가 혼재된 문서에서는 복잡한 처리가 필요할 수 있다. CJKV에 적용할 수 있는 조판 규칙을 정한 규격으로는 JIS X 4051-1995 (2004년에 개정)가 알려져 있다.
2.3.1. 세로쓰기
컴퓨터의 텍스트 표시 및 처리는 원래 가로쓰기였지만, CJK/CJKV 텍스트는 전통적으로 세로쓰기이므로, 조판에서는 세로쓰기에 대한 대응이 요구된다. 이때 단순히 세로로 표시하는 것뿐만 아니라, 글자 간격이나 배치를 세로쓰기에 맞게 조정해야 한다.
->
컴퓨터의 텍스트 표시 및 처리는 원래 가로쓰기였지만, CJK/CJKV 텍스트는 전통적으로 세로쓰기이므로, 조판에서는 세로쓰기에 대한 대응이 요구된다. 이때 단순히 세로로 표시하는 것뿐만 아니라, 글자 간격이나 배치를 세로쓰기에 맞게 조정해야 한다.
수정 내용:
* `` 템플릿 제거: 허용되지 않는 템플릿이므로 제거했습니다.
2.3.2. 격자 조판
CJKV의 조판에서는 세로 조판, 가로 조판 모두 정방형으로 구성된 격자 위에 문자를 배치하는 기능이 요구된다. 이는 한자, 히라가나, 가타카나, 한글 등 CJKV 특유의 문자가 대부분 정방형에 맞는 글자꼴을 가지고 있기 때문이다. 그러나 일부 기호나 라틴 문자는 그렇지 않기 때문에, 그것들이 혼재된 문서에서는 세로쓰기용 문자로의 대체 등 복잡한 처리가 필요하다.
3. 문자 코드 규격
CJK 언어들은 모두 한자의 영향을 받았다는 공통점이 있다. 중국어는 일상생활에 약 4,000자, 완전한 문자 생활을 위해서는 40,000자 이상의 한자가 필요하다. 일본어는 가나와 함께 한자를 사용하며, 일반적으로 2,000자 정도의 한자가 필요하지만 고유 명사 표기에는 더 많은 글자가 필요하다. 한국어는 한자 사용이 줄고 있지만, 전문 용어나 고유 명사 등에 보조적으로 사용된다. 한글은 조합형 문자이므로, 가능한 모든 글자 조합 수는 11,172자이며, 옛한글까지 포함하면 1,638,750자로 세계 최대이다.
이러한 특징 때문에 한중일 언어들에 필요한 모든 문자들은 16비트 고정폭 문자 인코딩이나 가변폭 문자 인코딩이 필요하다. 8비트 인코딩의 256자로는 이들 언어의 문자 조합을 표현하기에 부족하기 때문이다. 유니코드나 중화인민공화국에서 제안한 GB18030과 같은 특수 문자 집합이 필요하다.
CJK 인코딩은 공통 문자 집합이 있음에도 불구하고 국가별로 다르게 개발되어 서로 호환되지 않는다.
3.1. 종류
CJK 문자 인코딩에는 다음과 같은 종류가 있다.
* Big5
* EUC-JP
* EUC-KR
* GB2312
* ISO 2022-JP
* Shift-JIS
* UTF-8
3.2. 유니코드
유니코드는 CJK 언어의 문자들을 통합하여 표현할 수 있는 문자 코드 규격이다. CJK 인코딩은 국가별로 다르게 개발되어 서로 호환되지 않지만, 유니코드는 이러한 문제를 해결하기 위해 시도되었다. 유니코드는 적어도 한자, 한글, 병음, 보포모포, 가나를 지원해야 한다.
CJK 문자 집합은 유니코드의 많은 부분을 차지하며, 대표적인 영역으로는 CJK 통합 한자가 있다. 유니코드의 CJK 통합 한자는 베트남의 문자 인코딩 규격인 TCVN 5773:1993과 TCVN 6056:1995의 한자(쯔놈과 쯔꾸옥 응ữ)도 원규격으로서 통합하고 있어, 실질적으로는 CJKV이다. 예를 들어, " 밭"에는 일본의 국자인 "밭"(JIS X 0208-1990의 482A)과 쯔놈의 "밭" (TCVN 5773:1993의 3C2F)이 통합되어 있다.
CJK 문자 인코딩은 다음과 같다.
| 인코딩 |
|---|
| Big5 |
| EUC-JP |
| EUC-KR |
| GB2312 |
| ISO 2022-JP |
| Shift-JIS |
| UTF-8 |