CJK
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
CJK는 중국어, 일본어, 한국어 등 한자 문화권 언어를 통칭하는 용어이다. 이들 언어는 한자를 공유하며, 많은 문자를 사용하므로 멀티바이트 문자를 사용한다. 키보드 입력 방식은 언어별로 다르며, 특히 한자 입력은 읽기를 입력하고 변환하는 방식이 일반적이다. CJK 언어는 전통적으로 세로쓰기를 사용하며, 조판 시 격자 위에 문자를 배치하는 기능이 요구된다. CJK 문자는 국가별로 다른 문자 인코딩을 사용했으나, 유니코드의 CJK 통합 한자를 통해 통합 표현이 가능해졌다.
더 읽어볼만한 페이지
- 베트남어 - 한자 부활
한자 부활은 과거 한자 문화권 국가에서 한자 사용을 확대하려는 움직임이나 주장을 의미하며, 대한민국에서는 한글 전용법 이후 제한된 한자 사용에 대한 논쟁이, 조선민주주의인민공화국에서는 한자 교육 부활에도 불구하고 일반적인 한자 미사용이, 베트남에서는 로마자 보급 후 감소한 한자 사용에 대한 부활 주장이 나타나고 있다. - 베트남어 - 베트남 문학
베트남 문학은 베트남의 역사, 문화, 사회상을 반영하는 문학 작품들을 통칭하며, 한문 문학, 쯔놈 문학, 쯔꾸옥응 문학으로 구분되고, 격동의 역사를 거치면서 다양한 주제와 기법으로 발전해 왔다. - 한중일 - 동아시아 정상회의
동아시아 정상회의(EAS)는 아세안 10개국과 주변 국가들이 참여하는 연례 회의로, 경제 협력 및 지역 안보 현안을 논의하며 동아시아 공동체 구축을 목표로 하지만, 회원국 간 이해관계 및 협력 구도의 복잡성으로 과제에 직면하고 있다. - 한중일 - 동아시아
동아시아는 중국, 일본, 한국, 몽골을 포함하는 지역으로 정의가 다양하며, 지리적으로 복잡한 지형과 다양한 기후대를 가지고 있고, 역사적으로 문화 교류가 활발했으나 근대에는 갈등을 겪었으며, 현재는 경제적 통합과 함께 해결해야 할 과제들이 남아있다. - 일본어 - 중고 일본어
중고 일본어는 794년부터 1185년까지 헤이안 시대에 사용된 일본어의 한 형태로, 히라가나와 가타카나가 파생되고, 한자, 히라가나, 가타카나를 문자 체계로 사용하며, 주어-목적어-서술어 구조의 문법과 다양한 문법 요소, 고유어와 한자어를 어휘로 사용했다. - 일본어 - 이로하 노래
이로하 노래는 일본어 가나 전체를 사용하여 지은 7·5조 가요 형식의 시로, 불교적 무상함을 노래하며, 가나 손글씨 연습과 일본어 순서 표기에 활용되었고, 작자 미상에 다양한 해석과 이야기가 전해진다.
CJK |
---|
2. 특징
CJK 언어들은 컴퓨터 처리 관점에서 몇 가지 공통적인 특징을 갖는다. CJK 인코딩은 국가별로 다르게 개발되어 서로 호환되지 않지만, 유니코드를 지원하는 인코딩이 시도된 적은 있다. 이러한 인코딩은 적어도 한자, 한글, 병음, 보포모포, 가나를 지원해야 한다.
2. 1. 멀티바이트 문자
CJK에 속하는 언어들은 모두 한자의 영향을 조금이나마 받았다는 특징이 있다. 중국어는 일상생활에 적어도 4000자, 완전한 문자 생활을 위해서는 40000자까지의 한자가 필요하다. 일본어는 가나와 함께 한자를 사용하며, 일반적인 문자 생활에서는 2000자 정도의 한자가 필요하지만 고유 명사를 위해서는 더 많은 글자가 필요하다. 한국어에서는 한자 사용이 감소하고 있지만, 전문 용어, 고유 명사 등을 위해 보조적인 역할을 한다. 한글은 조합형 문자이기 때문에, 조합 가능한 글리프 수는 11,172자이며, 옛한글까지 포함하면 1,638,750자로 세계 최대이다.이러한 문자적 특징 때문에 한중일 언어들에 필요한 모든 문자들은 적어도 16비트 고정폭 문자 인코딩이나 가변폭 문자 인코딩이 필요하다. 8비트 인코딩에서 사용할 수 있는 256자보다 이 언어의 문자 조합이 훨씬 많기 때문이다. 유니코드나 GB18030(중화인민공화국에서 제안한 인코딩)같은 특수한 문자 집합이 필요하다.
중국어, 일본어, 한국어를 컴퓨터로 다루는 경우, 영숫자와 프로그래밍 및 조작에 사용되는 기호 외에, 한자, 히라가나, 가타카나, 한글이 필요하다. 이러한 문자 집합은, 서구 언어의 대부분이 사용하는 알파벳과는 달리, 1 바이트 (8비트)로 표현할 수 있는 문자 총수를 크게 넘어선다. 이 때문에, 이러한 언어에서는 멀티바이트 문자를 사용하게 된다.
2. 2. 문자 입력
한자, 히라가나, 가타카나, 한글(특히 한자)은 문자 집합이 커서 모든 문자를 키보드에 직접 할당하기 어렵다. 따라서 현재는 영문 키보드나 여기에 몇 개의 키를 추가한 키보드와 소프트웨어를 이용한 입력 방식을 사용하여 입력하는 것이 일반적이다.2. 2. 1. 한자 입력 방식 (중국어, 일본어)
일본어와 중국어에서는 한자를 입력할 때 주로 발음을 입력하고 소프트웨어를 통해 변환하는 방식을 사용한다. (\[\[Microsoft IME]], \[\[Google 일본어 입력]], ATOK, SKK 등).[1] 발음을 이용한 입력 방식은 변환 단위에 따라 한 글자씩 변환하는 단어 변환과 여러 구절을 한 번에 변환하는 연문절 변환 등으로 나뉜다. 중국어에서는 글자 모양을 기반으로 한 입력 방식인 Wubi Method|오필자형 입력법영어 등도 사용된다.[1]2. 2. 2. 한글 입력 방식 (한국어)
한글은 자모 단위로 입력하는 방법이 일반적이다.[2]2. 3. 조판
CJK 언어는 주로 종이 문서를 만들 때 서구 언어와 다른 조판 방식이 필요하다. CJKV 조판에서는 세로쓰기와 가로쓰기 모두 정방형 격자 위에 문자를 배치하는 기능이 필요하며, 일부 기호나 라틴 문자가 혼재된 문서에서는 복잡한 처리가 필요할 수 있다.[4] CJKV에 적용할 수 있는 조판 규칙을 정한 규격으로는 JIS X 4051-1995 (2004년에 개정)가 알려져 있다.[5]2. 3. 1. 세로쓰기
컴퓨터의 텍스트 표시 및 처리는 원래 가로쓰기였지만, CJK/CJKV 텍스트는 전통적으로 세로쓰기이므로, 조판에서는 세로쓰기에 대한 대응이 요구된다. 이때 단순히 세로로 표시하는 것뿐만 아니라, 글자 간격이나 배치를 세로쓰기에 맞게 조정해야 한다.[3]- >
컴퓨터의 텍스트 표시 및 처리는 원래 가로쓰기였지만, CJK/CJKV 텍스트는 전통적으로 세로쓰기이므로, 조판에서는 세로쓰기에 대한 대응이 요구된다. 이때 단순히 세로로 표시하는 것뿐만 아니라, 글자 간격이나 배치를 세로쓰기에 맞게 조정해야 한다.[3]
수정 내용:
- `` 템플릿 제거: 허용되지 않는 템플릿이므로 제거했습니다.
2. 3. 2. 격자 조판
CJKV의 조판에서는 세로 조판, 가로 조판 모두 정방형으로 구성된 격자 위에 문자를 배치하는 기능이 요구된다. 이는 한자, 히라가나, 가타카나, 한글 등 CJKV 특유의 문자가 대부분 정방형에 맞는 글자꼴을 가지고 있기 때문이다. 그러나 일부 기호나 라틴 문자는 그렇지 않기 때문에, 그것들이 혼재된 문서에서는 세로쓰기용 문자로의 대체 등 복잡한 처리가 필요하다.[4]3. 문자 코드 규격
CJK 언어들은 모두 한자의 영향을 받았다는 공통점이 있다. 중국어는 일상생활에 약 4,000자, 완전한 문자 생활을 위해서는 40,000자 이상의 한자가 필요하다. 일본어는 가나와 함께 한자를 사용하며, 일반적으로 2,000자 정도의 한자가 필요하지만 고유 명사 표기에는 더 많은 글자가 필요하다. 한국어는 한자 사용이 줄고 있지만, 전문 용어나 고유 명사 등에 보조적으로 사용된다. 한글은 조합형 문자이므로, 가능한 모든 글자 조합 수는 11,172자이며, 옛한글까지 포함하면 1,638,750자로 세계 최대이다.
이러한 특징 때문에 한중일 언어들에 필요한 모든 문자들은 16비트 고정폭 문자 인코딩이나 가변폭 문자 인코딩이 필요하다. 8비트 인코딩의 256자로는 이들 언어의 문자 조합을 표현하기에 부족하기 때문이다. 유니코드나 중화인민공화국에서 제안한 GB18030과 같은 특수 문자 집합이 필요하다.
CJK 인코딩은 공통 문자 집합이 있음에도 불구하고 국가별로 다르게 개발되어 서로 호환되지 않는다.
3. 1. 종류
CJK 문자 인코딩에는 다음과 같은 종류가 있다.3. 2. 유니코드
유니코드는 CJK 언어의 문자들을 통합하여 표현할 수 있는 문자 코드 규격이다. CJK 인코딩은 국가별로 다르게 개발되어 서로 호환되지 않지만, 유니코드는 이러한 문제를 해결하기 위해 시도되었다. 유니코드는 적어도 한자, 한글, 병음, 보포모포, 가나를 지원해야 한다.CJK 문자 집합은 유니코드의 많은 부분을 차지하며, 대표적인 영역으로는 CJK 통합 한자가 있다. 유니코드의 CJK 통합 한자는 베트남의 문자 인코딩 규격인 TCVN 5773:1993과 TCVN 6056:1995의 한자(쯔놈과 쯔꾸옥 응ữ)도 원규격으로서 통합하고 있어, 실질적으로는 CJKV이다. 예를 들어, " 밭"에는 일본의 국자인 "밭"(JIS X 0208-1990의 482A)과 쯔놈의 "밭" (TCVN 5773:1993의 3C2F)이 통합되어 있다.
CJK 문자 인코딩은 다음과 같다.
참조
[1]
서적
ランディ(2002)
[2]
서적
ランディ(2002)
[3]
서적
ランディ(2002)
[4]
서적
ランディ(2002)
[5]
서적
ランディ(2002)
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com