맨위로가기

한중일 통합 한자

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

한중일 통합 한자는 유니코드 및 ISO/IEC 10646에서 한자를 통합하여 표현하기 위한 문자 집합이다. 이 집합은 중국어, 일본어, 한국어, 베트남어의 쯔놈 문자 등을 포함하며, 기본 블록에는 20,992개의 한자가 수록되어 있다. 유니코드 버전별로 확장이 이루어져, 현재는 여러 확장 블록을 통해 97,680개 이상의 한자를 포함한다. CJK 통합 한자는 각국의 표준 한자 코드를 기반으로 하며, 한자 통합 과정에서 글리프 모양의 차이, 중복 수록, 잘못된 통합 등의 문제점이 발생하기도 했다. 유니코드에는 한중일 통합 한자 외에도 CJK 관련 부호, 기호, 호환성 문자 등이 존재한다.

더 읽어볼만한 페이지

  • 유니코드에 관한 - UTF-8
    UTF-8은 유니코드 문자를 표현하는 가변 길이 문자 인코딩 방식으로, ASCII 코드와 호환성을 유지하며 다양한 언어의 문자를 표현할 수 있도록 설계되었지만, 보안 문제점과 공간 효율성 측면에서 단점을 가진다.
  • 유니코드에 관한 - UTF-1
    UTF-1은 유니코드 초기 버전을 인코딩하기 위해 1992년에 설계된 가변 길이 문자 인코딩 방식으로, ASCII 호환성을 유지하고 ISO 2022 및 MIME과의 호환성을 고려했지만, "모듈로 190" 산술을 사용하는 특징과 현대 유니코드 표준과의 차이점을 가진다.
  • 한중일 - 동아시아 정상회의
    동아시아 정상회의(EAS)는 아세안 10개국과 주변 국가들이 참여하는 연례 회의로, 경제 협력 및 지역 안보 현안을 논의하며 동아시아 공동체 구축을 목표로 하지만, 회원국 간 이해관계 및 협력 구도의 복잡성으로 과제에 직면하고 있다.
  • 한중일 - 동아시아
    동아시아는 중국, 일본, 한국, 몽골을 포함하는 지역으로 정의가 다양하며, 지리적으로 복잡한 지형과 다양한 기후대를 가지고 있고, 역사적으로 문화 교류가 활발했으나 근대에는 갈등을 겪었으며, 현재는 경제적 통합과 함께 해결해야 할 과제들이 남아있다.
  • 유니코드 - 이모지
    이모지는 1999년 NTT 도코모에서 처음 도입된 그림 문자로, 유니코드 표준 제정 후 전 세계적으로 확산되어 다양한 언어적 기능을 수행하며 대중문화에 영향을 미치지만, 플랫폼별 표현 방식 차이와 의미 해석 논란도 존재한다.
  • 유니코드 - 국제 음성 기호
    국제 음성 기호는 국제 음성 협회가 개발한 언어의 음성 표기 문자 기호 체계로, 라틴 문자를 기반으로 자음, 모음, 초분절 기호 등을 포함하여 모든 언어의 음성을 정확하게 표기하는 것을 목표로 한다.
한중일 통합 한자
CJK 통합 한자
문자 종류표의 문자
언어중국어
일본어
한국어
베트남어
포함 문자한자
유니코드 정보
이름CJK 통합 한자
블록 위치4E00–9FFF
평면0
포함 문자 수20,976
인코딩UTF-8
UTF-16
UTF-32
관련 항목
같이 보기CJK 통합 한자 확장 A
CJK 통합 한자 확장 B
CJK 통합 한자 확장 C
CJK 통합 한자 확장 D
CJK 통합 한자 확장 E
CJK 통합 한자 확장 F
CJK 통합 한자 확장 G
CJK 통합 한자 확장 H
CJK 통합 한자 확장 I
CJK 호환용 한자
CJK 부수 보충
CJK 획수
CJK 문자/그림 기호
문자 부호 목록

2. 한중일 통합 한자 영역

유니코드 및 ISO/IEC 10646에서 한자를 통합하여 표현하기 위한 문자 집합이다.

50px
원전 H는 다음과 같이 식별한다.

  • H 홍콩 보충 문자 집합 2008
  • HB0 Big5: 계산기에서의 중국어 자형과 문자 부호의 대응표, Technical Report C-26, 전뇌용 중문자형여자마대조표, 기술 통보 C-26, 1984, Symbols
  • HB1 Big5 제1수준
  • HB2 Big5 제2수준
  • HD 홍콩 보충 문자 집합 2016


50px
원전 M은 다음과 같이 식별한다.

  • MA 홍콩 보충 문자 집합 2008
  • MB1 Big5
  • MB2 Big5
  • MC 마카오 보충 문자 집합
  • MD MCSCS 가로 확장
  • MDH MCSCS 가로 확장
  • MAC 마카오 정보 시스템 자집


50px
원전 T는 다음과 같이 식별한다.

  • T1 TCA-CNS 11643-1992 제 1 면
  • T2 TCA-CNS 11643-1992 제 2 면
  • T3 TCA-CNS 11643-1992 제 3 면 및 몇몇 추가 문자
  • T4 TCA-CNS 11643-1992 제 4 면
  • T5 TCA-CNS 11643-1992 제 5 면
  • T6 TCA-CNS 11643-1992 제 6 면
  • T7 TCA-CNS 11643-1992 제 7 면
  • TA 화학 명명 원칙(제4판)
  • TB TCA-CNS 11643-2007 제 11 면
  • TC TCA-CNS 11643-2007 제 12 면
  • TD TCA-CNS 11643-2007 제 13 면
  • TE TCA-CNS 11643-2007 제 14 면
  • TF TCA-CNS 11643-2007 제 15 면
  • T13 TCA-CNS 11643 제 19 면 (pending new version)
  • TU 원전 없음


50px
원전 J는 다음과 같이 식별한다.

  • J0 JIS X 0208-1990
  • J1 JIS X 0212-1990
  • J13 J1을 JIS X 0213:2004 제3수준으로 대체한 것
  • J13A J1을 JIS X 0213:2000 제3수준에 추가한 JIS X 0213:2004 제3수준으로 대체한 것
  • J14 J1을 JIS X 0213:2004 제4수준으로 대체한 것
  • J3 JIS X 0213:2000 제3수준
  • J3A JIS X 0213:2004 제3수준
  • J4 JIS X 0213:2000 제4수준
  • JA 국내 5사 한자 통합표, 1993
  • JA3 JA를 JIS X 0213:2004 제3수준으로 대체한 것
  • JA4 JA를 JIS X 0213:2004 제4수준으로 대체한 것
  • JH 범용 전자 정보 교환 환경 정비 프로그램 2002~2009
  • JK 금석문자경[35]
  • JMJ 문자 정보 기반 정비 사업
  • JARIB 전파산업회 ARIB STD-B24 제5.1판, 2007년 3월 14일


50px
원전 K는 다음과 같이 식별한다.

  • K0 KS X 1001:2004 (이전에는 KS C 5601-1987이었다.)
  • K1 KS X 1002:2001 (이전에는 KS C 5657-1991이었다.)
  • K2 PKS C 5700-1 1994
  • K3 PKS C 5700-2 1994
  • K4 PKS 5700-3:1998
  • K5 Korean IRG Hanja Character Set 5th Edition: 2001
  • K6 KS X 1027-5:2014
  • KC 한국 역사 정보 통합 시스템
  • KU 원전 없음


''참고 K2, K3, K4 및 K5에 포함된 한자는 새로운 한국 규격군에서 개정 작업이 진행 중이다.''

50px
원전 KP는 다음과 같이 식별한다.

  • KP0 KPS 9566-97
  • KP1 KPS 10721:2000 및 KPS 10721:2003


50px
원전 V는 다음과 같이 식별한다.

  • V0 TCVN 5773:1993
  • V1 TCVN 6056:1995
  • V2 VHN 01:1998
  • V3 VHN 02:1998
  • V4 喃字詞典, 岱喃字字典, 沔南喃字榜査
  • VN Vietnamese horizontal extensions

  • SAT대정신수대장경 텍스트 데이터베이스
  • UK 상형 문자 보고자 그룹
    50px
  • UTC 유니코드 기술 위원회 보고서
    |50px]]


서기소 클러스터(grapheme cluster)에서, 한자는 UTF-16에서 가변(16, 32, 48, 64비트)이다.[36]

  • 16비트

: 기본 다국어 평면(BMP)

  • 32비트

: 추가 평면

: 기본 다국어 평면(BMP) + SVS(자형 선택자 (유니코드 블록)/Variation Selectors (Unicode block)영어)

  • 48비트

: 기본 다국어 평면(BMP) + IVS(자형 선택자 보조/Variation Selectors Supplement영어)

  • 64비트

: 추가 평면 + IVS

2. 1. 한중일 통합 한자

유니코드 기본 다국어 평면(BMP)의 U+4E00부터 U+9FFF까지의 영역에 20,992개의 한자가 수록되어 있다.[4] 초기 20,902자는 강희자전의 부수 순서에 따라 배열되었으며, 이후 추가된 한자들은 부수 순서와 관계없이 배열되었다.

CJK 통합 한자 (4E00–9FFF)라고 명명된 기본 블록은 U+4E00부터 U+9FFF까지의 범위에 20,992개의 기본 한자를 포함한다. 이 블록은 중국어뿐만 아니라 일본어가나한자, 한글한자, 베트남어의 쯔놈 문자까지 포함한다. 이 블록의 많은 문자는 세 문자 체계에서 모두 사용되는 반면, 다른 문자는 세 체계 중 하나 또는 두 개에서만 사용된다.[4]

이 블록은 한자 통합의 결과이며, 이는 동아시아에서 다소 논란이 있었다.[5] 중국어, 일본어 및 한국어 문자가 동일한 위치에 인코딩되면서 선택된 글리프의 모양은 사용 중인 특정 글꼴에 따라 달라질 수 있었다. 그러나 ''소스 분리 규칙''에 따르면 이전 문자 집합에서 별도로 인코딩된 문자는 새로운 유니코드 인코딩에서도 별도로 유지된다.[6]

변형 선택자를 사용하면 유니코드 내에서 특정 변형 CJK 표의 문자를 지정할 수 있다.[7]

50px
원전 G는 다음과 같이 식별한다.

  • G0 GB 2312-80
  • G1 GB 12345-90
  • G3 GB 7589-87 번체자
  • G5 GB 7590-87 번체자
  • G7 현대 한어 통용 자표 및 간화자 총표
  • GS 싱가포르에서의 한자
  • G8 GB 8565-88
  • G9 GB 18030-2000
  • GE GB 16500-95
  • GH GB 15564-1995 홍콩의 일부 문자 방송용 한자 체계
  • GK GB 12052-89 정보 교환용 한글 문자 부호화 문자 정보
  • G4K 사고전서
  • GBK 중국대백과전서
  • GCE 국가교육연구원
  • GCH 사해(辭海)
  • GCY 사원(辭源)
  • GCYY 중국 측회 과학원 용자
  • GDM 중국 공안부 호적 인명 지명 한자
  • GDZ 지질 출판사 용자
  • GFC 현대 한어 규범 사전 제2판
  • GFZ 방정(方正) 조판 시스템
  • GGFZ 통용 규범 한자 사전
  • GGH 고대 한어 사전
  • GHC 한어 대사전
  • GHF 한문 불전 의난 속자 회석 여 연구
  • GHZ 한어 대자전
  • GHZR 한어 대자전 제2판
  • GIDC 중국 공안부 ID 시스템
  • GIDC23 중국 공안부 ID 시스템 2023
  • GIDCX 중국 공안부 ID 시스템
  • GJZ 상무인서관 용자
  • GKX 강희자전 및 강희자전 보유
  • GKJ Terms in Sciences and Technologies (과학 기술 용어) approved by the China National Committee for Terms in Sciences and Technologies (CNCTST)
  • GLGYJ 좡족 료가 연구
  • GLK 용감수감
  • GOCD 옥스포드 영한 한영 사전
  • GPGLG 좡족 민가 문화 총서・평과 료가
  • GRM 인민일보의 한자
  • GT 1983년 표준 전마본(수정본)
  • GU 원전 불명(원전이 있다고 여겨졌지만, 후에 오류로 판명된 글자 등)
  • GWZ 한어 대사전 출판사 용자
  • GXC 현대 한어 사전
  • GXH 신화자전
  • GXHZ 신화 대자전
  • GZ 고좡자 사전
  • GZA-1 생생 불식의 전승・효와 좡족 효도 노래의 연구
  • GZA-2 좡족 윤리 도덕 장시 전양가 역주
  • GZA-3 좡족 민가 고적 집성・정가(1) 료가
  • GZA-4 좡족 민가 고적 집성・정가(2) 환𭪤
  • GZA-6 중국 좡족 속담
  • GZA-7 원고의 추억・좡족 창세 신화 고가 연구
  • GZFY 한어 방언 대사전
  • GZH 중화자해
  • GZJW 은주 금문 집성 인득
  • GZYS 좡족 인민의 문화 유산 - 방괴 좡자, 중국 민족 고문자 연구


''참고: 강희자전(GKX)으로 참조되는 문자에 대한 부호표상의 예시 그림은 현재 중국에서 사용되고 있으며, 강희자전에 표시된 예시 그림과는 약간 다를 수 있다.''

2. 1. 1. 목록

4E00-62FF,

6300-77FF,

7800-8CFF,

8D00-9FFF.

2. 1. 2. 출처

다양한 국가 및 지역의 표준 한자 코드를 기반으로 한다. 대한민국은 KS X 1001, KS X 1002 등의 표준을 제공했다.

2. 2. 한중일 통합 한자 확장 A

유니코드 3.0(1999)에서 한중일 통합 한자 확장 A(3400–4DBF)에는 U+3400부터 U+4DB5까지 6,582개의 한자가 수록되었다. CJK 통합 한자 확장 A라고 명명된 블록(3400–4DBF)은 U+3400부터 U+4DBF까지의 범위에 있는 6,592개의 추가 문자를 포함한다.

3400-4DBF

원전 K는 다음과 같이 식별한다.

  • K0 KS X 1001:2004 (이전에는 KS C 5601-1987이었다.)
  • K1 KS X 1002:2001 (이전에는 KS C 5657-1991이었다.)
  • K2 PKS C 5700-1 1994
  • K3 PKS C 5700-2 1994
  • K4 PKS 5700-3:1998
  • K5 Korean IRG Hanja Character Set 5th Edition: 2001
  • K6 KS X 1027-5:2014
  • KC 한국 역사 정보 통합 시스템
  • KU 원전 없음


''참고 K2, K3, K4 및 K5에 포함된 한자는 새로운 한국 규격군에서 개정 작업이 진행 중이다.''

2. 2. 1. 목록

3400-4DBF

2. 2. 2. 출처

원전 K는 다음과 같이 식별한다.

  • K0 KS X 1001:2004 (이전에는 KS C 5601-1987이었다.)
  • K1 KS X 1002:2001 (이전에는 KS C 5657-1991이었다.)
  • K2 PKS C 5700-1 1994
  • K3 PKS C 5700-2 1994
  • K4 PKS 5700-3:1998
  • K5 Korean IRG Hanja Character Set 5th Edition: 2001
  • K6 KS X 1027-5:2014
  • KC 한국 역사 정보 통합 시스템
  • KU 원전 없음


''참고 K2, K3, K4 및 K5에 포함된 한자는 새로운 한국 규격군에서 개정 작업이 진행 중이다.''

2. 3. 한중일 통합 한자 확장 B

유니코드 3.1(2001)에서 한중일 통합 한자 확장 B(20000–2A6DF)에는 U+20000부터 U+2A6D6까지 42,711개의 한자가 수록되었다. 여기에는 강희자전에서 사용된 대부분의 문자와 과거 베트남어를 표기하는데 사용되었던 많은 쯔놈 문자가 포함되어 있다.

중화인민공화국은 다음과 같은 출처를 제공하였다.

  • G0 GB 2312-80
  • G1 GB 12345-90
  • G3 GB 7589-87 번체자
  • G5 GB 7590-87 번체자
  • G7 현대 한어 통용 자표 및 간화자 총표
  • GS 싱가포르에서의 한자
  • G8 GB 8565-88
  • G9 GB 18030-2000
  • GE GB 16500-95
  • GH GB 15564-1995 홍콩의 일부 문자 방송용 한자 체계
  • GK GB 12052-89 정보 교환용 한글 문자 부호화 문자 정보
  • G4K 사고전서
  • GBK 중국대백과전서
  • GCE 국가교육연구원
  • GCH 사해(辭海)
  • GCY 사원(辭源)
  • GCYY 중국 측회 과학원 용자
  • GDM 중국 공안부 호적 인명 지명 한자
  • GDZ 지질 출판사 용자
  • GFC 현대 한어 규범 사전 제2판
  • GFZ 방정(方正) 조판 시스템
  • GGFZ 통용 규범 한자 사전
  • GGH 고대 한어 사전
  • GHC 한어 대사전
  • GHF 한문 불전 의난 속자 회석 여 연구
  • GHZ 한어 대자전
  • GHZR 한어 대자전 제2판
  • GIDC 중국 공안부 ID 시스템
  • GIDC23 중국 공안부 ID 시스템 2023
  • GIDCX 중국 공안부 ID 시스템
  • GJZ 상무인서관 용자
  • GKX 강희자전 및 강희자전 보유
  • GKJ Terms in Sciences and Technologies (과학 기술 용어) approved by the China National Committee for Terms in Sciences and Technologies (CNCTST)
  • GLGYJ 좡족 료가 연구
  • GLK 용감수감
  • GOCD 옥스포드 영한 한영 사전
  • GPGLG 좡족 민가 문화 총서・평과 료가
  • GRM 인민일보의 한자
  • GT 1983년 표준 전마본(수정본)
  • GU 원전 불명(원전이 있다고 여겨졌지만, 후에 오류로 판명된 글자 등)
  • GWZ 한어 대사전 출판사 용자
  • GXC 현대 한어 사전
  • GXH 신화자전
  • GXHZ 신화 대자전
  • GZ 고좡자 사전
  • GZA-1 생생 불식의 전승・효와 좡족 효도 노래의 연구
  • GZA-2 좡족 윤리 도덕 장시 전양가 역주
  • GZA-3 좡족 민가 고적 집성・정가(1) 료가
  • GZA-4 좡족 민가 고적 집성・정가(2) 환𭪤
  • GZA-6 중국 좡족 속담
  • GZA-7 원고의 추억・좡족 창세 신화 고가 연구
  • GZFY 한어 방언 대사전
  • GZH 중화자해
  • GZJW 은주 금문 집성 인득
  • GZYS 좡족 인민의 문화 유산 - 방괴 좡자, 중국 민족 고문자 연구


''참고: 강희자전(GKX)으로 참조되는 문자에 대한 부호표상의 예시 그림은 현재 중국에서 사용되고 있으며, 강희자전에 표시된 예시 그림과는 약간 다를 수 있다.''

2. 3. 1. 목록

20000-215FF,

21600-230FF,

23100-245FF,

24600-260FF,

26100-275FF,

27600-290FF,

29100-2A6DF.

2. 3. 2. 출처


  • 강희자전
  • 한어대자전
  • 사원
  • 사해
  • 한어대사전
  • 중국대백과전서
  • 베이징 대학 Founder DTP
  • 사고전서
  • HKSCS
  • JIS X 0213 제3수준한자와 제4수준한자
  • KS X 1027-3:2011 (PKS 5700-3:1998)
  • KS X 1027-4:2011 (Korean IRG Hanja Character Set 5th Edition: 2001)
  • KPS 9566-97
  • KPS 10721-2000
  • CNS 11643 planes 4-7, 15
  • TCVN, VHN 01:1998, VHN 02:1998

원전 G는 다음과 같이 식별한다.

  • G0 GB 2312-80
  • G1 GB 12345-90
  • G3 GB 7589-87 번체자
  • G5 GB 7590-87 번체자
  • G7 현대 한어 통용 자표 및 간화자 총표
  • GS 싱가포르에서의 한자
  • G8 GB 8565-88
  • G9 GB 18030-2000
  • GE GB 16500-95
  • GH GB 15564-1995 홍콩의 일부 문자 방송용 한자 체계
  • GK GB 12052-89 정보 교환용 한글 문자 부호화 문자 정보
  • G4K 사고전서
  • GBK 중국대백과전서
  • GCE 국가교육연구원
  • GCH 사해(辭海)
  • GCY 사원(辭源)
  • GCYY 중국 측회 과학원 용자
  • GDM 중국 공안부 호적 인명 지명 한자
  • GDZ 지질 출판사 용자
  • GFC 현대 한어 규범 사전 제2판
  • GFZ 방정(方正) 조판 시스템
  • GGFZ 통용 규범 한자 사전
  • GGH 고대 한어 사전
  • GHC 한어 대사전
  • GHF 한문 불전 의난 속자 회석 여 연구
  • GHZ 한어 대자전
  • GHZR 한어 대자전 제2판
  • GIDC 중국 공안부 ID 시스템
  • GIDC23 중국 공안부 ID 시스템 2023
  • GIDCX 중국 공안부 ID 시스템
  • GJZ 상무인서관 용자
  • GKX 강희자전 및 강희자전 보유
  • GKJ Terms in Sciences and Technologies (과학 기술 용어) approved by the China National Committee for Terms in Sciences and Technologies (CNCTST)
  • GLGYJ 좡족 료가 연구
  • GLK 용감수감
  • GOCD 옥스포드 영한 한영 사전
  • GPGLG 좡족 민가 문화 총서・평과 료가
  • GRM 인민일보의 한자
  • GT 1983년 표준 전마본(수정본)
  • GU 원전 불명(원전이 있다고 여겨졌지만, 후에 오류로 판명된 글자 등)
  • GWZ 한어 대사전 출판사 용자
  • GXC 현대 한어 사전
  • GXH 신화자전
  • GXHZ 신화 대자전
  • GZ 고좡자 사전
  • GZA-1 생생 불식의 전승・효와 좡족 효도 노래의 연구
  • GZA-2 좡족 윤리 도덕 장시 전양가 역주
  • GZA-3 좡족 민가 고적 집성・정가(1) 료가
  • GZA-4 좡족 민가 고적 집성・정가(2) 환𭪤
  • GZA-6 중국 좡족 속담
  • GZA-7 원고의 추억・좡족 창세 신화 고가 연구
  • GZFY 한어 방언 대사전
  • GZH 중화자해
  • GZJW 은주 금문 집성 인득
  • GZYS 좡족 인민의 문화 유산 - 방괴 좡자, 중국 민족 고문자 연구

''참고: 강희자전(GKX)으로 참조되는 문자에 대한 부호표상의 예시 그림은 현재 중국에서 사용되고 있으며, 강희자전에 표시된 예시 그림과는 약간 다를 수 있다.''

원전 K는 다음과 같이 식별한다.

  • K0 KS X 1001:2004 (이전에는 KS C 5601-1987이었다.)
  • K1 KS X 1002:2001 (이전에는 KS C 5657-1991이었다.)
  • K2 PKS C 5700-1 1994
  • K3 PKS C 5700-2 1994
  • K4 PKS 5700-3:1998
  • K5 Korean IRG Hanja Character Set 5th Edition: 2001
  • K6 KS X 1027-5:2014
  • KC 한국 역사 정보 통합 시스템
  • KU 원전 없음

''참고 K2, K3, K4 및 K5에 포함된 한자는 새로운 한국 규격군에서 개정 작업이 진행 중이다.''

2. 4. 한중일 통합 한자 확장 C

유니코드 5.2(2009)에서 한중일 통합 한자 확장 C 영역(2A700–2B73F)에는 U+2A700부터 U+2B734까지 4,149개의 한자가 수록되었다.

2. 4. 1. 목록

2A700-2B73F.

2A700-2B73F.

2. 4. 2. 출처

KS X 1027-4:2011

원전 K는 다음과 같이 식별한다.

  • K0 KS X 1001:2004 (이전에는 KS C 5601-1987이었다.)
  • K1 KS X 1002:2001 (이전에는 KS C 5657-1991이었다.)
  • K2 PKS C 5700-1 1994
  • K3 PKS C 5700-2 1994
  • K4 PKS 5700-3:1998
  • K5 Korean IRG Hanja Character Set 5th Edition: 2001
  • K6 KS X 1027-5:2014
  • KC 한국 역사 정보 통합 시스템
  • KU 원전 없음


''참고 K2, K3, K4 및 K5에 포함된 한자는 새로운 한국 규격군에서 개정 작업이 진행 중이다.''

2. 5. 한중일 통합 한자 확장 D

유니코드 6.0(2010)에서 한중일 통합 한자 확장 D 영역(2B740–2B81F)에는 U+2B740부터 U+2B81D까지 222개의 한자가 수록되었다. 이 블록은 유니코드 6.0(2010)에 추가되었다.

2. 5. 1. 목록

2B740-2B81F

2. 6. 한중일 통합 한자 확장 E

유니코드 8.0(2015)에서 한중일 통합 한자 확장 E 영역(2B820-2CEAF)에는 U+2B820부터 U+2CEAF까지 5,762개의 한자가 수록되었다.

2B820-2CEAF

2. 6. 1. 목록

2B820-2CEAF

2. 7. 한중일 통합 한자 확장 F

유니코드 10.0(2017)에서 한중일 통합 한자 확장 F 영역(2CEB0-2EBE0)에는 U+2CEB0부터 U+2EBE0까지 7,473개의 한자가 수록되었다. 이 블록에는 좡어의 Sawndip 문자 1,000개 이상이 포함되어 있다.

2CEB0-2EBE0

원전 K는 다음과 같이 식별한다.

  • K0 KS X 1001:2004 (이전에는 KS C 5601-1987이었다.)
  • K1 KS X 1002:2001 (이전에는 KS C 5657-1991이었다.)
  • K2 PKS C 5700-1 1994
  • K3 PKS C 5700-2 1994
  • K4 PKS 5700-3:1998
  • K5 Korean IRG Hanja Character Set 5th Edition: 2001
  • K6 KS X 1027-5:2014
  • KC 한국 역사 정보 통합 시스템
  • KU 원전 없음


''참고 K2, K3, K4 및 K5에 포함된 한자는 새로운 한국 규격군에서 개정 작업이 진행 중이다.''

2. 7. 1. 목록

2CEB0-2EBE0

2. 7. 2. 출처

원전 K는 다음과 같이 식별한다.

  • K0 KS X 1001:2004 (이전에는 KS C 5601-1987이었다.)
  • K1 KS X 1002:2001 (이전에는 KS C 5657-1991이었다.)
  • K2 PKS C 5700-1 1994
  • K3 PKS C 5700-2 1994
  • K4 PKS 5700-3:1998
  • K5 Korean IRG Hanja Character Set 5th Edition: 2001
  • K6 KS X 1027-5:2014
  • KC 한국 역사 정보 통합 시스템
  • KU 원전 없음


''참고 K2, K3, K4 및 K5에 포함된 한자는 새로운 한국 규격군에서 개정 작업이 진행 중이다.''

2. 8. 한중일 통합 한자 확장 G

유니코드 13.0(2020)에서 한중일 통합 한자 확장 G 영역(30000-3134F)에는 U+30000부터 U+3134F까지 4,939개의 한자가 수록되었다.[13] CJK 통합 한자 확장 G라는 블록은 유니코드 13.0의 일부로 제3 표의 평면에 U+30000부터 U+3134F까지의 범위로 추가되었으며, 4,939개의 문자를 포함하고 있다.[13]

2. 8. 1. 목록

30000-3134F.

30000–3134F.

2. 8. 2. 출처


  • 한어대사전
  • 장족요가연구
  • 고장자자전
  • 한국 역사 정보 통합 시스템
  • CNS 11643
  • IRG N2107R2
  • 대장경연구팀
  • 각 수집 미수록 한자

원전 K는 다음과 같이 식별한다.

  • K0 KS X 1001:2004 (이전에는 KS C 5601-1987이었다.)
  • K1 KS X 1002:2001 (이전에는 KS C 5657-1991이었다.)
  • K2 PKS C 5700-1 1994
  • K3 PKS C 5700-2 1994
  • K4 PKS 5700-3:1998
  • K5 Korean IRG Hanja Character Set 5th Edition: 2001
  • K6 KS X 1027-5:2014
  • KC 한국 역사 정보 통합 시스템
  • KU 원전 없음

''참고 K2, K3, K4 및 K5에 포함된 한자는 새로운 한국 규격군에서 개정 작업이 진행 중이다.''

2. 9. 한중일 통합 한자 확장 H

유니코드 15.0(2022)에서 한중일 통합 한자 확장 H 영역(31350–323AF)에는 U+31350부터 U+323AF까지 4,192개의 한자가 수록되었다. CJK 통합 한자 확장 H로 명명된 블록은 U+31350부터 U+323AF까지의 범위에서 4,192개의 문자를 포함하며, 보조 표의 문자 영역에 유니코드 15.0의 일부로 추가되었다.[14] 31350–323AF

2. 9. 1. 목록

31350–323AF

2. 10. 한중일 통합 한자 확장 I

유니코드 15.1(2023)에서 한중일 통합 한자 확장 I 영역(2EBF0–2EE5F)에는 U+2EBF0부터 U+2EE5F까지 622개의 한자가 수록되었다.[15] CJK 통합 한자 확장 I이라고 불리는 블록이 유니코드 15.1의 일부로 U+2EBF0부터 U+2EE5F 범위에 보조 표의 문자 평면에 추가되었으며, 622개의 문자를 포함하고 있다.[15]

2. 10. 1. 목록

2EBF0–2EE5F.

2EBF0–2EE5F.

2. 11. 한중일 통합 한자 확장 J

중국은 강희자전이나 고장자를 비롯한 소수 민족이 사용하는 특수 한자 등 모든 문자를 UCS에 수록하려 하고 있으며, 일본과 한국, 베트남에서도 한자(국자, 한국 국자, 쯔놈 등)의 추가 제안이 있기 때문에, 유니코드 16.0에서는 확장 J의 추가가 예정되어 있으며, 유니코드의 향후 버전에서는 CJK 통합 한자의 확장 블록이 더욱 증가할 가능성이 있다.

갑골 문자, 금문, 소전 등 고대 문자에 대해서는 세 번째 한자 면에 추가하는 것을 검토하고 있다.

한자의 부품과 가나나 알파벳 등을 조합한 문자(⿸广K(경의 약자), ⿱宀R(료의 약자), ⿰木キ(기의 약자), ⿱⿰⿱콘⿱크리土(콘크리트) 등)과, 불교의 석전(釋典)의 주문 등에서 사용된 기묘한 자형의 문자(
인 (불자)
), ⿴〇⿻𠃊冂(엔) 등)은, 일반적인 한자와는 다른 블록으로 추가하는 것을 검토하고 있다.

2. 12. 한중일 호환용 한자

F900–FAFF 블록은 U+F900~U+FAFF 영역에 해당하며, 다른 표준과의 왕복 호환성을 위해 만들어졌다. 유니코드 3.1에서는 제2면(추가 한자면)에 U+2F800~U+2FA1F 블록(한중일 호환용 한자 보충)이 추가되었다. 이 블록들에는 기본적으로 CJK 통합 한자와 중복되는 한자가 할당되어 있다.[1]

CJK 통합 한자는 하나의 한자에 하나의 부호 위치만 주어지기 때문에, KS X 1001처럼 각국의 규격에서 완전히 같은 형태의 한자가 중복 수록된 경우, 유니코드 변환 시 가역성 손실 문제가 발생할 수 있다. KS X 1001의 경우, 독음에 따라 분리되어 있어 독음을 알 수 없게 되는 문제가 있다. 이러한 문제를 해결하기 위해 이 블록이 만들어졌다. Big5에서 잘못 중복된 두 글자도 이 블록에 있다. IBM 확장 한자 중 CJK 통합 한자에 포함되지 못한 것도 있으며, 그중 U+FA1F(﨟)나 U+FA24(﨤) 등 12자는 CJK 통합 한자에 같은 한자가 없어 CJK 통합 한자와 동일하게 취급된다.

유니코드 3.2에서는 JIS X 0213에서 포섭 기준 변경으로 분리된 "侮󠄁󠄁", "僧󠄁󠄁", "社󠄁" 등이 이 블록에 추가되었다. 이는 CJK 통합 한자가 일본뿐 아니라 중국, 한국의 한자도 포함하기 때문에, 일본만을 위해 포섭 기준을 변경하면 다른 나라(특히 한국)가 국내 규격과 대응하는 유니코드 코드 값을 변경해야 하는 문제가 발생하기 때문이다. 예를 들어 "社󠄁"의 경우, GB 18030에서는 ⽰ 부가 "⺭" 형태이지만, 한국의 KS X 1001에서는 "⺬" 형태를 채용한다. 따라서 "社󠄁"를 CJK 통합 한자에 새로 추가하면, GB 18030은 문제가 없지만, KS X 1001의 "社󠄀"는 새로 추가된 쪽으로 코드를 변경해야 한다.

2. 12. 1. 목록

한중일 호환용 한자(F900-FAFF)

한중일 호환용 한자 보충(2F800-2FA1F)

F900–FAFF는 U+F900~U+FAFF 블록에 해당한다. 유니코드 3.1에서는 보조 집합으로서 제2면(추가 한자면)에 U+2F800~U+2FA1F 블록이 추가되었다. 기본적으로 CJK 통합 한자와 중복되는 한자가 할당되어 있다.

CJK 통합 한자에는 기본적으로 하나의 한자에 하나의 부호 위치만 주어지기 때문에, KS X 1001 등 각국의 규격에서 완전히 같은 형태의 한자가 중복되어 수록되었을 경우, 유니코드와의 상호 변환을 수행할 때 가역성이 손실될 수 있다. (KS X 1001의 경우, 독음에 따라 분리되어 있기 때문에, 독음을 알 수 없게 되어 곤란한 경우가 있다.) 이러한 문제를 해결하기 위해 이 블록이 만들어졌다. Big5에서 잘못 중복된 두 글자도 이 블록에 있다. IBM 확장 한자 중 CJK 통합 한자에 들어가지 못한 것도 있으며, 그중에는 U+FA1F(﨟)나 U+FA24(﨤) 등 CJK 통합 한자에 같은 한자가 존재하지 않아 CJK 통합 한자와 같은 취급을 하는 것이 12자 있다.

유니코드 3.2에서는 JIS X 0213에서 포섭 기준이 변경되어 분리된 것 중 "侮󠄁󠄁"나 "僧󠄁󠄁", "社󠄁" 등 유니코드에서는 포섭되는 것이 이 블록에 추가되었다. 이는 CJK 통합 한자는 일본 외에도 중국과 한국의 한자를 포함한 것이며, 일본만을 위해 포섭 기준을 변경하여 포섭 분리하여 추가하면 다른 나라가 국내 규격과 대응하는 유니코드 코드 값을 변경해야 하는 경우가 있기 때문이다. 예를 들어, "社󠄁" 등 ⽰ 부의 한자는 GB 18030에서는 부가 "⺭"의 형태를 채용하고 있지만, KS X 1001에서는 부가 "⺭"이 아닌 "⺬"의 형태를 채용하고 있다. 만약 "社󠄁"를 포섭 분리하여 CJK 통합 한자의 새로운 부호 위치에 추가하면, GB 18030은 그대로 괜찮지만, KS X 1001의 "社󠄀"의 코드와의 대응은 새로 추가된 쪽으로 변경해야만 한다.

3. 역사

한중일 통합 한자 코드에 대한 논의는 1980년대부터 시작되었다.[24] 1978년 일본에서 최초의 ISO 2022 기반 한자 코드 규격 JIS C 6226이 제정되었고, 1980년대에는 중국, 대만, 한국에서 각 국가 및 지역용 한자 코드 규격이 제정되었지만, 이들은 서로 관련성이 없어 혼용해서 사용하기 어려웠다.[24]

1980년, 국립국회도서관의 다카하시 도쿠타로는 서지학의 관점에서 동아시아의 통일 한자 코드의 필요성을 지적했다.[24] 같은 해, 대만에서 제정된 3바이트 한자 코드 규격 CCCII는 일본, 중국, 대만의 한자를 통일적으로 취급할 목적으로 만들어진 최초의 규격 중 하나로, 미국에서도 ANSI Z 39.64로 채택되었다.

1984년, ISO의 문자 코드 규격 위원회 (ISO/TC 97 - SC2)는 전 세계 문자를 단일 문자 집합으로 처리할 수 있는 문자 코드 규격 (ISO 10646)을 만들기로 결정하고, 전문 워크 그룹 (WG2)을 설치했다. 초기에는 16비트를 예상했으나, 중국의 반대로 각국의 한자 코드를 통합한 한자 집합 HCC의 아이디어가 제안되었다.[24]

1990년, ISO 10646의 초판 드래프트는 한자 코드를 32비트로 표현하고 각국의 한자 코드를 그대로 넣는 방식이었으나, 중국은 한자를 통일하여 취급할 것을 요구하며 반대했다. 이에 따라, 워크 그룹은 CJK-JRG를 설치하여 한자 코드 방침을 계속 검토했다.

1987년경부터 제록스의 조 베커[25]와 리 콜린스[26]는 전 세계 문자를 통일적으로 취급할 수 있는 문자 코드 Unicode를 개발하고 있었다. 1989년에 발표된 Unicode 개요에서는 16비트로 모든 문자를 취급하고, 일본, 중국, 한국의 한자를 통합하는 것을 기본 정책으로 했다. 1991년 1월에는 유니코드 컨소시엄이 설립되었다.

1991년, ISO/IEC 10646의 초판 드래프트는 Unicode와의 일원화를 요구하는 각국에 의해 부결되었고, CJK-JRG에서 ISO 10646과 Unicode의 일원화가 추진되었다. CJK-JRG는 각국의 한자 코드에 기반하여 독자적인 통합 기준을 정하고, 통합 한자 코드표 Unified Repertoire and Ordering (URO)를 작성했다.

1992년, URO를 반영한 ISO 10646의 2판 드래프트가 완성되어 국제 규격화되었다. 1993년 5월, 최초의 CJK 통합 한자 20,902자가 할당된 ISO/IEC 10646이 정식으로 제정되었고, 한 달 후에는 내용을 동일하게 하는 Unicode 1.1이 제정되었다.

이후 지속적인 확장을 통해 새로운 한자들이 추가되었다. 1999년 Unicode 3.0에서는 CJK 통합 한자 확장 A로 6,582자가 추가되었고[27][28], 2001년 Unicode 3.1에서는 CJK 통합 한자 확장 B에 42,711자가 추가되었다. 2005년 Unicode 4.1, 2008년 Unicode 5.1, 2009년 Unicode 5.2, 2010년 Unicode 6.0, 2012년 Unicode 6.1, 2015년 Unicode 8.0, 2017년 Unicode 10.0, 2018년 Unicode 11.0, 2020년 Unicode 13.0, 2021년 Unicode 14.0, 2022년 Unicode 15.0, 2023년 Unicode 15.1을 거치면서 한자가 계속 추가되었다. 2024년 9월에는 Unicode 16.0에서 확장 J의 4,300자가 추가될 예정이다.[31]

4. 특징 및 문제점

유니코드 버전 5.0까지 U+4039(䀹)에는 夾(협)이 들어간 한자와 㚒(섬)이 들어간 한자가 통합되어 있었다.[16] 그러나 두 글자는 훈과 음이 모두 다른 한자로, 사실 통합되어서는 안 될 한자였다.[38]

U+4039의 분리 제안이 받아들여져 유니코드 5.1에서 U+9FC3 (鿃)으로 새로 분리되었다.[16][38]

MS 한글 IME에서는 U+4039를 U+9FC3의 음인 "섬"으로 입력해야 하는 문제가 남아있다.

확장 한자 B 영역에는 수백 개의 이체자가 수록되어 있으며,[39] 그 중 일부는 유니코드 글자 수록 과정에서의 실수 등으로 인해 중복 수록되었다.[40]


  • U+34A8 㒨 = U+20457 𠑗 : U+20457는 중국(간체권) 한자 U+34A8와 같음, 그러나 중국(번체권)의 글자 U+34A8와는 모양이 약간 다름.[40][19]
  • U+3DB7 㶷 = U+2420E 𤈎 : 모양이 같은 한자[40][19]
  • U+8641 虁 = U+27144 𧅄 : U+27144는 한국 한자 U+8641와 같음, 그러나 일본, 중국(간체권, 번체권)의 글자 U+8641와는 모양이 약간 다름.[40][19]
  • U+204F2 𠓲 = U+23515 𣔕 : 모양이 같은 한자, 그러나 부수가 다름.[40][19]
  • U+249BC 𤦼 = U+249E9 𤧩 : 모양이 같은 한자[40][19]
  • U+24BD2 𤯒 = U+2A415 𪐕 : 모양이 같은 한자, 그러나 부수가 다름.[40][19]
  • U+26842 𦡂 = U+26866 𦡦 : 모양이 같은 한자[40][19]
  • U+FA23 﨣 = U+27EAF 𧺯 : 모양이 같은 한자 (은 한중일 호환용 한자로 분류되어 있으나 실제로는 통합 한자임.)[40][19]


CJK 통합 한자 확장 B에는 일부 문자가 다른 문자와 잘못 통합된 경우가 있다. U+2017B(𠅻), U+204AF(𠒯) 및 U+24CB2(𤲲)가 그러한 예인데, 처음 두 문자는 중국 본토와 베트남의 글꼴 소스가, 마지막 문자는 중국 본토와 대만의 글꼴 소스가 잘못 통합되었다.[17]

또한 CJK 통합 한자 확장 B에서는 수백 개의 글리프 변형이 실수로 인코딩되었고,[18] ISO/IEC JTC 1/SC 2 보고서에 따르면 6개의 정확한 중복 문자와 2개의 반 중복 문자가 실수로 인코딩되었다.[19]

4. 1. U+4039 문자

유니코드 버전 5.0까지 U+4039(䀹)에는 夾(협)이 들어간 한자와 㚒(섬)이 들어간 한자가 통합되어 있었다.[16] 그러나 두 글자는 훈과 음이 모두 다른 한자로, 사실 통합되어서는 안 될 한자였다.[38]

U+4039의 분리 제안이 받아들여져 유니코드 5.1에서 U+9FC3 (鿃)으로 새로 분리되었다.[16][38]

MS 한글 IME에서는 U+4039를 U+9FC3의 음인 "섬"으로 입력해야 하는 문제가 남아있다.

4. 2. 확장 B 한자 영역의 같은 모양의 글자

확장 한자 B 영역에는 수백 개의 이체자가 수록되어 있으며,[39] 그 중 일부는 유니코드 글자 수록 과정에서의 실수 등으로 인해 중복 수록되었다.[40]

  • U+34A8 㒨 = U+20457 𠑗 : U+20457는 중국(간체권) 한자 U+34A8와 같음, 그러나 중국(번체권)의 글자 U+34A8와는 모양이 약간 다름.[40][19]
  • U+3DB7 㶷 = U+2420E 𤈎 : 모양이 같은 한자[40][19]
  • U+8641 虁 = U+27144 𧅄 : U+27144는 한국 한자 U+8641와 같음, 그러나 일본, 중국(간체권, 번체권)의 글자 U+8641와는 모양이 약간 다름.[40][19]
  • U+204F2 𠓲 = U+23515 𣔕 : 모양이 같은 한자, 그러나 부수가 다름.[40][19]
  • U+249BC 𤦼 = U+249E9 𤧩 : 모양이 같은 한자[40][19]
  • U+24BD2 𤯒 = U+2A415 𪐕 : 모양이 같은 한자, 그러나 부수가 다름.[40][19]
  • U+26842 𦡂 = U+26866 𦡦 : 모양이 같은 한자[40][19]
  • U+FA23 﨣 = U+27EAF 𧺯 : 모양이 같은 한자 (은 한중일 호환용 한자로 분류되어 있으나 실제로는 통합 한자임.)[40][19]


CJK 통합 한자 확장 B에는 일부 문자가 다른 문자와 잘못 통합된 경우가 있다. U+2017B(𠅻), U+204AF(𠒯) 및 U+24CB2(𤲲)가 그러한 예인데, 처음 두 문자는 중국 본토와 베트남의 글꼴 소스가, 마지막 문자는 중국 본토와 대만의 글꼴 소스가 잘못 통합되었다.[17]

또한 CJK 통합 한자 확장 B에서는 수백 개의 글리프 변형이 실수로 인코딩되었고,[18] ISO/IEC JTC 1/SC 2 보고서에 따르면 6개의 정확한 중복 문자와 2개의 반 중복 문자가 실수로 인코딩되었다.[19]

5. 유니코드 버전별 한중일 통합 한자

유니코드 버전별 한중일 통합 한자
유니코드 버전내용위치개수누계
1.0한중일 통합 한자기본 다국어 평면(BMP, U+4E00부터 U+9FA5)20,90220,902
한중일 호환용 한자에 있지만 실제로는 중복되지 않는 한자기본 다국어 평면1220,914
3.0한중일 통합 한자 확장 A기본 다국어 평면(U+3400부터 U+4DB5)6,58227,496
3.1한중일 통합 한자 확장 B보조 상형 문자 평면(SIP, U+20000부터 U+2A6D6)42,71170,207
4.1HKSCS-2004와 GB 18030-2000에 없었던 ISO 10646 한자기본 다국어 평면(HKSCS에서: U+9FA6부터 U+9FB3, GB 18030에서: U+9FB4부터 U+9FBB)2270,229
5.1일본 한자(U+9FBC~U+9FC2), U+4039의 분리(U+9FC3)기본 다국어 평면870,237
5.2한중일 통합 한자 확장 C보조 상형 문자 평면(SIP, U+2A700부터 U+2B734)4,14974,386
6.0한중일 통합 한자 확장 D보조 상형 문자 평면(SIP, U+2B740부터 U+2B81F)22274,616
8.0한중일 통합 한자 확장 E, 한중일 통합 한자 9가지보조 상형 문자 평면(SIP, U+2B820부터 U+2CEAF), 기본 다국어 평면(BMP, U+9FCD부터 U+9FD5까지)5,78080,397
6.1한중일 통합 한자 1가지기본 다국어 평면174,617
10.0한중일 통합 한자 확장 F, 한중일 통합 한자 21가지보조 상형 문자 평면(SIP, U+2CEB0부터 U+2EBE0), 기본 다국어 평면(BMP, (U+9FD6부터 U+9FEA까지)7,48487,882
11.0한중일 통합 한자 5가지기본 다국어 평면(BMP, U+9FEB부터 U+9FEF까지)587,887
13.0한중일 통합 한자 확장 G, 한중일 통합 한자 13가지, 한중일 통합 한자 확장 A 10가지, 한중일 통합 한자 확장 B 7가지상형 문자 제3 평면(TIP, U+30000부터 U+3134F까지), 기본 다국어 평면(BMP, U+9FF0부터 U+9FFB까지), 기본 다국어 평면(U+4DB6부터 U+4DC6까지), 보조 상형 문자 평면(SIP, U+2A6D7부터 U+2A6DD까지)4,96992,856
14.0한중일 통합 한자 3가지, 한중일 통합 한자 확장 B 2가지, 한중일 통합 한자 확장 C 4가지기본 다국어 평면(BMP, U+9FFC부터 U+9FFF까지), 보조 상형 문자 평면(SIP, U+2A6DE부터 U+2A6DF까지), 보조 상형 문자 평면(SIP, U+2B735부터 U+2B738)992,865
15.0한중일 통합 한자 확장 H, 한중일 통합 한자 확장 C 1가지상형 문자 제3 평면(TIP, U+31350부터 U+323AF까지), 보조 상형 문자 평면(SIP, U+2B739)4,19397,058
15.1한중일 통합 한자 확장 I보조 상형 문자 평면(SIP, U+2EBF0부터 U+2EE5F까지)62297,680



기본 다국어 평면의 일부인 CJK 통합 한자 블록과 CJK 통합 한자 확장 A는 대부분의 CJK 글꼴에서 지원된다. 그러나 일본어 및 한국어 글꼴은 일반적으로 중국어보다 적은 수의 문자(각각 약 13,000자 및 8,000자)를 가지고 있다. 확장 B, C, D는 Vista 이후 Microsoft Windows에 포함된 추가 글꼴인 MingLiU-ExtB, MingLiU_HKSCS-ExtB, PMingLiU-ExtB, SimSun-ExtB에서 지원된다.[21]

6. 기타 CJK 관련 문자 블록

유니코드에는 한중일 통합 한자 외에도 CJK 관련 문자 블록이 존재한다.[20] CJK 부수, 획, 구두점, 기호 및 호환성 문자 등이 포함된다.[20]

CJK 기호 및 구두점 블록의 과 같은 문자는 "CJK 통합 한자"에는 포함되지 않지만, 다른 모든 목적에서는 CJK 문자로 취급된다.[20]

레거시 텍스트 처리 시스템 및 구식 문자 집합과의 호환성을 위해 다음과 같은 네 개의 호환성 문자 블록이 포함되어 있다.


  • CJK 호환성 (3300–33FF)
  • CJK 호환성 양식 (FE30–FE4F)
  • CJK 호환성 한자 (F900–FAFF)
  • CJK 호환성 한자 보충 (2F800–2FA1F)


이 블록들에는 세로 텍스트 레이아웃을 위한 문자 형식과 유니코드가 다른 방식을 통해 처리할 것을 권장하는 서식 있는 텍스트 문자가 포함되어 있어 사용이 권장되지 않는다.

서기소 클러스터(grapheme cluster)에서 한자는 UTF-16에서 가변(16, 32, 48, 64비트)이다.[36]

  • 16비트: 기본 다국어 평면
  • 32비트: 추가 평면, 기본 다국어 평면 + 자형 선택자 (유니코드 블록)/Variation Selectors (Unicode block)영어
  • 48비트: 기본 다국어 평면 + 자형 선택자 보조/Variation Selectors Supplement영어
  • 64비트: 추가 평면 + IVS

7. 원 규격

각 한자 문자에는 적어도 하나의 원본 참조가 있다.[34]

''주: 원본이 업데이트되어도 원본 참조는 업데이트하지 않는다. 업데이트된 원본은 이전 버전에 포함되지 않은 문자를 식별하는 데만 사용할 수 있다.''

참조

[1] 웹사이트 Unicode 16.0 UCD: PropList.txt https://www.unicode.[...] 2024-05-31
[2] 웹사이트 Unicode 16.0 UCD: Unihan: Unihan_IRGSources.txt https://www.unicode.[...] 2024-07-31
[3] 웹사이트 UAX #45: U-source Ideographs https://www.unicode.[...] Unicode Consortium 2024-07-31
[4] 문서 The Unicode Standard 4.0, Appendix A - Han Unification History https://unicode.org/[...]
[5] 웹사이트 The secret life of Unicode http://www-128.ibm.c[...]
[6] 문서 Chapter 11 - East Asian scripts https://unicode.org/[...] The Unicode standard, 4.0
[7] 웹사이트 Ideographic Variation Database https://www.unicode.[...] 2022-09-13
[8] 웹사이트 IVD Stats https://www.unicode.[...] 2022-09-13
[9] 문서 PRI 108: Combined registration of the Adobe Japan1 collection and of sequences in that collection https://www.unicode.[...]
[10] 웹사이트 Unihan_IRGSources.txt (from Unihan.zip) https://www.unicode.[...] 2023-07-15
[11] 웹사이트 UAX #38: Unicode Han Database (Unihan) https://www.unicode.[...] Unicode Consortium 2024-07-31
[12] 서적 CJKV information processing https://www.worldcat[...] O'Reilly Media, Inc 2009
[13] 웹사이트 Unicode 13.0.0 http://www.unicode.o[...] 2020-03-10
[14] 웹사이트 Unicode 15.0.0 http://www.unicode.o[...] 2022-09-13
[15] 웹사이트 Unicode 15.1.0 https://www.unicode.[...] 2023-09-12
[16] 문서 proposal of disunification of U+4039 http://std.dkuug.dk/[...]
[17] 문서 Comments on four error glyphs on CJK Unified Ideographs Ext B & E. https://www.unicode.[...]
[18] 웹사이트 IRGN1155 Possible Duplicates https://drive.google[...]
[19] 웹사이트 Defect Report on Duplicate Encoded CJK Forms http://std.dkuug.dk/[...] ISO/IEC JTC1/SC2/WG2 2003-10-06
[20] 간행물 GB/T 15835-2011《出版物上数字用法》 https://journals.uss[...] China Guojia Biaozhun
[21] 서적 CJKV Information Processing https://books.google[...] O'Reilly 2009
[22] 문서 universal multiple-octet coded character set
[23] 문서 CJK comptatibility ideograph
[24] 문서 Han character collection
[25] 문서 Joe Becker
[26] 문서 Lee Collins
[27] 문서 vertical supplementation
[28] 웹사이트 Editorial corrigenda on CJK compatibility ideographs, and other items http://anubis.dkuug.[...] 1998-11-30
[29] 문서 internal supplementation
[30] 문서 horizontal supplementation
[31] 웹사이트 CJK Unified Ideographs Extension J https://www.unicode.[...]
[32] 문서 https://www.unicode.[...]
[33] 문서 https://www.unicode.[...]
[34] 문서 JIS X 0221:2014 国際符号化文字集合(UCS) http://kikakurui.com[...]
[35] 문서 JKは今昔文字鏡である。 https://twitter.com/[...]
[36] 간행물 経済産業省 改元を目前に今すぐ実施すべき準備、対応とは 13ページ https://www.meti.go.[...] 経済産業省
[37] 웹사이트 IPAmj明朝フォント符号化の状況 https://mojikiban.ip[...]
[38] 논문 proposal of disunification of U+4039 http://std.dkuug.dk/[...] 2011-09-16
[39] 웹인용 unifiable glyph variants http://www.cse.cuhk.[...] 2017-04-07
[40] 웹인용 Defect Report on Duplicate Encoded CJK Forms http://std.dkuug.dk/[...] ISO/IEC JTC1/SC2/WG2 2003-10-06



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com