유니코드 영역

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

유니코드 영역은 문자를 효율적으로 관리하고 확장하기 위해 사용되는 개념으로, 각 문자는 특정 블록에 할당된다. 유니코드 블록은 겹치지 않으며, 시작 코드 포인트와 크기는 16의 배수이다. 각 블록은 고유한 이름을 가지며, 모든 코드 포인트는 "Block" 속성을 갖는다. 각 유니코드 포인트는 일반 범주와 스크립트 속성을 가지며, 이는 블록과 독립적이다. 유니코드 16.0은 338개의 블록을 정의하며, 한글 관련 블록을 포함한 전체 유니코드 영역 목록이 존재한다. 유니코드 안정성 정책에 따라 문자는 이동하거나 제거될 수 없으며, 유니코드 블록 목록은 갱신 시점에 따라 차이가 있을 수 있다. 유니코드는 한국어 정보 처리를 위한 완전성, 국제 표준과의 호환성, 다국어 환경 지원을 제공한다.

유니코드 영역
유니코드 영역 정보
이름유니코드 영역
설명유니코드 코드 공간의 연속된 코드 포인트 범위
범위U+0000부터 U+10FFFF까지
총 코드 포인트 수1,114,112 (16진수: 110000)
할당된 코드 포인트 수변화
미할당 코드 포인트 수변화
유니코드 표준
버전유니코드 표준의 특정 버전에 정의됨
문자특정 문자 집합을 나타냄
스크립트특정 스크립트 또는 스크립트 그룹에 속하는 문자 포함
일반 범주영역 내 문자들의 일반적인 속성 (예: 대문자, 숫자, 구두점)
사용
문자 인코딩영역 내 문자를 컴퓨터에서 표현하는 방식 (예: UTF-8, UTF-16)
정렬영역 내 문자를 정렬하는 규칙
렌더링영역 내 문자를 화면이나 인쇄물에 표시하는 방식
보충 영역 A 개인 사용 영역
시작U+F0000
U+FFFFD
코드 포인트 수65,534
약칭PUA-A
보충 영역 B 개인 사용 영역
시작U+100000
U+10FFFD
코드 포인트 수65,534
약칭PUA-B
추가 정보
관련 문서유니코드
유니코드 문자 목록
기본 다국어 평면
보충 다국어 평면
보충 특수 목적 평면
개인 사용 영역
📚 더 읽어볼만한 페이지
  • 유니코드에 관한 - UTF-8
  • 유니코드에 관한 - UTF-1
    UTF-1은 유니코드 초기 버전을 인코딩하기 위해 1992년에 설계된 가변 길이 문자 인코딩 방식으로, ASCII 호환성을 유지하고 ISO 2022 및 MIME과의 호환성을 고려했지만, "모듈로 190" 산술을 사용하는 특징과 현대 유니코드 표준과의 차이점을 가진다.
  • 유니코드 - 이모지
    이모지는 1999년 NTT 도코모에서 처음 도입된 그림 문자로, 유니코드 표준 제정 후 전 세계적으로 확산되어 다양한 언어적 기능을 수행하며 대중문화에 영향을 미치지만, 플랫폼별 표현 방식 차이와 의미 해석 논란도 존재한다.
  • 유니코드 - 국제 음성 기호
    국제 음성 기호는 국제 음성 협회가 개발한 언어의 음성 표기 문자 기호 체계로, 라틴 문자를 기반으로 자음, 모음, 초분절 기호 등을 포함하여 모든 언어의 음성을 정확하게 표기하는 것을 목표로 한다.
  • 언어에 관한 - 네팔어
    네팔어는 데바나가리 문자로 표기되며, 산스크리트어와 프라크리트어의 영향을 받았으며, 10세기에서 14세기 사이에 나타나, 20세기 이후 표준화 과정을 거쳐 현대 네팔어로 자리 잡았으며, 인도 내 네팔어 사용자들의 권익 신장에 기여했다.
  • 언어에 관한 - 슬로바키아어
    슬로바키아어는 슬로바키아의 공용어이자 약 500만 명이 사용하는 서슬라브어군 언어로, 라틴 문자 기반의 고유한 문자를 사용하며 체코어와 유사하고 폴란드어 등 다른 슬라브어와도 연관성을 가진다.

2. 유니코드 블록의 개념 및 설계

유니코드는 문자를 효율적으로 관리하고 확장하기 위해 '블록'이라는 개념을 사용한다.

모든 유니코드 블록은 서로 겹치지 않으며(쌍별로 분리), 각 블록의 시작 코드 포인트와 크기는 항상 16의 배수이다. 따라서 16진수 표기법에서 시작(최소) 포인트는 U+xxx0이고 종료(최대) 포인트는 U+yyyF이다. 블록의 크기는 최소 16개에서 최대 65,536개의 코드 포인트를 포함할 수 있다.

할당된 모든 코드 포인트는 "Block" 속성을 가지며, 그 값은 해당 포인트를 소유하는 고유한 블록의 이름을 지정하는 문자열이다. 블록에는 할당되지 않은 코드 포인트도 포함될 수 있으며, 이는 향후 추가를 위해 예약되어 있다.

2.1. 블록의 정의

유니코드 블록은 고유한 이름으로 식별되며, 이는 ASCII 문자만 사용하고 일반적으로 기호의 특성을 설명하며, 영어로 "Tibetan" 또는 "Supplemental Arrows-A"와 같다. 블록 이름을 비교할 때는 대소문자, 공백, 하이픈 및 밑줄을 무시한다.

블록은 쌍별로 분리되어 겹치지 않는다. 각 블록의 시작 코드 포인트와 크기(코드 포인트 수)는 항상 16의 배수이다. 따라서 16진수 표기법에서 시작(최소) 포인트는 U+xxx0이고 종료(최대) 포인트는 U+yyyF이며, 여기서 xxxyyy는 3개 이상의 16진수 숫자이다. 블록의 크기는 최소 16에서 최대 65,536 코드 포인트까지 다양할 수 있다.

할당된 모든 코드 포인트는 "Block"이라는 글리프 속성을 가지며, 그 값은 해당 포인트를 소유하는 고유한 블록의 이름을 지정하는 문자열이다. 그러나 블록에는 할당되지 않은 코드 포인트도 포함될 수 있으며, 일반적으로 "논리적으로" 해당 블록에 속해야 하는 문자의 향후 추가를 위해 예약되어 있다. 할당되지 않은 평면 4–13과 같이 이름이 지정된 블록에 속하지 않는 코드 포인트는 block="No_Block" 값을 갖는다.

특정 유니코드 블록에 속한다고 해서 해당 블록에 포함되거나 포함될 것으로 예상되는 문자의 특정 속성이 보장되는 것은 아니다. 문자의 정체성은 유니코드 문자 데이터베이스에 명시된 속성에 의해 결정된다. 예를 들어, 32개의 비문자 코드 포인트 U+FDD0..U+FDEF의 연속 범위는 아랍어 표현 형식-A 블록의 다른 문자와 공통적인 속성을 공유하지 않는다. 즉, 아랍어 스크립트 문자 또는 "오른쪽에서 왼쪽으로의 비문자"가 아니며, 아랍어 호환성 문자가 더 이상 인코딩되지 않기로 합의되었으므로 이 블록에 채우기 문자로 할당된다.

2.2. 블록의 구조적 특징

모든 유니코드 블록은 서로 겹치지 않으며(쌍별로 분리), 각 블록의 시작 코드 포인트와 크기는 항상 16의 배수이다. 따라서 16진수 표기법에서 시작(최소) 포인트는 U+xxx0이고 종료(최대) 포인트는 U+yyyF이다. 블록의 크기는 최소 16개에서 최대 65,536개의 코드 포인트를 포함할 수 있다.

할당된 모든 코드 포인트는 "Block" 속성을 가지며, 그 값은 해당 포인트를 소유하는 고유한 블록의 이름을 지정하는 문자열이다. 블록에는 할당되지 않은 코드 포인트도 포함될 수 있으며, 이는 향후 추가를 위해 예약되어 있다.

2.3. 블록과 문자 속성

3. 유니코드 일반 범주 및 스크립트 속성

각 유니코드 포인트는 해당 기호가 시스템에 포함된 언어 또는 응용 프로그램에서의 역할을 설명하려는 "일반 범주"라는 속성을 갖는다. 일반 범주의 예로는 "Lu"(대문자), "Nd"(10진수 숫자), "Pi"(시작 따옴표 구두점) 및 "Mn"(비간격 표시, 즉, 앞선 글리프에 대한 분음 부호)가 있다. 이 구분은 코드 블록과 완전히 독립적이다. 주어진 일반 범주를 가진 코드 포인트는 일반적으로 여러 블록에 걸쳐 있으며, 각 블록 내에서도 연속적일 필요가 없다.

각 코드 포인트는 또한 해당 코드 포인트가 어떤 스크립트를 위해 사용되는지, 또는 여러 스크립트 시스템에서 사용되는지를 지정하는 스크립트 속성을 가지고 있다. 이것 또한 블록과 독립적이다.

유니코드 시스템에 대한 설명에서 블록은 기타 기호 블록의 "체스 기호"와 같이 더 구체적인 하위 그룹으로 세분될 수 있다(별도의 체스 기호 블록과 혼동하지 마십시오). 이러한 하위 그룹은 유니코드 컨소시엄에서 사용되는 기술적 의미의 "블록"이 아니며, 사용자의 편의를 위해 이름이 지정되었다.

3.1. 일반 범주

각 유니코드 포인트는 해당 기호가 시스템에 포함된 언어 또는 응용 프로그램에서의 역할을 설명하려는 "일반 범주"라는 속성을 갖는다. 일반 범주의 예로는 "Lu"(대문자), "Nd"(10진수 숫자), "Pi"(시작 따옴표 구두점) 및 "Mn"(비간격 표시, 즉, 앞선 글리프에 대한 분음 부호)가 있다. 이 구분은 코드 블록과 완전히 독립적이다. 주어진 일반 범주를 가진 코드 포인트는 일반적으로 여러 블록에 걸쳐 있으며, 각 블록 내에서도 연속적일 필요가 없다.

3.2. 스크립트 속성

각 코드 포인트는 어떤 스크립트를 위해 사용되는지, 또는 여러 스크립트 시스템에서 사용되는지를 지정하는 스크립트 속성을 가지고 있다. 스크립트 속성은 문자가 속한 문자 체계(예: 한글, 라틴 문자, 아랍 문자 등)를 나타낸다. 스크립트 속성 역시 블록과 독립적이다.

4. 전체 유니코드 영역 목록

유니코드 버전 16.0는 338개의 블록을 정의하며, 각 블록은 평면별로 분류된다.

{| class="wikitable sortable collapsible uncollapsed" style="width:100%; margin:0;"
! style="text-align:center; border:1px solid grey; margin-right:0.25em;" colspan=6 | 유니코드 영역의 목록
|-
! width="10%" | 평면
! width="15%" | 영역 범위
! width="30%" | 영역 이름
! width="10%" | 코드 포인트
! width="10%" | 할당된 글자
! width="25%" | 문자
|-
| {{hs || U+0000..U+007F || Basic Latin (로마자 기본) || 128 || 128 || 로마자 (52자), 일반 (76자)
|-
| 0 BMP || U+0080..U+00FF || Latin-1 Supplement (라틴-1 보충) || 128 || 128 || 로마자 (64자), 일반 (64자)
|-
| 0 BMP || U+0100..U+017F || Latin Extended-A (로마자 확장 A) || 128 || 128 || 로마자
|-
| 0 BMP || U+0180..U+024F || Latin Extended-B (로마자 확장 B) || 208 || 208 || 로마자
|-
| 0 BMP || U+0250..U+02AF || IPA Extensions (IPA 확장) || 96 || 96 || 로마자
|-
| 0 BMP || U+02B0..U+02FF || Spacing Modifier Letters (조정 문자) || 80 || 80 || 주음부호 (2자), 로마자 (14자), 일반 (64자)
|-
| 0 BMP || U+0300..U+036F || Combining Diacritical Marks (조합용 발음 구별 부호) || 112 || 112 || 상속
|-
| 0 BMP || U+0370..U+03FF || Greek and Coptic (그리스와 콥트 문자) || 144 || 135 || 그리스 (14자), 콥트 (117자), 일반 (4자)
|-
| 0 BMP || U+0400..U+04FF || Cyrillic (키릴 문자) || 256 || 256 || 키릴 (254자), 상속 (2자)
|-
| 0 BMP || U+0500..U+052F || Cyrillic Supplement (키릴 문자 보충) || 48 || 48 || 키릴
|-
| 0 BMP || U+0530..U+058F || Armenian (아르메니아 문자) || 96 || 89 || 아르메니아 (88자), 일반 (1자)
|-
| 0 BMP || U+0590..U+05FF || Hebrew (히브리 문자) || 112 || 87 || 히브리
|-
| 0 BMP || U+0600..U+06FF || Arabic (아랍 문자) || 256 || 255 || 아랍 (226자), 일반 (17자), 상속 (12자)
|-
| 0 BMP || U+0700..U+074F || Syriac || 80 || 77 || 시리아
|-
| 0 BMP || U+0750..U+077F || Arabic Supplement || 48 || 48 || 아랍 문자
|-
| 0 BMP || U+0780..U+07BF || Thaana || 64 || 50 || 타나
|-
| 0 BMP || U+07C0..U+07FF || NKo || 64 || 59 || 응코
|-
| 0 BMP || U+0800..U+083F || Samaritan || 64 || 61 || 사마리아
|-
| 0 BMP || U+0840..U+085F || Mandaic || 32 || 29 || 만다이아
|-
| 0 BMP || U+0860..U+086F || Syriac Supplement || 16 || 11 || 시리아
|-
| 0 BMP || U+08A0..U+08FF || Arabic Extended-A || 96 || 73 || 아랍 (72자), 일반 (1자)
|-
| 0 BMP || U+0900..U+097F || Devanagari || 128 || 128 || 데바나가리 (124자), 일반 (2자), 상속 (2자)
|-
| 0 BMP || U+0980..U+09FF || Bengali || 128 || 95 || 벵골
|-
| 0 BMP || U+0A00..U+0A7F || Gurmukhi || 128 || 79 || 구르무키
|-
| 0 BMP || U+0A80..U+0AFF || Gujarati || 128 || 91 || 구자라트
|-
| 0 BMP || U+0B00..U+0B7F || Oriya || 128 || 90 || 오리야
|-
| 0 BMP || U+0B80..U+0BFF || Tamil || 128 || 72 || 타밀
|-
| 0 BMP || U+0C00..U+0C7F || Telugu || 128 || 96 || 텔루구
|-
| 0 BMP || U+0C80..U+0CFF || Kannada || 128 || 88 || 칸나다
|-
| 0 BMP || U+0D00..U+0D7F || Malayalam || 128 || 117 || 말라얄람
|-
| 0 BMP || U+0D80..U+0DFF || Sinhala || 128 || 90 || 싱할라
|-
| 0 BMP || U+0E00..U+0E7F || Thai || 128 || 87 || 타이 (86자), 일반 (1자)
|-
| 0 BMP || U+0E80..U+0EFF || Lao || 128 || 67 || 라오
|-
| 0 BMP || U+0F00..U+0FFF || Tibetan || 256 || 211 || 티베트 (207자), 일반 (4자)
|-
| 0 BMP || U+1000..U+109F || Myanmar || 160 || 160 || 미얀마
|-
| 0 BMP || U+10A0..U+10FF || Georgian || 96 || 88 || 조지아 (87자), 일반 (1자)
|-
| 0 BMP || U+1100..U+11FF || Hangul Jamo || 256 || 256 || 한글
|-
| 0 BMP || U+1200..U+137F || Ethiopic || 384 || 358 || 에티오피아
|-
| 0 BMP || U+1380..U+139F || Ethiopic Supplement || 32 || 26 || 에티오피아
|-
| 0 BMP || U+13A0..U+13FF || Cherokee || 96 || 92 || 체로키
|-
| 0 BMP || U+1400..U+167F || Unified Canadian Aboriginal Syllabics || 640 || 640 || 캐나다 원주민
|-
| 0 BMP || U+1680..U+169F || Ogham || 32 || 29 || 오검
|-
| 0 BMP || U+16A0..U+16FF || Runic || 96 || 89 || (86자), 일반 (3자)
|-
| 0 BMP || U+1700..U+171F || Tagalog || 32 || 20 || 타갈로그
|-
| 0 BMP || U+1720..U+173F || Hanunoo || 32 || 23 || 하누누 (21자), 일반 (2자)
|-
| 0 BMP || U+1740..U+175F || Buhid || 32 || 20 || 부히드
|-
| 0 BMP || U+1760..U+177F || Tagbanwa || 32 || 18 || 타그반와
|-
| 0 BMP || U+1780..U+17FF || Khmer || 128 || 114 || 크메르
|-
| 0 BMP || U+1800..U+18AF || Mongolian || 176 || 156 || 몽골 (153자), 일반 (3자)
|-
| 0 BMP || U+18B0..U+18FF || Unified Canadian Aboriginal Syllabics Extended || 80 || 70 || 캐나다 원주민
|-
| 0 BMP || U+1900..U+194F || Limbu || 80 || 68 || 림부
|-
| 0 BMP || U+1950..U+197F || Tai Le || 48 || 35 || 타이 러
|-
| 0 BMP || U+1980..U+19DF || New Tai Lue || 96 || 83 || 신 타이 르
|-
| 0 BMP || U+19E0..U+19FF || Khmer Symbols || 32 || 32 || 크메르
|-
| 0 BMP || U+1A00..U+1A1F || Buginese || 32 || 30 || 부기
|-
| 0 BMP || U+1A20..U+1AAF || Tai Tham || 144 || 127 || 타이 탐
|-
| 0 BMP || U+1AB0..U+1AFF || Combining Diacritical Marks Extended || 80 || 15 || 상속
|-
| 0 BMP || U+1B00..U+1B7F || Balinese || 128 || 121 || 발리
|-
| 0 BMP || U+1B80..U+1BBF || Sundanese || 64 || 64 || 순다
|-
| 0 BMP || U+1BC0..U+1BFF || Batak || 64 || 56 || 바타크
|-
| 0 BMP || U+1C00..U+1C4F || Lepcha || 80 || 74 || 렙차
|-
| 0 BMP || U+1C50..U+1C7F || Ol Chiki || 48 || 48 || 올치키
|-
| 0 BMP || U+1C80..U+1C8F || Cyrillic Extended-C || 16 || 9 || 키릴
|-
| 0 BMP || U+1CC0..U+1CCF || Sundanese Supplement || 16 || 8 || 순다
|-
| 0 BMP || U+1CD0..U+1CFF || Vedic Extensions || 48 || 42 || 일반 (54자), 상속 (27자)
|-
| 0 BMP || U+1D00..U+1D7F || Phonetic Extensions || 128 || 128 || 키릴 (2자), 그리스 (15자), 로마자 (111자)
|-
| 0 BMP || U+1D80..U+1DBF || Phonetic Extensions Supplement || 64 || 64 || 그리스 (1자), 로마자 (63자)
|-
| 0 BMP || U+1DC0..U+1DFF || Combining Diacritical Marks Supplement || 64 || 63 || 상속
|-
| 0 BMP || U+1E00..U+1EFF || Latin Extended Additional || 256 || 256 || 로마자
|-
| 0 BMP || U+1F00..U+1FFF || Greek Extended || 256 || 233 || 그리스
|-
| 0 BMP || U+2000..U+206F || General Punctuation || 112 || 111 || 일반 (109자), 상속 (2자)
|-
| 0 BMP || U+2070..U+209F || Superscripts and Subscripts || 48 || 42 || 로마자 (15자), 일반 (27자)
|-
| 0 BMP || U+20A0..U+20CF || Currency Symbols || 48 || 32 || 일반
|-
| 0 BMP || U+20D0..U+20FF || Combining Diacritical Marks for Symbols || 48 || 33 || 상속
|-
| 0 BMP || U+2100..U+214F || Letterlike Symbols || 80 || 80 || 그리스 (1자), 로마자 (4자), 일반 (75자)
|-
| 0 BMP || U+2150..U+218F || Number Forms || 64 || 60 || 로마자 (41자), 일반 (19자)
|-
| 0 BMP || U+2190..U+21FF || Arrows || 112 || 112 || 일반
|-
| 0 BMP || U+2200..U+22FF || Mathematical Operators || 256 || 256 || 일반
|-
| 0 BMP || U+2300..U+23FF || Miscellaneous Technical || 256 || 256 || 일반
|-
| 0 BMP || U+2400..U+243F || Control Pictures || 64 || 39 || 일반
|-
| 0 BMP || U+2440..U+245F || Optical Character Recognition || 32 || 11 || 일반
|-
| 0 BMP || U+2460..U+24FF || Enclosed Alphanumerics || 160 || 160 || 일반
|-
| 0 BMP || U+2500..U+257F || Box Drawing || 128 || 128 || 일반
|-
| 0 BMP || U+2580..U+259F || Block Elements || 32 || 32 || 일반
|-
| 0 BMP || U+25A0..U+25FF || Geometric Shapes || 96 || 96 || 일반
|-
| 0 BMP || U+2600..U+26FF || Miscellaneous Symbols || 256 || 256 || 일반
|-
| 0 BMP || U+2700..U+27BF || Dingbats || 192 || 192 || 일반
|-
| 0 BMP || U+27C0..U+27EF || Miscellaneous Mathematical Symbols-A || 48 || 48 || 일반
|-
| 0 BMP || U+27F0..U+27FF || Supplemental Arrows-A || 16 || 16 || 일반
|-
| 0 BMP || U+2800..U+28FF || Braille Patterns || 256 || 256 || 점자
|-
| 0 BMP || U+2900..U+297F || Supplemental Arrows-B || 128 || 128 || 일반
|-
| 0 BMP || U+2980..U+29FF || Miscellaneous Mathematical Symbols-B || 128 || 128 || 일반
|-
| 0 BMP || U+2A00..U+2AFF || Supplemental Mathematical Operators || 256 || 256 || 일반
|-
| 0 BMP || U+2B00..U+2BFF || Miscellaneous Symbols and Arrows || 256 || 207 || 일반
|-
| 0 BMP || U+2C00..U+2C5F || Glagolitic || 96 || 94 || 글라골
|-
| 0 BMP || U+2C60..U+2C7F || Latin Extended-C || 32 || 32 || 로마자
|-
| 0 BMP || U+2C80..U+2CFF || Coptic || 128 || 123 || 콥트
|-
| 0 BMP || U+2D00..U+2D2F || Georgian Supplement || 48 || 40 || 조지아
|-
| 0 BMP || U+2D30..U+2D7F || Tifinagh || 80 || 59 || 티피나그
|-
| 0 BMP || U+2D80..U+2DDF || Ethiopic Extended || 96 || 79 || 에티오피아
|-
| 0 BMP || U+2DE0..U+2DFF || Cyrillic Extended-A || 32 || 32 || 키릴
|-
| 0 BMP || U+2E00..U+2E7F || Supplemental Punctuation || 128 || 74 || 일반
|-
| 0 BMP || U+2E80..U+2EFF || CJK Radicals Supplement || 128 || 115 || 한자
|-
| 0 BMP || U+2F00..U+2FDF || Kangxi Radicals || 224 || 214 || 한자
|-
| 0 BMP || U+2FF0..U+2FFF || Ideographic Description Characters || 16 || 12 || 일반
|-
| 0 BMP || U+3000..U+303F || CJK Symbols and Punctuation || 64 || 64 || 한자 (15자), 한글 (2자), 일반 (43자), 상속 (4자)
|-
| 0 BMP || U+3040..U+309F || Hiragana || 96 || 93 || 히라가나 (89자), 일반 (2자), 상속 (2자)
|-
| 0 BMP || U+30A0..U+30FF || Katakana || 96 || 96 || 가타카나 (93자), 상속 (3자)
|-
| 0 BMP || U+3100..U+312F || Bopomofo || 48 || 42 || 주음부호
|-
| 0 BMP || U+3130..U+318F || Hangul Compatibility Jamo || 96 || 94 || 한글
|-
| 0 BMP || U+3190..U+319F || Kanbun || 16 || 16 || 일반
|-
| 0 BMP || U+31A0..U+31BF || Bopomofo Extended || 32 || 27 || 주음부호
|-
| 0 BMP || U+31C0..U+31EF || CJK Strokes || 48 || 36 || 일반
|-
| 0 BMP || U+31F0..U+31FF || Katakana Phonetic Extensions || 16 || 16 || 가타카나
|-
| 0 BMP || U+3200..U+32FF || Enclosed CJK Letters and Months || 256 || 254 || 한글 (62자), 가타카나 (47자), 일반 (145자)
|-
| 0 BMP || U+3300..U+33FF || CJK Compatibility || 256 || 256 || 가타카나 (88자), 일반 (168자)
|-
| 0 BMP || U+3400..U+4DBF || CJK Unified Ideographs Extension A
(한중일 통합 한자 확장 A) || 6,592 || 6,582 || 한자
|-
| 0 BMP || U+4DC0..U+4DFF || Yijing Hexagram Symbols || 64 || 64 || [[역경상

4.1. 한글 관련 유니코드 영역

5. 이전/이동된 블록

유니코드 안정성 정책은 문자가 한번 할당되면 폐기될 수 있을지라도 이동하거나 제거할 수 없도록 요구한다. 이는 유니코드 2.0 및 그 이후의 모든 버전에 적용된다.

유니코드 2.0 이전에는 다음과 같은 블록들이 이동되었다.

👆
좌우로 밀어서 보기
유니코드 2.0 이전의 이전 유니코드 블록
블록 범위과거
블록 이름
추가된 버전제거된 버전현재 점유 범위블록에 의해 대체됨코드 포인트할당된 문자스크립트
U+1000..U+105F티베트 문자1.0.01.0.1미얀마 문자티베트 문자9671티베트 문자
U+3400..U+3D2D한글1.0.02.0CJK 통합 한자 확장 A한글 음절23502350한글
U+3D2E..U+44B7한글 보충-A1.12.019301930
U+44B8..U+4DFF한글 보충-BCJK 통합 한자 확장 A 및 주역 괘 상징23762376

6. 유니코드 블록 목록의 변화 (일본어판 참고)

유니코드 컨소시엄의 자료와 비교했을 때, 일본어 위키백과의 유니코드 블록 목록은 갱신 시점의 차이로 인해 일부 차이가 존재한다.

👆
좌우로 밀어서 보기
본 목록과 유니코드 컨소시엄 자료의 차이점
유니코드 범위컨소시엄 자료일본어 위키백과비고
U+0860..U+086FSyriac Supplement시리아 문자 확장16
U+1000..U+109FMyanmar미얀마 문자160
U+18B0..U+18FFUnified Canadian Aboriginal Syllabics Extended통합 캐나다 원주민 문자 확장80
U+1950..U+197FTai Le타이 레 문자48
U+1980..U+19DFNew Tai Lue신 타이 루 문자96
U+A9E0..U+A9FFMyanmar Extended-B미얀마 문자 확장 B32
U+AA60..U+AA7FMyanmar Extended-A미얀마 문자 확장 A
U+AA80..U+AADFTai Viet타이 비엣 문자96
U+10280..U+1029FLycian리키아 문자32
U+10920..U+1093FLydian리디아 문자
U+10B60..U+10B7FInscriptional Pahlavi비문 파흘라비 문자
U+10B80..U+10BAFPsalter Pahlavi시편 파흘라비 문자48
U+10E60..U+10E7FRumi Numeral Symbols루미 숫자 기호32
U+111E0..U+111FFSinhala Archaic Numbers옛 싱할라 숫자
U+11400..U+1147FNewa네와 문자128
U+11B00..U+11B5FDevanagari Extended-A데바나가리 문자 확장 A96
U+13430..U+1343FEgyptian Hieroglyph Format Controls이집트 상형 문자 서식 제어 기호16
U+13430..U+1345F48 # 블록이 확장됨 (16 → 48).
U+16A70..U+16ACFTangsa탕사 문자96
U+1E100..U+1E14FNyiakeng Puachue Hmong냐켕 푸아추 흐몽 문자80
U+1E290..U+1E2BFToto토토48

7. 유니코드와 한국어 정보 처리

7.1. 한글 표현의 완전성

7.2. 국제 표준과의 호환성

7.3. 다국어 환경 지원

8. 결론