JIS X 0208
1. 개요
JIS X 0208은 일본 산업 표준(JIS)으로, 정보 교환을 위한 6,800개 이상의 문자를 포함하는 문자 집합이다. 1978년에 처음 제정되었으며, 여러 차례 개정을 거쳐 1997년 최종 개정판이 발표되었다. 이 표준은 한자, 히라가나, 가타카나, 로마자, 숫자, 기호 등을 포함하며, 7비트 또는 8비트 2바이트 인코딩 방식을 사용한다. JIS X 0208은 다양한 운영체제 및 환경에서 구현되었으며, 유니코드의 한자 통합에도 영향을 미쳤다. 하지만, 표준 제정 과정에서 출처가 불분명한 ‘유령 문자’가 포함되었고, 인코딩 방식에 따라 문자 매핑이 일치하지 않는 경우도 있다.
| 이름 | 7비트 및 8비트의 2바이트 정보 교환용 부호화 한자 집합 |
|---|---|
| 로마자 표기 | Nana-Bitto Oyobi Hachi-Bitto no Ni-Baito Jōhō Kōkan'yō Fugōka Kanji Shūgō |
| 다른 이름 | JIS C 6226 |
| 표준 | JIS X 0208:1978 ~ 1997 |
| 언어 지원 | 일본어 영어 러시아어 불가리아어 |
| 부분적 지원 | 그리스어 중국어 |
| 인코딩 | Shift JIS ("SJIS") ISO-2022-JP ("JIS") EUC-JP ("UJIS") |
| 확장 집합 | ARIB STD B24 한자 NEC PC98 DBCS JIS X 0213 평면 1 |
| 이전 표준 | JIS X 0201 |
| 다음 표준 | JIS X 0213 |
| 관련 표준 | 관련 보충: 다른 ISO 2022 CJK DBCS: |
| 분류 | ISO 2022 DBCS CJK 인코딩 |
-
JIS 표준 -
JIS X 0212
JIS X 0212는 1990년 일본 규격 협회에서 발표한 정보 교환용 한자 부호 표준으로, JIS X 0208 문자 집합의 확장 및 적용 범위 부족을 해결하기 위해 6,067개의 문자를 지정하였으며, 유니코드 제정 시 원규격 중 하나로 사용되었으나 현재는 사실상 사장되었고 JIS X 0213에 통합되었다. -
JIS 표준 -
JIS X 0201
JIS X 0201은 7비트 및 8비트 문자 집합을 포함하는 일본의 문자 인코딩 방식으로, ASCII 기반 로마자, 가타카나, 문장 부호로 구성되며, ASCII의 일부 문자가 엔화 기호나 윗줄로 대체된 특징을 가진다. -
일본어 컴퓨팅 -
Shift JIS
Shift JIS는 JIS X 0201을 기반으로 JIS X 0208을 할당하여 일본어 문자를 인코딩하는 방식으로, 이스케이프 시퀀스 없이 문자 집합을 혼용하여 파일 크기를 절약하고 처리 시간을 단축하며, MS-DOS에서 "MS 한자 코드"로 채택된 후 사실상 표준으로 자리 잡았다. -
일본어 컴퓨팅 -
JIS X 0212
JIS X 0212는 1990년 일본 규격 협회에서 발표한 정보 교환용 한자 부호 표준으로, JIS X 0208 문자 집합의 확장 및 적용 범위 부족을 해결하기 위해 6,067개의 문자를 지정하였으며, 유니코드 제정 시 원규격 중 하나로 사용되었으나 현재는 사실상 사장되었고 JIS X 0213에 통합되었다. -
문자 집합 -
점자
점자는 루이 브라이유가 개발한 시각 장애인용 촉각 문자 체계로, 6점 점자를 사용하여 133개 이상의 언어에 적용되었으며, 교육, 정보 접근, 사회 참여에 필수적인 역할을 수행하지만 문해력 저하와 교육의 어려움이라는 과제도 안고 있다. -
문자 집합 -
ISO/IEC 646
ISO/IEC 646는 ASCII 기반의 7비트 문자 인코딩 표준으로, 국가별 변형이 존재했으나, 최종 개정판은 ASCII와 호환되도록 정의되었고, 현재는 ITU-T 권고 T.50 IRA가 현행 표준으로 유지되고 있다.
2. 구성
JIS X 0208은 94×94 문자 집합이며, 각 행들은 다음과 같이 구성되어 있다.
* 0x21 ~ 0x28: 한자가 아닌 문자들 (문장 부호, 그림 문자, 히라가나, 가타카나, 그리스 문자, 키릴 문자 등)
* 0x30 ~ 0x4F: 제1수준 한자 영역 (발음 순서대로, 가장 많이 사용되는 2965자를 추림)
* 0x50 ~ 0x74: 제2수준 한자 영역 (발음 순서대로, 그 다음 많이 사용되는 3390자를 추림)
본래 JIS X 0208에는 사용자 정의 영역이 없지만, 몇몇 구현들은 이를 무시하고 0x75행 이후의 빈 영역을 확장해서 사용하기도 한다. 예를 들어 CP932에서는 행 0x79부터 0x7C까지에 일부 문자를 더 추가해서 쓴다.
JIS X 0208에 수록된 한자 중 20여 자는 실제로 사용되지 않는 문자로 일명 ‘유령 문자(幽霊文字일본어)’라 불린다. 이는 표준을 제정할 때 한자의 명확한 출처를 밝히지 않아서 잘못된 획이 추가되거나 한자의 의미가 잘못 쓰이는 등 일부 오류가 제대로 고쳐지지 않았기 때문에 생긴 것으로, 이후에 나온 표준들은 이런 문제를 피하기 위해 한자의 명확한 출처를 밝히게 되었다.
일부 공급업체는 다른 유니코드 매핑을 이 집합에 사용한다. 예를 들어, 마이크로소프트는 kuten 1-29 (JIS 0x213D)를 U+2015 (수평선)로 매핑하는 반면, 애플(Apple Inc.)은 U+2014 (Em Dash)로 매핑한다. 마찬가지로, 마이크로소프트는 kuten 1-61 (JIS 0x215D)을 U+FF0D (U+002D 하이픈 마이너스의 전각 형태)로 매핑하고, 애플은 U+2212 (마이너스 기호)로 매핑한다. 물결표의 유니코드 매핑도 공급업체마다 다르다.
| 2x | 1-1 IDSP | 1-2 、 | 1-3 。 | 1-4 , | 1-5 . | 1-6 ・ | 1-7 : | 1-8 ; | 1-9 ? | 1-10 ! | 1-11 ゛ | 1-12 ゜ | 1-13 ´ | 1-14 ` | 1-15 ¨ | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 3x | 1-16 ^ | 1-17 ‾ | 1-18 _ | 1-19 ヽ | 1-20 ヾ | 1-21 ゝ | 1-22 ゞ | 1-23 〃 | 1-24 仝 | 1-25 々 | 1-26 〆 | 1-27 〇 | 1-28 ー | 1-29 — | 1-30 ‐ | 1-31 / | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 4x | 1-32 \ | 1-33 〜 | 1-34 ‖ | 1-35 | | 1-36 [[…]]일본어 | 1-37 [[‥]]일본어 | 1-38 ‘ | 1-39 ’ | 1-40 “ | 1-41 ” | 1-42 ( | 1-43 ) | 1-44 〔 | 1-45 〕 | 1-46 [ | ] | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 5x | 1-48 { | 1-49 [[괄호|} | ]]|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 2x | 2-1 ◆ | 2-2 □ | 2-3 ■ | 2-4 △ | 2-5 ▲ | 2-6 ▽ | 2-7 ▼ | 2-8 ※ | 2-9 〒 | 2-10 → | 2-11 ← | 2-12 ↑ | 2-13 ↓ | 2-14 〓 | ||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 3x | 2-26 ∈ | 2-27 ∋ | 2-28 ⊆ | 2-29 ⊇ | 2-30 ⊂ | 2-31 ⊃ | ||||||||||
| 4x | 2-32 ∪ | 2-33 ∩ | 2-42 ∧ | 2-43 ∨ | 2-44 ¬ | 2-45 ⇒ | 2-46 ⇔ | 2-47 ∀ | ||||||||
| 5x | 2-48 ∃ | 2-60 ∠ | 2-61 ⊥ | 2-62 ⌒ | 2-63 ∂ | |||||||||||
| 6x | 2-64 ∇ | 2-65 ≡ | 2-66 ≒ | 2-67 ≪ | 2-68 ≫ | 2-69 [[√]]일본어 | 2-70 [[∽]]일본어 | 2-71 ∝ | 2-72 ∵ | 2-73 ∫ | 2-74 ∬ | |||||
| 7x | 2-82 Å | 2-83 ‰ | 2-84 ♯ | 2-85 ♭ | 2-86 ♪ | 2-87 † | 2-88 ‡ | 2-89 ¶ | 2-94 ◯ |
| 2x | ||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 3x | 3-16 0 | 3-17 1 | 3-18 2 | 3-19 3 | 3-20 4 | 3-21 5 | 3-22 6 | 3-23 7 | 3-24 8 | 3-25 9 | ||||||
| 4x | 3-33 A | 3-34 B | 3-35 C | 3-36 D | 3-37 E | 3-38 F | 3-39 G | 3-40 H | 3-41 I | 3-42 J | 3-43 K | 3-44 L | 3-45 M | 3-46 N | 3-47 O | |
| 5x | 3-48 P | 3-49 Q | 3-50 R | 3-51 S | 3-52 T | 3-53 U | 3-54 V | 3-55 W | 3-56 X | 3-57 Y | 3-58 Z | |||||
| 6x | 3-65 a | 3-66 b | 3-67 c | 3-68 d | 3-69 e | 3-70 f | 3-71 g | 3-72 h | 3-73 i | 3-74 j | 3-75 k | 3-76 l | 3-77 m | 3-78 n | 3-79 o | |
| 7x | 3-80 p | 3-81 q | 3-82 r | 3-83 s | 3-84 t | 3-85 u | 3-86 v | 3-87 w | 3-88 x | 3-89 y | 3-90 z |
| 2x | 4-1 ぁ | 4-2 あ | 4-3 ぃ | 4-4 い | 4-5 ぅ | 4-6 う | 4-7 ぇ | 4-8 え | 4-9 ぉ | 4-10 お | 4-11 か | 4-12 が | 4-13 き | 4-14 ぎ | 4-15 く | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 3x | 4-16 ぐ | 4-17 け | 4-18 げ | 4-19 こ | 4-20 ご | 4-21 さ | 4-22 ざ | 4-23 し | 4-24 じ | 4-25 す | 4-26 ず | 4-27 せ | 4-28 ぜ | 4-29 そ | 4-30 ぞ | 4-31 た |
| 4x | 4-32 だ | 4-33 ち | 4-34 ぢ | 4-35 っ | 4-36 つ | 4-37 づ | 4-38 て | 4-39 で | 4-40 と | 4-41 ど | 4-42 な | 4-43 に | 4-44 ぬ | 4-45 ね | 4-46 の | 4-47 は |
| 5x | 4-48 ば | 4-49 ぱ | 4-50 ひ | 4-51 び | 4-52 ぴ | 4-53 ふ | 4-54 ぶ | 4-55 ぷ | 4-56 へ | 4-57 べ | 4-58 ぺ | 4-59 ほ | 4-60 ぼ | 4-61 ぽ | 4-62 ま | 4-63 み |
| 6x | 4-64 む | 4-65 め | 4-66 も | 4-67 ゃ | 4-68 や | 4-69 ゅ | 4-70 ゆ | 4-71 ょ | 4-72 よ | 4-73 ら | 4-74 り | 4-75 る | 4-76 れ | 4-77 ろ | 4-78 ゎ | 4-79 わ |
| 7x | 4-80 ゐ | 4-81 ゑ | 4-82 を | 4-83 ん |
| 2x | 5-1 ァ | 5-2 ア | 5-3 ィ | 5-4 イ | 5-5 ゥ | 5-6 ウ | 5-7 ェ | 5-8 エ | 5-9 ォ | 5-10 オ | 5-11 カ | 5-12 ガ | 5-13 キ | 5-14 ギ | 5-15 ク | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 3x | 5-16 グ | 5-17 ケ | 5-18 ゲ | 5-19 コ | 5-20 ゴ | 5-21 サ | 5-22 ザ | 5-23 シ | 5-24 ジ | 5-25 ス | 5-26 ズ | 5-27 セ | 5-28 ゼ | 5-29 ソ | 5-30 ゾ | 5-31 タ |
| 4x | 5-32 ダ | 5-33 チ | 5-34 ヂ | 5-35 ッ | 5-36 ツ | 5-37 ヅ | 5-38 テ | 5-39 デ | 5-40 ト | 5-41 ド | 5-42 ナ | 5-43 ニ | 5-44 ヌ | 5-45 ネ | 5-46 ノ | 5-47 ハ |
| 5x | 5-48 バ | 5-49 パ | 5-50 ヒ | 5-51 ビ | 5-52 ピ | 5-53 フ | 5-54 ブ | 5-55 プ | 5-56 ヘ | 5-57 ベ | 5-58 ペ | 5-59 ホ | 5-60 ボ | 5-61 ポ | 5-62 マ | 5-63 ミ |
| 6x | 5-64 ム | 5-65 メ | 5-66 モ | 5-67 ャ | 5-68 ヤ | 5-69 ュ | 5-70 ユ | 5-71 ョ | 5-72 ヨ | 5-73 ラ | 5-74 リ | 5-75 ル | 5-76 レ | 5-77 ロ | 5-78 ヮ | 5-79 ワ |
| 7x | 5-80 ヰ | 5-81 ヱ | 5-82 ヲ | 5-83 ン | 5-84 ヴ | 5-85 ヵ | 5-86 ヶ |
| 2x | 7-1 А | 7-2 Б | 7-3 В | 7-4 Г | 7-5 Д | 7-6 Е | 7-7 Ё | 7-8 Ж | 7-9 З | 7-10 И | 7-11 Й | 7-12 К | 7-13 Л | 7-14 М | 7-15 Н | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 3x | 7-16 О | 7-17 П | 7-18 Р | 7-19 С | 7-20 Т | 7-21 У | 7-22 Ф | 7-23 Х | 7-24 Ц | 7-25 Ч | 7-26 Ш | 7-27 Щ | 7-28 Ъ | 7-29 Ы | 7-30 Ь | 7-31 Э |
| 4x | 7-32 Ю | 7-33 Я | ||||||||||||||
| 5x | 7-49 а | 7-50 б | 7-51 в | 7-52 г | 7-53 д | 7-54 е | 7-55 ё | 7-56 ж | 7-57 з | 7-58 и | 7-59 й | 7-60 к | 7-61 л | 7-62 м | 7-63 н | |
| 6x | 7-64 о | 7-65 п | 7-66 р | 7-67 с | 7-68 т | 7-69 у | 7-70 ф | 7-71 х | 7-72 ц | 7-73 ч | 7-74 ш | 7-75 щ | 7-76 ъ | 7-77 ы | 7-78 ь | 7-79 э |
| 7x | 7-80 ю | 7-81 я |
| 2x | 8-1 │ | 8-2 ─ | 8-3 ┐ | 8-4 ┌ | 8-5 └ | 8-6 ┘ | 8-7 ┤ | 8-8 ┬ | 8-9 ├ | 8-10 ┴ | 8-11 ┼ | 8-12 ━ | 8-13 ┃ | 8-14 ┏ | 8-15 ┓ | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 3x | 8-16 ┗ | 8-17 ┛ | 8-18 ┫ | 8-19 ┳ | 8-20 ┣ | 8-21 ┻ | 8-22 ╋ | 8-23 ┠ | 8-24 ┯ | 8-25 ┨ | 8-26 ┷ | 8-27 ┿ | 8-28 ┝ | 8-29 ┰ | 8-30 ┥ | 8-31 ┷ |
| 4x | 8-32 ╂ | |||||||||||||||
| 5x | ||||||||||||||||
| 6x | ||||||||||||||||
| 7x |
JIS X 0208 표준의 9행부터 15행까지는 비어 있다.
2.1. 유령 문자
JIS X 0208에는 표준 제정 당시 출처가 불분명하여 잘못 포함된 '유령 문자'가 20여 자 존재한다. 이는 표준 제정 과정의 한계를 보여주는 사례로, 이후 표준에서는 이러한 문제를 방지하기 위해 노력하고 있다.
다지마 가즈오는 1979년에 신자원이나 대한화사전에서 찾을 수 없는 63개의 한자를 확인하고, 이러한 한자들이 확실한 출처에서 선택되기를 바란다고 언급했다. 이러한 한자들은 유레이 모지/幽霊文字일본어 또는 유레이 간지/幽霊漢字일본어 등으로 알려지게 되었다.
제4차 규격 원안 작성 위원회는 출처 불명의 한자 문제를 해결하기 위해 조사를 진행했다. 그 결과, 초안 위원회가 "대응 분석 결과"에 크게 의존하여 한자를 수집했으며, "일본 인격 등록 이름 한자" 및 "국가 행정 구역 목록 한자" 목록에서 유래한 한자들이 포함되었음을 확인했다. "일본 인격 등록 이름 한자"의 원본은 존재하지 않았지만, "국가 행정 구역 목록"과 NTT 전화번호부 데이터베이스, 고대 문헌 등을 조사하여 출처를 확인할 수 없는 한자를 12개로 줄였다.
이 중 妛는 인쇄공이 山과 女를 잘라 붙여 𡚴를 만들려다 그림자가 선으로 잘못 해석되어 만들어진 것으로 추정된다.
3. 적용 범위 및 적합성
JIS X 0208에서 규정하는 문자 집합은 주로 데이터 처리 시스템과 이에 연결된 장치 간, 또는 데이터 통신 시스템 간의 정보 교환을 목적으로 한다. 이 문자 집합은 데이터 처리 및 텍스트 처리에 사용할 수 있다.
문자 집합의 부분적인 구현은 호환 가능한 것으로 간주되지 않는다. 초기 표준에서는 비한자 및 제1수준 한자만의 구현이 고려되었으나, 호환 가능한 것으로 지정된 적은 없다.
과거에는 JIS X 0208:1997이 적합성 인증 또는 자기 적합 선언의 대상이 아니라고 생각되었으나, 2009년 현재 경제산업성 및 JISC는 "국가가 JIS 마크 표시 제도의 대상이 되는 상품 등을 한정하는 지정 상품제를 폐지하고, 인증 가능한 JIS 제품 규격이 있는 제품이 대상이 됩니다"라고 명언하고 있기 때문에, 적합성 규정이 있는 JIS X 0208:1997도 적합성 인증 또는 자기 적합 선언의 대상이 될 수 있다고 해석된다.
4. 부호 구조
JIS X 0208의 부호는 기본적으로 7비트 2바이트 부호 또는 8비트 2바이트 부호이다. 단, 도형 문자 중 "SPACE" 및 모든 제어 문자는 1바이트로 표현된다. 부호 위치를 표현하기 위해 "열 번호/행 번호" 및 "구점 번호"가 사용된다.
4.1. 열 번호/행 번호
JIS X 0208에서 1바이트 부호의 비트 조합(bit combination)을 표현하기 위해 열 번호/행 번호가 사용된다. 이는 1바이트의 16진수 표기(00부터 FF)의 위쪽 자리와 아래쪽 자리에 해당한다. 7비트의 상위 3비트 또는 8비트의 상위 4비트를 10진수 정수 0부터 7 또는 0부터 15에 대응시키고, 이 숫자를 열 번호로 한다. 그리고 하위 4비트를 10진수 정수 0부터 15에 대응시키고, 이 숫자를 행 번호로 한다.
예를 들어, SPACE에 대응하는 비트 조합은, 7비트 부호에서 010 0000, 8비트 부호에서 0010 0000이다. 이는 열 번호/행 번호에 의해 2/0으로 표현된다.
JIS X 0208의 거의 모든 그래픽 문자 코드는 각각 7비트 이상인 2바이트로 표현되지만, 모든 제어 문자와 일반 공백 문자 (전각 공백은 제외)는 1바이트 코드로 표현된다.
| JIS X 0208 (선행 바이트) | ||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 2x | SP | 1-_ (구두점) | 2-_ (기호) | 3-_ (영숫자) | 4-_ (히라가나) | 5-_ (가타카나) | 6-_ (그리스 문자) | 7-_ (키릴 문자) | 8-_ (상자) | 9-_ | 10-_ | 11-_ | 12-_ | 13-_ | 14-_ | 15-_ |
| 3x | 16-_ (한자 L1) | 17-_ (한자 L1) | 18-_ (한자 L1) | 19-_ (한자 L1) | 20-_ (한자 L1) | 21-_ (한자 L1) | 22-_ (한자 L1) | 23-_ (한자 L1) | 24-_ (한자 L1) | 25-_ (한자 L1) | 26-_ (한자 L1) | 27-_ (한자 L1) | 28-_ (한자 L1) | 29-_ (한자 L1) | 30-_ (한자 L1) | 31-_ (한자 L1) |
| 4x | 32-_ (한자 L1) | 33-_ (한자 L1) | 34-_ (한자 L1) | 35-_ (한자 L1) | 36-_ (한자 L1) | 37-_ (한자 L1) | 38-_ (한자 L1) | 39-_ (한자 L1) | 40-_ (한자 L1) | 41-_ (한자 L1) | 42-_ (한자 L1) | 43-_ (한자 L1) | 44-_ (한자 L1) | 45-_ (한자 L1) | 46-_ (한자 L1) | 47-_ (한자 L1) |
| 5x | 48-_ (한자 L2) | 49-_ (한자 L2) | 50-_ (한자 L2) | 51-_ (한자 L2) | 52-_ (한자 L2) | 53-_ (한자 L2) | 54-_ (한자 L2) | 55-_ (한자 L2) | 56-_ (한자 L2) | 57-_ (한자 L2) | 58-_ (한자 L2) | 59-_ (한자 L2) | 60-_ (한자 L2) | 61-_ (한자 L2) | 62-_ (한자 L2) | 63-_ (한자 L2) |
| 6x | 64-_ (한자 L2) | 65-_ (한자 L2) | 66-_ (한자 L2) | 67-_ (한자 L2) | 68-_ (한자 L2) | 69-_ (한자 L2) | 70-_ (한자 L2) | 71-_ (한자 L2) | 72-_ (한자 L2) | 73-_ (한자 L2) | 74-_ (한자 L2) | 75-_ (한자 L2) | 76-_ (한자 L2) | 77-_ (한자 L2) | 78-_ (한자 L2) | 79-_ (한자 L2) |
| 7x | 80-_ (한자 L2) | 81-_ (한자 L2) | 82-_ (한자 L2) | 83-_ (한자 L2) | 84-_ (한자 L2) | 85-_ | 86-_ | 87-_ | 88-_ | 89-_ | 90-_ | 91-_ | 92-_ | 93-_ | 94-_ | DEL |
4.2. 구점 번호
JIS X 0208에서 구점 번호는 2바이트 부호에서 각 문자의 위치를 나타내는 데 사용된다. 94개의 구(row)와 각 구당 94개의 점(cell)으로 구성되며, "몇 구 몇 점" 또는 "구 번호-점 번호" 형식으로 표현된다. 예를 들어, 문자 "亜"는 16구 1점이므로,16-01로 표현한다.
JIS X 0208는 7비트 환경에서 (JIS X 0202 / ISO-2022-JP에서 전환 가능) 두 바이트가 모두 0x21에서 0x7E사이의 94가지 값으로 표현될수 있다. 이 값들은 공백을 제외하고 7비트 ASCII 인쇄문자에 사용되는 범위와 일치한다. 인코딩된 바이트는 각 숫자에 0x20 (32)를 더하여 얻는다. 예를 들어 16-01 ("亜")는 바이트`0x30 0x21` 로 표시된다. 8비트 EUC-JP는 0xA1에서 0xFE 범위를 사용하고(최상위 비트를 1로 설정) Shift JIS와 같은 다른 인코딩은 JIS X 0208에 필요한 인코딩 공간보다 더 많은 인코딩 공간을 포함하여 더 복잡한 변화를 사용한다. JIS X 0208에 대한 일부 Shift JIS 특정 확장은 94보다 큰 행 번호를 사용한다.
이러한 구조는 중국 본토의 GB 2312, 대한민국의 KS C 5601(현재 KS X 1001)에서도 사용된다.
4.3. 공백 영역
2바이트 코드 중 9구부터 15구, 85구부터 94구는 문자가 할당되지 않은 공백 영역이다. 즉, 문자가 규정되지 않은 구점 위치이다. 그 외의 구에서도 일부 점은 공백 영역이다.
공백 영역은 기본적으로 사용해서는 안 되는 구점 위치이다. 정보 교환 당사자의 합의가 있을 때를 제외하고, 공백 영역에 외자를 할당하여 정보 교환을 해서는 안 된다.
공백 영역에 문자를 할당할 때에도, 규격에 정해진 도형 문자를 공백 영역에도 할당하거나, 공백 영역의 복수의 구점 위치에 같은 문자를 할당해서는 안 된다. 중복 부호화를 피하기 위해서이다.
또한, 공백 영역에 문자를 할당할 때에는, 한자의 포섭 기준에 주의해야 한다. 예를 들어 25구 66점에는 口高일본어 및 はしご高일본어가 포섭되어 대응하고 있다. 따라서, 25구 66점의 문자를 口高일본어에 한정하여 해석하고, はしご高일본어를 공백 영역에 할당하는 것은 규격 위반이 된다.
하지만 실제로는 Windows-932, MacJapanese 등 여러 공급업체별 Shift JIS 변형은 JIS X 0208의 인코딩 공간의 할당되지 않은 행에 공급업체 확장을 인코딩한다. 또한, JIS X 0208에서 미할당된 코드의 대부분은 더 새로운 JIS X 0213 표준에 의해 할당된다.
4.4. 문자 이름
JIS X 0208의 각 문자에는 이름이 부여되어 있어, 부호에 의존하지 않고 문자를 식별할 수 있다. 문자의 이름은 다른 부호화 문자 집합의 규격과 일치하도록 정해져 있으며, 특히 유니버설 코드 문자 집합(UCS/유니코드)과의 조정이 이루어져, 유니코드와 같은 문자 집합에 대한 문자 매핑의 가능한 소스 중 하나가 된다. 예를 들어 ISO/IEC 646 국제 참조 버전(US-ASCII) 열 4 행 1의 문자와 JIS X 0208 행 3 셀 33의 문자는 모두 "LATIN CAPITAL LETTER A"라는 이름을 가지고 있어 동일한 문자로 간주될 수 있다.
한자를 제외한 문자의 이름은 라틴 문자 대문자, 공백, 하이픈으로 구성된다. 또한, 일본어 통용 명칭/일본어 통용 명칭일본어이 부여되지만, 이는 참고 사항일 뿐 규정의 일부는 아니다.
한자의 이름은 대응하는 국제 부호화 문자 집합(UCS)의 16진 표기 부호화 표현에 "CJK UNIFIED IDEOGRAPH-"를 붙여 기계적으로 생성된다. 예를 들어, 16구 1점([[wikt:亜일본어)은 UCS의 U+4E9C에 해당하므로, 그 이름은 "CJK UNIFIED IDEOGRAPH-4E9C"가 된다. 한자에는 일본어 통용 명칭이 부여되지 않는다.
5. 한자 집합
JIS X 0208은 6355자의 한자와 524자의 비한자를 포함하는 한자 집합을 규정한다. 이 집합은 94×94 문자 집합으로 구성되어 있으며, 각 행은 다음과 같이 나뉜다.
* 0x21 ~ 0x28 (1구 ~ 2구): 한자가 아닌 문자들 (문장 부호, 그림 문자, 히라가나, 가타카나, 그리스 문자, 키릴 문자 등)
* 0x30 ~ 0x4F (16구 ~ 47구): 제1수준 한자 영역 (발음 순서대로, 가장 많이 사용되는 2965자를 추림)
* 0x50 ~ 0x74 (48구 ~ 84구): 제2수준 한자 영역 (발음 순서대로, 그 다음 많이 사용되는 3390자를 추림)
JIS X 0208에 수록된 한자 중 20여 자는 실제로 사용되지 않는 문자로 ‘유령 문자(유레이모지/幽霊文字일본어)'라 불린다. 이는 표준 제정 시 한자의 명확한 출처를 밝히지 않아 생긴 오류 때문이다.
비한자는 특수 문자, 숫자, 로마자, 히라가나, 가타카나, 그리스 문자, 키릴 문자, 괘선 소편으로 구성된다. 특수 문자는 와지 간격, 구두점과 마침표 등의 기술 기호, 탁점과 반탁점 등의 분음 부호, 반복 기호 등의 가나 또는 한자에 준하는 것, 괄호 기호, 통화 기호와 우편 마크를 포함한 단위 기호 등으로 구성된다.
5.1. 개요
5.2. 특수 문자, 숫자 및 라틴 문자
JIS X 0208의 숫자와 라틴 문자는 전각으로 취급되며, ISO/IEC 646 국제 기준 버전(IRV)의 문자와는 다른 해석이 가능하다. 이는 JIS X 0208이 ISO/IEC 646과 완벽하게 호환되지 않음을 의미하며, 이 표준의 약점 중 하나로 지적된다.
마이크로소프트와 애플(Apple Inc.) 등 일부 공급업체는 JIS X 0208의 특수 문자, 숫자, 라틴 문자에 대해 서로 다른 유니코드 매핑을 사용한다. 예를 들어, 마이크로소프트는 kuten 1-29 (JIS 0x213D)를 U+2015 (수평선)로 매핑하는 반면, 애플은 U+2014 (Em Dash)로 매핑한다. 마찬가지로, 마이크로소프트는 kuten 1-61 (JIS 0x215D)을 U+FF0D (U+002D 하이픈 마이너스의 전각 형태)로 매핑하고, 애플은 U+2212 (마이너스 기호)로 매핑한다. 물결표의 유니코드 매핑도 공급업체마다 다르다.
Shift JIS, EUC-JP, ISO 2022-JP와 같이 JIS X 0208을 ASCII 또는 JIS X 0201과 결합하는 인코딩에서는, ASCII 및 JISCII 구두점(표에서 노란색 배경)에 대해 전각 반각 양식 블록에 대한 대체 매핑을 사용할 수 있다.
| 구 | 점 | 유니코드 | 문자 | 설명 | 비고 |
|---|---|---|---|---|---|
| 1 | 29 | U+2014 | — | Em 대시 | JIS 및 애플: U+2014. 유니코드: U+2015. |
| 1 | 33 | U+301C | 〜 | 물결표 대시 | 마이크로소프트 및 WHATWG: U+FF5E. 유니코드, JIS 및 애플: U+301C. |
| 1 | 61 | U+2212 | − | 마이너스 기호 | 마이크로소프트: U+FF0D. 유니코드, JIS 및 애플: U+2212. |
JIS X 0208은 ISO 646의 배열을 따르지 않아, 숫자와 라틴 문자가 1구(구두점)와 3구(문자와 숫자)에 분산되어 있다. 3구는 62개의 문자 및 숫자만 ISO 646 배열을 따른다.
| ISO/IEC 646:1991 IRV | JIS X 0208 | ||||||
|---|---|---|---|---|---|---|---|
| 열/행 | x0213 | Microsoft | Symbol | Name | Kuten | Symbol | Name |
| 2/2 | 1-2-16 | 92-94 115-24 | " | QUOTATION MARK | 1-15 | ¨ | DIAERESIS |
| 1-40 | “ | LEFT DOUBLE QUOTATION MARK | |||||
| 1-41 | ” | RIGHT DOUBLE QUOTATION MARK | |||||
| 1-77 | ″ | DOUBLE PRIME | |||||
| 2/7 | 1-2-15 | 92-93 115-23 | ' | APOSTROPHE | 1-13 | ´ | ACUTE ACCENT |
| 1-38 | ‘ | LEFT SINGLE QUOTATION MARK | |||||
| 1-39 | ’ | RIGHT SINGLE QUOTATION MARK | |||||
| 1-76 | ′ | PRIME | |||||
| 2/13 | 1-2-17 | 1-61 | - | HYPHEN-MINUS | 1-30 | ‐ | HYPHEN |
| 1-61 | − | MINUS SIGN | |||||
| 7/14 | 1-2-18 | 1-33 | ~ | TILDE | (해당 문자 없음) | ||
| (해당 문자 없음) | 1-33 | 〜 | WAVE DASH | ||||
초기 표준부터 괄호 숫자, 합자, 로마 숫자 등은 문자 합성을 통해 표현 가능하다고 여겨졌으나, 독립된 코드 포인트는 주어지지 않았다. 1997년 제4차 표준에서는 모든 문자가 스페이싱 문자로 명확히 정의되었고, 문자 합성은 금지되었다.
5.3. 히라가나 및 가타카나
JIS X 0208의 히라가나와 가타카나는 JIS X 0201과 달리 탁점과 반탁점 표기를 문자 자체의 일부로 포함한다. 또한 JIS X 0201에는 없는 가타카나 [[wi (kana)/ヰ일본어, [[we (kana)/ヱ일본어(둘 다 현대 일본어에서는 사용하지 않음), [[wa (kana)/ヮ일본어도 포함한다.
JIS X 0208의 가나 배열은 JIS X 0201의 가타카나 배열과 다르다. JIS X 0201에서는 음절이 [[wo (kana)/ヲ일본어로 시작하고, 그 뒤에 50음도 순서로 정렬된 작은 가나가 오고, 그 뒤에 50음도 순서로 정렬된 전체 크기 가나가 온다(ヲァィゥェォャュョッーアイウエオ......ラリルレロワン일본어). 반면에 JIS X 0208에서는 가나가 먼저 50음도 순서로 정렬된 다음, "작은 가나, 전체 크기 가나, 탁점이 있는 가나, 반탁점이 있는 가나" 순으로 정렬되어 동일한 기본 가나가 파생형과 함께 그룹화된다(ぁあぃいぅうぇえぉお......っつづ......はばぱひびぴふぶぷへべぺほぼぽ......ゎわゐゑをん일본어). 이러한 정렬 순서는 가나 기반 사전 검색을 더 쉽게 하기 위해 선택되었다.
JIS X 0208에는 JIS X 0201의 가타카나 배열이 적용되지 않았다. JIS X 0201 가타카나를 반각 가나로 하여 JIS X 0208의 가타카나와 구별하는 구현이 발생한 원인은 이러한 비호환성에 있다고 여겨진다.
5.4. 한자
정보 처리 학회 한자 코드 위원회가 1971년에 편찬한 표준 코드용 한자표 (시안)/標準コード用漢字表 (試案)일본어 (일본 정보 처리 학회 한자 코드 위원회가 1971년에 이 목록을 작성했다. 아래의 "대응 분석 결과"에서 6086자로 나타난다.) , 행정 관리청이 1975년에 선정한 행정 정보 처리용 기본 한자/行政情報処理用基本漢字일본어(2,817자로 구성), 일본생명 수용 인명 한자/日本生命収容人名漢字일본어('대응 분석 결과'를 구성하는 한자표 중 하나로, 3,044자로 구성되며, 일본생명이 계약자의 성명에서 추출한 한자로 추정되지만, 제1차 규격의 원안 작성 위원회 시점에서 원전이 존재하지 않아 '대응 분석 결과'에 전재되었다.), 국토 행정 구획 총람 사용 한자/国土行政区画総覧使用漢字일본어('대응 분석 결과'를 구성하는 한자표 중 하나로, 3,251자로 구성되며, 국토지리협회가 편집하고 있는 일본 전국의 자까지의 행정 지명 목록표 '국토 행정 구획 총람'에 사용되었던 한자이다. 원안 작성 위원회는 '국토 행정 구획 총람' 자체를 조사하지 않고, 그것에 사용된 한자는 '대응 분석 결과'를 통해 규격에 반영되었다.)를 참고하여 선정되었다.
제2차 규격 및 제3차 규격에서 각각 4자 및 2자의 제2수준 한자가 추가되어 한자는 6,355자가 되었다. 제2차 규격에서는 자형의 변경 및 수준 간 한자의 교체가 이루어졌으며, 제3차 규격에서도 자형의 변경이 이루어졌다.
5.4.1. 수준 구분
2,965개의 제1수준 한자는 16열부터 47열까지, 3,390개의 제2수준 한자는 48열부터 84열까지 배치되어 있다.
제1수준의 경우, 여러 한자 글자 목록에 공통으로 사용되는 문자를 선택했으며, 도요 한자(당용 한자), 도요 한자 수정 초안, 인명용 한자를 기반으로 했다. 또한, JIS C 6260("도도부현(현) 식별 코드"; 현재 JIS X 0401)와 JIS C 6261("시정촌 식별 코드"; 현재 JIS X 0402)을 참조하여 거의 모든 일본의 도도부현, 시, 구, 정, 촌 등의 한자를 의도적으로 제1수준에 배치했다. 하지만 야스오카(2001a)에 따르면 작업 누락이 있었던 것 같으며, 야스오카는 인바군, 인바촌의 "旛"(58-57) 및 시스이정의 "泗"(61-89)가 제1수준에 포함되지 않은 것을 지적하고 있다. 또한 전문가의 수정 사항이 추가되었다.
제2수준에는, 상기의 주요 4 한자표에 나타나 제1수준에서 누락된 한자가 수록되었다. 제1수준은 한자의 음훈에 기초하여 배열되었으므로, 음훈을 알기 어려운 한자 중에는 제1수준에서 제2수준으로 넘어간 것도 있다(니시무라 1978).
일반적으로 제1수준은 사용 빈도가 높은 한자, 제2수준은 사용 빈도가 낮은 한자로 여겨지지만, 수준 구분은 물론 JIS 한자 제정 당시의 기준이므로, 시대의 흐름에 따라 오늘날에는 "翔"이나 "煌"과 같이 제2수준이지만 자주 사용하게 된 한자, 반대로 "糎"나 "粍"와 같이 제1수준이지만 그다지 사용하지 않게 된 한자도 다수 존재한다. 인명용 한자 별표에는 JIS 한자 제정 후에 추가된 것 중에는 제2수준의 것도 몇 개 존재한다.
1990년대 이후에는 대부분의 시스템에서 제2수준 한자까지 사용할 수 있게 되었고, 문자 코드도 Unicode로 이행하고 있기 때문에, 사용하고 싶은 한자가 제1수준인지 제2수준인지 신경 쓸 필요는 거의 없어졌다. 그러나 수천 자나 되는 한자 폰트를 제작하려면 상당한 수고와 시간이 들기 때문에, 프리 폰트 등에서는 일부 한자만 수록하는 경우가 있다. 그 때, 수준을 기준으로 수록할지 말지를 결정하는 경우도 있다(제1수준만 수록하고 있는 폰트도 있다).
5.4.2. 배열
JIS X 0208의 제1수준 한자는 이 규격 고유의 대표 음훈, 즉 각 한자에 대해 각각 하나씩 정한 음 또는 훈의 순으로 배열되었다. 원칙적으로 음이 대표 음훈으로 지정되었으며, 음이 여러 개 있는 (이표기의 한음, 오음, 당음 등) 한자에 대해서는 "사용 빈도가 우세"하다고 판단된 음이 대표 음훈으로 채택되었다. 음이 존재하지 않거나 일반적이지 않은 한자에 대해서는 훈이 대표 음훈으로 지정되었다. 동사의 훈을 대표 음훈으로 할 때는 종지형이 아닌 연용형이 대표 음훈으로 지정되었다.
예를 들어, 16구 1점에서 41점까지 대표 음훈이 "あ(아)"로 시작하는 41자가 배열되어 있다. 이 중 "葵(해바라기 퀴, あおい, 16-10)", "粟(좁쌀 족, 粟(좁쌀), 아와, 16-32)" 등 22자는 훈을 대표 음훈으로 하고 있다. "逢(봉, 아, 16-09)", "扱(급, 아츠카이, 16-23)" 등은 동사의 연용형이 대표 음훈으로 지정된 예이다.
대표 음훈이 같은 한자 중에서는 음을 대표 음훈으로 하는 한자가 먼저, 훈을 대표 음훈으로 하는 한자가 나중에 배열되었으며, 음 또는 훈이 같은 한자 중에서는 부수 및 획순으로 배열되었다.
제1수준에 있든 제2수준에 있든, 이체자는 기본적으로 친자의 바로 뒤에 함께 배열되었다. 예를 들어, 제2수준에서 49구 88점의 "劍"의 바로 뒤에는 원칙인 획순을 어기고 "劔", "劒" 및 "剱"이 배열되어 있다.
제2수준 한자 집합은 부수 및 획순으로 배열되었다. 부수 및 획수를 같이 하는 한자 중에서는 50음 순으로 배열되었다.
5.4.3. 출처 불명의 한자
JIS X 0208에는 종합적인 한자 사전에서 찾을 수 없고 출처가 불분명한 한자(유령 문자)가 존재한다. 제4차 규격에서는 이러한 한자의 출처를 조사하여 그 수를 줄였으나, 여전히 다음 12자의 출처가 불분명하다.
| 쿠텐 | 기호 | 분류 |
|---|---|
| 52-55 | {{llang|ja|墸|} | }