맨위로가기

JIS X 0212

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

JIS X 0212는 1990년 일본 규격 협회(JSA)가 발표한 보조 문자 집합 표준으로, 주 JIS X 0208 문자 집합의 범위를 확장하기 위해 고안되었다. 이 표준은 특수 문자, 알파벳, 한자를 포함한 6,067개의 문자를 지정했으며, 유니코드 제정 시 원규격 중 하나로 사용되어 유니코드 기반 시스템에서 보조 한자를 이용할 수 있게 했다. JIS X 0212는 EUC-JP, ISO-2022-JP-2, ISO-2022-JP-1 등의 인코딩 방식에서 이용 가능했으나, Shift_JIS에서는 이용할 수 없었다. JIS X 0212는 JIS X 0213 표준의 제정으로 인해 사실상 사장되었지만, 이 표준에 포함된 5,801개의 한자는 유니코드에 포함되었다.

더 읽어볼만한 페이지

  • JIS 표준 - JIS X 0201
    JIS X 0201은 7비트 및 8비트 문자 집합을 포함하는 일본의 문자 인코딩 방식으로, ASCII 기반 로마자, 가타카나, 문장 부호로 구성되며, ASCII의 일부 문자가 엔화 기호나 윗줄로 대체된 특징을 가진다.
  • JIS 표준 - JIS X 0208
    JIS X 0208은 정보 교환을 목적으로 하는 일본어 문자 집합 코드로, 94×94 문자 집합으로 구성되어 한자, 히라가나, 가타카나, 숫자, 로마자, 기호 등을 포함하며, 각 문자에는 식별 가능한 이름이 부여되어 유니코드와 같은 다른 문자 집합과의 매핑에 활용되지만, 사용자 정의 영역이 없고 일부 한자는 실제로 사용되지 않는 유령 문자로 알려져 있다.
  • 일본어 컴퓨팅 - Shift JIS
    Shift JIS는 JIS X 0201을 기반으로 JIS X 0208을 할당하여 일본어 문자를 인코딩하는 방식으로, 이스케이프 시퀀스 없이 문자 집합을 혼용하여 파일 크기를 절약하고 처리 시간을 단축하며, MS-DOS에서 "MS 한자 코드"로 채택된 후 사실상 표준으로 자리 잡았다.
  • 일본어 컴퓨팅 - JIS X 0201
    JIS X 0201은 7비트 및 8비트 문자 집합을 포함하는 일본의 문자 인코딩 방식으로, ASCII 기반 로마자, 가타카나, 문장 부호로 구성되며, ASCII의 일부 문자가 엔화 기호나 윗줄로 대체된 특징을 가진다.
  • 문자 집합 - 점자
    점자는 루이 브라이유가 개발한 시각 장애인용 촉각 문자 체계로, 6점 점자를 사용하여 133개 이상의 언어에 적용되었으며, 교육, 정보 접근, 사회 참여에 필수적인 역할을 수행하지만 문해력 저하와 교육의 어려움이라는 과제도 안고 있다.
  • 문자 집합 - ISO/IEC 646
    ISO/IEC 646는 ASCII 기반의 7비트 문자 인코딩 표준으로, 국가별 변형이 존재했으나, 최종 개정판은 ASCII와 호환되도록 정의되었고, 현재는 ITU-T 권고 T.50 IRA가 현행 표준으로 유지되고 있다.
JIS X 0212
JIS X 0212
개요
명칭정보 교환용 한자 부호 - 보조 한자
로마자 표기JIS X 0212
목적일본어 지원을 위해 JIS X 0208과 함께 사용하도록 의도됨. 그 자체로는 어떤 언어도 실질적으로 지원하지 않음.
상태유니한 소스. 코드화된 문자 세트 자체는 JIS X 0208만큼 널리 지원되지는 않지만, 때때로 EUC-JP에서 사용됨.
인코딩EUC-JP
ISO-2022-JP-1
확장IBM 코드 페이지 953
OSF 확장
하이브리드 평면 2
관련 표준보완 대상:
기타 보조 ISO 2022 CJK DBCSes:
분류보조 문자 세트
ISO 2022
DBCS
CJK 인코딩

2. 역사

1990년 일본 규격 협회(JSA)는 보조 문자 집합 표준인 情報交換用漢字符号-補助漢字|조호 코칸요 간지 후고 - 호조 간지일본어를 발표했다. 이 표준은 JIS X 0208 문자 집합에서 사용 가능한 문자의 범위를 확장하고 해당 집합의 적용 범위 부족을 해결하기 위해 고안되었다.[1]

3. 구성

JIS X 0212는 94×94 문자 집합이며, 각 행은 다음과 같이 구성되어 있다.



오일러 다이어그램으로 JIS X 0208, JIS X 0212, JIS X 0213, Windows-31J, Microsoft 표준 문자 집합 및 유니코드의 문자 집합 비교


이 표준은 총 6,067개의 문자를 포함하고 있으며, 크게 비한자와 한자로 나뉜다.

JIS X 0212는 유니코드 외에도 EUC-JP, ISO-2022-JP-2, ISO-2022-JP-1의 부호화 방식에서도 이용할 수 있다. 그러나 Shift_JIS에서는 부호화 방식의 제약으로 이용할 수 없어, 2000년에 JIS X 0213이 제정되었다.

3. 1. 비한자

JIS X 0212는 6,067개의 문자를 포함하며, 그중 비한자는 다음과 같이 구성된다.

분류문자 수상세
특수 문자21자
알파벳245자


3. 2. 한자

JIS X 0212는 5,801개의 확장 한자를 포함하고 있다. JIS X 0212의 제정에는 국문학연구자료관(당시)의 타지마 카즈오가 크게 관여하여, 국문학연구자료관의 서지 데이터베이스 구축에 대한 연구 성과를 기반으로 문자를 선정했으며, 학문 연구에 적합한 문자 집합이 되었다.[1] 다만, 수록된 한자 중에는 유래가 불분명한 것도 있다.[1] 또한, "〆"자는 JIS X 0208에도 포함되어 있지만, 그것과는 크게 다른 예시 자형으로 16구 17점에 한자로 수록(乄|시메일본어)하고 있다.[1]

유니코드는 제정 시 JIS X 0212를 원규격 중 하나로 삼았기 때문에 보조 한자를 모두 포함하고 있다.[1] 따라서 유니코드 기반 시스템에서는 폰트만 있으면 보조 한자를 이용할 수 있다.[1]

4. 인코딩


  • EUC-JP에서 문자는 3바이트로 표현되며, 첫 번째 바이트는 0x8F, 그 다음 두 바이트는 0xA1 – 0xFE 범위 내에 있다.
  • ISO 2022 기반 JIS 인코딩의 특정 구현—ISO-2022-JP-EXT, ISO-2022-JP-1 및 ISO-2022-JP-2 포함—에서 시퀀스 `ESC $ ( D`가 JIS X 0212 문자를 나타내는 데 사용된다.
  • 널리 사용되는 Shift JIS 인코딩에서는 JIS X 0212 문자의 캡슐화가 불가능하다. Shift JIS에는 문자에 할당되지 않은 코드 공간이 충분하지 않기 때문이다.

5. 구현

JIS X 0212는 IBM에서 '''코드 페이지 953'''이라고 불리며, 공급업체 확장을 포함한다.[2][3][4] 대안인 CCSID '''5049'''는 이러한 확장을 제외한다.[5]

JIS X 0212 문자는 전통적으로 일본 정보 처리를 지배해 온 코딩 시스템인 시프트 JIS에서 인코딩할 수 없기 때문에, 이 문자 집합의 실제 구현은 거의 이루어지지 않았다. 유닉스/리눅스 시스템에서 일반적으로 사용되는 EUC-JP에서 인코딩될 수 있으며, 대부분의 구현이 이루어진 곳이 바로 여기다.

EUC-JP는 JIS X 0212에 대해 첫 번째 바이트 0x8F와 0xA1–FE 범위의 두 바이트를 사용한다.


Windows 코드 페이지 20932는 JIS X 0212에 대해 0xA1–FE 범위의 첫 번째 바이트와 0x21–FE 범위의 바이트를 사용한다.


다음은 1990년대 초반 유닉스 환경에서 JIS X 0212 구현을 위해 이루어진 작업들이다.

  • 유닉스 X 윈도우 시스템에서 사용하기 위해 기본 "BDF" 글꼴이 컴파일되었다.
  • Wnn 시스템용 IME 변환 파일이 컴파일되었다.
  • kterm 콘솔 창 응용 프로그램이 이를 지원하도록 확장되었다.
  • Emacs 및 ''jstevie'' 편집기가 이를 지원하도록 확장되었다.


Netscape/Mozilla/Firefox 제품군, Opera 등 많은 WWW 브라우저 및 Mozilla Thunderbird와 같은 관련 응용 프로그램은 EUC-JP 인코딩에서 JIS X 0212 문자의 표시를 지원하지만, Internet Explorer는 JIS X 0212 문자를 지원하지 않는다. GNOME Terminal과 같은 최신 터미널 에뮬레이션 패키지도 JIS X 0212 문자를 지원한다.

EUC 코딩에서 JIS X 0212를 지원하는 응용 프로그램은 다음과 같다.

  • 유닉스/리눅스용 [http://www.csse.monash.edu.au/~jwb/xjdic/ xjdic] 사전 프로그램
  • WWWJDIC 일본어 사전 서버 (그러나 Internet Explorer는 EUC에서 JIS X 0212 확장을 지원하지 않으므로, 이 서버는 EUC-JP 모드에서 설정될 때 이러한 문자에 대해 비트맵 그래픽을 보낸다.)

6. 유니코드(Unicode)와의 관계

JIS X 0212에 포함된 한자는 초기 ISO 10646/유니코드 표준의 통합된 CJK 문자 집합으로 이어지는 한자 통합의 소스 중 하나로 사용되었다. 5,801개의 모든 한자가 통합되었다.

유니코드는 제정 시 JIS X 0212를 원규격 중 하나로 삼았기 때문에 보조 한자를 모두 포함하고 있다. 따라서 유니코드 기반 시스템에서는 폰트만 있으면 보조 한자를 이용할 수 있다. 그 외에 EUC-JP, ISO-2022-JP-2, ISO-2022-JP-1의 부호화 방식에서도 이용할 수 있다. 그러나 Shift_JIS에서는 부호화 방식의 제약으로 이용할 수 없으며, Shift_JIS에서도 이용할 수 있도록 설계된 확장 문자 집합으로 2000년에 JIS X 0213이 제정되게 된다.

7. JIS X 0213과의 관계

JIS X 0212는 응용 프로그램 외에는 사실상 사장된 표준이다. 이 표준에 포함된 2,743개의 한자는 JIS X 0213 표준에 포함되었다. JIS X 0212의 기여는 유니코드에 포함된 5,801개의 한자로 평가될 수 있다.

JIS X 0213이 제3수준 및 제4수준 문자로 규정되면서 JIS X 0212는 JIS X 0213보다 하위 위치가 되었고, JIS X 0213을 사용하는 것이 권장되었다. 공적 규격 등에서도 JIS X 0212 대신 JIS X 0213 사용을 권장하는 것이 늘어나고 있다. 2004년 JIS X 0213:2004 제정으로 JIS X 0212에 포함된 일부 글리프도 변경되었지만, JIS X 0212는 과거 규격이므로 JIS X 0213에 포함되지 않은 문자는 변경되지 않았다.[6]

7. 1. JIS X 0213:2004와 JIS X 0212:1990에서 글꼴 모양이 다른 문자

JIS X 0213은 제3수준 및 제4수준의 문자로 규정되었으며, 이 제정으로 인해 JIS X 0212는 JIS X 0213보다 하위의 위치가 되었고, JIS X 0213을 사용하는 것이 권장되었다. 그 후의 공적 규격 등에서도 JIS X 0212가 아닌 JIS X 0213을 사용할 것을 권장하는 것이 늘어나고 있다. 2004년에는 JIS X 0213:2004가 제정되어 JIS X 0212에 포함된 일부 글리프도 변경되었지만, JIS X 0212는 과거의 규격이므로 JIS X 0213에 포함되지 않은 문자는 변경되지 않았다.[6]

JIS X 0213:2004와 JIS X 0212:1990에서 글꼴 모양이 다른 문자는 다음과 같다. JIS X 0212:1990의 글꼴 모양은 Adobe-Japan1-6 문자 컬렉션에 포함된 글리프와 일치하는 것은 한자 이체자 셀렉터(IVS)를 사용한 후, 凸版文久明朝, 유명조체, 겐노명조를 지정하고, 일치하지 않는 것은 그림을 사용했다. IVS를 지원하지 않는 환경이나, 글리프의 구현이 다른 폰트에서는 정확한 글꼴 모양을 재현할 수 없다. 주민 기본 대장 통일 문자에서는 다른 코드 포인트로 수록하고 있다.[7]

JIS X 0212 구획점문자(JIS X 0212:1990)문자(JIS X 0213:2004)유니코드주민 기본 대장 통일 문자
18-49僲󠄁U+50F2ad9b
20-60
Adobe-Japan2 문자 컬렉션 0702、U+53D5(叕)의 JIS X 0212:1990 예시 글꼴 모양
U+53D5
26-05嫚󠄁U+5ADAaffe
70-84嶲󠄀U+5DB2
28-50廋󠄁U+5ECB
34-39晷󠄁U+6677b2a2
34-43
Adobe-Japan2 문자 컬렉션 2001、U+6680(暀)의 JIS X 0212:1990 예시 글꼴 모양
U+6680b2aa
36-81槾󠄁U+69FEb37b
38-11
Adobe-Japan2 문자 컬렉션 2345、U+6BA9(殩)의 JIS X 0212:1990 예시 글꼴 모양
U+6BA9b3ed
38-68
Adobe-Japan2 문자 컬렉션 2402、U+6C74(汴)의 JIS X 0212:1990 예시 글꼴 모양
U+6C74b40e
41-07濹󠄁U+6FF9b4d5
42-15熳󠄁U+71B3b540
44-34瑢󠄁U+7462b5c3
44-79瓘󠄁U+74D8b5dc
44-88瓯󠄁U+74EFb5e2
45-72瘈󠄁U+7608b606
45-87瘦󠄁U+7626
46-47盔󠄁U+76D4b638
47-20瞢󠄁U+77A2b65f
48-41礴󠄁U+7934b694
51-04籩󠄁U+7C69b7ed
51-72絜󠄁U+7D5Cb817
56-59葜󠄁U+845Cb9d2
63-07貛󠄁U+8C9Bbbbe
68-84鍥󠄁U+9365be04
69-09鎋󠄁U+938Bbe19
69-17鎡󠄁U+93A1be05
70-86雚󠄁U+96DAbe93
71-18靕󠄁U+9755beb5
74-18鬭󠄁U+9B2D
75-57鳦󠄁U+9CE6c044
76-23鶿󠄁鶿U+9DBFc055


7. 2. JIS X 0212와 JIS X 0213에서 UCS 부호가 일치하지 않는 문자

JIS X 0213은 제3수준 및 제4수준의 문자로 규정되었으며, 이 제정으로 인해 JIS X 0212는 JIS X 0213보다 하위의 위치가 되었고, JIS X 0213을 사용하는 것이 권장되었다. 그 후의 공적 규격 등에서도 JIS X 0212가 아닌 JIS X 0213을 사용할 것을 권장하는 것이 늘어나고 있다. 2004년에는 JIS X 0213:2004가 제정되어 JIS X 0212에 포함된 일부 글리프도 변경되었지만, JIS X 0212는 과거의 규격이므로 JIS X 0213에 포함되지 않은 문자는 변경되지 않았다.

「『JIS X 0213 7비트 및 8비트 2바이트 정보 교환용 부호화 확장 한자 집합』부속서 11 3.2 JIS X 0212からの索引」에서 JIS X 0212와 JIS X 0213의 대응이 규정되어 있다. 「3.3 JIS X 0221からの索引」에는 UCS 부호와의 대응이 규정되어 있다. 아래와 같이 UCS의 부호가 다른 문자가 존재한다.[6]

JIS X 0212→UCSJIS X 0213→UCS비고
U+5765U+5766
U+601AU+601B
U+67E6U+67E4
U+5DF9U+537A
U+572EU+572F
U+653AU+6539
U+7386U+8332
U+676EU+67FF杮(こけら, 고케라) (획수 8획)을 柿(かき, 가키) (획수 9획)에 대응(포섭)
U+6637U+25055
U+5F50U+5F51
U+7626U+75E9JIS X 0213:2004 (추가 10문자 중 하나와 대응하지 않고, 기존 이체자에 대응)
U+7E6BU+7E4BJIS X 0213:2004 (추가 10문자 중 하나와 대응하지 않고, 기존 이체자에 대응)
U+4E44U+3006JIS 포섭 기준에 따르지 않는 것
U+0110U+00D0JIS 포섭 기준에 따르지 않는 것(Đ, Ð)


8. 글꼴 지원

Adobe-Japan1-6 이후에 준거하는 OpenType Pr6/Pr6N 글꼴이 JIS X 0212를 지원한다.[8]

겐노카쿠고, 겐노민초, VL고딕 등 자유 글꼴도 대응하고 있다.

Windows에서는 오래전부터 대응 글꼴이 준비되어 있었다. Windows 98부터 이미 표준으로 번들되어 있는 MS 고딕과 MS 명조가 대응하고 있다. Windows Vista 이후의 시스템 글꼴인 메이리오는 Vista 발매 당시 버전 (5.00)에서는 대응하지 않았지만, Windows 7에 탑재된 버전 (6.02)에서 대응하게 되었다. Windows 10이 탑재하는 유명조와 유고딕의 문자 세트는 2019년 이후 Adobe-Japan1-7을 포함[9]하므로 Pr6N 상당이다.

macOS에서는 OS X 매버릭스에서 추가된 유명조체와 유고딕체가 Pr6N 글꼴이며,[9] macOS 시에라 이후 Font Book에서 추가 다운로드할 수 있는 톳판 분큐 명조, 톳판 분큐 고딕도 Pr6N 글꼴이다. iOS에서는 iOS 14 시점에서 표준 탑재 일본어 글꼴이 Adobe-Japan1-5 상당의 히라기노 ProN으로 제한되기 때문에, JIS X 0212의 문자·예시 자형을 올바르게 표시할 수 없는 경우가 있다.

참조

[1] 웹사이트 5. Indexes (§ Index jis0212) https://encoding.spe[...]
[2] 웹사이트 Code page 953 information document https://www-01.ibm.c[...]
[3] 웹사이트 CCSID 953 information document http://www-01.ibm.co[...]
[4] 간행물 Code Page CPGID 00953 (pdf) https://public.dhe.i[...] IBM
[5] 웹사이트 CCSID 5049 information document http://www-01.ibm.co[...]
[6] 웹사이트 漢字データベースプロジェクト JIS X 0212 http://kanji-databas[...]
[7] 논문 住民基本台帳ネットワーク統一文字とその問題点 https://doi.org/10.1[...] 2012
[8] 웹사이트 Adobe-Japan1-6の2つのフォント | フォント用語集 | 文字の手帖 | 株式会社モリサワ https://www.morisawa[...]
[9] 문서 OS搭載の游書体一覧PDF http://www.jiyu-kobo[...] 字游工房 2019-07-17



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com