맨위로가기

코드 페이지 950

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

코드 페이지 950은 윈도우 운영체제에서 사용되는 문자 인코딩 방식으로, Big5 인코딩을 기반으로 한다. 마이크로소프트는 코드 페이지 950을 Big5의 ETEN 확장 문자의 하위 집합을 포함하도록 수정했으며, 2000년에는 유로 기호를 추가했다. IBM은 CCSID 950이라는 Big5 변형을 사용하며, 단일 바이트 코드 페이지 1114와 이중 바이트 코드 페이지 947로 구성된다. IBM은 마이크로소프트와의 호환성을 위해 코드 페이지 1372와 CCSID 1373을 정의하기도 했다. 코드 페이지 950과 관련된 다양한 변형과 확장, 그리고 사용자 영역 사용에 대한 정보를 제공한다.

더 읽어볼만한 페이지

  • 윈도우 코드 페이지 - Windows-1252
    Windows-1252는 마이크로소프트 윈도우에서 ANSI 코드 페이지로 불렸으나 ANSI 표준은 아니며, 윈도우 1.0부터 사용되어 윈도우 98에서 최종 버전이 도입되었고, HTML5 사양에서 미선언된 문자 집합으로 간주되며, 다양한 운영체제 및 환경에서 관련된 인코딩 방식들이 존재한다.
  • 윈도우 코드 페이지 - 코드 페이지 949
    코드 페이지 949는 EUC-KR을 확장한 문자 인코딩으로, IBM과 마이크로소프트에서 다르게 정의되어 사용되며, 파이썬과 WHATWG에서도 각기 다른 레이블로 인식한다.
  • 중국어 컴퓨팅 - Big5
    Big5는 1984년 대만에서 제정된 번체 중국어 문자 인코딩 방식으로, 로마자, 숫자, 주음부호 외에 1만 3천여 자의 한자를 포함하여 대만, 홍콩, 마카오 등에서 널리 쓰였으나 호환성 문제와 유니코드의 등장으로 사용이 줄고 있다.
  • 중국어 컴퓨팅 - 중국어 입력기
    중국어 입력기는 디지털 기기에서 중국어를 입력하는 다양한 방식과 소프트웨어를 아우르며, 자형 기반에서 발음 기반으로 발전하여 창힐 입력법, 병음 입력 방식 등이 사용되고, 스마트폰 보급 후 터치스크린 및 음성 인식 방식과 다양한 소프트웨어가 제공되면서 지역별 선호 방식이 존재한다.
  • 문자 집합 - 점자
    점자는 루이 브라이유가 개발한 시각 장애인용 촉각 문자 체계로, 6점 점자를 사용하여 133개 이상의 언어에 적용되었으며, 교육, 정보 접근, 사회 참여에 필수적인 역할을 수행하지만 문해력 저하와 교육의 어려움이라는 과제도 안고 있다.
  • 문자 집합 - ISO/IEC 646
    ISO/IEC 646는 ASCII 기반의 7비트 문자 인코딩 표준으로, 국가별 변형이 존재했으나, 최종 개정판은 ASCII와 호환되도록 정의되었고, 현재는 ITU-T 권고 T.50 IRA가 현행 표준으로 유지되고 있다.
코드 페이지 950
기본 정보
이름코드 페이지 950
언어중국어 정체
종류문자 인코딩
상세 정보
개발마이크로소프트
기반Big5-ETen
확장Big5
IANA 등록Character Sets
MSDN 설명Encoding.WindowsCodePage Property - .NET Framework (current version)
코드 페이지 950 레이아웃
마이크로소프트(상단, MS-950 또는 IBM-1373)와 IBM(하단, IBM-950)에서 구현된 코드 페이지 950 레이아웃

2. 용어 및 변형

코드 페이지 950은 Big5의 변형으로, 마이크로소프트IBM 등에서 다양한 버전으로 사용된다.

Windows 코드 페이지 950은 일반적인 Big5와 비교했을 때, ETEN 확장의 일부를 포함하고 있다는 주요 차이점이 있다. IBM의 CCSID 950은 마이크로소프트의 코드 페이지 950과 유사하지만, 일부 ETEN 확장의 통합 방식과 사용자 정의 영역 등에서 차이를 보인다.[3]

마이크로소프트는 2000년에 코드 페이지 950에 유로 기호(€)를 추가했다. IBM은 유로 기호 업데이트를 포함한 Big-5 변형을 CCSID 1370으로 지칭하며, 마이크로소프트 변형과의 호환성을 위해 CCSID 1373도 정의한다.[13]

2. 1. 마이크로소프트 코드 페이지 950

마이크로소프트에서 정의한 코드 페이지 950은 "일반적인"(벤더 특정적이지 않은) Big5와 주요 차이점이 있는데, 16진수 0xF9D6부터 0xF9FE까지의 Big5에 대한 ETEN 확장의 하위 집합을 통합한다는 점이다.[3] 이 확장은 일곱 개의 중국어 문자 碁(기), 銹(수), 裏(리), 墻(장), 恒(항), 粧(장), 嫺(한)과 34개의 상자 그리기 문자 및 블록 요소로 구성된다. 다른 ETEN 확장 문자에 사용되는 범위 중 일부는 대신 최종 사용자 정의 (개인 사용) 문자로 정의된다.[3]

마이크로소프트는 2000년에 코드 페이지 950 버전을 업데이트하여 이중 바이트 코드 0xA3E1에 유로 기호(€)를 추가했다.[13]

2. 2. IBM 코드 페이지 950 (CCSID 950)

IBM의 CCSID 950은 단일 바이트 코드 페이지 1114(CCSID 1114)와 이중 바이트 코드 페이지 947(CCSID 947)로 구성되며,[4][5][6] Big5 변형이기도 하지만 마이크로소프트의 코드 페이지 950과는 다소 다르다. ETEN 확장의 일부를 리드 바이트 0xA3,[7] 0xC6,[3][8] 0xC7,[9] 및 0xC8[3][10]에 대해 통합하는 반면, 마이크로소프트가 포함하는 리드 바이트 0xF9는 생략하고 대신 이를 사설 사용 영역에 사용자 정의 문자로 매핑한다.[3][11] 또한 트레일 바이트가 0x81–A0인 두 개의 비 ETEN 확장 영역을 포함하는데, 이는 일반적인 Big5 트레일 바이트 범위를 벗어나지만 Big5+ 트레일 바이트 범위와 유사하다. 영역 5는 리드 바이트가 0xF2–F9이고 IBM이 선택한 문자를 포함하며, 영역 9는 리드 바이트가 0x81–8C이고 사용자 정의 영역이다.[12]

마이크로소프트는 2000년에 코드 페이지 950 버전을 업데이트하여 이중 바이트 코드 0xA3E1에 유로 기호(€)를 추가했다. IBM은 Big-5 변형의 유로 기호 업데이트를 CCSID 1370으로 지칭한다(단일 바이트(0x80) 및 이중 바이트 유로 기호 모두 포함).[13] 이는 단일 바이트 코드 페이지 1114(CCSID 5210)와 이중 바이트 코드 페이지 947(CCSID 21427)로 구성된다.[13][14][15]

IBM Db2에서 마이크로소프트 변형과의 더 나은 호환성을 위해 IBM은 순수 이중 바이트 코드 페이지 1372[16]와 관련 가변 폭 CCSID 1373도 정의하는데, 이는 이중 바이트 유로 기호만 포함하고[17] 확장 영역이 포함되는 마이크로소프트의 동작과 일치한다.[18][19][20][21][22]

2. 3. IBM CCSID 1370

IBM의 CCSID 1370은 유로 기호(€) 업데이트를 포함하는 Big-5 변형이다.[13] 이는 단일 바이트 코드 페이지 1114 (CCSID 5210)와 이중 바이트 코드 페이지 947 (CCSID 21427)로 구성된다.[13][14][15] 마이크로소프트는 2000년에 코드 페이지 950 버전을 업데이트하여 이중 바이트 코드 0xA3E1에 유로 기호를 추가했으며, IBM은 이를 CCSID 1370으로 지칭한다.

2. 4. IBM 코드 페이지 1372 및 CCSID 1373

IBM CCSID 950은 단일 바이트 코드 페이지 1114(CCSID 1114)와 이중 바이트 코드 페이지 947(CCSID 947)로 구성되며,[4][5][6] Big5 변형이기도 하지만 마이크로소프트의 코드 페이지 950과는 다소 다르다. ETEN 확장의 일부를 리드 바이트 0xA3,[7] 0xC6,[3][8] 0xC7,[9] 0xC8[3][10]에 대해 통합하는 반면, 마이크로소프트가 포함하는 리드 바이트 0xF9는 생략하고 대신 이를 사설 사용 영역에 사용자 정의 문자로 매핑한다.[3][11] 또한 트레일 바이트가 0x81–A0인 두 개의 비 ETEN 확장 영역을 포함하는데, 이는 일반적인 Big5 트레일 바이트 범위를 벗어나지만 Big5+ 트레일 바이트 범위와 유사하다. 영역 5는 리드 바이트가 0xF2–F9이고 IBM이 선택한 문자를 포함하며, 영역 9는 리드 바이트가 0x81–8C이고 사용자 정의 영역이다.[12]

IBM Db2에서 마이크로소프트 변형과의 더 나은 호환성을 위해 IBM은 순수 이중 바이트 코드 페이지 1372[16]와 관련 가변 폭 CCSID 1373도 정의하는데, 이는 이중 바이트 유로 기호만 포함하고[17] 확장 영역이 포함되는 마이크로소프트의 동작과 일치한다.[18][19][20][21][22]

3. IBM 코드 페이지 1114의 단일 바이트 코드

다음은 IBM에서 포함된 단일 바이트 그래픽 문자이다. 코드 0x00부터 0x1F, 0x7F는 상황에 따라 C0 제어 코드 대신 사용될 수 있다 (코드 페이지 437, 코드 페이지 897 비교). 0x80의 단일 바이트 유로 기호는 IBM CCSID 950 또는 1373, Microsoft에서도 포함되지 않는다.[23][24]

코드 페이지 1114
코드문자유니코드설명
0x00style="background:#DDD" |
0x01style="background:#DDD" |
0x02style="background:#DDD" |
0x03style="background:#DDD" |
0x04style="background:#DDD" |
0x05style="background:#DDD" |
0x06style="background:#DDD" |
0x07style="background:#DDD" |
0x08style="background:#DDD" |
0x09style="background:#DDD" |
0x0Astyle="background:#DDD" |
0x0Bstyle="background:#DDD" |
0x0Cstyle="background:#DDD" |
0x0Dstyle="background:#DDD" |
0x0Estyle="background:#DDD" |
0x0Fstyle="background:#DDD" |
0x10style="background:#DDD" |
0x11style="background:#DDD" |
0x12style="background:#DDD" |
0x13style="background:#DDD" |
0x14style="background:#DDD" |
0x15style="background:#DDD" |
0x16style="background:#DDD" |
0x17style="background:#DDD" |
0x18style="background:#DDD" |
0x19style="background:#DDD" |
0x1Astyle="background:#DDD" |
0x1Bstyle="background:#DDD" |
0x1Cstyle="background:#DDD" |
0x1Dstyle="background:#DDD" |
0x1Estyle="background:#DDD" |
0x1Fstyle="background:#DDD" |
0x20U+0020SP
0x21!U+0021느낌표
0x22"U+0022큰따옴표
0x23#U+0023숫자 기호
0x24$U+0024달러 기호
0x25%U+0025퍼센트 기호
0x26&U+0026앰퍼샌드
0x27'U+0027아포스트로피
0x28(U+0028왼쪽 괄호
0x29)U+0029오른쪽 괄호
0x2A*U+002A별표
0x2B+U+002B더하기 기호
0x2C,U+002C쉼표
0x2D-U+002D하이픈 대시
0x2E.U+002E마침표
0x2F/U+002F슬래시
0x300U+0030숫자 0
0x311U+0031숫자 1
0x322U+0032숫자 2
0x333U+0033숫자 3
0x344U+0034숫자 4
0x355U+0035숫자 5
0x366U+0036숫자 6
0x377U+0037숫자 7
0x388U+0038숫자 8
0x399U+0039숫자 9
0x3A:U+003A콜론
0x3B;U+003B세미콜론
0x3C<U+003C보다 작음 기호
0x3D=U+003D같음 기호
0x3E>U+003E보다 큼 기호
0x3F?U+003F물음표
0x40@U+0040골뱅이
0x41AU+0041라틴 대문자 A
0x42BU+0042라틴 대문자 B
0x43CU+0043라틴 대문자 C
0x44DU+0044라틴 대문자 D
0x45EU+0045라틴 대문자 E
0x46FU+0046라틴 대문자 F
0x47GU+0047라틴 대문자 G
0x48HU+0048라틴 대문자 H
0x49IU+0049라틴 대문자 I
0x4AJU+004A라틴 대문자 J
0x4BKU+004B라틴 대문자 K
0x4CLU+004C라틴 대문자 L
0x4DMU+004D라틴 대문자 M
0x4ENU+004E라틴 대문자 N
0x4FOU+004F라틴 대문자 O
0x50PU+0050라틴 대문자 P
0x51QU+0051라틴 대문자 Q
0x52RU+0052라틴 대문자 R
0x53SU+0053라틴 대문자 S
0x54TU+0054라틴 대문자 T
0x55UU+0055라틴 대문자 U
0x56VU+0056라틴 대문자 V
0x57WU+0057라틴 대문자 W
0x58XU+0058라틴 대문자 X
0x59YU+0059라틴 대문자 Y
0x5AZU+005A라틴 대문자 Z
0x5BU+005B왼쪽 대괄호
0x5CU+005C역 슬래시
0x5D]U+005D오른쪽 대괄호
0x5E^U+005E캐럿
0x5F_U+005F밑줄
0x60`U+0060억음 악센트
0x61aU+0061라틴 소문자 A
0x62bU+0062라틴 소문자 B
0x63cU+0063라틴 소문자 C
0x64dU+0064라틴 소문자 D
0x65eU+0065라틴 소문자 E
0x66fU+0066라틴 소문자 F
0x67gU+0067라틴 소문자 G
0x68hU+0068라틴 소문자 H
0x69iU+0069라틴 소문자 I
0x6AjU+006A라틴 소문자 J
0x6BkU+006B라틴 소문자 K
0x6ClU+006C라틴 소문자 L
0x6DmU+006D라틴 소문자 M
0x6EnU+006E라틴 소문자 N
0x6FoU+006F라틴 소문자 O
0x70pU+0070라틴 소문자 P
0x71qU+0071라틴 소문자 Q
0x72rU+0072라틴 소문자 R
0x73sU+0073라틴 소문자 S
0x74tU+0074라틴 소문자 T
0x75uU+0075라틴 소문자 U
0x76vU+0076라틴 소문자 V
0x77wU+0077라틴 소문자 W
0x78xU+0078라틴 소문자 X
0x79yU+0079라틴 소문자 Y
0x7AzU+007A라틴 소문자 Z
0x7B{U+007B왼쪽 중괄호
0x7C\U+007C세로 막대
0x7D

4. 사용자 영역 사용

Big5 확장 사용자 정의 문자(EUDC)는 개인 사용 영역(PUA) 코드 포인트에 매핑된다. 이 매핑은 글자가 유니코드에서 지정된 영역에서 발견되지 않을 경우 HKSCS에서도 사용된다.[30][27]

4. 1. Big5 EUDC에서 PUA로의 매핑 공식

Big5 EUDC에서 PUA 코드 포인트로의 매핑[28][25]
Big5 범위유니코드 범위공식[29][26]
81 40–8D FEU+EEB8–U+F6B00xeeb8 + (157 * (H-0x81)) + (L<0x80)?(L-0x40):(L-0x62)
8E 40–A0 FEU+E311–U+EEB70xe311 + (157 * (H-0x8e)) + (L<0x80)?(L-0x40):(L-0x62)
C6 A1–C8 FEU+F6B1–U+F8480xf672 + (157 * (H-0xc6)) + (L<0x80)?(L-0x40):(L-0x62)
FA 40–FE FEU+E000–U+E3100xe000 + (157 * (H-0xfa)) + (L<0x80)?(L-0x40):(L-0x62)



이 매핑은 글자가 유니코드에서 정해둔 판에서 발견되지 못할 경우 HKSCS에서도 사용된다.[30][27]

참조

[1] 웹사이트 Character Sets https://www.iana.org[...]
[2] 웹사이트 Encoding.WindowsCodePage Property - .NET Framework (current version) https://msdn.microso[...] Microsoft
[3] 간행물 Chinese Character Encoding for Internet Messages https://tools.ietf.o[...] IETF 1996
[4] 웹사이트 CCSID 950 information document http://www-01.ibm.co[...]
[5] 웹사이트 CCSID 1114 information document http://www-01.ibm.co[...]
[6] 웹사이트 CCSID 947 information document http://www-01.ibm.co[...]
[7] 웹사이트 Lead byte A3: ibm-950_P110-1999 https://demo.icu-pro[...] International Components for Unicode
[8] 웹사이트 Lead byte C6: ibm-950_P110-1999 https://demo.icu-pro[...] International Components for Unicode
[9] 웹사이트 Lead byte C7: ibm-950_P110-1999 https://demo.icu-pro[...] International Components for Unicode
[10] 웹사이트 Lead byte C8: ibm-950_P110-1999 https://demo.icu-pro[...] International Components for Unicode
[11] 웹사이트 Lead byte F9: ibm-950_P110-1999 https://demo.icu-pro[...] International Components for Unicode
[12] 웹사이트 IBM Traditional Chinese Graphic Character Set for IBM BIG-5 Code https://public.dhe.i[...] IBM
[13] 웹사이트 CCSID 1370 information document http://www-01.ibm.co[...]
[14] 웹사이트 CCSID 5210 information document http://www-01.ibm.co[...]
[15] 웹사이트 CCSID 21427 information document http://www-01.ibm.co[...]
[16] 웹사이트 CPGID 01372: MS T-Chinese Big-5 (Special for DB2) http://www-01.ibm.co[...]
[17] 웹사이트 ibm-1373_P100-2002 http://icu-project.o[...] International Components for Unicode
[18] 웹사이트 Lead byte A3: ibm-1373_P100-2002 https://demo.icu-pro[...] International Components for Unicode
[19] 웹사이트 Lead byte C6: ibm-1373_P100-2002 https://demo.icu-pro[...] International Components for Unicode
[20] 웹사이트 Lead byte C7: ibm-1373_P100-2002 https://demo.icu-pro[...] International Components for Unicode
[21] 웹사이트 Lead byte C8: ibm-1373_P100-2002 https://demo.icu-pro[...] International Components for Unicode
[22] 웹사이트 Lead byte F9: ibm-1373_P100-2002 https://demo.icu-pro[...] International Components for Unicode
[23] 간행물 Code Page CPGID 01114 (pdf) https://public.dhe.i[...] IBM
[24] 간행물 Code Page CPGID 01114 (txt) https://public.dhe.i[...] IBM
[25] 웹사이트 Windows Best Fit Chart: CP950 http://ftp.unicode.o[...] unicode.org 2016-09-13
[26] 웹사이트 Big5 http://kanji-databas[...] 2016-09-13
[27] 웹사이트 Big5-HKSCS:2008 http://www.ogcio.gov[...]
[28] 웹인용 Windows Best Fit Chart: CP950 ftp://ftp.unicode.or[...] unicode.org 2016-09-13
[29] 웹인용 Big5 http://kanji-databas[...] 2016-09-13
[30] 웹인용 Big5-HKSCS:2008 http://www.ogcio.gov[...] 2017-05-25



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com