코드 페이지 950
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
코드 페이지 950은 윈도우 운영체제에서 사용되는 문자 인코딩 방식으로, Big5 인코딩을 기반으로 한다. 마이크로소프트는 코드 페이지 950을 Big5의 ETEN 확장 문자의 하위 집합을 포함하도록 수정했으며, 2000년에는 유로 기호를 추가했다. IBM은 CCSID 950이라는 Big5 변형을 사용하며, 단일 바이트 코드 페이지 1114와 이중 바이트 코드 페이지 947로 구성된다. IBM은 마이크로소프트와의 호환성을 위해 코드 페이지 1372와 CCSID 1373을 정의하기도 했다. 코드 페이지 950과 관련된 다양한 변형과 확장, 그리고 사용자 영역 사용에 대한 정보를 제공한다.
더 읽어볼만한 페이지
- 윈도우 코드 페이지 - Windows-1252
Windows-1252는 마이크로소프트 윈도우에서 ANSI 코드 페이지로 불렸으나 ANSI 표준은 아니며, 윈도우 1.0부터 사용되어 윈도우 98에서 최종 버전이 도입되었고, HTML5 사양에서 미선언된 문자 집합으로 간주되며, 다양한 운영체제 및 환경에서 관련된 인코딩 방식들이 존재한다. - 윈도우 코드 페이지 - 코드 페이지 949
코드 페이지 949는 EUC-KR을 확장한 문자 인코딩으로, IBM과 마이크로소프트에서 다르게 정의되어 사용되며, 파이썬과 WHATWG에서도 각기 다른 레이블로 인식한다. - 중국어 컴퓨팅 - Big5
Big5는 1984년 대만에서 제정된 번체 중국어 문자 인코딩 방식으로, 로마자, 숫자, 주음부호 외에 1만 3천여 자의 한자를 포함하여 대만, 홍콩, 마카오 등에서 널리 쓰였으나 호환성 문제와 유니코드의 등장으로 사용이 줄고 있다. - 중국어 컴퓨팅 - 중국어 입력기
중국어 입력기는 디지털 기기에서 중국어를 입력하는 다양한 방식과 소프트웨어를 아우르며, 자형 기반에서 발음 기반으로 발전하여 창힐 입력법, 병음 입력 방식 등이 사용되고, 스마트폰 보급 후 터치스크린 및 음성 인식 방식과 다양한 소프트웨어가 제공되면서 지역별 선호 방식이 존재한다. - 문자 집합 - 점자
점자는 루이 브라이유가 개발한 시각 장애인용 촉각 문자 체계로, 6점 점자를 사용하여 133개 이상의 언어에 적용되었으며, 교육, 정보 접근, 사회 참여에 필수적인 역할을 수행하지만 문해력 저하와 교육의 어려움이라는 과제도 안고 있다. - 문자 집합 - ISO/IEC 646
ISO/IEC 646는 ASCII 기반의 7비트 문자 인코딩 표준으로, 국가별 변형이 존재했으나, 최종 개정판은 ASCII와 호환되도록 정의되었고, 현재는 ITU-T 권고 T.50 IRA가 현행 표준으로 유지되고 있다.
코드 페이지 950 | |
---|---|
기본 정보 | |
이름 | 코드 페이지 950 |
언어 | 중국어 정체 |
종류 | 문자 인코딩 |
상세 정보 | |
개발 | 마이크로소프트 |
기반 | Big5-ETen |
확장 | Big5 |
IANA 등록 | Character Sets |
MSDN 설명 | Encoding.WindowsCodePage Property - .NET Framework (current version) |
![]() |
2. 용어 및 변형
코드 페이지 950은 Big5의 변형으로, 마이크로소프트와 IBM 등에서 다양한 버전으로 사용된다.
Windows 코드 페이지 950은 일반적인 Big5와 비교했을 때, ETEN 확장의 일부를 포함하고 있다는 주요 차이점이 있다. IBM의 CCSID 950은 마이크로소프트의 코드 페이지 950과 유사하지만, 일부 ETEN 확장의 통합 방식과 사용자 정의 영역 등에서 차이를 보인다.[3]
마이크로소프트는 2000년에 코드 페이지 950에 유로 기호(€)를 추가했다. IBM은 유로 기호 업데이트를 포함한 Big-5 변형을 CCSID 1370으로 지칭하며, 마이크로소프트 변형과의 호환성을 위해 CCSID 1373도 정의한다.[13]
2. 1. 마이크로소프트 코드 페이지 950
마이크로소프트에서 정의한 코드 페이지 950은 "일반적인"(벤더 특정적이지 않은) Big5와 주요 차이점이 있는데, 16진수 0xF9D6부터 0xF9FE까지의 Big5에 대한 ETEN 확장의 하위 집합을 통합한다는 점이다.[3] 이 확장은 일곱 개의 중국어 문자 碁(기), 銹(수), 裏(리), 墻(장), 恒(항), 粧(장), 嫺(한)과 34개의 상자 그리기 문자 및 블록 요소로 구성된다. 다른 ETEN 확장 문자에 사용되는 범위 중 일부는 대신 최종 사용자 정의 (개인 사용) 문자로 정의된다.[3]마이크로소프트는 2000년에 코드 페이지 950 버전을 업데이트하여 이중 바이트 코드 0xA3E1에 유로 기호(€)를 추가했다.[13]
2. 2. IBM 코드 페이지 950 (CCSID 950)
IBM의 CCSID 950은 단일 바이트 코드 페이지 1114(CCSID 1114)와 이중 바이트 코드 페이지 947(CCSID 947)로 구성되며,[4][5][6] Big5 변형이기도 하지만 마이크로소프트의 코드 페이지 950과는 다소 다르다. ETEN 확장의 일부를 리드 바이트 0xA3,[7] 0xC6,[3][8] 0xC7,[9] 및 0xC8[3][10]에 대해 통합하는 반면, 마이크로소프트가 포함하는 리드 바이트 0xF9는 생략하고 대신 이를 사설 사용 영역에 사용자 정의 문자로 매핑한다.[3][11] 또한 트레일 바이트가 0x81–A0인 두 개의 비 ETEN 확장 영역을 포함하는데, 이는 일반적인 Big5 트레일 바이트 범위를 벗어나지만 Big5+ 트레일 바이트 범위와 유사하다. 영역 5는 리드 바이트가 0xF2–F9이고 IBM이 선택한 문자를 포함하며, 영역 9는 리드 바이트가 0x81–8C이고 사용자 정의 영역이다.[12]마이크로소프트는 2000년에 코드 페이지 950 버전을 업데이트하여 이중 바이트 코드 0xA3E1에 유로 기호(€)를 추가했다. IBM은 Big-5 변형의 유로 기호 업데이트를 CCSID 1370으로 지칭한다(단일 바이트(0x80) 및 이중 바이트 유로 기호 모두 포함).[13] 이는 단일 바이트 코드 페이지 1114(CCSID 5210)와 이중 바이트 코드 페이지 947(CCSID 21427)로 구성된다.[13][14][15]
IBM Db2에서 마이크로소프트 변형과의 더 나은 호환성을 위해 IBM은 순수 이중 바이트 코드 페이지 1372[16]와 관련 가변 폭 CCSID 1373도 정의하는데, 이는 이중 바이트 유로 기호만 포함하고[17] 확장 영역이 포함되는 마이크로소프트의 동작과 일치한다.[18][19][20][21][22]
2. 3. IBM CCSID 1370
IBM의 CCSID 1370은 유로 기호(€) 업데이트를 포함하는 Big-5 변형이다.[13] 이는 단일 바이트 코드 페이지 1114 (CCSID 5210)와 이중 바이트 코드 페이지 947 (CCSID 21427)로 구성된다.[13][14][15] 마이크로소프트는 2000년에 코드 페이지 950 버전을 업데이트하여 이중 바이트 코드 0xA3E1에 유로 기호를 추가했으며, IBM은 이를 CCSID 1370으로 지칭한다.2. 4. IBM 코드 페이지 1372 및 CCSID 1373
IBM CCSID 950은 단일 바이트 코드 페이지 1114(CCSID 1114)와 이중 바이트 코드 페이지 947(CCSID 947)로 구성되며,[4][5][6] Big5 변형이기도 하지만 마이크로소프트의 코드 페이지 950과는 다소 다르다. ETEN 확장의 일부를 리드 바이트 0xA3,[7] 0xC6,[3][8] 0xC7,[9] 0xC8[3][10]에 대해 통합하는 반면, 마이크로소프트가 포함하는 리드 바이트 0xF9는 생략하고 대신 이를 사설 사용 영역에 사용자 정의 문자로 매핑한다.[3][11] 또한 트레일 바이트가 0x81–A0인 두 개의 비 ETEN 확장 영역을 포함하는데, 이는 일반적인 Big5 트레일 바이트 범위를 벗어나지만 Big5+ 트레일 바이트 범위와 유사하다. 영역 5는 리드 바이트가 0xF2–F9이고 IBM이 선택한 문자를 포함하며, 영역 9는 리드 바이트가 0x81–8C이고 사용자 정의 영역이다.[12]IBM Db2에서 마이크로소프트 변형과의 더 나은 호환성을 위해 IBM은 순수 이중 바이트 코드 페이지 1372[16]와 관련 가변 폭 CCSID 1373도 정의하는데, 이는 이중 바이트 유로 기호만 포함하고[17] 확장 영역이 포함되는 마이크로소프트의 동작과 일치한다.[18][19][20][21][22]
3. IBM 코드 페이지 1114의 단일 바이트 코드
다음은 IBM에서 포함된 단일 바이트 그래픽 문자이다. 코드 0x00부터 0x1F, 0x7F는 상황에 따라 C0 제어 코드 대신 사용될 수 있다 (코드 페이지 437, 코드 페이지 897 비교). 0x80의 단일 바이트 유로 기호는 IBM CCSID 950 또는 1373, Microsoft에서도 포함되지 않는다.[23][24]
코드 | 문자 | 유니코드 | 설명 |
---|---|---|---|
0x00 | style="background:#DDD" | | ||
0x01 | style="background:#DDD" | | ||
0x02 | style="background:#DDD" | | ||
0x03 | style="background:#DDD" | | ||
0x04 | style="background:#DDD" | | ||
0x05 | style="background:#DDD" | | ||
0x06 | style="background:#DDD" | | ||
0x07 | style="background:#DDD" | | ||
0x08 | style="background:#DDD" | | ||
0x09 | style="background:#DDD" | | ||
0x0A | style="background:#DDD" | | ||
0x0B | style="background:#DDD" | | ||
0x0C | style="background:#DDD" | | ||
0x0D | style="background:#DDD" | | ||
0x0E | style="background:#DDD" | | ||
0x0F | style="background:#DDD" | | ||
0x10 | style="background:#DDD" | | ||
0x11 | style="background:#DDD" | | ||
0x12 | style="background:#DDD" | | ||
0x13 | style="background:#DDD" | | ||
0x14 | style="background:#DDD" | | ||
0x15 | style="background:#DDD" | | ||
0x16 | style="background:#DDD" | | ||
0x17 | style="background:#DDD" | | ||
0x18 | style="background:#DDD" | | ||
0x19 | style="background:#DDD" | | ||
0x1A | style="background:#DDD" | | ||
0x1B | style="background:#DDD" | | ||
0x1C | style="background:#DDD" | | ||
0x1D | style="background:#DDD" | | ||
0x1E | style="background:#DDD" | | ||
0x1F | style="background:#DDD" | | ||
0x20 | U+0020 | SP | |
0x21 | ! | U+0021 | 느낌표 |
0x22 | " | U+0022 | 큰따옴표 |
0x23 | # | U+0023 | 숫자 기호 |
0x24 | $ | U+0024 | 달러 기호 |
0x25 | % | U+0025 | 퍼센트 기호 |
0x26 | & | U+0026 | 앰퍼샌드 |
0x27 | ' | U+0027 | 아포스트로피 |
0x28 | ( | U+0028 | 왼쪽 괄호 |
0x29 | ) | U+0029 | 오른쪽 괄호 |
0x2A | * | U+002A | 별표 |
0x2B | + | U+002B | 더하기 기호 |
0x2C | , | U+002C | 쉼표 |
0x2D | - | U+002D | 하이픈 대시 |
0x2E | . | U+002E | 마침표 |
0x2F | / | U+002F | 슬래시 |
0x30 | 0 | U+0030 | 숫자 0 |
0x31 | 1 | U+0031 | 숫자 1 |
0x32 | 2 | U+0032 | 숫자 2 |
0x33 | 3 | U+0033 | 숫자 3 |
0x34 | 4 | U+0034 | 숫자 4 |
0x35 | 5 | U+0035 | 숫자 5 |
0x36 | 6 | U+0036 | 숫자 6 |
0x37 | 7 | U+0037 | 숫자 7 |
0x38 | 8 | U+0038 | 숫자 8 |
0x39 | 9 | U+0039 | 숫자 9 |
0x3A | : | U+003A | 콜론 |
0x3B | ; | U+003B | 세미콜론 |
0x3C | < | U+003C | 보다 작음 기호 |
0x3D | = | U+003D | 같음 기호 |
0x3E | > | U+003E | 보다 큼 기호 |
0x3F | ? | U+003F | 물음표 |
0x40 | @ | U+0040 | 골뱅이 |
0x41 | A | U+0041 | 라틴 대문자 A |
0x42 | B | U+0042 | 라틴 대문자 B |
0x43 | C | U+0043 | 라틴 대문자 C |
0x44 | D | U+0044 | 라틴 대문자 D |
0x45 | E | U+0045 | 라틴 대문자 E |
0x46 | F | U+0046 | 라틴 대문자 F |
0x47 | G | U+0047 | 라틴 대문자 G |
0x48 | H | U+0048 | 라틴 대문자 H |
0x49 | I | U+0049 | 라틴 대문자 I |
0x4A | J | U+004A | 라틴 대문자 J |
0x4B | K | U+004B | 라틴 대문자 K |
0x4C | L | U+004C | 라틴 대문자 L |
0x4D | M | U+004D | 라틴 대문자 M |
0x4E | N | U+004E | 라틴 대문자 N |
0x4F | O | U+004F | 라틴 대문자 O |
0x50 | P | U+0050 | 라틴 대문자 P |
0x51 | Q | U+0051 | 라틴 대문자 Q |
0x52 | R | U+0052 | 라틴 대문자 R |
0x53 | S | U+0053 | 라틴 대문자 S |
0x54 | T | U+0054 | 라틴 대문자 T |
0x55 | U | U+0055 | 라틴 대문자 U |
0x56 | V | U+0056 | 라틴 대문자 V |
0x57 | W | U+0057 | 라틴 대문자 W |
0x58 | X | U+0058 | 라틴 대문자 X |
0x59 | Y | U+0059 | 라틴 대문자 Y |
0x5A | Z | U+005A | 라틴 대문자 Z |
0x5B | U+005B | 왼쪽 대괄호 | |
0x5C | U+005C | 역 슬래시 | |
0x5D | ] | U+005D | 오른쪽 대괄호 |
0x5E | ^ | U+005E | 캐럿 |
0x5F | _ | U+005F | 밑줄 |
0x60 | ` | U+0060 | 억음 악센트 |
0x61 | a | U+0061 | 라틴 소문자 A |
0x62 | b | U+0062 | 라틴 소문자 B |
0x63 | c | U+0063 | 라틴 소문자 C |
0x64 | d | U+0064 | 라틴 소문자 D |
0x65 | e | U+0065 | 라틴 소문자 E |
0x66 | f | U+0066 | 라틴 소문자 F |
0x67 | g | U+0067 | 라틴 소문자 G |
0x68 | h | U+0068 | 라틴 소문자 H |
0x69 | i | U+0069 | 라틴 소문자 I |
0x6A | j | U+006A | 라틴 소문자 J |
0x6B | k | U+006B | 라틴 소문자 K |
0x6C | l | U+006C | 라틴 소문자 L |
0x6D | m | U+006D | 라틴 소문자 M |
0x6E | n | U+006E | 라틴 소문자 N |
0x6F | o | U+006F | 라틴 소문자 O |
0x70 | p | U+0070 | 라틴 소문자 P |
0x71 | q | U+0071 | 라틴 소문자 Q |
0x72 | r | U+0072 | 라틴 소문자 R |
0x73 | s | U+0073 | 라틴 소문자 S |
0x74 | t | U+0074 | 라틴 소문자 T |
0x75 | u | U+0075 | 라틴 소문자 U |
0x76 | v | U+0076 | 라틴 소문자 V |
0x77 | w | U+0077 | 라틴 소문자 W |
0x78 | x | U+0078 | 라틴 소문자 X |
0x79 | y | U+0079 | 라틴 소문자 Y |
0x7A | z | U+007A | 라틴 소문자 Z |
0x7B | { | U+007B | 왼쪽 중괄호 |
0x7C | \ | U+007C | 세로 막대 |
0x7D |
4. 사용자 영역 사용
Big5 확장 사용자 정의 문자(EUDC)는 개인 사용 영역(PUA) 코드 포인트에 매핑된다. 이 매핑은 글자가 유니코드에서 지정된 영역에서 발견되지 않을 경우 HKSCS에서도 사용된다.[30][27] 4. 1. Big5 EUDC에서 PUA로의 매핑 공식참조
[1]
웹사이트
Character Sets
https://www.iana.org[...]
|