맨위로가기

코드 페이지 949

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

코드 페이지 949는 EUC-KR의 확장으로, IBM과 마이크로소프트에서 다르게 정의되어 사용된다. IBM의 코드 페이지 949는 "cp949", "949", "ibm-949"로 불리며, 마이크로소프트는 "ms949" 또는 "windows-949"로 UHC(통합 한글 코드)를 지칭하며, "ks_c_5601-1987" 레이블을 할당한다. 코드 페이지 1363(IBM-1363)은 UHC를 위한 IBM의 코드 페이지로, 싱글바이트 코드 페이지 1126과 더블바이트 코드 페이지 1362의 조합이다. 파이썬은 "cp949", "949", "ms949", "uhc"를 UHC 레이블로 인식하지만 IBM-949 코덱은 포함하지 않으며, WHATWG는 "windows-949"만 인식한다.

더 읽어볼만한 페이지

  • 윈도우 코드 페이지 - Windows-1252
    Windows-1252는 마이크로소프트 윈도우에서 ANSI 코드 페이지로 불렸으나 ANSI 표준은 아니며, 윈도우 1.0부터 사용되어 윈도우 98에서 최종 버전이 도입되었고, HTML5 사양에서 미선언된 문자 집합으로 간주되며, 다양한 운영체제 및 환경에서 관련된 인코딩 방식들이 존재한다.
  • 윈도우 코드 페이지 - 코드 페이지 950
    코드 페이지 950은 윈도우 운영체제에서 사용되는 Big5 인코딩 기반의 문자 인코딩 방식이며, 마이크로소프트와 IBM에서 다양한 변형과 확장을 거쳐 사용된다.
  • 한국어 컴퓨팅 - 한글 자판
    한글 자판은 한글 입력 방식의 배열을 의미하며, 두벌식, 세벌식, 타자기 자판, 휴대 전화 자판 등 다양한 종류가 있고, 리듬감, 도깨비불 현상, 오타 수정 가능성 등 다양한 논점을 가지고 있다.
  • 한국어 컴퓨팅 - KS X 1001
    KS X 1001은 정보 처리를 위한 문자 집합 및 인코딩 방식을 정의하는 대한민국 산업표준으로, 94x94 문자 집합을 기반으로 한글, 한자, 특수 문자 등을 포함하며 EUC-KR, ISO-2022-KR, Johab 등 다양한 인코딩 방식을 지원한다.
  • 문자 인코딩 - 유니코드
    유니코드는 세계의 모든 문자를 하나의 컴퓨터 인코딩 표준으로 통합하기 위해 설계되었으며, 유니코드 컨소시엄에 의해 관리되고 UTF-8, UTF-16, UTF-32 등의 부호화 형식을 제공하지만, 일부 문자 표현 문제, 버전 간 비호환성, 레거시 인코딩과의 호환성 문제 등의 과제를 안고 있다.
  • 문자 인코딩 - UTF-8
    UTF-8은 유니코드 문자를 표현하는 가변 길이 문자 인코딩 방식으로, ASCII 코드와 호환성을 유지하며 다양한 언어의 문자를 표현할 수 있도록 설계되었지만, 보안 문제점과 공간 효율성 측면에서 단점을 가진다.
코드 페이지 949
개요
이름통합형 한글 코드
다른 이름윈도우 코드 페이지 949
IBM 코드 페이지 1363
언어한국어
확장EUC-KR
표준WHATWG 인코딩 표준 ( "EUC-KR"로 지정)
분류확장 아스키
가변 폭 인코딩
CJK 문자 인코딩
관련 항목KPS 9566-2003
KPS 9566-2011
통합형 한글 코드 레이아웃
통합형 한글 코드 레이아웃

2. 용어

통합 한글 코드(UHC)는 IANA에 인터넷을 통해 정보를 교환하는 표준으로 등록되어 있지 않다.[6] 대안으로는 UTF-8이 있다. 하지만 W3C/WHATWG 인코딩 표준은 HTML5에서 사용되며, 통합 한글 코드 확장을 "EUC-KR" 정의에 통합한다.[7]

마이크로소프트는 Windows-949에 "ks_c_5601-1987" 레이블을 할당하며,[8][9] 이는 KS X 1001 자체에 적절하게 적용된다.[10] WHATWG는 "ks_c_5601-1987" 레이블을 "EUC-KR"과 상호 교환 가능하게 취급하며 "배포된 콘텐츠와 호환"하는 것을 목표로 한다.[11] 유니코드 협회의 철회된 매핑 모음인 "OBSOLETE/EASTASIA"는 통합 한글 코드에 대한 매핑을 "KSC5601.TXT"로 포함했으며, 7비트 KS X 1001에 대한 자동 파생 매핑을 "KSX1001.TXT"로 포함했다.[12]

IBM의 코드 페이지 949는 EUC-KR의 또 다른 관련 없는 확장이다. 국제 유니코드 구성 요소 (ICU)는 해당 IBM 코드 페이지를 참조하기 위해 "cp949", "949" 또는 "ibm-949"를 사용하며,[13] UHC의 Windows 매핑을 참조하기 위해 "ms949" 또는 "windows-949"(또는 "ks_c_5601-1987"의 여러 변형)를 사용한다.[23] 반면에 파이썬은 "cp949", "949", "ms949" 및 "uhc"를 UHC의 레이블로 인식하며 IBM-949 코덱을 포함하지 않는다.[14] 코드 페이지 번호를 포함하는 레이블 중에서 WHATWG는 "windows-949"만 인식한다.[11]

3. 싱글바이트 코드

IBM의 코드 페이지 1363 (IBM-1363)은 통합 한글 코드를 위한 것으로, 싱글바이트(SBCS) 코드 페이지 1126과 더블바이트(DBCS) 코드 페이지 1362의 조합이다.[28][29][30][31] 코드 페이지 1126은 코드 페이지 437과 유사하지만, 0x5C에 ₩를 할당하는 등 일부 차이가 있다. 마이크로소프트는 0x5C를 \로 매핑하지만, 글꼴에 따라 원 기호로 표시될 수 있다.

코드 페이지 1126의 싱글바이트 부분은 다음과 같다.[28][29][30][31]

|| ~ || ⌂

|}

4. 코드 페이지 관련 정보

IBM의 코드 페이지 949 (cp949, 949, ibm-949)는 EUC-KR의 또 다른 확장이며, 국제 유니코드 구성 요소(ICU)에서 사용된다.[13] 마이크로소프트의 코드 페이지 949 (ms949, windows-949)는 통합 한글 코드(UHC)를 의미하며, ICU에서는 "ks_c_5601-1987"의 여러 변형으로 사용된다.[23] 파이썬은 "cp949", "949", "ms949", "uhc"를 UHC의 레이블로 인식하지만, IBM-949 코덱은 포함하지 않는다.[14] WHATWG는 "windows-949"만 인식한다.[11]

마이크로소프트는 Windows-949에 "ks_c_5601-1987" 레이블을 할당하며,[8][9] 이는 KS X 1001 자체에 적절하게 적용된다. KS C 5601은 KS X 1001의 원래 이름이다.[10] WHATWG는 "ks_c_5601-1987" 레이블을 "EUC-KR"과 상호 교환 가능하게 취급하며 "배포된 콘텐츠와 호환"하는 것을 목표로 한다.[11]

IBM의 통합 한글 코드에 대한 코드 페이지는 '''코드 페이지 1363''' ('''IBM-1363''') 또는 "Korean MS-Win"이라고 불린다. 이는 SBCS '''코드 페이지 1126'''과 DBCS 코드 페이지 1362의 조합이다.[15][16][17][18][19] 이는 원 기호 (U+20A9)에 대한 0x5C의 단일 바이트 매핑을 갖는다는 점에서 다르다.[20][21][22] Windows는 0x5C를 ASCII와 같이 U+005C (백슬래시에 대한 유니코드 코드 포인트)에 매핑하지만,[23] 글꼴은 종종 이를 원 기호로 렌더링한다.[24] 물결 대시의 유니코드 매핑 (0xA1AD) 또한 다르며, IBM 매핑은 U+301C를 선호하는 반면,[25] Microsoft 매핑은 U+223C (물결 연산자)를 선호한다.[26] UHC에 대한 IBM 매핑은 ICU에서 "ibm-1363"으로 사용할 수 있으며,[20] ICU "windows-949" 코덱은 일부 ICU 소스 코드 주석에서 IBM-1261로 지칭된다.[27]

통합 한글 코드는 IANA에 인터넷을 통해 정보를 교환하는 표준으로 등록되어 있지 않다.[6] 대안으로는 UTF-8이 있다. 하지만 W3C/WHATWG 인코딩 표준은 HTML5에서 사용되며, 통합 한글 코드 확장을 "EUC-KR" 정의에 통합한다.[7]

5. 유니코드 매핑 관련 정보

참조

[1] 웹사이트 한글 코드에 대하여 http://www.w3c.or.kr[...] W3C
[2] 웹사이트 KSC and UHC http://zsigri.tripod[...] 2002-06-18
[3] 간행물 INFO: Hangul (Korean) Character Sets https://support.micr[...] Microsoft
[4] 웹사이트 What are KS X 1001(KS C 5601) and other Hangul codes? http://stason.org/TU[...]
[5] 간행물 Appendix F: Vendor encoding Methods https://resources.or[...] O'Reilly Media 2009-01-13
[6] 웹사이트 Character Sets https://www.iana.org[...] 2017-01-11
[7] 간행물 5. Indexes (§ index EUC-KR) https://encoding.spe[...] WHATWG
[8] 웹사이트 Encoding.WindowsCodePage Property - .NET Framework (current version) https://msdn.microso[...] Microsoft
[9] 간행물 Code Page Identifiers https://docs.microso[...] Microsoft 2021-01-07
[10] 웹사이트 convrtrs.txt https://opensource.a[...]
[11] 웹사이트 4.2. Names and labels https://encoding.spe[...] WHATWG
[12] 웹사이트 KSX1001.TXT: KS X 1001 to Unicode table https://www.unicode.[...] Unicode, Inc
[13] 간행물 ibm-949_P110-1999 (alias cp949) https://ssl.icu-proj[...] International Components for Unicode
[14] 간행물 codecs — Codec registry and base classes § Standard Encodings https://docs.python.[...] Python Software Foundation
[15] 간행물 Coded character set identifiers - CCSID 1363 https://www-01.ibm.c[...] IBM
[16] 웹사이트 Code page 1126 information document https://www-01.ibm.c[...]
[17] 웹사이트 CCSID 1126 information document http://www-01.ibm.co[...]
[18] 웹사이트 Code page 1362 information document https://www-01.ibm.c[...]
[19] 웹사이트 CCSID 1362 information document http://www-01.ibm.co[...]
[20] 간행물 ibm-1363 http://demo.icu-proj[...] International Components for Unicode
[21] 간행물 Code Page CPGID 01126 (pdf) https://public.dhe.i[...] IBM
[22] 간행물 Code Page CPGID 01126 (txt) https://public.dhe.i[...] IBM
[23] 간행물 windows-949-2000 http://demo.icu-proj[...] International Components for Unicode
[24] 간행물 When is a backslash not a backslash? http://archives.milo[...] 2005-09-17
[25] 웹사이트 ibm-1363_P110-1997 (lead byte A1) https://ssl.icu-proj[...] International Components for Unicode
[26] 웹사이트 windows-949-2000 (lead byte A1) https://ssl.icu-proj[...] International Components for Unicode
[27] 문서 See, for reference, [https://opensource.apple.com/source/ICU/ICU-59180.0.1/icuSources/common/ucnv_lmb.cpp.auto.html ucnv_lmb.cpp] (Brendan Murray, Jim Snyder-Grant), where the lead byte 0x11 is commented as referring to "Korean: ibm-1261" after the definition of ULMBCS_GRP_KO, but it is mapped to the "windows-949" ICU codec in the OptGroupByteToCPName array later in the file.
[28] 간행물 Code Page CPGID 01126 (pdf) https://public.dhe.i[...] IBM
[29] 간행물 Code Page CPGID 01126 (txt) https://public.dhe.i[...] IBM
[30] Youtube ICU Demonstration mapping IBM-1363 to Unicode https://icu4c-demos.[...]
[31] Youtube ICU Demonstration mapping IBM-1363C (ASCII based variant) to Unicode https://icu4c-demos.[...]
[32] 웹인용 WHATWG Encoding Standard https://encoding.spe[...] 2019-01-28



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com

0123456789ABCDEF
0xNUL
1x
2xSP!"#$%&'()*+,-./
3x0123456789:;<=>?
4x@ABCDEFGHIJKLMNO
5xPQRSTUVWXYZ[]^_
6x`abcdefghijklmno
7xpqrstuvwxyz{}