맨위로가기

국규 9566

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

KPS 9566은 조선민주주의인민공화국(북한)의 문자 인코딩 표준으로, 1993년에 제정되어 여러 차례 개정되었다. 이 표준은 ASCII 문자 집합을 기반으로 하며, 한글, 한자, 특수 문자 등을 포함한다. KPS 9566은 북한의 자모 순서와 특수 문자를 반영하며, 김일성, 김정일, 김정은의 이름을 특수하게 표기하는 문자를 포함하는 등 독자적인 특징을 갖는다. 유니코드와의 호환성 문제와 KPS 10721과 같은 관련 표준에 대한 내용도 다룬다.

더 읽어볼만한 페이지

  • 조선민주주의인민공화국의 정보 기술 - 붉은별 (운영 체제)
    붉은별 OS는 북한에서 개발된 리눅스 기반 운영 체제로, 내나라 브라우저를 탑재하고 광명망에서 사용되며, macOS와 유사한 디자인을 가진 버전과 서버용으로 사용되는 버전이 있으며 검열 기능을 포함한다.
  • 한국어 컴퓨팅 - 한글 자판
    한글 자판은 한글 입력 방식의 배열을 의미하며, 두벌식, 세벌식, 타자기 자판, 휴대 전화 자판 등 다양한 종류가 있고, 리듬감, 도깨비불 현상, 오타 수정 가능성 등 다양한 논점을 가지고 있다.
  • 한국어 컴퓨팅 - KS X 1001
    KS X 1001은 정보 처리를 위한 문자 집합 및 인코딩 방식을 정의하는 대한민국 산업표준으로, 94x94 문자 집합을 기반으로 한글, 한자, 특수 문자 등을 포함하며 EUC-KR, ISO-2022-KR, Johab 등 다양한 인코딩 방식을 지원한다.
  • 유니코드 미수록 문자 - 금석문자경
    금석문자경은 1997년 발매된 한자 글꼴 및 데이터베이스로, 다양한 버전 업데이트와 웹 데이터베이스 서비스 등을 제공하다가 2018년 사업이 종료되었다.
  • 유니코드 미수록 문자 - 약자
    약자는 한자를 간략하게 줄여 쓴 글자로, 초서 형태 반영, 일부 생략, 간단한 글자 대체 등의 방식으로 만들어지며, 한국에서는 과거 약자 제정 시도가 있었으나 사회적 공감대 부족 등으로 무산되었다.
국규 9566
개요
이름KPS 9566
다른 이름ISO-IR-202 (1997년 버전)
종류ISO 2022 호환 DBCS, CJK 인코딩
사용 언어한국어, 영어, 러시아어 (부분 지원: 그리스어, 일본어)
사용 지역조선민주주의인민공화국
규격
표준KPS 9566
인코딩 방식UHC 스타일 인코딩, EUC-KP, ISO 2022
관련 규격
다른 ISO 2022 조선글 DBCSKS X 1001, GB 12052
다른 ISO 2022 CJK DBCSJIS X 0208, GB 2312

2. 역사적 배경

ASCII 문자 집합은 1963년 미국에서 시작되었으며, 1967년에 현재의 형태로 개정되었다.[2] 같은 해 국제 표준(ECMA-6, ISO/IEC 646)으로도 채택되었다.[3] ASCII는 7비트 단일 바이트 인코딩으로 미국식 영문 텍스트 표현을 위한 기본적인 지원을 제공했다.[2][4]

1972년, ISO 646 개정판에서는 코드의 국가별 버전 개념을 도입하여, 각 국가에서 덜 사용되는 코드를 자체적으로 필요한 문자로 대체할 수 있도록 했다. 동시에 ASCII 확장을 정의하는 작업이 진행되어 1973년에 JIS X 0202, ECMA-35, ISO 2022로 발표되었다.[5] ISO 2022는 7비트 및 8비트 환경에서 단일/다중 바이트 문자 집합을 사용하는 메커니즘과 shift 코드 및 이스케이프 시퀀스를 사용하여 표준 방식으로 전환하는 메커니즘을 지정한다.[6]

동아시아 국가들은 한자를 사용하기 때문에 단일 바이트 코드로는 표현 가능한 문자 수가 부족하여, 자체적인 문자 체계를 위해 표준화된 더블 바이트 인코딩(DBCS)을 도입했다. ISO 2022를 준수하는 DBCS에서 모든 문자는 두 개의 ASCII 인쇄 가능 문자 바이트로 표현될 수 있었다.[7] 최초로 등록된 ISO 2022 준수 DBCS이자 국가 표준으로 확립된 최초의 동아시아 DBCS는 1978년에 발행된 JIS X 0208(일본)이었다.[8][9] 이어서 1980년에 GB 2312(중국 본토), 1987년에 완성형 코드(대한민국, 처음에는 KS C 5601-1987)가 나왔다.[10][9] 1984년에 정의된 Big5(대만)는 ISO 2022 구조를 따르지 않았다.[10]

한국어 표기 체계는 자음과 모음에 대한 개별 기호(자모)를 알파벳처럼 사용하지만, 각 음절에 대해 이러한 기호를 블록으로 구성하여 조판한다. 완성형 코드는 각 한국어 음절 블록을 별도로 포함하여 한자와 유사하게 큰 문자 집합으로 취급했다.[14] 이는 대한민국 표준 KS C 5601의 세 번째 판에서 처음 정의되었다. 첫 번째 판에서는 음절 블록을 시퀀스로 인코딩할 수 있는 개별 자모의 인코딩(N바이트 한글)을 정의했지만 널리 채택되지 않았다.[12][13] 완성형 코드는 가능한 모든 현대 한국어 음절을 인코딩하지 않고 가장 일반적인 2350개만 인코딩했지만,[19] 결합 시퀀스를 사용하여 지정할 수 있었고, 이는 종종 지원되지 않았다.[14] Johab이라는 대체 인코딩(또한 한국)도 존재했으며 한동안 완성형 코드와 경쟁했다.[12] 통합 한글 코드(UHC)는 마이크로소프트에서 Windows 95와 함께 도입되었으며, EUC-KR을 확장하여 Johab에서 사용할 수 있는 다른 모든 음절을 나타낼 수 있도록 했다.[14]

대한민국은 한국어를 위한 ISO 2022 DBCS를 개발한 유일한 국가는 아니었다. 중국 본토의 GB 12052가 1989년에 발행되었다. 이는 중국 북동부의 한국 소수 민족이 사용하도록 개발되었다.[19] 조선민주주의인민공화국도 KPS 9566을 개발했다. 조선민주주의인민공화국과 대한민국 모두 주요 표기 체계로 조선글(한글)을 사용하지만, 서로 다른 사전식 순서를 사용한다.[38] 따라서 문자 정렬은 완성형 코드와 KPS 9566 간에 다르다.[34]

KPS 9566은 유니코드와의 호환성 향상 등을 위해 여러 차례 개정되었다(1997년, 2003년 등).[60] 일반적으로 연도를 지정하여 표시한다(예: KPS 9566-97, 9566-2003). 붉은별 OS 3.0이 출시된 현재 판은 KPS 9566-2011로 보이며, 김정은을 지도자 목록에 추가했다.[45] KPS 9566의 1997년 판에 대한 공개적으로 사용 가능한 코드 차트는 ISO 2022 94×94 평면을 보여준다.[30] 조선민주주의인민공화국 외부에서 얻을 수 있는 정보 출처에 따르면, 더 최근 판은 GBK 또는 UHC와 유사하게 EUC 평면 외부의 추가 할당을 정의하는 것으로 보인다.[45]

여러 국가 표준과 플랫폼/글꼴 특정 독점 문자 인코딩 사용으로 인한 상호 운용성 문제 때문에, 유니코드 표준은 표현 가능한 모든 텍스트를 단일 범용 형식으로 교환할 수 있도록 하는 것을 목표로 개발되었다. 유니코드의 첫 번째 판은 1991년과 1992년에 발행되었으며,[15] ISO/IEC 10646은 1993년에 유니코드와 동기화되어 확립되었다.[16] 유니코드 형식은 월드 와이드 웹에서 국제적인 사용을 위해 선호되며, 레거시 문자 인코딩은 매핑 파일을 통해 유니코드의 부분 인코딩으로 처리된다.[17][18]

3. 구성

KPS 9566은 94x94 문자 집합으로, 특수 문자, 한글, 한자 영역 등으로 구성된다. 전체적인 구조는 KS X 1001과 유사하지만, 북한의 사전식 순서 표준에 따라 자모와 음절의 순서가 다르고, 세로쓰기용 문자와 북한 지도자 이름 표기를 위한 특수 문자를 포함하는 등 차이점이 있다.[19][34]
KPS 9566-2000은 다음과 같이 구성된다.


  • 0x21 ~ 0x2C: 특수 문자 영역 (문장 부호, 그림 문자, 한글 자모, 히라가나, 가타카나, 그리스 문자, 키릴 문자 등)
  • 0x2F: 사용자 정의 영역 A
  • 0x30 ~ 0x4C: 한글 영역 (자주 쓰이는 2679자를 북한 자모 차례에 따라 배열)
  • 0x4D ~ 0x7E: 한자 영역 (4653자를 한글 독음 순서대로 배열)
  • 0x4C행과 0x7E행의 0x50열부터는 각각 사용자 정의 영역 B·C

KPS 9566-2003은 KPS 9566-2000을 확장하여, 다음과 같은 변경 사항이 있다.

  • 0x2E행에 ISO/IEC 8859-1에는 있지만 KPS 9566-2000에 포함되지 않았던 문자 추가
  • 유니코드와의 변환표를 4.0 버전에 맞춰 변경
  • 켈빈 기호(°K)를 유로화 기호(€)로 변경하는 등 일부 문자 변경 및 삭제


KPS 9566-2003의 문자 인코딩은 8비트 문자 인코딩이며, 코드 페이지 949와 유사하다.
KPS 9566-2011은 붉은별 OS 3.0에서 사용되는 126×178 문자 집합으로, 다음과 같은 변경 사항이 있다.

  • 유니코드 매핑 일부 변경 (예: 0xA1C1을 U+02BC에서 U+FE10으로 변경)
  • 김정은의 굵은 글씨 초성 추가 (0xA4EE ~ 0xA4F0)
  • 0xA1A1부터 0xFEFE 범위를 제외한 많은 문자 (나머지 초성의 조합 문자, 한자, 기호) 추가


KPS 9566은 김일성, 김정일, 김정은의 이름을 특수하게 표기하는 문자를 포함하여 북한의 정치적 상황을 반영한다.[20][45][1] 이러한 특수 문자 때문에 KPS 9566과 유니코드 간에는 완전한 호환성이 없다.[71]

3. 1. 한글 영역

KPS 9566은 현대 한글 2679자를 북한 자모 차례에 따라 배열한다. KPS 9566-2003은 8493자의 확장 한글을 추가로 지원하며, 이는 코드 페이지 949의 확장 한글 영역과 유사하지만, 첫째 바이트가 다르다.[71]

코드 포인트 16-01부터 44-47까지는 미리 조합된 한글 음절 클러스터가 연속적인 정렬된 블록에 할당되어 있다. 모든 가능한 클러스터에 코드 포인트가 할당되는 것은 아니다.[71] KS X 1001의 서로 다른 순서 및 가용성과 비교된다.

KPS 9566-2003에 대해 문서화된 인코딩 형식은 GR(0xA1-0xFE)에서 KPS 9566 플레인을 인코딩하고, 또한 0x80-0xC2 범위의 선행 바이트와 0x41-0x5A, 0x61-0x7A 및 0x81-0xFE 범위의 후행 바이트를 사용하여 나머지 음절 클러스터를 인코딩한다.[71] 이는 통합 한글 코드와 유사하지만 KPS 9566의 생략된 클러스터와 정렬 순서가 KS X 1001과 다르다.

KPS 9566 (미리 조합된 한글 음절)
코드 범위16-0116-0216-0316-0416-0516-0616-0716-0816-0916-1016-1116-1216-1316-1416-15
302x/B0Ax가|가한국어각|각한국어간|간한국어갇|갇한국어갈|갈한국어갉|갉한국어갊|갊한국어감|감한국어갑|갑한국어값|값한국어갓|갓한국어강|강한국어갖|갖한국어갗|갗한국어같|같한국어
코드 범위16-1616-1716-1816-1916-2016-2116-2216-2316-2416-2516-2616-2716-2816-2916-3016-31
303x/B0Bx갚|갚한국어갛|갛한국어갔|갔한국어갸|갸한국어갹|갹한국어갼|갼한국어걀|걀한국어걈|걈한국어걋|걋한국어걍|걍한국어거|거한국어걱|걱한국어건|건한국어걷|걷한국어걸|걸한국어걹|걹한국어
코드 범위16-3216-3316-3416-3516-3616-3716-3816-3916-4016-4116-4216-4316-4416-4516-4616-47
304x/B0Cx걺|걺한국어검|검한국어겁|겁한국어것|것한국어겅|겅한국어겆|겆한국어겉|겉한국어겊|겊한국어겋|겋한국어겄|겄한국어겨|겨한국어격|격한국어견|견한국어겯|겯한국어결|결한국어겸|겸한국어
코드 범위16-4816-4916-5016-5116-5216-5316-5416-5516-5616-5716-5816-5916-6016-6116-6216-63
305x/B0Dx겹|겹한국어겻|겻한국어경|경한국어곁|곁한국어겪|겪한국어겼|겼한국어고|고한국어곡|곡한국어곤|곤한국어곧|곧한국어골|골한국어곪|곪한국어곬|곬한국어곯|곯한국어곰|곰한국어곱|곱한국어
코드 범위16-6416-6516-6616-6716-6816-6916-7016-7116-7216-7316-7416-7516-7616-7716-7816-79
306x/B0Ex곳|곳한국어공|공한국어곶|곶한국어곺|곺한국어교|교한국어굔|굔한국어굘|굘한국어굡|굡한국어굣|굣한국어구|구한국어국|국한국어군|군한국어굳|굳한국어굴|굴한국어굵|굵한국어굶|굶한국어
코드 범위16-8016-8116-8216-8316-8416-8516-8616-8716-8816-8916-9016-9116-9216-9316-94
307x/B0Fx굻|굻한국어굼|굼한국어굽|굽한국어굿|굿한국어궁|궁한국어궂|궂한국어규|규한국어균|균한국어귤|귤한국어귬|귬한국어귱|귱한국어그|그한국어극|극한국어근|근한국어귿|귿한국어
코드 범위17-0117-0217-0317-0417-0517-0617-0717-0817-0917-1017-1117-1217-1317-1417-15
312x/B1Ax글|글한국어긁|긁한국어긇|긇한국어금|금한국어급|급한국어긋|긋한국어긍|긍한국어기|기한국어긱|긱한국어긴|긴한국어긷|긷한국어길|길한국어긺|긺한국어김|김한국어깁|깁한국어
코드 범위17-1617-1717-1817-1917-2017-2117-2217-2317-2417-2517-2617-2717-2817-2917-3017-31
313x/B1Bx깃|깃한국어깅|깅한국어깆|깆한국어깇|깇한국어깉|깉한국어깊|깊한국어개|개한국어객|객한국어갠|갠한국어갤|갤한국어갬|갬한국어갭|갭한국어갯|갯한국어갱|갱한국어갰|갰한국어걔|걔한국어
코드 범위17-3217-3317-3417-3517-3617-3717-3817-3917-4017-4117-4217-4317-4417-4517-4617-47
314x/B1Cx걘|걘한국어걜|걜한국어게|게한국어겍|겍한국어겐|겐한국어겔|겔한국어겜|겜한국어겝|겝한국어겟|겟한국어겡|겡한국어겠|겠한국어계|계한국어곈|곈한국어곌|곌한국어곕|곕한국어곗|곗한국어
코드 범위17-4817-4917-5017-5117-5217-5317-5417-5517-5617-5717-5817-5917-6017-6117-6217-63
315x/B1Dx괴|괴한국어괵|괵한국어괸|괸한국어괼|괼한국어굄|굄한국어굅|굅한국어굇|굇한국어굉|굉한국어굈|굈한국어귀|귀한국어귁|귁한국어귄|귄한국어귈|귈한국어귐|귐한국어귑|귑한국어귓|귓한국어
코드 범위17-6417-6517-6617-6717-6817-6917-7017-7117-7217-7317-7417-7517-7617-7717-7817-79
316x/B1Ex긔|긔한국어과|과한국어곽|곽한국어관|관한국어괃|괃한국어괄|괄한국어괆|괆한국어괌|괌한국어괍|괍한국어괏|괏한국어광|광한국어괐|괐한국어궈|궈한국어궉|궉한국어권|권한국어궐|궐한국어
코드 범위17-8017-8117-8217-8317-8417-8517-8617-8717-8817-8917-9017-9117-9217-9317-94
317x/B1Fx궘|궘한국어궝|궝한국어궜|궜한국어괘|괘한국어괙|괙한국어괜|괜한국어괠|괠한국어괩|괩한국어괭|괭한국어괬|괬한국어궤|궤한국어궥|궥한국어궷|궷한국어나|나한국어낙|낙한국어
코드 범위18-0118-0218-0318-0418-0518-0618-0718-0818-0918-1018-1118-1218-1318-1418-15
322x/B2Ax낛|낛한국어난|난한국어낟|낟한국어날|날한국어낡|낡한국어낢|낢한국어남|남한국어납|납한국어낫|낫한국어낭|낭한국어낮|낮한국어낯|낯한국어낱|낱한국어낳|낳한국어낚|낚한국어
코드 범위18-1618-1718-1818-1918-2018-2118-2218-2318-2418-2518-2618-2718-28
323x/B2Bx났|났한국어냐|냐한국어냑|냑한국어냔|냔한국어냘|냘한국어냠|냠한국어냡|냡한국어냥|냥한국어너|너한국어넉|넉한국어넋|넋한국어넌|넌한국어널|널한국어



(표 계속)

3. 2. 한자 영역

69-09 (0xE5A9)의 한자는 문서화된 모든 표에서 U+676E 杮중국어에 매핑된다. 그러나 문자들은 음독에 따라 정렬되어 있어서, U+67FF 柿중국어가 의도된 것으로 보인다.[72]

3. 3. 특수 문자 영역

KPS 9566은 문장 부호, 그림 문자, 숫자, 로마자, 그리스 문자, 키릴 문자, 히라가나, 가타카나, 단위 기호, 괘선 문자 등 다양한 특수 문자를 포함한다.[45] 특히, 조선로동당의 상징(망치, 낫, 붓)과 김일성, 김정일, 김정은의 이름을 특수하게 표기하는 문자 등 북한의 특수성을 나타내는 문자들도 포함되어 있다.[45]

KPS 9566-2000은 94×94 문자 집합이며, 정렬을 제외한 전체적인 구조는 KS X 1001과 유사하다. 특수 문자 영역은 21(16진) ~ 2C(16진)에 해당하며, 여기에는 다양한 기호, 그림 문자, 한글 자모, 히라가나, 가타카나, 그리스 문자, 키릴 문자 등이 포함된다.

KPS 9566-2000에 할당된 8259자 중 83자는 유니코드에 수록되지 않았는데, 그 중 77자가 특수 기호이고, 나머지 6자는 김일성김정일 전용 한글(굵은 글자)이다. 이들은 일반 한글과는 별도로 24(16진)행의 68(16진)열부터 6D(16진)열까지 수록되어 있다.

2011년 판에는 ISO-IR-202 평면 외부에서 인코딩된 몇 가지 추가적인 한자와 기호가 포함되었는데,[45] 이 문자들은 모두 개인 사용 영역에 매핑되어 있으며, 그 목적은 알려져 있지 않다.[45] 다음은 KPS 9566-2011의 비음절, 비한자 섹션으로 주 평면 외부에 대한 표이다.[45]


4. 유니코드와의 관계 및 호환성 문제

KPS 9566은 일부 특수 문자와 지도자 이름의 특수 표기 때문에 유니코드와 완전히 호환되지 않는다. 유니코드 컨소시엄은 북한이 제안한 일부 특수 문자, 특히 정치적 성격의 문자 추가를 거부했다.[76][77] 북한은 유니코드에 "한글" 대신 "조선글자"라는 용어를 사용하고, 남북한의 정렬 순서 차이를 해결할 것을 요구했으나, 유니코드 컨소시엄은 기존 정책과 안정성을 이유로 거부했다.

KPS 9566과 유니코드 간의 완전한 왕복 변환(round trip)은 현재 지원되지 않는 문자를 개인 사용 영역(PUA)에 매핑하지 않는 한 불가능하다.[74][75] KPS 9566-2003 및 KPS 9566-2011은 확장 한글 및 특수 문자를 포함하여 유니코드와의 호환성을 일부 개선했지만, 여전히 완전한 호환성에는 미치지 못한다.

KPS 9566-2003에 할당된 16776자 중 총 22자가 당시 시점에서 유니코드에 포함되어 있지 않았는데, 그 중 16자는 특수 문자이고 나머지 6자는 "김, 일, 성, 김, 정, 일"과 같이 중복된 한글(조선어) 음절이다. 이 문자들은 0x24행 0x68열부터 0x6D열까지 배치되어 있다.[74][75]

유니코드 컨소시엄은 김씨 일가의 이름 및 조선노동당 기호(동그라미 쳐진 것과 쳐지지 않은 것 총 두 개)를 제외한 나머지 특수 문자들을 유니코드에 추가하였다. 그 결과 특수문자 2자와 "김, 일, 성, 김, 정, 일" 6자, 총 8자가 유니코드에 포함되지 않았다. 김정은이 3대 세습을 한 뒤에 김정은의 이름이 국규 9566 코드에 추가되면서, 2014년 현재 시점에서 특수문자 2자, 중복된 한글 9자("김, 일, 성, 김, 정, 일, 김, 정, 은")가 유니코드에 등재되어 있지 않다.

KPS 9566-2000에 할당된 8259자 중 83자가 유니코드에 수록되지 않았다 (일부는 유니코드 4.0에서 추가됨). 그 중 77자가 특수 기호, 나머지 6자가 김일성김정일 전용 한글 (굵은 글자, 24(16진)행의 68(16진)열부터 6D(16진)열까지)로, 일반 한글과는 별도로 수록되어 있다.

KPS 9566-2011은 126×178 문자 집합으로, 붉은별 OS 3.0의 글꼴에 사용된다. 북한 측은 이 버전에 대해 아무것도 공표하지 않아 공식적인 버전은 불분명하지만, 해당 글꼴에서 "2011KPS"라는 문자열이 발견되었기 때문에, 연구자들 사이에서는 편의상 "KPS 9566-2011"로 명명하고 있다. KPS 9566-2000과 비교하면 다음과 같은 변경 사항이 있다.


  • 유니코드 매핑을 일부 변경했다 (예: 0xA1C1을 U+02BC에서 U+FE10으로 변경).
  • 김정은의 굵은 글씨 초성을 추가했다 (0xA4EE ~ 0xA4F0).
  • 0xA1A1부터 0xFEFE 범위를 제외한 많은 문자 (나머지 초성의 조합 문자, 한자, 기호)를 추가했다.

5. KPS 10721

KPS 10721은 2000년에 발행된 북한의 보충 한자 집합 코드이다. KPS 9566에 없는 한자를 추가로 포함하며, KPS 9566의 한자도 KPS 10721에 포함되지만, ISO 2022와 관련 없는 다른 인코딩 구조를 사용한다.[19][22]

KPS 10721은 최소 19469개의 한자를 인코딩한다. 2009년 당시에는 이들 모두가 유니코드에 매핑되지는 않았지만, 통합 목록 및 정렬에서 10358자, CJK 통합 표의 문자 확장 A에서 3187자, CJK 호환 표의 문자에서 107자(모두 기본 다국어 평면)를 포함했으며, CJK 통합 표의 문자 확장 B에서 5767자, CJK 호환 표의 문자 보충에서 50자(보충 표의 문자 평면)를 포함했다.[19]

2022년 이전에는 북한 외부에서 KPS 10721 표준에 대해 알려진 바가 거의 없었다.[19][1] 유니코드 컨소시엄에서 사용할 수 있는 적절한 글꼴 데이터가 부족하여 유니코드 코드 차트에서 이러한 한자의 하위 집합에 대해서만 북한 참조 글리프가 제공되었다.[21][22] 그럼에도 불구하고 KPS 9566 또는 KPS 10721 소스를 가진 유니코드 한자 문자는 Unihan 데이터베이스에서 `kIRG_KPSource` 키를 사용하여 KPS 코드에 상호 참조된다. Unihan 소스 코드는 KPS 9566을 "KP0"으로, KPS 10721을 "KP1"으로 참조한다.[23]

2022년에는 KPS-10721-to-유니코드 매핑 데이터의 일부 오류를 수정하고 유니코드 코드 차트에 새로운 북한 참조 글리프를 제공하기 위해 사용된 북한 옥편 안드로이드 앱에서 한자 글꼴이 분리되었다. 이 과정에서 KPS 9566 한자의 KPS 10721로의 매핑도 추론되었다.[22][24] 기존 참조 글리프는 2022년 9월 유니코드 15에서 업데이트되었으며,[25] 유니코드 컨소시엄의 CJK 및 Unihan 그룹은 2022년 11월에 유니코드 기술 위원회가 추가 참조 글리프를 다음 버전의 유니코드에 포함하도록 권장했으며,[26] 이는 2023년 9월 유니코드 15.1에 포함될 예정이다.[27]

6. 대한민국 표준(KS X 1001)과의 비교

KPS 9566과 KS X 1001은 모두 한글, 한자, 특수 문자를 포함하지만, 다음과 같은 차이점이 있다.


  • 구조: KPS 9566-2000은 94×94 문자 집합이며, 정렬을 제외한 전체적인 구조는 KS X 1001과 유사하다.
  • 21(16진) ~ 2C(16진): 특수 문자 영역 (부호, 그림 문자, 한글 자모, 히라가나, 가타카나, 그리스 문자, 키릴 문자 등)
  • 2F(16진): 사용자 정의 영역
  • 30(16진) ~ 4C(16진): 한글 영역 (자주 사용되는 2679자를 조선민주주의인민공화국의 자모 배열에 따라 배열)
  • 4D(16진) ~ 7E(16진): 한자 영역 (4653자를 한글의 음독 순서에 따라 배열)
  • 4C(16진)행과 7E(16진)행의 50(16진)열부터는 각각 사용자 정의 영역 B・C가 된다.

  • 유니코드 수록 여부: KPS 9566-2000에 할당된 8259자 중 83자가 유니코드에 수록되지 않았다 (일부는 유니코드 4.0에서 추가됨).
  • 김일성, 김정일 전용 한글: 83자 중 77자는 특수 기호, 나머지 6자는 김일성김정일 전용 한글 (굵은 글자. 24(16진)행의 68(16진)열부터 6D(16진)열까지)로, 일반 한글과는 별도로 수록되어 있다.
  • 특수 문자: KPS 9566은 괄호, 따옴표, 쉼표 등과 같은 일반적인 문장 부호와 세로 쓰기에 사용되는 표현 형식을 포함한다.
  • ASCII 문장 부호: ASCII 문장 부호(강조 표시)는 기본 라틴 문자 코드 포인트에 매핑되어 표시되지만, KPS 9566을 ASCII와 결합하는 인코딩(예: 2003년판에서 정의됨)에 사용될 때는 반각 및 전각 형태 블록에 매핑된다.[71]

  • 세로 표현 형식 변경(2011): 2003년 매핑과 비교하여 2011년 매핑은 유니코드 4.1에 도입된 세로 형태 블록을 활용하기 위해 세 개의 세로 표현 형식의 유니코드 매핑을 변경했다.[45]


]] (U+007D)

  • 1-50 〈 (U+3008)
  • 1-51 〉 (U+3009)
  • 1-52 《 (U+300A)
  • 1-53 》 (U+300B)
  • 1-54 「 (U+300C)
  • 1-55 」 (U+300D)
  • 1-56 『 (U+300E)
  • 1-57 』 (U+300F)
  • 1-58 【 (U+3010)
  • 1-59 】 (U+3011)
  • 1-60 .) (U+F105)
  • 1-61 .⟫ (U+F106)
  • 1-62 ‚ (U+201A)
  • 1-63 ‛ (U+201B)

|

  • 1-64 „ (U+201E)
  • 1-65 ‟ (U+201F)
  • 1-66 ︵ (U+FE35)
  • 1-67 ︶ (U+FE36)
  • 1-68 ︹ (U+FE39)
  • 1-69 ︺ (U+FE3A)
  • 1-70 ﹇ (U+FE47)
  • 1-71 ﹈ (U+FE48)
  • 1-72 ︷ (U+FE37)
  • 1-73 ︸ (U+FE38)
  • 1-74 ︿ (U+FE3F)
  • 1-75 ﹀ (U+FE40)
  • 1-76 ︽ (U+FE3D)
  • 1-77 ︾ (U+FE3E)
  • 1-78 ﹁ (U+FE41)
  • 1-79 ﹂ (U+FE42)

|

  • 1-80 ﹃ (U+FE43)
  • 1-81 ﹄ (U+FE44)
  • 1-82 ︻ (U+FE3B)
  • 1-83 ︼ (U+FE3C)

|}

참조

[1] 웹사이트 Four of a Kind: KS X 1001 & KPS 9566 https://ccjktype.fon[...] Adobe Inc 2019-03-25
[2] 웹사이트 An annotated history of some character codes or ASCII: American Standard Code for Information Infiltration https://www.sr-ix.co[...] 2020-03-17
[3] 웹사이트 Standard ECMA-6: 7-bit Coded Character Set https://www.ecma-int[...] Ecma International
[4] 서적 CJKV Information Processing: Chinese, Japanese, Korean & Vietnamese Computing O'Reilly Media
[5] 간행물 7-bit Input/Output Coded Character Set https://www.ecma-int[...] Ecma International 1973
[6] 서적 Character Code Structure and Extension Techniques https://www.ecma-int[...] 1994
[7] 서적 CJKV Information Processing: Chinese, Japanese, Korean & Vietnamese Computing O'Reilly Media
[8] 서적 CJKV Information Processing: Chinese, Japanese, Korean & Vietnamese Computing O'Reilly Media
[9] 간행물 International Register of Coded Character Sets to be Used With Escape Sequences (ISO-IR) https://itscj.ipsj.o[...] ITSCJ/Information Processing Society of Japan
[10] 서적 CJKV Information Processing: Chinese, Japanese, Korean & Vietnamese Computing O'Reilly Media
[11] 서적 CJKV Information Processing: Chinese, Japanese, Korean & Vietnamese Computing O'Reilly Media
[12] 간행물 The Social Shaping of ICTs Standards: A Case of National Coded Character Set Standards Controversy in Korea https://www.era.lib.[...] University of Edinburgh 2005
[13] 간행물 CJK.INF Version 1.9 https://ccjktype.fon[...] 1995-12-18
[14] 웹사이트 What are KS X 1001(KS C 5601) and other Hangul codes? http://stason.org/TU[...]
[15] 웹사이트 History of Unicode Release and Publication Dates https://www.unicode.[...]
[16] 웹사이트 Unicode and ISO/IEC 10646 https://www.babelsto[...] 2019-06-17
[17] 웹사이트 XML Japanese Profile https://www.w3.org/T[...] W3C 2000-04-14
[18] 간행물 Encoding Standard https://encoding.spe[...] WHATWG
[19] 서적 CJKV Information Processing: Chinese, Japanese, Korean & Vietnamese Computing O'Reilly Media
[20] 서적 CJKV Information Processing: Chinese, Japanese, Korean & Vietnamese Computing https://books.google[...] O'Reilly Media
[21] 웹사이트 Q: Why are DPRK (North Korean == kIRG_KPSource) glyphs missing from some CJK code charts? https://www.unicode.[...] Unicode Consortium
[22] 웹사이트 Proposal to consider adding CodeCharts support for kIRG_KPSource representative glyphs in Unicode https://www.unicode.[...] 2022-10-16
[23] 웹사이트 Unicode Han Database (Unihan) https://www.unicode.[...] 2020-03-05
[24] 웹사이트 KPS 10721:2000 (Unicode KP1源) 文件重构 (修订版) http://cheonhyeong.c[...] 2022-06-19
[25] 웹사이트 CJK Compatibility Ideographs (§ DPRK compatibility ideographs https://unicode.org/[...] Unicode Consortium
[26] 웹사이트 35) L2/22-238: Proposal to consider adding CodeCharts support for kIRG_KPSource representative glyphs https://www.unicode.[...] 2022-11-01
[27] 웹사이트 US/Unicode Activity Report for IRG #60 https://www.unicode.[...] 2023-02-07
[28] IETF UTF-8, a transformation format of ISO 10646 https://tools.ietf.o[...] IETF 1998
[29] 웹사이트 Unicode Character Encoding Stability Policies https://www.unicode.[...] Unicode Consortium 2017-06-23
[30] iso-ir DPRK Standard Korean Graphic Character Set for Information Interchange 1998-06-22
[31] 웹사이트 Amendment of the part containing the Korean characters in ISO/IEC 10646-1:1998 amendment 5 https://unicode.org/[...] 1999-08-10
[32] 웹사이트 New Work item proposal (NP) for an amendment of the Korean part of ISO/IEC 10646-1:1993 https://www.unicode.[...] 1999-12-07
[33] 웹사이트 Comments on DPRK New Work Item proposal on Korean characters http://unicode.org/w[...] 2000-03-02
[34] 웹사이트 DPRK letter on character names and ordering in 10646-1: 2000 https://unicode.org/[...] 2000-07-05
[35] 웹사이트 Proposal for the addition of 14 Korean alphabets to ISO/IEC 10646-1 http://unicode.org/w[...] 2000-08-10
[36] 웹사이트 Proposal for the addition of 82 symbols to ISO/IEC 10646-1 http://unicode.org/w[...] 2000-08-10
[37] 웹사이트 Proposal to change the existing name of Korean characters in ISO/IEC 10646-1 http://unicode.org/w[...] 2000-08-10
[38] 웹사이트 Evidence for arrangement of Korean characters proposed by CSK http://unicode.org/w[...] 2000-08-10
[39] 웹사이트 Proposal to add the Hanja column of D. P. R. of Korea in ISO/IEC 10646-1 (14938 ideographs to CJK Unified Ideographs and 3181 ideographs to its Extention [sic] A) http://unicode.org/w[...] 2000-08-10
[40] 웹사이트 Report of the meeting of the Korean script ad hoc group http://unicode.org/w[...] 2000-09-21
[41] 웹사이트 Proposal to add the 160 Compatibility Hanja code table of D P R of Korea into CJK Compatibility Ideographs https://unicode.org/[...] 2001-09-03
[42] 웹사이트 A Report of Korean Script ad hoc group meeting on Oct. 15, 2001 https://web.archive.[...] 2020-04-29
[43] 웹사이트 Notes on proposed Symbols from DPRK https://www.unicode.[...] 2002-02-13
[44] 웹사이트 National Body Position: 3-way cross-reference tables - KS X 1001, KPS 9566, and UCS https://unicode.org/[...] 2002-11-30
[45] 웹사이트 Information on the most recent version of KPS 9566 (KPS 9566-2011?) https://www.unicode.[...] 2018-01-05
[46] 웹사이트 Re: Scripts in Unicode 4.0 https://www.unicode.[...] 2002-08-15
[47] 웹사이트 Miscellaneous Symbols and Arrows https://www.unicode.[...] "[[Unicode Consortium]]"
[48] 웹사이트 Miscellaneous Symbols https://www.unicode.[...] "[[Unicode Consortium]]"
[49] 웹사이트 Unicode 4.0 Emoji https://emojipedia.o[...]
[50] 웹사이트 Miscellaneous Symbols https://www.unicode.[...] "[[Unicode Consortium]]"
[51] 웹사이트 Unicode 4.0 beta characters https://www.unicode.[...] 2003-02-24
[52] 웹사이트 Emoji Symbols: Background Data—Background data for Proposal for Encoding Emoji Symbols https://www.unicode.[...]
[53] 웹사이트 Japanese TV Symbols https://www.unicode.[...] 2007-09-18
[54] 웹사이트 Emoji Versions & Sources, v13.0 https://www.unicode.[...] 2020
[55] 웹사이트 Unicode 5.2 Emoji List https://emojipedia.o[...]
[56] 웹사이트 Waving White Flag Emoji https://emojipedia.o[...]
[57] 웹사이트 Waving Black Flag Emoji https://emojipedia.o[...]
[58] 웹사이트 Proposal to reconsider compatibility symbols and punctuation used in the DPRK https://www.unicode.[...] 2018
[59] 웹사이트 KPS 9566 mappings (was Re: Arrow dingbats) https://www.unicode.[...] 2015-05-29
[60] 웹사이트 Conversion tables between KPS 9566-2003(N. Korean) & Unicode https://bz-he-de.apa[...] 2004-08-27
[61] 서적 Appendix E: Vendor Character Set Standards https://resources.or[...] "[[O'Reilly Media|O'Reilly]]"
[62] 웹사이트 Map (external version) from Mac OS Korean encoding to Unicode 3.2 and later https://unicode.org/[...] "[[Unicode Consortium]]" 2005-04-05
[63] 웹사이트 Symbols for Legacy Computing Supplement https://www.unicode.[...] 2024-05-27
[64] 웹사이트 The Cyrillic Charset Soup http://czyborra.com/[...] 2016-12-03
[65] 서적 CJKV Information Processing: Chinese, Japanese, Korean & Vietnamese Computing "[[O'Reilly Media|O'Reilly]]"
[66] 웹사이트 Re: Arrow dingbats https://www.unicode.[...] 2015-05-28
[67] 웹사이트 Proposal to add of 70 symbols to ISO/IEC 10646-1:2000 https://unicode.org/[...] 2001-09-03
[68] 웹사이트 ROK's Comments about DPRK's proposal, WG2 N 2374, to add 70 symbols to ISO/IEC 10646-1:2000 https://unicode.org/[...] 2001-10-13
[69] 웹사이트 A Report of Korean Script ad hoc group meeting on Oct. 15, 2001 https://web.archive.[...] 2020-04-29
[70] 웹사이트 Proposal to encode: SYMBOL FOR TYPE A ELECTRONICS https://www.unicode.[...] 2018
[71] 웹사이트 KPS 9566-2003 to Unicode https://unicode.org/[...] Unicode Consortium
[72] 웹사이트 KP0-E5A9 should be mapped to U+67FF instead of U+676E https://www.unicode.[...] 2021-03-17
[73] 문서 The encoding format documented by Unicode https://unicode.org/[...]
[74] 웹인용 55 лет развития внешней торговли http://www.kcckp.net[...] Внешняя торговля 2010-01-05
[75] 웹인용 북한에는 김일성, 김정일 전용 특수문자가 있다! http://blog.daum.net[...] 2010-04-14
[76] 웹인용 보관된 사본 http://std.dkuug.dk/[...] 2010-04-06
[77] 웹인용 보관된 사본 http://std.dkuug.dk/[...] 2010-04-06



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com

KPS 9566 (0x21/0xA1로 시작) 특수문자
2x/Ax3x/Bx4x/Cx5x/Dx6x/Ex7x/Fx