KS X 1026-1
1. 개요
KS X 1026-1은 한글 자모, 한글 자모 확장-A, 한글 자모 확장-B 영역의 문자를 '조합형 한글 낱자'로 정의하는 한국 산업 규격이다. 이 규격은 조합형 한글 낱자를 단독으로 사용할 때 채움 문자를 함께 사용하도록 하며, 여러 조합형 한글 낱자를 사용하여 겹낱자를 표현하거나 현대 한글 완성자 또는 옛한글 완성자와 조합형 한글 낱자를 섞어 쓰는 것을 금지한다. 또한, 옛한글 낱자의 모양과 정렬 순서를 수정하고, 유니코드 정규화 시 조합형 한글 낱자만을 사용하도록 규정하며, 한글 낱자를 초성, 중성, 종성 순서로 정렬하는 방식을 제시한다.
-
한국 산업 규격 정보 산업 부문 -
KS X 1001
KS X 1001은 정보 처리를 위한 문자 집합 및 인코딩 방식을 정의하는 대한민국 산업표준으로, 94x94 문자 집합을 기반으로 한글, 한자, 특수 문자 등을 포함하며 EUC-KR, ISO-2022-KR, Johab 등 다양한 인코딩 방식을 지원한다. -
한국 산업 규격 정보 산업 부문 -
KS X 1002
KS X 1002는 94×94 문자 집합으로 구성된 대한민국의 문자 코드 표준으로, 라틴 문자, 그리스 문자, 특수 문자, 확장된 현대 한글, 옛한글, 한자 등으로 구성되어 있으며, 유니코드 CJK 통합 한자 블록의 소스로 활용되었으나, 2벌식 자판 배열 기반 설계로 현대 컴퓨팅 환경에서 불편함과 호환성 문제를 가진다. -
한국어 컴퓨팅 -
한글 자판
한글 자판은 한글 입력 방식의 배열을 의미하며, 두벌식, 세벌식, 타자기 자판, 휴대 전화 자판 등 다양한 종류가 있고, 리듬감, 도깨비불 현상, 오타 수정 가능성 등 다양한 논점을 가지고 있다. -
한국어 컴퓨팅 -
KS X 1001
KS X 1001은 정보 처리를 위한 문자 집합 및 인코딩 방식을 정의하는 대한민국 산업표준으로, 94x94 문자 집합을 기반으로 한글, 한자, 특수 문자 등을 포함하며 EUC-KR, ISO-2022-KR, Johab 등 다양한 인코딩 방식을 지원한다. -
특수 문자 -
양곤
양곤은 미얀마의 최대 도시이자 과거 수도로, 6세기 몬족의 작은 어촌에서 시작되어 알라웅파야 왕에 의해 개명 및 확장되었고, 영국령 버마의 수도를 거쳐 현재는 미얀마의 상업, 경제, 문화 중심지이지만 2005년 행정 수도가 네피도로 이전되었으며 다양한 민족과 문화, 불교 사원과 역사적 건축물을 보유하고 최근 경제적 어려움을 겪고 있다. -
특수 문자 -
황제
황제는 진시황에서 유래한 최고 통치자 칭호로, 동양에서는 천자의 개념과 연결되었고 서양에서는 로마 황제의 칭호에서 유래했으며, 각 지역의 역사와 문화에 따라 다양한 호칭과 의미를 지녔으나 현재는 일본 천황만이 유일하게 그 칭호를 유지하고 있다.
2. 주요 내용
이 표준에서 조합형 한글 낱자는 한글 자모(Hangul Jamo, U+1100–U+11FF), 한글 자모 확장-A(Hangul Jamo Extended-A, U+A960–U+A97F), 한글 자모 확장-B(Hangul Jamo Extended-B, U+D7B0–U+D7FF) 영역에 속한 문자를 의미한다.
2.1. 한글 낱자 하나를 단독으로 표현할 때
한글 호환 자모(Hangul Compatibility Jamo, U+3130~U+318F) 영역의 한글 낱자는 단독으로 사용하며, 채움 문자를 넣지 않는다.
* 예: ㄱ (U+3131), ㅏ (U+314F)
조합형 한글 낱자는 반드시 채움 문자와 함께 사용해야 한다. 초성만 단독으로 나타낼 때는 중성 채움 문자(U+1160)를 뒤에 붙여야 한다. 중성만 단독으로 나타낼 때는 초성 채움 문자(U+115F)를 앞에 붙여야 한다. 종성만 단독으로 나타낼 때는 초성 채움 문자와 중성 채움 문자(U+115F U+1160)를 앞에 붙여야 한다.
* 예: ᄓᅠ (U+1113 U+1160), ᅟᅶ (U+115F U+1176), ᅟᅠᇃ (U+115F U+1160 U+11C3)
2.2. 금지된 조합
* 조합형 낱자 여러 개를 이용하여 겹낱자를 표현하지 않는다.
예: ᄖ (유니코드 U+1116)는 올바른 표현이지만, ᄂ과 ᄇ(유니코드 U+1102, U+1107)을 이어서 쓰는 방식은 허용되지 않는다.
* 현대 한글 완성자는 반드시 한글 글자 마디(Hangul Syllables, 유니코드 U+AC00~U+D7AF) 영역의 문자로 표현해야 하며, 조합형 낱자로 표현하지 않는다.
예: '한'은 유니코드 U+D55C로 표현하는 것이 올바르며, ᄒ, ᅡ, ᆫ(유니코드 U+1112, U+1161, U+11AB)을 조합하여 표현하는 것은 허용되지 않는다.
* 옛한글 완성자를 표현할 때 한글 글자 마디 영역의 문자와 조합형 낱자를 섞어 쓰지 않는다.
** 예: 초성 ㄱ, 중성 ㅏ, 종성 ᇫ으로 이루어진 글자는 각 자모의 유니코드(U+1100, U+1161, U+11EB)를 조합하여 표현하는 것이 올바르다. 완성된 글자 '가'(유니코드 U+AC00)에 종성 ᇫ(유니코드 U+11EB)을 붙여 표현하는 방식은 허용되지 않는다.
2.3. 수정된 한글 낱자들
U+11EC ᇬ, U+11ED ᇭ, U+11EE ᇮ, U+11EF ᇯ의 ㅇ(이응)을 ㆁ(옛이응)으로 바로잡았다. 글꼴을 만들 때는 ㅇ이 아니라 ㆁ으로 디자인해야 하며, 정렬할 때도 ㅇ이 아니라 ㆁ의 뒤쪽으로 정렬해야 한다.
2.4. 정규화
옛한글에 유니코드 정규화 형식 C(NFC) 또는 KC(NFKC)를 적용하면 '현대 한글 초성 + 현대 한글 중성 + 옛한글 종성'의 조합이 '현대 한글 완성자 + 옛한글 종성' 형태로 바뀌는 문제가 발생할 수 있다. KS X 1026-1 표준은 이러한 경우, 현대 한글 완성자를 사용하지 않고 조합형 한글 낱자들만을 사용하도록 요구한다. 이 표준의 부속서 B에는 구체적인 한글 정규화 처리 알고리즘이 제시되어 있다.
* 예시: 'ᄀ+ᅡ+ᇫ' (U+1100 U+1161 U+11EB)
NFC 또는 NFKC 적용 시: '가+ᇫ' (U+AC00 U+11EB)
KS X 1026-1 적용 시: 'ᄀ+ᅡ+ᇫ' (U+1100 U+1161 U+11EB) - 원래 조합 유지
2.5. 정렬
한글 낱자들(옛한글 낱자들 포함)은 다음과 같은 순서로 정렬한다.
* 초성: ᄀ, ᄁ, ᅚ, ᄂ, ᄓ, ᄔ, ᄕ, ᄖ, ᅛ, ᅜ, ᅝ, ᄃ, ᄗ, ᄄ, ᅞ, ꥠ, ꥡ, ꥢ, ꥣ, ᄅ, ꥤ, ꥥ, ᄘ, ꥦ, ꥧ, ᄙ, ꥨ, ꥩ, ꥪ, ꥫ, ꥬ, ꥭ, ꥮ, ᄚ, ᄛ, ᄆ, ꥯ, ꥰ, ᄜ, ꥱ, ᄝ, ᄇ, ᄞ, ᄟ, ᄠ, ᄈ, ᄡ, ᄢ, ᄣ, ᄤ, ᄥ, ᄦ, ꥲ, ᄧ, ᄨ, ꥳ, ᄩ, ᄪ, ꥴ, ᄫ, ᄬ, ᄉ, ᄭ, ᄮ, ᄯ, ᄰ, ᄱ, ᄲ, ᄳ, ᄊ, ꥵ, ᄴ, ᄵ, ᄶ, ᄷ, ᄸ, ᄹ, ᄺ, ᄻ, ᄼ, ᄽ, ᄾ, ᄿ, ᅀ, ᄋ, ᅁ, ᅂ, ꥶ, ᅃ, ᅄ, ᅅ, ᅆ, ᅇ, ᅈ, ᅉ, ᅊ, ᅋ, ꥷ, ᅌ, ᄌ, ᅍ, ᄍ, ꥸ, ᅎ, ᅏ, ᅐ, ᅑ, ᄎ, ᅒ, ᅓ, ᅔ, ᅕ, ᄏ, ᄐ, ꥹ, ᄑ, ᅖ, ꥺ, ᅗ, ᄒ, ꥻ, ᅘ, ᅙ, ꥼ, (채움; U+115F)
* 중성: (채움; U+1160), ᅡ, ᅶ, ᅷ, ᆣ, ᅢ, ᅣ, ᅸ, ᅹ, ᆤ, ᅤ, ᅥ, ᅺ, ᅻ, ᅼ, ᅦ, ᅧ, ᆥ, ᅽ, ᅾ, ᅨ, ᅩ, ᅪ, ᅫ, ᆦ, ᆧ, ᅿ, ᆀ, ힰ, ᆁ, ᆂ, ힱ, ᆃ, ᅬ, ᅭ, ힲ, ힳ, ᆄ, ᆅ, ힴ, ᆆ, ᆇ, ᆈ, ᅮ, ᆉ, ᆊ, ᅯ, ᆋ, ᅰ, ힵ, ᆌ, ᆍ, ᅱ, ힶ, ᅲ, ᆎ, ힷ, ᆏ, ᆐ, ᆑ, ᆒ, ힸ, ᆓ, ᆔ, ᅳ, ힹ, ힺ, ힻ, ힼ, ᆕ, ᆖ, ᅴ, ᆗ, ᅵ, ᆘ, ᆙ, ힽ, ힾ, ힿ, ퟀ, ᆚ, ퟁ, ퟂ, ᆛ, ퟃ, ᆜ, ퟄ, ᆝ, ᆞ, ퟅ, ᆟ, ퟆ, ᆠ, ᆡ, ᆢ
* 종성: (없음), ᆨ, ᆩ, ᇺ, ᇃ, ᇻ, ᆪ, ᇄ, ᇼ, ᇽ, ᇾ, ᆫ, ᇅ, ᇿ, ᇆ, ퟋ, ᇇ, ᇈ, ᆬ, ퟌ, ᇉ, ᆭ, ᆮ, ᇊ, ퟍ, ퟎ, ᇋ, ퟏ, ퟐ, ퟑ, ퟒ, ퟓ, ퟔ, ᆯ, ᆰ, ퟕ, ᇌ, ퟖ, ᇍ, ᇎ, ᇏ, ᇐ, ퟗ, ᆱ, ᇑ, ᇒ, ퟘ, ᆲ, ퟙ, ᇓ, ퟚ, ᇔ, ᇕ, ᆳ, ᇖ, ᇗ, ퟛ, ᇘ, ᆴ, ᆵ, ᆶ, ᇙ, ퟜ, ퟝ, ᆷ, ᇚ, ퟞ, ퟟ, ᇛ, ퟠ, ᇜ, ퟡ, ᇝ, ᇞ, ᇟ, ퟢ, ᇠ, ᇡ, ᇢ, ᆸ, ퟣ, ᇣ, ퟤ, ퟥ, ퟦ, ᆹ, ퟧ, ퟨ, ퟩ, ᇤ, ᇥ, ᇦ, ᆺ, ᇧ, ᇨ, ᇩ, ퟪ, ᇪ, ퟫ, ᆻ, ퟬ, ퟭ, ퟮ, ퟯ, ퟰ, ퟱ, ퟲ, ᇫ, ퟳ, ퟴ, ᆼ, ᇰ, ᇬ, ᇭ, ퟵ, ᇱ, ᇲ, ᇮ, ᇯ, ퟶ, ᆽ, ퟷ, ퟸ, ퟹ, ᆾ, ᆿ, ᇀ, ᇁ, ᇳ, ퟺ, ퟻ, ᇴ, ᇂ, ᇵ, ᇶ, ᇷ, ᇸ, ᇹ
--
--