ISO/IEC 6937
1. 개요
ISO/IEC 6937은 라틴 문자를 기반으로 하는 문자 집합으로, 다양한 유럽 언어 및 국제 통신에 사용되는 문자들을 포함한다. 1바이트 및 2바이트 문자를 지원하며, 1바이트 문자는 ISO 646-IRV를 따르며, 2바이트 문자는 "자폭 없는 다이어크리틱 기호"와 기본 알파벳 문자의 조합으로 구성된다. 이 문자 집합은 비디오텍스 및 월드 시스템 텔레텍스트 버전으로도 사용되며, 각 버전은 특정 기능과 문자 집합을 포함한다.
| 표준 명칭 | T.51 |
|---|---|
| 긴 명칭 | 텔레매틱 서비스를 위한 라틴 기반 코드 문자 집합 |
| 상태 | 시행 중 |
|---|---|
| 시작 연도 | 1984년 |
| 버전 | (09/92) |
| 버전 날짜 | 1992년 9월 |
| 조직 | ITU-T |
| 위원회 | 스터디 그룹 VIII |
| 도메인 | 인코딩 |
| 라이선스 | 자유로이 이용 가능 |
| 웹사이트 | T.51 : 텔레매틱 서비스를 위한 라틴 기반 코드 문자 집합 |
| 표준 | ISO/IEC 6937 ITU T.51 |
|---|---|
| 다른 이름 | 코드 페이지 20269 ISO-IR-90 (구) ISO-IR-142 (구) ISO-IR-156 |
| 기반 | ITU T.61 |
| 관련 | ETS 300 706 ISO 5426 NeXT Multinational PostScript 표준 인코딩 ITU T.101 |
-
ITU-T T 시리즈 권고 -
T.38
T.38은 IP 네트워크를 통해 팩스를 전송하는 프로토콜로, T.30 프로토콜을 기반으로 하며 스푸핑, 데이터 중복 기술을 사용하여 네트워크 문제를 해결하고, CNG, CED 신호와 이미지 데이터를 UDP 또는 TCP로 중계한다. -
ITU-T 권고 -
비대칭 디지털 가입자 회선
-
ITU-T 권고 -
팩시밀리
-
문자 인코딩 -
유니코드
유니코드는 세계의 모든 문자를 하나의 컴퓨터 인코딩 표준으로 통합하기 위해 설계되었으며, 유니코드 컨소시엄에 의해 관리되고 UTF-8, UTF-16, UTF-32 등의 부호화 형식을 제공하지만, 일부 문자 표현 문제, 버전 간 비호환성, 레거시 인코딩과의 호환성 문제 등의 과제를 안고 있다. -
문자 인코딩 -
UTF-8
2. 문자 집합
ISO/IEC 6937은 라틴 문자를 표현하기 위해 1바이트 및 2바이트 문자 코드를 사용하는 문자 집합이다.
ISO/IEC 6937 문자 집합은 다음과 같이 구성된다.
* 1바이트 문자: ASCII와 유사한 기본 라틴 문자와 추가적인 기호 및 문자를 포함한다.
* 2바이트 문자: 악센트 부호와 기본 라틴 문자를 조합하여 확장된 라틴 문자를 표현한다.
아래 표는 ISO/IEC 6937의 문자 집합을 나타낸다.
| SP | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| p | q | r | s | t | u | v | w | x | y | z | { | | | [[Bracket|} | ]]|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 악센트 | 코드 | 두 번째 문자 | 결과 |
|---|---|---|---|
| 무덤 | 0xC1 | AEIOUaeiou | ÀÈÌÒÙàèìòù |
| 급성 | 0xC2 | ACEILNORSUYZacegilnorsuyz | ÁĆÉÍĹŃÓŔŚÚÝŹáćéģíĺńóŕśúýź |
| 곡절 | 0xC3 | ACEGHIJOSUWYaceghijosuwy | ÂĈÊĜĤÎĴÔŜÛŴŶâĉêĝĥîĵôŝûŵŷ |
| 틸데 | 0xC4 | AINOUainou | ÃĨÑÕŨãĩñõũ |
| 매크론 | 0xC5 | AEIOUaeiou | ĀĒĪŌŪāēīōū |
| 브레베 | 0xC6 | AGUagu | ĂĞŬăğŭ |
| 점 | 0xC7 | CEGIZcegz | ĊĖĠİŻċėġż |
| 움라우트 또는 이중 점 | 0xC8 | AEIOUYaeiouy | ÄËÏÖÜŸäëïöüÿ |
| 링 | 0xCA | AUau | ÅŮåů |
| 세디라 | 0xCB | CGKLNRSTcklnrst | ÇĢĶĻŅŖŞŢçķļņŗşţ |
| 이중 급성 | 0xCD | OUou | ŐŰőű |
| 오고넥 | 0xCE | AEIUaeiu | ĄĘĮŲąęįų |
| 캐론 | 0xCF | CDELNRSTZcdelnrstz | ČĎĚĽŇŘŠŤŽčďěľňřšťž |
3. 코드 레이아웃
ISO/IEC 6937은 ISO/IEC 2022 그래픽 문자 세트이며, 주 세트는 94코드 세트이고 보조 세트는 96코드 세트이다. ISO 2022 코드 확장 기술을 사용하지 않는 환경에서 주 세트는 G0 세트로 지정되고 GL(0x20..0x7F)에서 호출되며, 보조 세트는 G2 세트로 지정되고 8비트 환경에서는 GR(0xA0..0xFF)에서 호출되거나, 7비트 환경에서 제어 코드 0x19를 단일 시프트로 사용하여 호출된다.
주요 세트(0x20-0x7F)는 ASCII와 대부분 동일하지만, 문자 0x24는 달러 기호($) 대신 국제 통화 기호(¤)로 지정되었다. 그러나 ITU T.51의 1992년판에서는 새로운 통신 애플리케이션에서는 달러 기호를 사용하도록 변경되었다.
보조 세트(0xA0-0xFF)에는 간격 문자, 비간격 그래픽 문자, 추가 기호 등이 포함되어 있다. 기본 세트에 없는 문자는 "비분리 구두점"과 기본 세트 문자의 조합으로 표현된다. 예를 들어, 급성 악센트가 있는 소문자 e (é)는 [급성 악센트]+e 와 같이 표현한다.
총 13개의 구두점은 기본 집합에서 선택된 문자를 따를 수 있다.
| 악센트 | 코드 | 두 번째 문자 | 결과 |
|---|---|---|---|
| 무덤 | 0xC1 | AEIOUaeiou | ÀÈÌÒÙàèìòù |
| 급성 | 0xC2 | ACEILNORSUYZacegilnorsuyz | ÁĆÉÍĹŃÓŔŚÚÝŹáćéģíĺńóŕśúýź |
| 곡절 | 0xC3 | ACEGHIJOSUWYaceghijosuwy | ÂĈÊĜĤÎĴÔŜÛŴŶâĉêĝĥîĵôŝûŵŷ |
| 틸데 | 0xC4 | AINOUainou | ÃĨÑÕŨãĩñõũ |
| 매크론 | 0xC5 | AEIOUaeiou | ĀĒĪŌŪāēīōū |
| 브레베 | 0xC6 | AGUagu | ĂĞŬăğŭ |
| 점 | 0xC7 | CEGIZcegz | ĊĖĠİŻċėġż |
| 움라우트 또는 이중 점 | 0xC8 | AEIOUYaeiouy | ÄËÏÖÜŸäëïöüÿ |
| 링 | 0xCA | AUau | ÅŮåů |
| 세디라 | 0xCB | CGKLNRSTcklnrst | ÇĢĶĻŅŖŞŢçķļņŗşţ |
| 이중 급성 | 0xCD | OUou | ŐŰőű |
| 오고넥 | 0xCE | AEIUaeiu | ĄĘĮŲąęįų |
| 캐론 | 0xCF | CDELNRSTZcdelnrstz | ČĎĚĽŇŘŠŤŽčďěľňřšťž |
아래는 ISO/IEC 6937의 코드 레이아웃 표이다. (표 생략)
4. 비디오텍스 버전
비디오텍에 대한 ITU T.101 표준에서 사용되는 보조 집합 버전은 1988년판 T.51의 첫 번째 보조 집합을 기반으로 한다.
데이터 구문 2의 기본 G2 집합은 그리스어 기본 집합의 코드와 결합하기 위해 0xC0에 ΅를 추가한다.
데이터 구문 3의 보조 집합은 "벡터 오버바"와 솔리더스 및 여러 반 그래픽 문자에 대한 비간격 기호를 추가한다.
5. 월드 시스템 텔레텍스트 버전
ETS 300 706 표준은 월드 시스템 텔레텍스트를 위해 G2 집합을 ISO 6937을 기반으로 사용한다. 이 표준은 T.61의 보충 집합의 상위 집합이며, T.51 1988년판의 첫 번째 보충 집합의 상위 집합이지만 특정 위치에서는 현재 버전의 T.51과 충돌한다. ETS 버전의 분음 부호 코드는 사용 중인 G0 집합, 예를 들어 US-ASCII 또는 BS_viewdata의 문자와 "연관"되도록 지정된다.
| Ax | SP (U+00A0) | ¡ (U+00A1) | ¢ (U+00A2) | £ (U+00A3) | $ (U+0024) | ¥ (U+00A5) | # (U+0023) | § (U+00A7) | ¤ (U+00A4) | ‘ (U+2018) | “ (U+201C) | « (U+00AB) | ← (U+2190) | ↑ (U+2191) | → (U+2192) | ↓ (U+2193) |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Bx | ° (U+00B0) | ± (U+00B1) | ² (U+00B2) | ³ (U+00B3) | × (U+00D7) | µ (U+00B5) | ¶ (U+00B6) | · (U+00B7) | ÷ (U+00F7) | ’ (U+2019) | ” (U+201D) | » (U+00BB) | ¼ (U+00BC) | ½ (U+00BD) | ¾ (U+00BE) | ¿ (U+00BF) |
| Cx | ◌̀ (U+0300) | ◌́ (U+0301) | ◌̂ (U+0302) | ◌̃ (U+0303) | ◌̄ (U+0304) | ◌̆ (U+0306) | ◌̇ (U+0307) | ◌̈ (U+0308) | ̣◌̣ (U+0323) | ◌̊ (U+030A) | ◌̧ (U+0327) | ◌̲ (U+0332) | ◌̋ (U+030B) | ◌̨ (U+0328) | ◌̌ (U+030C) | |
| Dx | ― (U+2015) | ¹ (U+00B9) | ® (U+00AE) | © (U+00A9) | ™ (U+2122) | ♪ (U+266A) | ₠ (U+20A0) | ‰ (U+2030) | α (U+03B1) | ⅛ (U+215B) | ⅜ (U+215C) | ⅝ (U+215D) | ⅞ (U+215E) | |||
| Ex | Ω (U+2126) | Æ (U+00C6) | Đ/Ð (U+0110/U+00D0) | ª (U+00AA) | Ħ (U+0126) | IJ (U+0132) | Ŀ (U+013F) | Ł (U+0141) | Ø (U+00D8) | Œ (U+0152) | º (U+00BA) | Þ (U+00DE) | Ŧ (U+0166) | Ŋ (U+014A) | ʼn (U+0149) | |
| Fx | ĸ (U+0138) | æ (U+00E6) | đ (U+0111) | ð (U+00F0) | ħ (U+0127) | ı (U+0131) | ij (U+0133) | ŀ (U+0140) | ł (U+0142) | ø (U+00F8) | œ (U+0153) | ß (U+00DF) | þ (U+00FE) | ŧ (U+0167) | ŋ (U+014B) | ■ (U+25A0) |