맨위로가기

ISO/IEC 6937

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

ISO/IEC 6937은 라틴 문자를 기반으로 하는 문자 집합으로, 다양한 유럽 언어 및 국제 통신에 사용되는 문자들을 포함한다. 1바이트 및 2바이트 문자를 지원하며, 1바이트 문자는 ISO 646-IRV를 따르며, 2바이트 문자는 "자폭 없는 다이어크리틱 기호"와 기본 알파벳 문자의 조합으로 구성된다. 이 문자 집합은 비디오텍스 및 월드 시스템 텔레텍스트 버전으로도 사용되며, 각 버전은 특정 기능과 문자 집합을 포함한다.

더 읽어볼만한 페이지

  • ITU-T T 시리즈 권고 - T.38
    T.38은 IP 네트워크를 통해 팩스를 전송하는 프로토콜로, T.30 프로토콜을 기반으로 하며 스푸핑, 데이터 중복 기술을 사용하여 네트워크 문제를 해결하고, CNG, CED 신호와 이미지 데이터를 UDP 또는 TCP로 중계한다.
  • 문자 집합 - 점자
    점자는 루이 브라이유가 개발한 시각 장애인용 촉각 문자 체계로, 6점 점자를 사용하여 133개 이상의 언어에 적용되었으며, 교육, 정보 접근, 사회 참여에 필수적인 역할을 수행하지만 문해력 저하와 교육의 어려움이라는 과제도 안고 있다.
  • 문자 집합 - ISO/IEC 646
    ISO/IEC 646는 ASCII 기반의 7비트 문자 인코딩 표준으로, 국가별 변형이 존재했으나, 최종 개정판은 ASCII와 호환되도록 정의되었고, 현재는 ITU-T 권고 T.50 IRA가 현행 표준으로 유지되고 있다.
  • 문자 인코딩 - 유니코드
    유니코드는 세계의 모든 문자를 하나의 컴퓨터 인코딩 표준으로 통합하기 위해 설계되었으며, 유니코드 컨소시엄에 의해 관리되고 UTF-8, UTF-16, UTF-32 등의 부호화 형식을 제공하지만, 일부 문자 표현 문제, 버전 간 비호환성, 레거시 인코딩과의 호환성 문제 등의 과제를 안고 있다.
  • 문자 인코딩 - UTF-8
    UTF-8은 유니코드 문자를 표현하는 가변 길이 문자 인코딩 방식으로, ASCII 코드와 호환성을 유지하며 다양한 언어의 문자를 표현할 수 있도록 설계되었지만, 보안 문제점과 공간 효율성 측면에서 단점을 가진다.
ISO/IEC 6937
명칭
표준 명칭T.51
긴 명칭텔레매틱 서비스를 위한 라틴 기반 코드 문자 집합
일반 정보
상태시행 중
시작 연도1984년
버전(09/92)
버전 날짜1992년 9월
조직ITU-T
위원회스터디 그룹 VIII
도메인인코딩
라이선스자유로이 이용 가능
웹사이트T.51 : 텔레매틱 서비스를 위한 라틴 기반 코드 문자 집합
인코딩 정보
표준ISO/IEC 6937
ITU T.51
다른 이름코드 페이지 20269
ISO-IR-90 (구)
ISO-IR-142 (구)
ISO-IR-156
기반ITU T.61
관련ETS 300 706
ISO 5426
NeXT Multinational
PostScript 표준 인코딩
ITU T.101

2. 문자 집합

ISO/IEC 6937은 라틴 문자를 표현하기 위해 1바이트 및 2바이트 문자 코드를 사용하는 문자 집합이다.

ISO/IEC 6937 문자 집합은 다음과 같이 구성된다.


  • 1바이트 문자: ASCII와 유사한 기본 라틴 문자와 추가적인 기호 및 문자를 포함한다.
  • 2바이트 문자: 악센트 부호와 기본 라틴 문자를 조합하여 확장된 라틴 문자를 표현한다.


아래 표는 ISO/IEC 6937의 문자 집합을 나타낸다.



| ~

|

|-

!

|

|

|

|

|

|

|

|

|

|

|

|

|

|

|

|

|-

!

|

|

|

|

|

|

|

|

|

|

|

|

|

|

|

|

|-

!

| NBSP

| ¡

| ¢

| £

|

| ¥

|

| §

| ¤

| ‘

| “

| «

| ←

| ↑

| →

| ↓

|-

!

| °

| ±

| ²

| ³

| ×

| µ

| ¶

| ·

| ÷

| ’

| ”

| »

| ¼

| ½

| ¾

| ¿

|-

!

|

| ̀

| ́

| ̂

| ̃

| ̄

| ̆

| ̇

| ̈

|

| ̊

| ̧

|

| ̋

| ̨

| ̌

|-

!

| ―

| ¹

| ®

| ©

| ™

| ♪

| ¬

| ¦

|

|

|

|

| ⅛

| ⅜

| ⅝

| ⅞

|-

!

| Ω

| Æ

| Đ/Ð

| ª

| Ħ

|

| IJ

| Ŀ

| Ł

| Ø

| Œ

| º

| Þ

| Ŧ

| Ŋ

| ʼn

|-

!

| ĸ

| æ

| đ

| ð

| ħ

| ı

| ij

| ŀ

| ł

| ø

| œ

| ß

| þ

| ŧ

| ŋ

| SHY

|}

0xC1~0xCF 범위의 코드와 U+0300—U+036F 범위의 결합 문자는 단순히 나열된 코드 포인트에 매핑될 수 없다. 또한 유니코드는 대문자 D with stroke와 대문자 Eth를 구분하는데, 이는 일반적으로 소문자(0xF2 및 0xF3)의 경우 다르게 보인다.

1988년판 ITU T.51은 두 가지 버전의 보조 집합을 정의했는데, 첫 번째 버전에는 두 번째 버전에 있는 Non-breaking space, Soft hyphen, not sign(¬) 및 broken bar(¦)가 없었다. 첫 번째 버전은 T.61 보조 집합의 확장으로 정의되었고, 두 번째 버전은 첫 번째 버전의 확장으로 정의되었다. 현재(1992) 판은 두 번째 버전만 포함하고, 특정 문자를 폐지하며, 기존 텔레매틱 서비스가 이전 동작을 유지하도록 허용되지만, 기본 집합을 현재 ISO-646-IRV(ASCII)로 업데이트한다.[6]

2. 1. 1바이트 문자

주요 세트(전반부)는 원래 ISO 646-IRV를 따랐으며, ISO/IEC 646:1991 개정 '이전'에는 ASCII를 대부분 따랐지만 문자 0x24는 달러 기호($) 대신 "국제 통화 기호(¤)"로 지정되었다. ITU T.51의 1992년판에서는 기존 CCITT 서비스가 0x24를 국제 통화 기호로 계속 해석하도록 허용했지만, 새로운 통신 애플리케이션에서는 달러 기호(즉, 현재 ISO 646-IRV를 따름)에 사용하고, 보조 세트를 사용하여 국제 통화 기호를 나타내도록 규정했다.[6]

보조 세트(후반부)에는 간격 문자 및 비간격 그래픽 문자, 추가 기호 및 향후 표준화를 위해 예약된 일부 위치가 포함되어 있다.

이 둘 다 ISO/IEC 2022 그래픽 문자 세트이며, 주 세트는 94코드 세트이고 보조 세트는 96코드 세트이다. ISO 2022 코드 확장 기술을 사용하지 않는 컨텍스트에서 주 세트는 G0 세트로 지정되고 GL(0x20..0x7F)에서 호출되며, 보조 세트는 G2 세트로 지정되고 8비트 환경에서는 GR(0xA0..0xFF)에서 호출되거나, 7비트 환경에서 제어 코드 0x19를 단일 시프트로 사용하여 호출된다.[2] 이 단일 시프트 투(Single Shift Two) 코드의 인코딩은 ISO-IR-106의 위치와 일치한다.[3]

ISO/IEC 6937의 보조 세트를 G2 세트로 지정하는 ISO/IEC 2022 이스케이프 시퀀스는 `ESC . R` (16진수 `1B 2E 52`)이다.[6][7][4] 이전 ISO 6937/2:1983 보조 세트는 94코드 세트로 등록되어 있으며, `ESC * l` (16진수 `1B 2A 6C`)을 사용하여 G2로 지정된다.[7][5]

2. 2. 2바이트 문자

ISO/IEC 6937은 2바이트 문자를 사용하여 더 많은 라틴 문자를 표현한다. 2바이트 문자는 "비분리 구두점"이라고 하는 특수한 첫 번째 바이트와 기본 집합에 있는 문자의 조합으로 구성된다.

예를 들어, 급성 악센트(acute accent)가 있는 소문자 e (é)는 다음과 같이 표현된다.

: 급성 악센트 (0xC2) + e = é

ITU T.51 표준은 보조 집합에서 16진수 0xC0–CF (8비트 형식) 범위를 비분리 구두점 문자에 할당한다.[6] 그러나 ISO/IEC 6937은 전체 지정 문자 목록을 정의하고, 구성 시퀀스 목록을 ISO/IEC 10646 문자 이름에 매핑하여 유니코드와 일치시킨다. ASCII에 없는 구두점의 간격 변형은 포함되지만, ASCII 공백은 후행 바이트이다.[7][8] 따라서, 특정 조합만이 ISO/IEC 표준을 준수한다.

이러한 조합 방식은 유니코드의 결합 문자 시스템과는 다르게, 구두점 코드가 문자 앞에 온다는 점에서 ANSEL과 유사하다.

특이하게도, '세디라가 있는 라틴 소문자 G'는 급성 악센트처럼 0xC2 선행 바이트를 사용하여 코딩된다. 이는 소문자 g의 하강선이 세디라와 겹치기 때문에, 보통 위쪽에 콤마가 붙는 형태(''Ģ ģ'')를 사용하기 때문이다.

총 13개의 구두점은 기본 집합의 특정 문자와 결합될 수 있다.

SP!"#$%&'()*+,-./
0123456789:;<=>?
@ABCDEFGHIJKLMNO
PQRSTUVWXYZ[\]^_
`abcdefghijklmno
pqrstuvwxyz{|}
악센트코드두 번째 문자결과
무덤0xC1AEIOUaeiouÀÈÌÒÙàèìòù
급성0xC2ACEILNORSUYZacegilnorsuyzÁĆÉÍĹŃÓŔŚÚÝŹáćéģíĺńóŕśúýź
곡절0xC3ACEGHIJOSUWYaceghijosuwyÂĈÊĜĤÎĴÔŜÛŴŶâĉêĝĥîĵôŝûŵŷ
틸데0xC4AINOUainouÃĨÑÕŨãĩñõũ
매크론0xC5AEIOUaeiouĀĒĪŌŪāēīōū
브레베0xC6AGUaguĂĞŬăğŭ
0xC7CEGIZcegzĊĖĠİŻċėġż
움라우트 또는 이중 점0xC8AEIOUYaeiouyÄËÏÖÜŸäëïöüÿ
colspan="4"|
0xCAAUauÅŮåů
세디라0xCBCGKLNRSTcklnrstÇĢĶĻŅŖŞŢçķļņŗşţ
colspan="4"|
이중 급성0xCDOUouŐŰőű
오고넥0xCEAEIUaeiuĄĘĮŲąęįų
캐론0xCFCDELNRSTZcdelnrstzČĎĚĽŇŘŠŤŽčďěľňřšťž


3. 코드 레이아웃

ISO/IEC 6937은 ISO/IEC 2022 그래픽 문자 세트이며, 주 세트는 94코드 세트이고 보조 세트는 96코드 세트이다. ISO 2022 코드 확장 기술을 사용하지 않는 환경에서 주 세트는 G0 세트로 지정되고 GL(0x20..0x7F)에서 호출되며, 보조 세트는 G2 세트로 지정되고 8비트 환경에서는 GR(0xA0..0xFF)에서 호출되거나, 7비트 환경에서 제어 코드 0x19를 단일 시프트로 사용하여 호출된다.[2]

주요 세트(0x20-0x7F)는 ASCII와 대부분 동일하지만, 문자 0x24는 달러 기호($) 대신 국제 통화 기호(¤)로 지정되었다. 그러나 ITU T.51의 1992년판에서는 새로운 통신 애플리케이션에서는 달러 기호를 사용하도록 변경되었다.[6]

보조 세트(0xA0-0xFF)에는 간격 문자, 비간격 그래픽 문자, 추가 기호 등이 포함되어 있다. 기본 세트에 없는 문자는 "비분리 구두점"과 기본 세트 문자의 조합으로 표현된다. 예를 들어, 급성 악센트가 있는 소문자 e (é)는 [급성 악센트]+e 와 같이 표현한다.

총 13개의 구두점은 기본 집합에서 선택된 문자를 따를 수 있다.

악센트코드두 번째 문자결과
무덤0xC1AEIOUaeiouÀÈÌÒÙàèìòù
급성0xC2ACEILNORSUYZacegilnorsuyzÁĆÉÍĹŃÓŔŚÚÝŹáćéģíĺńóŕśúýź
곡절0xC3ACEGHIJOSUWYaceghijosuwyÂĈÊĜĤÎĴÔŜÛŴŶâĉêĝĥîĵôŝûŵŷ
틸데0xC4AINOUainouÃĨÑÕŨãĩñõũ
매크론0xC5AEIOUaeiouĀĒĪŌŪāēīōū
브레베0xC6AGUaguĂĞŬăğŭ
0xC7CEGIZcegzĊĖĠİŻċėġż
움라우트 또는 이중 점0xC8AEIOUYaeiouyÄËÏÖÜŸäëïöüÿ
colspan="4"|
0xCAAUauÅŮåů
세디라0xCBCGKLNRSTcklnrstÇĢĶĻŅŖŞŢçķļņŗşţ
colspan="4"|
이중 급성0xCDOUouŐŰőű
오고넥0xCEAEIUaeiuĄĘĮŲąęįų
캐론0xCFCDELNRSTZcdelnrstzČĎĚĽŇŘŠŤŽčďěľňřšťž



아래는 ISO/IEC 6937의 코드 레이아웃 표이다. (표 생략)

4. 비디오텍스 버전

비디오텍에 대한 ITU T.101 표준에서 사용되는 보조 집합 버전은 1988년판 T.51의 첫 번째 보조 집합을 기반으로 한다.[9]

데이터 구문 2의 기본 G2 집합은 그리스어 기본 집합의 코드와 결합하기 위해 0xC0에 ΅를 추가한다.[9]

데이터 구문 3의 보조 집합은 "벡터 오버바"와 솔리더스 및 여러 반 그래픽 문자에 대한 비간격 기호를 추가한다.[10]

5. 월드 시스템 텔레텍스트 버전

ETS 300 706 표준은 월드 시스템 텔레텍스트를 위해 G2 집합을 ISO 6937을 기반으로 사용한다.[11] 이 표준은 T.61의 보충 집합의 상위 집합이며, T.51 1988년판의 첫 번째 보충 집합의 상위 집합이지만 특정 위치에서는 현재 버전의 T.51과 충돌한다. ETS 버전의 분음 부호 코드는 사용 중인 G0 집합, 예를 들어 US-ASCII 또는 BS_viewdata의 문자와 "연관"되도록 지정된다.[11]

월드 시스템 텔레텍스트, 라틴 G2 집합 (ETS 300 706:1997)[11]
AxSP (U+00A0)¡ (U+00A1)¢ (U+00A2)£ (U+00A3)$ (U+0024)¥ (U+00A5)# (U+0023)§ (U+00A7)¤ (U+00A4)‘ (U+2018)“ (U+201C)« (U+00AB)← (U+2190)↑ (U+2191)→ (U+2192)↓ (U+2193)
Bx° (U+00B0)± (U+00B1)² (U+00B2)³ (U+00B3)× (U+00D7)µ (U+00B5)¶ (U+00B6)· (U+00B7)÷ (U+00F7)’ (U+2019)” (U+201D)» (U+00BB)¼ (U+00BC)½ (U+00BD)¾ (U+00BE)¿ (U+00BF)
Cx◌̀ (U+0300)◌́ (U+0301)◌̂ (U+0302)◌̃ (U+0303)◌̄ (U+0304)◌̆ (U+0306)◌̇ (U+0307)◌̈ (U+0308)̣◌̣ (U+0323)◌̊ (U+030A)◌̧ (U+0327)◌̲ (U+0332)◌̋ (U+030B)◌̨ (U+0328)◌̌ (U+030C)
Dx― (U+2015)¹ (U+00B9)® (U+00AE)© (U+00A9)™ (U+2122)♪ (U+266A) (U+20A0)‰ (U+2030)α (U+03B1) (U+215B) (U+215C) (U+215D) (U+215E)
ExΩ (U+2126)Æ (U+00C6)Đ/Ð (U+0110/U+00D0)ª (U+00AA)Ħ (U+0126)IJ (U+0132)Ŀ (U+013F)Ł (U+0141)Ø (U+00D8)Œ (U+0152)º (U+00BA)Þ (U+00DE)Ŧ (U+0166)Ŋ (U+014A)ʼn (U+0149)
Fxĸ (U+0138)æ (U+00E6)đ (U+0111)ð (U+00F0)ħ (U+0127)ı (U+0131)ij (U+0133)ŀ (U+0140)ł (U+0142)ø (U+00F8)œ (U+0153)ß (U+00DF)þ (U+00FE)ŧ (U+0167)ŋ (U+014B)■ (U+25A0)


참조

[1] 웹사이트 T.51 : Latin based coded character sets for telematic services https://www.itu.int/[...] 2019-11-14
[2] 간행물 Recommendation T.51 (1992) Amendment 1 https://www.itu.int/[...] 1995-08-11
[3] 간행물 Teletex Primary Set of Control Functions 1985-08-01
[4] 간행물 Supplementary Set of ISO/IEC 6937:1992 1991-12-15
[5] 간행물 Supplementary Set of Latin Alphabetic and non-Alphabetic Graphic Characters 1985-01-10
[6] 간행물 Latin based coded character sets for telematic services https://www.itu.int/[...] 1992-09-18
[7] 간행물 WD 6937, Coded graphic character set for text communication - Latin alphabet http://open-std.org/[...] 1998-04-15
[8] 서적 The Telecommunications Illustrated Dictionary https://books.google[...] CRC Press 2002-05-29
[9] 간행물 Supplementary Set of Graphic Characters for Videotex 1988-11-01
[10] 간행물 Supplementary Set of Graphic Characters for CCITT Recommendation T.101, Data Syntax III 1986-11-30
[11] 간행물 Enhanced Teletext specification (PDF) https://www.etsi.org[...] 1997
[12] 문서 '[{{ISO-IR|156}} Supplementary Set of ISO/IEC 6937:1992] The high-ASCII half of the character set. (The left-hand side is [{{ISO-IR|006}} U.S. ASCII].)'
[13] 웹인용 Supplementary Set of ISO/IEC 6937:1992 https://www.itscj.ip[...]



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com