ISO/IEC 6937

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

ISO/IEC 6937은 라틴 문자를 기반으로 하는 문자 집합으로, 다양한 유럽 언어 및 국제 통신에 사용되는 문자들을 포함한다. 1바이트 및 2바이트 문자를 지원하며, 1바이트 문자는 ISO 646-IRV를 따르며, 2바이트 문자는 "자폭 없는 다이어크리틱 기호"와 기본 알파벳 문자의 조합으로 구성된다. 이 문자 집합은 비디오텍스 및 월드 시스템 텔레텍스트 버전으로도 사용되며, 각 버전은 특정 기능과 문자 집합을 포함한다.

ISO/IEC 6937

명칭

표준 명칭	T.51
긴 명칭	텔레매틱 서비스를 위한 라틴 기반 코드 문자 집합

일반 정보

상태	시행 중
시작 연도	1984년
버전	(09/92)
버전 날짜	1992년 9월
조직	ITU-T
위원회	스터디 그룹 VIII
도메인	인코딩
라이선스	자유로이 이용 가능
웹사이트	T.51 : 텔레매틱 서비스를 위한 라틴 기반 코드 문자 집합

인코딩 정보

표준	ISO/IEC 6937 ITU T.51
다른 이름	코드 페이지 20269 ISO-IR-90 (구) ISO-IR-142 (구) ISO-IR-156
기반	ITU T.61
관련	ETS 300 706 ISO 5426 NeXT Multinational PostScript 표준 인코딩 ITU T.101

📚 더 읽어볼만한 페이지

ITU-T T 시리즈 권고 - T.38
T.38은 IP 네트워크를 통해 팩스를 전송하는 프로토콜로, T.30 프로토콜을 기반으로 하며 스푸핑, 데이터 중복 기술을 사용하여 네트워크 문제를 해결하고, CNG, CED 신호와 이미지 데이터를 UDP 또는 TCP로 중계한다.
ITU-T 권고 - 비대칭 디지털 가입자 회선
ITU-T 권고 - 팩시밀리
문자 집합 - 점자
점자는 루이 브라이유가 개발한 시각 장애인용 촉각 문자 체계로, 6점 점자를 사용하여 133개 이상의 언어에 적용되었으며, 교육, 정보 접근, 사회 참여에 필수적인 역할을 수행하지만 문해력 저하와 교육의 어려움이라는 과제도 안고 있다.
문자 집합 - ISO/IEC 646
ISO/IEC 646는 ASCII 기반의 7비트 문자 인코딩 표준으로, 국가별 변형이 존재했으나, 최종 개정판은 ASCII와 호환되도록 정의되었고, 현재는 ITU-T 권고 T.50 IRA가 현행 표준으로 유지되고 있다.

1. 개요
2. 문자 집합
- 2.1. 1바이트 문자
- 2.2. 2바이트 문자
3. 코드 레이아웃
4. 비디오텍스 버전
5. 월드 시스템 텔레텍스트 버전

2. 문자 집합

ISO/IEC 6937은 라틴 문자를 표현하기 위해 1바이트 및 2바이트 문자 코드를 사용하는 문자 집합이다.

ISO/IEC 6937 문자 집합은 다음과 같이 구성된다.

* 1바이트 문자: ASCII와 유사한 기본 라틴 문자와 추가적인 기호 및 문자를 포함한다.
* 2바이트 문자: 악센트 부호와 기본 라틴 문자를 조합하여 확장된 라틴 문자를 표현한다.

아래 표는 ISO/IEC 6937의 문자 집합을 나타낸다.

👆

좌우로 밀어서 보기

]]
| ~
|
|-
!
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|-
!
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|-
!
| NBSP
| ¡
| ¢
| £
|
| ¥
|
| §
| ¤
| ‘
| “
| «
| ←
| ↑
| →
| ↓
|-
!
| °
| ±
| ²
| ³
| ×
| µ
| ¶
| ·
| ÷
| ’
| ”
| »
| ¼
| ½
| ¾
| ¿
|-
!
|
| ̀
| ́
| ̂
| ̃
| ̄
| ̆
| ̇
| ̈
|
| ̊
| ̧
|
| ̋
| ̨
| ̌
|-
!
| ―
| ¹
| ®
| ©
| ™
| ♪
| ¬
| ¦
|
|
|
|
| ⅛
| ⅜
| ⅝
| ⅞
|-
!
| Ω
| Æ
| Đ/Ð
| ª
| Ħ
|
| Ĳ
| Ŀ
| Ł
| Ø
| Œ
| º
| Þ
| Ŧ
| Ŋ
| ŉ
|-
!
| ĸ
| æ
| đ
| ð
| ħ
| ı
| ĳ
| ŀ
| ł
| ø
| œ
| ß
| þ
| ŧ
| ŋ
| SHY
|}

0xC1~0xCF 범위의 코드와 U+0300—U+036F 범위의 결합 문자는 단순히 나열된 코드 포인트에 매핑될 수 없다. 또한 유니코드는 대문자 D with stroke와 대문자 Eth를 구분하는데, 이는 일반적으로 소문자(0xF2 및 0xF3)의 경우 다르게 보인다.

1988년판 ITU T.51은 두 가지 버전의 보조 집합을 정의했는데, 첫 번째 버전에는 두 번째 버전에 있는 Non-breaking space, Soft hyphen, not sign(¬) 및 broken bar(¦)가 없었다. 첫 번째 버전은 T.61 보조 집합의 확장으로 정의되었고, 두 번째 버전은 첫 번째 버전의 확장으로 정의되었다. 현재(1992) 판은 두 번째 버전만 포함하고, 특정 문자를 폐지하며, 기존 텔레매틱 서비스가 이전 동작을 유지하도록 허용되지만, 기본 집합을 현재 ISO-646-IRV(ASCII)로 업데이트한다.

2.1. 1바이트 문자

주요 세트(전반부)는 원래 ISO 646-IRV를 따랐으며, ISO/IEC 646:1991 개정 '이전'에는 ASCII를 대부분 따랐지만 문자 0x24는 달러 기호($) 대신 "국제 통화 기호(¤)"로 지정되었다. ITU T.51의 1992년판에서는 기존 CCITT 서비스가 0x24를 국제 통화 기호로 계속 해석하도록 허용했지만, 새로운 통신 애플리케이션에서는 달러 기호(즉, 현재 ISO 646-IRV를 따름)에 사용하고, 보조 세트를 사용하여 국제 통화 기호를 나타내도록 규정했다.

보조 세트(후반부)에는 간격 문자 및 비간격 그래픽 문자, 추가 기호 및 향후 표준화를 위해 예약된 일부 위치가 포함되어 있다.

이 둘 다 ISO/IEC 2022 그래픽 문자 세트이며, 주 세트는 94코드 세트이고 보조 세트는 96코드 세트이다. ISO 2022 코드 확장 기술을 사용하지 않는 컨텍스트에서 주 세트는 G0 세트로 지정되고 GL(0x20..0x7F)에서 호출되며, 보조 세트는 G2 세트로 지정되고 8비트 환경에서는 GR(0xA0..0xFF)에서 호출되거나, 7비트 환경에서 제어 코드 0x19를 단일 시프트로 사용하여 호출된다. 이 단일 시프트 투(Single Shift Two) 코드의 인코딩은 ISO-IR-106의 위치와 일치한다.

ISO/IEC 6937의 보조 세트를 G2 세트로 지정하는 ISO/IEC 2022 이스케이프 시퀀스는 `ESC . R` (16진수 `1B 2E 52`)이다. 이전 ISO 6937/2:1983 보조 세트는 94코드 세트로 등록되어 있으며, `ESC * l` (16진수 `1B 2A 6C`)을 사용하여 G2로 지정된다.

2.2. 2바이트 문자

ISO/IEC 6937은 2바이트 문자를 사용하여 더 많은 라틴 문자를 표현한다. 2바이트 문자는 "비분리 구두점"이라고 하는 특수한 첫 번째 바이트와 기본 집합에 있는 문자의 조합으로 구성된다.

예를 들어, 급성 악센트(acute accent)가 있는 소문자 e (é)는 다음과 같이 표현된다.

: 급성 악센트 (0xC2) + e = é

ITU T.51 표준은 보조 집합에서 16진수 0xC0–CF (8비트 형식) 범위를 비분리 구두점 문자에 할당한다. 그러나 ISO/IEC 6937은 전체 지정 문자 목록을 정의하고, 구성 시퀀스 목록을 ISO/IEC 10646 문자 이름에 매핑하여 유니코드와 일치시킨다. ASCII에 없는 구두점의 간격 변형은 포함되지만, ASCII 공백은 후행 바이트이다. 따라서, 특정 조합만이 ISO/IEC 표준을 준수한다.

이러한 조합 방식은 유니코드의 결합 문자 시스템과는 다르게, 구두점 코드가 문자 앞에 온다는 점에서 ANSEL과 유사하다.

특이하게도, '세디라가 있는 라틴 소문자 G'는 급성 악센트처럼 0xC2 선행 바이트를 사용하여 코딩된다. 이는 소문자 g의 하강선이 세디라와 겹치기 때문에, 보통 위쪽에 콤마가 붙는 형태(Ģ ģ)를 사용하기 때문이다.

총 13개의 구두점은 기본 집합의 특정 문자와 결합될 수 있다.

👆

좌우로 밀어서 보기



SP	!	"	#	$	%	&	'	(	)	*	+	,	-	.	/
0	1	2	3	4	5	6	7	8	9	:	;	<	=	>	?
@	A	B	C	D	E	F	G	H	I	J	K	L	M	N	O
P	Q	R	S	T	U	V	W	X	Y	Z	[	\	]	^	_
`	a	b	c	d	e	f	g	h	i	j	k	l	m	n	o
p	q	r	s	t	u	v	w	x	y	z	{	\|	[[Bracket\|}

악센트	코드	두 번째 문자	결과
무덤	0xC1	AEIOUaeiou	ÀÈÌÒÙàèìòù
급성	0xC2	ACEILNORSUYZacegilnorsuyz	ÁĆÉÍĹŃÓŔŚÚÝŹáćéģíĺńóŕśúýź
곡절	0xC3	ACEGHIJOSUWYaceghijosuwy	ÂĈÊĜĤÎĴÔŜÛŴŶâĉêĝĥîĵôŝûŵŷ
틸데	0xC4	AINOUainou	ÃĨÑÕŨãĩñõũ
매크론	0xC5	AEIOUaeiou	ĀĒĪŌŪāēīōū
브레베	0xC6	AGUagu	ĂĞŬăğŭ
점	0xC7	CEGIZcegz	ĊĖĠİŻċėġż
움라우트 또는 이중 점	0xC8	AEIOUYaeiouy	ÄËÏÖÜŸäëïöüÿ

링	0xCA	AUau	ÅŮåů
세디라	0xCB	CGKLNRSTcklnrst	ÇĢĶĻŅŖŞŢçķļņŗşţ

이중 급성	0xCD	OUou	ŐŰőű
오고넥	0xCE	AEIUaeiu	ĄĘĮŲąęįų
캐론	0xCF	CDELNRSTZcdelnrstz	ČĎĚĽŇŘŠŤŽčďěľňřšťž

3. 코드 레이아웃

ISO/IEC 6937은 ISO/IEC 2022 그래픽 문자 세트이며, 주 세트는 94코드 세트이고 보조 세트는 96코드 세트이다. ISO 2022 코드 확장 기술을 사용하지 않는 환경에서 주 세트는 G0 세트로 지정되고 GL(0x20..0x7F)에서 호출되며, 보조 세트는 G2 세트로 지정되고 8비트 환경에서는 GR(0xA0..0xFF)에서 호출되거나, 7비트 환경에서 제어 코드 0x19를 단일 시프트로 사용하여 호출된다.

주요 세트(0x20-0x7F)는 ASCII와 대부분 동일하지만, 문자 0x24는 달러 기호($) 대신 국제 통화 기호(¤)로 지정되었다. 그러나 ITU T.51의 1992년판에서는 새로운 통신 애플리케이션에서는 달러 기호를 사용하도록 변경되었다.

보조 세트(0xA0-0xFF)에는 간격 문자, 비간격 그래픽 문자, 추가 기호 등이 포함되어 있다. 기본 세트에 없는 문자는 "비분리 구두점"과 기본 세트 문자의 조합으로 표현된다. 예를 들어, 급성 악센트가 있는 소문자 e (é)는 [급성 악센트]+e 와 같이 표현한다.

총 13개의 구두점은 기본 집합에서 선택된 문자를 따를 수 있다.

👆

좌우로 밀어서 보기

악센트	코드	두 번째 문자	결과
무덤	0xC1	AEIOUaeiou	ÀÈÌÒÙàèìòù
급성	0xC2	ACEILNORSUYZacegilnorsuyz	ÁĆÉÍĹŃÓŔŚÚÝŹáćéģíĺńóŕśúýź
곡절	0xC3	ACEGHIJOSUWYaceghijosuwy	ÂĈÊĜĤÎĴÔŜÛŴŶâĉêĝĥîĵôŝûŵŷ
틸데	0xC4	AINOUainou	ÃĨÑÕŨãĩñõũ
매크론	0xC5	AEIOUaeiou	ĀĒĪŌŪāēīōū
브레베	0xC6	AGUagu	ĂĞŬăğŭ
점	0xC7	CEGIZcegz	ĊĖĠİŻċėġż
움라우트 또는 이중 점	0xC8	AEIOUYaeiouy	ÄËÏÖÜŸäëïöüÿ

링	0xCA	AUau	ÅŮåů
세디라	0xCB	CGKLNRSTcklnrst	ÇĢĶĻŅŖŞŢçķļņŗşţ

이중 급성	0xCD	OUou	ŐŰőű
오고넥	0xCE	AEIUaeiu	ĄĘĮŲąęįų
캐론	0xCF	CDELNRSTZcdelnrstz	ČĎĚĽŇŘŠŤŽčďěľňřšťž

아래는 ISO/IEC 6937의 코드 레이아웃 표이다. (표 생략)

4. 비디오텍스 버전

비디오텍에 대한 ITU T.101 표준에서 사용되는 보조 집합 버전은 1988년판 T.51의 첫 번째 보조 집합을 기반으로 한다.

데이터 구문 2의 기본 G2 집합은 그리스어 기본 집합의 코드와 결합하기 위해 0xC0에 ΅를 추가한다.

데이터 구문 3의 보조 집합은 "벡터 오버바"와 솔리더스 및 여러 반 그래픽 문자에 대한 비간격 기호를 추가한다.

5. 월드 시스템 텔레텍스트 버전

ETS 300 706 표준은 월드 시스템 텔레텍스트를 위해 G2 집합을 ISO 6937을 기반으로 사용한다. 이 표준은 T.61의 보충 집합의 상위 집합이며, T.51 1988년판의 첫 번째 보충 집합의 상위 집합이지만 특정 위치에서는 현재 버전의 T.51과 충돌한다. ETS 버전의 분음 부호 코드는 사용 중인 G0 집합, 예를 들어 US-ASCII 또는 BS_viewdata의 문자와 "연관"되도록 지정된다.

👆

좌우로 밀어서 보기

월드 시스템 텔레텍스트, 라틴 G2 집합 (ETS 300 706:1997)
Ax	SP (U+00A0)	¡ (U+00A1)	¢ (U+00A2)	£ (U+00A3)	$ (U+0024)	¥ (U+00A5)	# (U+0023)	§ (U+00A7)	¤ (U+00A4)	‘ (U+2018)	“ (U+201C)	« (U+00AB)	← (U+2190)	↑ (U+2191)	→ (U+2192)	↓ (U+2193)
Bx	° (U+00B0)	± (U+00B1)	² (U+00B2)	³ (U+00B3)	× (U+00D7)	µ (U+00B5)	¶ (U+00B6)	· (U+00B7)	÷ (U+00F7)	’ (U+2019)	” (U+201D)	» (U+00BB)	¼ (U+00BC)	½ (U+00BD)	¾ (U+00BE)	¿ (U+00BF)
Cx		◌̀ (U+0300)	◌́ (U+0301)	◌̂ (U+0302)	◌̃ (U+0303)	◌̄ (U+0304)	◌̆ (U+0306)	◌̇ (U+0307)	◌̈ (U+0308)	̣◌̣ (U+0323)	◌̊ (U+030A)	◌̧ (U+0327)	◌̲ (U+0332)	◌̋ (U+030B)	◌̨ (U+0328)	◌̌ (U+030C)
Dx	― (U+2015)	¹ (U+00B9)	® (U+00AE)	© (U+00A9)	™ (U+2122)	♪ (U+266A)	₠ (U+20A0)	‰ (U+2030)	α (U+03B1)				⅛ (U+215B)	⅜ (U+215C)	⅝ (U+215D)	⅞ (U+215E)
Ex	Ω (U+2126)	Æ (U+00C6)	Đ/Ð (U+0110/U+00D0)	ª (U+00AA)	Ħ (U+0126)		Ĳ (U+0132)	Ŀ (U+013F)	Ł (U+0141)	Ø (U+00D8)	Œ (U+0152)	º (U+00BA)	Þ (U+00DE)	Ŧ (U+0166)	Ŋ (U+014A)	ŉ (U+0149)
Fx	ĸ (U+0138)	æ (U+00E6)	đ (U+0111)	ð (U+00F0)	ħ (U+0127)	ı (U+0131)	ĳ (U+0133)	ŀ (U+0140)	ł (U+0142)	ø (U+00F8)	œ (U+0153)	ß (U+00DF)	þ (U+00FE)	ŧ (U+0167)	ŋ (U+014B)	■ (U+25A0)