ISO/IEC 8859-6

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

ISO/IEC 8859-6은 아랍어를 지원하는 8비트 문자 인코딩 표준이다. 1986년 아랍 표준화 및 계량 기구(ASMO)가 ASMO 708로 처음 개발했으며, ECMA-114로 채택된 후 ISO 8859-6으로 국제 표준화 기구(ISO) 표준으로 승인되었다. 이 문자 집합은 양방향 텍스트를 지원하며, 아랍어 문자와 함께 라틴 문자와 숫자, 구두점을 포함한다. ISO/IEC 8859-6은 MS-DOS, Windows 등 다양한 운영체제 및 환경에서 사용되었으며, 여러 파생 인코딩 방식이 존재한다.

ISO/IEC 8859-6
일반 정보
mime: ISO-8859-6
별칭iso-ir-127
ECMA-114
ASMO-708
arabic
csISOLatinArabic
이전 표준ASMO 449
다음 표준유니코드
분류확장 ASCII
ISO 8859
확장OEM-708, 맥 OS 아라빅 (대부분)
관련 표준Windows-1256 (비호환, 여러 문자 이동)
표준ASMO 708, ECMA-114, ISO/IEC 8859-6
📚 더 읽어볼만한 페이지
  • ISO/IEC 8859 - ISO/IEC 8859-8
    ISO/IEC 8859-8은 히브리어 텍스트 표현을 위해 설계된 ISO/IEC 8859 문자 인코딩의 일부로, 양방향 텍스트 지원 특징을 포함하며 RFC-1556에서 두 가지 변형을 정의한다.
  • ISO/IEC 8859 - ISO/IEC 8859-15
    ISO/IEC 8859-15는 ISO 8859-1을 확장하여 유로 기호와 일부 유럽어 문자를 추가한 8비트 문자 인코딩 방식이지만, UTF-8로 대체되어 널리 사용되지는 못했다.

2. 역사

아랍 표준화 및 계량 기구(ASMO)는 1986년에 아랍어 사용 국가에서 사용될 8비트 표준으로 ASMO 708을 고안하였다. 이 문자 집합은 이전 7비트 표준인 ASMO 449에서 영감을 받았지만, 몇 가지 차이점을 가진다.

ASMO 708은 양방향 문자 집합으로, 문맥(숫자가 라틴 문자인지 아랍 문자인지)에 따라 숫자는 라틴 숫자 또는 아랍 숫자로 렌더링된다. 또한 문맥에 따라 대칭 구두점은 스크립트 방향에 따라 반전된다.

ASMO 708은 ECMA와 긴밀히 협력하여 설계되었으며, ECMA는 1986년 이를 자체 ECMA-114 표준으로 채택했다. 또한 ISO 8859-6으로 ISO 표준으로 승인되었고, 1986년 코드화된 문자 집합 국제 등록에 IR 127로 등록되었다.

3. 다른 문자 집합과의 관계

ASMO 708은 원래 MS-DOS코드 페이지로 만들어졌으며, 상자 그림 문자 등 아랍어와 무관한 문자는 제외되었다. ASMO 708은 다음과 같은 여러 문자 집합들과 관련이 있다.

* ASMO 708/French 1
* French 1/ASMO 708
* ISO/IR 167
* MS-DOS용 마이크로소프트 코드 페이지 708
* MS-DOS용 마이크로소프트 코드 페이지 710 (투명 아랍어)
* MS-DOS용 마이크로소프트 코드 페이지 720 (투명 ASMO)
* 마이크로소프트 Windows 1256

문자 표에는 독립형만 표기되어 있지만, 이 문자 코드로 작성된 텍스트를 표시하려면 아랍어 결합 처리가 필요하다. 또한, 샤클은 결합 문자로 처리해야 한다. 숫자는 ASCII 숫자만 정의되어 있다.

ISO_8859-6:1987 (더 잘 알려진 MIME 이름은 ISO-8859-6)는 이 규격을 논리적 순서로 사용하고, C0 (0x00–0x1F) 및 C1 (0x80–0x9F) 부분에 ISO/IEC 6429에서 온 제어 코드를 사용한 것으로 구성된 IANA 캐릭터 세트이다. (ISO/IEC 6429 및 ISO/IEC 2022에서 온) 이스케이프 시퀀스는 해석되지 않는다. 이 캐릭터 세트의 텍스트는 논리적 순서이므로, 표시에는 양방향 텍스트 처리가 필요하다. 이 캐릭터 세트에는 iso-ir-127, ISO_8859-6, ECMA-114, ASMO-708, ArabiccsISOLatinArabic라는 별칭이 있다.

ISO-8859-6 뒤에 -e 나 -i를 붙여 명시적 또는 암묵적으로 문자 방향을 지정한 버전도 존재한다. ISO-8859-6-I는 암묵적인(논리적) 문자 방향을 가지며, ISO-8859-6-E는 제어 코드를 사용하여 명시적으로 문자 방향을 지정해야 한다. 아무것도 붙이지 않은 ISO-8859-6는 왼쪽에서 오른쪽으로 표시되도록 되어 있지만, 현실적으로 ISO-8859-6-E는 사용되지 않으며, ISO-8859-6는 ISO-8859-6-I와 마찬가지로 취급된다.

3.1. ASMO 708/French 1

ASMO 708/French 1은 프랑스어 소문자 문자를 추가한 것이다.

3.2. French 1/ASMO 708

ISO 8859-1 코드 포인트에 프랑스어 소문자 문자를 추가하고 아랍어 문자를 '이동'시킨 버전이다.

3.3. ISO/IR 167

ISO/IR 167는 프랑스어 및 독일어 문자를 추가한 버전이다.

3.4. MS-DOS 코드 페이지 708

코드 페이지 708은 마이크로소프트MS-DOS용 코드 페이지로, 코드 페이지 437의 일반적인 코드 포인트에 프랑스어 문자를 추가하고 상자 그리기 문자를 추가한 것이다.

3.5. MS-DOS 코드 페이지 710 및 720

코드 페이지 710(투명 아랍어)과 코드 페이지 720(투명 ASMO)은 코드 페이지 437의 일반적인 코드 포인트에 프랑스어 문자를 추가하고, 코드 페이지 437의 상자 그리기 문자가 원래 코드 포인트에 있도록 아랍어 문자를 '이동'시킨 마이크로소프트의 MS-DOS용 코드 페이지이다.

3.6. Windows-1256

Windows 1256은 Windows 1252 코드 포인트에 프랑스어 소문자 문자를 추가하고 아랍어 문자를 '이동'시킨 마이크로소프트의 코드 페이지이다.

4. 코드 차트

👆
좌우로 밀어서 보기
]]
| ~
| style="background-color:#CFC" |  
|-
! 8x
| rowspan="2" colspan="16" style="background-color:#CFC;valign:middle;text-align:center" | 미사용
|-
! 9x
|-
! Ax
| NBSP
| style="background-color:#CFC" |  
| style="background-color:#CFC" |  
| style="background-color:#CFC" |  
| ¤
| style="background-color:#CFC" |  
| style="background-color:#CFC" |  
| style="background-color:#CFC" |  
| style="background-color:#CFC" |  
| style="background-color:#CFC" |  
| style="background-color:#CFC" |  
| style="background-color:#CFC" |  
| ,
| SHY
| style="background-color:#CFC" |  
| style="background-color:#CFC" |  
|-
! Bx
| style="background-color:#CFC" |  
| style="background-color:#CFC" |  
| style="background-color:#CFC" |  
| style="background-color:#CFC" |  
| style="background-color:#CFC" |  
| style="background-color:#CFC" |  
| style="background-color:#CFC" |  
| style="background-color:#CFC" |  
| style="background-color:#CFC" |  
| style="background-color:#CFC" |  
| style="background-color:#CFC" |  
| ؛
| style="background-color:#CFC" |  
| style="background-color:#CFC" |  
| style="background-color:#CFC" |  
| ؟
|-
! Cx
| style="background-color:#CFC" |  
| ء
| آ
| أ
| ؤ
| إ
| ئ
| ا
| ب
| ة
| ت
| ث
| ج
| ح
| خ
| د
|-
! Dx
| ذ
| ر
| ز
| س
| ش
| ص
| ض
| ط
| ظ
| ع
| غ
| style="background-color:#CFC" |  
| style="background-color:#CFC" |  
| style="background-color:#CFC" |  
| style="background-color:#CFC" |  
| style="background-color:#CFC" |  
|-
! Ex
| ـ
| ف
| ق
| ك
| ل
| م
| ن
| ه
| و
| ى
| ي
| style="background-color:#CCF" |  ً
| style="background-color:#CCF" |  ٌ
| style="background-color:#CCF" |  ٍ
| style="background-color:#CCF" |  َ
| style="background-color:#CCF" |  ُ
|-
! Fx
| style="background-color:#CCF" |  ِ
| style="background-color:#CCF" |  ّ
| style="background-color:#CCF" |  ْ
| style="background-color:#CFC" |  
| style="background-color:#CFC" |  
| style="background-color:#CFC" |  
| style="background-color:#CFC" |  
| style="background-color:#CFC" |  
| style="background-color:#CFC" |  
| style="background-color:#CFC" |  
| style="background-color:#CFC" |  
| style="background-color:#CFC" |  
| style="background-color:#CFC" |  
| style="background-color:#CFC" |  
| style="background-color:#CFC" |  
| style="background-color:#CFC" |  
|}
위의 표에서 0x20은 일반적인 공백 문자이고, 0xA0은 NO-BREAK SPACE이다. 0xAD는 SOFT HYPHEN이며, 호환되는 웹 브라우저에서는 아무것도 표시되지 않아야 한다.

코드 값 0x00–0x1F, 0x7F, 0x80–0x9F, 0xA1–0xA3, 0xA5–0xAB, 0xB0–0xBA, 0xBC–0xBE, 0xC0, 0xDC–0xDF, 및 0xF3–0xFF는 ISO/IEC 8859-6에서 문자가 할당되지 않는다.

코드 값 0xEB–0xF2에는 결합 문자가 할당되어 있다.

5. ISO_8859-6 (ISO-8859-6)

ISO_8859-6은 IANA 캐릭터 세트로, 논리적 순서를 사용하고 C0 (0x00–0x1F) 및 C1 (0x80–0x9F) 부분에 ISO/IEC 6429에서 온 제어 코드를 사용한다. 이스케이프 시퀀스는 해석되지 않는다. 이 문자 집합의 텍스트는 논리적 순서이므로, 표시에는 양방향 텍스트 처리가 필요하다. 이 문자 집합에는 iso-ir-127, ISO_8859-6, ECMA-114, ASMO-708, ArabiccsISOLatinArabic라는 별칭이 있다.

ISO-8859-6-I는 암묵적인(논리적) 문자 방향을 가지며, ISO-8859-6-E는 제어 코드를 사용하여 명시적으로 문자 방향을 지정해야 하는 버전도 존재한다. 아무것도 붙이지 않은 ISO-8859-6에서는 왼쪽에서 오른쪽으로 표시되도록 되어 있지만, 현실적으로 ISO-8859-6-E는 사용되지 않으며, ISO-8859-6는 ISO-8859-6-I와 마찬가지로 취급된다.

ISO/IEC 8859-6
x0x1x2x3x4x5x6x7x8x9xAxBxCxDxExF
0x미사용
1x
2xSP!"#$%&'()*+,-./
3x0123456789:;<=>?
4x@ABCDEFGHIJKLMNO
5xPQRSTUVWXYZ[\\]^_
6x`abcdefghijklmno
7xpqrstuvwxyz{|[[중괄호|}
mime: ISO-8859-6
별칭iso-ir-127
ECMA-114
ASMO-708
arabic
csISOLatinArabic
이전 표준ASMO 449
다음 표준유니코드
분류확장 ASCII
ISO 8859
확장OEM-708, 맥 OS 아라빅 (대부분)
관련 표준Windows-1256 (비호환, 여러 문자 이동)
표준ASMO 708, ECMA-114, ISO/IEC 8859-6