ISO/IEC 8859-5
1. 개요
ISO/IEC 8859-5는 키릴 문자를 지원하는 8비트 문자 인코딩 표준이다. 이 표준은 ISO 8859-1과 유사한 구조를 가지며, 키릴 문자를 포함한 다양한 언어를 지원한다. ISO/IEC 8859-5는 세르비아어, 불가리아어, 벨라루스어, 마케도니아어, 러시아어에 사용할 수 있지만, 우크라이나어의 특정 문자나 몬테네그로어의 문자를 포함하지 않아 사용에 제약이 있다. ISO/IEC 8859-5는 KOI8-R, KOI8-U, 코드 페이지 866, 코드 페이지 1251, 유니코드 등 다른 인코딩 방식에 비해 널리 사용되지 않는다.
| 이름 | ISO 8859-5 |
|---|---|
| 별칭 | ISO-IR-144, 키릴 문자, csISOLatinCyrillic |
| 표준 | ISO/IEC 8859-5, ECMA-113 (1988년 에디션 이후) |
| 분류 | 확장 ASCII, ISO 8859 |
| 확장 | US-ASCII, ISO-IR-153 |
| 확장 기능 | IBM-915 |
| 기반 | 메인 코드 페이지 |
| 언어 | 러시아어, 불가리아어, 벨라루스어, 마케도니아어, 세르비아어, 우크라이나어 (부분) |
| 이전 | ECMA-113:1986 (ISO-IR-111) |
| 관련 | IBM-1124 |
-
ISO/IEC 8859 -
ISO/IEC 8859-8
ISO/IEC 8859-8은 히브리어 텍스트 표현을 위해 설계된 ISO/IEC 8859 문자 인코딩의 일부로, 양방향 텍스트 지원 특징을 포함하며 RFC-1556에서 두 가지 변형을 정의한다. -
ISO/IEC 8859 -
ISO/IEC 8859-15
ISO/IEC 8859-15는 ISO 8859-1을 확장하여 유로 기호와 일부 유럽어 문자를 추가한 8비트 문자 인코딩 방식이지만, UTF-8로 대체되어 널리 사용되지는 못했다.
2. 지원 언어
ISO/IEC 8859-5는 다음 언어들을 지원한다.
* 세르비아어 (키릴 문자 표기)
* 불가리아어
* 벨라루스어
* 마케도니아어
* 러시아어
원래는 우크라이나어도 지원 대상이었으나, 초판 제정 당시의 정자법에서는 제외되었고 1991년에 부활한 문자 ґ우크라이나어는 포함되지 않는다. 마찬가지로, 초판 제정 후에 정자법이 정해진 몬테네그로어의 문자 з́srp, с́srp도 포함하지 않는다.
3. 코드 페이지 레이아웃
ISO 8859-1과의 차이점은 해당 유니코드 코드 포인트로 표시된다.
| 코드 | 설명 | 코드 | 설명 | 코드 | 설명 | 코드 | 설명 |
|---|---|---|---|---|---|---|---|
| Ax | NO-BREAK SPACE영어 | Bx | А | Cx | Р | Dx | а |
| A1 | Ё | B1 | Б | C1 | С | D1 | б |
| A2 | Ђ | B2 | В | C2 | Т | D2 | в |
| A3 | Ѓ | B3 | Г | C3 | У | D3 | г |
| A4 | Є | B4 | Д | C4 | Ф | D4 | д |
| A5 | Ѕ | B5 | Е | C5 | Х | D5 | е |
| A6 | І | B6 | Ж | C6 | Ц | D6 | ж |
| A7 | Ї | B7 | З | C7 | Ч | D7 | з |
| A8 | Ј | B8 | И | C8 | Ш | D8 | и |
| A9 | Љ | B9 | Й | C9 | Щ | D9 | й |
| AA | Њ | BA | К | CA | Ъ | DA | к |
| AB | Ћ | BB | Л | CB | Ы | DB | л |
| AC | Ќ | BC | М | CC | Ь | DC | м |
| AD | SOFT HYPHEN영어 | BD | Н | CD | Э | DD | н |
| AE | Ў | BE | О | CE | Ю | DE | о |
| AF | Џ | BF | П | CF | Я | DF | п |
| 코드 | 설명 | 코드 | 설명 | 코드 | 설명 | 코드 | 설명 |
| Ex | р | Fx | № | ||||
| E1 | с | F1 | ё | ||||
| E2 | т | F2 | ђ | ||||
| E3 | у | F3 | ѓ | ||||
| E4 | ф | F4 | є | ||||
| E5 | х | F5 | ѕ | ||||
| E6 | ц | F6 | і | ||||
| E7 | ч | F7 | ї | ||||
| E8 | ш | F8 | ј | ||||
| E9 | щ | F9 | љ | ||||
| EA | ъ | FA | њ | ||||
| EB | ы | FB | ћ | ||||
| EC | ь | FC | ќ | ||||
| ED | э | FD | § | ||||
| EE | ю | FE | ў | ||||
| EF | я | FF | џ |
4. 역사 및 관련 코드 페이지
ECMA-113 표준은 두 번째 에디션부터 ISO-8859-5와 동일했으며, 첫 번째 에디션(ISO-IR-111)은 초기 KOI-8의 확장판이었다. ISO-8859-5의 초기 초안은 ISO-IR-111을 따랐지만, 1987년 러시아 문자를 알파벳 순서로 재정렬했다(Ё 제외).
IBM 코드 페이지 915는 ISO/IEC 8859-5의 확장판으로, 반그래픽과 다른 기호를 C1 영역에 추가한다. IBM 코드 페이지 1124는 대부분 ISO-8859-5와 동일하지만, 우크라이나어 사용을 위해 ѓ를 ґ로 대체한다.
ISO-IR-200은 킬딘 사미어, 코미어, 네네츠어를 지원하기 위해 여러 비 러시아 문자를 변경하였다.
ISO-IR-201은 추바슈어, 코미어, 마리어 및 우드무르트어를 지원하기 위해 도입되었다.
5. 비판 및 한계
ISO/IEC 8859-5는 세르비아어(키릴 문자 표기), 불가리아어, 벨라루스어, 마케도니아어, 러시아어를 지원한다. 원래 우크라이나어도 포함되었으나, 초판 제정 당시의 맞춤법에서는 제외되었고 1991년에 부활한 문자 [[ґ]]우크라이나어를 포함하지 않는다.
실제로는 KOI8-R(러시아어), KOI8-U(우크라이나어), MS-DOS의 코드 페이지 866, Windows-1251, 유니코드 등 다른 키릴 문자 부호화 방식이 널리 사용되어 ISO/IEC 8859-5는 거의 사용되지 않는다. 특히, 현대 우크라이나어에서 필수적인 문자 Ґґ를 포함하지 않아 우크라이나어 사용자에게는 실용성이 떨어진다.