ISO/IEC 8859-15
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
ISO/IEC 8859-15는 1999년에 제정된 8비트 문자 인코딩 표준으로, "라틴 문자 9번"이라고도 불리며, ISO 8859-1을 확장하여 유럽 언어의 문자 지원을 개선했다. 이 표준은 유로 기호 (€), 프랑스어 문자인 Œ, œ, Ÿ, 그리고 핀란드어 및 에스토니아어에서 사용되는 Š, š, Ž, ž 등을 추가하여 ISO 8859-1과의 차이점을 보인다. ISO 8859-15는 아프리카, 서유럽, 오세아니아, 아메리카 대륙, 그리고 동아시아 언어의 로마자 표기 등 다양한 언어를 지원하며, 핀란드어, 프랑스어, 독일어 등 20개 이상의 언어에 사용된다.
더 읽어볼만한 페이지
- ISO/IEC 8859 - ISO/IEC 8859-8
ISO/IEC 8859-8은 히브리어 텍스트 표현을 위해 설계된 ISO/IEC 8859 문자 인코딩의 일부로, 양방향 텍스트 지원 특징을 포함하며 RFC-1556에서 두 가지 변형을 정의한다. - ISO/IEC 8859 - ISO/IEC 8859-3
ISO/IEC 8859-3은 서유럽 언어 외에 에스페란토, 몰타어, 튀르키예어 지원을 위해 설계된 ISO/IEC 8859 문자 인코딩 방식으로, 확장 라틴 문자, 특수 문자, 기호들을 포함하며 각 문자에 고유한 코드 포인트가 할당되어 있다.
ISO/IEC 8859-15 | |
---|---|
일반 정보 | |
다른 이름 | latin-9, latin-0 |
표준 | ISO/IEC 8859 |
기반 | ISO-8859-1 |
이전 | ISO-8859-1 |
다음 | UTF-8 |
분류 | ISO 8859 (확장 ASCII, ISO 4873 레벨 1) |
확장 | US-ASCII |
2. 역사
ISO 8859-15는 ISO 8859-1의 개정판으로 1999년에 발표되었다.
1996년 사미어 지원을 위한 제안은 거부되었지만 ISO-IR 197로 통과되었다.[6][7][8] 초기에는 ISO 8859-16과 유사한 형태로 제안되었으며, 당시에는 유로 기호 (€)가 존재하지 않았다. 이후 여러 차례 수정을 거쳐 현재의 ISO 8859-15가 완성되었다.
ISO 8859-1과 ISO 8859-15의 주요 차이점은 다음과 같다.
ISO 8859-15에서 프랑스어를 위해 가, 핀란드어와 에스토니아어의 차용어 표기를 위해 가 추가되었다.
2. 1. 초안 및 수정 과정
ISO 8859-15 식별자는 1996년에 사미어를 위해 제안되었지만 결국 거부되었고, ISO-IR 197로 통과되었다.[6][7][8]ISO 8859-16은 오늘날의 ISO 8859-15와 유사한 인코딩으로 제안되었으며, 사용되지 않거나 거의 사용되지 않는 11개의 ISO 8859-1 문자를 누락된 프랑스어 Œ œ (DEC-MCS 및 Lotus International Character Set과 동일한 위치) 및 Ÿ (이 세트와 동일한 위치가 아닌, 아이슬란드어를 위해 Ý가 그 자리에 있었음), 네덜란드어 IJ ij, 터키어 Ğ ğ İ ı Ş ş로 대체하는 것이었다. 유로 기호는 당시 존재하지 않았다.[9]
초안은 다음과 같다.
코드 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Ax | NBSP | ¡ | ¢ | £ | ¤ | IJ | ¦ | § | ij | © | ª | « | ¬ | SHY | ® | ¯ |
Bx | ° | ± | Ğ | ğ | İ | µ | ¶ | · | ı | Ş | º | » | ş | ½ | Ÿ | ¿ |
Cx | À | Á | Â | Ã | Ä | Å | Æ | Ç | È | É | Ê | Ë | Ì | Í | Î | Ï |
Dx | Ð | Ñ | Ò | Ó | Ô | Õ | Ö | Œ | Ø | Ù | Ú | Û | Ü | Ý | Þ | ß |
Ex | à | á | â | ã | ä | å | æ | ç | è | é | ê | ë | ì | í | î | ï |
Fx | ð | ñ | ò | ó | ô | õ | ö | œ | ø | ù | ú | û | ü | ý | þ | ÿ |
ISO 8859-15는 ISO 8859-1에서 8개의 문자를 변경하여 더 많은 언어를 지원한다. 특히, 유로 기호(€)와 프랑스어에 필요한 Œ, œ, Ÿ, 그리고 핀란드어와 에스토니아어에서 사용되는 Š, š, Ž, ž 등이 추가되었다.
ISO 8859-15는 아메리카, 서유럽, 오세아니아, 아프리카 대부분 지역에서 사용되는 언어와 동아시아 언어의 대부분의 표준 로마자 표기를 지원한다.[1] 각 문자는 단일 8비트 코드 값으로 인코딩되며, 이러한 코드 값은 특정 언어들을 표현하는데 사용될 수 있다.[1]
이 이름은 나중에 ISO-8859-0으로 변경되었고 1997년에 재구성되었다. 터키어 문자는 당시 UCS (유니코드) 구현이 멀지 않았고, 네덜란드어 ''IJ'' 합자는 기존의 digraph ''ij''가 적절하다고 여겨지면서 터키어에 현재보다 더 많은 피해를 줄 수 있다고 판단하여 제거되었다. 또한 웨일스어 Ŵ ŵ 및 Ŷ ŷ를 추가하는 것을 고려했지만 추가 조사를 기다리는 동안 연기되었다. 사용되지 않거나 거의 사용되지 않는 4개의 ISO 8859-1 문자 (¤, ¨, ´, ¸)는 각각 €(유로 기호), Ÿ, Œ, œ로 대체되었다.[10] 유로 (€)는 유로가 도입되면서 필요하게 되었다. Ÿ는 프랑스어 텍스트를 소문자에서 대문자로 변환하고 다시 변환할 때 손실이 없도록 하는 데 필요하며, Œ 및 œ는 프랑스어 합자이다. 아이러니하게도 마지막 세 개는 이미 DEC의 다국어 문자 세트 (MCS)에 1983년에 존재했으며, 이 문자 세트에서 ECMA-94 (1985) 및 ISO-8859-1 (1987)이 파생되었다. 원래 코드 포인트가 이제 다른 문자에 의해 점유되었으므로 재도입을 위해 덜 논리적인 코드 포인트를 선택해야 했다.
동일한 제안은 또한 6개의 문자 (¢, ¦, ±, ¼, ½, ¾)를 "최대 언어를 커버하기 위한 다른 일부 문자"로 대체하는 것을 권장했다. 이러한 문자를 선택한 이유는 제안서에 명시되어 있었다.[10]
유로 기호의 경우, 일부는 통화 기호 대신 플러스-마이너스 기호를 대체하려고 했다. 통화 기호는 일부 응용 프로그램에서 필드 구분 기호로 사용되며, 다른 응용 프로그램에서는 소계를 나타내는 데 사용된다. 이에 대한 강력한 반대가 있었다. 한 사람은 "제안된 «+-»은 적절한 대체가 아닙니다. 왜냐하면 이 시퀀스는 거의 사용되지 않지만 이미 «±»와는 매우 다른 고정된 수학적 의미를 가지고 있기 때문입니다. 그리고 독자가 의도된 의미 «±»를 문맥에서 추론하더라도 «±» 대신 «+-»은 적어도 프랑스어 사용자의 o-e 합자 대신 «oe»만큼 물리학자의 미적 감정을 상하게 할 것입니다."라고 말했습니다.[11]
결국, ±는 유지되었고, ¤는 제거되었다 (원래 계획대로).
1997/1998년경 (Windows-1252가 업데이트되었을 때) 네 개의 문자가 선택되었다: Š, š, Ž, ž는 핀란드어 및 에스토니아어에서 러시아어 차용어와 이름을 전사하는 데 사용된다. 제안서는 동시에 ISO 8859-15로 이름이 변경되었다. 결국 문자 ¦, ¼, ½, ¾가 제거되었고, ¢는 다른 네 개보다 더 흔했기 때문에 유지되었다.
3. ISO 8859-1과의 차이점
8859-1과 8859-15는 다음 8곳이 다르다.[10]
이 중 Œ, œ, Ÿ는 프랑스어를 위해, Š, š, Ž, ž는 핀란드어와 에스토니아어의 차용어 표기를 위해 추가되었다.[10]
8859-15에서 추가된 모든 문자 및 기호는 마이크로소프트 윈도우의 코드 페이지 1252에도 존재하지만, 부호 위치는 다르다.
4. 지원 언어
ISO 8859-15가 지원하는 전체 언어 목록은 하위 섹션 "전체 지원 언어"에서 확인할 수 있다.
4. 1. 전체 지원 언어
ISO 8859-15는 다음 언어들을 완벽하게 지원한다.
5. 코드 페이지 레이아웃
ISO/IEC 8859-15의 코드 페이지 레이아웃은 다음과 같다. 문자 아래에는 유니코드 코드 포인트를 표시한다.[12][13][14]
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | 사용 안 함 | |||||||||||||||
1 | 사용 안 함 | |||||||||||||||
2 | SP | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4 | 앳(@) | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
5 | P | Q | R | S | T | U | V | W | X | Y | Z | || ~ || |- ! 8 | colspan="16" style="background-color:#cfc" | ''사용 안 함'' |- ! 9 | colspan="16" style="background-color:#cfc" | ''사용 안 함'' |- ! A | NBSP || ¡ || ¢ || £ || € || ¥ || Š || § || š || © || ª || « || ¬ || SHY || ® || ¯ |- ! B | ° || ± || ² || ³ || Ž || µ || ¶ || · || ž || ¹ || º || » || Œ || œ || Ÿ || ¿ |- ! C | À || Á ||  || à || Ä || Å || Æ || Ç || È || É || Ê || Ë || Ì || Í || Î || Ï |- ! D | Ð || Ñ || Ò || Ó || Ô || Õ || Ö || × || Ø || Ù || Ú || Û || Ü || Ý || Þ || ß |- ! E | à || á || â || ã || ä || å || æ || ç || è || é || ê || ë || ì || í || î || ï |- ! F | ð || ñ || ò || ó || ô || õ || ö || ÷ || ø || ù || ú || û || ü || ý || þ || ÿ |} 참조
[1]
웹사이트
ISO-8859-15
https://www.iana.org[...]
2016-03-08
|