ISO/IEC 8859-15
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
ISO/IEC 8859-15는 1999년에 제정된 8비트 문자 인코딩 표준으로, "라틴 문자 9번"이라고도 불리며, ISO 8859-1을 확장하여 유럽 언어의 문자 지원을 개선했다. 이 표준은 유로 기호 (€), 프랑스어 문자인 Œ, œ, Ÿ, 그리고 핀란드어 및 에스토니아어에서 사용되는 Š, š, Ž, ž 등을 추가하여 ISO 8859-1과의 차이점을 보인다. ISO 8859-15는 아프리카, 서유럽, 오세아니아, 아메리카 대륙, 그리고 동아시아 언어의 로마자 표기 등 다양한 언어를 지원하며, 핀란드어, 프랑스어, 독일어 등 20개 이상의 언어에 사용된다.
더 읽어볼만한 페이지
- ISO/IEC 8859 - ISO/IEC 8859-8
ISO/IEC 8859-8은 히브리어 텍스트 표현을 위해 설계된 ISO/IEC 8859 문자 인코딩의 일부로, 양방향 텍스트 지원 특징을 포함하며 RFC-1556에서 두 가지 변형을 정의한다. - ISO/IEC 8859 - ISO/IEC 8859-3
ISO/IEC 8859-3은 서유럽 언어 외에 에스페란토, 몰타어, 튀르키예어 지원을 위해 설계된 ISO/IEC 8859 문자 인코딩 방식으로, 확장 라틴 문자, 특수 문자, 기호들을 포함하며 각 문자에 고유한 코드 포인트가 할당되어 있다.
2. 역사
ISO 8859-15는 ISO 8859-1의 개정판으로 1999년에 발표되었다.
1996년 사미어 지원을 위한 제안은 거부되었지만 ISO-IR 197로 통과되었다.[6][7][8] 초기에는 ISO 8859-16과 유사한 형태로 제안되었으며, 당시에는 유로 기호 (€)가 존재하지 않았다. 이후 여러 차례 수정을 거쳐 현재의 ISO 8859-15가 완성되었다.
ISO 8859-1과 ISO 8859-15의 주요 차이점은 다음과 같다.
ISO 8859-15에서 프랑스어를 위해 가, 핀란드어와 에스토니아어의 차용어 표기를 위해 가 추가되었다.
2. 1. 초안 및 수정 과정
ISO 8859-15 식별자는 1996년에 사미어를 위해 제안되었지만 결국 거부되었고, ISO-IR 197로 통과되었다.[6][7][8]ISO 8859-16은 오늘날의 ISO 8859-15와 유사한 인코딩으로 제안되었으며, 사용되지 않거나 거의 사용되지 않는 11개의 ISO 8859-1 문자를 누락된 프랑스어 Œ œ (DEC-MCS 및 Lotus International Character Set과 동일한 위치) 및 Ÿ (이 세트와 동일한 위치가 아닌, 아이슬란드어를 위해 Ý가 그 자리에 있었음), 네덜란드어 IJ ij, 터키어 Ğ ğ İ ı Ş ş로 대체하는 것이었다. 유로 기호는 당시 존재하지 않았다.[9]
초안은 다음과 같다.
ISO 8859-15는 ISO 8859-1에서 8개의 문자를 변경하여 더 많은 언어를 지원한다. 특히, 유로 기호(€)와 프랑스어에 필요한 Œ, œ, Ÿ, 그리고 핀란드어와 에스토니아어에서 사용되는 Š, š, Ž, ž 등이 추가되었다.
ISO 8859-15는 아메리카, 서유럽, 오세아니아, 아프리카 대부분 지역에서 사용되는 언어와 동아시아 언어의 대부분의 표준 로마자 표기를 지원한다.[1] 각 문자는 단일 8비트 코드 값으로 인코딩되며, 이러한 코드 값은 특정 언어들을 표현하는데 사용될 수 있다.[1]
이 이름은 나중에 ISO-8859-0으로 변경되었고 1997년에 재구성되었다. 터키어 문자는 당시 UCS (유니코드) 구현이 멀지 않았고, 네덜란드어 ''IJ'' 합자는 기존의 digraph ''ij''가 적절하다고 여겨지면서 터키어에 현재보다 더 많은 피해를 줄 수 있다고 판단하여 제거되었다. 또한 웨일스어 Ŵ ŵ 및 Ŷ ŷ를 추가하는 것을 고려했지만 추가 조사를 기다리는 동안 연기되었다. 사용되지 않거나 거의 사용되지 않는 4개의 ISO 8859-1 문자 (¤, ¨, ´, ¸)는 각각 €(유로 기호), Ÿ, Œ, œ로 대체되었다.[10] 유로 (€)는 유로가 도입되면서 필요하게 되었다. Ÿ는 프랑스어 텍스트를 소문자에서 대문자로 변환하고 다시 변환할 때 손실이 없도록 하는 데 필요하며, Œ 및 œ는 프랑스어 합자이다. 아이러니하게도 마지막 세 개는 이미 DEC의 다국어 문자 세트 (MCS)에 1983년에 존재했으며, 이 문자 세트에서 ECMA-94 (1985) 및 ISO-8859-1 (1987)이 파생되었다. 원래 코드 포인트가 이제 다른 문자에 의해 점유되었으므로 재도입을 위해 덜 논리적인 코드 포인트를 선택해야 했다.
동일한 제안은 또한 6개의 문자 (¢, ¦, ±, ¼, ½, ¾)를 "최대 언어를 커버하기 위한 다른 일부 문자"로 대체하는 것을 권장했다. 이러한 문자를 선택한 이유는 제안서에 명시되어 있었다.[10]
유로 기호의 경우, 일부는 통화 기호 대신 플러스-마이너스 기호를 대체하려고 했다. 통화 기호는 일부 응용 프로그램에서 필드 구분 기호로 사용되며, 다른 응용 프로그램에서는 소계를 나타내는 데 사용된다. 이에 대한 강력한 반대가 있었다. 한 사람은 "제안된 «+-»은 적절한 대체가 아닙니다. 왜냐하면 이 시퀀스는 거의 사용되지 않지만 이미 «±»와는 매우 다른 고정된 수학적 의미를 가지고 있기 때문입니다. 그리고 독자가 의도된 의미 «±»를 문맥에서 추론하더라도 «±» 대신 «+-»은 적어도 프랑스어 사용자의 o-e 합자 대신 «oe»만큼 물리학자의 미적 감정을 상하게 할 것입니다."라고 말했습니다.[11]
결국, ±는 유지되었고, ¤는 제거되었다 (원래 계획대로).
1997/1998년경 (Windows-1252가 업데이트되었을 때) 네 개의 문자가 선택되었다: Š, š, Ž, ž는 핀란드어 및 에스토니아어에서 러시아어 차용어와 이름을 전사하는 데 사용된다. 제안서는 동시에 ISO 8859-15로 이름이 변경되었다. 결국 문자 ¦, ¼, ½, ¾가 제거되었고, ¢는 다른 네 개보다 더 흔했기 때문에 유지되었다.
3. ISO 8859-1과의 차이점
8859-1과 8859-15는 다음 8곳이 다르다.[10]
이 중 Œ, œ, Ÿ는 프랑스어를 위해, Š, š, Ž, ž는 핀란드어와 에스토니아어의 차용어 표기를 위해 추가되었다.[10]
8859-15에서 추가된 모든 문자 및 기호는 마이크로소프트 윈도우의 코드 페이지 1252에도 존재하지만, 부호 위치는 다르다.
4. 지원 언어
ISO 8859-15가 지원하는 전체 언어 목록은 하위 섹션 "전체 지원 언어"에서 확인할 수 있다.
4. 1. 전체 지원 언어
ISO 8859-15는 다음 언어들을 완벽하게 지원한다.
5. 코드 페이지 레이아웃
ISO/IEC 8859-15의 코드 페이지 레이아웃은 다음과 같다. 문자 아래에는 유니코드 코드 포인트를 표시한다.[12][13][14]