ISO/IEC 8859-1
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
ISO/IEC 8859-1은 191개의 라틴 문자를 포함하는 8비트 문자 인코딩 표준으로, "라틴 문자 제1부"라고도 불린다. 아메리카, 서유럽, 오세아니아, 아프리카 일부 지역과 동아시아 언어의 로마자 표기에서 널리 사용된다. 이 표준은 갈리시아어, 노르웨이어, 덴마크어, 독일어, 영어 등 여러 언어를 완전하게 표현할 수 있으며, 카탈루냐어, 체코어, 네덜란드어 등 일부 언어는 특정 문자가 누락되어 대체 문자를 사용해야 한다. ISO/IEC 8859-1은 또한 특정 따옴표의 부재, 코드표, 역사, 관련 문자 집합 등의 정보를 포함한다.
더 읽어볼만한 페이지
- ISO/IEC 8859 - ISO/IEC 8859-8
ISO/IEC 8859-8은 히브리어 텍스트 표현을 위해 설계된 ISO/IEC 8859 문자 인코딩의 일부로, 양방향 텍스트 지원 특징을 포함하며 RFC-1556에서 두 가지 변형을 정의한다. - ISO/IEC 8859 - ISO/IEC 8859-15
ISO/IEC 8859-15는 ISO 8859-1을 확장하여 유로 기호와 일부 유럽어 문자를 추가한 8비트 문자 인코딩 방식이지만, UTF-8로 대체되어 널리 사용되지는 못했다. - 문자 집합 - 점자
점자는 루이 브라이유가 개발한 시각 장애인용 촉각 문자 체계로, 6점 점자를 사용하여 133개 이상의 언어에 적용되었으며, 교육, 정보 접근, 사회 참여에 필수적인 역할을 수행하지만 문해력 저하와 교육의 어려움이라는 과제도 안고 있다. - 문자 집합 - ISO/IEC 646
ISO/IEC 646는 ASCII 기반의 7비트 문자 인코딩 표준으로, 국가별 변형이 존재했으나, 최종 개정판은 ASCII와 호환되도록 정의되었고, 현재는 ITU-T 권고 T.50 IRA가 현행 표준으로 유지되고 있다. - ISO/IEC 표준 - 프로젝트 관리
프로젝트 관리는 제한된 자원 내에서 특정 목표를 달성하기 위해 상호 연관된 작업들을 계획, 실행, 모니터링 및 종료하는 일시적인 활동으로, 범위, 시간, 비용, 품질, 리스크 관리가 중요하며, 프로젝트 관리자는 표준 및 방법론을 활용하여 프로젝트의 성공을 책임진다. - ISO/IEC 표준 - ISO/IEC 646
ISO/IEC 646는 ASCII 기반의 7비트 문자 인코딩 표준으로, 국가별 변형이 존재했으나, 최종 개정판은 ASCII와 호환되도록 정의되었고, 현재는 ITU-T 권고 T.50 IRA가 현행 표준으로 유지되고 있다.
| ISO/IEC 8859-1 | |
|---|---|
| 개요 | |
| 명칭 | ISO/IEC 8859-1:1998 |
| MIME | ISO-8859-1 |
| 별칭 | iso-ir-100, csISOLatin1, latin1, l1, IBM819, CP819 |
![]() | |
| 표준 | ISO/IEC 8859 |
| 언어 | 영어, 기타 |
| 상태 | 해당 없음 |
| 확장 | US-ASCII |
| 기반 | DEC MCS |
| 다음 | UTF-8 UTF-16 |
| 관련 항목 | ISO/IEC 8859-15 Windows-1252 BraSCII |
| 분류 | 확장 ASCII, ISO/IEC 8859 |
| 상세 정보 | |
| 설명 | 정보 기술 - 8비트 단일 바이트 코딩 그래픽 문자 집합 - 파트 1: 라틴 알파벳 No. 1 |
| 기타 명칭 | 라틴-1 |
2. 포함하는 언어
ISO/IEC 8859-1은 "라틴 문자 제1부"라고도 불리며, 라틴 문자 체계의 191개 문자로 구성되어 있다. 이 문자 인코딩은 아메리카 대륙, 서유럽, 오세아니아, 그리고 아프리카의 많은 지역과 동아시아 언어의 대부분 표준 로마자 표기에서 널리 사용된다.[1]
각 문자는 단일 8비트 코드 값으로 인코딩된다. 이러한 코드 값들은 데이터 교환 시스템이 다양한 언어로 통신하는 데 필요한 요구 사항을 거의 충족하지만, 따옴표와 같이 독일어나 아이슬란드어 등 여러 언어의 올바른 따옴표는 지원되지 않는 등 일부 예외가 있다.[1]
ISO/IEC 8859-1은 많은 언어를 표현할 수 있지만, 카탈루냐어, 체코어, 네덜란드어 등은 특정 문자가 포함되어 있지 않아 완벽하게 표현할 수 없다. 또한, 프랑스어의 Œ와 같은 일부 특수 문자도 지원하지 않는다.[1]
2. 1. 완전히 포함하는 언어
ISO/IEC 8859-1에서 완전히 표현 가능한 언어는 다음과 같다.[1]
각 문자는 8비트 코드 값 하나로 인코딩된다. 이러한 코드 값은 따옴표와 같이 독일어나 아이슬란드어를 포함한 여러 언어의 올바른 따옴표를 제외하고, 다음 언어로 통신하기 위해 거의 모든 데이터 교환 시스템에서 사용할 수 있다.[1]
2. 2. 불완전하게 포함하는 언어
ISO/IEC 8859-1은 특정 언어에서 사용되는 일부 문자를 포함하지 않아 해당 언어들을 완벽하게 표현할 수 없다. 다음은 ISO/IEC 8859-1에서 빠진 글자와 그에 대한 통상적인 해결책, 그리고 해당 글자를 지원하는 문자 집합을 정리한 표이다.| 언어 | 빠진 글자 | 통상적 해결책 | 지원 문자 집합 |
|---|---|---|---|
| 카탈루냐어 | Ŀ, ŀ (폐지) | L·, l· | |
| 체코어 | Č, č, Ř, ř, Š, š, Ž, ž, Ď, ď, Ť, ť, Ň, ň, Ů, ů, Ě, ě | Ç, ç, R, r, Sh, sh, Zh, zh, Ð, ð (or d,) T, t, Ñ, ñ, U, u·, Ë, ë | ISO-8859-2, Windows-1250 |
| 네덜란드어 | IJ, ij | 이중음자 IJ, ij | |
| 에스토니아어 | Š, š, Ž, ž (외래어에만 있음) | Sh, sh, Zh, zh | ISO-8859-15, Windows-1252 |
| 핀란드어 | Š, š, Ž, ž (외래어에만 있음) | Sh, sh, Zh, zh | ISO-8859-15, Windows-1252 |
| 프랑스어 | Œ, œ, 드물게 Ÿ | 이중음자 OE, oe, 트레마를 뗀 Y (또는 Ý) | ISO-8859-15, ISO-8859-16, Windows-1252 |
| 과라니어 | Ẽ, ẽ, Ĩ, ĩ, Ũ, ũ, Ỹ, ỹ, G̃, g̃ | E~, e~, I~, i~, U~, u~, Y~, y~, G~, g~ or Ê, ê, Î, î, Û, û, Ý, ÿ | |
| 헝가리어 | Ő, ő, Ű, ű | Õ, õ (or Ô, ô; 드물게 Ö, ö), Û, û (드물게 Ü, ü) | ISO-8859-2, Windows-1250 |
| 아일랜드어 (전통적 철자법) | Ḃ, ḃ, Ċ, ċ, Ḋ, ḋ, Ḟ, ḟ, Ġ, ġ, Ṁ, ṁ, Ṡ, ṡ, Ṫ, ṫ | Bh, bh, Ch, ch, Dh, dh, Fh, fh, Gh, gh, Mh, mh, Sh, sh, Th, th | ISO-8859-14 |
| 라틴어 (장음 부호 사용) | Ā, ā, Ē, ē, Ī, ī, Ō, ō, Ū, ū | ISO-8859-13, Windows-1257 | |
| 마오리어 | Ā, ā, Ē, ē, Ī, ī, Ō, ō, Ū, ū | Ä, ä, Ë, ë, Ï, ï, Ö, ö, Ü, ü | ISO-8859-13, Windows-1257 |
| 루마니아어 | Ă, ă, Ș, ș, Ț, ț, 이전에 쓰인 세디유를 단 Ţ, ţ | A, a (또는 Ã, ã), S, s, T, t | ISO-8859-2, Windows-1250 (세디유 단 Ţ, ţ) |
| 튀르키예어 | İ, ı, Ğ, ğ, Ş, ş | I, i, G, g, S, s | ISO-8859-3, ISO-8859-9, Windows-1254 |
| 웨일스어 | Ẁ, ẁ, Ẃ, ẃ, Ŵ, ŵ, Ŷ, ŷ | Ý, ÿ | ISO-8859-14 |
| 폴란드어 | Ą, ą, Ć, ć, Ę, ę, Ł, ł, Ń, ń, Ś, ś, Ź, ź, Ż, ż | Ã, ã, Ç, ç, Ê, ê, L, l, Ñ, ñ, S, s, Z, z, Z, z | ISO-8859-2, ISO-8859-13, Windows-1250, Windows-1257 |
2. 3. 따옴표
ISO/IEC 8859-1에는 일부 언어에 필요한 특정 따옴표가 누락되어 있다. 지원되는 따옴표는 « », " ", ' ' 뿐이며, 6이나 9 모양의 여닫는 큰따옴표와 작은따옴표는 지원되지 않는다. 일부 글꼴은 공간을 차지하는 악상 그라브(`, 0x60)와 어포스트로피(', 0x27)를 각각 여는 작은따옴표와 닫는 작은따옴표로 나타내나, 이는 근래의 표준에 비춰 볼 때 옳은 방법이 아니다.[1]3. 코드표
| ISO/IEC 8859-1 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| x0 | x1 | x2 | x3 | x4 | x5 | x6 | x7 | x8 | x9 | xA | xB | xC | xD | xE | xF | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 0x | 미사용 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 1x | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 2x | SP | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 4x | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 5x | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^^ | _ | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 6x | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 7x | p | q | r | s | t | u | v | w | x | y | z | { | \ | } | ||~|- !8x |rowspan="2" colspan="16" style="background-color:#cfc"|''미사용'' |- !9x |- !Ax |style="font-size: x-small; text-decoration: underline"|''NBSP'' |¡ |¢ |£ |¤ |¥ |¦ |§ |¨ |© |ª |« |¬ |style="font-size: x-small; text-decoration: underline"|''SHY'' |® |¯ |- !Bx |° |± |² |³ |´ |µ |¶ |· |¸ |¹ |º |» |¼ |½ |¾ |¿ |- !Cx |À||Á||Â||Ã||Ä||Å||Æ||Ç||È||É||Ê||Ë||Ì||Í||Î||Ï |- !Dx |Ð||Ñ||Ò||Ó||Ô||Õ||Ö||×||Ø||Ù||Ú||Û||Ü||Ý||Þ||ß |- !Ex |à||á||â||ã||ä||å||æ||ç||è||é||ê||ë||ì||í||î||ï |- !Fx |ð||ñ||ò||ó||ô||õ||ö||÷||ø||ù||ú||û||ü||ý||þ||ÿ |} 코드 값 00–1F, 7F–9F는 ISO/IEC 8859-1에서 문자를 할당하지 않았다. 하위 영역 20부터 7E(G0 부분 집합)는 ASCII의 G0 부분 집합과 정확히 같은 매핑이다. 상위 영역 A0부터 FF(G1 부분 집합)는 ISO 2022의 시퀀스 "'''ESC . A'''"로 지시되는 부분 집합과 정확히 같은 매핑이다. 4. 역사
ISO 8859-1은 1983년 디지털 이큅먼트 코퍼레이션(DEC)이 VT220 단말기에서 사용한 다국어 문자 집합(MCS)을 기반으로 만들어졌다.[17] 유럽 컴퓨터 제조업체 협회(ECMA International)에서 개발되어 1985년 3월 ECMA-94로 발표되었으며, 때때로 이 이름으로도 알려져 있다.[17] 1986년 6월에 발표된 ECMA-94 2판에는 ISO 8859-2, ISO 8859-3, ISO 8859-4도 포함되었다.[14] 5. 관련 문자 집합
ISO/IEC 8859-1 표준은 오랫동안 많은 문자 매핑(문자 집합, charset, 코드 페이지라고도 함)의 기반이 되어 왔다. 가장 유명한 문자 집합은 '''ISO-8859-1'''과 Windows-1252이다. 이러한 매핑은 모두 ISO/IEC 8859-1의 상위 집합으로, 00–1F, 7F, 그리고 80~9F 범위에 있는 코드 값에 추가 문자를 매핑하여 표준의 191개 문자에 할당을 추가한다.
5. 1. ISO/IEC 8859-15ISO/IEC 8859-15는 ISO/IEC 8859-1의 개정판으로 1999년에 개발되었다. ISO/IEC 8859-1에 없는 프랑스어와 핀란드어 텍스트에 필요한 일부 문자와 유로 기호를 제공한다. 이를 위해 ISO/IEC 8859-1에서 자주 사용되지 않는 분수 기호와 자음 없는 발음 기호(¤, ¦, ¨, ´, ¸, ¼, ½, ¾)가 제거되었다. 아이러니하게도 새로 추가된 세 문자(Œ, œ, Ÿ)는 ISO/IEC 8859-1(1987)의 전신인 DEC의 1983년 다국어 문자 집합(MCS)에 이미 포함되어 있었다. 원래 코드 포인트가 다른 용도로 재사용되었기 때문에 이 문자들은 논리적이지 않은 다른 코드 포인트로 다시 도입되어야 했다.[18][19]5. 2. Windows-1252Windows-1252는 ISO/IEC 8859-1의 상위 집합으로, ISO/IEC 8859-15에서 제공하는 누락된 문자와 여러 서체 기호를 추가한다. 128~159(16진수 80~9F) 범위의 거의 사용되지 않는 C1 제어 문자를 대체하여 이를 구현한다.[20]Windows-1252 텍스트를 ISO-8859-1로 잘못 표시하는 경우가 매우 흔하다. 흔히 워드 프로세싱 소프트웨어의 "똑똑한 따옴표"로 생성된 모든 따옴표와 작은 따옴표가 Windows 이외의 운영 체제에서 물음표나 상자로 바뀌어 텍스트를 읽기 어렵게 만든다. 많은 웹 브라우저와 이메일 클라이언트는 ISO-8859-1 제어 코드를 Windows-1252 문자로 해석하며, 이러한 동작은 나중에 HTML5에서 표준화되었다.[20] 5. 3. Mac Roman1984년에 출시된 애플 매킨토시 컴퓨터는 맥 로만이라는 문자 인코딩을 도입했다. 이는 서유럽의 데스크톱 퍼블리싱에 적합하도록 고안되었다. ASCII의 상위 집합이며 ISO-8859-1에 있는 대부분의 문자와 Windows-1252의 추가 문자를 모두 포함하지만, 배열은 완전히 다르다. ISO/IEC 8859-1에는 있지만 이 집합에는 없는 소수의 인쇄 가능 문자는, 맥용 인터넷 익스플로러의 최종 버전을 포함한 이전 매킨토시 브라우저를 사용하는 웹사이트에서 텍스트를 편집할 때 종종 문제의 원인이 된다.[1]5. 4. 기타MS-DOS는 코드 페이지 850을 사용하는데, 이는 ISO-8859-1에 있는 모든 인쇄 가능 문자를 완전히 다른 배열로 포함하고 있으며, 코드 페이지 437에서 가장 널리 사용되는 그래픽 문자들을 추가로 포함하고 있다.1989년부터[21] 2015년까지 휴렛패커드(Hewlett-Packard)는 많은 계산기에 ISO-8859-1의 또 다른 상위 집합을 사용했다. 이 독점적인 문자 집합은 때때로 간단히 "ECMA-94"라고도 불렸다.[21] HP는 또한 코드 페이지 1053을 가지고 있는데, 이는 0x7F에 중간 음영(▒, U+2592)을 추가한다.[22] 몇몇 EBCDIC 코드 페이지는 ISO-8859-1과 동일한 문자 집합을 갖도록 의도적으로 설계되어 서로 간의 변환을 용이하게 했다. ISO/IEC 8859-1 표준은 오랫동안 많은 문자 매핑(다른 이름으로 문자 집합, charset, 또는 코드 페이지)의 기반이 되어 왔다. 문자 집합 중 가장 유명한 것은 '''ISO-8859-1'''과 Windows-1252이다. 이러한 매핑은 모두 ISO/IEC 8859-1의 상위 집합이다. 즉, 이들은 00–1F, 7F, 그리고 80~9F 범위에 있는 코드 값에 추가 문자를 매핑함으로써 표준의 191개 문자에 할당을 추가한다. 참조
[1]
웹사이트
Historical trends in the usage statistics of character encodings for Web sites, December 2024
https://w3techs.com/[...]
2024-12-16
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
