문자 참조
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
문자 참조는 문자를 표현하는 방법으로, 미리 정의된 이름(SGML 실체)을 사용하는 방법과 ISO 10646의 문자 코드를 수치로 나타내는 방법이 있다. HTML은 문자 실체 참조와 수치 문자 참조를 사용하며, XML은 실체 참조와 문자 참조를 사용한다. 수치 문자 참조는 10진수 또는 16진수를 사용하며, 문자 실체 참조는 특정한 문자열을 사용한다. HTML은 252개의 문자 실체를 정의하고 있으며, XML은 5개의 미리 정의된 실체를 규정하고 사용자는 DTD를 통해 새로운 실체 참조를 추가할 수 있다.
더 읽어볼만한 페이지
- XML - 오피스 오픈 XML
오피스 오픈 XML은 마이크로소프트에서 개발한 XML 기반의 파일 포맷으로, 문서, 스프레드시트, 프레젠테이션 등의 사무용 전자 문서를 표현하기 위해 사용되며 마이크로소프트 오피스 2007부터 기본 파일 형식으로 채택되어 ECMA 인터내셔널 및 ISO/IEC 국제 표준으로도 표준화되었다. - XML - 자원 기술 프레임워크
자원 기술 프레임워크(RDF)는 웹 상의 메타데이터를 표현하기 위한 표준 모델로, URI 기반의 리소스와 트리플 구조의 속성을 사용하여 정보 자원 간의 관계를 명확하게 기술하며, 시맨틱 웹 구축의 핵심 기술로서 다양한 분야에서 활용된다. - HTML - Alt 속성
`alt` 속성은 HTML의 `img` 및 `area` 태그에서 이미지를 로드할 수 없을 때 대체 텍스트를 지정하며, 스크린 리더 및 SEO에 영향을 미치고, W3C 지침에 따라 이미지의 의미를 전달하거나 장식용 이미지는 빈 문자열로 지정해야 한다. - HTML - 폰트 패밀리 (HTML)
폰트 패밀리(HTML)는 CSS 스타일 시트, 인라인 CSS, HTML `font` 태그를 통해 웹 페이지 글꼴을 지정하는 방법으로, 사용자 기기에 설치된 글꼴에 따라 표현이 달라지며, CSS의 `font-family` 속성은 글꼴 모양을 식별하고 제네릭 폰트와 글꼴 대체 메커니즘을 통해 일관된 글꼴 표현을 가능하게 한다. - 컴퓨터 용어 - 중앙 처리 장치
중앙 처리 장치(CPU)는 컴퓨터 시스템의 핵심 부품으로, 프로그램 명령어를 해석하고 실행하여 데이터를 처리하는 장치이다. - 컴퓨터 용어 - 운영체제 서비스 관리
문자 참조 |
---|
2. 문자 참조의 종류와 명칭
문자 참조는 크게 두 가지 방법으로 사용할 수 있다. 첫째는 미리 정의된 특정한 이름(SGML 실체, SGML entity영어)을 문자를 표현하는 약어로 사용하는 방법이고, 둘째는 문자를 표현하는 ISO 10646의 문자 코드를 수로 나타내어 사용하는 방법이다. 이 두 가지 방법을 가리키는 이름은 HTML과 XML 표준에 따라 조금 다르다.[5][6][7][8]
표준 | 실체를 사용한 문자 참조 | 수치를 사용한 문자 참조 |
---|---|---|
W3C의 HTML 권장안[5][6] | 문자 실체 참조 (character entity reference영어) | 수치 문자 참조 (numeric character reference영어) |
W3C의 XML 권장안[7][8] | 실체 참조 (entity reference영어) | 문자 참조 (character reference영어) |
=== 문자 실체 참조 / 실체 참조 ===
사용법 | 설명 |
---|---|
앰퍼샌드 기호, 문자 실체 이름, 쌍반점을 차례로 씀. |
HTML에서는 '''문자 실체 참조'''(文字實體參照), XML에서는 '''실체 참조'''라고 부르는 이 방식은 SGML 실체 이름을 이용하는 문자 참조이다. 사용할 때는 앰퍼샌드 기호(
실체 이름은 표준 문서 형식 정의(DTD)에 미리 정의되어 있거나, XML처럼 사용자가 DTD를 통해 직접 정의할 수도 있다. 실체 이름은 대소문자를 구별하므로 주의해야 한다. 예를 들어 HTML에서
HTML 4 버전에서는 252개의 문자 실체를 정의하고 있으며, 사용자가 임의로 추가할 수는 없다.[11] 반면, XML에서는 기본적으로 5개의 '미리 정의된 실체(predefined entities영어)'만을 규정하고 있으며, 필요시 사용자가 DTD를 통해 새로운 실체 참조를 추가할 수 있다.[9][10] XML의 미리 정의된 실체는 다음과 같다.
이름 | 문자 | 유니코드(10진) | 설명 |
---|---|---|---|
" | U+0022 (34) | 겹따옴표 | |
& | U+0026 (38) | 앰퍼샌드 기호 | |
' | U+0027 (39) | 어포스트로피 | |
< | U+003C (60) | 보다 작음 기호 | |
> | U+003E (62) | 보다 큼 기호 |
=== 수치 문자 참조 / 문자 참조 ===
진법 | 사용법 | 설명 |
---|---|---|
10진수 | 앰퍼샌드 기호, 해시 기호, 10진수, 쌍반점을 차례로 씀. | |
16진수 | 앰퍼샌드 기호, 해시 기호, 로마자 x, 16진수, 쌍반점을 차례로 씀. |
SGML 실체를 이용하는 문자 참조 방식을 HTML 권장안에서는 '''문자 실체 참조'''(character entity reference영어)라고 부른다.[5][6]
HTML에서는 '''수치 문자 참조'''(數値文字參照), XML에서는 '''문자 참조'''라고 부르는 이 방식은 문자 코드의 수치를 직접 넣는 방식이다. 이때 사용되는 문자 코드는 국제 문자 세트(ISO 10646)를 따른다.[5]
사용법은 앰퍼샌드 기호(
예를 들어, '여는 꺾쇠표'(<) 문자는 10진수로는
3. HTML의 문자 실체 참조
문자 실체 참조는 앰퍼샌드 기호(&
)와 미리 정의된 문자 실체 이름, 그리고 쌍반점(;
)을 차례로 붙여 &이름;
형태로 사용한다. 이때 실체 이름은 대소문자를 구별한다. 예를 들어, HTML에서 Å
은 대문자 Å를 나타내고, å
은 소문자 å를 나타낸다.
HTML 4 버전의 문서 형식 정의(DTD)에서는 252개의 문자 실체를 정의했으며, 이후 HTML 4.01 버전에서 새로운 문자 참조가 추가되지는 않았다.[11] HTML 4 표준 명세는 표준 DTD에 정의된 것 외에 사용자가 임의로 실체를 추가하여 정의하는 것을 허용하지 않는다. XHTML 1.0부터 XML 표준에 따라 추가된 어포스트로피('
, 유니코드 U+0027)[12][16]를 포함하면, HTML 4 기반 문서에서 사용할 수 있는 문자 실체 참조는 총 253개이다.
문자 실체 참조는 수치 문자 참조보다 어떤 문자를 나타내는지 직관적으로 알 수 있다는 장점이 있어 자주 사용된다. 그러나 미리 정의된 이름이 없는 문자(예: 8분 음표 '♪')는 수치 문자 참조를 사용해야 한다.
다음은 HTML 마크업에서 자주 사용되는 문자 실체 참조의 예시이다.문자 문자 실체 참조 설명
줄 바꿈 없는 공백. 줄 바꿈이 일어나지 않는 공백 문자이다. <
< 작음 기호(<). HTML 태그를 여는 데 사용되는 <
문자를 나타낸다.>
> 큼 기호(>). HTML 태그를 닫는 데 사용되는 >
문자를 나타낸다.&
& 앰퍼샌드(&). 문자 참조 시작을 나타내는 &
문자 자체를 나타낸다."
" 이중 따옴표("). HTML 속성 값을 감싸는 데 사용되는 "
문자를 나타낸다.
앞서 언급했듯이, 문자 실체 참조는 대소문자를 구별한다. 예를 들어 독일어 움라우트가 포함된 문자를 표현할 때 다음과 같이 구분된다.ä
는 소문자 ä를 나타낸다.Ä
는 대문자 Ä를 나타낸다.
4. XML의 문자 실체 참조
W3C의 XML 권장안에서는 실체를 사용하는 문자 참조에 대해 '문자 실체 참조'라는 용어 대신 '실체 참조(entity reference영어)'라는 용어를 사용한다.[7][8] 이는 HTML 권장안에서 수백 개의 문자 실체 참조를 정의하는 것과 달리, XML에서는 단 다섯 개의 '미리 정의된 실체(predefined entities영어)'만을 기본적으로 규정하고 있기 때문이다.[9][10] 사용자는 필요에 따라 문서 형식 정의(DTD)를 통해 새로운 실체 참조를 정의하여 사용할 수 있다.
XML 사양에서 미리 정의된 5개의 엔티티는 다음과 같다. 이 외의 엔티티 참조는 별도로 DTD를 지정하지 않는 한 사용할 수 없다.
이름 | 문자 | 유니코드 (10진) | 권장안 | 설명 |
---|---|---|---|---|
quot | " | U+0022 (34) | XML 1.0 | 겹따옴표 |
amp | & | U+0026 (38) | XML 1.0 | 앰퍼샌드 기호 |
apos | ' | U+0027 (39) | XML 1.0 | 어포스트로피 |
lt | < | U+003C (60) | XML 1.0 | 부등호 (보다 작음 기호) |
gt | > | U+003E (62) | XML 1.0 | 부등호 (보다 큼 기호) |
미리 정의된 엔티티의 주요 사용 용도는 다음과 같다.
5. 수치 문자 참조
'''수치 문자 참조'''는 문자 코드의 수치를 직접 넣어 문자를 표현하는 방식이다. 국제 문자 세트(ISO 10646)에서 정의된 문자 코드를 사용하며,[5] 10진수 또는 16진수로 표기할 수 있다.
진법 | 사용법 | 설명 |
---|---|---|
10진수 | &#N; | 앰퍼샌드(&), 해시 기호(#), 10진수 숫자(N), 세미콜론(;)을 차례로 쓴다. |
16진수 | &#xH; 또는 &#XH; | 앰퍼샌드(&), 해시(#), 로마자 x 또는 X, 16진수 숫자(H), 세미콜론(;)을 차례로 쓴다. |
16진수를 사용할 때는 숫자 부분의 대소문자를 구별하지 않는다. 숫자 앞에 붙는 로마자 'x'는 소문자(''x'')나 대문자(''X'') 모두 사용할 수 있지만, XML에서는 소문자 'x'만 사용해야 하며 대문자 'X'(''&#XH;'')는 허용되지 않는다. HTML에서는 둘 다 사용할 수 있다.[5][7][8]
예를 들어, 8분 음표(♪)는 다음과 같이 표현할 수 있다.
- 10진수: ''♪''
- 16진수: ''♪''
16진수 표기법은 원래 SGML 규격에는 없었으나, HTML 4.0에서 표준으로 도입되었다.
6. 문자 참조 목록 (ISO-8859-1)
문자 | 16진수 | 10진수 | 문자 실체 참조 | 설명 |
---|---|---|---|---|
00A0 | 0160 | | 줄 바꿈 없는 공백 | |
¡ | 00A1 | 0161 | ¡ | 거꾸로 된 느낌표 |
¢ | 00A2 | 0162 | ¢ | 센트 기호 |
£ | 00A3 | 0163 | £ | 파운드 기호 |
¤ | 00A4 | 0164 | ¤ | 일반 통화 기호 |
¥ | 00A5 | 0165 | ¥ | 엔 기호 |
¦ | 00A6 | 0166 | ¦ | 세로 파선 |
§ | 00A7 | 0167 | § | 절 기호 |
¨ | 00A8 | 0168 | ¨ | 움라우트 |
© | 00A9 | 0169 | © | 저작권 기호 |
ª | 00AA | 0170 | ª | 서수의 지시 (여성형) |
« | 00AB | 0171 | « | 왼쪽 꺾쇠 따옴표 |
¬ | 00AC | 0172 | ¬ | 부정 기호 |
| 00AD | 0173 | ­ | 소프트 하이픈 |
® | 00AE | 0174 | ® | 등록 상표 |
¯ | 00AF | 0175 | ¯ | 마크론 |
° | 00B0 | 0176 | ° | 도 기호 |
± | 00B1 | 0177 | ± | 플러스 마이너스 기호 |
² | 00B2 | 0178 | ² | 위첨자 숫자 2, 제곱 |
³ | 00B3 | 0179 | ³ | 위첨자 숫자 3, 세제곱 |
´ | 00B4 | 0180 | ´ | 예각 악센트 |
µ | 00B5 | 0181 | µ | 마이크론 기호 |
¶ | 00B6 | 0182 | ¶ | 단락 기호 |
· | 00B7 | 0183 | · | 가운데 점 |
¸ | 00B8 | 0184 | ¸ | 세디유(cedilla) |
¹ | 00B9 | 0185 | ¹ | 위첨자 숫자 1 |
º | 00BA | 0186 | º | 서수의 지시 (남성형) |
» | 00BB | 0187 | » | 오른쪽 꺾쇠 따옴표 |
¼ | 00BC | 0188 | ¼ | 분수 1/4 |
½ | 00BD | 0189 | ½ | 분수 1/2 |
¾ | 00BE | 0190 | ¾ | 분수 3/4 |
¿ | 00BF | 0191 | ¿ | 거꾸로 된 물음표 |
À | 00C0 | 0192 | À | 대문자 A (그레이브 악센트 부호 포함) |
Á | 00C1 | 0193 | Á | 대문자 A (예각 악센트 부호 포함) |
 | 00C2 | 0194 |  | 대문자 A (곡절 악센트 부호 포함) |
à | 00C3 | 0195 | à | 대문자 A (물결표 부호 포함) |
Ä | 00C4 | 0196 | Ä | 대문자 A (움라우트 부호 포함) |
Å | 00C5 | 0197 | Å | 대문자 A (고리 부호 포함) |
Æ | 00C6 | 0198 | Æ | 대문자 AE 이중 모음 (합자) |
Ç | 00C7 | 0199 | Ç | 대문자 C (세디유 부호 포함) |
È | 00C8 | 0200 | È | 대문자 E (그레이브 악센트 부호 포함) |
É | 00C9 | 0201 | É | 대문자 E (예각 악센트 부호 포함) |
Ê | 00CA | 0202 | Ê | 대문자 E (곡절 악센트 부호 포함) |
Ë | 00CB | 0203 | Ë | 대문자 E (움라우트 부호 포함) |
Ì | 00CC | 0204 | Ì | 대문자 I (그레이브 악센트 부호 포함) |
Í | 00CD | 0205 | Í | 대문자 I (예각 악센트 부호 포함) |
Î | 00CE | 0206 | Î | 대문자 I (곡절 악센트 부호 포함) |
Ï | 00CF | 0207 | Ï | 대문자 I (움라우트 부호 포함) |
Ð | 00D0 | 0208 | Ð | 대문자 에드 |
Ñ | 00D1 | 0209 | Ñ | 대문자 N (물결표 부호 포함) |
Ò | 00D2 | 0210 | Ò | 대문자 O (그레이브 악센트 부호 포함) |
Ó | 00D3 | 0211 | Ó | 대문자 O (예각 악센트 부호 포함) |
Ô | 00D4 | 0212 | Ô | 대문자 O (곡절 악센트 부호 포함) |
Õ | 00D5 | 0213 | Õ | 대문자 O (물결표 부호 포함) |
Ö | 00D6 | 0214 | Ö | 대문자 O (움라우트 부호 포함) |
× | 00D7 | 0215 | × | 곱셈 기호 |
Ø | 00D8 | 0216 | Ø | 대문자 O (슬래시 부호 포함) |
Ù | 00D9 | 0217 | Ù | 대문자 U (그레이브 악센트 부호 포함) |
Ú | 00DA | 0218 | Ú | 대문자 U (예각 악센트 부호 포함) |
Û | 00DB | 0219 | Û | 대문자 U (곡절 악센트 부호 포함) |
Ü | 00DC | 0220 | Ü | 대문자 U (움라우트 부호 포함) |
Ý | 00DD | 0221 | Ý | 대문자 Y (예각 악센트 부호 포함) |
Þ | 00DE | 0222 | Þ | 대문자 쏜 |
ß | 00DF | 0223 | ß | 독일어 소문자 에스체트 (sz 합자) |
à | 00E0 | 0224 | à | 소문자 a (그레이브 악센트 부호 포함) |
á | 00E1 | 0225 | á | 소문자 a (예각 악센트 부호 포함) |
â | 00E2 | 0226 | â | 소문자 a (곡절 악센트 부호 포함) |
ã | 00E3 | 0227 | ã | 소문자 a (물결표 부호 포함) |
ä | 00E4 | 0228 | ä | 소문자 a (움라우트 부호 포함) |
å | 00E5 | 0229 | å | 소문자 a (고리 포함) |
æ | 00E6 | 0230 | æ | 소문자 ae 이중 모음 (합자) |
ç | 00E7 | 0231 | ç | 소문자 c (세디유 부호 포함) |
è | 00E8 | 0232 | è | 소문자 e (그레이브 악센트 부호 포함) |
é | 00E9 | 0233 | é | 소문자 e (예각 악센트 부호 포함) |
ê | 00EA | 0234 | ê | 소문자 e (곡절 악센트 부호 포함) |
ë | 00EB | 0235 | ë | 소문자 e (움라우트 부호 포함) |
ì | 00EC | 0236 | ì | 소문자 i (그레이브 악센트 부호 포함) |
í | 00ED | 0237 | í | 소문자 i (예각 악센트 부호 포함) |
î | 00EE | 0238 | î | 소문자 i (곡절 악센트 부호 포함) |
ï | 00EF | 0239 | ï | 소문자 i (움라우트 부호 포함) |
ð | 00F0 | 0240 | ð | 소문자 에드 |
ñ | 00F1 | 0241 | ñ | 소문자 n (물결표 부호 포함) |
ò | 00F2 | 0242 | ò | 소문자 o (그레이브 악센트 부호 포함) |
ó | 00F3 | 0243 | ó | 소문자 o (예각 악센트 부호 포함) |
ô | 00F4 | 0244 | ô | 소문자 o (곡절 악센트 부호 포함) |
õ | 00F5 | 0245 | õ | 소문자 o (물결표 부호 포함) |
ö | 00F6 | 0246 | ö | 소문자 o (움라우트 부호 포함) |
÷ | 00F7 | 0247 | ÷ | 나눗셈 기호 |
ø | 00F8 | 0248 | ø | 소문자 o (슬래시 포함) |
ù | 00F9 | 0249 | ù | 소문자 u (그레이브 악센트 부호 포함) |
ú | 00FA | 0250 | ú | 소문자 u (예각 악센트 부호 포함) |
û | 00FB | 0251 | û | 소문자 u (곡절 악센트 부호 포함) |
ü | 00FC | 0252 | ü | 소문자 u (움라우트 부호 포함) |
ý | 00FD | 0253 | ý | 소문자 y (예각 악센트 부호 포함) |
þ | 00FE | 0254 | þ | 소문자 쏜 |
ÿ | 00FF | 0255 | ÿ | 소문자 y (움라우트 부호 포함) |
7. 타입세트 스타일 문장 부호
가독성을 위해 알파벳 "O" 옆에 문자를 배치하였다.
문자 | 문자 실체 참조 | 설명 |
---|---|---|
‘O | ‘ | 왼쪽 작은따옴표 |
O’ | ’ | 오른쪽 작은따옴표 |
O‚ | ‚ | 아래쪽 작은따옴표 |
“O | “ | 왼쪽 큰따옴표 |
O” | ” | 오른쪽 큰따옴표 |
O„ | „ | 아래쪽 큰따옴표 |
—O | — | 엠 대시 |
–O | – | 엔 대시 |
참조
[1]
문서
numeric character reference
[2]
문서
character entity reference
[3]
문서
entity reference
[4]
웹사이트
XHTML 1.0: The Extensible HyperText Markup Language (Second Edition)
https://www.w3.org/T[...]
[5]
웹인용
HTML 4.01 Specification - 5.3 Character references
http://www.w3.org/TR[...]
W3C
1999-12-24
[6]
서적
웹표준교과서 - XHTML과 CSS로 하는'바른' 웹디자인
디지털미디어리서치
2007-06-25
[7]
웹인용
Extensible Markup Language (XML) 1.0 (Fifth Edition) - 4.1 Character and Entity References
http://www.w3.org/TR[...]
W3C
2008-11-26
[8]
웹인용
Extensible Markup Language (XML) 1.1 (Second Edition) - 4.1 Character and Entity References
http://www.w3.org/TR[...]
W3C
2006-09-29
[9]
웹인용
Extensible Markup Language (XML) 1.0 (Fifth Edition) - 4.6 Predefined Entities
http://www.w3.org/TR[...]
W3C
2008-11-26
[10]
웹인용
Extensible Markup Language (XML) 1.1 (Second Edition) - 4.6 Predefined Entities
http://www.w3.org/TR[...]
W3C
2006-09-29
[11]
웹인용
HTML 4.01 Specification - 24 Character entity references in HTML 4
http://www.w3.org/TR[...]
W3C
1999-12-24
[12]
웹인용
XHTML™ 1.0 The Extensible HyperText Markup Language (Second Edition) - C.16. The Named Character Reference '
http://www.w3.org/TR[...]
W3C
2002-08-01
[13]
문서
문자 실체 이름이 정의된 공용 문서 형식 정의를 말한다. 이는 다음 셋 중 하나에 속한다.
[14]
문서
ISO 10646에 통합되기 이전의 옛 문자 집합|문자 부분집합을 말한다.
[15]
문서
ISO 10646 표준과 유니코드에 있는 영어로 된 문자 이름. 비공식적인 이름은 그 뒤에 기울임꼴로 표시되어 있다.
[16]
문서
HTML의 DTD에는 포함되지 않고 XML에서 정의된 것으로, 사용에 주의가 필요하다. XML이나 XHTML 문서를 올바르게 읽지 못하는 HTML 전용 브라우저의 경우 '가 동작하지 않으므로 대신 '를 사용해야 한다.
[17]
문서
해당 문자는 HTML 4.0 발표 이후 ISO 10646에서 표준화되었다.
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com