2. 문자 목록
C0 제어 코드와 기본 라틴 문자 블록에는 C0 제어, ASCII 구두점 및 기호, ASCII 숫자, 대문자 라틴 알파벳, 소문자 라틴 알파벳, 제어 문자까지 총 6개의 하위 제목이 있으며, 각 하위 제목에 속하는 문자, 기호, 제어 코드는 다음과 같다.[8]
| 하위 제목 | 기호 수 | 문자 범위 | | C0 제어 | 32개의 제어 코드 | U+0000 ~ U+001F |
| ASCII 구두점 및 기호 | 33개의 구두점 및 기호 | U+0020 ~ U+002F, U+003A ~ U+0040, U+005B ~ U+0060 및 U+007B ~ U+007E |
| ASCII 숫자 | 10개의 숫자 | U+0030 ~ U+0039 |
| 대문자 라틴 알파벳 | 26개의 악센트 없는 대문자 라틴 문자 | U+0041 ~ U+005A |
| 소문자 라틴 알파벳 | 26개의 악센트 없는 소문자 라틴 문자 | U+0061 ~ U+007A |
| 제어 문자 | "삭제" 문자를 포함하는 1개의 제어 코드 | U+007F |
2. 1. C0 제어 문자 (C0 Controls)
C0 제어 코드는 U+0000부터 U+001F까지의 제어 문자를 포함하며, 통신 및 장치 제어에 사용되는 특수 문자들이다. C0 제어 코드는 유니코드 버전 1.0에서 "C0 ASCII 제어 문자(C0 ASCII control codes)"라고 불렸으며, ASCII 및 기타 7비트/8비트 문자 코드에서 계승되었다. 각 제어 코드의 영어 이름은 ISO/IEC 6429:1992 표준에서 가져왔다.
| 코드 | 문자 | 문자명(영어) | 설명 | 약어 | | U+0000 | | Null character | 널 문자 | NUL |
| U+0001 | | Start of Heading | 헤딩 시작 | SOH |
| U+0002 | | Start of Text | 텍스트 시작 | STX |
| U+0003 | | End-of-text character | 텍스트 종료 | ETX |
| U+0004 | | End-of-transmission character | 전송 종료 | EOT |
| U+0005 | | Enquiry character | 문의 문자 | ENQ |
| U+0006 | | Acknowledge character | 긍정 응답 문자 | ACK |
| U+0007 | | Bell character | 벨 문자 | BEL |
| U+0008 | | Backspace | 백스페이스 | BS |
| U+0009 | | Horizontal tab | 수평 탭 | HT |
| U+000A | | Line feed | LF(줄 바꿈) | LF |
| U+000B | | Vertical tab | 수직 탭 | VT |
| U+000C | | Form feed | 폼 피드 | FF |
| U+000D | | Carriage return | 캐리지 리턴 | CR |
| U+000E | | Shift Out | 시프트 아웃 | SO |
| U+000F | | Shift In | 시프트 인 | SI |
| U+0010 | | Data Link Escape | 데이터 링크 탈출 | DLE |
| U+0011 | | Device Control 1 | 장치 제어 1 | DC1 |
| U+0012 | | Device Control 2 | 장치 제어 2 | DC2 |
| U+0013 | | Device Control 3 | 장치 제어 3 | DC3 |
| U+0014 | | Device Control 4 | 장치 제어 4 | DC4 |
| U+0015 | | Negative-acknowledge character | 부정 응답 | NAK |
| U+0016 | | Synchronous Idle | 동기식 유휴 | SYN |
| U+0017 | | End of Transmission Block | 전송 블록 종료 | ETB |
| U+0018 | | Cancel character | 취소 문자 | CAN |
| U+0019 | | End of Medium | 매체 종료 | EM |
| U+001A | | Substitute character | 대체 문자 | SUB |
| U+001B | | Escape character | 이스케이프 문자 | ESC |
| U+001C | | File Separator | 파일 구분 기호 | FS |
| U+001D | | Group Separator | 그룹 구분 기호 | GS |
| U+001E | | Record Separator | 레코드 구분 기호 | RS |
| U+001F | | Unit Separator | 유닛 구분 기호 | US |
2. 2. ASCII 구두점 및 기호 (ASCII Punctuation and Symbols)
이 섹션은 표준 구두점 문자, 간단한 수학 연산자, 달러 기호, 백분율 기호, 앰퍼샌드, 밑줄 문자, 수직선과 같은 기호를 포함한다.[19]
| 코드 | 문자 | 설명 | | U+0020 | | 스페이스 |
| U+0021 | ! | 느낌표 |
| U+0022 | " | 따옴표 |
| U+0023 | # | 해시 기호 |
| U+0024 | $ | 달러 기호 |
| U+0025 | % | 백분율 기호 |
| U+0026 | & | 앰퍼샌드 |
| U+0027 | ' | 아포스트로피 |
| U+0028 | ( | 왼쪽 소괄호 |
| U+0029 | ) | 오른쪽 소괄호 |
| U+002A | * | 별표 |
| U+002B | + | 더하기표 |
| U+002C | , | 쉼표 |
| U+002D | - | 하이픈 마이너스 |
| U+002E | . | 마침표 |
| U+002F | / | 빗금 |
| U+003A | : | 쌍점 |
| U+003B | ; | 쌍반점 |
| U+003C | < | ...보다 작음 |
| U+003D | = | 등호 |
| U+003E | > | ...보다 큼 |
| U+003F | ? | 물음표 |
| U+0040 | @ | 골뱅이표 |
| U+005B | [ | 왼쪽 대괄호 |
| U+005C | \ | 역슬래시 |
| U+005D | ] | 오른쪽 대괄호 |
| U+005E | ^ | 윗꺾쇠 |
| U+005F | _ | 밑줄 문자 |
| U+0060 | ` | 악상 그라브 |
| U+007B | { | 왼쪽 중괄호 |
| U+007C | | | 수직선 |
| U+007D | } | 오른쪽 중괄호 |
| U+007E | ~ | 물결표 |
U+005C (\)는 유니코드와 기존 문자 집합을 혼용한 일본어 또는 한국어 글꼴에서 엔 기호나 원 기호로 보일 수도 있다.[18]
2. 3. ASCII 숫자 (ASCII Digits)
ASCII 숫자 소제목은 표준 유럽 숫자 문자 0, 1, 2, 3, 4, 5, 6, 7, 8, 9를 포함한다.[8]
| 코드 | 문자 | 문자명(영어) | 설명 | | U+0030 | 0 | Digit Zero | 0 |
| U+0031 | 1 | Digit One | 1 |
| U+0032 | 2 | Digit Two | 2 |
| U+0033 | 3 | Digit Three | 3 |
| U+0034 | 4 | Digit Four | 4 |
| U+0035 | 5 | Digit Five | 5 |
| U+0036 | 6 | Digit Six | 6 |
| U+0037 | 7 | Digit Seven | 7 |
| U+0038 | 8 | Digit Eight | 8 |
| U+0039 | 9 | Digit Nine | 9 |
2. 4. 대문자 라틴 알파벳 (Uppercase Latin Alphabet)
대문자로 된 표준 26개의 무악센트 라틴 알파벳을 포함하고 있다.[8] 이 소분류에는 표준적인 26자의 악센트가 없는 대문자 라틴 문자가 포함되어 있다.[19]
2. 5. 소문자 라틴 알파벳 (Lowercase Latin Alphabet)
소문자의 표준 26자이며 악센트가 없는 라틴 문자를 포함한다.[19]
| 코드 | 문자 | 문자명(영어) | 설명 |
|---|
| U+0061 | a | Latin Small Letter A | 라틴 소문자 A |
| U+0062 | b | Latin Small Letter B | 라틴 소문자 B |
| U+0063 | c | Latin Small Letter C | 라틴 소문자 C |
| U+0064 | d | Latin Small Letter D | 라틴 소문자 D |
| U+0065 | e | Latin Small Letter E | 라틴 소문자 E |
| U+0066 | f | Latin Small Letter F | 라틴 소문자 F |
| U+0067 | g | Latin Small Letter G | 라틴 소문자 G |
| U+0068 | h | Latin Small Letter H | 라틴 소문자 H |
| U+0069 | i | Latin Small Letter I | 라틴 소문자 I |
| U+006A | j | Latin Small Letter J | 라틴 소문자 J |
| U+006B | k | Latin Small Letter K | 라틴 소문자 K |
| U+006C | l | Latin Small Letter L | 라틴 소문자 L |
| U+006D | m | Latin Small Letter M | 라틴 소문자 M |
| U+006E | n | Latin Small Letter N | 라틴 소문자 N |
| U+006F | o | Latin Small Letter O | 라틴 소문자 O |
| U+0070 | p | Latin Small Letter P | 라틴 소문자 P |
| U+0071 | q | Latin Small Letter Q | 라틴 소문자 Q |
| U+0072 | r | Latin Small Letter R | 라틴 소문자 R |
| U+0073 | s | Latin Small Letter S | 라틴 소문자 S |
| U+0074 | t | Latin Small Letter T | 라틴 소문자 T |
| U+0075 | u | Latin Small Letter U | 라틴 소문자 U |
| U+0076 | v | Latin Small Letter V | 라틴 소문자 V |
| U+0077 | w | Latin Small Letter W | 라틴 소문자 W |
| U+0078 | x | Latin Small Letter X | 라틴 소문자 X |
| U+0079 | y | Latin Small Letter Y | 라틴 소문자 Y |
| U+007A | z | Latin Small Letter Z | 라틴 소문자 Z |
2. 6. 제어 문자 (Control Character)
"제어 문자" 소분류에는 삭제 문자(DEL)만 포함되어 있다.[19]
3. 문자 코드 표
| 코드 | 문자 | 설명 | 약칭 |
|---|
| C0 제어 문자 |
| U+0000 | | 널 | NUL |
| U+0001 | | 헤더 시작 | SOH |
| U+0002 | | 본문 시작 | STX |
| U+0003 | | 본문 종료 | ETX |
| U+0004 | | 전송 종료 | EOT |
| U+0005 | | 응답 요구 | ENQ |
| U+0006 | | 긍정 응답 | ACK |
| U+0007 | | 벨 | BEL |
| U+0008 | | 백스페이스 | BS |
| U+0009 | | 수평 탭 | HT |
| U+000A | | 개행 | LF |
| U+000B | | 수직 탭 | VT |
| U+000C | | 다음 페이지 | FF |
| U+000D | | 캐리지 리턴 | CR |
| U+000E | | 시프트 아웃 | SO |
| U+000F | | 시프트 인 | SI |
| U+0010 | | 전송 제어 확장 | DLE |
| U+0011 | | 장치 제어 1 | DC1 |
| U+0012 | | 장치 제어 2 | DC2 |
| U+0013 | | 장치 제어 3 | DC3 |
| U+0014 | | 장치 제어 4 | DC4 |
| U+0015 | | 부정응답 | NAK |
| U+0016 | | 동기 | SYN |
| U+0017 | | 전송 블록 종료 | ETB |
| U+0018 | | 취소 | CAN |
| U+0019 | | 매체 종료 | EM |
| U+001A | | 치환 | SUB |
| U+001B | | 이스케이프 | ESC |
| U+001C | | 파일 경계 할당 | FS |
| U+001D | | 그룹 경계 할당 | GS |
| U+001E | | 레코드 경계 할당 | RS |
| U+001F | | 장치 경계 할당 | US |
| ASCII 문장 부호와 기호 |
| U+0020 | | 스페이스 | SP |
| U+0021 | ! | 느낌표 | |
| U+0022 | " | 따옴표 | |
| U+0023 | # | 해시 기호 | |
| U+0024 | $ | 달러 기호 | |
| U+0025 | % | 백분율 기호 | |
| U+0026 | & | 앰퍼샌드 | |
| U+0027 | ' | 아포스트로피 | |
| U+0028 | ( | 왼쪽 소괄호 | |
| U+0029 | ) | 오른쪽 소괄호 | |
| U+002A | * | 별표 | |
| U+002B | + | 더하기표 | |
| U+002C | , | 쉼표 | |
| U+002D | - | 하이픈 마이너스 | |
| U+002E | . | 마침표 | |
| U+002F | / | 빗금 | |
| ASCII 숫자 |
| U+0030 | 0 | 숫자 0 | |
| U+0031 | 1 | 숫자 1 | |
| U+0032 | 2 | 숫자 2 | |
| U+0033 | 3 | 숫자 3 | |
| U+0034 | 4 | 숫자 4 | |
| U+0035 | 5 | 숫자 5 | |
| U+0036 | 6 | 숫자 6 | |
| U+0037 | 7 | 숫자 7 | |
| U+0038 | 8 | 숫자 8 | |
| U+0039 | 9 | 숫자 9 | |
| ASCII 문장 부호와 기호 |
| U+003A | : | 쌍점 | |
| U+003B | ; | 쌍반점 | |
| U+003C | < | ...보다 작음 | |
| U+003D | = | 등호 | |
| U+003E | > | ...보다 큼 | |
| U+003F | ? | 물음표 | |
| U+0040 | @ | 골뱅이표 | |
| 대문자 로마자 알파벳 |
| U+0041 | A | 대문자 A | |
| U+0042 | B | 대문자 B | |
| U+0043 | C | 대문자 C | |
| U+0044 | D | 대문자 D | |
| U+0045 | E | 대문자 E | |
| U+0046 | F | 대문자 F | |
| U+0047 | G | 대문자 G | |
| U+0048 | H | 대문자 H | |
| U+0049 | I | 대문자 I | |
| U+004A | J | 대문자 J | |
| U+004B | K | 대문자 K | |
| U+004C | L | 대문자 L | |
| U+004D | M | 대문자 M | |
| U+004E | N | 대문자 N | |
| U+004F | O | 대문자 O | |
| U+0050 | P | 대문자 P | |
| U+0051 | Q | 대문자 Q | |
| U+0052 | R | 대문자 R | |
| U+0053 | S | 대문자 S | |
| U+0054 | T | 대문자 T | |
| U+0055 | U | 대문자 U | |
| U+0056 | V | 대문자 V | |
| U+0057 | W | 대문자 W | |
| U+0058 | X | 대문자 X | |
| U+0059 | Y | 대문자 Y | |
| U+005A | Z | 대문자 Z | |
| ASCII 문장 부호와 기호 |
| U+005B | [ | 왼쪽 대괄호 | |
| U+005C | \ | 역슬래시[25] | |
| U+005D | ] | 오른쪽 대괄호 | |
| U+005E | ^ | 윗꺾쇠 | |
| U+005F | _ | 밑줄 문자 | |
| U+0060 | ` | 악상 그라브 | |
| 소문자 로마자 알파벳 |
| U+0061 | a | 소문자 a | |
| U+0062 | b | 소문자 b | |
| U+0063 | c | 소문자 c | |
| U+0064 | d | 소문자 d | |
| U+0065 | e | 소문자 e | |
| U+0066 | f | 소문자 f | |
| U+0067 | g | 소문자 g | |
| U+0068 | h | 소문자 h | |
| U+0069 | i | 소문자 i | |
| U+006A | j | 소문자 j | |
| U+006B | k | 소문자 k | |
| U+006C | l | 소문자 l | |
| U+006D | m | 소문자 m | |
| U+006E | n | 소문자 n | |
| U+006F | o | 소문자 o | |
| U+0070 | p | 소문자 p | |
| U+0071 | q | 소문자 q | |
| U+0072 | r | 소문자 r | |
| U+0073 | s | 소문자 s | |
| U+0074 | t | 소문자 t | |
| U+0075 | u | 소문자 u | |
| U+0076 | v | 소문자 v | |
| U+0077 | w | 소문자 w | |
| U+0078 | x | 소문자 x | |
| U+0079 | y | 소문자 y | |
| U+007A | z | 소문자 z | |
| ASCII 문장 부호와 기호 |
| U+007B | { | 왼쪽 중괄호 | |
| U+007C | | | 수직선 | |
| U+007D | } | ||오른쪽 중괄호 ||
|-
|U+007E ||~ ||물결표 ||
|-
| colspan=4 | 제어 문자
|-
| U+007F || || 삭제 || DEL
|}
:U+005C (\)는 유니코드와 기존 문자 집합을 혼용한 일본어 또는 한국어 글꼴에서 엔 기호나 원 기호로 보일 수도 있다.[25]
4. 변형 (Variants)
몇몇 문자들은 뒤에 변형 지시자(Variation Selector)가 오면 표준화된 변형으로 렌더링되도록 정의되어 있다.
짧은 대각선 획이 있는 0(숫자 0)에 대한 변형은 U+0030 숫자 0, U+FE00 VS1 (0︀)으로 정의된다.[9][14]
12개의 문자(#, *, 숫자) 뒤에는 U+FE0E VS15 또는 U+FE0F VS16이 와서 이모지 변형을 만들 수 있다.[10][11][12][13] 이들은 키캡 기본 문자이며, 예를 들어 #️⃣ (U+0023 숫자 기호 U+FE0F VS16 U+20E3 결합하는 괄호 키캡)가 있다. VS15 버전은 "텍스트 표현"이고, VS16 버전은 "이모지 스타일"이다.[14]
style="font-size:small" | 이모지 변형 시퀀스| U+ | 0023 | 002A | 0030 | 0031 | 0032 | 0033 | 0034 | 0035 | 0036 | 0037 | 0038 | 0039 |
| base | # | * | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
| base+VS15+keycap | #︎⃣ | *︎⃣ | 0︎⃣ | 1︎⃣ | 2︎⃣ | 3︎⃣ | 4︎⃣ | 5︎⃣ | 6︎⃣ | 7︎⃣ | 8︎⃣ | 9︎⃣ |
| base+VS16+keycap | #️⃣ | *️⃣ | 0️⃣ | 1️⃣ | 2️⃣ | 3️⃣ | 4️⃣ | 5️⃣ | 6️⃣ | 7️⃣ | 8️⃣ | 9️⃣ |
5. 이모지 (Emoji)
기본 라틴 문자 블록에는 U+0023 (#), U+002A (*), U+0030–U+0039 (0-9)의 12가지 문자가 이모지로 포함되어 있다.[20][21] 이 문자들은 와 조합하여 전화기 버튼을 나타낼 수 있다. (예: #️⃣ (U+0023 넘버 사인 U+FE0F VS16 U+20E3 COMBINING ENCLOSING KEYCAP)).
이 12가지 문자는 두 종류의 이형 문자 선택자를 적용할 수 있다. 이모지 표시(U+FE0F VS16) 또는 텍스트 표시(U+FE0E VS15)를 적용할 수 있으며, 둘 다 기본값은 텍스트 표시이다.[22]
이모지의 이형 문자 시퀀스| U+ | 0023 | 002A | 0030 | 0031 | 0032 | 0033 | 0034 | 0035 | 0036 | 0037 | 0038 | 0039 |
| 기본 코드 포인트 | # | * | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
| base+VS15 (텍스트) | #︎ | *︎ | 0︎ | 1︎ | 2︎ | 3︎ | 4︎ | 5︎ | 6︎ | 7︎ | 8︎ | 9︎ |
| base+VS16 (이모지) | #️ | *️ | 0️ | 1️ | 2️ | 3️ | 4️ | 5️ | 6️ | 7️ | 8️ | 9️ |
6. 역사 (History)
유니코드 기본 라틴 문자 블록의 특정 문자를 정의하는 과정과 관련된 유니코드 문서들은 다음과 같다.
| 버전 | 최종 코드 포인트[1] | 개수 | UTC ID | L2 ID | WG2 ID | 문서 |
|---|
| 1.0.0 | U+0000..007F | 128 | | | | (미정) |
| | | UTC/1999-013영어 | | | 켄트 칼슨(Kent Karlsson), 틸데와 마이크로 기호 분해한국어 (1999-05-27) |
| | | | L2/99-176R영어 | | 리사 무어(Lisa Moore), 1999년 6월 8-10일 시애틀에서 열린 UTC/L2 공동 회의록한국어 (1999-11-04), 마이크로 기호 케이스 매핑한국어 부분 |
| | | | L2/04-145영어 | | 데이비드 스타너(David Starner), BAE 보고서 1884(Dorsey)에서 C 스트로크 문자 예제한국어 (2004-04-30) |
| | | | L2/04-202영어 | | 데보라 앤더슨(Deborah Anderson), C 슬래시 피드백한국어 (2004-06-07) |
| | | | | [https://www.unicode.org/wg2/docs/n3046.pdf N3046] | 미셸 쉬냐르(Michel Suignard), 제어 문자에 대한 공식 정의 개선한국어 (2006-02-22) |
| | | | | N3103영어 ([https://www.unicode.org/wg2/docs/n3103.pdf pdf], [https://www.unicode.org/wg2/docs/n3103.doc doc]) | V. S. 우마마헤스와란(V. S. Umamaheswaran), WG 2 회의 48차 회의록 (미확정), 미국 캘리포니아주 마운틴뷰; 2006-04-24/27한국어 (2006-08-25), M48.33 부분 |
| | | | L2/11-043영어 | | 아스무스 프라이탁(Asmus Freytag), 켄트 칼슨(Kent Karlsson), 수퍼 및 아래 첨자 문자에 대한 특정 속성 할당의 실수 및 불일치 수정 제안한국어 (2011-02-02) |
| | | | L2/11-160영어 | | PRI #181 열두 문자의 일반 범주 변경한국어 (2011-05-02) |
| | | | L2/11-261R2영어 | | 리사 무어(Lisa Moore), UTC #128 / L2 #225 회의록한국어 (2011-08-16), 합의 128-C3한국어 부분: BEL 및 NUL 약어를 추가하여 제어 문자에 대한 이름 별칭에 대한 Ken Whistler의 L2/11-281 권장 사항을 수락합니다.한국어 |
| | | | L2/11-438영어[2][3] | [https://www.unicode.org/wg2/docs/n4182.pdf N4182] | 피터 에드버그(Peter Edberg), 이모지 변형 시퀀스(L2/11-429 개정)한국어 (2011-12-22) |
| | | | L2/15-107영어 | | 리사 무어(Lisa Moore), UTC #143 회의록한국어 (2015-05-12), 합의 143-C5한국어 부분: 이모지-데이터.txt의 12개 키캡 시퀀스를 유니코드 8.0에서 임시 명명된 시퀀스로 추가합니다.한국어 |
| | | | L2/15-268영어 | | 바바라 비턴(Barbara Beeton), 아스무스 프라이탁(Asmus Freytag), 로렌티우 이안쿠(Laurențiu Iancu), 머레이 사전트(Murray Sargent), 빈 집합의 슬래시 0 변형 표현 제안한국어 (2015-10-30) |
| | | | L2/15-301영어[4][3] | | 루즈베 푸르나데르(Roozbeh Pournader), 이모지에 대한 278개의 표준화된 변형 시퀀스 제안한국어 (2015-11-01) |
| | | | L2/15-254영어 | | 리사 무어(Lisa Moore), UTC #145 회의록한국어 (2015-11-16), B.12.1.2 부분 빈 집합의 슬래시 0 변형 표현 제안한국어 |
| | | | L2/17-294영어 | [https://www.unicode.org/wg2/docs/n4914-17294-fullwidth-slashed-zero.pdf N4914] | 켄 룬데(Ken Lunde), U+FF10 FULLWIDTH DIGIT ZERO에 대한 표준화된 변형 시퀀스 추가 제안한국어 (2017-08-14) |
| | | | L2/22-019영어 | | 마르쿠스 셰러(Markus Scherer) 외, UTC #170 속성 피드백 및 권장 사항한국어 (2022-01-19), F.2 F4 부분: ISO의 U+0019 vs. NameAliases.txt vs. 차트/NamesList.txt한국어 |
| | | | L2/22-016영어 | | 피터 콘스터블(Peter Constable), UTC #170 회의록한국어 (2022-04-21), 합의 170-C24한국어 부분: U+0019의 경우, 유니코드 버전 15.0에 대해 약어 유형의 이름 별칭 "EM"을 추가합니다.한국어 |
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com