맨위로가기

UTF-EBCDIC

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

UTF-EBCDIC는 UTF-8보다 많은 160개의 문자를 표현하는 단일 바이트 인코딩 방식이다. 코드 페이지 레이아웃은 제어 문자, 구두점, 특수 문자, 숫자, 알파벳(대문자 및 소문자) 등으로 구성되어 있다. 이 인코딩은 IBM-1047과 유사하며, CCSID 37과는 일부 문자의 위치가 다르다. 오라클 UTFE는 오라클 데이터베이스에서 사용되는 UTF-8 변형으로, 보조 문자를 처리하며 EBCDIC 플랫폼에서 사용된다.

더 읽어볼만한 페이지

  • 유니코드 변환 형식 - UTF-8
    UTF-8은 유니코드 문자를 표현하는 가변 길이 문자 인코딩 방식으로, ASCII 코드와 호환성을 유지하며 다양한 언어의 문자를 표현할 수 있도록 설계되었지만, 보안 문제점과 공간 효율성 측면에서 단점을 가진다.
  • 유니코드 변환 형식 - UTF-1
    UTF-1은 유니코드 초기 버전을 인코딩하기 위해 1992년에 설계된 가변 길이 문자 인코딩 방식으로, ASCII 호환성을 유지하고 ISO 2022 및 MIME과의 호환성을 고려했지만, "모듈로 190" 산술을 사용하는 특징과 현대 유니코드 표준과의 차이점을 가진다.
  • 유니코드에 관한 - UTF-8
    UTF-8은 유니코드 문자를 표현하는 가변 길이 문자 인코딩 방식으로, ASCII 코드와 호환성을 유지하며 다양한 언어의 문자를 표현할 수 있도록 설계되었지만, 보안 문제점과 공간 효율성 측면에서 단점을 가진다.
  • 유니코드에 관한 - UTF-1
    UTF-1은 유니코드 초기 버전을 인코딩하기 위해 1992년에 설계된 가변 길이 문자 인코딩 방식으로, ASCII 호환성을 유지하고 ISO 2022 및 MIME과의 호환성을 고려했지만, "모듈로 190" 산술을 사용하는 특징과 현대 유니코드 표준과의 차이점을 가진다.
  • 문자 인코딩 - 유니코드
    유니코드는 세계의 모든 문자를 하나의 컴퓨터 인코딩 표준으로 통합하기 위해 설계되었으며, 유니코드 컨소시엄에 의해 관리되고 UTF-8, UTF-16, UTF-32 등의 부호화 형식을 제공하지만, 일부 문자 표현 문제, 버전 간 비호환성, 레거시 인코딩과의 호환성 문제 등의 과제를 안고 있다.
  • 문자 인코딩 - UTF-8
    UTF-8은 유니코드 문자를 표현하는 가변 길이 문자 인코딩 방식으로, ASCII 코드와 호환성을 유지하며 다양한 언어의 문자를 표현할 수 있도록 설계되었지만, 보안 문제점과 공간 효율성 측면에서 단점을 가진다.
UTF-EBCDIC

2. 코드 페이지 레이아웃

UTF-EBCDIC는 싱글 바이트 인코딩으로 160개 문자를 표현하며(UTF-8의 경우 128개), 이는 IBM-1047과 유사하다. 코드 페이지 레이아웃은 아래 표와 같다.



|J

|K

|L

|M

|N

|O

|P

|Q

|R

|

|

|

|

|

|

|-

! Ex

|\

|

|S

|T

|U

|V

|W

|X

|Y

|Z

|

|

|

|

|

|

|-

! Fx

|0

|1

|2

|3

|4

|5

|6

|7

|8

|9

|

|

|

|

|

|APC

|}

각 코드에 대한 자세한 내용은 다음과 같다.

  • 제어 문자: 0x00 ~ 0x3F, 0x7F, 0x80 ~ 0x9F 범위에 있으며, 제어 문자 섹션에 자세히 설명되어 있다.
  • 구두점 및 특수 문자: 0x40 ~ 0x7E 범위에 있으며, 구두점 및 특수 문자 섹션에 자세히 설명되어 있다.
  • 숫자: 0xF0 ~ 0xF9 범위에 있으며, 숫자 섹션에 자세히 설명되어 있다.
  • 알파벳 (대문자 및 소문자): 대문자는 0xC1 ~ 0xC9, 0xD1 ~ 0xD9, 0xE2 ~ 0xE9 범위에, 소문자는 0x81 ~ 0x89, 0x91 ~ 0x99, 0xA2 ~ 0xA9 범위에 있으며, 알파벳 섹션에 자세히 설명되어 있다.

2. 1. 제어 문자

UTF-EBCDIC에는 0x00 ~ 0x3F, 0x7F, 0x80 ~ 0x9F 범위에 다양한 제어 문자들이 포함되어 있다. 주요 제어 문자는 다음과 같다.

UTF-EBCDIC 코드 페이지 레이아웃
0x0123456789ABCDEF
0xNULSOHSTXETXSTHTSSADELEPARISS2VTFFCRSOSI
1xDLEDC1DC2DC3OSCLFBSESACANEMPU2SS3FSGSRSUS
2xPADHOPBPHNBHINDNELETBESCHTSHTJVTSPLDPLUENQACKBEL
3xDCSPU1SYNSTSCCHMWSPAEOTSOSSGCISCICSIDC4NAKPMSUB
4xSP.<(+|
5x&!$*);^
6x-/,%_>?
7x`:#@'="
8xabcdefghi
9xjklmnopqr
Ax~stuvwxyz[
Bx]
Cx{ABCDEFGHI
Dx}
코드이름설명
0x00NUL널 문자
0x01SOH헤더 시작
0x02STX텍스트 시작
0x03ETX텍스트 종료
0x04EOT전송 종료
0x05ENQ탐구
0x06ACK응답
0x07BEL경고음
0x08BS백스페이스
0x09HT수평 탭
0x0ALF라인 피드
0x0BVT수직 탭
0x0CFF폼 피드
0x0DCR캐리지 리턴
0x0ESO시프트 아웃
0x0FSI시프트 인
0x10DLE데이터 링크 이스케이프
0x11DC1장치 제어 1
0x12DC2장치 제어 2
0x13DC3장치 제어 3
0x14DC4장치 제어 4
0x15NAK부정 응답
0x16SYN동기화 유휴
0x17ETB전송 블록 종료
0x18CAN취소
0x19EM매체 종료
0x1ASUB대체
0x1BESC이스케이프
0x1CFS파일 구분
0x1DGS그룹 구분
0x1ERS레코드 구분
0x1FUS단위 구분
0x7FDEL삭제
0x80PAD패딩
0x81HOP하이 옥텟 프리셋
0x82BPH여기에서 줄 바꿈 허용
0x83NBH여기에서 줄 바꿈 금지
0x84IND인덱스
0x85NEL다음 줄
0x86SSA선택 영역 시작
0x87ESA선택 영역 종료
0x88HTS문자 탭 설정
0x89HTJ정렬된 문자 탭
0x8AVTS라인 탭 설정
0x8BPLD부분 줄 앞으로
0x8CPLU부분 줄 뒤로
0x8DRI역 캐리지 리턴
0x8ESS2단일 시프트 2
0x8FSS3단일 시프트 3
0x90DCS장치 제어 문자열
0x91PU1개인 사용 1
0x92PU2개인 사용 2
0x93STS전송 상태 설정
0x94CCH취소 문자
0x95MW메시지 대기
0x96SPA보호 영역 시작
0x97EPA보호 영역 종료
0x98SOS문자열 시작
0x99SGCI단일 그래픽 문자 도입자
0x9ASCI단일 문자 도입자
0x9BCSI제어 시퀀스 도입자
0x9CST문자열 종료
0x9DOSC운영 체제 명령
0x9EPM프라이버시 메시지
0x9FAPC응용 프로그램 명령


2. 2. 구두점 및 특수 문자

UTF-EBCDIC에서 0x40부터 0x7E 범위에는 다음과 같은 구두점 및 특수 문자들이 포함되어 있다.



|-

| || || 0xE0 || \

|}

2. 3. 숫자

UTF-EBCDIC에서 숫자 0부터 9까지는 0xF0부터 0xF9 범위에 할당되어 있다. 각 숫자에 해당하는 코드는 다음과 같다.

코드문자코드문자
0x40공백0x60-
0x4A마침표0x61/
0x4B<0x6A,
0x4C(0x6B%
0x4D+0x6C_
0x4E0x6D>
0x50&0x6E?
0x5A!0x79`
0x5B$0x7A:
0x5C*0x7B#
0x5D)0x7C@
0x5E;0x7D'
0x5F^0x7E
0x7F"
0xA1~
0xAA
0xB9[
0xC0{
0xD0}
숫자코드
00xF0
10xF1
20xF2
30xF3
40xF4
50xF5
60xF6
70xF7
80xF8
90xF9


2. 4. 알파벳 (대문자 및 소문자)

UTF-EBCDIC에서 알파벳 대문자는 0xC1 ~ 0xC9, 0xD1 ~ 0xD9, 0xE2 ~ 0xE9 범위에, 소문자는 0x81 ~ 0x89, 0x91 ~ 0x99, 0xA2 ~ 0xA9 범위에 있다. 각 코드 범위와 해당 문자는 다음과 같다.

코드 범위문자코드 범위문자
0xC1A0x81a
0xC2B0x82b
0xC3C0x83c
0xC4D0x84d
0xC5E0x85e
0xC6F0x86f
0xC7G0x87g
0xC8H0x88h
0xC9I0x89i
0xD1J0x91j
0xD2K0x92k
0xD3L0x93l
0xD4M0x94m
0xD5N0x95n
0xD6O0x96o
0xD7P0x97p
0xD8Q0x98q
0xD9R0x99r
0xE2S0xA2s
0xE3T0xA3t
0xE4U0xA4u
0xE5V0xA5v
0xE6W0xA6w
0xE7X0xA7x
0xE8Y0xA8y
0xE9Z0xA9z


3. Oracle UTFE

'''오라클 UTFE'''는 유니코드 3.0 UTF-8 오라클 데이터베이스 변형으로, CESU-8과 유사하게 보조 문자를 단일 4바이트 또는 5바이트 문자가 아닌 두 개의 4바이트 문자로 인코딩한다. 이는 EBCDIC 플랫폼에서만 사용된다.[2]

참조

[1] 웹사이트 UTR #16: UTF-EBCDIC https://www.unicode.[...] 2021-02-23
[2] 서적 Oracle9i Database Globalization Support Guide https://docs.oracle.[...] Oracle Corporation 2002



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com