JIS X 0201
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
JIS X 0201은 1969년에 제정된 일본 산업 표준 문자 인코딩으로, 7비트 및 8비트 문자 집합을 포함한다. 이 표준은 국제 전신 문자 No.2(ITA2) 코드를 기반으로 하며, 로마자, 가타카나, 특수 기호를 포함한다. JIS X 0201은 일본에서 널리 사용되었으며, 특히 전국 은행 데이터 통신 시스템에서 2018년까지 사용되었다. 이 표준은 Shift JIS와 같은 다른 문자 인코딩의 기반이 되었으며, 유니코드와도 관련이 있다.
더 읽어볼만한 페이지
- JIS 표준 - JIS X 0212
JIS X 0212는 1990년 일본 규격 협회에서 발표한 정보 교환용 한자 부호 표준으로, JIS X 0208 문자 집합의 확장 및 적용 범위 부족을 해결하기 위해 6,067개의 문자를 지정하였으며, 유니코드 제정 시 원규격 중 하나로 사용되었으나 현재는 사실상 사장되었고 JIS X 0213에 통합되었다. - JIS 표준 - JIS X 0208
JIS X 0208은 정보 교환을 목적으로 하는 일본어 문자 집합 코드로, 94×94 문자 집합으로 구성되어 한자, 히라가나, 가타카나, 숫자, 로마자, 기호 등을 포함하며, 각 문자에는 식별 가능한 이름이 부여되어 유니코드와 같은 다른 문자 집합과의 매핑에 활용되지만, 사용자 정의 영역이 없고 일부 한자는 실제로 사용되지 않는 유령 문자로 알려져 있다. - 일본어 컴퓨팅 - Shift JIS
Shift JIS는 JIS X 0201을 기반으로 JIS X 0208을 할당하여 일본어 문자를 인코딩하는 방식으로, 이스케이프 시퀀스 없이 문자 집합을 혼용하여 파일 크기를 절약하고 처리 시간을 단축하며, MS-DOS에서 "MS 한자 코드"로 채택된 후 사실상 표준으로 자리 잡았다. - 일본어 컴퓨팅 - JIS X 0212
JIS X 0212는 1990년 일본 규격 협회에서 발표한 정보 교환용 한자 부호 표준으로, JIS X 0208 문자 집합의 확장 및 적용 범위 부족을 해결하기 위해 6,067개의 문자를 지정하였으며, 유니코드 제정 시 원규격 중 하나로 사용되었으나 현재는 사실상 사장되었고 JIS X 0213에 통합되었다. - 문자 집합 - 점자
점자는 루이 브라이유가 개발한 시각 장애인용 촉각 문자 체계로, 6점 점자를 사용하여 133개 이상의 언어에 적용되었으며, 교육, 정보 접근, 사회 참여에 필수적인 역할을 수행하지만 문해력 저하와 교육의 어려움이라는 과제도 안고 있다. - 문자 집합 - ISO/IEC 646
ISO/IEC 646는 ASCII 기반의 7비트 문자 인코딩 표준으로, 국가별 변형이 존재했으나, 최종 개정판은 ASCII와 호환되도록 정의되었고, 현재는 ITU-T 권고 T.50 IRA가 현행 표준으로 유지되고 있다.
2. 역사
국제 전신 전화 자문 위원회(CCITT)가 국제 전신 문자 No.2(ITA2) 코드를 국제 표준으로 도입하면서, 일본에서도 이를 기반으로 한 문자 코드 표준화가 진행되었다. 초기에는 6비트 코드가 사용되었으나, 문자 맵 크기와 코드 레이아웃 문제로 산업계 요구를 충족시키지 못했다. 이에 국제 표준화 기구(ISO) 초안을 바탕으로 새로운 표준 제정이 추진되었다.[1]
ISO R 646 초안 발표 후, 정보 처리 학회(IPSJ)에 코드 표준화 위원회가 구성되어 가타카나 매핑을 포함한 표준화 작업이 진행되었다. 초기 JIS 초안은 작은 가타카나 문자를 일반 가타카나 문자 옆에 배치했으나, 키보드 메커니즘 문제로 비판받았다. ISO 초안에서 통화 기호 할당 문제가 제기되었는데, JIS 위원회는 엔 기호(¥)를 0x5c 위치에 할당하기로 결정했다.[2]
이러한 과정을 거쳐 1969년 JIS C 6220이 발행되었고, 이후 여러 차례 개정을 거쳐 현재의 JIS X 0201이 되었다. JIS X 0201은 전국 은행 데이터 통신 시스템 등에서 널리 사용되었으며,[3] JIS X 0208, Shift JIS와 같은 다른 문자 집합과의 관계 속에서 일본 문자 인코딩 발전에 큰 영향을 미쳤다.[4]
2. 1. 제정 배경
국제 전신 전화 자문 위원회(CCITT)는 국제 표준으로 국제 전신 문자 No.2(ITA2) 코드를 도입했는데, 이는 5비트 라틴 인코딩이었다. 대부분의 국가가 이를 기반으로 자체 국가 표준을 가지고 있었다. 일본에서는 공업기술원(AIST)이 이를 JIS C 0803-1961('전신 타자기의 키보드 레이아웃 및 코드')의 6비트 문자 코드로 표준화했지만, 문자 맵이 작고 코드 레이아웃이 비실용적이어서 산업 요구 사항에 부합하지 않았다. AIST는 일본에서 사용되는 다양한 코드를 대체할 실용적인 문자 인코딩을 고려했다.[1]1963년, 국제 표준화 기구(ISO)는 ISO R 646('정보 처리 교환을 위한 6 및 7비트 코드화 문자 세트') 초안을 발표했다. AIST는 ISO R 646과 가타카나 매핑을 정보 처리 학회(IPSJ)에 위임했고, IPSJ는 코드 표준화 위원회를 구성했다. 위원회는 가타카나 세트가 문자 맵에 들어갈 수 없었기 때문에 ISO 초안의 6비트 형식을 채택하지 않았다. 초기 JIS 초안은 작은 가타카나 문자를 각각 일반 가타카나 문자 옆에 매핑했는데, 이는 오십음도 순서로 정렬하는 데 편리하다고 여겨졌지만, 일부 위원들은 일반 가타카나 문자만 처리하는 키보드의 메커니즘을 복잡하게 만들 것이라고 비판했다.
1964년 ISO 초안은 0x24와 0x5c 위치를 각 국가에서 할당할 첫 번째 및 두 번째 통화 기호로 예약했지만, 통화 기호는 현지화될 수 있으므로 국제 통신에서 사용하는 것은 너무 위험하다고 간주되었다. ISO 위원회는 일반 통화 기호(¤)를 사용하거나 달러 기호($)와 파운드 기호(£) 기호에 영구 할당을 부여하는 두 가지 옵션을 가지고 있었다. 달러 기호는 0x24 위치에, 파운드 기호는 0x23 위치에 할당하기로 합의했다. JIS 위원회는 엔 기호(¥)를 0x5c (국가 사용 위치 중 하나)에 넣기로 결정했다.[2]
2. 2. 제정 및 개정
국제 표준화 기구(ISO)의 초안을 바탕으로 1969년에 JIS C 6220('정보 교환을 위한 코드')이 제정되었다.[1] 1987년에는 JIS 카테고리 개혁으로 인해 JIS X 0201로 번호가 변경되었고, 1990년에는 '정보 교환을 위한 7비트 및 8비트 코드화 문자 세트'로 명칭이 변경되었다.JIS X 0201 문자 세트는 일본에서 널리 사용되었는데, 특히 1973년에 설립된 전국 은행 데이터 통신 시스템에서 은행 간 거래 메시지에 JIS X 0201의 하위 집합을 사용했다.[3] 이 시스템은 2018년까지 사용되다가 히라가나 및 가타카나 문자를 처리할 수 있는 ZEDI(전은EDI시스템)로 대체되었다.
1978년에는 히라가나 및 한자 문자를 표현하기 위해 JIS C 6226(JIS X 0208) 2바이트 문자 세트가 개발되었다.[4] JIS X 0208은 가타카나 문자를 포함했지만, 코드와 레이아웃은 JIS X 0201과 달랐다. 컴퓨터 제조업체들은 JIS X 0201과의 호환성을 위해 JIS X 0208의 자체 확장을 개발했다. 1982년, 마이크로소프트의 간지 인코딩 방식(코드 페이지 932 of MS-DOS)과 디지털 리서치의 SJC26(일본 CP/M-86용)이 shift out 및 shift in 문자 없이 JIS X 0201 단일 바이트 인코딩과 JIS X 0208 이중 바이트 인코딩을 결합하기 위해 개발되었는데, 이것이 Shift JIS이며, 개인용 컴퓨터의 산업 표준이 되었다.
3. 구성
JIS X 0201은 7비트와 8비트 문자 집합을 모두 포함한다. 8비트 문자 집합의 구성은 다음과 같다.
- 0x21 ~ 0x7E: ASCII 및 ISO/IEC 646에 기반한 로마자 문자 집합. ASCII와 거의 같으나, 역슬래시(0x5C)가 ¥로, 물결표(0x7E)가 ‾로 바뀌었다.[5]
- 0xA1 ~ 0xFE: 가타카나와 몇몇 문장 부호. (0xE0부터 0xFE까지는 사용되지 않음)
7비트 문자 집합은 8비트 문자 집합에 기반하며, 0x21부터 0x7E까지의 영역만 사용한다. 로마자 문자 집합과 가타카나 문자 집합은 shift in 및 shift out 코드를 사용하여 전환한다. 7비트 형식에서 shift out(0x0E)은 가나 집합으로, shift in(0x0F)은 로마자 집합으로 전환된다.[6][7] 8비트 형식에서는 최상위 비트가 설정된 바이트(0x80-0xFF)는 가나 집합, 설정되지 않은 바이트(0x00-0x7F)는 로마자 집합에 사용된다.
3. 1. 로마자 집합
이 표준의 로마자 집합은 ASCII에 기반하고 있으나, 몇 가지 차이점이 있다. 역슬래시(0x5C)는 ¥로, 물결표(0x7E)는 ‾로 대체되었다.[5]7비트 형식에서는 shift out 코드를 사용하여 가타카나 문자 집합으로 전환하고, shift in 코드 (0x0F)를 사용하여 로마자 집합으로 전환한다.[6][7]

