일본어 입력기
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
일본어 입력기는 일본어 텍스트를 입력하는 데 사용되는 소프트웨어 또는 하드웨어 도구로, 가나-한자 변환, 한자 직접 입력, 전체 문자 배열 등 다양한 입력 방식을 제공한다. 가나-한자 변환은 가나를 입력하고 한자, 가타카나, 로마자로 변환하는 방식으로, JIS 배열, 엄지 시프트, 로마자, 휴대폰 입력 방식을 포함한다. 일본어 입력기는 입력 방식 전환, 히라가나-한자 변환, 사전, 학습, 입력 지원 기능 등을 갖추고 있으며, 인터넷 슬랭 생성에도 영향을 미친다.
더 읽어볼만한 페이지
- 일본어 입력기 - 구글 일본어 입력
구글 일본어 입력은 구글에서 개발한 일본어 입력기로, 풍부한 어휘와 예측 기능, 오타 교정, 다양한 어휘 지원, 유행어 예측, 안정성을 특징으로 하며, 오픈 소스 버전 Mozc도 존재하고 Gboard에도 통합되어 사용자 편의성을 위한 업데이트가 지속적으로 이루어진다. - 일본어 컴퓨팅 - Shift JIS
Shift JIS는 JIS X 0201을 기반으로 JIS X 0208을 할당하여 일본어 문자를 인코딩하는 방식으로, 이스케이프 시퀀스 없이 문자 집합을 혼용하여 파일 크기를 절약하고 처리 시간을 단축하며, MS-DOS에서 "MS 한자 코드"로 채택된 후 사실상 표준으로 자리 잡았다. - 일본어 컴퓨팅 - JIS X 0212
JIS X 0212는 1990년 일본 규격 협회에서 발표한 정보 교환용 한자 부호 표준으로, JIS X 0208 문자 집합의 확장 및 적용 범위 부족을 해결하기 위해 6,067개의 문자를 지정하였으며, 유니코드 제정 시 원규격 중 하나로 사용되었으나 현재는 사실상 사장되었고 JIS X 0213에 통합되었다. - 입력기 - 금석문자경
금석문자경은 1997년 발매된 한자 글꼴 및 데이터베이스로, 다양한 버전 업데이트와 웹 데이터베이스 서비스 등을 제공하다가 2018년 사업이 종료되었다. - 입력기 - SCIM
SCIM은 C++ 또는 C로 작성된 모듈화된 객체 지향 구조의 입력기로, 동적 라이브러리 로드, UCS-4/UTF-8 인코딩 지원을 통한 국제화, 다양한 입력기 라이브러리 통합, 그리고 IIIMF 입력기 프레임워크의 언어 엔진으로의 동작을 특징으로 한다.
일본어 입력기 | |
---|---|
개요 | |
유형 | 입력기 |
사용 언어 | 일본어 |
입력 방식 | |
주요 방식 | 가나 입력 로마자 입력 |
기타 방식 | 음성 입력 필기 인식 |
입력 체계 | |
가나 입력 | JIS 신 JIS 친지 M식 |
로마자 입력 | 와푸로 로마자 헤본식 로마자 일본식 로마자 쿤레이식 로마자 |
소프트웨어 | |
주요 소프트웨어 | ATOK Google 일본어 입력기 Microsoft IME Kotoeri |
모바일 운영체제 | Gboard iWnn 플라잉 키 |
역사 | |
초기 | 기요나리 겐타로의 가나 타자기 발명 |
발전 | 워드프로세서 및 개인용 컴퓨터 보급과 함께 발전 |
관련 기술 | |
자동 변환 | 인공지능 및 자연어 처리 기술 활용 |
학습 기능 | 사용자 입력 패턴 학습 및 자동 완성 기능 제공 |
문제점 및 과제 | |
입력 효율성 | 가나 입력과 로마자 입력 간 효율성 논쟁 |
오타 및 변환 오류 | 문맥 기반의 정확한 변환 필요 |
사용자 인터페이스 | 직관적이고 편리한 사용자 인터페이스 설계 |
기타 | |
관련 용어 | IME (Input Method Editor) FEP (Front End Processor) |
표준 | JIS X 4061 (일본어 입력 시스템 기능 요구 사항) |
2. 입력 및 변환 방법
PC에서 영문 입력은 일반 키보드에서 타자기와 같이 입력할 수 있지만, 일본어와 같이 사용 문자 수가 수천을 넘는 언어의 문장을 입력할 때는 모든 문자에 하나의 키를 할당하는 키보드는 비현실적이기 때문에, 여러 키 조작으로 한 글자를 입력하는 등의 방법이 필요하다.
일본어 입력 방법은 크게 다음과 같이 나눌 수 있다.
- '''가나 한자 변환(かな漢字変換일본어)''' : 가나를 입력하여 한자, 가나, 영문자 등으로 변환한다.
- * 가나 입력: JIS 배열, 엄지 시프트 등의 키보드 배열을 이용하여 직접 가나 문자를 입력한다.
- * 로마자 입력: QWERTY 배열 키보드로 로마자를 입력하고 가나 문자로 변환한다.
- '''한자 직접 입력(漢字直接入力일본어)''' : 한자에 특정 키 입력을 할당하여 직접 한자를 입력한다. 한자 텔렉스 등에서 사용된 다단 시프트(多段シフト일본어) 방식도 여기에 해당한다.
- '''전체 문자 배열(全文字配列일본어)''' : 사용하는 문자 수만큼 키를 갖춘 시스템이다. 초기 워드프로세서, 일본어 전자 타자기에서 사용된 태블릿 방식 등이 있다.
- '''기타 입력 방식'''
- * 한화사전(漢和辞典일본어) 방식: 부수(부수 변환), 총획수 등으로 한자를 검색한다.
- * 필기 입력: 포인팅 장치를 통한 필기를 문자로 인식한다.
- * 음성 인식: 마이크에 입력된 음성을 한자와 가나가 섞인 문장으로 변환한다.
1978년 도시바의 "JW-10" 발매를 통해 가나 한자 변환 방식이 실현되었다. 일본어 입력기는 MS-DOS 시절에는 프론트 엔드 프로세서(FEP)로, 윈도우 보급 이후에는 입력기(IME)로 불리는 경우가 많다. 워드프로세서, PC뿐만 아니라 휴대전화, 게임기 등 다양한 기기에 내장되어 있다.
2. 1. 가나 한자 변환 (かな漢字変換)
일본어 입력 방법 중 현재 주류는 읽는 방식인 가나를 어떤 형태로든 입력해 놓고, 한자, 가나, 영문자 등의 변환 후보에서 선택하여 입력하는 '가나 한자 변환'이다. 이는 1978년 도시바의 "JW-10" 발매를 통해 실현되었다. 일본어 입력기는 MS-DOS 시절에는 주로 프런트 엔드 프로세서(FEP)로 구현되었기 때문에, 일본어 입력 FEP, 더 줄여서 FEP 등으로 불리는 경우가 많았다. 윈도우 보급 이후에는 입력기(IME)로 불리는 경우가 많아졌다.가나 한자 변환은 입력된 가나에 대한 후보 한자 목록을 제공하며, 사용자는 스페이스바 또는 화살표 키를 사용하여 올바른 표기에 도달할 때까지 후보 목록을 스크롤할 수 있다. 올바른 표기에 도달하면 ''Enter'' 키 또는 "변환" 키를 눌러 변환 프로세스를 종료한다. 히라가나가 필요한 경우, 문자를 입력한 직후 ''Enter'' 키를 누르면 입력한 대로 히라가나가 표시된다. 가타카나가 필요한 경우, 한자 선택과 함께 옵션으로 제공되거나, 일부 키보드에서는 무변환(無変換) 버튼을 누르면 가타카나와 히라가나 사이를 전환할 수 있다.

정교한 가나 한자 변환기(총칭하여 입력기 또는 IME라고 함)는 여러 가나 단어를 한 번에 한자로 변환할 수 있어, 사용자가 각 단계에서 변환을 수행할 필요가 없다. 사용자는 스페이스바 또는 변환 버튼을 눌러 입력의 어느 단계에서든 변환할 수 있으며, 변환기는 단어의 정확한 분할을 추측하려고 시도한다. 일부 IME 프로그램은 사용자가 올바른 한자를 선택하는 데 도움이 되도록 각 단어에 대한 간략한 정의를 표시한다.
가끔 가나 한자 변환기는 모든 단어에 대해 올바른 한자를 추측할 수 있지만, 그렇지 않은 경우 커서(화살표) 키를 사용하여 후보 단어 사이를 앞뒤로 이동하거나 숫자 키를 사용하여 그 중 하나를 직접 선택할 수 있다. 선택한 단어 경계가 잘못된 경우, 제어 키(또는 시프트 키)와 화살표 키를 사용하여 단어 경계를 이동할 수 있다.
변환 단위로는 한자 한 글자, 단어, 문절, 연문절, 문장 일괄 변환 등이 있지만, 현재 한 글자나 단어 단위 변환은 많이 줄어들었다.
워드프로세서, 컴퓨터뿐만 아니라 휴대 전화, 비디오 레코더, 게임기와 같은 디지털 가전, 자동차 내비게이션, 정보 키오스크 단말기 등 일본어 입력을 필요로 하는 다양한 기기에 일본어 입력 시스템이 탑재되어 있다.
2. 1. 1. 가나 입력
JIS 배열, 엄지 시프트 등의 키보드 배열을 이용하여 직접 가나 문자를 입력하는 방식이다.2. 1. 2. 로마자 입력
다수의 일본어 입력 방식 편집기는 로마자를 사용하여 일본어 텍스트를 입력할 수 있도록 지원하며, 이 로마자는 다시 가나 또는 한자로 변환될 수 있다. 이 방법을 사용하면 가나 표기가 있는 일본어 자판을 사용하지 않아도 된다.[5]레이아웃 | 데스크톱 | 휴대폰 | 스마트폰 | 순환 입력 | 플릭 입력 | 로마자 입력 |
---|---|---|---|---|---|---|
QWERTY | 예 | 아니요 | 예 | 아니요 | 아니요 | 예 |
2. 1. 3. 휴대 전화 입력
가나 한자 변환을 스마트폰이나 휴대 전화로 할 경우, 하드웨어 키보드나 소프트웨어 키보드로 멀티탭 입력 혹은 플릭 입력(フリック入力)으로 가나 입력을 하는 것이 일반적이다. 그 후, 2터치 입력이나 입력예측에 의해 타자 수를 줄이는 시도를 볼 수 있으며, 근래에는 PC용 가나 한자 변환 시스템에도 입력 예측 기능을 가지고 있다.[4]
초기 휴대폰에서 일본어 입력을 위해 사용된 주요 시스템은 숫자 키패드를 기반으로 한다. 각 숫자는 특정 가나 시퀀스와 연결되어 있으며, 예를 들어 '2'는 ''ka'', ''ki'', ''ku'', ''ke'', ''ko''에 해당하며, 올바른 가나를 얻기 위해 해당 버튼을 반복해서 누른다. 각 키는 50음도 (5행 × 10열 가나 격자)의 열에 해당하며, 누르는 횟수가 행을 결정한다.[4] 탁음 및 반탁음 기호, 구두점 및 기타 기호는 동일한 방식으로 다른 버튼을 통해 추가할 수 있다. 가나에서 한자로의 변환은 화살표 및 기타 키를 통해 수행된다.

플릭 입력은 스마트폰에서 사용되는 일본어 입력 방식이다. 키 배치는 케이타이 입력과 동일하지만, 키를 반복해서 누르는 대신, 사용자는 원하는 문자를 생성하기 위해 키에서 특정 방향으로 스와이프할 수 있다.[4] 구글 일본어 입력, POBox 및 S-Shoin과 같은 일본 스마트폰 IME는 모두 플릭 입력을 지원한다.
레이아웃 | 데스크톱 | 휴대폰 | 스마트폰 | 순환 입력 | 플릭 입력 | 로마자 입력 |
---|---|---|---|---|---|---|
12 키 | 아니요 | 예 | 예 | 예 | 예 | 아니요 |
QWERTY | 예 | 아니요 | 예 | 아니요 | 아니요 | 예 |
Godan | 아니요 | 아니요 | 예 | 아니요 | 예 | 예 |
2. 2. 한자 직접 입력 (漢字直接入力)
한자에 특정 키 입력을 할당하여, 가나를 거치지 않고 직접 한자를 입력하는 방법이다. 한자 텔렉스 등에서 사용된 다단 시프트(多段シフト|다단 시프트일본어) 방식도 여기에 해당한다.[6]2. 3. 전체 문자 배열 (全文字配列)
사용하는 문자 수만큼 키를 갖추고 직접 입력하는 시스템이다. 초기 워드프로세서, 일본어 전자 타자기에서 사용된 태블릿 방식 등이 있다.[6]2. 4. 기타 입력 방식
- 한화사전(漢和辞典일본어)에서 한자를 찾는 방식을 바탕으로 한자를 검색하는 방식이다. 부수(부수 변환), 총획수 등으로 검색한다.
- 필기 입력: 포인팅 장치를 통한 필기를 문자로 인식하여 가장 가까운 문자를 표시한다.
- 음성 인식: 마이크에 입력된 음성을 단어로 인식하여 한자와 가나가 섞인 문장으로 변환한다.
3. 가나 한자 변환의 주요 기능
PC에서 영문 입력은 일반 키보드에서 타자기와 같이 입력할 수 있지만, 일본어와 같이 사용 문자 수가 수천을 넘는 언어의 문장을 입력할 때는 모든 문자에 하나의 키를 할당하는 키보드는 비현실적이기 때문에, 여러 키 조작으로 한 글자를 입력하는 등의 방법이 필요하다.
일본어 입력 방법으로 현재 주류는 읽는 방식인 가나를 어떤 형태로든(가나 입력 또는 로마자 입력 등) 입력해 놓고, 한자·가나·영문자 등의 변환 후보에서 선택하여 입력하는 '가나 한자 변환'이다. 이는 1978년 9월 26일에 도시바의 JW-10 발매를 통해 실현되었다.[6] 일본어 입력기는 MS-DOS 시절에는 주로 프론트 엔드 프로세서로서 구현되었기 때문에, 일본어 입력 프론트 엔드 프로세서(일본어 입력 FEP, 약칭 FEP) 등으로 불리는 경우가 많았다. 윈도우 보급 이후에는 입력기(IME)로 불리는 경우가 많아졌다.
3. 1. 입력
이 때, 크게 로마자로 가나를 입력하는 방식과 직접 가나를 입력하는 방식의 2가지 유형이 있다. 로마자를 가나로 바꿀 경우, 로마자를 가나로 변환하는 것도 일본어 입력 시스템의 기능 중 하나이다.[6]일본어 입력은 로마자 및 히라가나 입력 모드 간의 전환과 히라가나와 한자 간의 변환을 필요로 하기 때문에, 일반적으로 키보드에는 몇 개의 특수 키가 있다. 이는 컴퓨터마다 다르며, 일부 OS 공급업체는 사용되는 키보드 유형에 관계없이 일관된 사용자 인터페이스를 제공하기 위해 노력해 왔다. 일본어 키보드가 아닌 경우, 옵션 또는 컨트롤 키 시퀀스를 사용하면 모든 작업을 수행할 수 있다.
대부분의 일본어 키보드에서 하나의 키는 로마자와 일본어 문자 간을 전환한다. 사용자가 빠르게 입력할 때 모호성을 방지하기 위해 각 모드(로마자 및 일본어)마다 고유한 키가 있을 수도 있다.
가장 최근에 입력된 히라가나 문자를 한자로 변환하도록 컴퓨터에 지시하는 키가 있을 수 있지만, 일본어 쓰기는 공백을 사용하지 않으므로 일반적으로 스페이스 키가 동일한 역할을 한다.
일부 키보드에는 다양한 형태의 문자를 전환하는 ''모드'' 키가 있다. 히라가나, 가타카나, 반각 가타카나, 반각 로마자, 전각 로마자가 옵션으로 제공된다. 일반적인 일본어 문자는 사각형인 반면, 로마자 문자는 일반적으로 가변적인 너비를 갖는다. 모든 일본어 문자는 사각형 상자의 공간을 차지하므로 텍스트의 격자 레이아웃을 유지하기 위해 동일한 사각형 형태로 로마자 문자를 입력하는 것이 바람직한 경우가 있다. 사각형 문자 셀에 맞춰진 이러한 로마자 문자는 전각이라고 하며, 일반적인 로마자 문자는 반각이라고 한다.
마지막으로, 키보드에는 마지막으로 입력된 가나가 한자로 변환되지 않도록 OS에 지시하는 특수 키가 있을 수 있다. 경우에 따라 이는 단순히 ''Return''/''Enter'' 키일 수도 있다.
가나를 직접 입력하는 대신, 다수의 일본어 입력 방식 편집기는 일본어 텍스트를 ''로마자''를 사용하여 입력할 수 있도록 지원하며, 이 로마자는 다시 가나 또는 한자로 변환될 수 있다. 이 방법은 가나 표기가 있는 일본어 자판을 사용할 필요가 없다.
일본어 입력 방식은 다음과 같다.
- 문자 배열 전체 - 사용하는 문자 수만큼 키를 갖추고 직접 입력하는 시스템.
- 문자판을 펜으로 터치하면 문자 코드가 컴퓨터에 입력되는 단자 입력 장치. 일본어 타자기에서 유래한 입력 장치, 전산 사진 식자에서 볼 수 있는 방식이 있다.[6]
- 한자 직접 입력 - 한자에 특정 키 스트로크를 할당하여 가나를 거치지 않고 직접 한자를 얻을 수 있는 것.
- 다단 시프트 - 하나의 키에 여러 문자가 할당되어 있으며, 해당 시프트 키를 누른 상태에서 입력하여 목적 문자를 입력하는 방식. 한자 텔렉스 등에서 이용되었다.
- 한화 사전에서의 한자 찾기 방식을 기반으로 한자를 검색하는 방식. 부수 (부수 변환), 총 획수 등.
- 가나 한자 변환 - 읽기로 가나를 어떤 형태로든 입력해 놓고, 한자·가나·영자 등의 변환 후보 중에서 선택하여 한자 문자를 얻는 방식.
- 가나 입력 - JIS 배열, 엄지 시프트, 토글 입력, 플릭 입력 등의 배열의 키보드를 사용하여 직접 가나 문자를 얻는 방식.
- 로마자 입력 - QWERTY 배열의 키보드로 로마자를 입력하여 가나 문자로 변환.
- 2 터치 입력 - 삐삐에서의 입력 방식. 숫자 입력.
- 필기 입력 - 포인팅 디바이스나 손가락의 궤적을 문자로 인식하여 가장 가까운 문자를 입력.
- 음성 인식 - 마이크로 입력된 소리를 단어로 인식하여 한자 가나 혼합 문장을 반환.
3. 2. 변환
히라가나로 어느 정도 문장이 입력된 읽기를 가나로 입력하고(미변환 문자열), 변환 키를 누르면 한자 가나 혼합문으로 변환된다.IME는 문절의 구분을 판단하여 문절마다 한자 변환을 수행한다. 문절을 자동 판단하는 것을 형태소 분석이라고 하며, 많은 IME는 이 형태소 분석을 이용하여 변환을 수행한다. 문절별로 나뉜 단어는 사전을 이용하여 변환된다. 사전에는 단순한 명사나 동사 외에도 관용구 등 복수 문절에 걸친 용례 데이터베이스를 가지고 있으며, 전후 문절을 참조하여 적절한 변환이 이루어진다. 일부 IME에는 미변환 문자열이 쌓이면 자동으로 순차 변환하거나, 구두점 입력을 통해 변환을 수행하는 기능이 있다.
변환된 결과가 적절한 경우에는 확정 키를 눌러 변환 후 문자열이 애플리케이션에 전달된다. 의도하지 않은 변환 결과가 나온 경우, 사용자가 문절마다 적절한 변환 후보를 선택하거나 문절의 구분을 수정할 수 있다. 그러한 작업을 하지 않고 "일괄 변환"할 수 있는 것이 이상적이며, 변환 정확도의 우열은 IME의 성능에서 결정적인 요소 중 하나가 된다.
3. 3. 사전
각 IME는 가나 한자 변환용 어휘 데이터베이스(시스템 사전)를 내장하고 있다. 더불어 기호/특수문자·영단어·이모티콘·방언·인터넷 슬랭 등 다양한 어휘에 대응하거나 우편번호와 지명의 상호변환·번역·계산 등 변환 시스템을 이용한 편리한 기능을 갖는 경우가 있다.[2]사용자가 원하는 단어·용례를 등록할 수 있는 사용자 사전 기능이 있다. 학습 기능이 뛰어나거나 IME가 준비하는 사전 자체가 충실하면 등록 작업이 적게 된다. 또 특정 불필요한 변환 후보가 빈번히 표시되어 곤란한 경우, 그 단어가 변환 결과에 나타나지 않게 등록하는 "억제 단어(抑制単語)"라고 하는 구조도 있다.[2]
IME용 변환 어휘 데이터베이스를 일반적으로 변환 사전이라고 한다.
3. 4. 학습
사용자의 변환 및 확정 결과를 기억하여 변환 정확도를 높이는 방식이다. 학습이 축적됨에 따라, IME는 자동으로 각 사용자에게 최적화된다. 잘못된 변환 결과도 저장되기 때문에 오류가 다음에 재현되는 것이 단점이다. ATOK 등에서는 변환 이력을 직접 편집해 불필요한 학습만을 제거할 수 있다.[1]학습이 많이 축적되면 반대로 변환 정확도가 떨어졌다고 느끼거나 학습 기능에 이상을 초래하는 경우가 있다.[1]
3. 5. 입력 지원 기능
입력 예측(入力予測)은 가나 입력량을 줄여준다. 이는 키보드에 비해 입력이 느린 휴대전화에서 발전했으며, 2000년대 후반에는 ATOK나 구글 일본어 입력 등 PC용 IME에도 도입되었다. 구글 일본어 입력의 경우 구글 검색 시스템을 활용하는 등 휴대전화와는 다른 구조를 가진 경우도 있다.[2]일부 IME는 사용자가 혼동하기 쉬운 동음이의어를 올바르게 선택할 수 있도록 동음이의어의 의미와 용법을 해설하는 기능을 제공한다.[2]
4. 기타
일본의 인터넷 속어 중에는 IME의 오변환에서 생겨나 정착된 것이 많이 있다.[1] 역사적 가나 표기법(구 가나 표기법)에 의한 입출력을 수행하는 변환 사전도 존재한다.[2]
참조
[1]
서적
IBM History of Far Eastern Languages in Computing: National Language Support Since 1961; [Looking to East Asia]
https://books.google[...]
Kurt Hensch
2004
[2]
웹사이트
106キーボードから101キーボードに変更する
https://www.asahi-ne[...]
2024-10-29
[3]
웹사이트
Setting Up Japanese Language and Keyboards {{!}} Teradici Documentation and Downloads
https://anyware.hp.c[...]
2024-10-29
[4]
웹사이트
Which Japanese input method on iPhone is more popular, Kana or Romaji?
https://www.quora.co[...]
2015-01-31
[5]
웹사이트
Godan キーボードとはなんですか?
https://support.goog[...]
[6]
간행물
特集:漢字情報の処理_漢字入力装置の操作性
日本オペレーションズ・リサーチ学会
1978
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com