맨위로가기

Apertium

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

Apertium은 스페인 정부의 지원을 받아 개발된 기계 번역 엔진이다. 알리칸테 대학교의 Transducens 연구 그룹이 주도하여 개발되었으며, 초기에는 밀접한 관련이 있는 언어 간의 번역을 위해 설계되었지만, 현재는 더 다양한 언어 쌍을 처리하도록 확장되었다. Apertium은 디포매터, 형태소 분석기, 형태소 중의성 제거기, 재토큰화, 어휘 전송, 어휘 선택, 구조적 전송, 형태소 생성기, 포스트 생성기, 재포매터 단계를 거쳐 텍스트를 번역한다. 현재 108개 언어 쌍과 50개 이상의 언어 및 언어 변종을 지원하며, 온라인 번역 웹사이트 및 오프라인 응용 프로그램에 활용된다.

더 읽어볼만한 페이지

  • 기계 번역 소프트웨어 - 마이크로소프트 번역기
    마이크로소프트 번역기는 클라우드 기반 기계 번역 서비스로, 신경망 기계 번역을 기반으로 100개 이상의 언어 간 실시간 번역, 텍스트/음성 번역, 사용자 지정 번역 시스템 구축, 실시간 대화 번역 기능 및 다양한 마이크로소프트 제품과의 통합을 제공하며, 사용자 피드백 기반 협업 번역과 Microsoft Translator Hub를 통해 번역 품질 개선 및 소멸 위기 언어 보존에 기여한다.
  • 기계 번역 소프트웨어 - 구글 번역
    구글 번역은 2006년 구글이 출시한 무료 번역 서비스로, 다양한 콘텐츠를 100개 이상 언어로 번역하며, 신경망 기계 번역 기술과 AI 모델을 통해 발전해 왔지만, 일부 제한점과 논란도 존재한다.
  • 자연어 처리 소프트웨어 - 구글 어시스턴트
    구글 어시스턴트는 2016년 구글에서 개발한 인공지능 음성 비서 서비스로, 양방향 대화 지원, 다양한 기기 및 플랫폼 확장성, 인터넷 검색, 일정 관리, 홈 오토메이션 제어 등의 기능을 제공하지만 개인정보 보호 문제에 대한 비판도 존재한다.
  • 자연어 처리 소프트웨어 - 마이크로소프트 번역기
    마이크로소프트 번역기는 클라우드 기반 기계 번역 서비스로, 신경망 기계 번역을 기반으로 100개 이상의 언어 간 실시간 번역, 텍스트/음성 번역, 사용자 지정 번역 시스템 구축, 실시간 대화 번역 기능 및 다양한 마이크로소프트 제품과의 통합을 제공하며, 사용자 피드백 기반 협업 번역과 Microsoft Translator Hub를 통해 번역 품질 개선 및 소멸 위기 언어 보존에 기여한다.
  • C++로 작성된 자유 소프트웨어 - 클램윈
    클램윈은 ClamAV 엔진 기반의 오픈 소스 백신 소프트웨어로, 트로이 목마, 바이러스, 멀웨어 등 다양한 악성 위협 분석 자료를 제공하며 예약 검사, 수동 검사, 컨텍스트 메뉴 통합 등의 기능을 지원하지만 실시간 감시 기능은 제공하지 않는다.
  • C++로 작성된 자유 소프트웨어 - VirtualDub
    VirtualDub은 윈도우 운영 체제에서 실행되는 무료 오픈 소스 비디오 캡처 및 처리 유틸리티이며, AVI 파일을 주로 처리하고 플러그인을 통해 다른 파일 형식도 지원하며, 동영상 캡처, 편집, 비디오 처리 및 필터 기능을 제공한다.
Apertium - [IT 관련 정보]에 관한 문서
개요
유형규칙 기반 기계 번역 플랫폼
라이선스GNU GPL
웹사이트Apertium 공식 웹사이트
저장소Apertium GitHub 저장소
Apertium 로고
Apertium 로고
개발
프로그래밍 언어C++
운영 체제POSIX 호환 및 Windows NT (제한적인 지원)
최신 릴리스
버전3.4.2
날짜2016년 5월 15일
언어
지원 언어 수35개 이상 (아래 언어 쌍 참조)
언어 관련 참고지원 언어 쌍 목록은 아래 참조
사용자 인터페이스
Apertium-tolk 스크린샷
Apertium-tolk, 사용자가 입력하는 대로 번역하는 간단한 데스크톱 사용자 인터페이스

2. 역사

Apertium은 스페인 정부의 자금 지원을 받아 알리칸테 대학교의 Transducens 연구 그룹에서 개발한 OpenTrad 프로젝트의 기계 번역 엔진 중 하나로 시작되었다.[4] 초기에는 밀접하게 관련된 언어 간의 번역을 위해 설계되었지만, 최근에는 더 다양한 언어 쌍을 처리하도록 확장되었다. 새로운 기계 번역 시스템을 만들려면 잘 정의된 XML 형식으로 언어 데이터(사전, 규칙)를 개발하기만 하면 된다.

비고 대학교, 카탈루냐 폴리테크닉 대학교, 폼페우 파브라 대학교 등 여러 대학과 협력하여 언어 데이터가 개발되었다.[4] Prompsit Language Engineering, Imaxin Software, Eleka Ingeniaritza Linguistikoa 등 여러 회사도 Apertium 개발에 참여하고 있다.

이 프로젝트는 2009년부터 2014년까지 구글 서머 오브 코드[4][5][6][7][8][9] 2010년부터 2017년까지 구글 코드인에 참여했다.[10][11][12][13][14][15][16][17]

3. 번역 방법론

Apertium은 소스 언어 텍스트를 대상 언어 텍스트로 번역하기 위해 다음과 같은 단계를 거친다.

1. 디포매터: 번역되어서는 안 되는 형식 마크업(HTML, RTF 등)을 제거한다.

2. 형태소 분석기: 텍스트를 분할하고 언어 사전을 검색하여 사전 형식과 태그를 반환한다. 교착어를 포함하는 쌍(여러 튀르크어족 포함)에서는 Helsinki Finite State Transducer(HFST)가 사용되고, 그렇지 않으면 Apertium 고유의 ''lttoolbox''라는 유한 상태 변환기 시스템이 사용된다.[18]

3. 형태소 중의성 제거기: (''형태소 분석기''와 ''형태소 중의성 제거기''는 함께 ''품사 태거''를 형성) 여러 일치 항목이 있을 때 하나의 일치 항목을 선택하여 모호한 세그먼트를 해결한다. Apertium은 대부분의 언어 쌍에 대해 제약 문법 규칙(vislcg3 파서[19] 사용)을 사용한다.

4. 재토큰화: 유한 상태 변환기를 사용하여 어휘 단위 시퀀스를 일치시키고 태그를 재정렬하거나 번역한다. (종종 관용적 표현을 대상 언어 문법에 더 가까운 것으로 번역하는 데 사용됨).

5. 어휘 전송: 중의성이 제거된 소스 언어 기본 단어를 검색하여 해당 대상 언어 동등물을 찾는다(즉, 소스 언어를 대상 언어에 매핑). ''어휘 전송''을 위해 Apertium은 ''bidix''라는 XML 기반 사전 형식을 사용한다.[20]

6. 어휘 선택: 소스 텍스트 단어가 대체 의미를 가질 때 대체 번역 중에서 선택한다. Apertium은 ''어휘 선택''을 수행하기 위해 특정 XML 기반 기술인 ''apertium-lex-tools''[21]를 사용한다.

7. 구조적 전송: (복잡한 구조적 전송 규칙을 작성할 수 있는 XML 형식) 단일 단계 청킹 전송, 3단계 청킹 전송 또는 CFG 기반 전송 모듈로 구성될 수 있다. 청킹 모듈은 이러한 표시에 대한 마커가 포함된 청크 시퀀스를 생성하여 소스 언어와 대상 언어 간의 문법적 차이(예: 성별 또는 수 일치)를 표시한다. 그런 다음 대상 언어에서 문법적인 번역을 생성하기 위해 청크를 재정렬하거나 수정한다. 더 새로운 CFG 기반 모듈은 입력 시퀀스를 가능한 파스 트리에 일치시키고 가장 높은 순위의 트리를 선택하고 트리에서 변환 규칙을 적용한다.

8. 형태소 생성기: 태그를 사용하여 올바른 대상 언어 표면 형태를 제공한다. 형태소 생성기는 형태소 분석기와 마찬가지로 형태소 변환기이다.[22] 형태소 변환기는 형태를 분석하고 생성한다.

9. 포스트 생성기: 단어 접촉으로 인한 필요한 철자법 변경(예: 생략)을 수행한다.

10. 재포매터: 첫 번째 단계에서 디포매터가 제거한 형식 마크업(HTML, RTF 등)을 바꾼다.

4. 지원 언어

현재, Apertium은 108개 언어 쌍과 50개 이상의 언어 및 언어 변종을 지원한다. 지원되는 주요 언어는 다음과 같다.



자세한 지원 언어 쌍 목록은 방대하여 생략한다.

4. 1. 최종 사용자 서비스 및 소프트웨어

Apertium은 여러 최종 사용자 서비스를 제공한다.

Apertium은 또한, 다음 오프라인 응용 프로그램도 제공한다.

참조

[1] 간행물 Rule-based Breton to French machine translation http://xixona.dlsi.u[...] 2010
[2] 논문 Recent advances in Apertium, a free/open-source rule-based machine translation platform for low-resource languages 2021-12-01
[3] 웹사이트 Apertium https://wiki.apertiu[...]
[4] 웹사이트 Accepted organizations for Google Summer of Code 2009 https://www.google-m[...]
[5] 웹사이트 Accepted organizations for Google Summer of Code 2010 https://www.google-m[...]
[6] 웹사이트 Accepted organizations for Google Summer of Code 2011 https://www.google-m[...]
[7] 웹사이트 Accepted organizations for Google Summer of Code 2012 https://www.google-m[...]
[8] 웹사이트 Accepted organizations for Google Summer of Code 2013 https://www.google-m[...]
[9] 웹사이트 Accepted organizations for Google Summer of Code 2014 https://www.google-m[...]
[10] 웹사이트 Accepted organizations for Google Code-in 2010 https://www.google-m[...]
[11] 웹사이트 Accepted organizations for Google Code-in 2011 https://www.google-m[...]
[12] 웹사이트 Accepted organizations for Google Code In 2012 https://www.google-m[...]
[13] 웹사이트 Accepted organizations for Google Code-in 2013 https://www.google-m[...]
[14] 웹사이트 Accepted organizations for Google Code-in 2014 https://www.google-m[...]
[15] 웹사이트 Accepted organizations for Google Code-in 2015 https://codein.withg[...]
[16] 웹사이트 Accepted organizations for Google Code-in 2016 https://codein.withg[...]
[17] 웹사이트 Accepted organizations for Google Code-in 2017 https://codein.withg[...]
[18] 웹사이트 Lttoolbox - Apertium http://wiki.apertium[...] 2016-01-19
[19] 웹사이트 VISL http://beta.visl.sdu[...] 2016-01-19
[20] 웹사이트 Bilingual dictionary - Apertium http://wiki.apertium[...] 2016-01-19
[21] 웹사이트 Constraint-based lexical selection module - Apertium http://wiki.apertium[...] 2016-01-19
[22] 웹사이트 Morphological dictionary - Apertium http://wiki.apertium[...] 2016-01-19
[23] 웹사이트 Google Summer of Code page http://socghop.appsp[...]
[24] 웹사이트 https://sourceforge.[...]



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com