아랍 문자
1. 개요
아랍 문자는 아람 문자를 기원으로 하며, 7세기경 현재의 형태를 갖추었다. 이슬람교의 확산과 함께 꾸란 및 종교 문헌 표기에 사용되었으며, 페르시아어, 우르두어 등 다양한 언어의 표기 수단으로 활용되었다. 아랍 문자는 단어 내 위치에 따라 모양이 변하는 특징을 가지며, 기본 문자 28자와 변형 문자, 발음 기호 등으로 구성된다. 또한, 아랍어 외의 언어 표기를 위해 추가 문자가 사용되기도 하며, 아브자드 순서를 따르는 전통적인 문자 순서를 갖는다. 현재는 서아라비아 숫자와 동아라비아 숫자를 사용하며, 컴퓨터 자판 및 다양한 문자 코드로 지원된다.
-
아랍계 문자 -
자위 문자
자위 문자는 아랍 문자를 기반으로 말레이어를 표기하기 위해 14세기경 만들어져 말레이 세계에서 널리 사용되었으며, 현재는 브루나이 공식 문자이자 말레이시아, 인도네시아 등지에서 종교, 문화적으로 사용되는 문자 체계이다. -
아랍계 문자 -
ز
ز는 아랍 문자의 하나이며, 유니코드 1586 (0x632)에 해당하고 '자이'라고 불리며, 파슈토어에서 사용되는 유사한 형태의 문자 {{unicode|ẓ}} (ځ)도 존재하며, 아랍 문자 ر (r)과도 형태적으로 유사하다. -
표시 이름과 문서 제목이 같은 위키공용분류 -
라우토카
라우토카는 피지 비치레부섬 서부에 위치한 피지에서 두 번째로 큰 도시이자 서부 지방의 행정 중심지로, 사탕수수 산업이 발달하여 "설탕 도시"로 알려져 있으며, 인도에서 온 계약 노동자들의 거주와 미 해군 기지 건설의 역사를 가지고 있고, 피지 산업 생산의 상당 부분을 담당하는 주요 기관들이 위치해 있다. -
표시 이름과 문서 제목이 같은 위키공용분류 -
코코넛
코코넛은 코코넛 야자나무의 열매로 식용 및 유지로 사용되며, 조리되지 않은 과육은 100g당 354kcal의 열량을 내는 다양한 영양 성분으로 구성되어 있고, 코코넛 파우더의 식이섬유는 대부분 불용성 식이섬유인 셀룰로오스이며, 태국 일부 지역에서는 코코넛 수확에 훈련된 원숭이를 이용하는 동물 학대 문제가 있다. -
한국어 위키백과의 링크가 위키데이터와 같은 위키공용분류 -
라우토카
라우토카는 피지 비치레부섬 서부에 위치한 피지에서 두 번째로 큰 도시이자 서부 지방의 행정 중심지로, 사탕수수 산업이 발달하여 "설탕 도시"로 알려져 있으며, 인도에서 온 계약 노동자들의 거주와 미 해군 기지 건설의 역사를 가지고 있고, 피지 산업 생산의 상당 부분을 담당하는 주요 기관들이 위치해 있다. -
한국어 위키백과의 링크가 위키데이터와 같은 위키공용분류 -
코코넛
코코넛은 코코넛 야자나무의 열매로 식용 및 유지로 사용되며, 조리되지 않은 과육은 100g당 354kcal의 열량을 내는 다양한 영양 성분으로 구성되어 있고, 코코넛 파우더의 식이섬유는 대부분 불용성 식이섬유인 셀룰로오스이며, 태국 일부 지역에서는 코코넛 수확에 훈련된 원숭이를 이용하는 동물 학대 문제가 있다.
2. 역사
아랍 문자의 기원은 아람 문자이다. 기원전 3세기에서부터 기원후 3세기경까지 세력을 유지한 페트라를 중심으로 하는 아랍계 나바테아인이 사용했던 아람 문자의 한 계통, 나바테아 문자에서 직접 발전된 문자이다. 당시의 나바테아 문자는, 다른 지역의 아람 문자와 마찬가지로, 문자와 문자 사이를 연결해서, 이어 쓰는 특징을 갖고 있었다. 나바테아인 활동 범위는 시리아 북부부터 예멘 방면에까지 넓은 범위에 미쳤으며, 4세기 경부터 히자즈(홍해 동쪽 해안)지방을 중심으로, 여타의 아랍인도 사용하기 시작했다. 당초 나바타이 인과 그 외의 아랍인과의 필기에 의한 의사소통은 이 문자를 이용한 아람어였으나, 점차로 자체 언어인 아랍어를 표기하는데도 쓰이게 되었다.
아랍어는 원래의 아람어와 비교하여 자음 수가 더 많고, 무엇보다 최초의 아랍 문자 중 몇개는 원래 다른 문자와 같은 모양으로 표기되는 치명적인 결점을 갖고 있었다. 이 문제를 회피하기 위해 문자 구별을 위해 점이 추가되거나, 뒤의 문자와 연이어 쓰지 않는 문자가 정해지는 등, 이슬람교가 발생한 7세기경에 이르러서는 거의 현재의 형태를 갖추게 되었다. 단, 점의 사용은 당시에는 비공식적인 표기로 취급되어, 최초의 꾸란에는 점을 찍어 문자를 구별하는 방식이 배제되어 있었다. 이후, 꾸란을 정확하게 읽어야 할 필요성에서, 꾸란에도 점 표기가 채용되게 되고, 여기에 모음 표기를 위한 기호도 발명되었다. 현재에는 문자에 사용되는 점은 정서법의 일부로 고착되었으나, 모음 기호는, 일상적인 문서에서는 원칙적으로 사용되지 않는다.
이슬람교가 포교된 후의 아랍 문자는 '신(알라)이 내린 말씀'의 기록인 꾸란 및 종교 문헌의 표기에 사용되며, 이슬람교로 개종한 비아랍 민족에게도 신의 가르침에 가까운 문자로 인식되어, 페르시아어를 비롯해 여러 언어에서도 표기 수단으로 활용되게 되었다.
필립 K 히티 교수(레바논 출신)은 "아랍 문자는, 세계에서 라틴 문자 다음으로 널리 쓰이는 문자이다" 라고 그의 저서 『아랍의 역사(상)』(원저 1937년 발생)에서 말하며, 아랍 문자를 사용하는 언어로 페르시아어, 아프간어, 우르두어, 튀르키예어, 베르베르어, 말레이어를 언급했다.
2017년 보도에 따르면, 바이킹의 무덤에서 발견된 시신 장식에 아랍 문자가 짜여 있었다는 것을 스웨덴 웁살라 대학교의 안니카 라르손이 발견했다. 이 옷들은 100년 이상 전에 발견되었지만, 바이킹 시대의 전형적인 시신 장식으로 치부되어 그대로 보관되어 있었다. 라르손에 따르면, 시신 장식에 짜여진 세밀한 기하학 무늬는 북유럽에서는 본 적이 없는 것이었다고 한다. 이것들은 바이킹이 독자적으로 만들어낸 무늬가 아니라, 쿠피체라는 오래된 서체의 아랍 문자였다. 연구자는 문자를 확대하여, 뒷면을 포함하여 모든 각도에서 살펴보았다. 빈번하게 발견된 것은 이슬람의 4대 칼리프의 이름 "알리"와 아랍어로 신을 나타내는 "알라"라는 단어였다. 다만, 이 문자를 "알라"로 읽는 것에 대해서는 텍사스 대학교의 스테파니 몰더 등에 의해 의문이 제기되고 있다.
3. 아랍 문자가 사용되는 언어
아랍어 외에도 페르시아어, 다리어, 쿠르드어, 파슈토어, 발루치어, 아제르바이잔어(주로 이란 지역), 신드어, 우르두어, 카슈미르어, 펀자브어(주로 파키스탄 지역), 위구르어, 카자흐어(주로 중국 지역), 키르기스어(주로 중국 지역), 베르베르어, 말레이어(주로 브루네이, 말레이시아 및 인도네시아의 무슬림 대상 미디어 및 종교 관련), 모로어(필리핀 모로족), 빠따니 말레이어, 발티어 등 다양한 언어에서 아랍 문자를 사용한다.
튀르키예어, 말레이어, 인도네시아어, 스와힐리어 등은 과거 아랍 문자를 사용했으나 로마자로 표기 수단을 변경했다. 이러한 문자 개혁은 탈이슬람화, 서구화, 문해율 향상, 모음 표기 간소화 등의 이유로 진행되었다. 그러나 터키를 제외한 대부분의 국가에서는 민간 및 종교 단체를 중심으로 아랍 문자가 계속 사용되고 있으며, 특히 말레이어의 경우 학교에서 제2정서법으로 교육하고 있다. 터키는 아랍 문자 사용 출판물을 금지하는 등 아랍 문자 사용 자체를 배격하는 방식으로 로마자화를 진행했으며, 현재도 터키어 로마자 29자 외의 문자를 사용한 출판물을 금지하고 있다. 이는 아랍 문자를 이용한 터키어 표기뿐만 아니라 쿠르드어 탄압의 도구로도 이용되고 있다.
체첸어, 타타르어, 카자흐어, 키르기스어, 투르크멘어, 위구르어, 우즈벡어, 타지크어, 둥간어 등 구 소련 내 무슬림 민족들의 언어는 러시아 혁명 이후 키릴 문자로 바뀌었으나, 일부 언어는 다시 로마자나 아랍 문자로 전환되었다. 현재에도 공식 문서는 키릴 문자 또는 로마자를 쓰지만, 민간 종교 관련 단체에서는 아랍 문자를 사용하기도 한다.
중국의 위구르어 등 무슬림 소수민족의 언어는 소련의 영향으로 키릴 문자화가 보급되었으나, 중소국경분쟁 이후 한어 병음 풍의 로마자 표기가 진행되기도 했다. 1980년대 민족정책 전환에 따라 아랍 문자가 부활되었으며, 현재 위구르어에서 사용되는 아랍 문자는 8개 모음 전체를 표기하는 식으로 개량되었다.
중국어(한어)를 사용하는 무슬림(회족)은 아랍 문자로 구어체 한어를 표기하기도 했는데, 이를 샤오얼징(小児経,小児錦)이라 한다. 샤오얼징은 경전 주석, 편지, 일기 등 다양한 용도로 사용되었으며, 현재도 닝샤, 간쑤 등 회족 집중 거주 지역에서 부분적으로 사용된다. 둥간족이 사용하는 둥간어도 예전에는 아랍 문자로 표기되었다. 둥샹족 및 사라족 또한 아랍 문자를 이용하여 자체 언어를 표기하고 있다.
스페인어에서도 이슬람 교도를 중심으로 아랍 문자로 표기되는 경우가 있었다.
4. 아랍 문자의 형태
아랍 문자는, 인쇄체와 필기체 어느 쪽이든 구부러진 문자들이 단어 안에서 연결되어 쓰이며, 그 문자가 어느 위치에 왔느냐에 따라 모양새가 변형되는 형태를 띠고 있다. 단어의 맨 처음에 위치했을 때의 어두형, 문자와 문자 사이에 위치할 때의 어중형, 맨 마지막 문자일 때의 어미형, 단독형 등 4가지 형태를 가지고 있다. 단어와 단어 사이는 띄어서 쓰며, 단어 안의 문자는, 짧은 세로 줄로 연결된다. 단, 다음 6개의 문자는 (و ز ر ذ د ا아랍어) 앞의 문자와 연결되나, 뒤의 문자와는 연결되지 않는다. 예를 들어, أرارات아랍어 (아라라트)의 문자는 모두 독립형인데, أ아랍어, ر아랍어 문자가 뒤의 문자와 연결되지 않기 때문이다. 한편, 문자와 문자가 결합하는 합자 현상도 존재하는데, 람 알리프(لا)가 그 예이다.
아랍 문자는 항상 필기체이며, 글자는 단어 내에서의 위치에 따라 모양이 달라진다. 글자는 단어의 처음, 중간, 끝 또는 독립된 위치(IMFI)에 따라 최대 4가지 뚜렷한 형태를 나타낼 수 있다. 일부 글자는 상당한 변형을 보이지만, 다른 글자는 네 위치에서 거의 동일하게 유지된다. 일반적으로 같은 단어의 글자는 짧은 가로선으로 양쪽에 연결되지만, 여섯 개의 글자(و ,ز ,ر ,ذ ,د ,ا아랍어)는 앞 글자에만 연결될 수 있다. 또한, 일부 글자 조합은 합자 (특수 모양)로 작성되며, 특히 [[lām-alif]]아랍어 لا아랍어가 유일한 필수 합자이다(합자가 아닌 조합 لا아랍어는 읽기 어렵다고 간주된다).
7. 하'
타자기 합자는 아랍어에서 흔히 사용된다. 필수 합자는 lām/ALA아랍어 ل + alif/ALA아랍어 ا에 대한 것으로, 두 가지 형태가 있다. 다른 모든 합자는 선택 사항이며, 여러 종류가 있다.
| 문맥적 형태 | 이름 | 음역 | 값 | |||
|---|---|---|---|---|---|---|
| 종결 | 중간 | 시작 | 고립 | |||
| 람 + 알리프 | laa | /laː/ | ||||
최대 7개의 서로 다른 구성 요소를 결합하는 더 복잡한 합자는 일반적으로 단어 [[알라]]/ALA아랍어를 나타내는 데 사용된다.
유니코드의 기본 범위 유니코드의 아랍 문자 (U+06xx) 내에서 유일한 합자는 lām/ALA아랍어 + alif/ALA아랍어이다. 이것은 글꼴과 워드 프로세싱에 있어서 유일하게 필수적인 것이다. 다른 범위는 이전 표준과의 호환성을 위한 것이며 선택 사항인 다른 합자를 포함한다.
* lām/ALA아랍어 + alif/ALA아랍어
*:
참고: 유니코드는 Presentation Form B FExx 범위에 이 합자에 대한 코드도 있습니다. 브라우저와 글꼴이 아랍어에 맞게 올바르게 구성되어 있으면 위에서 표시된 합자는 `U+FEFB` ARABIC LIGATURE LAM WITH ALEF ISOLATED FORM과 동일해야 한다.
::
* `U+0640` ARABIC TATWEEL + lām/ALA아랍어 + alif/ALA아랍어
*:
참고: 유니코드는 Presentation Form B U+FExx 범위에 이 합자에 대한 코드도 있습니다. 브라우저와 글꼴이 아랍어에 맞게 올바르게 구성되어 있으면 위에서 표시된 합자는 이와 동일해야 한다.
* `U+FEFC` ARABIC LIGATURE LAM WITH ALEF FINAL FORM
*:
유니코드 Presentation Form A 범위 U+FB50에서 U+FDxx까지의 또 다른 합자는 합자 알라/ALA아랍어 ("신")에 대한 특수 코드인 `U+FDF2` ARABIC LIGATURE ALLAH ISOLATED FORM이다.
::
이것은 대부분의 텍스트 프로세서의 단점을 해결하기 위한 해결 방법이며, 이들은 코란에서 단어 [[알라]]/ALA아랍어에 대한 올바른 모음 부호를 표시할 수 없다. 아랍어 문자는 코란 외의 다른 텍스트를 작성하는 데 사용되므로 lām/ALA아랍어 + lām/ALA아랍어 + hā’/ALA아랍어를 이전 합자로 렌더링하는 것은 잘못된 것으로 간주된다.
컴퓨터에 여러 글꼴(Noto Naskh Arabic, mry_KacstQurn, KacstOne, Nadeem, DejaVu Sans, Harmattan, Scheherazade, Lateef, Iranian Sans, Baghdad, DecoType Naskh) 중 하나가 설치되어 있으면 (Iranian Sans는 Wikimedia 웹 글꼴에서 지원됨) 단어가 부호 없이 나타난다.
* lām/ALA아랍어 + lām/ALA아랍어 + hā’/ALA아랍어 = LILLĀH ("알라에게만 [오직 신에게]"를 의미)
*: or
* alif/ALA아랍어 + lām/ALA아랍어 + lām/ALA아랍어 + hā’/ALA아랍어 = ALLĀH (아랍어로 "신"이라는 단어)
*: or
* alif아랍어 + lām아랍어 + lām아랍어 + `U+0651` ARABIC SHADDA + `U+0670` ARABIC LETTER SUPERSCRIPT ALEF + hā’/ALA아랍어
*: (DejaVu Sans 및 KacstOne은 추가된 위 첨자 알리프를 표시하지 않습니다)
자동으로 이중화 표시와 위 첨자 알리프를 추가하지 않고 결함이 있는 글꼴에 표시하려는 시도는 첫 번째 또는 두 번째 lām/ALA아랍어 뒤에 `U+200d` (너비가 0인 결합자)를 추가하는 것이다.
* (alif아랍어 +) lām아랍어 + lām아랍어 + `U+200d` 너비 0 결합자 + hā’/ALA아랍어
*:
==== 해 문자와 달 문자 ====
아랍 문자는 정관사 ال아랍어(알)이 앞에 붙을 때 일어나는 발음의 변화에 따라 해 문자(후루프 샴시야/حروف شمسية아랍어)와 달 문자(후루프 까마라/حروف قمرية아랍어)로 구별된다. 이러한 이름은 해 문자 중 ش으로 시작하는 해(샴시야/شمسية아랍어)와 달 문자 중 ق로 시작하는 달(까마리야/قمرية아랍어)에서 각각 유래한 것이다.
===== 해 문자 =====
해 문자는 앞에 ال아랍어이 붙으면 ل아랍어이 묵음화 하며 대신 해 문자 스스로가 2중으로 발음된다.
* 예) شمسية아랍어(샴씨야(툰)) → الشمسية아랍어(앗샴씨야(투))
해 문자에 속하는 문자로는 ت, ث, د, ذ, ر, ز, س, ش, ص, ض, ط, ظ, ل, ن 이 있다.
아랍어에서, 정관사 "ال아랍어" (al-) 의 /l/ 소리가 뒤에 오는 문자와 역행 동화하여 장자음이 되는 문자를 태양 문자 َحروف شمسية아랍어 (ḥurūf shamsiyya, 후루프 샴시야)라고 한다. 구체적으로는, /l/과 조음점이 같거나 근접한 설단음 (치음, 치경음, 후치경음)을 나타내는 문자이다. "태양"을 의미하는 شمس아랍어 (shams, 샴스)의 머리글자 ش가 포함되어 있기 때문에 이렇게 불린다.
예를 들어, شمس아랍어에 정관사가 붙은 경우, الشَّمْسُ아랍어 (ash-shams, 앗=샴스)가 되어 "알=샴스"라고 발음하지 않는다. 즉, 아랍어의 정관사 ال 바로 뒤에 태양 문자가 오는 경우에는 정관사는 "알"로 발음하는 것이 아니라, 태양 문자가 두 번 겹쳐 발음된다. 구체적으로는, ت, ث, د, ذ, ر, ز, س, ش, ص, ض, ط, ظ, ل, ن이 태양 문자이다.
===== 달 문자 =====
달 문자는 앞에 ال아랍어이 붙어도 서로 간섭되지 않고 각자가 정상적으로 발음된다.
* 예) قمرية아랍어(까마리야(툰)) → القمرية아랍어(알까마리야(투))
달 문자에 속하는 문자로는 ا, ب, ج, ح, خ, ع, غ, ف, ق, ك, م, ه, و, ي, ء 가 있다.
정관사 /l/의 음이 동화되지 않는 문자, 즉 태양 문자 이외의 문자를 월 문자(후루프 카마리야/حروف قمرية아랍어)라고 한다. "달"을 의미하는 카마르/قمر아랍어의 머리글자 ق아랍어가 포함되어 있기 때문에 이렇게 불린다.
카마르/قمر아랍어에 정관사가 붙으면, 알 카마르/القمر아랍어가 된다. 위의 알 카마르처럼 정관사 ال아랍어의 바로 뒤에 월 문자가 오는 경우에는 정관사는 "알"로 발음한다. 또한, 구체적으로는 أ (ء) , ب, ج, ح, خ, ع, غ, ف, ق, ك, م, ه, و, ي가 월 문자이다.
4.1. 해 문자와 달 문자
아랍 문자는 정관사 ال아랍어(알)이 앞에 붙을 때 일어나는 발음의 변화에 따라 해 문자(후루프 샴시야/حروف شمسية아랍어)와 달 문자(후루프 까마라/حروف قمرية아랍어)로 구별된다. 이러한 이름은 해 문자 중 ش으로 시작하는 해(샴시야/شمسية아랍어)와 달 문자 중 ق로 시작하는 달(까마리야/قمرية아랍어)에서 각각 유래한 것이다.
해 문자는 앞에 ال아랍어(알)이 붙으면 ل아랍어이 묵음화되며 대신 해 문자 스스로가 2중으로 발음된다.
* 예) شمسية아랍어(샴씨야(툰)) → الشمسية아랍어(앗샴씨야(투))
해 문자에 속하는 문자로는 ت, ث, د, ذ, ر, ز, س, ش, ص, ض, ط, ظ, ل, ن 이 있다. 아랍어에서, 정관사 "ال아랍어" (al-) 의 /l/ 소리가 뒤에 오는 문자와 역행 동화하여 장자음이 되는 문자를 태양 문자 َحروف شمسية아랍어 (ḥurūf shamsiyya, 후루프 샴시야)라고 한다. 예를 들어, شمس아랍어(샴스)에 정관사가 붙은 경우, الشَّمْسُ아랍어(ash-shams, 앗=샴스)가 되어 "알=샴스"라고 발음하지 않는다.
달 문자는 앞에 ال아랍어(알)이 붙어도 서로 간섭되지 않고 각자가 정상적으로 발음된다.
* 예) قمرية아랍어(까마리야(툰)) → القمرية아랍어(알까마리야(투))
달 문자에 속하는 문자로는 ا, ب, ج, ح, خ, ع, غ, ف, ق, ك, م, ه, و, ي, ء 가 있다. 정관사 /l/의 음이 동화되지 않는 문자를 월 문자(후루프 카마리야/حروف قمرية아랍어)라고 한다. 카마르/قمر아랍어에 정관사가 붙으면, 알 카마르/القمر아랍어가 된다.
4.1.1. 해 문자
해 문자는 앞에 ال아랍어이 붙으면 ل아랍어이 묵음화 하며 대신 해 문자 스스로가 2중으로 발음된다.
* 예) شمسية아랍어(샴씨야(툰)) → الشمسية아랍어(앗샴씨야(투))
해 문자에 속하는 문자로는 ت, ث, د, ذ, ر, ز, س, ش, ص, ض, ط, ظ, ل, ن 이 있다.
아랍어에서, 정관사 "ال아랍어" (al-) 의 /l/ 소리가 뒤에 오는 문자와 역행 동화하여 장자음이 되는 문자를 태양 문자 َحروف شمسية아랍어 (ḥurūf shamsiyya, 후루프 샴시야)라고 한다. 구체적으로는, /l/과 조음점이 같거나 근접한 설단음 (치음, 치경음, 후치경음)을 나타내는 문자이다. "태양"을 의미하는 شمس아랍어 (shams, 샴스)의 머리글자 ش가 포함되어 있기 때문에 이렇게 불린다.
예를 들어, شمس아랍어에 정관사가 붙은 경우, الشَّمْسُ아랍어 (ash-shams, 앗=샴스)가 되어 "알=샴스"라고 발음하지 않는다. 즉, 아랍어의 정관사 ال 바로 뒤에 태양 문자가 오는 경우에는 정관사는 "알"로 발음하는 것이 아니라, 태양 문자가 두 번 겹쳐 발음된다. 구체적으로는, ت, ث, د, ذ, ر, ز, س, ش, ص, ض, ط, ظ, ل, ن이 태양 문자이다.
4.1.2. 달 문자
달 문자는 앞에 ال아랍어이 붙어도 서로 간섭되지 않고 각자가 정상적으로 발음된다.
* 예) قمرية아랍어(까마리야(툰)) → القمرية아랍어(알까마리야(투))
달 문자에 속하는 문자로는 ا, ب, ج, ح, خ, ع, غ, ف, ق, ك, م, ه, و, ي, ء 가 있다.
정관사 /l/의 음이 동화되지 않는 문자, 즉 태양 문자 이외의 문자를 월 문자(후루프 카마리야/حروف قمرية아랍어)라고 한다. "달"을 의미하는 카마르/قمر아랍어의 머리글자 ق아랍어가 포함되어 있기 때문에 이렇게 불린다.
카마르/قمر아랍어에 정관사가 붙으면, 알 카마르/القمر아랍어가 된다. 위의 알 카마르처럼 정관사 ال아랍어의 바로 뒤에 월 문자가 오는 경우에는 정관사는 "알"로 발음한다. 또한, 구체적으로는 أ (ء) , ب, ج, ح, خ, ع, غ, ف, ق, ك, م, ه, و, ي가 월 문자이다.
5. 아랍 문자의 목록
아랍 문자는 기본 문자 28자와 특수 기호, 그리고 아랍어 외의 언어에서 사용되는 변형 문자로 구성된다.
== 기본 문자 ==
아랍어에서는 기본 28자의 자음 문자에 함자 기호가 사용된다.
| 문자 | 문자명 | 음가 | |||
|---|---|---|---|---|---|
| 단독형 | 어두형 | 어중형 | 어말형 | ||
| 알리프/ا아랍어 | 알리프/ﺎ아랍어 | 알리프 (Alif) | 무음 혹은 (※) | ||
| 바/ﺏ아랍어 | 바/ﺑ아랍어 | 바/ﺒ아랍어 | 바/ﺐ아랍어 | 바 (Bāʾ) | |
| 타/ﺕ아랍어 | 타/ﺗ아랍어 | 타/ﺘ아랍어 | 타/ﺖ아랍어 | 타 (Tāʾ) | |
| 사/ﺙ아랍어 | 사/ﺛ아랍어 | 사/ﺜ아랍어 | 사/ﺚ아랍어 | 사 (Thā) | |
| 짐/ﺝ아랍어 | 짐/ﺟ아랍어 | 짐/ﺠ아랍어 | 짐/ﺞ아랍어 | 짐 (Jīm) | |
| 하/ح아랍어 | 하/ﺣ아랍어 | 하/ﺤ아랍어 | 하/ﺢ아랍어 | 하 (Ḥā) | |
| 카/خ아랍어 | 카/ﺧ아랍어 | 카/ﺨ아랍어 | 카/ﺦ아랍어 | 카 (Khā) | |
| 달/د아랍어 | 달/ﺪ아랍어 | 달 (Dāl) | |||
| 달/ذ아랍어 | 달/ﺬ아랍어 | 달 (Dhāl) | |||
| 라/ر아랍어 | 라/ﺮ아랍어 | 라 (Rā) | |||
| 자이/ز아랍어 | 자이/ﺰ아랍어 | 자이 (Zāy) | |||
| 신/ﺱ아랍어 | 신/ﺳ아랍어 | 신/ﺴ아랍어 | 신/ﺲ아랍어 | 신 (Sīn) | |
| 쉰/ش아랍어 | 쉰/ﺷ아랍어 | 쉰/ﺸ아랍어 | 쉰/ﺶ아랍어 | 쉰 (Shīn) | |
| 사드/ص아랍어 | 사드/ﺻ아랍어 | 사드/ﺼ아랍어 | 사드/ﺺ아랍어 | 사드 (Ṣād) | |
| 다드/ض아랍어 | 다드/ﺿ아랍어 | 다드/ﻀ아랍어 | 다드/ﺾ아랍어 | 다드 (Ḍād) | |
| 타/ط아랍어 | 타/ﻃ아랍어 | 타/ﻄ아랍어 | 타/ﻂ아랍어 | 타 (Ṭāʾ) | |
| 다/ظ아랍어 | 다/ﻇ아랍어 | 다/ﻈ아랍어 | 다/ﻆ아랍어 | 다 (Ẓāʾ) | |
| 아인/ع아랍어 | 아인/ﻋ아랍어 | 아인/ﻌ아랍어 | 아인/ﻊ아랍어 | 아인 (ʿAyn) | |
| 가인/غ아랍어 | 가인/ﻏ아랍어 | 가인/ﻐ아랍어 | 가인/ﻎ아랍어 | 가인 (Ġayn) | |
| 파/ف아랍어 | 파/ﻓ아랍어 | 파/ﻔ아랍어 | 파/ﻒ아랍어 | 파 (Fāʾ) | |
| 까프/ق아랍어 | 까프/ﻗ아랍어 | 까프/ﻘ아랍어 | 까프/ﻖ아랍어 | 까프 (Qāf) | |
| 카프/ك아랍어 | 카프/ﻛ아랍어 | 카프/ﻜ아랍어 | 카프/ﻚ아랍어 | 카프 (Kāf) | |
| 람/ل아랍어 | 람/ﻟ아랍어 | 람/ﻠ아랍어 | 람/ﻞ아랍어 | 람 (Lām) | |
| 밈/م아랍어 | 밈/ﻣ아랍어 | 밈/ﻤ아랍어 | 밈/ﻢ아랍어 | 밈 (Mīm) | |
| 눈/ن아랍어 | 눈/ﻧ아랍어 | 눈/ﻨ아랍어 | 눈/ﻦ아랍어 | 눈 (Nūn) | |
| 하/ه아랍어 | 하/ﻫ아랍어 | 하/ﻬ아랍어 | 하/ﻪ아랍어 | 하 (Hā) | |
| 와우/و아랍어 | 와우/ﻮ아랍어 | 와우 (Wāw) | |||
| 야/ي아랍어 | 야/ﻳ아랍어 | 야/ﻴ아랍어 | 야/ﻲ아랍어 | 야 (Yā) | |
| 함자/ء아랍어 | 함자 (Hamza) | ||||
알리프(ا)는 고유의 음가를 갖지 않으며, 모음 표기나 함자와 함께 사용된다. 알리프(ا)는 다음과 같은 형태로 사용된다.
# 어두에서 /a/ /i/ /u/ 중 하나의 발음을 표시 (이때 함자 (/ʔ/) 가 붙는 경우도 있음)
# 어중, 어말에서 다른 자음 문자의 뒤에 붙어 장음 /aː/를 표시
# 어중, 어말에서 /a/의 음가 표시용 함자와 함께 쓰임
기본적인 아랍 문자는 28개의 문자를 포함한다. 아랍 문자를 차용하여 다른 언어를 표기하는 경우, 문자가 추가되거나 삭제되기도 한다. 예를 들어 ⟨پ⟩는 를 나타내는 데 자주 사용된다.
많은 문자가 서로 비슷하게 생겼지만, 중심 부분 위나 아래에 점(아랍어 구두점#ʾiʿjām (자음의 음성적 구분)/ʾiʿjām아랍어)을 찍어 구분한다. 이러한 점은 서로 다른 소리를 나타내는 문자를 구분하기 때문에 문자의 필수적인 부분이다. 예를 들어, 아랍 문자 b/ب아랍어, t/ت아랍어, th/ث아랍어는 기본 형태가 같지만, 각각 아래에 점 1개, 위에 점 2개, 위에 점 3개가 추가된다. 문자 n/ن아랍어 또한 시작 형태와 중간 형태에서는 같은 형태를 가지며, 위에 점 1개가 추가되지만, 고립 형태와 마지막 형태에서는 다소 다르다.
인쇄 및 필기체 아랍어에서 단어 내 대부분의 문자는 인접한 문자와 직접 연결된다.
== 변형 문자 ==
아랍 문자의 기본 문자의 변형에는 타 마르부타(ة아랍어), 알리프 마끄수라(ى아랍어), 람 알리프(لا아랍어) 등이 있다.
* 타 마르부타(ة아랍어): ت의 변형으로, 명사나 형용사 뒤에 붙어 여성형을 만든다. 단어 끝에 오는 경우가 많으며, 발음되지 않거나 로 발음되기도 하고, 구성 상태에서는 로 발음되기도 한다. 예를 들어 madrasa/مدرسة아랍어는 또는 madrasah/مدرسة아랍어 로 발음될 수 있으며, "학교"를 의미한다. madrasatu sāra/مدرسة سارة아랍어는 "사라의 학교"를 의미한다. 드물게 남성 단수 명사나 남성 복수 명사 형태를 나타내기도 한다.
* 알리프 마끄수라(ى아랍어): 알리프(ا)의 변형으로, 특정 어휘의 어미에만 붙으며, 현대 표준 아랍어에서는 로 발음된다. 주로 동사의 중성/비여성적 측면을 나타내기 위해 사용된다. 이집트와 수단에서는 단어 끝에 점이 없는 ي아랍어를 쓰는 방식으로 사용되기도 한다.
* 람 알리프(لا아랍어): 람(ل)과 알리프(ا)의 합자이다. 알리프(ا)로 시작하는 어휘 앞에 정관사 ال(알)이 붙을 때 등에 나타난다. /(ʔ)a/ /(ʔ)i/ /(ʔ)u/ 음가를 갖는 어두 ا의 바로 앞에 람(ل)이 와 'لا'가 될 경우, 음가는 /laː/ 가 아니라, /l(ʔ)a/ /l(ʔ)i/ /l(ʔ)u/ 중 하나가 된다.
# 하'
유니코드의 기본 범위 유니코드의 아랍 문자 (U+06xx) 내에서 유일한 합자는 람 + 알리프이다. 다른 범위는 이전 표준과의 호환성을 위한 것이며 선택 사항인 다른 합자를 포함한다.
* lām/لا아랍어 + alif/لا아랍어
*: لا/لا아랍어
참고: 유니코드는 Presentation Form B FExx 범위에 이 합자에 대한 코드도 있으며, 브라우저와 글꼴이 아랍어에 맞게 올바르게 구성되어 있으면 위에서 표시된 합자는 `U+FEFB` ARABIC LIGATURE LAM WITH ALEF ISOLATED FORM과 동일해야 한다.
:: ﻻ/ﻻ아랍어
*
U+0640 ARABIC TATWEEL + lām/لا아랍어 + alif/لا아랍어*: ـلا/ـلا아랍어
참고: 유니코드는 Presentation Form B U+FExx 범위에 이 합자에 대한 코드도 있으며, 브라우저와 글꼴이 아랍어에 맞게 올바르게 구성되어 있으면 위에서 표시된 합자는 이와 동일해야 한다.
*
U+FEFC ARABIC LIGATURE LAM WITH ALEF FINAL FORM*: ﻼ/ﻼ아랍어
유니코드 Presentation Form A 범위 U+FB50에서 U+FDxx까지의 또 다른 합자는 합자 알라/الله아랍어 ("신")에 대한 특수 코드인
U+FDF2 ARABIC LIGATURE ALLAH ISOLATED FORM이다.:: ﷲ/ﷲ아랍어
== 발음 기호 ==
아랍 문자의 발음 기호는 현대 표준 아랍어의 통상 표기에서는 생략되지만, 교육 자료나 해설용 텍스트 등에서는 사용된다.
=== 모음 기호 ===
아랍 문자의 모음 기호는 다음과 같다.
| 기호 | 이름 | 음가 | 역할 |
|---|---|---|---|
| َ | 파트하/فتحة아랍어 | [a] | 단모음 /a/ |
| ِ | 카스라/كسرة아랍어 | [i] | 단모음 /i/ |
| ُ | 담마/ضمة아랍어 | [u] | 단모음 /u/ |
| ْ | 수쿤/سكون아랍어 | [-] | 모음이 없음을 표시. |
일반적인 아랍어 표기에서는 단모음 기호를 생략하는 경우가 많지만, 꾸란과 같이 정확한 발음이 중요한 텍스트나 교육용 자료에서는 모음 기호를 사용하여 정확한 발음을 나타낸다. 아랍어는 모음의 미묘한 변화에 따라 문장의 의미가 완전히 달라질 수 있기 때문에, 모음 기호는 아랍어 문법에서 매우 중요하다.
장모음은 단모음 기호 뒤에 각각 알리프(ا), 야(ي), 와우(و)를 붙여서 표현한다.
이중모음 /aj/와 /aw/는 'ي'(야, /j/)를 사용한 표기 ay가 이중 모음 ai, 'و'(와우, /w/)를 사용한 aw가 이중 모음 aw에 해당한다.
=== 탄윈 ===
탄윈(تنوين아랍어) 기호는 발음 기호를 두 번 써서 [-n] 발음을 부가하며, 이는 문장에서의 격을 나타내는 데 사용된다.
=== 자음 관련 기호 ===
| 기호 | 이름 | 음가 | 역할 |
|---|---|---|---|
| آ ٓ (لآ ـلآ) | 맛다 | [ʔaː] ([lʔaː]) | 함자가 붙은 알리프(أ) 가 옴을 표시. 장음부호 /ʔa/음가의 أ 및 لأ 에만 붙는다. |
| ٱ | 와슬라 | [-] | 알리프 전용 묵음 기호. 함자가 붙지 않는 어두의 알리프의 발음이, (다른 단어가 앞에 옴으로 인해) 묵음 처리됨을 표시. |
| ٰ | 알리프 칸자리야 | [aː] | 표기상 알리프가 생략되었음을 표시. 미니 알리프 (※) |
| ّ | 샷다 | [CC] | 자음 중복 기호. 같은 자음이 두개가 연속으로 옴을 표시. |
※ 이슬람교의 신 알라는 아랍어 표기로 알라/الله아랍어이며, 샷다( ّ )위에 짧은 선이 그어져 있는데, 이것도 미니 알리프의 일종이다. 키보드로 입력할 때 람(ل) + 람(ل) + 하(ه)를 입력하면 자동적으로 이 기호가 붙는다.
쌍자음은 자음이 겹쳐 발음되는 현상이다. 아랍어에서는 문자를 두 번 쓰는 대신, 샤다/شَدَّة아랍어(W자 모양)라는 기호를 사용한다. 두 자음 사이에 모음이 나타나면 문자는 단순히 두 번 쓰인다. 이 구별 기호는 한 음절의 끝 자음이 다음 음절의 첫 자음과 동일한 경우에만 나타난다. 예를 들어, 다라사/درس아랍어(전체 발음 구별 기호: 다라사/دَرَسَ아랍어)는 '공부하다'라는 의미의 1형 동사이고, 다ㄹ라사/درّس아랍어(전체 발음 구별 기호: 다ㄹ라사/دَرَّسَ아랍어)는 중간 ㄹ/r아랍어 자음이 두 배로 발음되어 '가르치다'라는 의미의 2형 동사이다.
== 아랍 문자의 전통 순서 ==
아랍 문자는 사전순 배열 외에 페니키아 문자에서 유래한 아브자드 순이라는 전통적인 순서도 가지고 있다. 이 순서는 지역에 따라 조금씩 차이가 있지만, 가장 일반적인 순서는 다음과 같다. (오른쪽에서 왼쪽 방향으로 읽는다)
{| class="wikitable"
|-
|style="line-height:180%;padding:10px;"|n/ن아랍어
|style="line-height:180%;padding:10px;"|m/م아랍어
|style="line-height:180%;padding:10px;"|l/ل아랍어
|style="line-height:180%;padding:10px;"|k/ك아랍어
|style="line-height:180%;padding:10px;"|y/ي아랍어
|style="line-height:180%;padding:10px;"|ṭ/ط아랍어
|style="line-height:180%;padding:10px;"|ḥ/ح아랍어
|style="line-height:180%;padding:10px;"|z/ز아랍어
|style="line-height:180%;padding:10px;"|w/و아랍어
|style="line-height:180%;padding:10px;"|h/ه아랍어
|style="line-height:180%;padding:10px;"|d/د아랍어
|style="line-height:180%;padding:10px;"|j/ج아랍어
|style="line-height:180%;padding:10px;"|b/ب아랍어
|style="line-height:180%;padding:10px;"|ʼ/ا아랍어
!문자
|-
|50||40||30||20||10||9||8||7||6||5||4||3||2||1
!수치
|-
|style="line-height:180%;padding:10px;"|ḡ/غ아랍어
|style="line-height:180%;padding:10px;"|ẓ/ظ아랍어
|style="line-height:180%;padding:10px;"|ḍ/ض아랍어
|style="line-height:180%;padding:10px;"|ḏ/ذ아랍어
|style="line-height:180%;padding:10px;"|ḵ/خ아랍어
|style="line-height:180%;padding:10px;"|ṯ/ث아랍어
|style="line-height:180%;padding:10px;"|t/ت아랍어
|style="line-height:180%;padding:10px;"|š/ش아랍어
|style="line-height:180%;padding:10px;"|r/ر아랍어
|style="line-height:180%;padding:10px;"|q/ق아랍어
|style="line-height:180%;padding:10px;"|ṣ/ص아랍어
|style="line-height:180%;padding:10px;"|f/ف아랍어
|style="line-height:180%;padding:10px;"|{{llang|ar|ع|
5.1. 기본 문자
아랍어에서는 기본 28자의 자음 문자에 함자 기호가 사용된다.
| 문자 | 문자명 | 음가 | |||
|---|---|---|---|---|---|
| 단독형 | 어두형 | 어중형 | 어말형 | ||
| ا아랍어 | ﺎ아랍어 | 알리프 (Alif) | 무음 혹은 (※) | ||
| ﺏ아랍어 | ﺑ아랍어 | ﺒ아랍어 | ﺐ아랍어 | 바 (Bāʾ) | |
| ﺕ아랍어 | ﺗ아랍어 | ﺘ아랍어 | ﺖ아랍어 | 타 (Tāʾ) | |
| ﺙ아랍어 | ﺛ아랍어 | ﺜ아랍어 | ﺚ아랍어 | 사 (Thā) | |
| ﺝ아랍어 | ﺟ아랍어 | ﺠ아랍어 | ﺞ아랍어 | 짐 (Jīm) | |
| ح아랍어 | ﺣ아랍어 | ﺤ아랍어 | ﺢ아랍어 | 하 (Ḥā) | |
| خ아랍어 | ﺧ아랍어 | ﺨ아랍어 | ﺦ아랍어 | 카 (Khā) | |
| د아랍어 | ﺪ아랍어 | 달 (Dāl) | |||
| ذ아랍어 | ﺬ아랍어 | 달 (Dhāl) | |||
| ر아랍어 | ﺮ아랍어 | 라 (Rā) | |||
| ز아랍어 | ﺰ아랍어 | 자이 (Zāy) | |||
| ﺱ아랍어 | ﺳ아랍어 | ﺴ아랍어 | ﺲ아랍어 | 신 (Sīn) | |
| ش아랍어 | ﺷ아랍어 | ﺸ아랍어 | ﺶ아랍어 | 쉰 (Shīn) | |
| ص아랍어 | ﺻ아랍어 | ﺼ아랍어 | ﺺ아랍어 | 사드 (Ṣād) | |
| ض아랍어 | ﺿ아랍어 | ﻀ아랍어 | ﺾ아랍어 | 다드 (Ḍād) | |
| ط아랍어 | ﻃ아랍어 | ﻄ아랍어 | ﻂ아랍어 | 타 (Ṭāʾ) | |
| ظ아랍어 | ﻇ아랍어 | ﻈ아랍어 | ﻆ아랍어 | 다 (Ẓāʾ) | |
| ع아랍어 | ﻋ아랍어 | ﻌ아랍어 | ﻊ아랍어 | 아인 (ʿAyn) | |
| غ아랍어 | ﻏ아랍어 | ﻐ아랍어 | ﻎ아랍어 | 가인 (Ġayn) | |
| ف아랍어 | ﻓ아랍어 | ﻔ아랍어 | ﻒ아랍어 | 파 (Fāʾ) | |
| ق아랍어 | ﻗ아랍어 | ﻘ아랍어 | ﻖ아랍어 | 까프 (Qāf) | |
| ك아랍어 | ﻛ아랍어 | ﻜ아랍어 | ﻚ아랍어 | 카프 (Kāf) | |
| ل아랍어 | ﻟ아랍어 | ﻠ아랍어 | ﻞ아랍어 | 람 (Lām) | |
| م아랍어 | ﻣ아랍어 | ﻤ아랍어 | ﻢ아랍어 | 밈 (Mīm) | |
| ن아랍어 | ﻧ아랍어 | ﻨ아랍어 | ﻦ아랍어 | 눈 (Nūn) | |
| ه아랍어 | ﻫ아랍어 | ﻬ아랍어 | ﻪ아랍어 | 하 (Hā) | |
| و아랍어 | ﻮ아랍어 | 와우 (Wāw) | |||
| ي아랍어 | ﻳ아랍어 | ﻴ아랍어 | ﻲ아랍어 | 야 (Yā) | |
| ء아랍어 | 함자 (Hamza) | ||||
알리프(ا)는 고유의 음가를 갖지 않으며, 모음 표기나 함자와 함께 사용된다.
알리프(ا)는 다음과 같은 형태로 사용된다.
# 어두에서 /a/ /i/ /u/ 중 하나의 발음을 표시 (이때 함자 (/ʔ/) 가 붙는 경우도 있음)
# 어중, 어말에서 다른 자음 문자의 뒤에 붙어 장음 /aː/를 표시
# 어중, 어말에서 /a/의 음가 표시용 함자와 함께 쓰임
기본적인 아랍 문자는 28개의 문자를 포함한다. 아랍 문자를 차용하여 다른 언어를 표기하는 경우, 문자가 추가되거나 삭제되기도 한다. 예를 들어 ⟨پ⟩는 를 나타내는 데 자주 사용된다.
많은 문자가 서로 비슷하게 생겼지만, 중심 부분 위나 아래에 점(아랍어 구두점#ʾiʿjām (자음의 음성적 구분)/ʾiʿjām아랍어})을 찍어 구분한다. 이러한 점은 서로 다른 소리를 나타내는 문자를 구분하기 때문에 문자의 필수적인 부분이다. 예를 들어, 아랍 문자 b/ب아랍어, t/ت아랍어, th/ث아랍어는 기본 형태가 같지만, 각각 아래에 점 1개, 위에 점 2개, 위에 점 3개가 추가된다. 문자 n/ن아랍어 또한 시작 형태와 중간 형태에서는 같은 형태를 가지며, 위에 점 1개가 추가되지만, 고립 형태와 마지막 형태에서는 다소 다르다.
인쇄 및 필기체 아랍어에서 단어 내 대부분의 문자는 인접한 문자와 직접 연결된다.
5.2. 변형 문자
아랍 문자의 기본 문자의 변형에는 타 마르부타(ة아랍어), 알리프 마끄수라(ى아랍어), 람 알리프(لا아랍어) 등이 있다.
* 타 마르부타({{lang|ar|ة}}): ت의 변형으로, 명사나 형용사 뒤에 붙어 여성형을 만든다. 단어 끝에 오는 경우가 많으며, 발음되지 않거나 로 발음되기도 하고, 구성 상태에서는 로 발음되기도 한다. 예를 들어 مدرسة아랍어()는 또는 로 발음될 수 있으며, "학교"를 의미한다. مدرسة سارة아랍어 ()는 "사라의 학교"를 의미한다. 드물게 남성 단수 명사나 남성 복수 명사 형태를 나타내기도 한다.
* 알리프 마끄수라({{lang|ar|ى}}): 알리프(ا)의 변형으로, 특정 어휘의 어미에만 붙으며, 현대 표준 아랍어에서는 로 발음된다. 주로 동사의 중성/비여성적 측면을 나타내기 위해 사용된다. 이집트와 수단에서는 단어 끝에 점이 없는 ي아랍어 ()를 쓰는 방식으로 사용되기도 한다.
* 람 알리프({{lang|ar|لا}}): 람(ل)과 알리프(ا)의 합자이다. 알리프(ا)로 시작하는 어휘 앞에 정관사 ال(알)이 붙을 때 등에 나타난다. /(ʔ)a/ /(ʔ)i/ /(ʔ)u/ 음가를 갖는 어두 ا의 바로 앞에 람(ل)이 와 'لا'가 될 경우, 음가는 /laː/ 가 아니라, /l(ʔ)a/ /l(ʔ)i/ /l(ʔ)u/ 중 하나가 된다.
# 하'
유니코드의 기본 범위 유니코드의 아랍 문자 (U+06xx) 내에서 유일한 합자는 람 + 알리프이다. 다른 범위는 이전 표준과의 호환성을 위한 것이며 선택 사항인 다른 합자를 포함한다.
* +
*:
참고: 유니코드는 Presentation Form B FExx 범위에 이 합자에 대한 코드도 있으며, 브라우저와 글꼴이 아랍어에 맞게 올바르게 구성되어 있으면 위에서 표시된 합자는 `U+FEFB` ARABIC LIGATURE LAM WITH ALEF ISOLATED FORM과 동일해야 한다.
::
* U+0640 ARABIC TATWEEL + +
*:
참고: 유니코드는 Presentation Form B U+FExx 범위에 이 합자에 대한 코드도 있으며, 브라우저와 글꼴이 아랍어에 맞게 올바르게 구성되어 있으면 위에서 표시된 합자는 이와 동일해야 한다.
* U+FEFC ARABIC LIGATURE LAM WITH ALEF FINAL FORM
*:
유니코드 Presentation Form A 범위 U+FB50에서 U+FDxx까지의 또 다른 합자는 합자 ("신")에 대한 특수 코드인 U+FDF2 ARABIC LIGATURE ALLAH ISOLATED FORM이다.
::
5.3. 발음 기호
아랍 문자의 발음 기호는 현대 표준 아랍어의 통상 표기에서는 생략되지만, 교육 자료나 해설용 텍스트 등에서는 사용된다.
== 모음 기호 ==
아랍 문자의 모음 기호는 다음과 같다.
| 기호 | 이름 | 음가 | 역할 |
|---|---|---|---|
| َ | 파트하/فتحة아랍어 | [a] | 단모음 /a/ |
| ِ | 카스라/كسرة아랍어 | [i] | 단모음 /i/ |
| ُ | 담마/ضمة아랍어 | [u] | 단모음 /u/ |
| ْ | 수쿤/سكون아랍어 | [-] | 모음이 없음을 표시. |
일반적인 아랍어 표기에서는 단모음 기호를 생략하는 경우가 많지만, 꾸란과 같이 정확한 발음이 중요한 텍스트나 교육용 자료에서는 모음 기호를 사용하여 정확한 발음을 나타낸다. 아랍어는 모음의 미묘한 변화에 따라 문장의 의미가 완전히 달라질 수 있기 때문에, 모음 기호는 아랍어 문법에서 매우 중요하다.
장모음은 단모음 기호 뒤에 각각 알리프(ا), 야(ي), 와우(و)를 붙여서 표현한다.
이중모음 /aj/와 /aw/는 'ي'(야, /j/)를 사용한 표기 ay가 이중 모음 ai, 'و'(와우, /w/)를 사용한 aw가 이중 모음 aw에 해당한다.
== 탄윈 ==
탄윈(تنوين아랍어) 기호는 발음 기호를 두 번 써서 [-n] 발음을 부가하며, 이는 문장에서의 격을 나타내는 데 사용된다.
== 자음 관련 기호 ==
| 기호 | 이름 | 음가 | 역할 |
|---|---|---|---|
| آ ٓ (لآ ـلآ) | 맛다 | [ʔaː] ([lʔaː]) | 함자가 붙은 알리프(أ) 가 옴을 표시. 장음부호 /ʔa/음가의 أ 및 لأ 에만 붙는다. |
| ٱ | 와슬라 | [-] | 알리프 전용 묵음 기호. 함자가 붙지 않는 어두의 알리프의 발음이, (다른 단어가 앞에 옴으로 인해) 묵음 처리됨을 표시. |
| ٰ | 알리프 칸자리야 | [aː] | 표기상 알리프가 생략되었음을 표시. 미니 알리프 (※) |
| ّ | 샷다 | [CC] | 자음 중복 기호. 같은 자음이 두개가 연속으로 옴을 표시. |
※ 이슬람교의 신 알라는 아랍어 표기로 알라/الله아랍어이며, 샷다( ّ )위에 짧은 선이 그어져 있는데, 이것도 미니 알리프의 일종이다. 키보드로 입력할 때 람(ل) + 람(ل) + 하(ه)를 입력하면 자동적으로 이 기호가 붙는다.
쌍자음은 자음이 겹쳐 발음되는 현상이다. 아랍어에서는 문자를 두 번 쓰는 대신, 샤다/شَدَّة아랍어(W자 모양)라는 기호를 사용한다. 두 자음 사이에 모음이 나타나면 문자는 단순히 두 번 쓰인다. 이 구별 기호는 한 음절의 끝 자음이 다음 음절의 첫 자음과 동일한 경우에만 나타난다. 예를 들어, 다라사/درس아랍어(전체 발음 구별 기호: 다라사/دَرَسَ아랍어)는 '공부하다'라는 의미의 1형 동사이고, 다ㄹ라사/درّس아랍어(전체 발음 구별 기호: 다ㄹ라사/دَرَّسَ아랍어)는 중간 ㄹ/r아랍어 자음이 두 배로 발음되어 '가르치다'라는 의미의 2형 동사이다.
5.3.1. 모음 기호
아랍 문자의 모음 기호에는 다음과 같은 것들이 있다.
| 기호 | 이름 | 음가 | 역할 |
|---|---|---|---|
| َ | 파트하(fatḥah) | [a] | 단모음 /a/ |
| ِ | 카스라(kasrah) | [i] | 단모음 /i/ |
| ُ | 돰마(ḍammah) | [u] | 단모음 /u/ |
| ْ | 스쿤(sukūn) | [-] | 모음이 없음을 표시. |
일반적인 아랍어 표기에서는 단모음 기호를 생략하는 경우가 많지만, 꾸란과 같이 정확한 발음이 중요한 텍스트나 교육용 자료에서는 모음 기호를 사용하여 정확한 발음을 나타낸다. 아랍어는 모음의 미묘한 변화에 따라 문장의 의미가 완전히 달라질 수 있기 때문에, 모음 기호는 아랍어 문법에서 매우 중요한 역할을 한다.
단모음은 음절에서 그 앞에 오는 자음 위나 아래에 배치된 부호로 쓸 수 있으며, 이를 라고 한다.
| 단모음 (완전히 모음화된 텍스트) | 이름 | 음역 | 음소 값 | 비고 |
|---|---|---|---|---|
| fat·ḥah | 방언, 위치, 강세에 따라 , , , , 에서 까지 다양하다. | |||
| 방언, 위치, 강세에 따라 , 에서 까지 다양하다. 영어 "U" (예: "put")에 근사하게 대응된다. | ||||
| 방언, 위치, 강세에 따라 , 에서 까지 다양하다. 영어 "I" (예: "pick")에 근사하게 대응된다. |
장모음은 단모음 기호 뒤에 각각 알리프(ا), 야(ي), 와우(و)를 붙여서 표현한다.
| 기호가 있는 문자 | 이름 | 음역 | 값 |
|---|---|---|---|
이중모음 와 는 다음과 같이 표시한다.
| 이중 모음 (모음 부호가 완전히 표시된 텍스트) | 전사 | 값 |
|---|---|---|
스쿤(sukūn)은 모음이 없음을 나타내는 기호로, 단어의 음절 구조를 명확하게 하는 데 사용된다. 예를 들어, "qalb" (마음)는 "قلْب"로 표기하여 "l" 다음에 모음이 없음을 나타낸다.
아랍어의 모음은 기본적으로 아/a/, 이/i/, 우/u/ 3개와 이를 장음화한 것, 그리고 조합된 이중 모음뿐이다.
이중 모음에 관해서는 'ي'(야, /j/)를 사용한 표기 ay가 이중 모음 ai, 'و'(와우, /w/)를 사용한 aw가 이중 모음 aw에 해당한다.
단모음은 자음자에 모음 기호를 부가하여 표현할 수 있다. (모음 기호는 일반적인 표기에서는 생략된다.)
| 기호 | 음가 | 의미 |
|---|---|---|
| َ | [a] | 단모음 아 |
| ِ | [i] | 단모음 이 |
| ُ | [u] | 단모음 우 |
5.3.2. 탄윈
탄윈(تنوين아랍어) 기호는 발음 기호를 두 번 써서 [-n] 발음을 부가하며, 이는 문장에서의 격을 나타내는 데 사용된다.
5.3.3. 자음 관련 기호
| 기호 | 이름 | 음가 | 역할 |
|---|---|---|---|
| آ ٓ (لآ ـلآ) | 맛다(madda) | [ʔaː] ([lʔaː]) | 함자가 붙은 알리프(أ) 가 옴을 표시. 장음부호 /ʔa/음가의 أ 및 لأ 에만 붙는다. |
| ٱ | 와슬라(wasla) | [-] | 알리프 전용 묵음 기호. 함자가 붙지 않는 어두의 알리프의 발음이, (다른 단어가 앞에 옴으로 인해) 묵음 처리됨을 표시. |
| ٰ | 알리프 칸자리야(alif khanjariyya) | [aː] | 표기상 알리프가 생략되었음을 표시. 미니 알리프 (※) |
| ّ | 샷다(shadda) | [CC] | 자음 중복 기호. 같은 자음이 두개가 연속으로 옴을 표시. |
※ 이슬람교의 신 알라는 아랍어 표기로 알라/الله아랍어이며, 샷다( ّ )위에 짧은 선이 그어져 있는데, 이것도 미니 알리프의 일종이다. 키보드로 입력할 때 람(ل) + 람(ل) + 하(ه)를 입력하면 자동적으로 이 기호가 붙는다.
쌍자음은 자음이 겹쳐 발음되는 현상이다. 아랍어에서는 문자를 두 번 쓰는 대신, 샤다/شَدَّة아랍어(W자 모양)라는 기호를 사용한다. 두 자음 사이에 모음이 나타나면 문자는 단순히 두 번 쓰인다. 이 구별 기호는 한 음절의 끝 자음이 다음 음절의 첫 자음과 동일한 경우에만 나타난다. 예를 들어, 다라사/درس아랍어(전체 발음 구별 기호: 다라사/دَرَسَ아랍어)는 '공부하다'라는 의미의 1형 동사이고, 다ㄹ라사/درّس아랍어(전체 발음 구별 기호: 다ㄹ라사/دَرَّسَ아랍어)는 중간 ㄹ/r아랍어 자음이 두 배로 발음되어 '가르치다'라는 의미의 2형 동사이다.
5.4. 아랍 문자의 전통 순서
아랍 문자는 사전순 배열 외에 페니키아 문자에서 유래한 아브자드 순이라는 전통적인 순서도 가지고 있다. 이 순서는 지역에 따라 조금씩 차이가 있지만, 가장 일반적인 순서는 다음과 같다. (오른쪽에서 왼쪽 방향으로 읽는다)
| n/ن아랍어 | m/م아랍어 | l/ل아랍어 | k/ك아랍어 | y/ي아랍어 | ṭ/ط아랍어 | ḥ/ح아랍어 | z/ز아랍어 | w/و아랍어 | h/ه아랍어 | d/د아랍어 | j/ج아랍어 | b/ب아랍어 | ʼ/ا아랍어 | 문자 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 50 | 40 | 30 | 20 | 10 | 9 | 8 | 7 | 6 | 5 | 4 | 3 | 2 | 1 | 수치 |
| ḡ/غ아랍어 | ẓ/ظ아랍어 | ḍ/ض아랍어 | ḏ/ذ아랍어 | ḵ/خ아랍어 | ṯ/ث아랍어 | t/ت아랍어 | š/ش아랍어 | r/ر아랍어 | q/ق아랍어 | ṣ/ص아랍어 | f/ف아랍어 | ‘/ع아랍어 | s/س아랍어 | 문자 |
| 1000 | 900 | 800 | 700 | 600 | 500 | 400 | 300 | 200 | 100 | 90 | 80 | 70 | 60 | 수치 |
아브자드 순은 중간에 모음을 넣어, 식으로 외울 수 있다. 아브자드 순서는 항목 번호 표기나 아브자드 숫자 용법 등에서 사용된다.
아랍 문자의 두 가지 주요 정렬 순서('알파벳 순서')에는 히자이()와 아브자디()가 있다.
히자이 순서(هِجَائِيّ아랍어 )는 전화번호부, 학급 명단, 사전 등에서 단어와 이름을 정렬할 때 사용되는 일반적인 순서이다. 이 순서는 글리프 모양의 시각적 유사성에 따라 문자를 그룹화한다. 반면, 아브자디 순서(أَبْجَدِيّ아랍어 )는 페니키아 문자에서 유래되었으며, 히브리 문자 및 그리스 문자와 같은 다른 알파벳의 순서와 유사하다. 이 순서에서 문자는 압자드 숫자로 알려진 숫자로도 사용되며, 히브리어 게마트리아와 그리스어 이소프세피와 동일한 수비학 코드를 갖는다.
현대 사전 및 기타 참고 서적에서는 알파벳순으로 정렬하기 위해 아브자드 순서를 사용하지 않고, 대신 모양의 유사성에 따라 문자를 부분적으로 묶는 새로운 히자이 순서를 사용하며, 히자이 순서는 숫자로 사용되지 않는다.
6. 추가 문자
이들 언어에는 아랍어에 없는 발음도 있기 때문에, 이를 표현하기 위해 몇몇 자모와 기호가 추가되었다.
=== 아랍 문자 유래의 변형 문자 ===
아랍어에 존재하지 않는 발음을 표기하기 위해 기본 아랍 문자를 바탕으로 변형된 문자들이 사용된다. 이들 문자는 차용어, 방언의 단어들, 또는 각국의 발음 표기 등에 사용되며, 페르시아 문자, 파슈토 문자, 우르두 문자, 위구르어, 샤무키 문자 등에서도 사용된다.
| 문자 | 발음 | 설명 |
|---|---|---|
| ڤ | /v/ 발음의 이름, 차용어 표기를 위해 파(파/ف아랍어) 대신 사용됨. 까프/ڨ아랍어와 혼동 주의. | |
| ڥ | 튀니지, 알제리, 모로코에서 사용됨. | |
| پ | /p/발음의 이름, 차용어 표기를 위해 바(바/ب아랍어) 대신 사용되기도 함. 바/ب아랍어를 그대로 쓰고 /p/ 발음하는 경우도 있음. | |
| ڜ | 모로코에서 사용됨. | |
| چ | 걸프 아랍어 및 이라크에서 해당 발음의 명칭, 차용어 표기를 위해 종종 사용됨. 타-쉰의 연속 표기(타-쉰/تش아랍어)도 사용됨. (예: 차드(차드/تشاد아랍어)) | |
| 이집트에서 사용됨. ( 본래 발음을 위한 짐/ج아랍어 대신. 이집트에서는 짐/ج아랍어는 발음 표기에 사용된다) | ||
| 이스라엘에서 도로 표지명에서 사용. | ||
| گ | 북아프리카 및 서아시아 지역에서 사용됨. | |
| ڨ | 튀니지 및 알제리에서 차용어 표기에 사용됨. 또는 몇개의 단어에서 까프(까프/ق아랍어)의 지역 방언 표기에도 사용됨. 파/ڤ아랍어)와 혼동 주의. | |
| ڭ | 모로코에서 사용됨. | |
| ڠ | 걸프 지역에서 드물게 사용됨. |
대표적인 예로 베(바/ڤ아랍어), 페(파/پ아랍어), 체(차/ڜ아랍어 또는 차/چ아랍어), 가프(가프/گ아랍어, 까프/ڨ아랍어, 카프/ڭ아랍어 또는 응아/ڠ아랍어) 등이 있다.
현대 표준 아랍어에 없는 소리를 표기하기 위해 일부 수정된 문자가 사용된다. 이 문자들은 외래어, 차용어, 방언 단어를 표기할 때 선택적으로 사용된다. 이러한 문자의 사용은 필자와 그 출신 국가에 따라 다르며, 필수는 아니다. 표준 아랍어에서 음소(이집트에서만 짐/ج아랍어의 표준 발음으로 간주)는 표준 아랍어로 외래어 또는 외국 고유 명사를 표기할 때 가장 많은 변형을 가진다.
와 소리는 대부분의 아랍 방언에는 존재하지 않는다. 반면에 , , 는 많은 방언에서 고유 음소 또는 이음소로 나타난다.
=== 아랍 문자 유래 언어 추가 문자 ===
페르시아 문자, 위구르 문자, 우르두 문자 등에서 아랍 문자에 추가된 문자들이 있다. 응(ڭ), 가프(گ), 베(ﭪ), 제(ژ), 체(ﭺ), 페(پ), 도차스미 하(ھ) 등이 이에 해당한다.
| 문자 | 글자 확대 | 문자명 | 음가 | |||
|---|---|---|---|---|---|---|
| 단독형 | 어두형 | 어중형 | 어말형 | |||
| 응/ڭ아랍어 | 응/ﯕ아랍어 | 응/ﯖ아랍어 | 응/ﯔ아랍어 | 응 (Ng) | /ŋ/ 위구르 문자 | |
| 가프/گ아랍어 | 가프/ﮔ아랍어 | 가프/ﮕ아랍어 | 가프/ﮓ아랍어 | 가프 (Gāf) | /g/ 페르시아 문자. 소라니 쿠르드어, 위구르어에서도 사용 | |
| 베/ﭪ아랍어 | 베/ﭬ아랍어 | 베/ﭭ아랍어 | 베/ﭫ아랍어 | 베 (Ve) | /v/ 소라니 쿠르드어에서 사용 | |
| 제/ژ아랍어 | (없음) | (없음) | 제/ـژ아랍어 | 제 (Zhe) | /ʒ/ 페르시아 문자, 위구르 문자 | |
| 체/ﭺ아랍어 | 체/ﭼ아랍어 | 체/ﭽ아랍어 | 체/ﭻ아랍어 | 체 (Che) | /tʃ/ 페르시아 문자, 위구르 문자 | |
| 페/پ아랍어 | 페/ﭘ아랍어 | 페/ﭙ아랍어 | 페/ﭗ아랍어 | 페 (Pe) | /p/ 페르시아 문자, 위구르 문자 | |
| ھ | ھــ | ــھــ | ــھ | Dochasmee hā | [hāː] ه의 변형. 우르두 문자에서 사용. |
표준 아랍어에서 ج/ج아랍어는 이집트에서 /g/발음으로 사용된다. 그리고 표준 아랍어로 외래어 또는 외국 고유 명사를 표기할 때 가장 많은 변형을 가진다. 표준 문자 ج/ج아랍어, غ/غ아랍어, ق/ق아랍어, ك/ك아랍어 또는 비표준 문자 ڨ/ڨ아랍어(튀니지와 알제리에서만 사용), ڭ/ڭ아랍어(모로코에서만 사용), گ/گ아랍어(주로 이라크에서 사용)으로 표기될 수 있다. 예를 들어, "Golf"는 필자와 그 출신 국가에 따라 جولف/جولف아랍어, غولف/غولف아랍어, قولف/قولف아랍어, كولف/كولف아랍어, ڨولف/ڨولف아랍어, ڭولف/ڭولف아랍어 또는 گولف/گولف아랍어로 표기될 수 있다.
| 문자 | 음소 | 비고 |
|---|---|---|
| پ/پ아랍어 | /p/ | ب/ب아랍어 대신 외래어 이름과 차용어를 표기할 때 사용되기도 한다. 외래어에만 사용된다. |
| ڤ/ڤ아랍어 | /v/ | ف/ف아랍어 대신 외래어 이름과 차용어를 표기할 때 사용되기도 한다. 외래어에만 사용된다. |
| ڥ/ڥ아랍어 | ڨ/ڨ아랍어와 구별하기 위해 ف/ف아랍어 대신 외래어 이름과 차용어를 표기할 때 알제리와 튀니지에서만 사용된다. 외래어에만 사용된다. | |
| ڨ/ڨ아랍어 | /g/ | 알제리와 튀니지에서는 ڨ/ڨ아랍어 또는 ق/ق아랍어를 사용하여 /g/를 공식적으로 표기한다. 도시 이름에도 사용된다. 예를 들어, Guelma는 ڨالمة/ڨالمة아랍어 또는 قالمة/قالمة아랍어로, Gafsa는 ڨفصة/ڨفصة아랍어 또는 قفصة/قفصة아랍어로, Gabès는 ڨابس/ڨابس아랍어 또는 قابس/قابس아랍어로 표기한다. |
| ڭ/ڭ아랍어 | 모로코에서는 ڭ/ڭ아랍어 또는 ك/ك아랍어를 사용하여 /g/를 공식적으로 표기한다. 도시 이름에도 사용된다. 예를 들어, Agadir는 أڭادير/أڭادير아랍어 또는 أكادير/أكادير아랍어 로 표기한다. | |
| گ/گ아랍어 | 걸프 아랍어와 이라크 아랍어에서 사용되지만, 방언 단어를 표기할 때만 사용된다. | |
| چ/چ아랍어 | /t͡ʃ/ | 걸프 아랍어와 이라크 아랍어에서 사용되지만, /t͡ʃ/가 고유 음소/이음소로 간주되는 방언 단어를 표기할 때만 사용된다. 아랍 세계 전역의 표준 아랍어에서는 일반적으로 تشـ/تشـ아랍어 (tāʼ-shīn) 시퀀스를 선호한다. |
| /ʒ/ | 표준 ج/ج아랍어가 /g/로 발음되는 외래어 이름과 차용어를 표기할 때 이집트에서 사용된다. 예를 들어 Giza는 الجيزة/الجيزة아랍어 로 표기한다. |
6.1. 기본 문자의 지역에 따른 변화형
지역에 따라 전통적으로 사용되는 기본 문자의 변화형이 있다. 신(س아랍어)의 변형인 ڛ(ـڛ ـڛـ ڛـ)는 과거 오토만 제국의 터키어에서 쓰였다. 마그레브 지역(리비아, 알제리 제외)에서는 파(ف아랍어)의 변형으로 ڢ(ـڢ ـڢـ ڢـ)를, 까프(ق아랍어)의 변형으로 ڧ/ٯ(ـڧ/ـٯ ـڧـ ڧـ)를 전통적으로 사용했다. 까프의 변형은 독립형/어미형에서는 점이 없고 어두형/어중형에서는 점이 있었다. 카프(ك아랍어)의 변형인 ک(ـک ـکـ کـ)는 오토만 터키어의 영향으로 마그레브 쪽에서 사용되었으며, 페르시아 문자와 걸프 아랍어 표기에서 현재까지도 사용된다. 이집트, 수단(나일강), 마그레브 지역에서 사용되는 야(ي아랍어)의 변형인 ی(ـی ـیـ یـ)는 독립형 및 어미형에서 점을 찍지 않으며, 모양새로는 알리프 마끄수라(ى아랍어)와 동일하다. 예를 들어, ʿalá/على아랍어 "on"과 ʿAlī/علي아랍어 "알리"는 이집트와 수단에서 모두 على아랍어로 표기된다. 종결형 kāf/ک아랍어의 대체 버전이 일부 필기체 변형에서 사용되는데( ـك아랍어 대신), 예를 들어 마다니 필기체는 메디나의 도로 표지판과 화학 회사 SABIC의 로고(سابک아랍어)에 사용된다.
6.2. 아랍 문자 유래의 변형 문자
아랍어에 존재하지 않는 발음을 표기하기 위해 기본 아랍 문자를 바탕으로 변형된 문자들이 사용된다. 이들 문자는 차용어, 방언의 단어들, 또는 각국의 발음 표기 등에 사용되며, 페르시아 문자, 파슈토 문자, 우르두 문자, 위구르어, 샤무키 문자 등에서도 사용된다.
| 문자 | 발음 | 설명 |
|---|---|---|
| ڤ | /v/ 발음의 이름, 차용어 표기를 위해 파(파/ف아랍어) 대신 사용됨. 까프/ڨ아랍어와 혼동 주의. | |
| ڥ | 튀니지, 알제리, 모로코에서 사용됨. | |
| پ | /p/발음의 이름, 차용어 표기를 위해 바(바/ب아랍어) 대신 사용되기도 함. 바/ب아랍어를 그대로 쓰고 /p/ 발음하는 경우도 있음. | |
| ڜ | 모로코에서 사용됨. | |
| چ | 걸프 아랍어 및 이라크에서 해당 발음의 명칭, 차용어 표기를 위해 종종 사용됨. 타-쉰의 연속 표기(타-쉰/تش아랍어)도 사용됨. (예: 차드(차드/تشاد아랍어)) | |
| 이집트에서 사용됨. ( 본래 발음을 위한 짐/ج아랍어 대신. 이집트에서는 짐/ج아랍어는 발음 표기에 사용된다) | ||
| 이스라엘에서 도로 표지명에서 사용. | ||
| گ | 북아프리카 및 서아시아 지역에서 사용됨. | |
| ڨ | 튀니지 및 알제리에서 차용어 표기에 사용됨. 또는 몇개의 단어에서 까프(까프/ق아랍어)의 지역 방언 표기에도 사용됨. 파/ڤ아랍어)와 혼동 주의. | |
| ڭ | 모로코에서 사용됨. | |
| ڠ | 걸프 지역에서 드물게 사용됨. |
대표적인 예로 베(바/ڤ아랍어), 페(파/پ아랍어), 체(차/ڜ아랍어 또는 차/چ아랍어), 가프(가프/گ아랍어, 까프/ڨ아랍어, 카프/ڭ아랍어 또는 응아/ڠ아랍어) 등이 있다.
현대 표준 아랍어에 없는 소리를 표기하기 위해 일부 수정된 문자가 사용된다. 이 문자들은 외래어, 차용어, 방언 단어를 표기할 때 선택적으로 사용된다. 이러한 문자의 사용은 필자와 그 출신 국가에 따라 다르며, 필수는 아니다. 표준 아랍어에서 음소(이집트에서만 짐/ج아랍어의 표준 발음으로 간주)는 표준 아랍어로 외래어 또는 외국 고유 명사를 표기할 때 가장 많은 변형을 가진다.
와 소리는 대부분의 아랍 방언에는 존재하지 않는다. 반면에 , , 는 많은 방언에서 고유 음소 또는 이음소로 나타난다.
아랍 문자는 현재 페르시아어 (페르시아 문자), 쿠르드어, 파슈토어 (파슈토 문자), 발루치어, 위구르어, 우르두어 (우르두 문자), 펀자브어 (샤무키 문자), 신드어 등에서 사용된다. 역사적으로는 튀르키예어, 중앙아시아의 튀르크계 제어 및 말레이어 (자위 문자), 스와힐리어 등 이슬람권 전역의 여러 언어에서도 아랍 문자가 사용되었다.
6.3. 아랍 문자 유래 언어 추가 문자
페르시아 문자, 위구르 문자, 우르두 문자 등에서 아랍 문자에 추가된 문자들이 있다. 응(ڭ), 가프(گ), 베(ﭪ), 제(ژ), 체(ﭺ), 페(پ), 도차스미 하(ھ) 등이 이에 해당한다.
| 문자 | 글자 확대 | 문자명 | 음가 | |||
|---|---|---|---|---|---|---|
| 단독형 | 어두형 | 어중형 | 어말형 | |||
| 응/ڭ아랍어 | 응/ﯕ아랍어 | 응/ﯖ아랍어 | 응/ﯔ아랍어 | 응 (Ng) | /ŋ/ 위구르 문자 | |
| 가프/گ아랍어 | 가프/ﮔ아랍어 | 가프/ﮕ아랍어 | 가프/ﮓ아랍어 | 가프 (Gāf) | /g/ 페르시아 문자. 소라니 쿠르드어, 위구르어에서도 사용 | |
| 베/ﭪ아랍어 | 베/ﭬ아랍어 | 베/ﭭ아랍어 | 베/ﭫ아랍어 | 베 (Ve) | /v/ 소라니 쿠르드어에서 사용 | |
| 제/ژ아랍어 | (없음) | (없음) | 제/ـژ아랍어 | 제 (Zhe) | /ʒ/ 페르시아 문자, 위구르 문자 | |
| 체/ﭺ아랍어 | 체/ﭼ아랍어 | 체/ﭽ아랍어 | 체/ﭻ아랍어 | 체 (Che) | /tʃ/ 페르시아 문자, 위구르 문자 | |
| 페/پ아랍어 | 페/ﭘ아랍어 | 페/ﭙ아랍어 | 페/ﭗ아랍어 | 페 (Pe) | /p/ 페르시아 문자, 위구르 문자 | |
| ھ | ھــ | ــھــ | ــھ | Dochasmee hā | [hāː] ه의 변형. 우르두 문자에서 사용. |
현대 표준 아랍어에 없는 소리를 표기하기 위해 일부 수정된 문자가 사용된다. 이러한 문자는 외래어, 차용어, 방언 단어를 표기할 때 선택적으로 사용된다. 이러한 문자의 사용은 필자와 그 출신 국가에 따라 다르며, 필수는 아니다.
표준 아랍어에서 ج/ج아랍어는 이집트에서 /g/발음으로 사용된다. 그리고 표준 아랍어로 외래어 또는 외국 고유 명사를 표기할 때 가장 많은 변형을 가진다. 표준 문자 ج/ج아랍어, غ/غ아랍어, ق/ق아랍어, ك/ك아랍어 또는 비표준 문자 ڨ/ڨ아랍어(튀니지와 알제리에서만 사용), ڭ/ڭ아랍어(모로코에서만 사용), گ/گ아랍어(주로 이라크에서 사용)으로 표기될 수 있다. 예를 들어, "Golf"는 필자와 그 출신 국가에 따라 جولف/جولف아랍어, غولف/غولف아랍어, قولف/قولف아랍어, كولف/كولف아랍어, ڨولف/ڨولف아랍어, ڭولف/ڭولف아랍어 또는 گولف/گولف아랍어로 표기될 수 있다.
| 문자 | 음소 | 비고 |
|---|---|---|
| پ/پ아랍어 | /p/ | ب/ب아랍어 대신 외래어 이름과 차용어를 표기할 때 사용되기도 한다. 외래어에만 사용된다. |
| ڤ/ڤ아랍어 | /v/ | ف/ف아랍어 대신 외래어 이름과 차용어를 표기할 때 사용되기도 한다. 외래어에만 사용된다. |
| ڥ/ڥ아랍어 | ڨ/ڨ아랍어와 구별하기 위해 ف/ف아랍어 대신 외래어 이름과 차용어를 표기할 때 알제리와 튀니지에서만 사용된다. 외래어에만 사용된다. | |
| ڨ/ڨ아랍어 | /g/ | 알제리와 튀니지에서는 ڨ/ڨ아랍어 또는 ق/ق아랍어를 사용하여 /g/를 공식적으로 표기한다. 도시 이름에도 사용된다. 예를 들어, Guelma는 ڨالمة/ڨالمة아랍어 또는 قالمة/قالمة아랍어로, Gafsa는 ڨفصة/ڨفصة아랍어 또는 قفصة/قفصة아랍어로, Gabès는 ڨابس/ڨابس아랍어 또는 قابس/قابس아랍어로 표기한다. |
| ڭ/ڭ아랍어 | 모로코에서는 ڭ/ڭ아랍어 또는 ك/ك아랍어를 사용하여 /g/를 공식적으로 표기한다. 도시 이름에도 사용된다. 예를 들어, Agadir는 أڭادير/أڭادير아랍어 또는 أكادير/أكادير아랍어 로 표기한다. | |
| گ/گ아랍어 | 걸프 아랍어와 이라크 아랍어에서 사용되지만, 방언 단어를 표기할 때만 사용된다. | |
| چ/چ아랍어 | /t͡ʃ/ | 걸프 아랍어와 이라크 아랍어에서 사용되지만, /t͡ʃ/가 고유 음소/이음소로 간주되는 방언 단어를 표기할 때만 사용된다. 아랍 세계 전역의 표준 아랍어에서는 일반적으로 تشـ/تشـ아랍어 (tāʼ-shīn) 시퀀스를 선호한다. |
| /ʒ/ | 표준 ج/ج아랍어가 /g/로 발음되는 외래어 이름과 차용어를 표기할 때 이집트에서 사용된다. 예를 들어 Giza는 الجيزة/الجيزة아랍어 로 표기한다. |
7. 아랍 숫자
서아라비아 숫자(현대 서구권 및 한국어에서 아라비아 숫자로 통용됨)와 동아라비아 숫자는 아랍 문자와 함께 사용되는 숫자이다. 오늘날 북아프리카 지역에서는 서아라비아 숫자가 사용된다. 서아라비아 숫자와 마찬가지로, 동아라비아 숫자는 왼쪽에서 오른쪽으로 쓰며, 왼쪽으로 갈 수록 큰 자릿수를 의미한다.
| 서부 (마그레브, 유럽) || rowspan="2" | 중앙 (중동) || colspan=2 | 동부 | |||
|---|---|---|---|
| 페르시아어 | 우르두어 | ||
| 0 | 0/٠아랍어 | 0/۰페르시아어 | 0/۰우르두어 |
| 1 | 1/١아랍어 | 1/۱페르시아어 | 1/۱우르두어 |
| 2 | 2/٢아랍어 | 2/۲페르시아어 | 2/۲우르두어 |
| 3 | 3/٣아랍어 | 3/۳페르시아어 | 3/۳우르두어 |
| 4 | 4/٤아랍어 | 4/۴페르시아어 | 4/۴우르두어 |
| 5 | 5/٥아랍어 | 5/۵페르시아어 | 5/۵우르두어 |
| 6 | 6/٦아랍어 | 6/۶페르시아어 | 6/۶우르두어 |
| 7 | 7/٧아랍어 | 7/۷페르시아어 | 7/۷우르두어 |
| 8 | 8/٨아랍어 | 8/۸페르시아어 | 8/۸우르두어 |
| 9 | 9/٩아랍어 | 9/۹페르시아어 | 9/۹우르두어 |
| 10 | 10/١٠아랍어 | 10/۱۰페르시아어 | 10/۱۰우르두어 |
7.1. 아브자드 숫자
숫자를 위한 전용 문자 외에, 아랍 문자 자체를 숫자를 나타내는 아브자드 숫자가 존재한다. 아브자드 순서로 매겨진 문자를 숫자에 대응시켜, 알리프/ا아랍어를 1로, 바/ب아랍어를 2로 짐/ج아랍어을 3으로 매기며, 야/ي아랍어 = 10, 카프/ك아랍어 = 20, 람/ل아랍어 = 30, …, 라/ر아랍어 = 200, …, 가인/غ아랍어 = 1000이 된다. 이는 항목의 순서 또는 크로노그램(연대 표시) 등에 사용된다.
8. 컴퓨터에서의 아랍어
아랍 문자는 ISO-8859-6, Windows-1256, 유니코드를 포함한 여러 문자 집합을 사용하여 인코딩할 수 있다. 유니코드에는 "아랍어 세그먼트"(U+0600 ~ U+06FF)가 포함되어 있다. 그러나 어느 문자 집합도 각 문자가 맥락에서 가져야 하는 형태를 나타내지 않는다. 각 문자에 대해 표시할 적절한 글리프를 선택하는 것은 렌더링 엔진의 몫이다.
각 문자는 유니코드에서 위치에 독립적인 인코딩을 가지며, 렌더링 소프트웨어는 결합 컨텍스트에서 올바른 글리프 형태(초기, 중간, 최종 또는 독립형)를 추론할 수 있다. 이것이 현재 권장 사항이다. 그러나 이전 표준과의 호환성을 위해 초기, 중간, 최종 및 독립 형태를 별도로 인코딩할 수도 있다.
== 키 배열 ==
윈도우의 아랍어 컴퓨터 자판 배열은 다음과 같다.
맥 컴퓨터 자판 배열은 다음과 같다.
다양한 국가를 위해 설계된 키보드는 서로 다른 배열을 가지고 있어서, 이라크식 키보드에 숙련된 사람이 사우디 아라비아식 키보드에 숙련된다고 할 수는 없다. 이러한 차이점은 알파벳 문자가 아닌 다른 문자의 위치를 포함할 수 있다.
모든 아랍어 키보드는 웹 브라우저의 URL과 같이 로마자 입력을 허용한다. 따라서 각 아랍어 키보드에는 아랍어 문자와 로마자 문자가 모두 표시되어 있다. 일반적으로 아랍어 키보드의 로마자 문자는 QWERTY 배열을 따르지만, 북아프리카에서는 프랑스어가 로마자 문자로 가장 많이 사용되는 언어이므로 아랍어 키보드는 AZERTY 배열을 사용한다.
Yamli 편집기와 같은 경쟁 온라인 도구를 이용하면 PC에 아랍어 지원이 설치되어 있지 않거나 아랍어 키보드의 배열에 대한 지식이 없어도 아랍어 문자를 입력할 수 있다.
== 문자 코드 ==
아랍어를 위한 문자 코드는 다음과 같은 것들이 있다.
* 마이크로소프트 윈도우 코드페이지 1256: 아랍 문자 외에 페르시아 문자, 우르두 문자도 추가되어 있으며, 아랍어 로마자 표기를 위한 엑센트 부가 소문자도 있다. 다른 코드와의 호환성 없음.
* ASMO 449: 7비트 코드. 아랍어 전용.
* ASMO-708: ASMO-449를 바탕으로 한 8비트 코드.
* ISO/IEC 8859-6: 8비트 코드. ASMO-708를 포함.
* MS-DOS 코드 페이지 720
* MS-DOS 코드 페이지 864: 아랍어 타이프라이터와 마찬가지로 어두형, 어중형, 어말형, 독립형이 별도로 번호가 매겨져 있다.
유니코드에서는 다음 구획이 아랍 문자를 위해 획정되어 있다.
* Arabic (U+0600 - U+06FF)
* Arabic Supplement (U+0750 - U+077F): 아프리카 계 언어군, 코와르어, 투르와리어, 부르샤스키어, 옛날 페르시아 문자
* Arabic Extended-A (U+08A0 - U+08FF): 아프리카 계(세네갈, 차드, 카메룬 등) 언어군. 로힌야어 문자, 필리핀에서 사용되는 문자 등을 포함
* Arabic Presentation Forms-A (U+FB50-FDFF)
* Arabic Presentation Forms-B (U+FE70-FEFF)
기본 아랍 문자 범위는 표준 문자 및 발음 구별 기호를 인코딩하지만 문맥상 형태는 인코딩하지 않는다(U+0621-U+0652는 직접적으로 ISO 8859-6에 기반한다). 또한 가장 일반적인 발음 구별 기호와 아랍-인도 숫자를 포함한다. U+06D6부터 U+06ED까지는 "'아야'" ۖ의 끝과 "'루브 엘 히즈브'" ۞의 시작과 같은 꾸란 주석 기호를 인코딩한다. 아랍 문자 보충 범위는 주로 아프리카(아랍어가 아닌) 언어를 표기하는 데 사용되는 문자 변형을 인코딩한다. 아랍 문자 확장-A 범위는 다양한 아랍어가 아닌 언어에 사용되는 추가적인 꾸란 주석 및 문자 변형을 인코딩한다.
아랍 문자 표현 형식-A 범위는 페르시아어, 우르두어, 신드어 및 중앙아시아 언어에 필요한 문맥상 형태 및 문자 변형의 합자를 인코딩한다. 아랍 문자 표현 형식-B 범위는 아랍어 발음 구별 기호의 간격 형태와 더 많은 문맥상 문자 형태를 인코딩한다.
8.1. 키 배열
윈도우의 아랍어 컴퓨터 자판 배열은 다음과 같다.
맥 컴퓨터 자판 배열은 다음과 같다.
다양한 국가를 위해 설계된 키보드는 서로 다른 배열을 가지고 있어서, 이라크식 키보드에 숙련된 사람이 사우디 아라비아식 키보드에 숙련된다고 할 수는 없다. 이러한 차이점은 알파벳 문자가 아닌 다른 문자의 위치를 포함할 수 있다.
모든 아랍어 키보드는 웹 브라우저의 URL과 같이 로마자 입력을 허용한다. 따라서 각 아랍어 키보드에는 아랍어 문자와 로마자 문자가 모두 표시되어 있다. 일반적으로 아랍어 키보드의 로마자 문자는 QWERTY 배열을 따르지만, 북아프리카에서는 프랑스어가 로마자 문자로 가장 많이 사용되는 언어이므로 아랍어 키보드는 AZERTY 배열을 사용한다.
Yamli 편집기와 같은 경쟁 온라인 도구를 이용하면 PC에 아랍어 지원이 설치되어 있지 않거나 아랍어 키보드의 배열에 대한 지식이 없어도 아랍어 문자를 입력할 수 있다.
8.2. 문자 코드
아랍어를 위한 문자 코드는 다음과 같은 것들이 있다.
* 마이크로소프트 윈도우 코드페이지 1256: 아랍 문자 외에 페르시아 문자, 우르두 문자도 추가되어 있으며, 아랍어 로마자 표기를 위한 엑센트 부가 소문자도 있다. 다른 코드와의 호환성 없음.
* ASMO 449: 7비트 코드. 아랍어 전용.
* ASMO-708: ASMO-449를 바탕으로 한 8비트 코드.
* ISO/IEC 8859-6: 8비트 코드. ASMO-708를 포함.
* MS-DOS 코드 페이지 720
* MS-DOS 코드 페이지 864: 아랍어 타이프라이터와 마찬가지로 어두형, 어중형, 어말형, 독립형이 별도로 번호가 매겨져 있다.
유니코드에서는 다음 구획이 아랍 문자를 위해 획정되어 있다.
* Arabic (U+0600 - U+06FF)
* Arabic Supplement (U+0750 - U+077F): 아프리카 계 언어군, 코와르어, 투르와리어, 부르샤스키어, 옛날 페르시아 문자
* Arabic Extended-A (U+08A0 - U+08FF): 아프리카 계(세네갈, 차드, 카메룬 등) 언어군. 로힌야어 문자, 필리핀에서 사용되는 문자 등을 포함
* Arabic Presentation Forms-A (U+FB50-FDFF)
* Arabic Presentation Forms-B (U+FE70-FEFF)
기본 아랍 문자 범위는 표준 문자 및 발음 구별 기호를 인코딩하지만 문맥상 형태는 인코딩하지 않는다(U+0621-U+0652는 직접적으로 ISO 8859-6에 기반한다). 또한 가장 일반적인 발음 구별 기호와 아랍-인도 숫자를 포함한다. U+06D6부터 U+06ED까지는 "'아야'" ۖ의 끝과 "'루브 엘 히즈브'" ۞의 시작과 같은 꾸란 주석 기호를 인코딩한다. 아랍 문자 보충 범위는 주로 아프리카(아랍어가 아닌) 언어를 표기하는 데 사용되는 문자 변형을 인코딩한다. 아랍 문자 확장-A 범위는 다양한 아랍어가 아닌 언어에 사용되는 추가적인 꾸란 주석 및 문자 변형을 인코딩한다.
아랍 문자 표현 형식-A 범위는 페르시아어, 우르두어, 신드어 및 중앙아시아 언어에 필요한 문맥상 형태 및 문자 변형의 합자를 인코딩한다. 아랍 문자 표현 형식-B 범위는 아랍어 발음 구별 기호의 간격 형태와 더 많은 문맥상 문자 형태를 인코딩한다.