아랍 문자 (유니코드 영역)

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

아랍 문자(유니코드 영역)는 히브리 문자처럼 오른쪽에서 왼쪽으로 가로쓰기하며, 단어 내 위치에 따라 글자 모양이 변하는 특징을 가진다. 유니코드에서는 U+0600부터 U+06FF 영역에 아랍 문자를 위한 다양한 문자와 기호를 포함하며, 아랍어 외에도 페르시아어, 우르두어 등 여러 언어 표기에 사용된다. 아랍 문자는 숫자, 구두점, 시 기호, 경칭 기호, 코란 주석 기호, 확장 아랍 기호 등을 포함하며, 유니코드 버전별로 문자가 추가되고 속성이 변경되어 왔다.

아랍 문자 (유니코드 영역)
유니코드 블록 정보
블록 이름아랍 문자
범위 시작0600
범위 끝06FF
스크립트아랍 문자 (238자)
공통 (6자)
상속 (12자)
알파벳아랍어
쿠르드어
파슈토어
페르시아어
우르두어
신디어
페르시아 문자
우르두 문자
파슈토 문자
쿠르드 문자
위구르어
오스만어
남아제르바이잔어
신드어
발루치어
서펀자브어
카슈미르어
말레이어
출처ISO 8859-6
더 이상 사용되지 않음1
유니코드 버전 1.0.0169
유니코드 버전 1.125
유니코드 버전 3.012
유니코드 버전 3.22
유니코드 버전 4.019
유니코드 버전 4.18
유니코드 버전 5.115
유니코드 버전 6.02
유니코드 버전 6.11
유니코드 버전 6.31
유니코드 버전 7.01
유니코드 버전 14.01
코드 차트유니코드 문자 코드 차트 (PDF)
참고유니코드 문자 데이터베이스
유니코드 표준 버전
📚 더 읽어볼만한 페이지
  • 유니코드 영역 - 딩뱃
    딩뱃은 장식 문자, 강조 표시, 비텍스트 상징을 포함하는 문자 집합으로, 유니코드 표준의 딩뱃 블록과 장식 딩뱃 블록을 통해 코드 포인트를 제공하며, 장식적 요소 외에도 정치적, 사회적 의미를 담을 수 있다.
  • 유니코드 영역 - 한중일 호환용 한자
    한중일 호환용 한자는 유니코드에서 기존 문자 코드와의 호환성을 위해 추가된 한자 블록으로, 다양한 문자 집합의 한자들이 추가되면서 중복 및 정의 오류, CJK 통합 한자와의 호환 문제 등 기술적 고려 사항이 존재한다.

2. 역사

아랍 문자는 히브리 문자 등과 마찬가지로 오른쪽에서 왼쪽으로 가로쓰기되며 (오른쪽 가로쓰기), 일부 예외가 되는 문자를 제외하고는 라틴 문자의 필기체처럼 같은 단어의 문자끼리 연결되어 쓰인다. 또한, 각 문자는 단어 내의 위치에 따라 독립형, 어두형, 어중형, 어말형의 4가지 형태를 가지지만, 이 블록 내에서는 단어 내 위치에 따른 글자 모양 차이는 부호 위치상 통일되어 있으며, 폰트 내에서 그 동작을 제어하는 사양으로 되어 있다. 단, 일부 문자에서는 아랍 문자 표시형 A 및 아랍 문자 표시형 B 블록에 단어 내 위치에 따른 글자 모양 차이의 부호 위치가 분리되어 수록되어 있다.

아랍 문자는 음소 문자 중, 자음만을 기록하는 압자드이며, "압자드"라는 명칭도 아랍 문자의 고전적인 배열 순서 (아브자드 순)의 첫 4글자 (알리프, , , )에서 유래했다. 일반적인 문서에서는 모음을 기록하지 않지만, 이슬람교의 성전인 코란 (쿠란)과 초심자 및 초등 교육용 교재 등 올바른 단어의 발음을 명시해야 하는 문서에서는 샤클이라고 불리는 모음 기호가 사용되므로, 이 기호들도 이 블록에 수록되어 있다.

중동북아프리카 지역에 널리 퍼져 있는 아랍권에서 널리 사용되는 이슬람교의 성전 언어인 아랍어 외에도, 이란공용어페르시아어, 파키스탄의 공용어인 우르두어, 아프가니스탄의 공용어인 파슈토어, 중화인민공화국·신장 위구르 자치구에 거주하는 튀르크계 소수 민족인 위구르인이 사용하는 위구르어, 이라크·이란·터키 등의 쿠르디스탄 지역에 거주하는 쿠르드족이 사용하는 쿠르드어 (특히 소라니 방언) 등, 무슬림이 많이 거주하는 이슬람권에서 사용되는 다른 언어의 표기에도 사용되는 아랍 문자를 수록하고 있다.

현재는 아랍 문자로의 표기가 일반적이지 않지만, 과거에는 정서법이 아랍 문자였던 터키어, 아제르바이잔어 (단, 이란 등에 거주하는 아제르바이잔인이 사용하는 남아제르바이잔어에서는 현재도 아랍 문자를 사용), 말레이어, 카자흐어 등을 위한 문자, 현재는 사어가 된 오스만어, 고전 아랍어 등을 위한 문자도 이 블록에 포함되어 있다.

또한, 아랍 문자에서 파생된, 페르시아어를 표기하기 위한 페르시아 문자와, 우르두어 표기에 사용되는 우르두 문자, 펀자브어 및 라운다어 등의 표기에 사용되는 샴키 문자, 과거 말레이어 표기에 사용되었던 자위 문자 (단, 태국에 거주하는 말레이계 민족이 사용하는 자위어에서는 현재도 사용되며, 말레이시아에서도 간판 등의 지명 표기에는 현재도 사용되고 있다), 인도네시아에서 과거 자바어 및 순다어, 마두라어 등의 표기에 사용되었던 , 나이지리아니제르 등에서 사용되는 하우사어 및, 부르키나파소말리에서 사용되는 풀라어 표기에 사용되는 , 과거 마다가스카르어 표기에 사용되었던 등은 문헌에 따라 다른 문자 체계로 취급되는 경우가 있지만, 유니코드상에서는 아랍 문자의 변종으로 취급되어 같은 문자 체계로 취급되고 있다. 또한, 우르두어와 카슈미르어 표기에 사용되는 아랍 문자는 나스타알리크체라고 불리는 일반적인 아랍 문자와는 크게 글자 모양이 다른 서체가 사용되고 있지만, 이 역시 유니코드상에서는 아랍 문자와 같은 표기 체계로 취급되므로, 이 문자들도 이 블록에 포함되어 있다.

유니코드 버전 1.0에서도 "아랍 문자(Arabic)"라는 블록명으로 제정되었다.

2.1. 고대

아랍 문자는 히브리 문자 영역 내 특정 문자의 정의에 있어, 목적과 과정을 기록한 유니코드 관련 문서의 내역은 다음과 같다.

👆
좌우로 밀어서 보기
버전최종 코드 영역문자수L2 IDWG2 ID문서
1.0.0U+060C, 061B, 061F, 0621..063A, 0640..0652, 0660..066C, 0670..06B7, 06BA..06BE, 06C0..06CE, 06D0..06D5, 06F0..06F9169(to be determined)
1.1U+066D, 06D6..06ED25(to be determined)
3.0U+0653..06553
3.0U+06B8..06B9, 06BF, 06CF, 06FA..06FE9N1573
3.2U+066E..066F2
4.0U+0600..0602, 060D..060E, 0610..0614, 0656..065813
4.0U+0603, 060F, 06153
4.0U+06EE..06EF, 06FF3
4.1U+060B1N2523
4.1U+061E, 065A..065C4
4.1U+06591N2581R2
4.1U+065D..065E2N2723
5.1U+0606..060A5N3086-1
5.1U+0616, 063B..063F6N3180R
5.1U+0617..061A4N3185R
6.0U+0620, 065F2N3686-I
6.1U+06041N3734
6.3U+061C1N4180
7.0U+06051N3990
14.0U+061D1

2.2. 중세

중세 시대 아랍 문자는 유니코드에서 특정 문자를 정의하는 과정과 목적을 기록한 여러 문서를 통해 그 발전 양상을 확인할 수 있다. 1.0.0 버전부터 여러 차례의 회의와 논의를 거쳐 다양한 아랍 문자들이 추가되고 개선되었다.

초기에는 아랍어의 기본적인 문자 형태와 숫자 구분 기호, 필기체 연결 등에 대한 논의가 이루어졌다. 이후 위구르어, 페르시아어, 아제르바이잔어 등 다양한 언어에서 사용되는 아랍 문자들을 추가하고, వాటి의 형태와 관련된 기술적인 문제들을 해결하기 위한 논의가 진행되었다.

특히, 2009년에는 U+0673(ARABIC LETTER ALEF WITH WAVY HAMZA BELOW) 문자의 사용 중단(Deprecate) 결정이 내려졌으며, 2010년에는 아랍 문자 Yeh Barree (U+06D2)의 연결 동작 문제와 관련된 논의가 있었다. 또한, 차가타이어, 위구르어, 카자흐어, 키르기스어 등 중앙아시아 지역 언어에서 사용되는 특수 문자들에 대한 추가 및 개선 작업도 이루어졌다.

이러한 과정을 통해 아랍 문자는 다양한 언어와 문화를 포괄하는 문자로 발전하였으며, 유니코드는 이러한 변화를 반영하여 아랍 문자의 표준을 정립하는 데 기여했다.

2.3. 현대

현대 아랍 문자는 유니코드 표준에서 여러 차례 변화를 겪었다. 초기 버전 1.0.0에서는 169개의 문자가 정의되었으며, 이후 여러 버전에서 문자가 추가되거나 속성이 변경되었다.

* 1.0.0 버전: U+060C, U+061B, U+061F, U+0621..063A, U+0640..0652, U+0660..066C, U+0670..06B7, U+06BA..06BE, U+06C0..06CE, U+06D0..06D5, U+06F0..06F9 등 169개 문자가 초기 정의되었다.
- 2000년 8월, UTC 회의 #83 의사록에서 아랍어 숫자 구분 기호에 대한 논의가 있었다.
- 2001년 6월, UTC/L2 회의 의사록에서 아랍어 필기체 연결에 대한 논의가 있었다.
- 2001년 11월, UTC/L2 회의 #88 의사록에서 U+06D5의 연결 동작 속성에 대한 논의가 있었다.
- 2009년, U+0673 (ARABIC LETTER ALEF WITH WAVY HAMZA BELOW) 문자가 폐지되었다.
* 1.1 버전: U+066D, U+06D6..06ED 등 25개 문자가 추가되었다.
- 2001년 11월, U+06DD (ARABIC END OF AYAH) 및 기타 아랍어 묶음 표시에 대한 설명 요청이 있었다.
- 2005년, U+06DF, U+06E0, U+06E1에 대한 대표 글리프 변경이 있었다.
- 2010년, U+06DE의 속성이 결합 표시에서 간격 기호로 변경되었다.
* 3.0 버전: U+0653..0655 등 3개 문자와, U+06B8..06B9, 06BF, 06CF, 06FA..06FE 등 9개 문자가 추가되었다.
* 3.2 버전: U+066E..066F 등 2개 문자가 추가되었다.
* 4.0 버전: U+0600..0602, U+060D..060E, U+0610..0614, U+0656..0658 등 13개 문자와, U+0603, U+060F, U+0615 등 3개 문자, U+06EE..06EF, U+06FF 등 3개 문자가 추가되었다.
* 4.1 버전: U+060B 등 1개 문자와, U+061E, 065A..065C 등 4개 문자, U+0659 등 1개 문자, U+065D..065E 등 2개 문자가 추가되었다.
* 5.1 버전: U+0606..060A 등 5개 문자와, U+0616, 063B..063F 등 6개 문자, U+0617..061A 등 4개 문자가 추가되었다.
* 6.0 버전: U+0620, 065F 등 2개 문자가 추가되었다.
* 6.1 버전: U+0604 등 1개 문자가 추가되었다.
* 6.3 버전: U+061C 등 1개 문자가 추가되었다.
* 7.0 버전: U+0605 등 1개 문자가 추가되었다.
* 14.0 버전: U+061D 등 1개 문자가 추가되었다.

이러한 변화 과정에서 아랍 문자의 형태, 속성, 글리프 등이 지속적으로 개선되었으며, 다양한 언어 및 지역의 요구 사항을 반영하여 문자가 추가되었다. 특히, 위구르어, 카자흐어, 키르기스어, 차가타이어 등 중앙아시아 지역 언어를 위한 문자들이 추가되었고, 꾸란 표기를 위한 특수 문자 및 기호도 추가되었다.

3. 収録文字(수록 문자)

wikitext
{| class="wikitable"
|-
! 코드 || 문자 || 문자명 (영어) || 용례·설명 || 라틴 문자 전사
|-
| colspan="5" style="text-align:center;" | 베이스라인 하단 마커
|-
| U+0600 || ؀ || ARABIC NUMBER SIGN || 아랍 문자의 번호 기호. 라틴 문자 등의 "#"에 해당한다. 아랍·인도 숫자로 쓰인 숫자 아래에 쓰인다. ||
|-
| U+0601 || ؁ || ARABIC SIGN SANAH || 아랍 문자에서 연호를 나타내는 숫자 아래에 쓰이는 기호. U+0604와 달리 주로 그레고리력이나 이슬람력 (히즈라력)에서 사용되며, 그레고리력의 경우 연호와 이 기호 뒤에 "기독교의"를 의미하는 아랍어 عيسوي ʿīsawī의 약자인 문자 ain(U+0639 ع)의 어두 형식을, 이슬람력의 경우 무함마드의 성천 (히즈라)를 나타내는 아랍어 هجري hijrī의 약자인 문자 heh doachashmee(U+06BE ھ)를 적는다. ||
|-
| U+0602 || ؂ || ARABIC FOOTNOTE MARKER || 아랍 문자의 각주를 나타낼 때 사용되는 기호로, 주석이 필요한 위치에 각주 번호를 나타내는 아랍·인도 숫자 아래에 쓰이며, 페이지 하단 등에 다시 같은 숫자와 이 기호의 조합이 사용되어 주석 정보가 적힌다. 라틴 문자 등에서의 별표(*)나 단검 기호(†)와 같은 기능을 한다. ||
|-
| U+0603 || ؃ || ARABIC SIGN SAFHA || ||
|-
| U+0604 || ؄ || ARABIC SIGN SAMVAT || 우르두어에서 비크라마력의 연호를 쓰기 위해 사용하는 기호. 연호를 나타내는 아랍·인도 숫자 아래에 쓰이며, 쓰인 숫자가 비크라마력에 따른 연도 표기임을 나타낸다. ||
|-
| colspan="5" style="text-align:center;" | 베이스라인 상단 마커
|-
| U+0605 || ؅ || ARABIC NUMBER MARK ABOVE || 에서 사용되는 경우가 있다. ||
|-
| colspan="5" style="text-align:center;" | 근호
|-
| U+0606 || ؆ || ARABIC-INDIC CUBE ROOT || 아랍 문자의 3제곱근 (세제곱근)의 수학 기호. ||
|-
| U+0607 || ؇ || ARABIC-INDIC FOURTH ROOT || 아랍 문자의 4제곱근 (이중 제곱수)의 수학 기호. ||
|-
| colspan="5" style="text-align:center;" | 문자 형태 기호
|-
| U+0608 || ؈ || ARABIC RAY || 아랍 문자의 수학 기호로 "직선"을 나타낸다. ||
|-
| colspan="5" style="text-align:center;" | 약물
|-
| U+0609 || ؉ || ARABIC-INDIC PER MILLE SIGN || 아랍 문자의 천분율 (퍼밀) 기호. ||
|-
| U+060A || ؊ || ARABIC-INDIC PER TEN THOUSAND SIGN || 아랍 문자의 만분율 기호. ||
|-
| colspan="5" style="text-align:center;" | 통화 기호
|-
| U+060B || ؋ || AFGHANI SIGN || 아프가니스탄의 공정 통화인 아프가니의 통화 기호. ||
|-
| colspan="5" style="text-align:center;" | 약물
|-
| U+060C || ، || ARABIC COMMA || 아랍 문자의 쉼표(콤마). 현대 문장에서는 타나 문자시리아 문자에서도 사용된다. ||
|-
| U+060D || ؍ || ARABIC DATE SEPARATOR || 아랍 문자에서 날짜와 달 이름 사이의 구분에 사용되는 기호. ||
|-
| colspan="5" style="text-align:center;" | 시 기호
|-
| U+060E || ؎ || ARABIC POETIC VERSE SIGN || 시에서 비율로 사용되는 기호. 행의 시작 부분에 쓰인다. ||
|-
| U+060F || ؏ || ARABIC SIGN MISRA || ||
|-
| colspan="5" style="text-align:center;" | 존칭 기호
|-
| U+0610 || ؐ || ARABIC SIGN SALLALLAHOU ALAYHE WASSALLAM || 이슬람교에서 종교적으로 중요한 성인이나 위인의 이름 위에 존경을 표하기 위해 쓰이는 기도문. "그에게 신의 평화와 축복이 있기를"을 의미하는 아랍어 "sallallahu alayhe wasallam"을 나타낸다. ||
|-
| U+0611 || ؑ || ARABIC SIGN ALAYHE ASSALLAM || 이슬람교에서 종교적으로 중요한 성인이나 위인의 이름 위에 존경을 표하기 위해 쓰이는 기도문. "그에게 평화가 있기를"을 의미하는 아랍어 "alayhe assalam"을 나타낸다. ||
|-
| U+0612 || ؒ || ARABIC SIGN RAHMATULLAH ALAYHE || 이슬람교에서 종교적으로 중요한 성인이나 위인의 이름 위에 존경을 표하기 위해 쓰이는 기도문. "신이 그에게 자비를 베풀기를"을 의미하는 아랍어 "rahmatullah alayhe"를 나타낸다. ||
|-
| U+0613 || ؓ || ARABIC SIGN RADI ALLAHOU ANHU || 이슬람교에서 종교적으로 중요한 성인이나 위인의 이름 위에 존경을 표하기 위해 쓰이는 기도문. "신이 그를 기뻐하시기를"을 의미하는 아랍어 "radi allahu ’anhu"를 나타낸다. ||
|-
| U+0614 || ؔ || ARABIC SIGN TAKHALLUS || 시인의 이름이나 이름 위에 놓이는 기호, 또는 일부 문장에서 모든 고유명사를 표시하는 데 사용되는 기호. ||
|-
| colspan="5" style="text-align:center;" | 꾸란의 주석 기호
|-
| U+0615 || ؕ || ARABIC SMALL HIGH TAH || 이란파키스탄에서 출판되는 일부 꾸란에서 읽는 중에 멈춰야 할 위치를 나타내는 기호. U+0679 ٹ 등의 일부 문자의 발음 기호로 사용되는 작은 TAH 기호와 혼동하지 않도록 한다. ||
|-
| colspan="5" style="text-align:center;" | 확장 아랍 기호
|-
| U+0616 || ؖ || ARABIC SMALL HIGH LIGATURE ALEF WITH LAM WITH YEH || ARABIC SMALL HIGH LIGATURE ALEF WITH YEH BARREE라고도 부른다. 초기 페르시아어 (10~16세기) ||
|-
| colspan="5" style="text-align:center;" | 꾸란의 주석 기호
|-
| U+0617 || ؗ || ARABIC SMALL HIGH ZAIN || 이란의 꾸란에서 사용되는 기호로, 본문에서 나타나는 부분에서 일시 정지해도 좋지만, 멈추지 않고 경전을 읽는 것이 권장됨을 나타내기 위해 사용된다. 아랍권의 꾸란에서 U+06D6 ۖ과 같은 역할을 한다. ||
|-
| U+0618 || ؘ || ARABIC SMALL FATHA || 064E َ FATHA와 혼동하지 않도록 한다. 이러한 일반적인 것보다 작은 샤클은 꾸란에서 사용되며, 절의 머리 글자인 알리프(U+0627 ا)에 부가된다. 이전 절에서 휴지를 거치지 않고 경전을 읽는 경우 알리프가 나타내는 자음[ʔ]을 발음하지 않고 이전 절의 마지막 자음에 작은 샤클이 나타내는 모음을 부가하여 읽는 것을 나타낸다. ||
|-
| U+0619 || ؙ || ARABIC SMALL DAMMA || 064F ُ DAMMA와 혼동하지 않도록 한다. 이러한 일반적인 것보다 작은 샤클은 꾸란에서 사용되며, 절의 머리 글자인 알리프(U+0627 ا)에 부가된다. 이전 절에서 휴지를 거치지 않고 경전을 읽는 경우 알리프가 나타내는 자음[ʔ]을 발음하지 않고 이전 절의 마지막 자음에 작은 샤클이 나타내는 모음을 부가하여 읽는 것을 나타낸다. ||
|-
| U+061A || ؚ || ARABIC SMALL KASRA || 0650 ِ KASRA와 혼동하지 않도록 한다. 이러한 일반적인 것보다 작은 샤클은 꾸란에서 사용되며, 절의 머리 글자인 알리프(U+0627 ا)에 부가된다. 이전 절에서 휴지를 거치지 않고 경전을 읽는 경우 알리프가 나타내는 자음[ʔ]을 발음하지 않고 이전 절의 마지막 자음에 작은 샤클이 나타내는 모음을 부가하여 읽는 것을 나타낸다. ||
|-
| colspan="5" style="text-align:center;" | 약물
|-
| U+061B || ؛ || ARABIC SEMICOLON || 아랍 문자의 세미콜론. 현대 문장에서는 타나 문자시리아 문자에서도 사용된다. ||
|-
| colspan="5" style="text-align:center;" | 제어 문자
|-
| U+061C || ؜ || ARABIC LETTER MARK || 라틴 문자 등의 왼쪽 가로쓰기 문자와 아랍 문자가 혼재되어 있는 양방향 텍스트에서 바로 앞 문자가 아랍 문자임을 나타낼 때 사용되는 제어 문자. 구체적인 글리프나 문자 폭을 갖지 않는다. 주로 번호가 매겨진 목록이나 수식, 날짜와 함께 사용되며, 숫자 바로 앞에 이 문자를 배치하여 산술 숫자를 자동으로 아랍·인도 숫자로 변환하고 숫자의 위치가 오른쪽으로 정렬되도록 조정할 의도이다. 일반적으로 ALM으로 약칭된다. ||
|-
| colspan="5" style="text-align:center;" | 약물
|-
| U+061D || ؝ || ARABIC END OF TEXT MARK || 마지막 문장의 끝에 일반적인 마침표 대신 붙는 약물. ||
|-
| U+061E || ؞ || ARABIC TRIPLE DOT PUNCTUATION MARK || 하우사어, 월로프어, 풀라어, 만딩카어 등 아프리카 언어의 옛 정서법에서 구두점 (마침표)으로 사용되던 기호. 현재는 사용되지 않는다. ||
|-
| U+061F || ؟ || ARABIC QUESTION MARK || 아랍 문자의 물음표. 현대 문장에서는 타나 문자시리아 문자에서도 사용된다. ||
|-
| colspan="5" style="text-align:center;" | 카슈미르어용 추가 문자
|-
| U+0620 || ؠ || ARABIC LETTER KASHMIRI YEH || 카슈미르어 바로 앞의 자음이 구개음화 (IPA:[-ʲ])임을 나타낸다. ||
|-
| colspan="5" style="text-align:center;" | ISO 8859-6에 기반한 문자
|-
| U+0621 || ء || ARABIC LETTER HAMZA || 함자. 자음[ʔ]를 나타낸다. 아랍어 || ˌ
|-
| U+0622 || آ || ARABIC LETTER ALEF WITH MADDA ABOVE || 마흐다가 붙은 알리프. [ʔaː]라는 발음을 나타낸다. 아랍어 ||
|-
| U+0623 || أ || ARABIC LETTER ALEF WITH HAMZA ABOVE || 함자가 위에 붙은 알리프. [ʔa] 또는 [ʔu]라는 발음을 나타낸다. 카자흐어, 투르크멘어 (~1929)에서는 모음[æ]를 나타낸다. || ˈ
|-
| U+0624 || ﺅ || ARABIC LETTER WAW WITH HAMZA ABOVE || 함자가 붙은 와우. [ʔu]라는 발음을 나타낸다. 파슈토어에서는 모음[o]、발루치어에서는 이중 장모음[ɑuː], 아제르바이잔어 (남아제르바이잔어), 투르크멘어 (이란, 아프가니스탄)에서는 모음[ø]를 나타낸다. ||
|-
| U+0625 || ﺇ || ARABIC LETTER ALEF WITH HAMZA BELOW || 함자가 아래에 붙은 알리프. [ʔi]라는 발음을 나타낸다. || ʾ
|-
| U+0626 || ﺉ || ARABIC LETTER YEH WITH HAMZA ABOVE || 함자가 붙은 야. [ʔi]라는 발음을 나타낸다. 파슈토어에서는 이중 모음[aɪ]를, 에서는 이중 모음[əɪ]를, 발루치어, 아제르바이잔어 (남아제르바이잔어), 타타르어 (1920~1927)에서는 모음[ɛ]를 나타낸다. 일반적으로 함자는 왼쪽 위에 쓰이지만, 키르기스어에서는 함자는 독립형과 어말형에서 일관되게 오른쪽 위에 놓인다. ||
|-
| U+0627 || ا || ARABIC LETTER ALEF || 알리프. 자음[ʔ]를 나타낸다. 위구르어, 제르바이잔어 (남아제르바이잔어)에서는 모음[a]를 나타낸다. || ʾ
|-
| U+0628 || ب || ARABIC LETTER BEH || 바. 자음[b]를 나타낸다. || b
|-
| U+0629 || ة || ARABIC LETTER TEH MARBUTA || 타 마르부타. 반드시 어말에만 나타나며, 여성 명사 어미인 [-at]를 나타낸다. 아랍어에서만 사용된다. || ẗ
|-
| U+062A || ﺕ || ARABIC LETTER TEH || 타. 자음[t]를 나타낸다. || t
|-
| U+062B || ﺙ || ARABIC LETTER THEH || 사. 자음[θ]를 나타낸다. || ṯ
|-
| U+062C || ج || ARABIC LETTER JEEM || . 자음[d͡ʒ]를 나타낸다. || ǧ
|-
| U+062D || ﺡ || ARABIC LETTER HAH || 하. 자음[ħ]를 나타낸다. || ḥ
|-
| U+062E || ﺥ || ARABIC LETTER KHAH || 하. 자음[x]를 나타낸다. || ẖ
|-
| U+062F || د || ARABIC LETTER DAL || 달. 자음[d]를 나타낸다. || d
|-
| U+0630 || ذ || ARABIC LETTER THAL || 잘. 자음[ð]를 나타낸다. || ḏ
|-
| U+0631 || ر || ARABIC LETTER REH || 라. 자음[r]를 나타낸다. 쿠르드어 (소라니 방언)에서는 자음[ɾ]을 나타낸다. || r
|-
| U+0632 || ز || ARABIC LETTER ZAIN || 자인. 자음[z]를 나타낸다. || z
|-
| U+0633 || س || ARABIC LETTER SEEN || 신. 자음[s]을 나타낸다. || s
|-
| U+0634 || ﺵ || ARABIC LETTER SHEEN || 신. 자음[ʃ]을 나타낸다. || š
|-
| U+0635 || ص || ARABIC LETTER SAD || 사드. 자음[sˤ]를 나타낸다. 인두음화된 [s]. || ṣ
|-
| U+0636 || ض || ARABIC LETTER DAD || 다드. 자음[dˤ]를 나타낸다. 인두음화된 [d]. 인두음화된 자음은 아랍어 이외의 언어에서는 드물며, 발음의 어려움 때문에 속어로 아랍어를 모국어로 하는 아랍인을 "다드의 민족"이라고 부르는 경우가 있다. || ḍ
|-
| U+0637 || ط || ARABIC LETTER TAH || 타. 자음[tˤ]를 나타낸다. 인두음화된 [t]. || ṭ
|-
| U+0638 || ﻅ || ARABIC LETTER ZAH || 자. 자음[ðˤ]를 나타낸다. 인두음화된 [ð]. || ẓ
|-
| U+0639 || ع || ARABIC LETTER AIN || 아인. 자음[ʕ]를 나타낸다. || ʿ
|-
| U+063A || غ || ARABIC LETTER GHAIN || 가인. 자음[ɣ]를 나타낸다. || ġ
|-
| colspan="5" style="text-align:center;" | 초기 페르시아어 및 아제르바이잔어용 추가 문자
|-
| U+063B || ػ || ARABIC LETTER KEHEH WITH TWO DOTS ABOVE || 초기 페르시아어 (10~16세기) 자음[ɡ] 또는 그 이음인 [ŋ]을 나타냈지만, 나중에 U+06AF گ, U+06AB ګ, U+06AD ڭ으로 대체되어 사용되지 않았다. ||
|-
| U+063C || ؼ || ARABIC LETTER KEHEH WITH THREE DOTS BELOW || 초기 페르시아어 (10~16세기) 자음[ɡ] 또는 그 이음인 [ŋ]을 나타냈지만, 나중에 U+06AF گ, U+06AB ګ, U+06AD ڭ으로 대체되어 사용되지 않았다. ||
|-
| U+063D || ؽ || ARABIC LETTER FARSI YEH WITH INVERTED V || 아제르바이잔어 (1992~) 자음[j] 또는 모음[ɯ]를 나타내는 데 사용되었다. ||
|-
| U+063E || ؾ || ARABIC LETTER FARSI YEH WITH TWO DOTS ABOVE || 초기 페르시아어 (10~16세기) 장모음[iː]를 나타낸다. 다른 어원에 의한 문법상의 차이와 강세의 유무를 명시하기 위해 사용되었다. ||
|-
| U+063F || ؿ || ARABIC LETTER FARSI YEH WITH THREE DOTS ABOVE || 초기 페르시아어 (10~16세기) 장모음[iː]를 나타낸다. 다른 어원에 의한 문법상의 차이와 강세의 유무를 명시하기 위해 사용되었다. ||
|-
| colspan="5" style="text-align:center;" | ISO 8859-6에 기반한 문자
|-
| U+0640 || ـ || ARABIC TATWEEL || 타트위르 또는 카시다 (kashida). 강조 및 할당 조정 등의 목적으로 문자를 늘리거나, 문법책 등에서 기본이 되는 문자 없이 단독 모음 기호 등을 표기하거나, 문자의 위치에 따른 자형 변화를 나타내기 위해 사용된다. 아람 문자, 하니피 로힝야 문자, 만다 문자, 마니 문자, 시편 파흘라비 문자, 소그드 문자, 시리아 문자에서도 사용된다. ||
|-
| U+0641 || ﻑ || ARABIC LETTER FEH || 파. 자음[f]를 나타낸다. || f
|-
| U+0642 || ﻕ || ARABIC LETTER QAF || 카프. 자음[q]를 나타낸다. || q
|-
| U+0643 || ك || ARABIC LETTER KAF || 카프. 자음[k]를 나타낸다. || k
|-
| U+0644 || ل || ARABIC LETTER LAM || 람. 자음[l]을 나타낸다. || l
|-
| U+0645 || م || ARABIC LETTER MEEM || 밈. 자음[m]을 나타낸다. 신드어에서는 짧은 꼬리를 가진 모양으로 쓰인다. || m
|-
| U+0646 || ن || ARABIC LETTER NOON || 눈. 자음[n]을 나타낸다. || n
|-
| U+0647 || ه || ARABIC LETTER HEH || 하. 자음[h]를 나타낸다. || h
|-
| U+0648 || ﻭ || ARABIC LETTER WAW || 와우. 자음[w]를 나타낸다. 단, 페르시아어 및 타지크어 등 페르시아 문자를 차용한 일부 언어에서는 [v]를 나타낸다. 아랍어에서는 이 문자 단독으로 wa라고 읽으며, "~와 (AND)"를 나타낸다. 카슈미르어에서는 장모음[oː]를, 키르기스어, 다르기와어 (1920~1928)에서는 모음[o]를, 카라칼파크어 (~1932)에서는 모음[o] 또는 모음[ø]를 나타낸다. || w
|-
| U+0649 || ﻯ || ARABIC LETTER ALEF MAKSURA || 아랍어에서는 알리프의 변종 중 하나이며, 정관사가 붙어 장모음[aː]에서 단모음[a]로 변화했음을 나타내는 알리프 막수라로 사용된다. 현재는 발음되지 않지만, 원래는 어미에 [-j]를 동반했던 것에서 유래한다. 위구르어 등에서는 모음을 나타내기 위해, 어떤 위치에 쓰이든 아래에 점이 없는 야와 같은 형태의 문자로 사용된다. 자음[j]에 대해서는 일반적인 자모 ya (U+064A ﻱ)를 사용한다. 위구르어, 보스니아어 (15세기~19세기), 다르기와어 (1920~1928)에서는 모음[i]를, 키르기스어, 카라칼파크어 (~1932), 투르크멘어 (~1929)에서는 모음[i] 또는 [ɯ]를, 카자흐어에서는 모음[ə]를 나타낸다. 이 문자와는 별도로 DOTLESS YEH라고 명명된 문자가 있지만, 이는 페르시아어 등에서 사용되는 야의 변종 중 하나로, 단어 내 쓰이는 위치에 따라 점이 붙거나 붙지 않으므로, 동작의 차이로부터 부호 위치가 구분되어 있다. U+0654 ٔ 와 조합하여 사용하는 것은 의도되지 않았다. || ỳ
|-
| U+064A || ﻱ || ARABIC LETTER YEH || 야. 자음[j]를 나타낸다. U+0654 ٔ 와 조합하여 사용하면 하단의 점이 사라진다. 한편, 그 외의 결합 기호와 조합하여 사용해도 하단의 점은 사라지지 않는다. || y
|-
| colspan="5" style="text-align:center;" | ISO 8859-6 준거 모음 기호
|-
| U+064B || ً || ARABIC FATHATAN || 파타탄. 모음 [-an]을 나타내는 모음 기호 (샤클). ||
|-
| U+064C || ٌ || ARABIC DAMMATAN || 담마탄. 모음 [-un]을 나타내는 모음 기호 (샤클). 이형 문자로 한쪽이 180도 회전한 두 개의 얽힌 담마로 쓰이는 경우도 있다. ||
|-
| U+064D || ٍ || ARABIC KASRATAN || 카스라탄. 모음 [-in]을 나타내는 모음 기호 (샤클). ||
|-
| U+064E || َ || ARABIC FATHA || 파타. 모음 [-a]를 나타내는 모음 기호 (샤클). ||
|-
| U+064F || ُ || ARABIC DAMMA || 담마. 모음 [-u]를 나타내는 모음 기호 (샤클). ||
|-
| U+0650 || ِ || ARABIC KASRA || 카스라. 모음 [-i]를 나타내는 모음 기호 (샤클). ||
|-
| U+0651 || ّ || ARABIC SHADDA || 샤다. 자음자를 중자음으로 읽는 것을 나타내는 기호 (샤클). 한국어의 "ㅆ"에 해당한다. 마다가스카르어 (구 정서법)에서는 자음의 비음화를 나타낸다. ||
|-
| U+0652 || ْ || ARABIC SUKUN || 수쿤. 무모음이며, 자음만 발음함을 나타내는 기호 (샤클). 일부 꾸란에서는 장모음이 무시되었음을 나타내기 위해 사용된다. 일반적으로 작은 원으로 쓰이지만, 꾸란에서는 이형 문자인 U+06E1 ۡ과 같은 형태로 쓰이는 경우도 있다. 아제르바이잔어 (남아제르바이잔어), 투르크멘어 (이란, 아프가니스탄)에서는 자모 waw(U+0648 ﻭ)와 함께 사용되어 모음[o]를 나타낸다. ||
|-
| colspan="5" style="text-align:center;" | 결합용 마흐다 및 함자
|-
| U+0653 || ٓ || ARABIC MADDAH ABOVE || 마흐다. [aː]라는 장모음을 나타낸다. U+0622 참조. ||
|-
| U+0654 || ٔ || ARABIC HAMZA ABOVE || ||
|-
| U+0655 || ٕ || ARABIC HAMZA BELOW || ||
|-
| U+0656 || ٖ || ARABIC SUBSCRIPT ALEF || ||
|-
| U+0657 || ٗ || ARABIC INVERTED DAMMA || ||
|-
| U+0658 || ٘ || ARABIC MARK NOON GHUNNA || ||
|-
| U+0659 || ٙ || ARABIC ZWARAKAY || ||
|-
| U+065A || ٚ || ARABIC VOWEL SIGN SMALL V ABOVE || ||
|-
| U+065B || ٛ || ARABIC VOWEL SIGN INVERTED SMALL V ABOVE || ||
|-
| U+065C || ٜ || ARABIC VOWEL SIGN DOT BELOW || ||
|-
| U+065D || ٝ || ARABIC REVERSED DAMMA || ||
|-
| U+065E

3.1. 베이스라인 하단 마커

베이스라인 하단 마커는 아랍 문자에서 문자열 아래에 쓰이는 기호류를 가리킨다. 문자열 길이에 맞춰 기호 길이를 늘려 렌더링하는 것이 바람직하다.

👆
좌우로 밀어서 보기
| 문자 || 설명
U+0655아랍 햄자 아래/ٕ아랍어ARABIC HAMZA BELOW
U+0656아랍 아래첨자 알레프/ٖ아랍어ARABIC SUBSCRIPT ALEF
U+065C아랍 모음 기호 아래 점/ٜ아랍어ARABIC VOWEL SIGN DOT BELOW
U+065F아랍 물결 햄자 아래/ٟ아랍어ARABIC WAVY HAMZA BELOW
U+06E3아랍 낮은 신/ۣ아랍어ARABIC SMALL LOW SEEN
U+06ED아랍 낮은 밈/ۭ아랍어ARABIC SMALL LOW MEEM

3.2. 베이스라인 상단 마커

아랍 문자는 문자열 상단에 다양한 기호를 작성한다. 이 기호들은 문자열 길이에 맞춰 길이를 늘려 렌더링하는 것이 바람직하다.

👆
좌우로 밀어서 보기
| 문자 || 이름
U+0600ARABIC NUMBER SIGN
U+0601ARABIC SIGN SANAH
U+0602ARABIC FOOTNOTE MARKER
U+0603ARABIC SIGN SAFHA
U+0604ARABIC SIGN SAMVAT
U+0605ARABIC NUMBER MARK ABOVE
U+0610ؐARABIC SIGN SALLALLAHOU ALAYHE WASSALLAM
U+0611ؑARABIC SIGN ALAYHE ASSALLAM
U+0612ؒARABIC SIGN RAHMATULLAH ALAYHE
U+0613ؓARABIC SIGN RADI ALLAHOU ANHU
U+0614ؔARABIC SIGN TAKHALLUS
U+0615ؕARABIC SMALL HIGH TAH
U+0616ؖARABIC SMALL HIGH LIGATURE ALEF WITH LAM WITH YEH
U+0617ؗARABIC SMALL HIGH ZAIN
U+0618ؘARABIC SMALL FATHA
U+0619ؙARABIC SMALL DAMMA
U+061AؚARABIC SMALL KASRA
U+0653ٓARABIC MADDAH ABOVE
U+0654ٔARABIC HAMZA ABOVE
U+0655ٕARABIC HAMZA BELOW
U+0670ٰARABIC LETTER SUPERSCRIPT ALEF
U+06D6ۖARABIC SMALL HIGH LIGATURE SAD WITH LAM WITH ALEF MAKSURA
U+06D7ۗARABIC SMALL HIGH LIGATURE QAF WITH LAM WITH ALEF MAKSURA
U+06D8ۘARABIC SMALL HIGH MEEM INITIAL FORM
U+06D9ۙARABIC SMALL HIGH LAM ALEF
U+06DAۚARABIC SMALL HIGH JEEM
U+06DBۛARABIC SMALL HIGH THREE DOTS
U+06DCۜARABIC SMALL HIGH SEEN
U+06DF۟ARABIC SMALL HIGH ROUNDED ZERO
U+06E0۠ARABIC SMALL HIGH UPRIGHT RECTANGULAR ZERO
U+06E1ۡARABIC SMALL HIGH DOTLESS HEAD OF KHAH
U+06E2ۢARABIC SMALL HIGH MEEM ISOLATED FORM
U+06E4ۤARABIC SMALL HIGH MADDA
U+06E7ۧARABIC SMALL HIGH YEH
U+06E8ۨARABIC SMALL HIGH NOON
U+06EA۪ARABIC EMPTY CENTRE LOW STOP
U+06EB۫ARABIC EMPTY CENTRE HIGH STOP
U+06EC۬ARABIC ROUNDED HIGH STOP WITH FILLED CENTRE

3.3. 근호

아랍 문자 유니코드 영역에는 근호를 나타내는 수학 기호 2종류가 있다. 이 기호들은 아랍 문자를 사용하는 수학 표기 체계에서 사용된다.

👆
좌우로 밀어서 보기
| 문자 || 이름
U+0606؆ARABIC-INDIC CUBE ROOT
U+0607؇ARABIC-INDIC FOURTH ROOT

3.4. 문자 모양 기호

아랍 문자에서 직선을 나타내는 기호는 U+0640에 배당된 아랍 타트윌/ـ아랍어이다.

3.5. 약물

아랍 문자를 표기할 때 사용되는 여러 구두점들이 있다. 아랍 문자는 오른쪽에서 왼쪽으로 쓰기 때문에, 일부 구두점은 다른 언어에서 사용되는 것과 반대 방향으로 나타난다. 예를 들어, 아랍어 쉼표(،)는 U+060C에, 세미콜론(؛)은 U+061B에, 물음표(؟)는 U+061F에 배당되어 있다. 이 외에도 날짜 구분 기호(؍)는 U+060D, 아야의 끝을 나타내는 기호(۝)는 U+06DD, 아랍 문자 마크(ALM)는 U+061C에 배당되어있다.

3.6. 통화 기호

아랍 문자의 통화 기호는 U+060B에 정의되어 있으며, 아프가니스탄의 통화 기호인 아프가니를 나타낸다. ؋

3.7. 시용 기호

아랍 문자로 쓰인 시에 사용되는 기호는 다음과 같다.

👆
좌우로 밀어서 보기
| 문자 || 설명
U+060E؎아랍어 시구 기호(ARABIC POETIC VERSE SIGN)
U+060F؏아랍어 미스라 기호(ARABIC SIGN MISRA)

3.8. 경칭용 기호

이슬람교에서는 종교적으로 중요한 인물의 이름을 표기할 때, 그 이름 위에 특별한 기도문을 나타내는 기호를 사용한다. 이러한 기호들은 존경과 경의를 표하는 의미를 담고 있다.

👆
좌우로 밀어서 보기
| U+0610 || U+0611 || U+0612 || U+0613 || U+0614
기호ؐؑؒؓؔ
설명SALLALLAHOU ALAYHE WASSALLAMALAYHE ASSALLAMRAHMATULLAH ALAYHERADI ALLAHOU ANHUTAKHALLUS

3.9. 코란 주석 기호

코란 주석 기호는 이슬람교의 성전인 쿠란에서 읽는 방법 등을 나타내기 위해 사용되는 기호류이다.

👆
좌우로 밀어서 보기
| 문자 || 이름
U+0600ARABIC NUMBER SIGN
U+0601ARABIC SIGN SANAH
U+0602ARABIC FOOTNOTE MARKER
U+0603ARABIC SIGN SAFHA
U+0604ARABIC SIGN SAMVAT
U+0605ARABIC NUMBER MARK ABOVE
U+060E؎ARABIC POETIC VERSE SIGN
U+060F؏ARABIC SIGN MISRA
U+0610ؐARABIC SIGN SALLALLAHOU ALAYHE WASSALLAM
U+0611ؑARABIC SIGN ALAYHE ASSALLAM
U+0612ؒARABIC SIGN RAHMATULLAH ALAYHE
U+0613ؓARABIC SIGN RADI ALLAHOU ANHU
U+0614ؔARABIC SIGN TAKHALLUS
U+0615ؕARABIC SMALL HIGH TAH
U+0616ؖARABIC SMALL HIGH LIGATURE ALEF WITH LAM WITH YEH
U+0617ؗARABIC SMALL HIGH ZAIN
U+0618ؘARABIC SMALL FATHA
U+0619ؙARABIC SMALL DAMMA
U+061AؚARABIC SMALL KASRA
U+06DDARABIC END OF AYAH
U+06DE۞ARABIC START OF RUB EL HIZB
U+06DF۟ARABIC SMALL HIGH ROUNDED ZERO
U+06E0۠ARABIC SMALL HIGH UPRIGHT RECTANGULAR ZERO
U+06E1ۡARABIC SMALL HIGH DOTLESS HEAD OF KHAH
U+06E2ۢARABIC SMALL HIGH MEEM ISOLATED FORM
U+06E3ۣARABIC SMALL LOW SEEN
U+06E4ۤARABIC SMALL HIGH MADDA
U+06E5ۥARABIC SMALL WAW
U+06E6ۦARABIC SMALL YEH
U+06E7ۧARABIC SMALL HIGH YEH
U+06E8ۨARABIC SMALL HIGH NOON
U+06E9۩ARABIC PLACE OF SAJDAH
U+06EA۪ARABIC EMPTY CENTRE LOW STOP
U+06EB۫ARABIC EMPTY CENTRE HIGH STOP
U+06EC۬ARABIC ROUNDED HIGH STOP WITH FILLED CENTRE
U+06EDۭARABIC SMALL LOW MEEM

3.10. 확장 아랍 기호

아랍 문자 유니코드 영역에는 고대 페르시아어에서 사용되던 기호가 포함되어 있다. 이 섹션에서는 10세기에서 11세기에 사용된 고대 페르시아어와 11세기에서 16세기에 사용된 초기 페르시아어(고전 페르시아어)에서 사용된 기호 중 하나의 문자를 소개한다.

👆
좌우로 밀어서 보기
 0123456789ABCDEF
U+060x؆؇؈؉؊؋،؍؎؏
U+061xؘؙؚؐؑؒؓؔؕؖؗ؛{{border؝؞؟
U+062xؠءآأؤإئابةتثجحخد
U+063xذرزسشصضطظعغػؼؽؾؿ
U+064xـفقكلمنهوىيًٌٍَُ
U+065xِّْٕٖٜٟٓٔٗ٘ٙٚٛٝٞ
U+066x٠١٢٣٤٥٦٧٨٩٪٫٬٭ٮٯ
U+067xٰٱٲٳٴٵٶٷٸٹٺٻټٽپٿ
U+068xڀځڂڃڄڅچڇڈډڊڋڌڍڎڏ
U+069xڐڑڒړڔڕږڗژڙښڛڜڝڞڟ
U+06Axڠڡڢڣڤڥڦڧڨکڪګڬڭڮگ
U+06Bxڰڱڲڳڴڵڶڷڸڹںڻڼڽھڿ
U+06Cxۀہۂۃۄۅۆۇۈۉۊۋیۍێۏ
U+06Dxېۑےۓ۔ەۖۗۘۙۚۛۜ۞۟
U+06Exۣ۠ۡۢۤۥۦۧۨ۩۪ۭ۫۬ۮۯ
U+06Fx۰۱۲۳۴۵۶۷۸۹ۺۻۼ۽۾ۿ

3.11. 제어 문자

유니코드에서 아랍 문자는 U+0600부터 U+06FF까지의 영역에 포함되어 있다. 이 영역에는 아랍 문자를 표기하기 위한 다양한 문자와 기호들이 포함되어 있는데, 그 중에는 특정 글리프나 문자 폭을 가지지 않는 제어 문자도 포함되어 있다.

이 소분류에는 바로 앞 문자가 아랍 문자임을 나타내기 위해 사용되는 제어 문자인 U+061C 아랍 문자 마크(ALM)가 수록되어 있다.

3.12. 카슈미르어용 추가 문자

카슈미르어는 인도파키스탄의 분쟁 지역인 카슈미르 지방에서 사용되는 언어로, 아랍 문자를 확장하여 표기한다. 이 섹션에서는 카슈미르어 표기에 사용되는 확장 문자 1개를 설명한다.

👆
좌우로 밀어서 보기
코드문자이름
U+0620ؠARABIC LETTER KASHMIRI YEH

3.13. ISO 8859-6 기반 문자

ISO 8859-6에 준거하여 기본적인 아랍 문자의 자모를 수록하고 있다. 표에서 특별한 언급이 없는 한, 아랍 문자를 표기에 사용하는 많은 언어에서 공통적으로 사용된다.

본 항목에 속하는 아랍 문자의 이름은, ISO 8859-6에서 파생된 로마자 표기 규칙을 따른다. 이것들은, 아랍어 문자명의 실제 발음과는 다르며, 예를 들어 U+0628 ب ARABIC LETTER BEH는 일반적인 아랍어 발음으로는 "ba'"가 된다.

3.14. 초기 페르시아어 및 아제르바이잔어용 추가 문자

초기 페르시아어아제르바이잔어에서 사용되는 아랍 문자의 확장 문자를 수록하고 있다. 초기 페르시아어는 10~11세기의 고대 페르시아어 및 11~16세기의 고전 페르시아어를 총칭하며, 과거 페르시아어의 정서법에 사용되었던 문자를 수록하고 있다.

한편, 아제르바이잔에서의 아제르바이잔어는 현재 로마자가 주요 표기 체계로 사용되고 있지만, 이란 등에서 사용되는 남아제르바이잔어에서는 현재도 아랍 문자로 표기하고 있다.

3.15. ISO 8859-6 기반 모음 기호

아랍 문자의 하위 분류에는 이슬람교의 성전인 꾸란이나 초보자용 또는 초등 교육용 교재 등에서 사용되는 모음 등을 표기하기 위한 보조 기호인 타쉬킬이 수록되어 있다. 타쉬킬은 아랍어에서 "타쉬킬을 치다"라는 동작을 나타내는 단어와 어원이 같다.

👆
좌우로 밀어서 보기
| 문자 || 이름
U+064BًARABIC FATHATAN
U+064CٌARABIC DAMMATAN
U+064DٍARABIC KASRATAN
U+064EَARABIC FATHA
U+064FُARABIC DAMMA
U+0650ِARABIC KASRA
U+0651ّARABIC SHADDA
U+0652ْARABIC SUKUN
U+0653ٓARABIC MADDAH ABOVE
U+0654ٔARABIC HAMZA ABOVE
U+0655ٕARABIC HAMZA BELOW
U+0656ٖARABIC SUBSCRIPT ALEF
U+0657ٗARABIC INVERTED DAMMA
U+0658٘ARABIC MARK NOON GHUNNA
U+0659ٙARABIC ZWARAKAY
U+065AٚARABIC VOWEL SIGN SMALL V ABOVE
U+065BٛARABIC VOWEL SIGN INVERTED SMALL V ABOVE
U+065CٜARABIC VOWEL SIGN DOT BELOW
U+065DٝARABIC REVERSED DAMMA
U+065EٞARABIC FATHA WITH TWO DOTS
U+065FٟARABIC WAVY HAMZA BELOW
U+0670ٰARABIC LETTER SUPERSCRIPT ALEF

3.16. 결합용 마흐다 및 함자

샤클 중 ISO 8859-6에 포함되지 않았던 결합용 마다(maddah)와 함자(hamza)를 수록하고 있다.

👆
좌우로 밀어서 보기
코드문자이름
U+0653ٓARABIC MADDAH ABOVE
U+0654ٔARABIC HAMZA ABOVE
U+0655ٕARABIC HAMZA BELOW
U+0674ٴARABIC LETTER HIGH HAMZA
U+0675ٵARABIC LETTER HIGH HAMZA ALEF
U+0676ٶARABIC LETTER HIGH HAMZA WAW
U+0677ٷARABIC LETTER U WITH HAMZA ABOVE
U+0678ٸARABIC LETTER HIGH HAMZA YEH
U+0681ځARABIC LETTER HAH WITH HAMZA ABOVE
U+06C2ۂARABIC LETTER HEH GOAL WITH HAMZA ABOVE
U+06D3ۓARABIC LETTER YEH BARREE WITH HAMZA ABOVE

3.17. 기타 결합 기호

아랍 문자를 사용하는 다양한 언어에서 사용되는 결합 기호들이 이 소분류에 포함된다.

👆
좌우로 밀어서 보기
| 문자 || 설명
U+064BًARABIC FATHATAN
U+064CٌARABIC DAMMATAN
U+064DٍARABIC KASRATAN
U+064EَARABIC FATHA
U+064FُARABIC DAMMA
U+0650ِARABIC KASRA
U+0651ّARABIC SHADDA
U+0652ْARABIC SUKUN
U+0653ٓARABIC MADDAH ABOVE
U+0654ٔARABIC HAMZA ABOVE
U+0655ٕARABIC HAMZA BELOW
U+0656ٖARABIC SUBSCRIPT ALEF
U+0657ٗARABIC INVERTED DAMMA
U+0658٘ARABIC MARK NOON GHUNNA
U+0659ٙARABIC ZWARAKAY
U+065AٚARABIC VOWEL SIGN SMALL V ABOVE
U+065BٛARABIC VOWEL SIGN INVERTED SMALL V ABOVE
U+065CٜARABIC VOWEL SIGN DOT BELOW
U+065DٝARABIC REVERSED DAMMA
U+065EٞARABIC FATHA WITH TWO DOTS
U+065FٟARABIC WAVY HAMZA BELOW
U+0670ٰARABIC LETTER SUPERSCRIPT ALEF

3.18. 아라비아-인도 숫자

아랍어에서는 아라비아-인도 숫자를 일반적으로 사용한다. 이 숫자들은 원래 인도에서 탄생했으며, 그 전까지 아랍권에서는 아랍 문자를 숫자로 사용하는 전통적인 방식을 따랐다. 하지만 인도에서 숫자만을 위한 문자를 차용하면서 현재까지 사용되고 있다. 이러한 이유로 이 숫자들은 "인도 숫자"라고 불린다.

아라비아-인도 숫자는 아랍어에서 사용되지만, 이란, 아프가니스탄, 파키스탄, 인도 등에서 사용되는 숫자와는 글자 모양이 약간 다르다. 그래서 유니코드에서는 "Eastern Arabic-Indic digits" (U+06F0~06F9)라는 별도의 부호 영역으로 구분한다.

👆
좌우로 밀어서 보기
| U+0660 || U+0661 || U+0662 || U+0663 || U+0664 || U+0665 || U+0666 || U+0667 || U+0668 || U+0669
| ٠ || ١ || ٢ || ٣ || ٤ || ٥ || ٦ || ٧ || ٨ || ٩
| ARABIC-INDIC DIGIT ZERO || ARABIC-INDIC DIGIT ONE || ARABIC-INDIC DIGIT TWO || ARABIC-INDIC DIGIT THREE || ARABIC-INDIC DIGIT FOUR || ARABIC-INDIC DIGIT FIVE || ARABIC-INDIC DIGIT SIX || ARABIC-INDIC DIGIT SEVEN || ARABIC-INDIC DIGIT EIGHT || ARABIC-INDIC DIGIT NINE


👆
좌우로 밀어서 보기
| U+06F0 || U+06F1 || U+06F2 || U+06F3 || U+06F4 || U+06F5 || U+06F6 || U+06F7 || U+06F8 || U+06F9
| ۰ || ۱ || ۲ || ۳ || ۴ || ۵ || ۶ || ۷ || ۸ || ۹
| EXTENDED ARABIC-INDIC DIGIT ZERO || EXTENDED ARABIC-INDIC DIGIT ONE || EXTENDED ARABIC-INDIC DIGIT TWO || EXTENDED ARABIC-INDIC DIGIT THREE || EXTENDED ARABIC-INDIC DIGIT FOUR || EXTENDED ARABIC-INDIC DIGIT FIVE || EXTENDED ARABIC-INDIC DIGIT SIX || EXTENDED ARABIC-INDIC DIGIT SEVEN || EXTENDED ARABIC-INDIC DIGIT EIGHT || EXTENDED ARABIC-INDIC DIGIT NINE

3.19. 고대 문자

초기 아랍 문자는 점으로 글자를 구분하는 방식이 없었다. 이 섹션에서는 그러한 글자 모양을 일부 설명한다.

👆
좌우로 밀어서 보기
코드값글자설명
U+066Eٮ점 없는 베 (베)
U+066Fٯ점 없는 카프 (카프)

3.20. 모음 기호

샤클 중 ISO 8859-6에 포함되지 않은 것은 다음과 같다.

👆
좌우로 밀어서 보기
| 문자 || 이름
U+0618ؘARABIC SMALL FATHA
U+0619ؙARABIC SMALL DAMMA
U+061AؚARABIC SMALL KASRA
U+0653ٓARABIC MADDAH ABOVE
U+0654ٔARABIC HAMZA ABOVE
U+0655ٕARABIC HAMZA BELOW
U+0656ٖARABIC SUBSCRIPT ALEF
U+0657ٗARABIC INVERTED DAMMA
U+0658٘ARABIC MARK NOON GHUNNA
U+0659ٙARABIC ZWARAKAY
U+065AٚARABIC VOWEL SIGN SMALL V ABOVE
U+065BٛARABIC VOWEL SIGN INVERTED SMALL V ABOVE
U+065CٜARABIC VOWEL SIGN DOT BELOW
U+065DٝARABIC REVERSED DAMMA
U+065EٞARABIC FATHA WITH TWO DOTS
U+065FٟARABIC WAVY HAMZA BELOW

3.21. 확장 아랍 문자

아랍 문자아랍어 외에도 페르시아어, 우르두어, 파슈토어, 쿠르드어, 위구르어, 카자흐어, 아제르바이잔어 등 아랍 문자를 사용하는 여러 언어에서 사용되는 확장 문자를 포함한다.

👆
좌우로 밀어서 보기
코드문자이름
U+0679ٹARABIC LETTER TTEH
U+067AٺARABIC LETTER TTEHEH
U+067BٻARABIC LETTER BEEH
U+067CټARABIC LETTER TEH WITH RING
U+067DٽARABIC LETTER TEH WITH THREE DOTS ABOVE DOWNWARDS
U+067EپARABIC LETTER PEH
U+067FٿARABIC LETTER TEHEH
U+0680ڀARABIC LETTER BEHEH
U+0681ځARABIC LETTER HAH WITH HAMZA ABOVE
U+0682ڂARABIC LETTER HAH WITH TWO DOTS VERTICAL ABOVE
U+0683ڃARABIC LETTER NYEH
U+0684ڄARABIC LETTER DYEH
U+0685څARABIC LETTER HAH WITH THREE DOTS ABOVE
U+0686چARABIC LETTER TCHEH
U+0687ڇARABIC LETTER TCHEHEH
U+0688ڈARABIC LETTER DDAL
U+0689ډARABIC LETTER DAL WITH RING
U+068AڊARABIC LETTER DAL WITH DOT BELOW
U+068BڋARABIC LETTER DAL WITH DOT BELOW AND SMALL TAH
U+068CڌARABIC LETTER DAHAL
U+068DڍARABIC LETTER DDAHAL
U+068EڎARABIC LETTER DUL
U+068FڏARABIC LETTER DAL WITH THREE DOTS ABOVE DOWNWARDS
U+0690ڐARABIC LETTER DAL WITH FOUR DOTS ABOVE
U+0691ڑARABIC LETTER RREH
U+0692ڒARABIC LETTER REH WITH SMALL V
U+0693ړARABIC LETTER REH WITH RING
U+0694ڔARABIC LETTER REH WITH DOT BELOW
U+0695ڕARABIC LETTER REH WITH SMALL V BELOW
U+0696ږARABIC LETTER REH WITH DOT BELOW AND DOT ABOVE
U+0697ڗARABIC LETTER REH WITH TWO DOTS ABOVE
U+0698ژARABIC LETTER JEH
U+0699ڙARABIC LETTER REH WITH FOUR DOTS ABOVE
U+069AښARABIC LETTER SEEN WITH DOT BELOW AND DOT ABOVE
U+069BڛARABIC LETTER SEEN WITH THREE DOTS BELOW
U+069CڜARABIC LETTER SEEN WITH THREE DOTS BELOW AND THREE DOTS ABOVE
U+069DڝARABIC LETTER SAD WITH TWO DOTS BELOW
U+069EڞARABIC LETTER SAD WITH THREE DOTS ABOVE
U+069FڟARABIC LETTER TAH WITH THREE DOTS ABOVE
U+06A0ڠARABIC LETTER AIN WITH THREE DOTS ABOVE
U+06A1ڡARABIC LETTER DOTLESS FEH
U+06A2ڢARABIC LETTER FEH WITH DOT MOVED BELOW
U+06A3ڣARABIC LETTER FEH WITH DOT BELOW
U+06A4ڤARABIC LETTER VEH
U+06A5ڥARABIC LETTER FEH WITH THREE DOTS BELOW
U+06A6ڦARABIC LETTER PEHEH
U+06A7ڧARABIC LETTER QAF WITH DOT ABOVE
U+06A8ڨARABIC LETTER QAF WITH THREE DOTS ABOVE
U+06A9کARABIC LETTER KEHEH
U+06AAڪARABIC LETTER SWASH KAF
U+06ABګARABIC LETTER KAF WITH RING
U+06ACڬARABIC LETTER KAF WITH DOT ABOVE
U+06ADڭARABIC LETTER NG
U+06AEڮARABIC LETTER KAF WITH THREE DOTS BELOW
U+06AFگARABIC LETTER GAF
U+06B0ڰARABIC LETTER GAF WITH RING
U+06B1ڱARABIC LETTER NGOEH
U+06B2ڲARABIC LETTER GAF WITH TWO DOTS BELOW
U+06B3ڳARABIC LETTER GUEH
U+06B4ڴARABIC LETTER GAF WITH THREE DOTS ABOVE
U+06B5ڵARABIC LETTER LAM WITH SMALL V
U+06B6ڶARABIC LETTER LAM WITH DOT ABOVE
U+06B7ڷARABIC LETTER LAM WITH THREE DOTS ABOVE
U+06B8ڸARABIC LETTER LAM WITH THREE DOTS BELOW
U+06B9ڹARABIC LETTER NOON WITH DOT BELOW
U+06BAںARABIC LETTER NOON GHUNNA
U+06BBڻARABIC LETTER RNOON
U+06BCڼARABIC LETTER NOON WITH RING
U+06BDڽARABIC LETTER NOON WITH THREE DOTS ABOVE
U+06BEھARABIC LETTER HEH DOACHASHMEE
U+06BFڿARABIC LETTER TCHEH WITH DOT ABOVE
U+06C0ۀARABIC LETTER HEH WITH YEH ABOVE
U+06C1ہARABIC LETTER HEH GOAL
U+06C2ۂARABIC LETTER HEH GOAL WITH HAMZA ABOVE
U+06C3ۃARABIC LETTER TEH MARBUTA GOAL
U+06C4ۄARABIC LETTER WAW WITH RING
U+06C5ۅARABIC LETTER KIRGHIZ OE
U+06C6ۆARABIC LETTER OE
U+06C7ۇARABIC LETTER U
U+06C8ۈARABIC LETTER YU
U+06C9ۉARABIC LETTER KIRGHIZ YU
U+06CAۊARABIC LETTER WAW WITH TWO DOTS ABOVE
U+06CBۋARABIC LETTER VE
U+06CCیARABIC LETTER FARSI YEH
U+06CDۍARABIC LETTER YEH WITH TAIL
U+06CEێARABIC LETTER YEH WITH SMALL V
U+06CFۏARABIC LETTER WAW WITH DOT ABOVE
U+06D0ېARABIC LETTER E
U+06D1ۑARABIC LETTER YEH WITH THREE DOTS BELOW
U+06D2ےARABIC LETTER YEH BARREE
U+06D3ۓARABIC LETTER YEH BARREE WITH HAMZA ABOVE
U+06D5ەARABIC LETTER AE
U+06EEۮARABIC LETTER DAL WITH INVERTED V
U+06EFۯARABIC LETTER REH WITH INVERTED V
U+06FAۺARABIC LETTER SHEEN WITH DOT BELOW
U+06FBۻARABIC LETTER DAD WITH DOT BELOW
U+06FCۼARABIC LETTER GHAIN WITH DOT BELOW
U+06FFۿARABIC LETTER HEH WITH INVERTED V

3.22. 비권장 문자

유니코드에서 사용이 권장되지 않는 문자는 다음과 같다.

👆
좌우로 밀어서 보기
| 문자 || 이름
U+0673ٳARABIC LETTER ALEF WITH WAVY HAMZA BELOW


이 문자는 다른 부호화 규격과의 호환성을 위해 추가되었지만, 현재 유니코드에서는 사용이 권장되지 않는다.

3.23. 고위치 함자

유니코드에서 고위치 함자는 카자흐어의 이중 문자를 표기할 때 사용되었던 문자이다. 이 문자는 U+0674에 해당하며, 현재 카자흐스탄에서는 키릴 문자를 사용하기에 일반적으로 폐지되었으나, 중화인민공화국 신장 위구르 자치구카자흐인들은 여전히 아랍 문자를 사용한다.

3.24. 카자흐어용 이중 자모

카자흐어 이중 문자(Digraphic letters)는 부호화되었지만, 호환성 분해는 원하는 표시 순서를 반영하지 않는 문자를 설명한다. 따라서, 이러한 카자흐어 이중 문자의 표기에는 요소의 올바른 순서를 가진 두 문자의 철자를 사용해야 한다.

3.25. 파르카리어용 확장 아랍 문자

파키스탄신드주 등에서 사용되는 파카리・콜리 어/Parkari Koli language영어(또는 단순히 파카리 어라고도 불림)용 확장 아랍 문자를 수록하고 있다.

3.26. 동방 아라비아-인도 숫자

이란, 파키스탄, 인도의 아랍 문자를 사용하는 언어에서 사용되는 아라비아 숫자는 다음과 같다.

👆
좌우로 밀어서 보기
문자설명
٠EXTENDED ARABIC-INDIC DIGIT ZERO
۱EXTENDED ARABIC-INDIC DIGIT ONE
۲EXTENDED ARABIC-INDIC DIGIT TWO
۳EXTENDED ARABIC-INDIC DIGIT THREE
۴EXTENDED ARABIC-INDIC DIGIT FOUR
۵EXTENDED ARABIC-INDIC DIGIT FIVE
۶EXTENDED ARABIC-INDIC DIGIT SIX
۷EXTENDED ARABIC-INDIC DIGIT SEVEN
۸EXTENDED ARABIC-INDIC DIGIT EIGHT
۹EXTENDED ARABIC-INDIC DIGIT NINE


페르시아어, 신드어, 우르두어 등에서 사용되며, 일부 숫자는 아랍어에서 사용되는 것과 다른 자형을 사용한다. 우르두어에서는 일부 숫자에 대해 아랍어, 페르시아어와도 다른 자형이 사용되지만, 페르시아어와 부호 위치가 통일되어 있다.

3.27. 신디어용 기호

신드어파키스탄신드주 등에서 사용되며, 신드어에서 사용되는 약어 기호는 다음과 같다.

👆
좌우로 밀어서 보기
코드문자이름
U+06FD۽ARABIC SIGN SINDHI AMPERSAND
U+06FE۾ARABIC SIGN SINDHI POSTPOSITION MEN

4. 특징

4.1. 문자 연결

4.2. 오른쪽에서 왼쪽으로 쓰기

4.3. 모음 표기

5. 한국과의 관계

5.1. 역사적 관계

5.2. 현대 한국 사회에서 활용

6. 유니코드

wikitext

👆
좌우로 밀어서 보기
아랍 문자
| 0 || 1 || 2 || 3 || 4 || 5 || 6 || 7 || 8 || 9 || A || B || C || D || E || F
U+060x؀؁؂؃؄؅؆؇؈؉؊؋،؍؎؏
U+061xؘؙؚؐؑؒؓؔؕؖؗ؛ALM؝؞؟
U+062xؠءآأؤإئابةتثجحخد
U+063xذرزسشصضطظعغػؼؽؾؿ
U+064xـفقكلمنهوىيًٌٍَُ
U+065xِّْٕٖٜٟٓٔٗ٘ٙٚٛٝٞ
U+066x٠١٢٣٤٥٦٧٨٩٪٫٬٭ٮٯ
U+067xٰٱٲٳٴٵٶٷٸٹٺٻټٽپٿ
U+068xڀځڂڃڄڅچڇڈډڊڋڌڍڎڏ
U+069xڐڑڒړڔڕږڗژڙښڛڜڝڞڟ
U+06Axڠڡڢڣڤڥڦڧڨکڪګڬڭڮگ
U+06Bxڰڱڲڳڴڵڶڷڸڹںڻڼڽھڿ
U+06Cxۀہۂۃۄۅۆۇۈۉۊۋیۍێۏ
U+06Dxېۑےۓ۔ەۖۗۘۙۚۛۜ۝۞۟
U+06Exۣ۠ۡۢۤۥۦۧۨ۩۪ۭ۫۬ۮۯ
U+06Fx۰۱۲۳۴۵۶۷۸۹ۺۻۼ۽۾ۿ

6.1. 코드표

👆
좌우로 밀어서 보기
아랍 문자
| 0 || 1 || 2 || 3 || 4 || 5 || 6 || 7 || 8 || 9 || A || B || C || D || E || F
U+060x؀؁؂؃؄؅؆؇؈؉؊؋،؍؎؏
U+061xؘؙؚؐؑؒؓؔؕؖؗ؛ALM؝؞؟
U+062xؠءآأؤإئابةتثجحخد
U+063xذرزسشصضطظعغػؼؽؾؿ
U+064xـفقكلمنهوىيًٌٍَُ
U+065xِّْٕٖٜٟٓٔٗ٘ٙٚٛٝٞ
U+066x٠١٢٣٤٥٦٧٨٩٪٫٬٭ٮٯ
U+067xٰٱٲٳٴٵٶٷٸٹٺٻټٽپٿ
U+068xڀځڂڃڄڅچڇڈډڊڋڌڍڎڏ
U+069xڐڑڒړڔڕږڗژڙښڛڜڝڞڟ
U+06Axڠڡڢڣڤڥڦڧڨکڪګڬڭڮگ
U+06Bxڰڱڲڳڴڵڶڷڸڹںڻڼڽھڿ
U+06Cxۀہۂۃۄۅۆۇۈۉۊۋیۍێۏ
U+06Dxېۑےۓ۔ەۖۗۘۙۚۛۜ۝۞۟
U+06Exۣ۠ۡۢۤۥۦۧۨ۩۪ۭ۫۬ۮۯ
U+06Fx۰۱۲۳۴۵۶۷۸۹ۺۻۼ۽۾ۿ

6.2. 유니코드 버전별 역사

유니코드 버전 업데이트에 따라 아랍 문자가 추가되거나 변경된 내역은 다음과 같다.

* 1.0.0 버전에는 169개의 아랍 문자가 U+060C, 061B, 061F, 0621..063A, 0640..0652, 0660..066C, 0670..06B7, 06BA..06BE, 06C0..06CE, 06D0..06D5, 06F0..06F9 코드 영역에 추가되었다. 이후 여러 차례 회의를 거쳐 아랍 문자 관련 논의가 진행되었다.
2000년 8월 8일, UTC 회의 #83 의사록에서 아랍 숫자 구분 기호에 대한 논의가 있었다.
2001년 6월 18일, UTC/L2 회의 의사록에서 아랍 필기체 연결에 대한 논의가 있었다.
2001년 11월 6일, UTC/L2 회의 #88 의사록에서 U+06D5의 연결 동작 속성에 대한 논의가 있었다.
2009년 5월 20일, UTC #119 / L2 #216 회의에서 U+0673(ARABIC LETTER ALEF WITH WAVY HAMZA BELOW) 문자를 폐지하는 안건이 상정되었다.
** 2009년 11월 10일, UTC #121 / L2 #218 회의에서 U+0673 문자가 폐지되었다.
* 1.1 버전에는 U+066D, 06D6..06ED 코드 영역에 25개의 문자가 추가되었다.
* 3.0 버전에는 U+0653..0655 코드 영역에 3개의 문자, U+06B8..06B9, 06BF, 06CF, 06FA..06FE 코드 영역에 9개의 문자가 추가되었다.
* 3.2 버전에는 U+066E..066F 코드 영역에 2개의 문자가 추가되었다.
* 4.0 버전에는 U+0600..0602, 060D..060E, 0610..0614, 0656..0658 코드 영역에 13개의 문자, U+0603, 060F, 0615 코드 영역에 3개의 문자, U+06EE..06EF, 06FF 코드 영역에 3개의 문자가 추가되었다.
* 4.1 버전에는 U+060B 코드 영역에 1개의 문자, U+061E, 065A..065C 코드 영역에 4개의 문자, U+0659 코드 영역에 1개의 문자, U+065D..065E 코드 영역에 2개의 문자가 추가되었다.
* 5.1 버전에는 U+0606..060A 코드 영역에 5개의 문자, U+0616, 063B..063F 코드 영역에 6개의 문자, U+0617..061A 코드 영역에 4개의 문자가 추가되었다.
* 6.0 버전에는 U+0620, 065F 코드 영역에 2개의 문자가 추가되었다.
* 6.1 버전에는 U+0604 코드 영역에 1개의 문자가 추가되었다.
* 6.3 버전에는 U+061C 코드 영역에 1개의 문자가 추가되었다.
* 7.0 버전에는 U+0605 코드 영역에 1개의 문자가 추가되었다.
* 14.0 버전에는 U+061D 코드 영역에 1개의 문자가 추가되었다.