아랍 문자 (유니코드 영역)
1. 개요
아랍 문자(유니코드 영역)는 히브리 문자처럼 오른쪽에서 왼쪽으로 가로쓰기하며, 단어 내 위치에 따라 글자 모양이 변하는 특징을 가진다. 유니코드에서는 U+0600부터 U+06FF 영역에 아랍 문자를 위한 다양한 문자와 기호를 포함하며, 아랍어 외에도 페르시아어, 우르두어 등 여러 언어 표기에 사용된다. 아랍 문자는 숫자, 구두점, 시 기호, 경칭 기호, 코란 주석 기호, 확장 아랍 기호 등을 포함하며, 유니코드 버전별로 문자가 추가되고 속성이 변경되어 왔다.
| 블록 이름 | 아랍 문자 |
|---|---|
| 범위 시작 | 0600 |
| 범위 끝 | 06FF |
| 스크립트 | 아랍 문자 (238자) 공통 (6자) 상속 (12자) |
| 알파벳 | 아랍어 쿠르드어 파슈토어 페르시아어 우르두어 신디어 페르시아 문자 우르두 문자 파슈토 문자 쿠르드 문자 위구르어 오스만어 남아제르바이잔어 신드어 발루치어 서펀자브어 카슈미르어 말레이어 |
| 출처 | ISO 8859-6 |
| 더 이상 사용되지 않음 | 1 |
| 유니코드 버전 1.0.0 | 169 |
| 유니코드 버전 1.1 | 25 |
| 유니코드 버전 3.0 | 12 |
| 유니코드 버전 3.2 | 2 |
| 유니코드 버전 4.0 | 19 |
| 유니코드 버전 4.1 | 8 |
| 유니코드 버전 5.1 | 15 |
| 유니코드 버전 6.0 | 2 |
| 유니코드 버전 6.1 | 1 |
| 유니코드 버전 6.3 | 1 |
| 유니코드 버전 7.0 | 1 |
| 유니코드 버전 14.0 | 1 |
| 코드 차트 | 유니코드 문자 코드 차트 (PDF) |
| 참고 | 유니코드 문자 데이터베이스 유니코드 표준 버전 |
-
유니코드 영역 -
딩뱃
딩뱃은 장식 문자, 강조 표시, 비텍스트 상징을 포함하는 문자 집합으로, 유니코드 표준의 딩뱃 블록과 장식 딩뱃 블록을 통해 코드 포인트를 제공하며, 장식적 요소 외에도 정치적, 사회적 의미를 담을 수 있다. -
유니코드 영역 -
한중일 호환용 한자
한중일 호환용 한자는 유니코드에서 기존 문자 코드와의 호환성을 위해 추가된 한자 블록으로, 다양한 문자 집합의 한자들이 추가되면서 중복 및 정의 오류, CJK 통합 한자와의 호환 문제 등 기술적 고려 사항이 존재한다.
- 1. 개요
- 2. 역사
- 3. 収録文字(수록 문자)
- 3.1. 베이스라인 하단 마커
- 3.2. 베이스라인 상단 마커
- 3.3. 근호
- 3.4. 문자 모양 기호
- 3.5. 약물
- 3.6. 통화 기호
- 3.7. 시용 기호
- 3.8. 경칭용 기호
- 3.9. 코란 주석 기호
- 3.10. 확장 아랍 기호
- 3.11. 제어 문자
- 3.12. 카슈미르어용 추가 문자
- 3.13. ISO 8859-6 기반 문자
- 3.14. 초기 페르시아어 및 아제르바이잔어용 추가 문자
- 3.15. ISO 8859-6 기반 모음 기호
- 3.16. 결합용 마흐다 및 함자
- 3.17. 기타 결합 기호
- 3.18. 아라비아-인도 숫자
- 3.19. 고대 문자
- 3.20. 모음 기호
- 3.21. 확장 아랍 문자
- 3.22. 비권장 문자
- 3.23. 고위치 함자
- 3.24. 카자흐어용 이중 자모
- 3.25. 파르카리어용 확장 아랍 문자
- 3.26. 동방 아라비아-인도 숫자
- 3.27. 신디어용 기호
- 4. 특징
- 5. 한국과의 관계
- 6. 유니코드
2. 역사
아랍 문자는 히브리 문자 등과 마찬가지로 오른쪽에서 왼쪽으로 가로쓰기되며 (오른쪽 가로쓰기), 일부 예외가 되는 문자를 제외하고는 라틴 문자의 필기체처럼 같은 단어의 문자끼리 연결되어 쓰인다. 또한, 각 문자는 단어 내의 위치에 따라 독립형, 어두형, 어중형, 어말형의 4가지 형태를 가지지만, 이 블록 내에서는 단어 내 위치에 따른 글자 모양 차이는 부호 위치상 통일되어 있으며, 폰트 내에서 그 동작을 제어하는 사양으로 되어 있다. 단, 일부 문자에서는 아랍 문자 표시형 A 및 아랍 문자 표시형 B 블록에 단어 내 위치에 따른 글자 모양 차이의 부호 위치가 분리되어 수록되어 있다.
아랍 문자는 음소 문자 중, 자음만을 기록하는 압자드이며, "압자드"라는 명칭도 아랍 문자의 고전적인 배열 순서 (아브자드 순)의 첫 4글자 (알리프, 바, 짐, 달)에서 유래했다. 일반적인 문서에서는 모음을 기록하지 않지만, 이슬람교의 성전인 코란 (쿠란)과 초심자 및 초등 교육용 교재 등 올바른 단어의 발음을 명시해야 하는 문서에서는 샤클이라고 불리는 모음 기호가 사용되므로, 이 기호들도 이 블록에 수록되어 있다.
중동 및 북아프리카 지역에 널리 퍼져 있는 아랍권에서 널리 사용되는 이슬람교의 성전 언어인 아랍어 외에도, 이란의 공용어인 페르시아어, 파키스탄의 공용어인 우르두어, 아프가니스탄의 공용어인 파슈토어, 중화인민공화국·신장 위구르 자치구에 거주하는 튀르크계 소수 민족인 위구르인이 사용하는 위구르어, 이라크·이란·터키 등의 쿠르디스탄 지역에 거주하는 쿠르드족이 사용하는 쿠르드어 (특히 소라니 방언) 등, 무슬림이 많이 거주하는 이슬람권에서 사용되는 다른 언어의 표기에도 사용되는 아랍 문자를 수록하고 있다.
현재는 아랍 문자로의 표기가 일반적이지 않지만, 과거에는 정서법이 아랍 문자였던 터키어, 아제르바이잔어 (단, 이란 등에 거주하는 아제르바이잔인이 사용하는 남아제르바이잔어에서는 현재도 아랍 문자를 사용), 말레이어, 카자흐어 등을 위한 문자, 현재는 사어가 된 오스만어, 고전 아랍어 등을 위한 문자도 이 블록에 포함되어 있다.
또한, 아랍 문자에서 파생된, 페르시아어를 표기하기 위한 페르시아 문자와, 우르두어 표기에 사용되는 우르두 문자, 펀자브어 및 라운다어 등의 표기에 사용되는 샴키 문자, 과거 말레이어 표기에 사용되었던 자위 문자 (단, 태국에 거주하는 말레이계 민족이 사용하는 자위어에서는 현재도 사용되며, 말레이시아에서도 간판 등의 지명 표기에는 현재도 사용되고 있다), 인도네시아에서 과거 자바어 및 순다어, 마두라어 등의 표기에 사용되었던 , 나이지리아와 니제르 등에서 사용되는 하우사어 및, 부르키나파소와 말리에서 사용되는 풀라어 표기에 사용되는 , 과거 마다가스카르어 표기에 사용되었던 등은 문헌에 따라 다른 문자 체계로 취급되는 경우가 있지만, 유니코드상에서는 아랍 문자의 변종으로 취급되어 같은 문자 체계로 취급되고 있다. 또한, 우르두어와 카슈미르어 표기에 사용되는 아랍 문자는 나스타알리크체라고 불리는 일반적인 아랍 문자와는 크게 글자 모양이 다른 서체가 사용되고 있지만, 이 역시 유니코드상에서는 아랍 문자와 같은 표기 체계로 취급되므로, 이 문자들도 이 블록에 포함되어 있다.
유니코드 버전 1.0에서도 "아랍 문자(Arabic)"라는 블록명으로 제정되었다.
2.1. 고대
아랍 문자는 히브리 문자 영역 내 특정 문자의 정의에 있어, 목적과 과정을 기록한 유니코드 관련 문서의 내역은 다음과 같다.
| 버전 | 최종 코드 영역 | 문자수 | L2 ID | WG2 ID | 문서 |
|---|---|---|---|---|---|
| 1.0.0 | U+060C, 061B, 061F, 0621..063A, 0640..0652, 0660..066C, 0670..06B7, 06BA..06BE, 06C0..06CE, 06D0..06D5, 06F0..06F9 | 169 | (to be determined) | ||
| 1.1 | U+066D, 06D6..06ED | 25 | (to be determined) | ||
| 3.0 | U+0653..0655 | 3 | |||
| 3.0 | U+06B8..06B9, 06BF, 06CF, 06FA..06FE | 9 | N1573 | ||
| 3.2 | U+066E..066F | 2 | |||
| 4.0 | U+0600..0602, 060D..060E, 0610..0614, 0656..0658 | 13 | |||
| 4.0 | U+0603, 060F, 0615 | 3 | |||
| 4.0 | U+06EE..06EF, 06FF | 3 | |||
| 4.1 | U+060B | 1 | N2523 | ||
| 4.1 | U+061E, 065A..065C | 4 | |||
| 4.1 | U+0659 | 1 | N2581R2 | ||
| 4.1 | U+065D..065E | 2 | N2723 | ||
| 5.1 | U+0606..060A | 5 | N3086-1 | ||
| 5.1 | U+0616, 063B..063F | 6 | N3180R | ||
| 5.1 | U+0617..061A | 4 | N3185R | ||
| 6.0 | U+0620, 065F | 2 | N3686-I | ||
| 6.1 | U+0604 | 1 | N3734 | ||
| 6.3 | U+061C | 1 | N4180 | ||
| 7.0 | U+0605 | 1 | N3990 | ||
| 14.0 | U+061D | 1 |
2.2. 중세
중세 시대 아랍 문자는 유니코드에서 특정 문자를 정의하는 과정과 목적을 기록한 여러 문서를 통해 그 발전 양상을 확인할 수 있다. 1.0.0 버전부터 여러 차례의 회의와 논의를 거쳐 다양한 아랍 문자들이 추가되고 개선되었다.
초기에는 아랍어의 기본적인 문자 형태와 숫자 구분 기호, 필기체 연결 등에 대한 논의가 이루어졌다. 이후 위구르어, 페르시아어, 아제르바이잔어 등 다양한 언어에서 사용되는 아랍 문자들을 추가하고, వాటి의 형태와 관련된 기술적인 문제들을 해결하기 위한 논의가 진행되었다.
특히, 2009년에는 U+0673(ARABIC LETTER ALEF WITH WAVY HAMZA BELOW) 문자의 사용 중단(Deprecate) 결정이 내려졌으며, 2010년에는 아랍 문자 Yeh Barree (U+06D2)의 연결 동작 문제와 관련된 논의가 있었다. 또한, 차가타이어, 위구르어, 카자흐어, 키르기스어 등 중앙아시아 지역 언어에서 사용되는 특수 문자들에 대한 추가 및 개선 작업도 이루어졌다.
이러한 과정을 통해 아랍 문자는 다양한 언어와 문화를 포괄하는 문자로 발전하였으며, 유니코드는 이러한 변화를 반영하여 아랍 문자의 표준을 정립하는 데 기여했다.
2.3. 현대
현대 아랍 문자는 유니코드 표준에서 여러 차례 변화를 겪었다. 초기 버전 1.0.0에서는 169개의 문자가 정의되었으며, 이후 여러 버전에서 문자가 추가되거나 속성이 변경되었다.
* 1.0.0 버전: U+060C, U+061B, U+061F, U+0621..063A, U+0640..0652, U+0660..066C, U+0670..06B7, U+06BA..06BE, U+06C0..06CE, U+06D0..06D5, U+06F0..06F9 등 169개 문자가 초기 정의되었다.
- 2000년 8월, UTC 회의 #83 의사록에서 아랍어 숫자 구분 기호에 대한 논의가 있었다.
- 2001년 6월, UTC/L2 회의 의사록에서 아랍어 필기체 연결에 대한 논의가 있었다.
- 2001년 11월, UTC/L2 회의 #88 의사록에서 U+06D5의 연결 동작 속성에 대한 논의가 있었다.
- 2009년, U+0673 (ARABIC LETTER ALEF WITH WAVY HAMZA BELOW) 문자가 폐지되었다.
* 1.1 버전: U+066D, U+06D6..06ED 등 25개 문자가 추가되었다.
- 2001년 11월, U+06DD (ARABIC END OF AYAH) 및 기타 아랍어 묶음 표시에 대한 설명 요청이 있었다.
- 2005년, U+06DF, U+06E0, U+06E1에 대한 대표 글리프 변경이 있었다.
- 2010년, U+06DE의 속성이 결합 표시에서 간격 기호로 변경되었다.
* 3.0 버전: U+0653..0655 등 3개 문자와, U+06B8..06B9, 06BF, 06CF, 06FA..06FE 등 9개 문자가 추가되었다.
* 3.2 버전: U+066E..066F 등 2개 문자가 추가되었다.
* 4.0 버전: U+0600..0602, U+060D..060E, U+0610..0614, U+0656..0658 등 13개 문자와, U+0603, U+060F, U+0615 등 3개 문자, U+06EE..06EF, U+06FF 등 3개 문자가 추가되었다.
* 4.1 버전: U+060B 등 1개 문자와, U+061E, 065A..065C 등 4개 문자, U+0659 등 1개 문자, U+065D..065E 등 2개 문자가 추가되었다.
* 5.1 버전: U+0606..060A 등 5개 문자와, U+0616, 063B..063F 등 6개 문자, U+0617..061A 등 4개 문자가 추가되었다.
* 6.0 버전: U+0620, 065F 등 2개 문자가 추가되었다.
* 6.1 버전: U+0604 등 1개 문자가 추가되었다.
* 6.3 버전: U+061C 등 1개 문자가 추가되었다.
* 7.0 버전: U+0605 등 1개 문자가 추가되었다.
* 14.0 버전: U+061D 등 1개 문자가 추가되었다.
이러한 변화 과정에서 아랍 문자의 형태, 속성, 글리프 등이 지속적으로 개선되었으며, 다양한 언어 및 지역의 요구 사항을 반영하여 문자가 추가되었다. 특히, 위구르어, 카자흐어, 키르기스어, 차가타이어 등 중앙아시아 지역 언어를 위한 문자들이 추가되었고, 꾸란 표기를 위한 특수 문자 및 기호도 추가되었다.
3. 収録文字(수록 문자)
wikitext
{| class="wikitable"
|-
! 코드 || 문자 || 문자명 (영어) || 용례·설명 || 라틴 문자 전사
|-
| colspan="5" style="text-align:center;" | 베이스라인 하단 마커
|-
| U+0600 || || ARABIC NUMBER SIGN || 아랍 문자의 번호 기호. 라틴 문자 등의 "#"에 해당한다. 아랍·인도 숫자로 쓰인 숫자 아래에 쓰인다. ||
|-
| U+0601 || || ARABIC SIGN SANAH || 아랍 문자에서 연호를 나타내는 숫자 아래에 쓰이는 기호. U+0604와 달리 주로 그레고리력이나 이슬람력 (히즈라력)에서 사용되며, 그레고리력의 경우 연호와 이 기호 뒤에 "기독교의"를 의미하는 아랍어 عيسوي ʿīsawī의 약자인 문자 ain(U+0639 ع)의 어두 형식을, 이슬람력의 경우 무함마드의 성천 (히즈라)를 나타내는 아랍어 هجري hijrī의 약자인 문자 heh doachashmee(U+06BE ھ)를 적는다. ||
|-
| U+0602 || || ARABIC FOOTNOTE MARKER || 아랍 문자의 각주를 나타낼 때 사용되는 기호로, 주석이 필요한 위치에 각주 번호를 나타내는 아랍·인도 숫자 아래에 쓰이며, 페이지 하단 등에 다시 같은 숫자와 이 기호의 조합이 사용되어 주석 정보가 적힌다. 라틴 문자 등에서의 별표(*)나 단검 기호(†)와 같은 기능을 한다. ||
|-
| U+0603 || || ARABIC SIGN SAFHA || ||
|-
| U+0604 || || ARABIC SIGN SAMVAT || 우르두어에서 비크라마력의 연호를 쓰기 위해 사용하는 기호. 연호를 나타내는 아랍·인도 숫자 아래에 쓰이며, 쓰인 숫자가 비크라마력에 따른 연도 표기임을 나타낸다. ||
|-
| colspan="5" style="text-align:center;" | 베이스라인 상단 마커
|-
| U+0605 || || ARABIC NUMBER MARK ABOVE || 에서 사용되는 경우가 있다. ||
|-
| colspan="5" style="text-align:center;" | 근호
|-
| U+0606 || ؆ || ARABIC-INDIC CUBE ROOT || 아랍 문자의 3제곱근 (세제곱근)의 수학 기호. ||
|-
| U+0607 || ؇ || ARABIC-INDIC FOURTH ROOT || 아랍 문자의 4제곱근 (이중 제곱수)의 수학 기호. ||
|-
| colspan="5" style="text-align:center;" | 문자 형태 기호
|-
| U+0608 || ؈ || ARABIC RAY || 아랍 문자의 수학 기호로 "직선"을 나타낸다. ||
|-
| colspan="5" style="text-align:center;" | 약물
|-
| U+0609 || ؉ || ARABIC-INDIC PER MILLE SIGN || 아랍 문자의 천분율 (퍼밀) 기호. ||
|-
| U+060A || ؊ || ARABIC-INDIC PER TEN THOUSAND SIGN || 아랍 문자의 만분율 기호. ||
|-
| colspan="5" style="text-align:center;" | 통화 기호
|-
| U+060B || ؋ || AFGHANI SIGN || 아프가니스탄의 공정 통화인 아프가니의 통화 기호. ||
|-
| colspan="5" style="text-align:center;" | 약물
|-
| U+060C || ، || ARABIC COMMA || 아랍 문자의 쉼표(콤마). 현대 문장에서는 타나 문자와 시리아 문자에서도 사용된다. ||
|-
| U+060D || ؍ || ARABIC DATE SEPARATOR || 아랍 문자에서 날짜와 달 이름 사이의 구분에 사용되는 기호. ||
|-
| colspan="5" style="text-align:center;" | 시 기호
|-
| U+060E || ؎ || ARABIC POETIC VERSE SIGN || 시에서 비율로 사용되는 기호. 행의 시작 부분에 쓰인다. ||
|-
| U+060F || ؏ || ARABIC SIGN MISRA || ||
|-
| colspan="5" style="text-align:center;" | 존칭 기호
|-
| U+0610 || ؐ || ARABIC SIGN SALLALLAHOU ALAYHE WASSALLAM || 이슬람교에서 종교적으로 중요한 성인이나 위인의 이름 위에 존경을 표하기 위해 쓰이는 기도문. "그에게 신의 평화와 축복이 있기를"을 의미하는 아랍어 "sallallahu alayhe wasallam"을 나타낸다. ||
|-
| U+0611 || ؑ || ARABIC SIGN ALAYHE ASSALLAM || 이슬람교에서 종교적으로 중요한 성인이나 위인의 이름 위에 존경을 표하기 위해 쓰이는 기도문. "그에게 평화가 있기를"을 의미하는 아랍어 "alayhe assalam"을 나타낸다. ||
|-
| U+0612 || ؒ || ARABIC SIGN RAHMATULLAH ALAYHE || 이슬람교에서 종교적으로 중요한 성인이나 위인의 이름 위에 존경을 표하기 위해 쓰이는 기도문. "신이 그에게 자비를 베풀기를"을 의미하는 아랍어 "rahmatullah alayhe"를 나타낸다. ||
|-
| U+0613 || ؓ || ARABIC SIGN RADI ALLAHOU ANHU || 이슬람교에서 종교적으로 중요한 성인이나 위인의 이름 위에 존경을 표하기 위해 쓰이는 기도문. "신이 그를 기뻐하시기를"을 의미하는 아랍어 "radi allahu ’anhu"를 나타낸다. ||
|-
| U+0614 || ؔ || ARABIC SIGN TAKHALLUS || 시인의 이름이나 이름 위에 놓이는 기호, 또는 일부 문장에서 모든 고유명사를 표시하는 데 사용되는 기호. ||
|-
| colspan="5" style="text-align:center;" | 꾸란의 주석 기호
|-
| U+0615 || ؕ || ARABIC SMALL HIGH TAH || 이란 및 파키스탄에서 출판되는 일부 꾸란에서 읽는 중에 멈춰야 할 위치를 나타내는 기호. U+0679 ٹ 등의 일부 문자의 발음 기호로 사용되는 작은 TAH 기호와 혼동하지 않도록 한다. ||
|-
| colspan="5" style="text-align:center;" | 확장 아랍 기호
|-
| U+0616 || ؖ || ARABIC SMALL HIGH LIGATURE ALEF WITH LAM WITH YEH || ARABIC SMALL HIGH LIGATURE ALEF WITH YEH BARREE라고도 부른다. 초기 페르시아어 (10~16세기) ||
|-
| colspan="5" style="text-align:center;" | 꾸란의 주석 기호
|-
| U+0617 || ؗ || ARABIC SMALL HIGH ZAIN || 이란의 꾸란에서 사용되는 기호로, 본문에서 나타나는 부분에서 일시 정지해도 좋지만, 멈추지 않고 경전을 읽는 것이 권장됨을 나타내기 위해 사용된다. 아랍권의 꾸란에서 U+06D6 ۖ과 같은 역할을 한다. ||
|-
| U+0618 || ؘ || ARABIC SMALL FATHA || 064E َ FATHA와 혼동하지 않도록 한다. 이러한 일반적인 것보다 작은 샤클은 꾸란에서 사용되며, 절의 머리 글자인 알리프(U+0627 ا)에 부가된다. 이전 절에서 휴지를 거치지 않고 경전을 읽는 경우 알리프가 나타내는 자음[
|-
| U+0619 || ؙ || ARABIC SMALL DAMMA || 064F ُ DAMMA와 혼동하지 않도록 한다. 이러한 일반적인 것보다 작은 샤클은 꾸란에서 사용되며, 절의 머리 글자인 알리프(U+0627 ا)에 부가된다. 이전 절에서 휴지를 거치지 않고 경전을 읽는 경우 알리프가 나타내는 자음[
|-
| U+061A || ؚ || ARABIC SMALL KASRA || 0650 ِ KASRA와 혼동하지 않도록 한다. 이러한 일반적인 것보다 작은 샤클은 꾸란에서 사용되며, 절의 머리 글자인 알리프(U+0627 ا)에 부가된다. 이전 절에서 휴지를 거치지 않고 경전을 읽는 경우 알리프가 나타내는 자음[
|-
| colspan="5" style="text-align:center;" | 약물
|-
| U+061B || ؛ || ARABIC SEMICOLON || 아랍 문자의 세미콜론. 현대 문장에서는 타나 문자와 시리아 문자에서도 사용된다. ||
|-
| colspan="5" style="text-align:center;" | 제어 문자
|-
| U+061C || || ARABIC LETTER MARK || 라틴 문자 등의 왼쪽 가로쓰기 문자와 아랍 문자가 혼재되어 있는 양방향 텍스트에서 바로 앞 문자가 아랍 문자임을 나타낼 때 사용되는 제어 문자. 구체적인 글리프나 문자 폭을 갖지 않는다. 주로 번호가 매겨진 목록이나 수식, 날짜와 함께 사용되며, 숫자 바로 앞에 이 문자를 배치하여 산술 숫자를 자동으로 아랍·인도 숫자로 변환하고 숫자의 위치가 오른쪽으로 정렬되도록 조정할 의도이다. 일반적으로 ALM으로 약칭된다. ||
|-
| colspan="5" style="text-align:center;" | 약물
|-
| U+061D || ؝ || ARABIC END OF TEXT MARK || 마지막 문장의 끝에 일반적인 마침표 대신 붙는 약물. ||
|-
| U+061E || ؞ || ARABIC TRIPLE DOT PUNCTUATION MARK || 하우사어, 월로프어, 풀라어, 만딩카어 등 아프리카 언어의 옛 정서법에서 구두점 (마침표)으로 사용되던 기호. 현재는 사용되지 않는다. ||
|-
| U+061F || ؟ || ARABIC QUESTION MARK || 아랍 문자의 물음표. 현대 문장에서는 타나 문자와 시리아 문자에서도 사용된다. ||
|-
| colspan="5" style="text-align:center;" | 카슈미르어용 추가 문자
|-
| U+0620 || ؠ || ARABIC LETTER KASHMIRI YEH || 카슈미르어 바로 앞의 자음이 구개음화 (IPA:[-ʲ])임을 나타낸다. ||
|-
| colspan="5" style="text-align:center;" | ISO 8859-6에 기반한 문자
|-
| U+0621 || ء || ARABIC LETTER HAMZA || 함자. 자음[
|-
| U+0622 || آ || ARABIC LETTER ALEF WITH MADDA ABOVE || 마흐다가 붙은 알리프. [ʔaː]라는 발음을 나타낸다. 아랍어 ||
|-
| U+0623 || أ || ARABIC LETTER ALEF WITH HAMZA ABOVE || 함자가 위에 붙은 알리프. [ʔa] 또는 [ʔu]라는 발음을 나타낸다. 카자흐어, 투르크멘어 (~1929)에서는 모음[
|-
| U+0624 || ﺅ || ARABIC LETTER WAW WITH HAMZA ABOVE || 함자가 붙은 와우. [ʔu]라는 발음을 나타낸다. 파슈토어에서는 모음[
|-
| U+0625 || ﺇ || ARABIC LETTER ALEF WITH HAMZA BELOW || 함자가 아래에 붙은 알리프. [ʔi]라는 발음을 나타낸다. || ʾ
|-
| U+0626 || ﺉ || ARABIC LETTER YEH WITH HAMZA ABOVE || 함자가 붙은 야. [ʔi]라는 발음을 나타낸다. 파슈토어에서는 이중 모음[aɪ]를, 에서는 이중 모음[əɪ]를, 발루치어, 아제르바이잔어 (남아제르바이잔어), 타타르어 (1920~1927)에서는 모음[
|-
| U+0627 || ا || ARABIC LETTER ALEF || 알리프. 자음[
|-
| U+0628 || ب || ARABIC LETTER BEH || 바. 자음[
|-
| U+0629 || ة || ARABIC LETTER TEH MARBUTA || 타 마르부타. 반드시 어말에만 나타나며, 여성 명사 어미인 [-at]를 나타낸다. 아랍어에서만 사용된다. || ẗ
|-
| U+062A || ﺕ || ARABIC LETTER TEH || 타. 자음[
|-
| U+062B || ﺙ || ARABIC LETTER THEH || 사. 자음[
|-
| U+062C || ج || ARABIC LETTER JEEM || 짐. 자음[
|-
| U+062D || ﺡ || ARABIC LETTER HAH || 하. 자음[
|-
| U+062E || ﺥ || ARABIC LETTER KHAH || 하. 자음[
|-
| U+062F || د || ARABIC LETTER DAL || 달. 자음[
|-
| U+0630 || ذ || ARABIC LETTER THAL || 잘. 자음[
|-
| U+0631 || ر || ARABIC LETTER REH || 라. 자음[
|-
| U+0632 || ز || ARABIC LETTER ZAIN || 자인. 자음[
|-
| U+0633 || س || ARABIC LETTER SEEN || 신. 자음[
|-
| U+0634 || ﺵ || ARABIC LETTER SHEEN || 신. 자음[
|-
| U+0635 || ص || ARABIC LETTER SAD || 사드. 자음[sˤ]를 나타낸다. 인두음화된 [s]. || ṣ
|-
| U+0636 || ض || ARABIC LETTER DAD || 다드. 자음[dˤ]를 나타낸다. 인두음화된 [d]. 인두음화된 자음은 아랍어 이외의 언어에서는 드물며, 발음의 어려움 때문에 속어로 아랍어를 모국어로 하는 아랍인을 "다드의 민족"이라고 부르는 경우가 있다. || ḍ
|-
| U+0637 || ط || ARABIC LETTER TAH || 타. 자음[tˤ]를 나타낸다. 인두음화된 [t]. || ṭ
|-
| U+0638 || ﻅ || ARABIC LETTER ZAH || 자. 자음[ðˤ]를 나타낸다. 인두음화된 [ð]. || ẓ
|-
| U+0639 || ع || ARABIC LETTER AIN || 아인. 자음[
|-
| U+063A || غ || ARABIC LETTER GHAIN || 가인. 자음[
|-
| colspan="5" style="text-align:center;" | 초기 페르시아어 및 아제르바이잔어용 추가 문자
|-
| U+063B || ػ || ARABIC LETTER KEHEH WITH TWO DOTS ABOVE || 초기 페르시아어 (10~16세기) 자음[
|-
| U+063C || ؼ || ARABIC LETTER KEHEH WITH THREE DOTS BELOW || 초기 페르시아어 (10~16세기) 자음[
|-
| U+063D || ؽ || ARABIC LETTER FARSI YEH WITH INVERTED V || 아제르바이잔어 (1992~) 자음[
|-
| U+063E || ؾ || ARABIC LETTER FARSI YEH WITH TWO DOTS ABOVE || 초기 페르시아어 (10~16세기) 장모음[iː]를 나타낸다. 다른 어원에 의한 문법상의 차이와 강세의 유무를 명시하기 위해 사용되었다. ||
|-
| U+063F || ؿ || ARABIC LETTER FARSI YEH WITH THREE DOTS ABOVE || 초기 페르시아어 (10~16세기) 장모음[iː]를 나타낸다. 다른 어원에 의한 문법상의 차이와 강세의 유무를 명시하기 위해 사용되었다. ||
|-
| colspan="5" style="text-align:center;" | ISO 8859-6에 기반한 문자
|-
| U+0640 || ـ || ARABIC TATWEEL || 타트위르 또는 카시다 (kashida). 강조 및 할당 조정 등의 목적으로 문자를 늘리거나, 문법책 등에서 기본이 되는 문자 없이 단독 모음 기호 등을 표기하거나, 문자의 위치에 따른 자형 변화를 나타내기 위해 사용된다. 아람 문자, 하니피 로힝야 문자, 만다 문자, 마니 문자, 시편 파흘라비 문자, 소그드 문자, 시리아 문자에서도 사용된다. ||
|-
| U+0641 || ﻑ || ARABIC LETTER FEH || 파. 자음[
|-
| U+0642 || ﻕ || ARABIC LETTER QAF || 카프. 자음[
|-
| U+0643 || ك || ARABIC LETTER KAF || 카프. 자음[
|-
| U+0644 || ل || ARABIC LETTER LAM || 람. 자음[
|-
| U+0645 || م || ARABIC LETTER MEEM || 밈. 자음[
|-
| U+0646 || ن || ARABIC LETTER NOON || 눈. 자음[
|-
| U+0647 || ه || ARABIC LETTER HEH || 하. 자음[
|-
| U+0648 || ﻭ || ARABIC LETTER WAW || 와우. 자음[
|-
| U+0649 || ﻯ || ARABIC LETTER ALEF MAKSURA || 아랍어에서는 알리프의 변종 중 하나이며, 정관사가 붙어 장모음[aː]에서 단모음[a]로 변화했음을 나타내는 알리프 막수라로 사용된다. 현재는 발음되지 않지만, 원래는 어미에 [-j]를 동반했던 것에서 유래한다. 위구르어 등에서는 모음을 나타내기 위해, 어떤 위치에 쓰이든 아래에 점이 없는 야와 같은 형태의 문자로 사용된다. 자음[
|-
| U+064A || ﻱ || ARABIC LETTER YEH || 야. 자음[
|-
| colspan="5" style="text-align:center;" | ISO 8859-6 준거 모음 기호
|-
| U+064B || ً || ARABIC FATHATAN || 파타탄. 모음 [-an]을 나타내는 모음 기호 (샤클). ||
|-
| U+064C || ٌ || ARABIC DAMMATAN || 담마탄. 모음 [-un]을 나타내는 모음 기호 (샤클). 이형 문자로 한쪽이 180도 회전한 두 개의 얽힌 담마로 쓰이는 경우도 있다. ||
|-
| U+064D || ٍ || ARABIC KASRATAN || 카스라탄. 모음 [-in]을 나타내는 모음 기호 (샤클). ||
|-
| U+064E || َ || ARABIC FATHA || 파타. 모음 [-a]를 나타내는 모음 기호 (샤클). ||
|-
| U+064F || ُ || ARABIC DAMMA || 담마. 모음 [-u]를 나타내는 모음 기호 (샤클). ||
|-
| U+0650 || ِ || ARABIC KASRA || 카스라. 모음 [-i]를 나타내는 모음 기호 (샤클). ||
|-
| U+0651 || ّ || ARABIC SHADDA || 샤다. 자음자를 중자음으로 읽는 것을 나타내는 기호 (샤클). 한국어의 "ㅆ"에 해당한다. 마다가스카르어 (구 정서법)에서는 자음의 비음화를 나타낸다. ||
|-
| U+0652 || ْ || ARABIC SUKUN || 수쿤. 무모음이며, 자음만 발음함을 나타내는 기호 (샤클). 일부 꾸란에서는 장모음이 무시되었음을 나타내기 위해 사용된다. 일반적으로 작은 원으로 쓰이지만, 꾸란에서는 이형 문자인 U+06E1 ۡ과 같은 형태로 쓰이는 경우도 있다. 아제르바이잔어 (남아제르바이잔어), 투르크멘어 (이란, 아프가니스탄)에서는 자모 waw(U+0648 ﻭ)와 함께 사용되어 모음[
|-
| colspan="5" style="text-align:center;" | 결합용 마흐다 및 함자
|-
| U+0653 || ٓ || ARABIC MADDAH ABOVE || 마흐다. [aː]라는 장모음을 나타낸다. U+0622 참조. ||
|-
| U+0654 || ٔ || ARABIC HAMZA ABOVE || ||
|-
| U+0655 || ٕ || ARABIC HAMZA BELOW || ||
|-
| U+0656 || ٖ || ARABIC SUBSCRIPT ALEF || ||
|-
| U+0657 || ٗ || ARABIC INVERTED DAMMA || ||
|-
| U+0658 || ٘ || ARABIC MARK NOON GHUNNA || ||
|-
| U+0659 || ٙ || ARABIC ZWARAKAY || ||
|-
| U+065A || ٚ || ARABIC VOWEL SIGN SMALL V ABOVE || ||
|-
| U+065B || ٛ || ARABIC VOWEL SIGN INVERTED SMALL V ABOVE || ||
|-
| U+065C || ٜ || ARABIC VOWEL SIGN DOT BELOW || ||
|-
| U+065D || ٝ || ARABIC REVERSED DAMMA || ||
|-
| U+065E
3.1. 베이스라인 하단 마커
베이스라인 하단 마커는 아랍 문자에서 문자열 아래에 쓰이는 기호류를 가리킨다. 문자열 길이에 맞춰 기호 길이를 늘려 렌더링하는 것이 바람직하다.
| | 문자 || 설명 | ||
|---|---|---|
| U+0655 | 아랍 햄자 아래/ٕ아랍어 | ARABIC HAMZA BELOW |
| U+0656 | 아랍 아래첨자 알레프/ٖ아랍어 | ARABIC SUBSCRIPT ALEF |
| U+065C | 아랍 모음 기호 아래 점/ٜ아랍어 | ARABIC VOWEL SIGN DOT BELOW |
| U+065F | 아랍 물결 햄자 아래/ٟ아랍어 | ARABIC WAVY HAMZA BELOW |
| U+06E3 | 아랍 낮은 신/ۣ아랍어 | ARABIC SMALL LOW SEEN |
| U+06ED | 아랍 낮은 밈/ۭ아랍어 | ARABIC SMALL LOW MEEM |
3.2. 베이스라인 상단 마커
아랍 문자는 문자열 상단에 다양한 기호를 작성한다. 이 기호들은 문자열 길이에 맞춰 길이를 늘려 렌더링하는 것이 바람직하다.
| | 문자 || 이름 | ||
|---|---|---|
| U+0600 | ARABIC NUMBER SIGN | |
| U+0601 | ARABIC SIGN SANAH | |
| U+0602 | ARABIC FOOTNOTE MARKER | |
| U+0603 | ARABIC SIGN SAFHA | |
| U+0604 | ARABIC SIGN SAMVAT | |
| U+0605 | ARABIC NUMBER MARK ABOVE | |
| U+0610 | ؐ | ARABIC SIGN SALLALLAHOU ALAYHE WASSALLAM |
| U+0611 | ؑ | ARABIC SIGN ALAYHE ASSALLAM |
| U+0612 | ؒ | ARABIC SIGN RAHMATULLAH ALAYHE |
| U+0613 | ؓ | ARABIC SIGN RADI ALLAHOU ANHU |
| U+0614 | ؔ | ARABIC SIGN TAKHALLUS |
| U+0615 | ؕ | ARABIC SMALL HIGH TAH |
| U+0616 | ؖ | ARABIC SMALL HIGH LIGATURE ALEF WITH LAM WITH YEH |
| U+0617 | ؗ | ARABIC SMALL HIGH ZAIN |
| U+0618 | ؘ | ARABIC SMALL FATHA |
| U+0619 | ؙ | ARABIC SMALL DAMMA |
| U+061A | ؚ | ARABIC SMALL KASRA |
| U+0653 | ٓ | ARABIC MADDAH ABOVE |
| U+0654 | ٔ | ARABIC HAMZA ABOVE |
| U+0655 | ٕ | ARABIC HAMZA BELOW |
| U+0670 | ٰ | ARABIC LETTER SUPERSCRIPT ALEF |
| U+06D6 | ۖ | ARABIC SMALL HIGH LIGATURE SAD WITH LAM WITH ALEF MAKSURA |
| U+06D7 | ۗ | ARABIC SMALL HIGH LIGATURE QAF WITH LAM WITH ALEF MAKSURA |
| U+06D8 | ۘ | ARABIC SMALL HIGH MEEM INITIAL FORM |
| U+06D9 | ۙ | ARABIC SMALL HIGH LAM ALEF |
| U+06DA | ۚ | ARABIC SMALL HIGH JEEM |
| U+06DB | ۛ | ARABIC SMALL HIGH THREE DOTS |
| U+06DC | ۜ | ARABIC SMALL HIGH SEEN |
| U+06DF | ۟ | ARABIC SMALL HIGH ROUNDED ZERO |
| U+06E0 | ۠ | ARABIC SMALL HIGH UPRIGHT RECTANGULAR ZERO |
| U+06E1 | ۡ | ARABIC SMALL HIGH DOTLESS HEAD OF KHAH |
| U+06E2 | ۢ | ARABIC SMALL HIGH MEEM ISOLATED FORM |
| U+06E4 | ۤ | ARABIC SMALL HIGH MADDA |
| U+06E7 | ۧ | ARABIC SMALL HIGH YEH |
| U+06E8 | ۨ | ARABIC SMALL HIGH NOON |
| U+06EA | ۪ | ARABIC EMPTY CENTRE LOW STOP |
| U+06EB | ۫ | ARABIC EMPTY CENTRE HIGH STOP |
| U+06EC | ۬ | ARABIC ROUNDED HIGH STOP WITH FILLED CENTRE |
3.3. 근호
아랍 문자 유니코드 영역에는 근호를 나타내는 수학 기호 2종류가 있다. 이 기호들은 아랍 문자를 사용하는 수학 표기 체계에서 사용된다.
3.4. 문자 모양 기호
아랍 문자에서 직선을 나타내는 기호는 U+0640에 배당된 아랍 타트윌/ـ아랍어이다.
3.5. 약물
아랍 문자를 표기할 때 사용되는 여러 구두점들이 있다. 아랍 문자는 오른쪽에서 왼쪽으로 쓰기 때문에, 일부 구두점은 다른 언어에서 사용되는 것과 반대 방향으로 나타난다. 예를 들어, 아랍어 쉼표(،)는 U+060C에, 세미콜론(؛)은 U+061B에, 물음표(؟)는 U+061F에 배당되어 있다. 이 외에도 날짜 구분 기호(؍)는 U+060D, 아야의 끝을 나타내는 기호()는 U+06DD, 아랍 문자 마크(ALM)는 U+061C에 배당되어있다.
3.6. 통화 기호
아랍 문자의 통화 기호는 U+060B에 정의되어 있으며, 아프가니스탄의 통화 기호인 아프가니를 나타낸다. ؋
3.7. 시용 기호
| | 문자 || 설명 | ||
|---|---|---|
| U+060E | ؎ | 아랍어 시구 기호(ARABIC POETIC VERSE SIGN) |
| U+060F | ؏ | 아랍어 미스라 기호(ARABIC SIGN MISRA) |
3.8. 경칭용 기호
이슬람교에서는 종교적으로 중요한 인물의 이름을 표기할 때, 그 이름 위에 특별한 기도문을 나타내는 기호를 사용한다. 이러한 기호들은 존경과 경의를 표하는 의미를 담고 있다.
3.9. 코란 주석 기호
코란 주석 기호는 이슬람교의 성전인 쿠란에서 읽는 방법 등을 나타내기 위해 사용되는 기호류이다.
| | 문자 || 이름 | ||
|---|---|---|
| U+0600 | ARABIC NUMBER SIGN | |
| U+0601 | ARABIC SIGN SANAH | |
| U+0602 | ARABIC FOOTNOTE MARKER | |
| U+0603 | ARABIC SIGN SAFHA | |
| U+0604 | ARABIC SIGN SAMVAT | |
| U+0605 | ARABIC NUMBER MARK ABOVE | |
| U+060E | ؎ | ARABIC POETIC VERSE SIGN |
| U+060F | ؏ | ARABIC SIGN MISRA |
| U+0610 | ؐ | ARABIC SIGN SALLALLAHOU ALAYHE WASSALLAM |
| U+0611 | ؑ | ARABIC SIGN ALAYHE ASSALLAM |
| U+0612 | ؒ | ARABIC SIGN RAHMATULLAH ALAYHE |
| U+0613 | ؓ | ARABIC SIGN RADI ALLAHOU ANHU |
| U+0614 | ؔ | ARABIC SIGN TAKHALLUS |
| U+0615 | ؕ | ARABIC SMALL HIGH TAH |
| U+0616 | ؖ | ARABIC SMALL HIGH LIGATURE ALEF WITH LAM WITH YEH |
| U+0617 | ؗ | ARABIC SMALL HIGH ZAIN |
| U+0618 | ؘ | ARABIC SMALL FATHA |
| U+0619 | ؙ | ARABIC SMALL DAMMA |
| U+061A | ؚ | ARABIC SMALL KASRA |
| U+06DD | ARABIC END OF AYAH | |
| U+06DE | ۞ | ARABIC START OF RUB EL HIZB |
| U+06DF | ۟ | ARABIC SMALL HIGH ROUNDED ZERO |
| U+06E0 | ۠ | ARABIC SMALL HIGH UPRIGHT RECTANGULAR ZERO |
| U+06E1 | ۡ | ARABIC SMALL HIGH DOTLESS HEAD OF KHAH |
| U+06E2 | ۢ | ARABIC SMALL HIGH MEEM ISOLATED FORM |
| U+06E3 | ۣ | ARABIC SMALL LOW SEEN |
| U+06E4 | ۤ | ARABIC SMALL HIGH MADDA |
| U+06E5 | ۥ | ARABIC SMALL WAW |
| U+06E6 | ۦ | ARABIC SMALL YEH |
| U+06E7 | ۧ | ARABIC SMALL HIGH YEH |
| U+06E8 | ۨ | ARABIC SMALL HIGH NOON |
| U+06E9 | ۩ | ARABIC PLACE OF SAJDAH |
| U+06EA | ۪ | ARABIC EMPTY CENTRE LOW STOP |
| U+06EB | ۫ | ARABIC EMPTY CENTRE HIGH STOP |
| U+06EC | ۬ | ARABIC ROUNDED HIGH STOP WITH FILLED CENTRE |
| U+06ED | ۭ | ARABIC SMALL LOW MEEM |
3.10. 확장 아랍 기호
아랍 문자 유니코드 영역에는 고대 페르시아어에서 사용되던 기호가 포함되어 있다. 이 섹션에서는 10세기에서 11세기에 사용된 고대 페르시아어와 11세기에서 16세기에 사용된 초기 페르시아어(고전 페르시아어)에서 사용된 기호 중 하나의 문자를 소개한다.
| 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
| U+060x | ؆ | ؇ | ؈ | ؉ | ؊ | ؋ | ، | ؍ | ؎ | ؏ | ||||||
| U+061x | ؐ | ؑ | ؒ | ؓ | ؔ | ؕ | ؖ | ؗ | ؘ | ؙ | ؚ | ؛ | {{border | ؝ | ؞ | ؟ |
| U+062x | ؠ | ء | آ | أ | ؤ | إ | ئ | ا | ب | ة | ت | ث | ج | ح | خ | د |
| U+063x | ذ | ر | ز | س | ش | ص | ض | ط | ظ | ع | غ | ػ | ؼ | ؽ | ؾ | ؿ |
| U+064x | ـ | ف | ق | ك | ل | م | ن | ه | و | ى | ي | ً | ٌ | ٍ | َ | ُ |
| U+065x | ِ | ّ | ْ | ٓ | ٔ | ٕ | ٖ | ٗ | ٘ | ٙ | ٚ | ٛ | ٜ | ٝ | ٞ | ٟ |
| U+066x | ٠ | ١ | ٢ | ٣ | ٤ | ٥ | ٦ | ٧ | ٨ | ٩ | ٪ | ٫ | ٬ | ٭ | ٮ | ٯ |
| U+067x | ٰ | ٱ | ٲ | ٳ | ٴ | ٵ | ٶ | ٷ | ٸ | ٹ | ٺ | ٻ | ټ | ٽ | پ | ٿ |
| U+068x | ڀ | ځ | ڂ | ڃ | ڄ | څ | چ | ڇ | ڈ | ډ | ڊ | ڋ | ڌ | ڍ | ڎ | ڏ |
| U+069x | ڐ | ڑ | ڒ | ړ | ڔ | ڕ | ږ | ڗ | ژ | ڙ | ښ | ڛ | ڜ | ڝ | ڞ | ڟ |
| U+06Ax | ڠ | ڡ | ڢ | ڣ | ڤ | ڥ | ڦ | ڧ | ڨ | ک | ڪ | ګ | ڬ | ڭ | ڮ | گ |
| U+06Bx | ڰ | ڱ | ڲ | ڳ | ڴ | ڵ | ڶ | ڷ | ڸ | ڹ | ں | ڻ | ڼ | ڽ | ھ | ڿ |
| U+06Cx | ۀ | ہ | ۂ | ۃ | ۄ | ۅ | ۆ | ۇ | ۈ | ۉ | ۊ | ۋ | ی | ۍ | ێ | ۏ |
| U+06Dx | ې | ۑ | ے | ۓ | ۔ | ە | ۖ | ۗ | ۘ | ۙ | ۚ | ۛ | ۜ | ۞ | ۟ | |
| U+06Ex | ۠ | ۡ | ۢ | ۣ | ۤ | ۥ | ۦ | ۧ | ۨ | ۩ | ۪ | ۫ | ۬ | ۭ | ۮ | ۯ |
| U+06Fx | ۰ | ۱ | ۲ | ۳ | ۴ | ۵ | ۶ | ۷ | ۸ | ۹ | ۺ | ۻ | ۼ | ۽ | ۾ | ۿ |
| 주 | ||||||||||||||||
3.11. 제어 문자
유니코드에서 아랍 문자는 U+0600부터 U+06FF까지의 영역에 포함되어 있다. 이 영역에는 아랍 문자를 표기하기 위한 다양한 문자와 기호들이 포함되어 있는데, 그 중에는 특정 글리프나 문자 폭을 가지지 않는 제어 문자도 포함되어 있다.
이 소분류에는 바로 앞 문자가 아랍 문자임을 나타내기 위해 사용되는 제어 문자인 U+061C 아랍 문자 마크(ALM)가 수록되어 있다.
3.12. 카슈미르어용 추가 문자
카슈미르어는 인도와 파키스탄의 분쟁 지역인 카슈미르 지방에서 사용되는 언어로, 아랍 문자를 확장하여 표기한다. 이 섹션에서는 카슈미르어 표기에 사용되는 확장 문자 1개를 설명한다.
| 코드 | 문자 | 이름 |
|---|---|---|
| U+0620 | ؠ | ARABIC LETTER KASHMIRI YEH |
3.13. ISO 8859-6 기반 문자
ISO 8859-6에 준거하여 기본적인 아랍 문자의 자모를 수록하고 있다. 표에서 특별한 언급이 없는 한, 아랍 문자를 표기에 사용하는 많은 언어에서 공통적으로 사용된다.
본 항목에 속하는 아랍 문자의 이름은, ISO 8859-6에서 파생된 로마자 표기 규칙을 따른다. 이것들은, 아랍어 문자명의 실제 발음과는 다르며, 예를 들어 U+0628 ب ARABIC LETTER BEH는 일반적인 아랍어 발음으로는 "ba'"가 된다.
3.14. 초기 페르시아어 및 아제르바이잔어용 추가 문자
초기 페르시아어 및 아제르바이잔어에서 사용되는 아랍 문자의 확장 문자를 수록하고 있다. 초기 페르시아어는 10~11세기의 고대 페르시아어 및 11~16세기의 고전 페르시아어를 총칭하며, 과거 페르시아어의 정서법에 사용되었던 문자를 수록하고 있다.
한편, 아제르바이잔에서의 아제르바이잔어는 현재 로마자가 주요 표기 체계로 사용되고 있지만, 이란 등에서 사용되는 남아제르바이잔어에서는 현재도 아랍 문자로 표기하고 있다.
3.15. ISO 8859-6 기반 모음 기호
아랍 문자의 하위 분류에는 이슬람교의 성전인 꾸란이나 초보자용 또는 초등 교육용 교재 등에서 사용되는 모음 등을 표기하기 위한 보조 기호인 타쉬킬이 수록되어 있다. 타쉬킬은 아랍어에서 "타쉬킬을 치다"라는 동작을 나타내는 단어와 어원이 같다.
| | 문자 || 이름 | ||
|---|---|---|
| U+064B | ً | ARABIC FATHATAN |
| U+064C | ٌ | ARABIC DAMMATAN |
| U+064D | ٍ | ARABIC KASRATAN |
| U+064E | َ | ARABIC FATHA |
| U+064F | ُ | ARABIC DAMMA |
| U+0650 | ِ | ARABIC KASRA |
| U+0651 | ّ | ARABIC SHADDA |
| U+0652 | ْ | ARABIC SUKUN |
| U+0653 | ٓ | ARABIC MADDAH ABOVE |
| U+0654 | ٔ | ARABIC HAMZA ABOVE |
| U+0655 | ٕ | ARABIC HAMZA BELOW |
| U+0656 | ٖ | ARABIC SUBSCRIPT ALEF |
| U+0657 | ٗ | ARABIC INVERTED DAMMA |
| U+0658 | ٘ | ARABIC MARK NOON GHUNNA |
| U+0659 | ٙ | ARABIC ZWARAKAY |
| U+065A | ٚ | ARABIC VOWEL SIGN SMALL V ABOVE |
| U+065B | ٛ | ARABIC VOWEL SIGN INVERTED SMALL V ABOVE |
| U+065C | ٜ | ARABIC VOWEL SIGN DOT BELOW |
| U+065D | ٝ | ARABIC REVERSED DAMMA |
| U+065E | ٞ | ARABIC FATHA WITH TWO DOTS |
| U+065F | ٟ | ARABIC WAVY HAMZA BELOW |
| U+0670 | ٰ | ARABIC LETTER SUPERSCRIPT ALEF |
3.16. 결합용 마흐다 및 함자
샤클 중 ISO 8859-6에 포함되지 않았던 결합용 마다(maddah)와 함자(hamza)를 수록하고 있다.
| 코드 | 문자 | 이름 |
|---|---|---|
| U+0653 | ٓ | ARABIC MADDAH ABOVE |
| U+0654 | ٔ | ARABIC HAMZA ABOVE |
| U+0655 | ٕ | ARABIC HAMZA BELOW |
| U+0674 | ٴ | ARABIC LETTER HIGH HAMZA |
| U+0675 | ٵ | ARABIC LETTER HIGH HAMZA ALEF |
| U+0676 | ٶ | ARABIC LETTER HIGH HAMZA WAW |
| U+0677 | ٷ | ARABIC LETTER U WITH HAMZA ABOVE |
| U+0678 | ٸ | ARABIC LETTER HIGH HAMZA YEH |
| U+0681 | ځ | ARABIC LETTER HAH WITH HAMZA ABOVE |
| U+06C2 | ۂ | ARABIC LETTER HEH GOAL WITH HAMZA ABOVE |
| U+06D3 | ۓ | ARABIC LETTER YEH BARREE WITH HAMZA ABOVE |
3.17. 기타 결합 기호
아랍 문자를 사용하는 다양한 언어에서 사용되는 결합 기호들이 이 소분류에 포함된다.
| | 문자 || 설명 | ||
|---|---|---|
| U+064B | ً | ARABIC FATHATAN |
| U+064C | ٌ | ARABIC DAMMATAN |
| U+064D | ٍ | ARABIC KASRATAN |
| U+064E | َ | ARABIC FATHA |
| U+064F | ُ | ARABIC DAMMA |
| U+0650 | ِ | ARABIC KASRA |
| U+0651 | ّ | ARABIC SHADDA |
| U+0652 | ْ | ARABIC SUKUN |
| U+0653 | ٓ | ARABIC MADDAH ABOVE |
| U+0654 | ٔ | ARABIC HAMZA ABOVE |
| U+0655 | ٕ | ARABIC HAMZA BELOW |
| U+0656 | ٖ | ARABIC SUBSCRIPT ALEF |
| U+0657 | ٗ | ARABIC INVERTED DAMMA |
| U+0658 | ٘ | ARABIC MARK NOON GHUNNA |
| U+0659 | ٙ | ARABIC ZWARAKAY |
| U+065A | ٚ | ARABIC VOWEL SIGN SMALL V ABOVE |
| U+065B | ٛ | ARABIC VOWEL SIGN INVERTED SMALL V ABOVE |
| U+065C | ٜ | ARABIC VOWEL SIGN DOT BELOW |
| U+065D | ٝ | ARABIC REVERSED DAMMA |
| U+065E | ٞ | ARABIC FATHA WITH TWO DOTS |
| U+065F | ٟ | ARABIC WAVY HAMZA BELOW |
| U+0670 | ٰ | ARABIC LETTER SUPERSCRIPT ALEF |
3.18. 아라비아-인도 숫자
아랍어에서는 아라비아-인도 숫자를 일반적으로 사용한다. 이 숫자들은 원래 인도에서 탄생했으며, 그 전까지 아랍권에서는 아랍 문자를 숫자로 사용하는 전통적인 방식을 따랐다. 하지만 인도에서 숫자만을 위한 문자를 차용하면서 현재까지 사용되고 있다. 이러한 이유로 이 숫자들은 "인도 숫자"라고 불린다.
아라비아-인도 숫자는 아랍어에서 사용되지만, 이란, 아프가니스탄, 파키스탄, 인도 등에서 사용되는 숫자와는 글자 모양이 약간 다르다. 그래서 유니코드에서는 "Eastern Arabic-Indic digits" (U+06F0~06F9)라는 별도의 부호 영역으로 구분한다.
| | U+0660 || U+0661 || U+0662 || U+0663 || U+0664 || U+0665 || U+0666 || U+0667 || U+0668 || U+0669 |
|---|
| | ٠ || ١ || ٢ || ٣ || ٤ || ٥ || ٦ || ٧ || ٨ || ٩ |
| | ARABIC-INDIC DIGIT ZERO || ARABIC-INDIC DIGIT ONE || ARABIC-INDIC DIGIT TWO || ARABIC-INDIC DIGIT THREE || ARABIC-INDIC DIGIT FOUR || ARABIC-INDIC DIGIT FIVE || ARABIC-INDIC DIGIT SIX || ARABIC-INDIC DIGIT SEVEN || ARABIC-INDIC DIGIT EIGHT || ARABIC-INDIC DIGIT NINE |
| | U+06F0 || U+06F1 || U+06F2 || U+06F3 || U+06F4 || U+06F5 || U+06F6 || U+06F7 || U+06F8 || U+06F9 |
|---|
| | ۰ || ۱ || ۲ || ۳ || ۴ || ۵ || ۶ || ۷ || ۸ || ۹ |
| | EXTENDED ARABIC-INDIC DIGIT ZERO || EXTENDED ARABIC-INDIC DIGIT ONE || EXTENDED ARABIC-INDIC DIGIT TWO || EXTENDED ARABIC-INDIC DIGIT THREE || EXTENDED ARABIC-INDIC DIGIT FOUR || EXTENDED ARABIC-INDIC DIGIT FIVE || EXTENDED ARABIC-INDIC DIGIT SIX || EXTENDED ARABIC-INDIC DIGIT SEVEN || EXTENDED ARABIC-INDIC DIGIT EIGHT || EXTENDED ARABIC-INDIC DIGIT NINE |
3.19. 고대 문자
초기 아랍 문자는 점으로 글자를 구분하는 방식이 없었다. 이 섹션에서는 그러한 글자 모양을 일부 설명한다.
| 코드값 | 글자 | 설명 |
|---|---|---|
| U+066E | ٮ | 점 없는 베 (베) |
| U+066F | ٯ | 점 없는 카프 (카프) |
3.20. 모음 기호
샤클 중 ISO 8859-6에 포함되지 않은 것은 다음과 같다.
| | 문자 || 이름 | ||
|---|---|---|
| U+0618 | ؘ | ARABIC SMALL FATHA |
| U+0619 | ؙ | ARABIC SMALL DAMMA |
| U+061A | ؚ | ARABIC SMALL KASRA |
| U+0653 | ٓ | ARABIC MADDAH ABOVE |
| U+0654 | ٔ | ARABIC HAMZA ABOVE |
| U+0655 | ٕ | ARABIC HAMZA BELOW |
| U+0656 | ٖ | ARABIC SUBSCRIPT ALEF |
| U+0657 | ٗ | ARABIC INVERTED DAMMA |
| U+0658 | ٘ | ARABIC MARK NOON GHUNNA |
| U+0659 | ٙ | ARABIC ZWARAKAY |
| U+065A | ٚ | ARABIC VOWEL SIGN SMALL V ABOVE |
| U+065B | ٛ | ARABIC VOWEL SIGN INVERTED SMALL V ABOVE |
| U+065C | ٜ | ARABIC VOWEL SIGN DOT BELOW |
| U+065D | ٝ | ARABIC REVERSED DAMMA |
| U+065E | ٞ | ARABIC FATHA WITH TWO DOTS |
| U+065F | ٟ | ARABIC WAVY HAMZA BELOW |
3.21. 확장 아랍 문자
아랍 문자는 아랍어 외에도 페르시아어, 우르두어, 파슈토어, 쿠르드어, 위구르어, 카자흐어, 아제르바이잔어 등 아랍 문자를 사용하는 여러 언어에서 사용되는 확장 문자를 포함한다.
| 코드 | 문자 | 이름 |
|---|---|---|
| U+0679 | ٹ | ARABIC LETTER TTEH |
| U+067A | ٺ | ARABIC LETTER TTEHEH |
| U+067B | ٻ | ARABIC LETTER BEEH |
| U+067C | ټ | ARABIC LETTER TEH WITH RING |
| U+067D | ٽ | ARABIC LETTER TEH WITH THREE DOTS ABOVE DOWNWARDS |
| U+067E | پ | ARABIC LETTER PEH |
| U+067F | ٿ | ARABIC LETTER TEHEH |
| U+0680 | ڀ | ARABIC LETTER BEHEH |
| U+0681 | ځ | ARABIC LETTER HAH WITH HAMZA ABOVE |
| U+0682 | ڂ | ARABIC LETTER HAH WITH TWO DOTS VERTICAL ABOVE |
| U+0683 | ڃ | ARABIC LETTER NYEH |
| U+0684 | ڄ | ARABIC LETTER DYEH |
| U+0685 | څ | ARABIC LETTER HAH WITH THREE DOTS ABOVE |
| U+0686 | چ | ARABIC LETTER TCHEH |
| U+0687 | ڇ | ARABIC LETTER TCHEHEH |
| U+0688 | ڈ | ARABIC LETTER DDAL |
| U+0689 | ډ | ARABIC LETTER DAL WITH RING |
| U+068A | ڊ | ARABIC LETTER DAL WITH DOT BELOW |
| U+068B | ڋ | ARABIC LETTER DAL WITH DOT BELOW AND SMALL TAH |
| U+068C | ڌ | ARABIC LETTER DAHAL |
| U+068D | ڍ | ARABIC LETTER DDAHAL |
| U+068E | ڎ | ARABIC LETTER DUL |
| U+068F | ڏ | ARABIC LETTER DAL WITH THREE DOTS ABOVE DOWNWARDS |
| U+0690 | ڐ | ARABIC LETTER DAL WITH FOUR DOTS ABOVE |
| U+0691 | ڑ | ARABIC LETTER RREH |
| U+0692 | ڒ | ARABIC LETTER REH WITH SMALL V |
| U+0693 | ړ | ARABIC LETTER REH WITH RING |
| U+0694 | ڔ | ARABIC LETTER REH WITH DOT BELOW |
| U+0695 | ڕ | ARABIC LETTER REH WITH SMALL V BELOW |
| U+0696 | ږ | ARABIC LETTER REH WITH DOT BELOW AND DOT ABOVE |
| U+0697 | ڗ | ARABIC LETTER REH WITH TWO DOTS ABOVE |
| U+0698 | ژ | ARABIC LETTER JEH |
| U+0699 | ڙ | ARABIC LETTER REH WITH FOUR DOTS ABOVE |
| U+069A | ښ | ARABIC LETTER SEEN WITH DOT BELOW AND DOT ABOVE |
| U+069B | ڛ | ARABIC LETTER SEEN WITH THREE DOTS BELOW |
| U+069C | ڜ | ARABIC LETTER SEEN WITH THREE DOTS BELOW AND THREE DOTS ABOVE |
| U+069D | ڝ | ARABIC LETTER SAD WITH TWO DOTS BELOW |
| U+069E | ڞ | ARABIC LETTER SAD WITH THREE DOTS ABOVE |
| U+069F | ڟ | ARABIC LETTER TAH WITH THREE DOTS ABOVE |
| U+06A0 | ڠ | ARABIC LETTER AIN WITH THREE DOTS ABOVE |
| U+06A1 | ڡ | ARABIC LETTER DOTLESS FEH |
| U+06A2 | ڢ | ARABIC LETTER FEH WITH DOT MOVED BELOW |
| U+06A3 | ڣ | ARABIC LETTER FEH WITH DOT BELOW |
| U+06A4 | ڤ | ARABIC LETTER VEH |
| U+06A5 | ڥ | ARABIC LETTER FEH WITH THREE DOTS BELOW |
| U+06A6 | ڦ | ARABIC LETTER PEHEH |
| U+06A7 | ڧ | ARABIC LETTER QAF WITH DOT ABOVE |
| U+06A8 | ڨ | ARABIC LETTER QAF WITH THREE DOTS ABOVE |
| U+06A9 | ک | ARABIC LETTER KEHEH |
| U+06AA | ڪ | ARABIC LETTER SWASH KAF |
| U+06AB | ګ | ARABIC LETTER KAF WITH RING |
| U+06AC | ڬ | ARABIC LETTER KAF WITH DOT ABOVE |
| U+06AD | ڭ | ARABIC LETTER NG |
| U+06AE | ڮ | ARABIC LETTER KAF WITH THREE DOTS BELOW |
| U+06AF | گ | ARABIC LETTER GAF |
| U+06B0 | ڰ | ARABIC LETTER GAF WITH RING |
| U+06B1 | ڱ | ARABIC LETTER NGOEH |
| U+06B2 | ڲ | ARABIC LETTER GAF WITH TWO DOTS BELOW |
| U+06B3 | ڳ | ARABIC LETTER GUEH |
| U+06B4 | ڴ | ARABIC LETTER GAF WITH THREE DOTS ABOVE |
| U+06B5 | ڵ | ARABIC LETTER LAM WITH SMALL V |
| U+06B6 | ڶ | ARABIC LETTER LAM WITH DOT ABOVE |
| U+06B7 | ڷ | ARABIC LETTER LAM WITH THREE DOTS ABOVE |
| U+06B8 | ڸ | ARABIC LETTER LAM WITH THREE DOTS BELOW |
| U+06B9 | ڹ | ARABIC LETTER NOON WITH DOT BELOW |
| U+06BA | ں | ARABIC LETTER NOON GHUNNA |
| U+06BB | ڻ | ARABIC LETTER RNOON |
| U+06BC | ڼ | ARABIC LETTER NOON WITH RING |
| U+06BD | ڽ | ARABIC LETTER NOON WITH THREE DOTS ABOVE |
| U+06BE | ھ | ARABIC LETTER HEH DOACHASHMEE |
| U+06BF | ڿ | ARABIC LETTER TCHEH WITH DOT ABOVE |
| U+06C0 | ۀ | ARABIC LETTER HEH WITH YEH ABOVE |
| U+06C1 | ہ | ARABIC LETTER HEH GOAL |
| U+06C2 | ۂ | ARABIC LETTER HEH GOAL WITH HAMZA ABOVE |
| U+06C3 | ۃ | ARABIC LETTER TEH MARBUTA GOAL |
| U+06C4 | ۄ | ARABIC LETTER WAW WITH RING |
| U+06C5 | ۅ | ARABIC LETTER KIRGHIZ OE |
| U+06C6 | ۆ | ARABIC LETTER OE |
| U+06C7 | ۇ | ARABIC LETTER U |
| U+06C8 | ۈ | ARABIC LETTER YU |
| U+06C9 | ۉ | ARABIC LETTER KIRGHIZ YU |
| U+06CA | ۊ | ARABIC LETTER WAW WITH TWO DOTS ABOVE |
| U+06CB | ۋ | ARABIC LETTER VE |
| U+06CC | ی | ARABIC LETTER FARSI YEH |
| U+06CD | ۍ | ARABIC LETTER YEH WITH TAIL |
| U+06CE | ێ | ARABIC LETTER YEH WITH SMALL V |
| U+06CF | ۏ | ARABIC LETTER WAW WITH DOT ABOVE |
| U+06D0 | ې | ARABIC LETTER E |
| U+06D1 | ۑ | ARABIC LETTER YEH WITH THREE DOTS BELOW |
| U+06D2 | ے | ARABIC LETTER YEH BARREE |
| U+06D3 | ۓ | ARABIC LETTER YEH BARREE WITH HAMZA ABOVE |
| U+06D5 | ە | ARABIC LETTER AE |
| U+06EE | ۮ | ARABIC LETTER DAL WITH INVERTED V |
| U+06EF | ۯ | ARABIC LETTER REH WITH INVERTED V |
| U+06FA | ۺ | ARABIC LETTER SHEEN WITH DOT BELOW |
| U+06FB | ۻ | ARABIC LETTER DAD WITH DOT BELOW |
| U+06FC | ۼ | ARABIC LETTER GHAIN WITH DOT BELOW |
| U+06FF | ۿ | ARABIC LETTER HEH WITH INVERTED V |
3.22. 비권장 문자
유니코드에서 사용이 권장되지 않는 문자는 다음과 같다.
| | 문자 || 이름 | ||
|---|---|---|
| U+0673 | ٳ | ARABIC LETTER ALEF WITH WAVY HAMZA BELOW |
이 문자는 다른 부호화 규격과의 호환성을 위해 추가되었지만, 현재 유니코드에서는 사용이 권장되지 않는다.
3.23. 고위치 함자
유니코드에서 고위치 함자는 카자흐어의 이중 문자를 표기할 때 사용되었던 문자이다. 이 문자는 U+0674에 해당하며, 현재 카자흐스탄에서는 키릴 문자를 사용하기에 일반적으로 폐지되었으나, 중화인민공화국 신장 위구르 자치구의 카자흐인들은 여전히 아랍 문자를 사용한다.
3.24. 카자흐어용 이중 자모
카자흐어 이중 문자(Digraphic letters)는 부호화되었지만, 호환성 분해는 원하는 표시 순서를 반영하지 않는 문자를 설명한다. 따라서, 이러한 카자흐어 이중 문자의 표기에는 요소의 올바른 순서를 가진 두 문자의 철자를 사용해야 한다.
3.25. 파르카리어용 확장 아랍 문자
파키스탄의 신드주 등에서 사용되는 파카리・콜리 어/Parkari Koli language영어(또는 단순히 파카리 어라고도 불림)용 확장 아랍 문자를 수록하고 있다.
3.26. 동방 아라비아-인도 숫자
이란, 파키스탄, 인도의 아랍 문자를 사용하는 언어에서 사용되는 아라비아 숫자는 다음과 같다.
| 문자 | 설명 |
|---|---|
| ٠ | EXTENDED ARABIC-INDIC DIGIT ZERO |
| ۱ | EXTENDED ARABIC-INDIC DIGIT ONE |
| ۲ | EXTENDED ARABIC-INDIC DIGIT TWO |
| ۳ | EXTENDED ARABIC-INDIC DIGIT THREE |
| ۴ | EXTENDED ARABIC-INDIC DIGIT FOUR |
| ۵ | EXTENDED ARABIC-INDIC DIGIT FIVE |
| ۶ | EXTENDED ARABIC-INDIC DIGIT SIX |
| ۷ | EXTENDED ARABIC-INDIC DIGIT SEVEN |
| ۸ | EXTENDED ARABIC-INDIC DIGIT EIGHT |
| ۹ | EXTENDED ARABIC-INDIC DIGIT NINE |
페르시아어, 신드어, 우르두어 등에서 사용되며, 일부 숫자는 아랍어에서 사용되는 것과 다른 자형을 사용한다. 우르두어에서는 일부 숫자에 대해 아랍어, 페르시아어와도 다른 자형이 사용되지만, 페르시아어와 부호 위치가 통일되어 있다.
3.27. 신디어용 기호
신드어는 파키스탄의 신드주 등에서 사용되며, 신드어에서 사용되는 약어 기호는 다음과 같다.
| 코드 | 문자 | 이름 |
|---|---|---|
| U+06FD | ۽ | ARABIC SIGN SINDHI AMPERSAND |
| U+06FE | ۾ | ARABIC SIGN SINDHI POSTPOSITION MEN |
4. 특징
4.1. 문자 연결
4.2. 오른쪽에서 왼쪽으로 쓰기
4.3. 모음 표기
5. 한국과의 관계
5.1. 역사적 관계
5.2. 현대 한국 사회에서 활용
6. 유니코드
wikitext
| 아랍 문자 | ||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| | 0 || 1 || 2 || 3 || 4 || 5 || 6 || 7 || 8 || 9 || A || B || C || D || E || F | ||||||||||||||||
| U+060x | | | | | | | ؆ | ؇ | ؈ | ؉ | ؊ | ؋ | ، | ؍ | ؎ | ؏ |
| U+061x | ؐ | ؑ | ؒ | ؓ | ؔ | ؕ | ؖ | ؗ | ؘ | ؙ | ؚ | ؛ | ALM | ؝ | ؞ | ؟ |
| U+062x | ؠ | ء | آ | أ | ؤ | إ | ئ | ا | ب | ة | ت | ث | ج | ح | خ | د |
| U+063x | ذ | ر | ز | س | ش | ص | ض | ط | ظ | ع | غ | ػ | ؼ | ؽ | ؾ | ؿ |
| U+064x | ـ | ف | ق | ك | ل | م | ن | ه | و | ى | ي | ً | ٌ | ٍ | َ | ُ |
| U+065x | ِ | ّ | ْ | ٓ | ٔ | ٕ | ٖ | ٗ | ٘ | ٙ | ٚ | ٛ | ٜ | ٝ | ٞ | ٟ |
| U+066x | ٠ | ١ | ٢ | ٣ | ٤ | ٥ | ٦ | ٧ | ٨ | ٩ | ٪ | ٫ | ٬ | ٭ | ٮ | ٯ |
| U+067x | ٰ | ٱ | ٲ | ٳ | ٴ | ٵ | ٶ | ٷ | ٸ | ٹ | ٺ | ٻ | ټ | ٽ | پ | ٿ |
| U+068x | ڀ | ځ | ڂ | ڃ | ڄ | څ | چ | ڇ | ڈ | ډ | ڊ | ڋ | ڌ | ڍ | ڎ | ڏ |
| U+069x | ڐ | ڑ | ڒ | ړ | ڔ | ڕ | ږ | ڗ | ژ | ڙ | ښ | ڛ | ڜ | ڝ | ڞ | ڟ |
| U+06Ax | ڠ | ڡ | ڢ | ڣ | ڤ | ڥ | ڦ | ڧ | ڨ | ک | ڪ | ګ | ڬ | ڭ | ڮ | گ |
| U+06Bx | ڰ | ڱ | ڲ | ڳ | ڴ | ڵ | ڶ | ڷ | ڸ | ڹ | ں | ڻ | ڼ | ڽ | ھ | ڿ |
| U+06Cx | ۀ | ہ | ۂ | ۃ | ۄ | ۅ | ۆ | ۇ | ۈ | ۉ | ۊ | ۋ | ی | ۍ | ێ | ۏ |
| U+06Dx | ې | ۑ | ے | ۓ | ۔ | ە | ۖ | ۗ | ۘ | ۙ | ۚ | ۛ | ۜ | | ۞ | ۟ |
| U+06Ex | ۠ | ۡ | ۢ | ۣ | ۤ | ۥ | ۦ | ۧ | ۨ | ۩ | ۪ | ۫ | ۬ | ۭ | ۮ | ۯ |
| U+06Fx | ۰ | ۱ | ۲ | ۳ | ۴ | ۵ | ۶ | ۷ | ۸ | ۹ | ۺ | ۻ | ۼ | ۽ | ۾ | ۿ |
| 주 | ||||||||||||||||
6.1. 코드표
| 아랍 문자 | ||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| | 0 || 1 || 2 || 3 || 4 || 5 || 6 || 7 || 8 || 9 || A || B || C || D || E || F | ||||||||||||||||
| U+060x | | | | | | | ؆ | ؇ | ؈ | ؉ | ؊ | ؋ | ، | ؍ | ؎ | ؏ |
| U+061x | ؐ | ؑ | ؒ | ؓ | ؔ | ؕ | ؖ | ؗ | ؘ | ؙ | ؚ | ؛ | ALM | ؝ | ؞ | ؟ |
| U+062x | ؠ | ء | آ | أ | ؤ | إ | ئ | ا | ب | ة | ت | ث | ج | ح | خ | د |
| U+063x | ذ | ر | ز | س | ش | ص | ض | ط | ظ | ع | غ | ػ | ؼ | ؽ | ؾ | ؿ |
| U+064x | ـ | ف | ق | ك | ل | م | ن | ه | و | ى | ي | ً | ٌ | ٍ | َ | ُ |
| U+065x | ِ | ّ | ْ | ٓ | ٔ | ٕ | ٖ | ٗ | ٘ | ٙ | ٚ | ٛ | ٜ | ٝ | ٞ | ٟ |
| U+066x | ٠ | ١ | ٢ | ٣ | ٤ | ٥ | ٦ | ٧ | ٨ | ٩ | ٪ | ٫ | ٬ | ٭ | ٮ | ٯ |
| U+067x | ٰ | ٱ | ٲ | ٳ | ٴ | ٵ | ٶ | ٷ | ٸ | ٹ | ٺ | ٻ | ټ | ٽ | پ | ٿ |
| U+068x | ڀ | ځ | ڂ | ڃ | ڄ | څ | چ | ڇ | ڈ | ډ | ڊ | ڋ | ڌ | ڍ | ڎ | ڏ |
| U+069x | ڐ | ڑ | ڒ | ړ | ڔ | ڕ | ږ | ڗ | ژ | ڙ | ښ | ڛ | ڜ | ڝ | ڞ | ڟ |
| U+06Ax | ڠ | ڡ | ڢ | ڣ | ڤ | ڥ | ڦ | ڧ | ڨ | ک | ڪ | ګ | ڬ | ڭ | ڮ | گ |
| U+06Bx | ڰ | ڱ | ڲ | ڳ | ڴ | ڵ | ڶ | ڷ | ڸ | ڹ | ں | ڻ | ڼ | ڽ | ھ | ڿ |
| U+06Cx | ۀ | ہ | ۂ | ۃ | ۄ | ۅ | ۆ | ۇ | ۈ | ۉ | ۊ | ۋ | ی | ۍ | ێ | ۏ |
| U+06Dx | ې | ۑ | ے | ۓ | ۔ | ە | ۖ | ۗ | ۘ | ۙ | ۚ | ۛ | ۜ | | ۞ | ۟ |
| U+06Ex | ۠ | ۡ | ۢ | ۣ | ۤ | ۥ | ۦ | ۧ | ۨ | ۩ | ۪ | ۫ | ۬ | ۭ | ۮ | ۯ |
| U+06Fx | ۰ | ۱ | ۲ | ۳ | ۴ | ۵ | ۶ | ۷ | ۸ | ۹ | ۺ | ۻ | ۼ | ۽ | ۾ | ۿ |
| 주 | ||||||||||||||||
6.2. 유니코드 버전별 역사
유니코드 버전 업데이트에 따라 아랍 문자가 추가되거나 변경된 내역은 다음과 같다.
* 1.0.0 버전에는 169개의 아랍 문자가 U+060C, 061B, 061F, 0621..063A, 0640..0652, 0660..066C, 0670..06B7, 06BA..06BE, 06C0..06CE, 06D0..06D5, 06F0..06F9 코드 영역에 추가되었다. 이후 여러 차례 회의를 거쳐 아랍 문자 관련 논의가 진행되었다.
2000년 8월 8일, UTC 회의 #83 의사록에서 아랍 숫자 구분 기호에 대한 논의가 있었다.
2001년 6월 18일, UTC/L2 회의 의사록에서 아랍 필기체 연결에 대한 논의가 있었다.
2001년 11월 6일, UTC/L2 회의 #88 의사록에서 U+06D5의 연결 동작 속성에 대한 논의가 있었다.
2009년 5월 20일, UTC #119 / L2 #216 회의에서 U+0673(ARABIC LETTER ALEF WITH WAVY HAMZA BELOW) 문자를 폐지하는 안건이 상정되었다.
** 2009년 11월 10일, UTC #121 / L2 #218 회의에서 U+0673 문자가 폐지되었다.
* 1.1 버전에는 U+066D, 06D6..06ED 코드 영역에 25개의 문자가 추가되었다.
* 3.0 버전에는 U+0653..0655 코드 영역에 3개의 문자, U+06B8..06B9, 06BF, 06CF, 06FA..06FE 코드 영역에 9개의 문자가 추가되었다.
* 3.2 버전에는 U+066E..066F 코드 영역에 2개의 문자가 추가되었다.
* 4.0 버전에는 U+0600..0602, 060D..060E, 0610..0614, 0656..0658 코드 영역에 13개의 문자, U+0603, 060F, 0615 코드 영역에 3개의 문자, U+06EE..06EF, 06FF 코드 영역에 3개의 문자가 추가되었다.
* 4.1 버전에는 U+060B 코드 영역에 1개의 문자, U+061E, 065A..065C 코드 영역에 4개의 문자, U+0659 코드 영역에 1개의 문자, U+065D..065E 코드 영역에 2개의 문자가 추가되었다.
* 5.1 버전에는 U+0606..060A 코드 영역에 5개의 문자, U+0616, 063B..063F 코드 영역에 6개의 문자, U+0617..061A 코드 영역에 4개의 문자가 추가되었다.
* 6.0 버전에는 U+0620, 065F 코드 영역에 2개의 문자가 추가되었다.
* 6.1 버전에는 U+0604 코드 영역에 1개의 문자가 추가되었다.
* 6.3 버전에는 U+061C 코드 영역에 1개의 문자가 추가되었다.
* 7.0 버전에는 U+0605 코드 영역에 1개의 문자가 추가되었다.
* 14.0 버전에는 U+061D 코드 영역에 1개의 문자가 추가되었다.