공백 문자
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
공백 문자는 단어를 구분하기 위해 사용되는 문자이며, 언어와 컴퓨터 환경에서 다양한 방식으로 활용된다. 영어와 같은 언어는 단어 사이에 공백을 사용하지만, 고대 라틴어, 고대 히브리어 등에서는 공백을 사용하지 않기도 했다. 컴퓨터에서는 스페이스, 탭, 개행 등 다양한 형태의 공백 문자가 존재하며, 프로그래밍 언어와 문서 편집 소프트웨어에서 텍스트의 구조를 나타내는 데 사용된다. 유니코드에는 다양한 종류의 공백 문자가 정의되어 있으며, URL에서 공백은 `%20`으로 인코딩된다.
더 읽어볼만한 페이지
- 무 (철학) - 절대 영도
절대영도는 열역학적으로 정의된 최저 온도로, 물질 입자의 에너지가 최소 상태이며, 엔트로피가 0이 되지만, 양자역학적 영점 진동으로 인해 실험적으로 도달할 수 없고, 극저온에서 특이한 양자 현상이 나타나며, 열역학 제3법칙에 따라 유한 번의 조작으로 도달할 수 없다. - 무 (철학) - 무색
무색은 특정한 색깔이 없는 상태로, 투명, 흰색, 무채색 등의 의미로 사용되며 투명과 밀접한 관련이 있지만 동일한 의미는 아니다. - 제어 문자 - 이스케이프 시퀀스
이스케이프 시퀀스는 컴퓨터 주변 장치의 상태를 변경하는 문자열로, 초기 보도 코드에서 시작하여 ASCII 표준을 거쳐 발전했으며 터미널, 프린터, 모뎀 제어 등에 사용되고, C 언어에서는 백슬래시를 사용하여 특수 문자를 표현한다. - 제어 문자 - 캐리지 리턴
캐리지 리턴은 출력 장치에서 커서를 현재 줄의 시작 위치로 이동시키는 제어 문자로, 텔레타이프 단말기나 타자기에서 유래되었으며, 줄 바꿈 문자와 함께 개행을 나타내거나 텍스트 줄의 끝을 나타내는 신호로 사용된다. - 쓰기 - 복사
복사는 예술, 문학, 사무, 생물, 디지털 환경 등에서 정보나 물체를 재생산하는 과정으로, 시각 예술에서의 작품 복사, 문학에서의 필사, 생물학적 DNA 복제, 디지털 데이터 복제 등을 포함하며, 저작권법에 의해 제한될 수 있지만, 도서관-저작권 단체 협력 및 자유이용마크 확대로 용이성이 증가하고 있다. - 쓰기 - 시학 (아리스토텔레스)
《시학》은 아리스토텔레스가 저술한 책으로, 시의 본질과 창작 원리를 탐구하며 미메시스, 카타르시스 등의 개념을 제시하고 비극의 구성 요소를 분석하여 서구 문예 비평에 영향을 미쳤다.
공백 문자 | |
---|---|
공백 | |
![]() | |
유니코드 | U+0020 |
HTML 엔티티 | |
설명 | 단어 또는 문자를 분리하는 데 사용되는 빈 공간 |
관련 문자 | NO-BREAK SPACE (줄 바꿈 없는 공백), 다른 유형의 공백 |
일반적인 속성 | |
종류 | 문장 부호 |
쓰이는 곳 | 컴퓨터 과학 타이포그래피 |
용도 | |
언어 | 자연어 프로그래밍 언어 |
목적 | 단어 분리 및 가독성 향상 |
2. 자연어에서의 사용
자연어에서 공백은 단어와 단어를 구분하는 데 사용되지만, 모든 언어가 이 규칙을 따르는 것은 아니다.
단어 간 간격은 알쿠인에 의한 카롤링거 소문자가 만들어지고 필사자들이 이를 채택한 후 시작되었다. 간격은 르네상스 이탈리아와 프랑스에서 표준이 되었고, 16세기 말에는 비잔티움 제국으로, 17세기에는 키릴 문자를 사용하는 슬라브어로, 그리고 근대에 와서야 현대 산스크리트어에 도입되었다.[2]
일본어에서는 사람들의 성과 이름을 구분하거나, 생략된 일본어 조사 (특히 주제를 나타내는 조사 ''wa'')를 표시하거나, 특정 문학적 또는 예술적 효과를 위해 공백을 사용할 수 있다. 그러나 현대 한국어는 서구의 영향을 받아 공백을 필수적으로 사용하는데, 이는 한글의 음성적 특성상 모호성을 피하기 위해 단어 구분 기호가 필요하기 때문이다. 한국어에서는 명사 덩어리, 명사와 한국어 조사, 형용사, 동사를 구분하기 위해 공백을 사용한다. 특정 복합어 또는 구의 경우, 공백을 사용할 수도 있고 사용하지 않을 수도 있다. 예를 들어 "대한민국"은 일반적으로 대한민국한국어과 같이 공백 없이 표기하며, 대한 민국한국어과 같이 공백을 넣어 표기하지 않는다.
독일어에서는 단어를 강조하거나, 강조하여 발음해야 할 단어를 나타내기 위해 하나의 단어 안에서 글자와 글자 사이를 띄우기도 한다. 예를 들어, "das Kind" 에서 "das" 를 강조하기 위해서는, "d a s Kind" 와 같이 한다. 이 경우에는 단어 간의 공백이 아니므로, 저스티피케이션을 위한 신축 대상이 되지 않는다.
문자마다 폭이 다른 서체(프로포셔널 폰트)의 경우, 문자 간격을 좁힘으로써 단어를 형성하는 문자의 연속을 자연스럽게 보이게 하는 커닝 기법도 있다.
2. 1. 단어 사이
현대 영어는 단어를 구분하기 위해 공백을 사용하지만, 모든 언어가 이 관례를 따르는 것은 아니다. 라틴어에서는 서기 600~800년경까지 단어 사이에 공백을 사용하지 않았다. 고대 히브리어와 아랍어는 부분적으로 모음의 부재로 인한 명확성의 부족을 보완하기 위해 공백을 사용했다.[1] 초기 그리스 문자도 공백 대신 단어를 구분하기 위해 인터펑트를 사용했지만, 이 관행은 곧 scriptura continuala에 의해 대체되었다.CJK 언어(한자, 가나)를 사용하는 언어에서는 공백을 사용하지 않는 경우가 많다. 일본어에서는 때때로 사람들의 성과 이름을 구분하거나, 특정 문학적 효과를 위해 공백을 사용할 수 있다. 그러나 현대 한국어는 서구의 영향을 받아 공백을 사용하며, 한글의 음성적 특성상 모호성을 피하기 위해 단어 구분 기호가 필요하기 때문이다. 한국어에서는 명사 덩어리, 명사와 한국어 조사, 형용사, 동사를 구분하기 위해 공백을 사용한다.
룬 문자 텍스트는 단어를 구분하기 위해 인터펑트와 유사하거나 콜론과 유사한 구두점을 사용한다.
2. 2. 문장 사이
라틴 문자를 사용하는 언어는 15세기 활판 인쇄술의 등장 이후 다양한 문장 간격 방법을 사용해왔다.- 하나의 공백 (때로는 프렌치 간격이라고도 함). 이는 ISO 기본 라틴 문자를 사용하는 대부분의 국가에서 출판물, 최종 작성물, 그리고 디지털(월드 와이드 웹) 미디어에 일반적인 관례이다.[3] 웹 브라우저는 텍스트를 표시할 때 소스 코드에서 단일 공백과 여러 공백을 구분하지 않으며, 텍스트에 "white-space" CSS 속성이 지정된 경우가 아니면 그렇다. 이것이 설정되지 않으면 공백 문자열을 단일 공백으로 축소하여 HTML 소스 코드를 기계가 읽기 쉬운 방식으로 배치할 수 있지만, 렌더링된 페이지의 간격을 제어하는 데는 어려움이 있다.[4]
- 두 개의 공백 (''영문 간격''). 이 관례는 고정폭 글꼴이 타자기에서 사용되면서 생겨났다고 주장되기도 한다.[5] 그러나 단어보다 문장 사이에 더 많은 간격을 두라는 지시는 수세기 전부터 있었으며, 타자기에 두 개의 공백을 두는 것은 조판공들이 가독성을 개선하기 위해 이전 규칙을 적용한 것에 가장 근접한 것이었다.[6] 더 넓은 간격은 제2차 세계 대전까지 조판공과 타자수 모두가 계속 사용했으며, 이후 조판공은 출판된 인쇄물에서 문장 사이에 단어 간격을 사용하는 것으로 점차 전환했지만, 타자수는 두 개의 공백을 사용하는 관행을 계속했다.[7][8][9][10][11][12][13][14][15][16][17]
- 하나의 넓어진 공백, 일반적으로 단어 간격의 1.3배에서 2배 미만. 이 간격은 19세기 이전에 조판술에서 사용되기도 했다. 또한 Linotype 기계[18] 및 TeX 시스템과 같은 다른 타자기 이외의 조판 시스템에서도 사용되었다.[19] 현대 컴퓨터 기반 디지털 글꼴은 종결 구두점 뒤의 간격도 조정하여 표준 단어 간격보다 약간 더 넓은 공백을 만들 수 있다.[20]
조판된 자료에서 적절한 문장 간격의 양에 대한 몇 가지 논란이 있었다. ''타이포그래피 스타일의 요소''에서는 문장 간격에 단어 하나의 공백만 필요하다고 명시한다.[21] 심리학 연구에 따르면 "독자들은 마침표 뒤에 두 개의 공백이 있는 경우 이점을 얻는다."[22]
라틴 문자에서는 단어와 단어 사이에 스페이스가 놓인다. 손글씨에서는 간격을 띄우는 것 외에, 필기체에서는 이어서 쓰지 않는다. 인쇄・조판 등의 경우, 인쇄 영역의 오른쪽 끝을 맞추는 「저스티피케이션」을 위해, 스페이스를 신축하여 조정한다.
또한 다양한 형식으로 문장과 문장 사이에 스페이스를 둔다. 「프렌치 스페이싱」에서는 문장과 문장 사이에 1문자 분량의 스페이스를 둔다. 「더블 스페이싱」 또는 「잉글리시 스페이싱」에서는 2문자 분량의 스페이스를 둔다. 또한 초기의 타자기에서는 「확장 스페이스(1-1/3문자 분량의 스페이스)」를 두는 경우가 있었다. 최근에는 스페이스를 두지 않는 경우도 늘고 있다.
2. 3. 단위 기호와 숫자
국제 단위계(SI)는 숫자와 측정 단위 사이에 공백을 넣어 표기하도록 규정하고 있다.[23] 이는 암묵적인 곱셈 기호로 간주된다.- 5.0 cm (5.0cm 또는 5.0 c m 또는 5.0 cms와 같이 표기하지 않는다.)
- 45 kg (45kg 또는 45 k g 또는 45 kgs와 같이 표기하지 않는다.)
- 32 ℃ (32°C 또는 32° C와 같이 표기하지 않는다.)
- 20 kN m 또는 20 kN⋅m (20 kNm 또는 20 k Nm와 같이 표기하지 않는다.)
- π/2 rad (π/2rad 또는 π / 2 rad와 같이 표기하지 않는다.)
- 50 % (50% 또는 50 percent와 같이 표기하지 않는다.) (참고: %는 SI 단위가 아니며, 많은 스타일 가이드에서는 이 권장 사항을 따르지 않는다. 50%는 형용사로 사용된다. 예를 들어 50% 아세트산과 같이 농도를 나타낼 때 사용한다.)
단, 각도를 나타내는 전통적인 기호인 도 (예: 30°), 분 (예: 22′), 초 (예: 8″)는 예외적으로 숫자와 기호 사이에 공백을 넣지 않는다.[32]
또한 SI는 천 단위 구분 기호로 공백[24](종종 좁은 공백)을 사용하도록 규정하고 있다. 소수점 구분 기호로는 점과 쉼표가 모두 사용된다.
- 1 000 000 000 000 (좁은 공백) 또는 1 000 000 000 000 (일반 공백은 훨씬 더 넓음) (1,000,000 또는 1.000.000와 같이 표기하지 않는다.)
위키백과:표기 지침에서도 과학 기술 분야에서는 3자리마다 쉼표( , ) (일본, 미국, 영국 등)나 마침표( . ) (프랑스, 독일 등)를 삽입하지 않고, 반각 공백을 넣도록 되어 있다 (위키백과:표기 지침#숫자).[28]
- 25,486,003 (2천5백4십8만6천3)
- 광속: ''c'' = 299,792,458 m/s
- 플랑크 상수: ''h'' = 6.62607015×10^−34 J s
- 조셉슨 상수: ''K''J = 483,597.848416983... GHz/V
단위 기호의 곱을 표현할 때에는 단위 기호 사이에 한 글자 분량의 공백 또는 중점 (・)을 삽입하도록 규정하고 있다.[29]
SI 접두어와 단위 기호 사이에는 공백을 넣어서는 안 된다.[30]
수치는 반드시 1자 분량의 공백 (통상 반각 공백(얇은 공간))을 사용하여 숫자와 단위 기호를 띄운다.[31] 이는 "℃(섭씨)", "%(퍼센트)"의 경우도 마찬가지이다.
- 32.7 kg (32.7kg로 하지 않는다.)
- 36.5 ℃ (36.5℃로 하지 않는다.)
- 16 % (16%로 하지 않는다.)
3. 컴퓨터에서의 이용
컴퓨터는 단어 사이를 나타내는 것 외에도 다양한 용도로 공백 문자를 사용한다. 공백의 크기도 여러 가지가 필요하므로, 용도와 크기가 다른 것을 구별해야 한다. 현대의 많은 컴퓨터는 주로 문자 코드를 구분하여 용도와 크기의 차이를 구별하지만, 실제 공백 너비는 글꼴에도 영향을 받는다.
- 스페이스 (SPACE영어, 라틴 문자는 일반적으로 반각이므로 반각 스페이스라고도 함) (ASCII 20H): 라틴 문자의 단어 사이 간격을 나타낸다. 논리 행(개행 문자로 구분된 문자열)이 물리 행(겉보기 1행)을 벗어나는 경우, 이 스페이스로 다음 행으로 넘어가게 한다. 이때 스페이스는 겉보기에는 개행으로 바뀌어 앞 행의 마지막과 다음 행의 처음에도 스페이스가 놓이지 않는다. 고정폭 글꼴 이외에는 반각 너비라고 할 수 없으며, 3분 너비인 경우가 많다. ASCII에 있으며 JIS X 0213에 없는 유일한 인쇄 가능 문자이다.[33]
- 탭: 정형 목적으로 삽입되는 스페이스를 탭이라고 한다. 편의상 탭 문자 (ASCII 09H)를 사용한 것을 하드 탭, 반각 스페이스를 사용한 것을 소프트 탭이라고 부르기도 한다.
- 키보드에는 스페이스 바가 있으며, 대부분 일반 키보다 크다.
- 와지 간격: 일본어에서 사용되는 스페이스로, 일본어 및 중국어 등 CJK 문자의 간격을 의미하는 문자가 별도로 정의되어 있다.
- 화이트 스페이스: 반각 스페이스, 탭, 개행을 통칭한다. C 언어 등 여러 프로그래밍 언어 및 HTML 등의 마크업 언어에서 동등하게 취급된다.
3. 1. 표현 방식
SPACENO-BREAK SPACE
ZERO WIDTH SPACE
IDEOGRAPHIC SPACE
ZERO WIDTH NO-BREAK SPACE
CHARACTER TABULATION