맨위로가기

서식 있는 텍스트

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

서식 있는 텍스트는 텍스트에 서식 정보를 포함하여 표현하는 방식을 의미한다. 이는 이진 파일 또는 ASCII 텍스트와 구별하기 어려울 수 있으며, HTML, RTF와 같은 텍스트 기반 마크업 언어로 표현될 수 있다. 서식 있는 텍스트는 타자기에서 밑줄을 사용하여 강조하던 방식에서 시작되었으며, HTML과 같은 마크업 언어는 특수 문자를 사용하여 서식을 표시한다. WYSIWYG 워드 프로세서는 이진 파일로 서식을 지정하는 방식으로 작동하며, 서식 범위와 기밀 유지에 단점이 있을 수 있다. 서식 정보는 이진 파일 또는 일반 텍스트로 표현될 수 있으며, 일반 텍스트 형식은 추가 정보를 이진 파일을 사용하지 않고 가지며, 해당 애플리케이션이 이를 해석하여 표시한다.

더 읽어볼만한 페이지

  • 출판 - 정기간행물
    정기간행물은 권, 호, 절대 번호 등으로 구분되어 일정한 주기로 발행되는 간행물이며, ISSN으로 식별되고, 다양한 종류가 존재하며, 우편 서비스에서 특별 요금을 적용받는다.
  • 출판 - 매체 편향
    매체 편향은 뉴스 보도에서 나타나는 다양한 패턴을 설명하는 가설로, 광고 편향, 내용 편향, 당파적 편향 등 여러 유형이 존재하며, 광고주, 독자 선호도 등 다양한 요인으로 발생하여 사회적 불평등 심화, 정치적 극단화 등 부정적 영향을 미친다.
  • 파일 포맷 - 바로 가기
    바로 가기는 운영체제에서 파일, 폴더, 프로그램, 웹 페이지에 대한 참조를 제공하는 기능 및 파일로, 사용자들이 원본에 빠르게 접근하도록 GUI 환경의 사용성을 향상시킨다.
  • 파일 포맷 - EXE
    EXE 파일 형식은 운영 체제에 따라 다양한 종류가 있는 실행 파일의 한 형태로, DOS MZ 실행 파일에서 PE, PE32+까지 발전해 왔으며, 코드, 데이터, 스택을 별도 관리하고 재배치 항목을 통해 실행 환경에 유연하게 대응하는 특징을 가진다.
서식 있는 텍스트

2. 용어

서식 있는 텍스트는 이진 파일로 올바르게 식별하거나 ASCII 텍스트로부터 구별하는 것이 불가능하다. 그 이유는 서식이 있는 텍스트가 꼭 이진(바이너리)일 필요는 없으며, HTML, RTF 등의 텍스트로만 이루어져 있을 수 있고, ASCII로만 이루어져 있을 수도 있기 때문이다. 이와 반대로 플레인 텍스트는 ASCII가 아닐 수도 있다. (예: 유니코드 UTF-8 인코딩) 텍스트로만 이루어진 서식 있는 텍스트는 텍스트로 구성된 마크업으로 달성할 수 있는 반면, 마이크로소프트 워드와 같은 서식 있는 텍스트의 일부 편집기들은 이진 포맷으로 저장한다.

멀티 스타일 텍스트의 파일 형식 자체는 이진 파일이거나 일반 텍스트일 수 있다. 일반 텍스트는 HTML처럼 추가 정보를 이진 파일을 사용하지 않고 가지며, 이에 대응하는 애플리케이션은 이를 해석하면서 표시한다. 따라서 멀티 스타일 텍스트를 처리할 수 없는 애플리케이션에서는 본문에 더하여 서식 정보도 함께 표시된다. 이러한 정보들은 사람이 어느 정도 읽을 수 있는 형태로 되어 있기 때문에, 문서를 작성한 애플리케이션이 없더라도 내용을 읽을 수 있다.[2]

3. 서식 있는 텍스트의 시작

서식 있는 텍스트는 컴퓨터 등장 이전, 타자기로 작성된 원고에서 강조를 위해 밑줄을 긋던 관행에서 유래되었다. 초기 컴퓨터 시스템에서는 밑줄을 직접 표현할 수 없었기 때문에, 사용자들이 특정 기호를 사용하여 강조를 나타냈다.[1][2]


  • 대문자 사용: I AM NOT making this up.
  • 밑줄로 감싸기: I am _not_ making this up.
  • 별표로 감싸기: I am *not* making this up.
  • 간격 띄우기: I am n o t making this up.


밑줄은 책 제목을 나타내는 데에도 사용되었다: Look it up in _The_C_Programming_Language_.

4. 마크업 언어

서식은 HTML의 꺾쇠 괄호(< >)와 같이 특수 문자로 본문 텍스트와 구별되는 태그로 표시할 수 있다. 예를 들어, "개는 분류학에서 ''Canis familiaris''로 분류됩니다."라는 텍스트는 다음과 같이 HTML로 마크업된다.

: <p>개는 분류학에서 <i>Canis familiaris</i>로 분류됩니다.</p>

이탤릭체 텍스트는 여는 이탤릭체 태그와 닫는 이탤릭체 태그로 묶여 있다. LaTeX에서는 텍스트가 다음과 같이 마크업된다.

: 개는 분류학에서 \textit{Canis familiaris}로 분류됩니다.

대부분의 마크업 언어는 특별한 소프트웨어 없이 모든 텍스트 편집기로 편집할 수 있다. 또한 많은 마크업 언어는 일부 기능을 자동화하거나 출력을 WYSIWYG로 표시하도록 설계된 전문 소프트웨어로 편집할 수도 있다.

5. 서식 있는 문서 파일

매킨토시 라이터(MacWrite) 이후 WYSIWYG 워드 프로세서들은 텍스트 마크업 대신 시각적으로 서식을 지정하는 방식으로 작동하며, 이진 파일로 저장하는 경향이 있다. 이러한 파일을 텍스트 편집기로 열면 서식이 지정된 텍스트 주위(예: WordPerfect) 또는 파일의 시작이나 끝(예: 마이크로소프트 워드)에 다양한 이진 문자가 포함되어 있다.[1]

이진 파일 형식은 서식 범위와 기밀 유지에 단점이 있다. 마크업 언어는 서식 범위를 명확하게 표시하는 반면, WYSIWYG 서식은 사용자의 기억에 의존하므로 오류 및 유지 관리 문제를 야기할 수 있다. 기밀 유지 측면에서, 서식 있는 텍스트 문서 파일 형식은 독점적이고 문서화되지 않은 경우가 많아 호환성 문제를 야기하고 불필요한 업그레이드를 유발할 수 있다.[1]

워드스타(WordStar)는 숨겨진 문자가 있는 이진 파일을 사용하지 않은 워드 프로세서였다.[1] 오픈오피스(OpenOffice.org) 라이터는 XML 형식으로 파일을 저장하지만, 압축되어 있기 때문에 이진 파일이다.[1] PDF는 일반적으로 이진 형식의 서식 있는 텍스트 파일 형식이며, 최종 사용자를 위한 형식으로 편집이 제한된다.[1]

6. 서식 정보의 형식

서식 있는 텍스트의 파일 형식 자체는 이진 파일이거나 일반 텍스트일 수 있다. 일반 텍스트는 HTML처럼 추가 정보를 이진 파일을 사용하지 않고 가지며, 이에 대응하는 애플리케이션은 이를 해석하면서 표시한다. 따라서 서식 있는 텍스트를 처리할 수 없는 애플리케이션에서는 본문에 더하여 서식 정보도 함께 표시된다. 이러한 정보들은 사람이 어느 정도 읽을 수 있는 형태로 되어 있기 때문에, 문서를 작성한 애플리케이션이 없더라도 내용을 읽을 수 있다.

참조

[1] 간행물 RFC1855: Netiquette Guidelines https://datatracker.[...] 1995-10-01
[2] 웹사이트 Structured Text https://edmullen.net[...] 2015-07-26
[3] 웹인용 Word Processors: Stupid and Inefficient http://ricardo.ecn.w[...] 1999-06-29



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com