구조적 문서
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
구조적 문서는 문서의 논리적 구조를 인코딩하는 데 중점을 둔다. HTML, XML, CSS 등 다양한 종류가 있으며, HTML은 웹사이트 작성에 사용되는 표준 언어이고, XML은 데이터를 저장하고 교환하기 위한 유연한 형식의 언어이며, CSS는 HTML 등의 구조적 문서를 시각적으로 꾸며주는 스타일 시트 언어이다. 구조적 문서는 내용과 표현을 분리하여 관리하며, 의미론적 마크업을 통해 콘텐츠의 추상적인 속성에 레이블을 지정한다. 이러한 특징은 다양한 방식으로 문서 재사용 및 표시를 가능하게 한다.
더 읽어볼만한 페이지
- 프로그래밍 언어 구현 - 어셈블리어
어셈블리어는 사람이 이해하기 쉬운 니모닉 기호로 기계어 명령을 표현하는 저수준 프로그래밍 언어로서, 각 프로세서마다 사양이 다른 어셈블리어가 존재하며 하드웨어 직접 제어, 성능 최적화, 저수준 시스템 프로그래밍 등에 활용된다. - 프로그래밍 언어 구현 - 컴파일러
컴파일러는 고급 프로그래밍 언어로 작성된 소스 코드를 컴퓨터가 이해할 수 있는 저급 언어로 변환하는 프로그램으로, 어휘 분석, 구문 분석, 의미 분석, 최적화, 코드 생성 등의 단계를 거쳐 목적 코드를 생성하며, 네이티브 컴파일러, 크로스 컴파일러 등으로 분류되어 다양한 분야에서 활용된다.
| 구조적 문서 |
|---|
2. 종류
구조적 문서는 다양한 처리 목적으로 사용할 수 있는 항목에 레이블을 지정하는 데 중점을 둔다. 예를 들어 "장 제목" 또는 "강조"와 같은 명시적인 레이블은 시각 장애인을 위한 시스템에 유용하며, 기술 정보 시트에 의미 있는 레이블을 지정하면 데이터베이스, 검색 시스템, 온라인 카탈로그 등과의 통합이 향상된다.[1]
구조적 문서는 최소한 계층 구조를 지원하며, 고급 시스템은 여러 개의 독립적이거나 중첩된 구성 요소 집합도 지원한다.[1] 구조적 문서 시스템은 일반적으로 구성 요소 유형과 구성 요소를 결합하는 방법을 정의하는 명시적 규칙("스키마")을 생성할 수 있으며, XSD, Relax NG, Schematron과 같이 스키마를 지정하기 위한 몇 가지 공식 언어가 존재한다.[1]
표준 일반화된 마크업 언어(SGML)가 구조적 문서의 개념을 개척했다.[2]
2. 1. HTML
웹사이트를 작성할 때 쓰는 표준 언어이다. (HTML) W3C에서 정의하고 설명하는 스키마를 따르며, 의미 지향 구성 요소와 서식 지향 구성 요소를 모두 포함한다.[1] HTML은 때때로 구조적 문서 시스템으로 사용되지만 서식 언어로 자주 사용된다.2. 2. XML
데이터를 저장하는 언어(.xml)이다.[1] 표준 일반화된 마크업 언어(SGML)의 후손인 XML이 현재 선호되고 있다.[2]JATS, TEI, UBL, EDI, XTCE, REST 등과 같이 협력하여 개발한 도메인별 스키마를 통해 구조적 문서를 사용하며, 이러한 모든 경우는 XML을 기반으로 하는 특정 스키마를 사용한다.
2. 3. CSS
HTML 등의 구조적 문서를 시각적으로 꾸며주는 스타일 시트 언어이다. 내용과 표현을 분리하여 효율적인 문서 관리를 가능하게 한다.[1]3. 구조적 의미론 (Structural Semantics)
구조적 문서는 단순히 서식을 지정하는 것을 넘어, 다양한 처리 목적에 맞게 항목에 레이블을 지정하는 데 중점을 둔다. 예를 들어 "장 제목", "강조" 같은 명시적 레이블은 시각 장애인을 위한 시스템에서 "Helvetica bold 24", "기울임꼴"보다 훨씬 유용하다. 기술 정보 시트의 여러 항목에 의미 있는 레이블을 지정하면 데이터베이스, 검색 시스템, 온라인 카탈로그 등과의 통합이 향상된다.[1]
구조적 문서는 최소한 계층 구조를 지원하며, 고급 시스템은 여러 개의 독립적이거나 중첩된 구성 요소 집합을 지원한다.[1] 구조적 문서 시스템은 구성 요소 유형과 결합 방법을 정의하는 규칙 집합인 "스키마"를 생성할 수 있다. XSD, Relax NG, Schematron 같은 공식 언어가 존재하며, 스키마 규칙을 준수하는 문서는 "해당 스키마에 따라 유효"하다고 한다.
표준 일반화된 마크업 언어(SGML)가 구조적 문서 개념을 개척했으며,[2] 이전 시스템인 Scribe, Augment, FRESS가 많은 기능을 제공했다. SGML의 후손인 XML이 현재 선호된다.
HTML은 구조적 문서의 널리 사용되는 표현이며, W3C에서 정의하고 설명하는 스키마이다. HTML은 의미 지향 구성 요소뿐만 아니라 서식 지향 구성 요소도 가지고 있다.
JATS, TEI, UBL, EDI, XTCE, REST 등 여러 도메인에서 협력하여 개발한 도메인별 스키마를 통해 구조적 문서를 사용하며, 이들은 모두 XML 기반이다.
3. 1. 의미론적 마크업 (Semantic Markup)
HTML에서 `` 요소는 포함된 텍스트가 강조됨을 의미한다. 시각적으로는 ``와 마찬가지로 굵게 표시되지만, 음성 인터페이스에서는 음성 변조를 사용할 가능성이 높다. 시맨틱 마크업은 시각적 표현이 아닌 콘텐츠의 추상적이고 준언어적 속성에 레이블을 지정하는 마크업 방식이다.[3]HTML의 의미론적 태그에는 `` 외에도 ``, ``, ``, ``, `
` 등이 있다. DocBook 및 TEI와 같은 다른 스키마는 훨씬 더 다양한 태그를 제공한다.
3. 2. 내용과 표현의 분리 (Separation of Content and Presentation)
구조적 문서는 인쇄된 페이지나 화면을 통해 사람에게 표시하는 데 거의 또는 전혀 명시적인 작업이 수행되지 않고, 문서의 논리적 구조를 인코딩하는 데 중점을 둔다. 구조적 문서는 컴퓨터 시스템에서 쉽게 처리하여 문서의 파생된 형태를 추출하고 표시할 수 있다. 예를 들어, 대부분의 위키백과 문서에서 목차는 문서 본문의 여러 제목 태그로부터 자동으로 생성된다. 옥스퍼드 영어 사전의 SGML 변환은 인쇄 버전의 이탤릭체 사용에 따른 여러 다른 의미를 명시적으로 구분했기 때문에, 검색 도구는 어원, 인용문 및 기타 많은 관심 있는 기능을 기반으로 항목을 검색할 수 있다. HTML이 단순히 서식 정보가 아닌 구조적 정보를 제공할 때, 시각 장애가 있는 사용자는 더 유용한 읽기 인터페이스를 쉽게 사용할 수 있다. 여행 회사가 여정을 단순히 표시하는 대신 구조적 문서로 제공하면, 사용자 도구가 필요한 사실을 쉽게 추출하여 캘린더 또는 기타 애플리케이션으로 전달할 수 있다.
구조적 문서의 가장 매력적인 기능 중 하나는 휴대폰, TV 화면, 음성 합성기 및 이를 처리하도록 프로그래밍할 수 있는 기타 모든 장치에서 다양한 방식으로 재사용하고 표시할 수 있다는 것이다.
4. 역사
구조적 문서는 단순히 서식을 지정하는 것을 넘어, 다양한 처리 목적으로 사용할 수 있도록 항목에 레이블을 지정하는 데 중점을 둔다. 예를 들어, "장 제목"이나 "강조"와 같은 명시적 레이블은 시각 장애인을 위한 시스템에서 "Helvetica bold 24" 또는 "기울임꼴"보다 훨씬 유용하다. 기술 정보 시트의 여러 항목에 의미 있는 레이블을 지정하면 데이터베이스, 검색 시스템, 온라인 카탈로그 등과의 통합이 향상된다.[1]
구조적 문서는 최소한 목록, 섹션 제목뿐만 아니라 섹션 등과 같은 계층 구조를 지원한다. 고급 시스템은 여러 개의 독립적이거나 중첩된 구성 요소 집합도 지원한다.[1]
구조적 문서 시스템은 일반적으로 구성 요소 유형과 결합 방법을 정의하는 명시적 규칙("스키마")을 생성할 수 있다. XSD, Relax NG, Schematron과 같이 스키마를 지정하기 위한 여러 공식 언어가 존재한다. 스키마 규칙을 준수하는 구조적 문서는 일반적으로 "해당 스키마에 따라 유효함"이라고 한다.[1]
HTML은 W3C에서 정의하고 설명하는 스키마를 사용하는 구조적 문서의 널리 사용되는 표현 중 하나이다. 그러나 HTML은 의미 지향 구성 요소뿐만 아니라 서식 지향 구성 요소도 가지고 있어, 구조적 문서 시스템과 서식 언어 두 가지 용도로 사용된다.[1]
4. 1. SGML
리에(Lie)와 사렐라(Saarela)는 표준 일반화 마크업 언어(SGML)가 구조적 문서의 개념을 개척했다고 언급했다.[2] SGML 이전의 시스템인 Scribe, Augment, FRESS는 많은 구조적 문서 기능들을 제공했으며, SGML의 후손인 XML이 현재 널리 사용되고 있다.4. 2. Scribe, Augment, FRESS
표준 일반화된 마크업 언어(SGML)가 구조적 문서의 개념을 개척했다는 언급이 있다.[2] Scribe, Augment, FRESS는 SGML 이전 시스템으로, 많은 구조적 문서 기능과 특징을 제공했으며, SGML의 후손인 XML이 현재 선호되고 있다.4. 3. XML (현재 선호)
SGML의 후손으로, 현재 가장 널리 사용되는 구조적 문서 표현 형식이다.[1] XML은 웹에서 구조화된 문서와 데이터를 위한 보편적인 형식이다.[2]저널 출판을 위한 JATS, 문학 문서를 위한 TEI, 비즈니스 교환을 위한 UBL 및 EDI, 우주선 원격 측정을 위한 XTCE, 웹 인터페이스를 위한 REST 등 다양한 도메인에서 특정 XML 기반 스키마를 활용하여 구조적 문서를 사용한다.
5. 문맥과 의도 (Context and Intent)
"구조"와 "비구조"의 구분은 문맥에 따라 달라질 수 있다. 특히 타이포그래피에서는 렌더링 방식 자체가 중요한 의미를 가질 수 있다. 예를 들어, 특정 스타일을 언제 사용해야 하는지에 대한 논의는 예시와 반례를 제시하고자 할 것이며, 렌더링이 문장과 동기화되지 않으면 더 이상 의미가 없을 것이다. 마찬가지로, 문서의 특정 판본은 내용뿐만 아니라 타이포그래피 관행 자체로도 가치가 있을 수 있으며, 이 경우 해당 관행을 설명하는 것은 바람직할 뿐만 아니라 필요하다. 그러나 이 문제는 문서 구조에만 국한되지 않는다. 문법을 논할 때도 발생하며, 다른 많은 경우에도 나타난다.[1]
6. 한국에서의 활용 및 중요성
(참조할 원문 소스가 제공되지 않았으므로, 이전 답변을 수정할 수 없습니다. 원문 소스를 제공해주시면 지침에 따라 수정하겠습니다.)
참조
[1]
간행물
Markup Overlap: A Review and a Horse
http://conferences.i[...]
2014-10-14
[2]
웹사이트
Multi-purpose publishing using HTML, XML, and CSS
http://www.w3.org/Pe[...]
Association for Computing Machinery
1998
[3]
웹사이트
A sample HTML instance
http://www.w3.org/Ma[...]
2014-03-05
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com