WARC (파일 형식)
1. 개요
WARC는 웹 아카이브를 위한 파일 형식이다. 다양한 웹 아카이빙 소프트웨어에서 사용되며, Heritrix, wget, Conifer, StormCrawler, Apache Nutch, libarchive 등이 있다. Conifer는 웹사이트를 캡처하고 보존하는 웹 기반 서비스형 소프트웨어(SaaS)이다.
WARC (파일 형식) - [IT 관련 정보]에 관한 문서
파일 포맷 정보
| 이름 | 웹 아카이브 |
|---|---|
| 확장자 | .warc |
| MIME 형식 | application/warc |
| 유형 코드 | 해당 없음 |
| 유니폼 타입 | 해당 없음 |
| 다음을 준수 | 해당 없음 |
| 매직 넘버 | 해당 없음 |
| 개발자 | 해당 없음 |
| 출시일 | 해당 없음 |
| 최신 릴리스 버전 | 해당 없음 |
| 최신 릴리스 날짜 | 해당 없음 |
| 장르 | 해당 없음 |
| 컨테이너 대상 | 해당 없음 |
| 포함 대상 | 해당 없음 |
| 다음으로부터 확장 | ARC |
| 다음으로 확장 | 해당 없음 |
| 표준 | ISO 28500:2017 |
| 공개 여부 | 예 |
| 웹사이트 | 웹 아카이브 사양 |
📚 더 읽어볼만한 페이지
-
아카이브 포맷 -
ARJ
ARJ는 다양한 소프트웨어 유틸리티에서 압축 해제가 가능한 파일 포맷으로, macOS에서는 독립 실행형 유틸리티를 통해 압축을 해제할 수 있다. -
아카이브 포맷 -
JAR (파일 포맷)
JAR (Java ARchive)는 자바 런타임 환경에서 애플리케이션 배포를 위해 사용되는 ZIP 기반의 파일 포맷으로, 자바 클래스 파일과 매니페스트 파일을 포함하여 메타데이터와 실행 정보를 관리하며, 압축 및 전자 서명을 지원하고 실행 가능한 JAR 파일을 통해 애플리케이션을 간편하게 실행할 수 있게 한다.
목차
2. 웹 아카이빙 소프트웨어
웹 아카이빙을 위해 개발된 다양한 소프트웨어 도구들이 있다. 자바로 작성된 Heritrix 웹 아카이버, wget(1.14 버전부터), Webrecorder의 이전 이름인 Conifer, 스톰크롤러, 아파치 너치, libarchive 등이 그것이다.
2.1. 오픈 소스 소프트웨어
WARC 파일 형식을 다루는 오픈 소스 소프트웨어는 누구나 자유롭게 사용, 수정, 배포할 수 있다.
2.1.1. Java 기반
* Heritrix 웹 아카이버는 자바로 작성되었다.
2.1.2. 기타 오픈 소스 소프트웨어
* wget (1.14 버전부터)
* Conifer, 이전 Webrecorder
* 스톰크롤러
* 아파치 너치
* libarchive
2.2. 서비스형 소프트웨어 (SaaS)
웹 기반 서비스형 소프트웨어(SaaS)에는 Conifer 등이 있다.