셰이프파일
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
셰이프파일은 지리 정보 시스템(GIS)에서 공간 데이터를 저장하는 데 사용되는 벡터 파일 형식이다. 이 형식은 `.shp`, `.shx`, `.dbf` 세 가지 필수 파일과 선택적 파일들로 구성되며, 지리적 위치 정보, 인덱스, 속성 정보를 저장한다. 셰이프파일은 위상 정보 부재, 파일 크기 및 속성 정보 제약, 도형 유형 혼합 제한 등의 한계를 가지고 있다.
더 읽어볼만한 페이지
- 지도학 - 측지학
측지학은 지구의 형상, 크기, 중력장 및 시간적 변화를 측정하고 연구하는 지구과학의 한 분야로, 고대 그리스어에서 유래되었으며 현대에는 GPS 등의 기술을 활용하여 지구 역학적 현상 연구에 기여한다. - 지도학 - 위도
위도는 지구 표면의 남북 위치를 각도로 나타내며, 지구를 회전 타원체로 가정했을 때 법선과 적도면이 이루는 각으로 측정하여 적도를 0°로 북극과 남극까지 나타내고, 기후와 지리적 특징 등에 영향을 미치는 다양한 종류가 존재한다. - 오픈 포맷 - HTML
HTML은 웹 페이지 제작을 위한 표준 마크업 언어로서, 팀 버너스리가 제안하고 구현한 후 인터넷 발전과 함께 널리 사용되며, SGML에 기반하여 하이퍼텍스트 기능으로 다양한 콘텐츠를 표현하고 연결하며, W3C와 WHATWG에서 표준화를 진행하고 최신 버전은 HTML Living Standard이다. - 오픈 포맷 - 오픈 소스
오픈 소스는 제품 설계 및 재배포를 장려하는 모델로, 소프트웨어 개발에서 시작하여 개방형 협업을 장려하며 다양한 분야에서 활용되고 있고 오픈 소스 이니셔티브와 같은 단체가 운동을 지원한다.
셰이프파일 - [IT 관련 정보]에 관한 문서 | |
---|---|
파일 포맷 정보 | |
이름 | 셰이프파일 |
![]() | |
파일 확장자 | .shp, .shx, .dbf |
MIME 형식 | x-gis/x-shapefile |
장르 | GIS |
소유자 | Esri |
표준 | Shapefile Technical Description |
2. 역사
셰이프파일 형식은 1990년대 초 Esri사가 자사의 GIS 소프트웨어인 ArcView GIS 버전 2와 함께 도입하였다.[1] 초기에는 ArcView GIS에서 주로 사용되었으나, 형식이 공개되고 다른 GIS 소프트웨어에서도 지원하기 시작하면서 널리 확산되었다. 현재는 다양한 소프트웨어를 사용하여 셰이프파일 형식으로 지리적 데이터 세트를 읽고 쓸 수 있다.
셰이프파일 형식은 여러 개의 파일로 구성되며, 일반적으로 같은 디렉터리에 동일한 파일 이름(접두사)을 가지고 저장된다. "셰이프파일"이라는 용어는 널리 알려져 있지만, 실제로는 여러 파일들의 집합을 의미한다. 필수 파일은 `.shp`, `.shx`, `.dbf` 세 가지이며, 이 외에도 여러 선택적 파일이 존재한다.
3. 구성
각 파일에서 셰이프의 순서는 `.shp`, `.shx`, `.dbf` 파일에서 서로 일치한다. 즉, `.shp` 파일의 첫 번째 레코드는 `.shx` 및 `.dbf` 파일의 첫 번째 레코드에 해당한다. `.shp` 및 `.shx` 파일에는 서로 다른 엔디안을 가진 다양한 필드가 있으므로 주의해야 한다.
3. 1. 필수 파일
: 셰이프 형식. 지리적 위치 정보를 담고 있는 주 파일이다.[1] 콘텐츠 유형은 `x-gis/x-shapefile`이다.
: 셰이프 인덱스 형식. `.shp` 파일 내에서 특정 위치 정보를 빠르게 찾을 수 있도록 돕는 인덱스 파일이다.[1] 콘텐츠 유형은 `x-gis/x-shapefile`이다.
: 속성 형식. 각 지리적 개체(feature)에 대한 속성 정보를 dBASE IV 형식으로 저장하는 데이터베이스 파일이다.[1] 콘텐츠 유형은 `application/octet-stream` 또는 `text/plain`이다.
3. 2. 선택적 파일
파일 확장자 | 설명 | 콘텐츠 유형 |
---|---|---|
좌표 참조 체계의 WKT(Well-known text)을 사용하는 투영 설명 | 또는 | |
및 | 피처의 공간 인덱스 파일. Esri 소프트웨어에서만 사용되며, 공간 검색 성능을 향상시킨다. | |
및 | 읽기 전용 피처의 공간 인덱스 | |
및 | 테이블의 활성 필드에 대한 속성 인덱스 | |
읽기/쓰기 데이터 세트를 위한 지오코딩 인덱스 | ||
읽기/쓰기 데이터 세트를 위한 지오코딩 인덱스 (ODB 형식) | ||
형식의 파일에 대한 속성 인덱스 (ArcGIS 8 이상) | ||
ISO 19115 또는 기타 XML 스키마와 같은 XML 형식의 지리 공간 메타데이터 | ||
파일의 문자 인코딩을 지정하는 데 사용되는 코드 페이지 파일 | 또는 | |
MapServer 및 GDAL/OGR 소프트웨어에서 사용되는 대체 사분트리 공간 인덱스 |
`.prj` 파일은 투영 형식 정보를 담고 있으며, 좌표계 및 투영 정보를 WKT(Well-known text) 형식으로 저장한다.[1] 이 파일은 좌표계를 지정하는 중요한 정보를 포함하고 있어 거의 필수적인 파일로 간주된다.
`.sbn` 및 `.sbx` 파일은 Esri 소프트웨어에서만 사용되는 공간 인덱스 파일이며, 공간 검색 성능을 향상시킨다.[9]
`.cpg` 파일은 코드 페이지 파일로, `.dbf` 파일의 문자 인코딩을 지정한다.
이 외에도 `.fbn`, `.fbx`, `.ain`, `.aih`, `.ixs`, `.mxs`, `.atx`, `.shp.xml` 등 다양한 선택적 파일이 존재한다.
4. 파일 형식
셰이프파일 형식은 지리적 위치 및 관련 속성 정보를 저장하기 위한 디지털 벡터 저장 형식이다. 이 형식은 위상 정보를 저장하는 기능이 부족하다. 1990년대 초 ArcView GIS 버전 2와 함께 도입되었으며, 현재 다양한 소프트웨어를 사용하여 셰이프파일 형식으로 지리적 데이터 세트를 읽고 쓸 수 있다.
"셰이프파일"이라는 용어는 일반적이지만, 이 형식은 동일한 디렉터리에 저장된 공통 파일 이름 접두사를 가진 파일 모음으로 구성된다. ''필수'' 파일에는 파일 확장자 `.shp`, `.shx`, .dbf
가 있다. 실제 ''셰이프파일''은 `.shp` 파일과 관련이 있지만, 다른 지원 파일이 필요하므로 단독으로는 배포에 적합하지 않다. ''ESRI 셰이프파일 기술 설명''에 따라,[1] 구형 GIS 소프트웨어는 DOS 8.3 파일명 규칙에 따라 파일 이름 접두사가 8자로 제한될 것으로 예상할 수 있지만, 최신 소프트웨어 응용 프로그램은 더 긴 이름을 가진 파일을 허용한다.
필수 파일
- `.shp` — 셰이프 규격: 지형 정보의 본체.
- `.shx` — 셰이프 인덱스 규격: 지형 데이터의 전방 검색, 후방 검색을 빠르게 하기 위한 위치 인덱스.
- `.dbf` — 속성 규격: 각 셰이프에 대한 세로 표 형식의 속성 정보. dBASE IV 형식 준수.
옵션 파일
- `.prj` — 투영 규격: 좌표계 및 투영 정보. 투영법을 Well-known text 형식으로 기술한 일반 텍스트 파일.
- `.sbn` 및 `.sbx` — 공간 인덱스.
- `.fbn` 및 `.fbx` — 읽기 전용 공간 인덱스.
- `.ain` 및 `.aih` — 테이블 내 활성 필드의 속성 인덱스.
- `.ixs` — 읽기/쓰기용 파일의 지오코딩 인덱스.
- `.mxs` — 읽기/쓰기용 파일의 지오코딩 인덱스 (ODB 규격).
- `.atx` — DBF 파일의 속성 인덱스 (ArcGIS Ver8 이후).
- `.shp.xml` — ISO 19115 및 기타 XML 스키마 언어 등의 XML 형식 지리 공간 메타데이터.
- `.cpg` — 사용한 문자 코드의 식별 코드 페이지 (DBF 전용) 지정.
- `.qix` — MapServer 및 GDAL/OGR 소프트웨어에서 사용되는 대체 사분트리 공간 인덱스
각 `.shp`, `.shx`, `.dbf` 파일에서 각 파일의 셰이프는 순서대로 서로 일치한다 (즉, `.shp` 파일의 첫 번째 레코드는 `.shx` 및 `.dbf` 파일의 첫 번째 레코드에 해당한다). `.shp` 및 `.shx` 파일에는 서로 다른 엔디안을 가진 다양한 필드가 있으므로, 파일 형식 구현자는 각 필드의 엔디안을 매우 신중하게 존중하고 적절하게 처리해야 한다.
4. 1. 셰이프 파일 (.shp)
셰이프파일 형식은 지리적 위치와 관련 속성 정보를 저장하는 벡터 저장 형식이다. 하지만, 위상 정보를 저장할 수는 없다. 셰이프파일 형식은 1990년대 초 ArcView Ver2에서 도입되었다. 현재는 다양한 프로그램을 사용하여 셰이프파일 형식의 지리 정보를 읽고 쓸 수 있다.셰이프파일 형식에 저장할 수 있는 것은 점, 선, 폴리곤이라는 기본적인 기하학적 데이터뿐이므로, 그 구조는 단순하다. 셰이프 (점, 선, 폴리곤)와 데이터 속성을 사용하여 무수한 지리적 데이터 표현을 만들어낼 수 있다. 표현을 통해 강력하고 정확한 계산이 가능해진다.
"셰이프파일"이라는 용어는 널리 알려져 있지만, 이 용어는 오해를 불러일으키기 쉬운 면도 있다. 셰이프파일 형식은 공통 파일 이름(접두사)을 가진 여러 개의 파일을 동일한 디렉터리에 저장해야 하기 때문이다. .shp, .shx, .dbf (dBASE) 확장자를 가진 3가지 종류의 파일이 필수적이다. 실제로 지리 데이터가 저장되어 있는 "셰이프파일"은 이 중 특히 .shp 파일을 가리키지만, 단독 파일만으로는 불완전하며 다른 지원 파일도 필요하다.
주 파일(.shp)은 지리적 데이터를 저장한다. 파일은 단일 고정 길이 헤더와 그 뒤에 오는 하나 이상의 가변 길이 레코드로 구성된다. 각 가변 길이 레코드는 레코드 헤더 부분과 레코드 내용 부분으로 구성된다. 파일 형식에 대한 자세한 설명은 ''ESRI Shapefile Technical Description''[1]에 기재되어 있다. 이 형식과 같은 ".shp" 확장자를 채택하고 있는 AutoCAD의 셰이프 폰트 소스 형식을 혼동하지 않도록 주의해야 한다.
2차원 좌표 데이터의 정렬은 직교 좌표계를 상정하고 있으며, (X, Y) 또는 (동서 좌표, 남북 좌표) 순서이다. 동서축과 남북축의 순서를 이렇게 하는 것은 지리 좌표계에서 (경도, 위도) 순으로 쓰는 것과 일치한다. 좌표계로서는, 3차원의 Z 좌표축(표고용)이나, 4차원의 M 좌표축(측정값용)도 지원하고 있다. Z 좌표에는 각 좌표의 3차원 공간에서의 표고를 저장하며, 이는 3차원 컴퓨터 그래픽스에서의 시각화나 해석 등에 사용된다. 사용자 정의 M 좌표에는 선형 참조 값이나 4차원 공간에서의 경과 시간 등을 저장하여 어떤 기능을 부여할 수 있다.
주 파일 헤더는 고정 길이 100바이트이며, 17개의 필드가 포함되어 있다. 내역은 4바이트(32비트 부호 있는 정수 int32) 정수 필드가 9개이고, 그 뒤에 8바이트(배정밀도) 부호 있는 부동 소수점 필드 8개이다.
바이트 위치 | 데이터 형식 | 엔디안 | 용도 |
---|---|---|---|
0–3 | int32 | big | 파일 부호 (항상 16진수 값 0x0000270a) |
4–23 | int32 | big | 미사용; uint32를 5개 |
24–27 | int32 | big | 파일 길이 (16비트 단어 수로 기술, 헤더 부분 포함) |
28–31 | int32 | little | 버전 번호 |
32–35 | int32 | little | Shape 종류 (아래 참조) |
36–67 | double | little | 데이터 세트에 포함된 모든 셰이프의 최소 경계 사각형(MBR); 네 개의 배정밀도 값을 다음 순서로 기술: min X, min Y, max X, max Y |
68–83 | double | little | Z의 범위; 두 개의 배정밀도 값을 다음 순서로 기술: min Z, max Z |
84–99 | double | little | M의 범위; 두 개의 배정밀도 값을 다음 순서로 기술: min M, max M |
주 파일 헤더 뒤에는 임의의 수의 가변 길이 레코드가 이어진다. 각 레코드의 선두 8바이트는 레코드 헤더 부분이다.
바이트 위치 | 데이터 형식 | 엔디안 | 용도 |
---|---|---|---|
0–3 | int32 | big | 레코드 일련 번호 (1부터 기산) |
4–7 | int32 | big | 레코드 길이 (16비트 단어 수로 기술) |
레코드 헤더 뒤에는 레코드 본체가 이어진다.
바이트 위치 | 데이터 형식 | 엔디안 | 용도 |
---|---|---|---|
0–3 | int32 | little | Shape 종류 (아래 참조) |
4– | – | – | Shape 내용 |
가변 길이 레코드의 내용은 셰이프 종류에 따라 다르다. 셰이프 종류는 파일 헤더 내에서 제공되거나 Null로 해야 한다. 이용 가능한 셰이프 종류는 다음과 같다.
종류 코드 | Shape 종류 | 가변 길이 레코드 내용 |
---|---|---|
0 | Null shape | 없음 |
1 | Point | X, Y |
3 | Polyline | MBR, 파트 수, 점 수, 파트군, 점군 |
5 | Polygon | MBR, 파트 수, 점 수, 파트군, 점군 |
8 | MultiPoint | MBR, 점 수, 점군 |
11 | PointZ | X, Y, Z, M (선택 사항) |
13 | PolylineZ | MBR, 파트 수, 점 수, 파트군, 점군, Z의 범위, Z의 배열, M의 범위, M의 배열 (선택 사항) |
15 | PolygonZ | MBR, 파트 수, 점 수, 파트군, 점군, Z의 범위, Z의 배열, M의 범위, M의 배열 (선택 사항) |
18 | MultiPointZ | MBR, 점 수, 점군, Z의 범위, Z의 배열, M의 범위, M의 배열 (선택 사항) |
21 | PointM | X, Y, M |
23 | PolylineM | MBR, 파트 수, 점 수, 파트군, 점군, M의 범위, M의 배열 (선택 사항) |
25 | PolygonM | MBR, 파트 수, 점 수, 파트군, 점군, M의 범위, M의 배열 (선택 사항) |
28 | MultiPointM | MBR, 점 수, 점군, M의 범위, M의 배열 (선택 사항) |
31 | MultiPatch | MBR, 파트 수, 점 수, 파트군, 파트 종류, 점군, Z의 범위, Z의 배열, M의 범위, M의 배열 (선택 사항) |
4. 2. 셰이프 인덱스 파일 (.shx)
셰이프 인덱스 파일(`.shx`)은 주 셰이프 파일(`.shp`)에서 각 도형의 위치를 빠르게 찾을 수 있도록 도와주는 역할을 한다. `.shx` 파일은 `.shp` 파일과 동일한 100바이트 헤더를 가지며, 그 뒤에 여러 개의 8바이트 고정 길이 레코드가 이어진다. 각 레코드는 다음 두 필드로 구성된다.[2]바이트 | 데이터 형식 | 엔디안 | 용도 |
---|---|---|---|
0–3 | int32 | 빅 엔디안 | 레코드 오프셋 (16비트 워드) |
4–7 | int32 | 빅 엔디안 | 레코드 길이 (16비트 워드) |
- 레코드 오프셋: `.shp` 파일에서 해당 도형 데이터가 시작하는 위치를 16비트 워드 단위로 나타낸다.
- 레코드 길이: `.shp` 파일에서 해당 도형 데이터의 길이를 16비트 워드 단위로 나타낸다.
이 인덱스 파일을 이용하면 `.shp` 파일에서 특정 도형을 빠르게 찾거나, 역방향으로 검색하는 것이 가능하다. 예를 들어, 뒤에서부터 특정 도형을 찾으려면 먼저 `.shx` 파일에서 해당 도형의 레코드 오프셋과 길이를 확인하고, 이 정보를 바탕으로 `.shp` 파일에서 실제 도형 데이터를 읽으면 된다. 마찬가지로, 임의의 개수의 레코드를 앞으로 검색하는 것도 가능하다.
만약 `.shp` 파일만 있고 `.shx` 파일이 없는 경우, `.shp` 파일을 분석하여 `.shx` 파일을 생성할 수도 있다. 그러나 셰이프 파일은 항상 인덱스를 포함해야 하므로, 이는 손상된 파일을 복구하는 경우로 간주된다.[2]
4. 3. 속성 파일 (.dbf)
dBASE영어 IV 형식을 사용하여 각 도형의 속성 정보를 저장한다. 이 형식은 공개되어 있으며, xBase로 알려진 많은 dBase 복제본에서 구현되었다. 예를 들어, 오픈 소스 셰이프파일 C 라이브러리는 일반 dBase IV 형식임에도 불구하고 해당 형식을 "xBase"라고 부른다.[3] 속성의 이름과 값은 표준화되어 있지 않으며, 셰이프파일의 출처에 따라 다를 수 있다.이 파일은 각 셰이프에 대한 속성 정보를 담고 있으며, dBASE IV 형식을 따른다. xBase 형식이라는 공개된 사양이 있으며, 오픈 소스 라이브러리 등에서 사용된다.[8]
.dbf 파일은 다음과 같은 한계점을 가진다.
- 유니코드 지원 부족: 다양한 언어의 문자 표현에 제약이 있다.
- 필드 이름 길이 제한: 필드 이름은 최대 10자로 제한된다.
- 최대 필드 개수 제한: 최대 255개의 필드만 가질 수 있다.
5. 한계
셰이프파일 형식은 단순하고 널리 사용되지만, 몇 가지 한계점을 가지고 있다.
- 파일 크기 및 속성 정보 제약: 셰이프파일 및 구성 파일의 크기는 2GB를 초과할 수 없어 저장 가능한 지형 정보량이 제한된다. 속성 데이터베이스 형식은 오래된 dBase 표준을 기반으로 하므로 필드 이름 길이(최대 10자), 최대 필드 수(255개), 지원되는 필드 유형 등에 제약이 있다.
- 도형 유형 혼합 제한: 셰이프파일은 점, 선, 폴리곤 중 한 가지 유형의 도형만 저장할 수 있다. 따라서 우물(점), 강(폴리라인), 호수(폴리곤)처럼 서로 다른 유형의 지리 정보는 별도의 셰이프파일에 저장해야 한다.
5. 1. 위상 정보 부재
셰이프파일 형식은 지리적 위치 및 관련 속성 정보를 저장하기 위한 디지털 벡터 저장 형식이지만, 위상 정보를 저장하는 기능은 없다.[1] 셰이프파일 형식은 셰이프 간의 위상 관계를 저장하는 기능을 갖추고 있지 않다. 커버리지와 많은 지오데이터베이스는 피처 위상 정보를 저장할 수 있다.5. 2. 파일 크기 및 속성 정보 제약
및 구성 파일의 크기는 2GB(또는 231 바이트)를 초과할 수 없으며, 최대 약 7천만 개의 포인트 피처를 저장할 수 있다.[6] 다른 지오메트리 유형의 최대 피처 수는 사용된 정점의 수에 따라 다르다.구성 파일의 속성 데이터베이스 형식은 오래된 dBase 표준을 기반으로 하므로, 다음과 같은 여러 가지 제한 사항이 있다.[6]
- 현재 dBase 표준 및 GDAL/OGR (셰이프파일 형식 데이터 세트를 읽고 쓰는 주요 오픈 소스 소프트웨어 라이브러리)는 널 값을 지원하지만, ESRI 소프트웨어는 이러한 값을 0으로 나타낸다. 이는 널 수량이 0으로 표시될 경우 표현과 통계를 왜곡할 수 있으므로 정량적 데이터를 분석하는 데 매우 심각한 문제이다.
- 유니코드 필드 이름 또는 필드 저장에 대한 지원이 부족하다.
- 필드 이름의 최대 길이는 10자이다.
- 최대 필드 수는 255개이다.
- 지원되는 필드 유형은 다음과 같다: 부동 소수점(13자 저장), 정수(4 또는 9자 저장), 날짜(시간 저장 없음; 8자 저장), 텍스트(최대 254자 저장)
- 부동 소수점 숫자는 텍스트로 저장되므로 반올림 오류가 발생할 수 있다.
5. 3. 도형 유형 혼합 제한
셰이프파일은 단일 도형 유형만 저장할 수 있다. 예를 들어 점과 선을 같은 셰이프파일에 함께 저장할 수 없다.[1] 서로 다른 유형의 지리 정보를 표현하기 위해서는 별도의 셰이프파일을 생성해야 한다. 예를 들어, 우물(점), 강(폴리라인), 호수(폴리곤)는 세 개의 별도 데이터 세트로 저장해야 한다.[1]6. 활용
셰이프파일 형식은 GIS 분야에서 널리 사용되며, 다양한 소프트웨어 및 시스템에서 지원된다. 특히 정부 및 공공기관에서 셰이프파일 형식으로 지리 정보를 제공하는 경우가 많다. 공간 데이터의 개방과 공유가 중요해짐에 따라, 셰이프파일 형식의 활용은 더욱 증가할 것으로 예상된다.[1]
참조
[1]
웹사이트
ESRI Shapefile Technical Description
http://www.esri.com/[...]
1998-07
[2]
웹사이트
qgis - Creating missing .shx file?
https://gis.stackexc[...]
[3]
웹사이트
Shapefile C Library V1.2
http://shapelib.mapt[...]
[4]
웹사이트
SBN Format
https://pyshp.google[...]
2011-10-04
[5]
웹사이트
Switch from Shapefile
http://switchfromsha[...]
2017
[6]
웹사이트
ArcGIS Desktop 9.3 Help – Geoprocessing considerations for shapefile output
http://webhelp.esri.[...]
Esri
2009-04-24
[7]
간행물
Esri Shapefile technical description
http://www.esri.com/[...]
1998-07
[8]
웹사이트
Shapefile C Library V1.2
http://shapelib.mapt[...]
[9]
문서
http://pyshp.googlec[...]
[10]
웹사이트
ArcGIS Desktop 9.3 Help – Geoprocessing considerations for shapefile output
http://webhelp.esri.[...]
Esri
2009-04-24
[11]
저널
ESRI Shapefile Technical Description
http://www.esri.com/[...]
1998-07
[12]
저널
ESRI Shapefile Technical Description
http://www.esri.com/[...]
1998-07
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com