지오코딩
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
지오코딩은 주소나 건물 이름과 같은 텍스트 정보를 위도와 경도와 같은 수치형 공간 데이터로 변환하는 기술이다. 1960년대 초부터 시작되어 지리 정보 시스템(GIS)의 발전에 기여했으며, 1960년대에 캐나다 지리 정보 시스템(CGIS) 개발을 통해 본격적으로 활용되기 시작했다. 1980년대에는 상업용 지오코딩 소프트웨어가 등장하고, 1990년대에는 인터넷과 오픈 소스 GIS를 통해 사용자 중심으로 변화했다. 2000년대에는 CASS 주소 표준화, 소포 중심 지오코딩, 역지오코딩 등의 기술이 발전했으며, 2010년대에는 클라우드 기반 API를 통해 정확도와 속도가 향상되었다. 지오코딩은 입력 데이터, 참조 데이터, 지오코더 알고리즘을 거쳐 이루어지며, 주소 보간법과 같은 기술을 활용한다. 다양한 분야에서 활용되며, GPS, 지명 해결, 장소 코드 등과 같은 다른 기술과 결합하여 사용되기도 한다. 지오코딩 기술의 발전은 개인 정보 보호 문제를 야기하기도 한다.
더 읽어볼만한 페이지
지오코딩 | |
---|---|
개요 | |
정의 | 주소나 지명 등의 텍스트 정보를 좌표로 변환하는 과정 |
활용 분야 | 지도 제작, 위치 기반 서비스, 데이터 분석 등 |
기술적 측면 | |
입력 데이터 | 주소, 지명, 우편번호 등 |
출력 데이터 | 위도, 경도 좌표 |
정확도 | 데이터베이스의 품질, 알고리즘의 정확도, 입력 데이터의 정확성에 따라 달라짐 |
방법 | |
데이터베이스 기반 | 주소 및 좌표 정보가 저장된 데이터베이스를 활용 |
API 기반 | 구글 지도, 네이버 지도 등에서 제공하는 API를 활용 |
알고리즘 기반 | 주소 형식을 분석하여 좌표를 추정하는 알고리즘을 활용 |
고려 사항 | |
주소 체계 | 국가별 주소 체계가 다르므로, 해당 국가에 맞는 지오코딩 엔진을 사용해야 함 |
데이터 품질 | 데이터베이스의 주소 정보가 최신 정보로 유지되어야 정확한 결과를 얻을 수 있음 |
개인 정보 보호 | 개인 주소 정보를 다루는 경우, 개인 정보 보호 관련 법규를 준수해야 함 |
관련 기술 | |
역지오코딩 | 좌표를 주소로 변환하는 과정 |
지리 정보 시스템 (GIS) | 지리 데이터를 수집, 분석, 시각화하는 시스템 |
기타 | |
주의사항 | 100% 정확한 지오코딩은 불가능하며, 오차가 발생할 수 있음 |
2. 역사
지오코딩은 지리 정보 시스템(GIS) 공간 분석의 하위 집합으로, 1960년대 초부터 관심을 받기 시작했다.
1960년, 로저 톰린슨 박사가 최초로 운영 가능한 GIS인 캐나다 지리 정보 시스템(CGIS)을 개발했다. CGIS는 캐나다 토지 조사를 위해 수집된 데이터를 저장하고 분석하는 데 사용되었으며, 농업, 야생 동물, 임업에 대한 정보를 1:50,000 축척으로 매핑하여 캐나다 농촌의 토지 활용 능력을 규제하기 위한 것이었다. 1963년 7월 1일, 미국 우체국(USPOD)에서 전국적으로 5자리 우편 번호를 도입했고, 1983년에는 주소를 더욱 정확하게 찾기 위한 9자리 ZIP+4 코드가 도입되었다. 1964년, 하버드 컴퓨터 그래픽 및 공간 분석 연구소는 GRID 및 SYMAP과 같은 획기적인 소프트웨어 코드를 개발했으며, 이들은 모두 GIS의 상업적 개발을 위한 원천이 되었다. 1967년, 인구 조사국 팀은 최초의 현대적 벡터 매핑 모델인 이중 독립 지도 인코딩(DIME)을 발명했다. DIME은 주소 범위를 거리 네트워크 파일로 암호화하고 "백분율 따라가기" 지오코딩 알고리즘을 통합했다.[5]
1980년대 초반, Intergraph, ESRI, CARIS, ERDAS, MapInfo Corporation 등 여러 상업용 지오코딩 소프트웨어 공급업체가 등장했다. 1986년, DOS 운영 체제용으로 설계된 최초의 데스크톱 지오코딩 소프트웨어인 Mapping Display and Analysis System(MIDAS)이 출시되었다.[1]
20세기 말, 특히 오픈 소스 GIS 소프트웨어를 통해 지오코딩은 사용자 중심으로 변화했다. 1980년 인구 조사에서 메일 발송/메일 회수 기술이 매우 성공적이었기 때문에, 미국 인구 조사국은 보간법 거리 지오코딩을 사용하여 대규모 지리 공간 데이터베이스를 구축할 수 있었다.[6] 이 데이터베이스는 TIGER (위상 통합 지리 인코딩 및 참조)의 탄생을 가능하게 했다.
2000년대 초반에는 코딩 정확도 지원 시스템(CASS) 주소 표준화가 부상했다. 2003년에는 지오코딩 플랫폼이 월별로 업데이트되는 거리 데이터와 우편 번호를 병합할 수 있었으며,[2] 이 프로세스는 "융합"으로 알려지게 되었다.[2] 2005년부터는 소포 중심 지오코딩을 포함했다.[3] 같은 해 평가사 소포 번호(APN)가 도입되었다.[4] 2006년에는 역지오코딩과 역 APN 조회가 도입되었다.[5] 2008년과 2009년에는 MapQuest, 구글 지도(Google Maps), 빙 지도(Bing Maps) 및 GPS(Global Positioning Systems)와 같은 대화형 사용자 지향적 지오코딩 플랫폼이 성장했다.[6]
2010년대에는 공급업체들이 전 세계적으로 지오코딩과 역 지오코딩을 완벽하게 지원하게 되었다.
2. 1. 1960년대
1960년, 로저 톰린슨 박사가 최초의 운영 가능한 지리 정보 시스템(GIS)인 캐나다 지리 정보 시스템(CGIS)을 개발했다. CGIS는 캐나다 토지 조사를 위해 수집된 데이터를 저장하고 분석하는 데 사용되었으며, 농업, 야생 동물, 임업에 대한 정보를 1:50,000 축척으로 매핑하여 캐나다 농촌의 토지 활용 능력을 규제하기 위한 것이었다. CGIS는 1990년대까지 사용되었으나 상업적으로는 제공되지 않았다.[3][4]1963년 7월 1일, 미국 우체국(USPOD)에서 전국적으로 5자리 우편 번호를 도입했다. 1983년에는 주소를 더욱 정확하게 찾기 위한 추가 식별자로 9자리 ZIP+4 코드가 도입되었다.
1964년, 하버드 컴퓨터 그래픽 및 공간 분석 연구소는 GRID 및 SYMAP과 같은 획기적인 소프트웨어 코드를 개발했으며, 이들은 모두 GIS의 상업적 개발을 위한 원천이 되었다.
1967년, 수학자 제임스 코베트와 도널드 쿠크를 포함한 인구 조사국 팀은 최초의 현대적 벡터 매핑 모델인 이중 독립 지도 인코딩(DIME)을 발명했다. DIME은 주소 범위를 거리 네트워크 파일로 암호화하고 "백분율 따라가기" 지오코딩 알고리즘을 통합했다.[5] "백분율 따라가기" 알고리즘은 일치하는 주소가 참조 피처의 총 길이에 대한 백분율로 참조 피처를 따라 어디에 위치하는지를 나타내는 것으로, 구글 지도 및 MapQuest와 같은 플랫폼에서 여전히 사용되고 있다. DIME은 미국 인구 조사국에서 사용하기 위한 것이었으며, 블록 면을 정확하게 매핑하고, 거리 교차점을 나타내는 노드를 디지털화하고, 공간 관계를 형성하는 것을 포함했다. 코네티컷주 뉴헤이븐은 지구상에서 지오코딩 가능한 거리 네트워크 데이터베이스를 갖춘 최초의 도시였다.
2. 2. 1980년대
1980년대 초반, Intergraph, ESRI, CARIS, ERDAS, MapInfo Corporation 등 여러 상업용 지오코딩 소프트웨어 공급업체가 등장했다. 이들은 1960년대의 공간 정보 분리 접근 방식과 이 공간 정보를 데이터베이스 구조로 구성하는 접근 방식을 통합했다.[1]1986년, DOS 운영 체제용으로 설계된 최초의 데스크톱 지오코딩 소프트웨어인 Mapping Display and Analysis System(MIDAS)이 출시되었다.[1] 맵인포(MapInfo)가 MIDAS를 인수하면서 지오코딩은 연구 부서에서 비즈니스 세계로 진출했다.[1] 이후 맵인포는 Pitney Bowes에 인수되었으며, 지오코딩을 비즈니스 인텔리전스와 통합하는 데 선구적인 역할을 했다.[1] 이를 통해 위치 인텔리전스는 공공 부문과 민간 부문 모두에 솔루션을 제공할 수 있게 되었다.[1]
2. 3. 1990년대
20세기 말, 특히 오픈 소스 GIS 소프트웨어를 통해 지오코딩은 사용자 중심으로 변화했다. 지도 응용 프로그램과 지리 공간 데이터는 인터넷을 통해 더욱 접근성이 높아졌다.1980년 인구 조사에서 메일 발송/메일 회수 기술이 매우 성공적이었기 때문에, 미국 인구 조사국은 보간법 거리 지오코딩을 사용하여 대규모 지리 공간 데이터베이스를 구축할 수 있었다.[6] 이 데이터베이스는 인구 조사의 전국적인 가구 범위와 함께 TIGER (위상 통합 지리 인코딩 및 참조)의 탄생을 가능하게 했다.
개별 주소가 아닌 주소 범위를 포함하는 TIGER는 이후 오늘날 사용되는 거의 모든 지오코딩 소프트웨어 플랫폼에 구현되었다. 1990년 인구 조사 말까지 TIGER는 "3천만 개 이상의 피처 교차점과 끝점에 대한 위도/경도 좌표와 1억 4천 5백만 개에 달하는 피처 '모양' 포인트를 포함하여 1천 2백만 개 이상의 다각형을 나타내는 4천 2백만 개 이상의 피처 세그먼트를 정의했다."[7]
TIGER는 "빅 데이터" 지리 공간 솔루션의 획기적인 발전을 이루었다.
2. 4. 2000년대
2000년대 초반에는 코딩 정확도 지원 시스템(CASS) 주소 표준화가 부상했다. CASS 인증은 자사 주소 표준화 소프트웨어의 품질을 미국 우정국(USPS)에서 평가받기를 원하는 모든 소프트웨어 벤더 및 광고 우편 발송자에게 제공된다. 매년 갱신되는 CASS 인증은 배달 지점 코드, 우편 번호, ZIP+4 코드를 기반으로 한다. 소프트웨어 벤더가 CASS 인증 소프트웨어를 채택하면 대량 우편 및 배송 비용 할인을 받을 수 있다. 인증된 데이터베이스를 보유한 후 대량 우편에서 정확성과 효율성이 향상되는 이점을 얻을 수 있다.[1] 또한 지오코딩 플랫폼도 여러 데이터 세트를 지원할 수 있었다.[1]2003년에는 지오코딩 플랫폼이 월별로 업데이트되는 거리 데이터와 우편 번호를 병합할 수 있었으며,[2] 이 프로세스는 "융합"으로 알려지게 되었다.[2]
2005년부터 지오코딩 플랫폼은 소포 중심 지오코딩을 포함했다.[3] 소포 중심 지오코딩을 통해 주소를 지오코딩할 때 높은 정밀도를 얻을 수 있었다.[3] 예를 들어, 소포 중심 지오코딩을 통해 지오코더는 특정 건물이나 토지의 중심점을 결정할 수 있었다.[3] 이제 플랫폼은 특정 소포의 고도를 결정할 수도 있었다.[3] 같은 해 평가사 소포 번호(APN)가 도입되었다.[4] 관할 구역의 세무 평가자는 이 번호를 부동산 소포에 할당할 수 있었다.[4] 이를 통해 적절한 식별 및 기록 유지가 가능해졌다.[4] APN은 가스 또는 석유 임대 지역을 지오코딩하고 대중에게 제공되는 재산세 정보를 색인하는 데 중요하다.[4]
2006년에는 역지오코딩과 역 APN 조회가 지오코딩 플랫폼에 도입되었다.[5] 이는 경도와 위도를 사용하여 숫자 위치를 텍스트로 읽을 수 있는 주소로 지오코딩하는 것을 포함했다.[5]
2008년과 2009년에는 MapQuest, 구글 지도(Google Maps), 빙 지도(Bing Maps) 및 GPS(Global Positioning Systems)와 같은 대화형 사용자 지향적 지오코딩 플랫폼이 성장했다.[6] 이러한 플랫폼은 특히 스마트폰과 같은 모바일 산업의 동시적인 성장으로 인해 대중에게 더욱 접근성이 높아졌다.[6]
2. 5. 2010년대
2010년대에는 공급업체들이 전 세계적으로 지오코딩과 역 지오코딩을 완벽하게 지원하게 되었다. 클라우드 기반 지오코딩 애플리케이션 프로그래밍 인터페이스(API)와 온-프레미스 지오코딩을 통해 더 높은 매칭률, 더 높은 정확도, 더 빠른 속도를 달성했다. 현재 지오코딩이 비즈니스 의사 결정에 영향을 미칠 수 있다는 아이디어가 인기를 얻고 있다. 이는 지오코딩 프로세스와 비즈니스 인텔리전스의 통합이다.3. 지오코딩 과정
지오코딩은 여러 데이터 세트와 프로세스를 함께 작동시키는 작업이다. 사용자가 제공하는 구성 요소와 지오코딩 소프트웨어에 내장된 구성 요소가 모두 포함된다.
좁은 의미에서 '''지오코딩'''은 지명과 주소가 가리키는 장소[18]에 지리 좌표를 부여하는 것을 말한다[19]. 이 장소는 시청과 같은 지점의 경우 한 점으로 정해지지만, 시정촌과 같은 범위의 경우 대표점을 한 점으로 나타내거나, 영역을 다각형(폴리곤)으로 나타내는 경우가 있다. 대표점은 응용 목적에 따라 기하학적으로 부여하거나, 의미를 가진 지점(예: 시의 경우 시청 위치, 강의 경우 하구 또는 합류점 위치)을 부여한다.[19]
지오코딩은 지명을 포함하는 문서나 특정 지점을 촬영한 사진과 같은 각종 데이터에 지리 좌표를 부여하는 것을 의미하기도 한다.
지오코딩은 사람이 수작업으로 수행하거나, 컴퓨터 처리를 통해 자동으로 수행할 수 있다[20]. 사진의 경우, 카메라 내장 GPS 장치를 통해 좌표를 입력하고, EXIF 규격의 "GPS에 관한 부속 정보"[21](통칭 '''지오태그''')를 사용한다.
지오코딩 결과를 저장하거나 컴퓨터 처리를 수행할 때 "지명과 좌표를 대응시킨 데이터베이스"인 지명 사전 또는 지오코딩 데이터베이스가 기초가 된다. 일본에서는 국토지리원이 가구에 대응하는 가구 레벨 위치 참조 정보를 정리하고[22], 국토교통성이 2000년부터 정비하여 2003년부터 연 1회 정보 갱신을 정례화했다[22].
지오코딩 후에는 좌표에 따른 지점의 지도를 표시하는 소프트웨어를 연동하여 지명을 입력하면 해당 지점의 지도를 표시할 수 있다. '''지도 검색 서비스'''가 이러한 응용 예이다[23]. 좌표를 입력하여 해당 지점의 지명을 얻는 것은 '''역 지오코딩(리버스 지오코딩)'''이라고 한다[24].
3. 1. 입력 데이터
입력 데이터는 사용자가 지오코딩 과정을 통해 수치형 공간 데이터( 위도 및 경도 )로 변환하려는 설명적이고 텍스트적인 정보( 주소 또는 건물 이름)이다. 이러한 정보는 종종 해당 위치의 다른 속성과 함께 표에 포함된다. 입력 데이터는 두 가지 범주로 분류된다.- 상대 입력 데이터: 단독으로는 해당 위치의 공간적 표현을 지정할 수 없지만, 지리적으로 다른 위치에 종속되고 상대적인 위치에 대한 텍스트 설명이다. 상대 지오코드의 예로는 "엠파이어 스테이트 빌딩 맞은편"이 있다. 엠파이어 스테이트 빌딩을 식별하지 않고는 찾고 있는 위치를 결정할 수 없다. 지오코딩 플랫폼은 종종 이러한 상대적 위치를 지원하지 않지만, 이러한 방향으로 발전이 이루어지고 있다.
- 절대 입력 데이터: 단독으로 해당 위치의 공간적 표현을 출력할 수 있는 위치에 대한 텍스트 설명이다. 이 데이터 유형은 다른 위치와 독립적으로 절대적으로 알려진 위치를 출력한다. 예를 들어, USPS 우편번호, USPS ZIP+4 코드, 완전 및 부분 우편 주소, USPS PO 박스, 농촌 도로, 도시, 카운티, 교차로, 명명된 장소는 모두 데이터 소스에서 절대적으로 참조할 수 있다.
최대한의 정확도를 얻기 위해, 입력 데이터 세트의 지오코드는 가능한 한 정확해야 하며, 표준 방식으로 형식이 지정되어야 한다. 따라서 오류를 찾아 수정하기 위해 종종 "주소 정리"라고 하는 데이터 정리 과정을 먼저 거치는 것이 일반적이다. 이는 참가자가 자체 위치 지오코드를 입력하는 데이터베이스의 경우 특히 중요하며, 다양한 형태(예: "Pennsylvania", "PA", "Penn.")와 철자 오류가 자주 발생한다.
3. 2. 참조 데이터
공간 참조 시스템에서 지리적 특징의 위치를 지정하는 데 필요한 두 번째 데이터 세트는 일반적으로 GIS 파일 형식이나 공간 데이터베이스에 저장된다. 예를 들어 건물의 포인트 데이터 세트, 거리의 라인 데이터 세트, 카운티의 폴리곤 데이터 세트가 있다. 이러한 특징의 속성은 입력 데이터 세트의 지오코드와 일치하는 정보(이름, 고유 ID, 미국의 지리적 특징에 대한 표준 지오코드인 FIPS 코드 등)를 포함해야 한다. 참조 데이터 세트는 유연성을 높이거나 복잡한 지오코드를 처리하기 위해 여러 지오코드 속성 열을 포함하는 것이 일반적이다. 예를 들어, 주소 지오코딩에 사용하려는 거리 데이터 세트에는 거리 이름뿐만 아니라 방향 접미사 또는 접두사, 각 세그먼트에서 발견되는 주소 번호 범위도 포함되어야 한다.[18]3. 3. 지오코더 알고리즘
지오코더는 입력 데이터 세트의 각 지오코드를 참조 데이터 세트의 해당 피처 속성과 일치시키는 소프트웨어이다. 일치하는 항목이 있으면 참조 피처의 위치를 입력 행에 연결할 수 있다. 이러한 알고리즘은 다음 두 가지 유형으로 나뉜다.- 직접 일치: 지오코더는 각 입력 항목이 참조 데이터 세트의 단일 전체 피처에 직접 대응할 것으로 예상한다. 예를 들어 국가, 우편 번호, 건물 지점 참조 데이터에 대한 주소 일치 등이 있다. 이러한 종류의 일치는 관계형 테이블 조인과 유사하지만, 지오코더 알고리즘은 대략적인 일치를 인식하기 위해 불확실성 처리를 통합하는 경우가 많다(예: 대문자/소문자 구별이나 약간의 오타).
- 보간 일치: 지오코드는 피처뿐만 아니라 해당 피처 내의 일부 위치도 지정한다. 가장 일반적이고 오래된 예는 주소를 거리 선 데이터와 일치시키는 것이다. 먼저 지오코더는 주소를 구성 요소(도로 이름, 번호, 방향 접두사/접미사)로 구문 분석한다. 지오코더는 이러한 구성 요소를 입력 값을 포함하는 숫자 범위를 가진 해당 도로 세그먼트와 일치시킨다. 그런 다음 주어진 숫자가 세그먼트의 범위 내에서 어디에 속하는지 계산하여 세그먼트를 따라 위치를 추정한다. 직접 일치와 마찬가지로 이러한 알고리즘은 대략적인 일치를 처리하기 위해 불확실성 처리 기능이 있다(특히 "East"의 "E" 및 "Drive"의 "Dr"와 같은 약어).
알고리즘이 모든 입력 데이터를 완벽하게 찾을 수 있는 경우는 드물다. 오타 또는 불완전한 입력 데이터, 불완전한(보통 오래된) 참조 데이터, 또는 알고리즘이 인식하지 못하는 고유한 지역 지오코딩 시스템으로 인해 불일치가 발생할 수 있다. 많은 지오코더는 의심스러운 일치를 수동으로 검토하고 수정하는 후속 단계를 제공한다.[18][19][20][21][22][23][24]
4. 주소 보간법
주소 보간법은 지오코딩의 한 가지 간단한 방법이다. 이 방법은 거리 네트워크가 이미 지리 좌표 공간 안에 매핑되어 있는 거리 지리 정보 시스템의 데이터를 활용한다. 각 거리 구간은 주소 범위(예: 한 구간에서 다음 구간까지의 건물 번호)와 연결된다. 지오코딩은 주소를 가져와서 거리에 일치시키고 특정 구간(예: "블록" 규칙을 사용하는 마을의 블록)에 일치시킨다. 그런 다음, 구간을 따라 범위 내에서 주소의 위치를 보간한다.
보간법 사용 시 주의사항:보간법은 다음과 같은 가정을 기반으로 하므로 실제와 차이가 있을 수 있다.
- 일반적인 거리 세그먼트에서 짝수 번호 구획은 한쪽에, 홀수 번호 구획은 다른 쪽에 있다고 가정한다. 하지만 현실에서는 흔하지 않다.
- 주어진 구획이 세그먼트 길이를 따라 균등하게 분포되어 있다고 가정한다. 하지만 현실에서는 거의 일어나지 않으며, 지오코딩된 주소가 수천 피트 떨어져 있는 경우도 드물지 않다.
- 거리가 직선이라고 가정한다. 거리가 곡선인 경우 지오코딩된 위치가 실제 위치와 일치하지 않을 수 있다.
- 세그먼트 정보(특히 TIGER와 같은 소스)에는 주소의 최대 상한이 포함되어 있으며, 전체 주소 범위를 사용하는 것처럼 보간된다. 예를 들어, 세그먼트(블록) 범위가 100-199이지만 블록 끝의 마지막 주소가 110인 경우, 주소 110은 세그먼트 끝 근처가 아닌 거리의 10% 지점으로 지오코딩된다.
- 대부분의 보간 구현은 주소를 점으로 생성한다. 실제로는 물리적 주소가 세그먼트 길이를 따라 분산되어 있다. 예를 들어, 쇼핑몰의 주소는 물리적 부지가 거리 세그먼트를 따라 일정 거리를 차지하지만, 보간은 단일 지점으로 처리한다.
흔히 하는 실수는 주어진 지도의 지오코딩 가능한 속성의 정확도 등급을 믿는 것이다. 벤더가 인용한 정확도는 주소가 올바른 세그먼트나 세그먼트의 올바른 쪽에 할당되는지, 그리고 해당 세그먼트를 따라 정확한 위치를 갖는지와 관련이 없다. 미국 인구 조사 TIGER 데이터 세트를 사용한 지오코딩 프로세스에서는 주소의 5-7.5%가 다른 인구 조사 구역에 할당될 수 있다.[9] 호주의 TIGER 유사 시스템 연구에서는 지오코딩된 지점의 50%가 잘못된 부동산 구획에 매핑되었다.[9]
지오코딩된 데이터의 정확성은 이 데이터를 사용하는 연구의 품질에도 영향을 미칠 수 있다. 아이오와 연구원 그룹의 연구[10]에 따르면, TIGER 데이터 세트를 사용하는 일반적인 지오코딩 방법은 통계 분석의 40%에 해당하는 손실을 초래할 수 있다. 대안은 정사영상 또는 영국의 Ordnance Survey의 주소 지점 데이터와 같은 이미지 코딩된 데이터를 사용하는 것이지만, 이러한 데이터 세트는 일반적으로 비싸다.
이러한 이유로 중요하지 않은 응용 프로그램 외에는 보간 결과를 사용하지 않는 것이 매우 중요하다. 보간 지오코딩은 일반적으로 권위 있는 결정을 내리는 데 적합하지 않다. 예를 들어, 생명 안전이 영향을 받는 결정에는 보간을 기반으로 한 결정을 내리지 않는다. 구급차나 소방차는 맵에서 무엇을 말하든 항상 출동한다.
4. 1. 예시
'742 에버그린 테라스'를 예로 들어보겠습니다.에버그린 테라스의 이 구역(예: 블록)이 700에서 799까지 이어진다고 가정해 보겠습니다. 짝수 번지수는 에버그린 테라스의 동쪽에 위치하고, 홀수 번지수는 길의 서쪽에 위치합니다. 742 에버그린 테라스는 블록의 중간 지점보다 약간 못 미치는 지점, 즉 길의 동쪽에 위치할 것입니다. 이 위치에 길을 따라 지점이 매핑될 것이고, 아마도 길 중심선에서 동쪽으로 약간 떨어진 거리에 위치할 것입니다.
4. 2. 한계점
지오코딩 과정은 항상 간단하지 않으며, 다음과 같은 경우 어려움이 발생할 수 있다.- 모호한 주소 구분: "742 Evergreen Terrace"와 "742 W Evergreen Terrace"처럼 유사한 주소를 구별하기 어려울 수 있다. 스프링필드와 셸비빌에 모두 "742 Evergreen Terrace"가 있을 수 있는데, 이 문제는 도시 이름(필요에 따라 주, 도, 국가 등)을 추가로 묻는 방식으로 해결할 수 있다. 보스턴, 매사추세츠[8]에는 여러 "100 Washington Street" 위치가 있는데, 이는 여러 도시가 거리 이름을 변경하지 않고 합병되었기 때문이다. 따라서 고유한 우편 번호나 구역 이름을 사용하여 구분해야 한다.
- 새로운 주소 처리: 지리 정보 시스템 데이터베이스에 아직 추가되지 않은 새로운 거리의 주소를 지오코딩하려는 경우 어려움이 발생한다.
주소 확인을 통해 주소의 존재를 확인하고 모호성을 제거하면 지오코딩 정확도를 크게 향상시킬 수 있다. 유효한 주소를 결정하면 지오코딩 및 위도/경도 좌표 결정이 매우 쉬워진다.
보간법 사용 시 주의사항:보간법은 다음과 같은 가정을 기반으로 하므로 실제와 차이가 있을 수 있다.
- 일반적인 거리 세그먼트에서 짝수 번호 구획은 한쪽에, 홀수 번호 구획은 다른 쪽에 있다고 가정한다. 하지만 현실에서는 흔하지 않다.
- 주어진 구획이 세그먼트 길이를 따라 균등하게 분포되어 있다고 가정한다. 하지만 현실에서는 거의 일어나지 않으며, 지오코딩된 주소가 수천 피트 떨어져 있는 경우도 드물지 않다.
- 거리가 직선이라고 가정한다. 거리가 곡선인 경우 지오코딩된 위치가 실제 위치와 일치하지 않을 수 있다.
- 세그먼트 정보(특히 TIGER와 같은 소스)에는 주소의 최대 상한이 포함되어 있으며, 전체 주소 범위를 사용하는 것처럼 보간된다. 예를 들어, 세그먼트(블록) 범위가 100-199이지만 블록 끝의 마지막 주소가 110인 경우, 주소 110은 세그먼트 끝 근처가 아닌 거리의 10% 지점으로 지오코딩된다.
- 대부분의 보간 구현은 주소를 점으로 생성한다. 실제로는 물리적 주소가 세그먼트 길이를 따라 분산되어 있다. 예를 들어, 쇼핑몰의 주소는 물리적 부지가 거리 세그먼트를 따라 일정 거리를 차지하지만, 보간은 단일 지점으로 처리한다.
매우 흔한 오류는 주어진 지도의 지오코딩 가능한 속성의 정확도 등급을 믿는 것이다. 벤더가 인용한 정확도는 주소가 올바른 세그먼트나 세그먼트의 올바른 쪽에 할당되는지, 그리고 해당 세그먼트를 따라 정확한 위치를 갖는지와 관련이 없다. 미국 인구 조사 TIGER 데이터 세트를 사용한 지오코딩 프로세스에서는 주소의 5-7.5%가 다른 인구 조사 구역에 할당될 수 있다. 호주의 TIGER 유사 시스템 연구에서는 지오코딩된 지점의 50%가 잘못된 부동산 구획에 매핑되었다.[9]
지오코딩된 데이터의 정확성은 이 데이터를 사용하는 연구의 품질에도 영향을 미칠 수 있다. 아이오와 연구원 그룹의 연구[10]에 따르면, TIGER 데이터 세트를 사용하는 일반적인 지오코딩 방법은 통계 분석의 40%에 해당하는 손실을 초래할 수 있다. 대안은 정사영상 또는 영국의 Ordnance Survey의 주소 지점 데이터와 같은 이미지 코딩된 데이터를 사용하는 것이지만, 이러한 데이터 세트는 일반적으로 비싸다.
이러한 이유로 중요하지 않은 응용 프로그램 외에는 보간 결과를 사용하지 않는 것이 매우 중요하다. 보간 지오코딩은 일반적으로 권위 있는 결정을 내리는 데 적합하지 않다. 예를 들어, 생명 안전이 영향을 받는 결정에는 보간을 기반으로 한 결정을 내리지 않는다. 구급차나 소방차는 맵에서 무엇을 말하든 항상 출동한다.
5. 기타 기술
GPS는 고품질의 도로망 데이터와 주소가 부족한 시골 지역이나 기타 장소에서 위치를 매핑하는 데 유용하다. 교통사고의 경우, 교차로나 도로 중심선의 중간 지점으로 지오코딩하는 것이 적절한 기술이다. 선진국의 대부분의 고속도로에는 응급 대응, 유지 보수 및 내비게이션에 도움이 되는 마일 표지가 있다. 특정 경우와 상황에 특정 기술을 사용하고 다른 경우에는 다른 기술을 사용하는 등 이러한 지오코딩 기술을 조합하여 사용하는 것도 가능하다.
구조화된 우편 주소 기록의 지오코딩과 달리 지명 해결은 구조화되지 않은 문서 모음에서 장소 이름을 해당 공간적 발자국에 매핑한다.
- 장소 코드는 위성 이미지와 머신 러닝을 사용하여 정보가 없는 곳에서 디지털 방식으로 생성된 주소를 만드는 방법을 제공한다. 예: [https://www.technologyreview.com/s/612492/four-billion-people-lack-an-address-machine-learning-could-change-that/ 로보코드]
- 자연 주소 코드[11]는 지구상의 모든 지역 또는 지구 주위의 모든 공간에 주소를 지정할 수 있는 독점적인 지오코드 시스템이다. 10개의 숫자만 사용하는 대신 영숫자를 사용하면 NAC가 숫자 위도/경도에 해당되는 것보다 짧아진다.
- 군사 도면 좌표 시스템은 지구상의 지점을 찾는 데 사용되는 NATO 군대의 지리 좌표 표준이다.
- 유니버설 횡단 메르카토르 좌표계는 지구 표면의 위치에 좌표를 할당하기 위한 지도 투영 시스템이다.
- 무선 통신 사업자들에게 인기 있는 메이든헤드 로케이터 시스템.
- 글로벌 군사 작전을 위해 개발된 세계 지리 참조 시스템(GEOREF)은 현재의 글로벌 영역 참조 시스템(GARS)으로 대체되었다.
- 오픈 위치 코드 또는 "플러스 코드"는 구글에서 개발하여 공개 도메인으로 출시되었다.
- 지오해시는 모턴 Z-순서 곡선을 기반으로 하는 공개 도메인 시스템이다.
- What3words는 좌표를 세 개의 숫자로 나누고 색인화된 사전에서 단어를 찾는 방식으로, GCS 좌표를 의사 무작위 단어 집합으로 인코딩하는 독점 시스템이다.
6. 활용 분야
지오코딩된 위치는 GIS 분석, 지도 제작, 의사 결정 워크플로우, 트랜잭션 매시업(transaction mash-up) 또는 더 큰 비즈니스 프로세스에 유용하게 사용된다. 웹에서는 지오코딩이 경로 설정 및 지역 검색과 같은 서비스에 사용된다. 지오코딩은 GPS와 함께 사진이나 RSS 항목과 같은 미디어의 지오태깅에 대한 위치 데이터를 제공한다.[18][19]
지오코딩의 결과를 저장하거나 컴퓨터 처리를 할 때, "지명과 좌표를 대응시킨 데이터베이스"가 기초가 되며, 이를 지명 사전 또는 지오코딩 데이터베이스라고 한다. 지오코딩 후에는 좌표에 따른 지점의 지도를 표시하는 소프트웨어를 연동시켜 지명을 입력하면 해당 지점의 지도를 표시할 수 있다. '''지도 검색 서비스'''가 이러한 응용 예시이다.[23]
7. 개인 정보 보호 문제
지오코딩(및 역지오코딩) 서비스의 확산과 접근성 증가는 개인 정보 보호에 대한 우려를 제기한다. 예를 들어, 범죄 사건을 지도화할 때, 법 집행 기관은 피해자와 가해자의 사생활 보호 권리와 대중의 알 권리 사이에서 균형을 맞추는 것을 목표로 한다. 법 집행 기관은 위치 정보의 일부 세부 사항(예: 피해자 또는 가해자를 식별할 수 있는 주소 정보)을 가리는 대체 지오코딩 기술을 실험해 왔다. 또한 대중에게 온라인 범죄 지도를 제공할 때, 지도상의 지점의 위치 정확성에 대한 부인 조항을 게시하고, 이러한 위치 가림 기술을 인정하며, 정보 사용에 대한 약관을 부과한다.
참조
[1]
논문
Georeferencing: From Texts to Maps.
[2]
웹사이트
Geocode term as a verb, as defined by Oxford English Dictionary
https://en.oxforddic[...]
2018-04-26
[3]
서적
Corbett, James P. Topological principles in cartography. Vol. 48. US Department of Commerce, Bureau of the Census, 1979.
[4]
웹사이트
Short CV
http://www.ncgia.ucs[...]
2023-04-09
[5]
웹사이트
Geographic Information Systems at Yale: Geocoding Resources
http://guides.librar[...]
2016-06-22
[6]
웹사이트
Spatially enabling the data: What is geocoding?
https://www.ncjrs.go[...]
2016-06-22
[7]
웹사이트
25th Anniversary of TIGER
http://census.maps.a[...]
2016-06-22
[8]
웹사이트
Google Maps
https://www.google.c[...]
2023-04-09
[9]
논문
On the accuracy of TIGER-type geocoded address data in relation to cadastral and census areal units
http://jratcliffe.ne[...]
[10]
논문
Geocoding accuracy and the recovery of relationships between environmental exposures and health
[11]
논문
Natural Area Coding Based Postcode Scheme
http://www.ijcce.org[...]
2022-08-25
[12]
학위논문
Developing an Agent-Based Framework for Intelligent Geocoding
http://catalogue.cur[...]
Curtin University
2010
[13]
문서
An Agent-Based Framework to Enable Intelligent Geocoding Services
http://www.isprs.org[...]
[14]
뉴스
Difficult addresses no problem for IntelliGeoLocator
http://www.theaustra[...]
2011-05-09
[15]
뉴스
X marks the spot
http://det.wa.edu.au[...]
2011-05-09
[16]
논문
A deep learning approach for rooftop geocoding
https://onlinelibrar[...]
2019
[17]
웹사이트
ジオコーディングって何?
https://business.map[...]
2020-11-06
[18]
논문
GoogleMapsを用いたことばのアンケートシステム
https://air.repo.nii[...]
秋田大学教育文化学部
2008-03
[19]
웹사이트
Pelias Geocoder
https://pelias.io/
2020-11-06
[20]
논문
APIを用いた地理情報配信Webサイトの構築 -電子国土Webシステムを事例に
https://ritsumei.rep[...]
立命館地理学会
[21]
웹사이트
2.6節(Exif)
https://web.archive.[...]
JEIDA 日本電子工業振興会
2020-11-06
[22]
웹사이트
位置参照情報 ダウンロードサービス
https://nlftp.mlit.g[...]
国土交通省
2020-11-06
[23]
논문
ジオコーディングと地図化のWebサイトの構築とその活用 : Google Maps APIを利用して<論文>
https://doi.org/10.2[...]
埼玉大学教育学部地理学研究室
2010
[24]
웹사이트
CSISジオコーディングサービスの活用 (国土地理院・地理院地図での利用例) :※逆ジオコーディングとしてもAPI上で稼働
https://www.maff.go.[...]
農林水産省
2019-12-18
[25]
OSM
OSM
https://wiki.openstr[...]
[26]
OSM
OSM
https://wiki.openstr[...]
[27]
GeoJSON
GeoJSON
https://tools.ietf.o[...]
[28]
오픈스트리트맵
오픈스트리트맵
https://wiki.openstr[...]
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com