지리통계학
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
지리통계학은 공간 추정 및 시뮬레이션과 관련된 불확실성을 모델링하기 위해 확률 함수 이론에 기반한 통계적 모델을 사용하는 학문이다. 알려지지 않은 위치에서 연구 대상 현상을 상관된 확률 변수의 집합으로 간주하며, 추정 이론과 표본 추출을 통해 모델링 목표를 설정한다. 지리통계학은 크리깅, 베이지안 추론 등 다양한 방법론을 활용하며, 추정, 시뮬레이션, 응용 분야 등 다양한 측면에서 연구된다.
더 읽어볼만한 페이지
지리통계학 | |
---|---|
일반 정보 | |
학문 분야 | 통계학 |
하위 분야 | 공간 통계학 |
적용 분야 | 지리학 광업 석유 탐사 환경 과학 농업 역학 |
주요 개념 | |
주요 개념 | 크리깅 베리오그램 공간 자기 상관 공간 예측 지리 정보 시스템(GIS) |
관련 인물 | |
주요 인물 | 다니엘 크리그 조르주 마테롱 |
주요 저서 | |
주요 저서 | 《광산 지구 통계학》(Géostatistique des gisements miniers, 1963) - 조르주 마테롱 |
활용 분야 | |
응용 분야 | 자원 평가 환경 오염 모델링 역학 연구 정밀 농업 기후 변화 연구 |
2. 배경
지리통계학은 보간법과 밀접하게 관련되어 있지만, 단순 보간 문제를 넘어선다. 지리통계 기법은 공간 추정 및 시뮬레이션과 관련된 불확실성을 모델링하기 위해 확률 함수(또는 확률변수) 이론에 기반한 통계적 모델에 의존한다.[2]
역거리 가중 보간법, 쌍선형 보간법, 최근접 이웃 보간법과 같은 여러 가지 간단한 보간 방법/알고리즘은 지리통계학 이전에도 이미 잘 알려져 있었다. 지리통계학은 알려지지 않은 위치에서 연구 대상 현상을 상관된 확률 변수의 집합으로 간주함으로써 보간 문제를 넘어선다.
Z/''Z''영어('''x''')를 특정 위치 x/'''x'''영어에서 관심 변수의 값이라고 하자. 이 값은 알려지지 않았다(예: 온도, 강우량, 피에조메트릭 수위, 지질학적 상(相) 등). 위치 x/'''x'''영어에 측정할 수 있는 값이 존재하지만, 지리통계학은 이 값이 측정되지 않았거나 아직 측정되지 않았기 때문에 확률적이라고 간주한다. 그러나 Z/''Z''영어('''x''')의 확률성은 완전하지 않다. 여전히, 그것은 Z/''Z''영어('''x''')에 대해 알려진 특정 정보에 따라 달라지는 누적 분포 함수(CDF)에 의해 정의된다.
:F(z/''z''영어, '''x''') = Prob{ Z('''x''') ≤ z/''z''영어 | 정보 }
일반적으로 Z/''Z''영어의 값이 x/'''x'''영어에 가까운 위치(또는 x/'''x'''영어의 근방)에서 알려진 경우, 이 근방을 통해 Z/''Z''영어('''x''')의 CDF를 제한할 수 있다. 높은 공간 연속성을 가정하는 경우 Z/''Z''영어('''x''')는 근방에서 발견된 값과 유사한 값만 가질 수 있다. 반대로, 공간 연속성이 없는 경우 Z/''Z''영어('''x''')는 어떤 값이든 가질 수 있다. 확률 변수의 공간 연속성은 변이 함수 기반 지리통계학의 경우 매개 변수 함수일 수도 있고, 다중점 시뮬레이션[3] 또는 의사 유전 알고리즘 기법과 같은 다른 방법을 사용할 때 비모수적 형태를 가질 수도 있는 공간 연속성 모델로 설명된다.
전체 영역에 단일 공간 모델을 적용함으로써, Z/''Z''영어가 정상 과정이라는 가정을 한다. 즉, 동일한 통계적 특성이 전체 영역에 적용 가능하다는 것을 의미한다. 여러 지리통계적 방법은 이 정상성 가정을 완화하는 방법을 제공한다.
이러한 틀에서 두 가지 모델링 목표를 구분할 수 있다.
# 추정 Z/''Z''영어('''x''')의 값, 일반적으로 CDF f(z,x)/''f''(''z'','''x''')영어의 기댓값, 중앙값 또는 최빈값에 의한 추정. 이것은 일반적으로 추정 문제로 표시된다.
# 표본 추출 전체 확률 밀도 함수 f(z,x)/''f''(''z'','''x''')영어에서 실제로 각 위치에서 그 가능한 각 결과를 고려하여 표본 추출. 이것은 일반적으로 Z/''Z''영어의 여러 대안 지도(실현)을 생성하여 수행된다. N/''N''영어개의 그리드 노드(또는 픽셀)로 이산화된 영역을 고려하자. 각 실현은 완전한 N/''N''영어-차원 결합 분포 함수의 표본이다.
:: F('''z''', '''x''') = Prob{ Z('''x'''1) ≤ z1, Z('''x'''2) ≤ z2, ..., Z('''x'''N) ≤ zN }
이 방법에서는 보간 문제에 대한 여러 해결책의 존재를 인정한다. 각 실현은 실제 변수가 될 수 있는 가능한 시나리오로 간주된다. 모든 관련 작업 흐름은 실현의 앙상블과 그에 따라 확률적 예측을 허용하는 예측의 앙상블을 고려한다. 따라서 지리통계학은 역문제를 해결할 때 공간 모델을 생성하거나 업데이트하는 데 자주 사용된다.[4][5]
지리통계적 추정 및 다중 실현 접근 방식 모두에 대해 여러 가지 방법이 존재한다. 여러 참고 서적은 이 분야에 대한 포괄적인 개요를 제공한다.[6][2][7][8][9][10][11][12][13][14][15]
2. 1. 확률 모델
지리통계학적 기법은 공간적 예측 및 시뮬레이션과 관련된 불확실성을 모델링하는 무작위 함수(또는 확률 변수) 이론에 기반한 통계 모델에 의존한다.[21] 역거리 가중, 이중 선형 보간, 최근접 이웃 보간 등 많은 단순한 내삽법 및 알고리즘은 지리통계학이 등장하기 이전부터 이미 알려져 있었다. 지리통계학은 미지의 위치에서 현상을 일련의 상관된 확률 변수로 연구한다는 점에서 단순한 내삽법과는 다르다.특정 위치 x에서 관심 대상의 미지의 변수(예: 온도, 강수량, 압력 수위, 지질학적 지형 등)를 ''Z''('''x''')라고 하자. 계산 과정에서 측정 가능한 위치 x의 값이 존재하지만, 지리통계학에서는 미측정으로 간주하고 무작위 값으로 설정한다. 이 무작위 값은 ''Z''('''x''') 주변의 특정 정보에 의존하는 누적분포함수에 의해 정의된다.
:F(''z'', '''x''') = Prob{ Z('''x''') ≤ ''z'' | information }
일반적으로 Z의 값이 x(또는 x의 근방 값)에 가까운 위치일 경우, 이 위치 주변에서 ''Z''('''x''')의 누적분포함수를 제약할 수 있다. 지리공간적 연속성이 높다고 추정되는 경우, ''Z''('''x''')는 주변에서 구한 값과 유사한 값만 얻을 수 있다. 반대로, 상기 연속성이 보이지 않는 경우 ''Z''('''x''')는 임의의 값이 된다.
지역 전체에 단일 공간 모델을 적용함으로써 동일한 통계적 특성을 적용할 수 있다. 몇몇 지리통계 방법은 이 정상성 가설의 완화 방법을 제공하고 있다.
''Z''('''x''')의 추정 이론에서는 전형적으로 ''f''(''z'','''x''')의 기댓값, 중앙값, 최빈값을 추정하는 문제로 제시된다. 실제 각 위치에서 산출 가능한 결과를 고려하여, 전체 확률밀도함수 ''f''(''z'','''x''')에서 표본조사한다. 이 기법에서는 Z와 대체 가능한 지도를 여러 개 생성하여 사용한다. N개의 그리드 노드(또는 픽셀)로 이산화된 대상 지역을 생각할 때, 각 지도는 완전한 N차원 동시 분포 함수의 추출 표본이다.
: F('''z''', '''x''') = Prob{ Z('''x'''1) ≤ z1, Z('''x'''2) ≤ z2, ..., Z('''x'''N) ≤ zN }
이 기법에서는 보간 문제에서 여러 해가 확인 가능하다. 각 지도는 실제 변수가 어떻게 될 수 있는지 가능한 상황으로 고려된다. 관련된 모든 작업 절차는 결과적으로 확률론적 예측이 가능한 예측 앙상블로 기능한다. 따라서 지리통계학은 자주 역문제를 풀 때 공간 모델을 생성하거나 업데이트하는 데 사용된다.[22][23]
지리통계적인 많은 추정 방법이 존재하며, 몇몇 참고 서적은 이 분야의 포괄적인 개요를 기술하고 있다.[24][25][26][27][28][29][30][31][32][33][34]
2. 2. 공간 연속성
2. 3. 정상성 가정
3. 모델링 목표
3. 1. 추정
크리깅은 지리통계학 기법의 한 종류로, 관측되지 않은 위치에서의 임의장(예: 지리적 위치의 함수로서의 지형의 고도 z)의 값을 인근 위치에서의 값 관측치로부터 보간하는 데 사용된다.[16]베이즈 정리를 사용하여 더 많은 증거나 정보가 이용 가능해짐에 따라 확률 모델을 업데이트하는 통계적 추론 방법인 베이지안 추론은 지리통계학에서 점점 더 중요한 역할을 하고 있다. 베이지안 추정은 공간 과정(가장 일반적으로 가우시안 과정)을 통해 크리깅을 구현하고, 베이즈 정리를 사용하여 과정을 업데이트하여 사후 확률을 계산한다.[17]
확률 보존의 원리를 고려하여, 순환 차분 방정식(유한 차분 방정식)을 격자와 함께 사용하여 지질 구조에 대한 불확실성을 정량화하는 확률을 계산하는 방법은 마르코프 체인 및 베이지안 모델에 대한 수치적 대안이다.[18]
코크리깅(cokriging)은 추정하고자 하는 변수와 상관관계가 있는 다른 변수의 선형 결합으로 추정하는 기법이다. 크리깅은 특정 지점의 변수를 알려진 데이터의 선형 결합으로 추정한다.[19]
크리깅은 바리오그램 모델을 이용하여 임의 지점에서 확률 변수를 예측하는 기법이다.[35] 지시 크리깅은 임의 지점에서 확률 변수가 특정 임계값 미만 또는 임계값을 초과하는 값을 취하는 경우의 비선형 크리깅 기법이다.[36]
3. 2. 시뮬레이션
- 집계
- 분할
- 턴닝 밴드 기법
- 콜레스키 분해
- 절단된 가우시안
- 플루리가우시안
- 어닐링
- 스펙트럼 시뮬레이션
- 순차 지표법
- 순차 가우시안
- 데드 리프 기법
- 전이 확률
- 마르코프 연쇄 지리통계학
- 서포트 벡터 머신
- 부울 시뮬레이션
- 유전 모델
- 의사 유전 모델
- 셀룰러 오토마타
- 다점 지리통계학
4. 응용 분야
5. 한국적 특수성
6. 도구
- 지역화 변수 이론
- 공분산 함수
- 반분산
- 바리오그램
- 크리깅
- 범위 (지리통계학)
- 실 (지리통계학)
- 너겟 효과
- 훈련 영상
- 유한 차분법
참조
[1]
논문
A statistical approach to some basic mine valuation problems on the Witwatersrand
1951
[2]
서적
An Introduction to Applied Geostatistics
Oxford University Press
1989
[3]
서적
Multiple-point geostatistics: modeling with training images
Wiley-Blackwell
2014
[4]
논문
Linear inverse Gaussian theory and geostatistics
2006
[5]
논문
A geostatistical approach to the inverse problem in groundwater modeling (steady state) and one-dimensional simulations
1983
[6]
서적
Applied Geostatistics with SGeMS: A User's Guide
Cambridge University Press
2009
[7]
서적
GSLIB: Geostatistical Software Library and User's Guide (Applied Geostatistics Series), Second Edition
http://www.gslib.com[...]
Oxford University Press
1997
[8]
서적
Geostatistics - Modeling Spatial Uncertainty
John Wiley & Sons, Inc.
1999
[9]
서적
Geostatistical simulation: Models and algorithms
Springer
2002
[10]
서적
Mining Geostatistics
Academic Press
1978
[11]
서적
Introduction to Geostatistics: Applications in Hydrogeology
Cambridge University Press
1997
[12]
서적
Multivariate geostatistics
Springer-Verlag
2003
[13]
서적
Geostatistical Reservoir Modeling, 2nd Edition
Oxford University Press
2014
[14]
논문
Multiple-point geostatistical modeling based on the cross-correlation functions
2012
[15]
웹사이트
Statios - WinGslib
http://www.statios.c[...]
2005-10-10
[16]
서적
Hierarchical Modeling and Analysis for Spatial Data, Second Edition
Chapman & Hall/CRC
2014
[17]
논문
High-Dimensional Bayesian Geostatistics
https://projecteucli[...]
2017
[18]
논문
A two-dimensional approach to quantify stratigraphic uncertainty from borehole data using non-homogeneous random fields
2023
[19]
웹사이트
地球統計学
https://oilgas-info.[...]
2022-10-17
[20]
논문
A statistical approach to some basic mine valuation problems on the Witwatersrand
1951
[21]
서적
An Introduction to Applied Geostatistics
Oxford University Press
1989
[22]
논문
Linear inverse Gaussian theory and geostatistics
2006
[23]
논문
A geostatistical approach to the inverse problem in groundwater modeling (steady state) and one-dimensional simulations
1983
[24]
서적
Applied Geostatistics with SGeMS: A User's Guide
Cambridge University Press
2009
[25]
서적
GSLIB: Geostatistical Software Library and User's Guide (Applied Geostatistics Series), Second Edition
http://www.gslib.com[...]
Oxford University Press
1997
[26]
서적
Geostatistics - Modeling Spatial Uncertainty
John Wiley & Sons, Inc.
1999
[27]
서적
Geostatistical simulation: Models and algorithms
Springer
2002
[28]
서적
Mining Geostatistics
Academic Press
1978
[29]
서적
Introduction to Geostatistics: Applications in Hydrogeology
Cambridge University Press
1997
[30]
서적
Multivariate geostatistics
Springer-Verlag
2003
[31]
서적
Geostatistical Reservoir Modeling
Oxford University Press
2002
[32]
논문
Multiple-point geostatistical modeling based on the cross-correlation functions
2012
[33]
웹사이트
http://www.statios.c[...]
[34]
서적
Applied Geostatistics
1989
[35]
간행물
(p. 42)
2014
[36]
서적
2014
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com