맨위로가기

계량화학

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

계량화학은 화학 시스템의 속성을 모델링하여 이해하고 예측하는 데 사용되는 학문 분야이다. 1970년대 컴퓨터의 과학 연구 활용과 함께 등장했으며, 분석 화학, 대사체학 등 다양한 분야에서 활용된다. 계량화학은 다변량 보정, 분류, 패턴 인식, 군집 분석, 다변량 곡선 분해, 실험 계획법, 신호 처리, 모델 성능 평가 등 다양한 기법을 활용하며, 다중 방식 방법 또한 널리 사용된다. 특히, 모델의 성능 평가를 위해 평균 제곱근 오차(RMSE)와 ROC 곡선 아래 면적(AUC) 등의 지표가 활용된다.

더 읽어볼만한 페이지

  • 화학정보학 - 민감도와 특이도
    민감도와 특이도는 의학적 진단에서 검사의 정확성을 평가하는 지표로, 민감도는 실제 양성인 대상 중 양성으로 나타나는 비율, 특이도는 실제 음성인 대상 중 음성으로 나타나는 비율을 의미하며, 선별 검사에서 두 지표를 모두 높여 질병을 정확하게 진단하는 것을 목표로 한다.
  • 화학정보학 - 화학 데이터베이스
    화학 데이터베이스는 화학 구조, 반응, 스펙트럼, 물성 등 화학 정보들을 디지털 형태로 저장 및 관리하는 시스템으로, 화학 물질 특성 규명, 신약 설계, 물질 검색 등에 활용되며 부분 구조 검색과 같은 기능도 제공한다.
  • 응용통계학 - 추천 시스템
    추천 시스템은 사용자의 선호도와 행동 패턴을 분석하여 개인 맞춤형 정보나 상품을 추천하는 시스템으로, 다양한 알고리즘과 새로운 기술이 도입되어 정확도와 개인화 수준을 높이고 있으며, 여러 서비스에서 활용되면서 정확도 외 다양성, 개인정보 보호 등 다양한 요소를 고려한 평가가 중요해지고 있다.
  • 응용통계학 - 계량경제학
    계량경제학은 통계 이론과 수리 통계학을 활용해 경제 현상을 분석하고, 경제 이론 모형을 통계적으로 추정 및 검증하며, 준실험 방법으로 인과 관계를 추론하고, 내생성 문제 해결 및 최신 방법론을 발전시키는 학문이다.
  • 계산화학 - 에너지 준위
    에너지 준위는 양자 역학적 계에서 입자가 가질 수 있는 특정 에너지 값으로, 원자 내 전자의 양자화된 에너지 상태를 나타내며 분자에서는 전자, 진동, 회전 에너지 준위가 존재하고, 에너지 준위 간 전이는 광자의 흡수 또는 방출을 수반한다.
  • 계산화학 - 섭동 이론
    섭동 이론은 정확히 풀리는 문제에 작은 변화가 있을 때 급수로 표현하여 근사해를 구하는 방법으로, 초기 해에 보정항을 더하는 방식으로 고전역학, 양자역학 등 다양한 분야에서 활용되며 섭동 형태와 적용 차수에 따라 구분된다.
계량화학

2. 배경

계량화학은 실험 자연 과학, 특히 화학에서 기술적 문제와 예측적 문제를 모두 해결하는 데 적용된다. 기술적 응용 분야에서는 화학 시스템의 속성이 시스템의 기본 관계와 구조를 파악하기 위한 목적으로 모델링되며(모델 이해 및 식별), 예측적 응용 분야에서는 화학 시스템의 속성이 새로운 속성 또는 관심 있는 동작을 예측하기 위한 목적으로 모델링된다. 두 경우 모두 데이터 세트는 작을 수도 있지만, 수백에서 수천 개의 변수와 수백에서 수천 개의 사례 또는 관측치를 포함하여 크고 복잡한 경우가 많다.

계량화학 기법은 특히 분석 화학 및 대사체학에서 널리 사용되며, 개선된 계량화학적 분석 방법의 개발은 분석 기기 및 방법론 분야의 발전을 지속적으로 이끌고 있다. 이는 응용 분야 중심의 학문이며, 표준 계량화학적 방법론은 산업적으로 매우 광범위하게 사용되고 있지만, 학술 단체는 계량화학 이론, 방법 및 응용 분야의 지속적인 개발에 전념하고 있다.

3. 기원

'계량화학'이라는 용어는 1971년 스반테 윌드의 연구 보조금 신청서에서 처음 사용되었으며,[1] 그 직후 스반테 윌드와 브루스 코왈스키에 의해 국제 계량화학회가 결성되었다.[2] 계량화학은 1970년대 컴퓨터가 과학적 연구에 활용되면서 등장한 분야로 인정받고 있다.

초창기 계량화학의 응용 분야는 대부분 다변량 분류와 관련이 있었고, 이후 다양한 데이터 및 컴퓨터 기반 화학 분석을 통해 정량적 예측 응용 분야로 확장되었다.

4. 주요 기법

계량화학의 주요 기법으로는 다변량 분석, 다변량 보정, 분류, 패턴 인식, 군집 분석, 다변량 곡선 분해, 실험 계획법, 신호 처리, 성능 특성화 및 성능 지표, 다변량 통계적 공정 관리(MSPC), 다중 방식 방법 등이 있다.


  • 다변량 분석: 적외선 및 UV/가시 분광법 데이터는 종종 시료당 수천 개의 측정값으로 계산된다. 질량 분석법, 핵 자기 공명, 원자 방출/흡수 및 크로마토그래피 실험 또한 본질적으로 매우 다변량적이다. 이러한 데이터는 주성분 분석(PCA), 부분 최소 자승(PLS) 등의 기법을 사용하는 데 적합하다.[3] PCA와 PLS는 데이터의 상호 관계 또는 '잠재 변수'를 활용하며, 회귀, 군집화 및 패턴 인식과 같은 추가 분석을 위한 좌표계를 제공한다.
  • 기타 기법: 분자 모델링, QSAR, 화학정보학 등도 계량화학의 주요 기법으로 활용된다.

4. 1. 다변량 보정

화학 계량학의 많은 문제와 응용 분야는 보정과 관련이 있다. 목표는 압력, 유량, 온도, 적외선, 라만,[10] NMR 스펙트럼질량 스펙트럼과 같이 화학 시스템의 측정된 특성을 기반으로 관심 있는 특성을 예측하는 데 사용할 수 있는 모델을 개발하는 것이다. 예를 들어,

  • 다중 파장 스펙트럼 응답과 분석물 농도
  • 분자 설명자와 생물학적 활성
  • 다변량 공정 조건/상태와 최종 제품 속성


과 관련된 다변량 모델을 개발하는 것이다.

이 과정에는 예측하려는 관심 속성의 기준 값과 이러한 속성에 해당하는 것으로 간주되는 측정된 속성을 포함하는 보정 또는 훈련 데이터 세트가 필요하다. 예를 들어, 다중 파장 스펙트럼 응답의 경우, 각 샘플에 대한 관심 분석물의 농도(참조)와 해당 샘플의 적외선 스펙트럼을 포함하여 여러 샘플의 데이터를 수집할 수 있다. 그런 다음 부분 최소 자승 회귀 또는 주성분 회귀 (및 기타 수많은 방법)와 같은 다변량 보정 기술을 사용하여 다변량 응답(스펙트럼)을 관심 분석물의 농도와 연관시키는 수학적 모델을 구성하며, 이러한 모델을 사용하여 새로운 샘플의 농도를 효율적으로 예측할 수 있다.

다변량 보정 기술은 종종 고전적 방법 또는 역 방법으로 광범위하게 분류된다.[7][11] 이러한 접근 방식의 주요 차이점은 고전적 보정에서는 모델이 측정된 분석 응답(예: 스펙트럼)을 설명하는 데 최적화되도록 해결되므로 최적의 설명자로 간주될 수 있지만, 역 방법에서는 모델이 관심 속성(예: 농도, 최적 예측자)을 예측하는 데 최적화되도록 해결된다는 것이다.[12] 역 방법은 일반적으로 화학 시스템에 대한 물리적 지식이 덜 필요하며, 적어도 이론적으로는 평균 제곱 오차 측면에서 우수한 예측을 제공하며,[13][14][15] 따라서 역 접근 방식이 현대 다변량 보정에서 더 자주 적용되는 경향이 있다.

다변량 보정 기술을 사용하는 주된 장점은 빠르고 저렴하며 비파괴적인 분석 측정(예: 광학 분광법)을 사용하여 시간이 오래 걸리고, 비용이 많이 들거나 파괴적인 테스트(예: LC-MS)가 필요한 샘플 특성을 추정할 수 있다는 것이다. 마찬가지로 중요한 것은 다변량 보정을 통해 다른 분석물의 심각한 간섭이 있는 상태에서도 정확한 정량 분석을 할 수 있다는 것이다. 분석 방법의 선택성은 분석 측정 방식과 마찬가지로 수학적 보정을 통해 제공된다. 예를 들어, 다른 분석 기술(예: 적외선 또는 라만 스펙트럼)에 비해 매우 넓고 선택성이 없는 근적외선 스펙트럼은 신중하게 개발된 다변량 보정 방법과 함께 사용하여 매우 복잡한 매트릭스에서 분석물의 농도를 예측하는 데 성공적으로 사용될 수 있다.

4. 2. 분류, 패턴 인식, 군집 분석

지도 다변량 분류 기법은 보정 또는 훈련 세트를 사용하여 미래의 시료를 분류할 수 있는 수학적 모델을 개발한다는 점에서 다변량 보정 기법과 밀접하게 관련되어 있다. 계량화학에서 사용되는 기법은 다변량 판별 분석, 로지스틱 회귀, 신경망, 회귀/분류 트리 등 다른 분야에서 사용되는 기법과 유사하다.[16] 이러한 기존의 분류 방법과 함께 주성분 또는 부분 최소 자승 점수에 대한 판별 분석과 같이 랭크 감소 기술을 사용하는 것은 계량화학에서 일상적인 일이다.

클래스 모델링 또는 단일 클래스 분류기라고 하는 일련의 기법은 관심 있는 개별 클래스에 대한 모델을 구축할 수 있다.[16] 이러한 방법은 제품의 품질 관리 및 진위 확인의 경우에 특히 유용하다.

비지도 분류(군집 분석)는 복잡한 데이터 세트에서 패턴을 발견하는 데에도 일반적으로 사용되며, 계량화학에서 사용되는 많은 핵심 기술은 머신 러닝 및 통계적 학습과 같은 다른 분야에서도 공통적으로 사용된다.

4. 3. 다변량 곡선 분해

다변량 분석은 계량화학의 초기 응용 분야에서 중요한 측면이었다. 적외선 및 UV/가시광선 분광법의 데이터는 종종 시료당 수천 개의 측정값으로 계산된다. 질량 분석법, 핵자기 공명, 원자 방출/흡수 및 크로마토그래피 실험 또한 본질적으로 매우 다변량적이다. 이러한 데이터의 구조는 주성분 분석(PCA), 부분 최소 자승(PLS), 직교 부분 최소 자승(OPLS) 및 양방향 직교 부분 최소 자승(O2PLS)과 같은 기법을 사용하는 데 적합한 것으로 밝혀졌다.[3] 이는 주로 데이터 세트가 매우 다변량적일 수 있지만 강력하고 종종 선형적인 저차 구조가 존재하기 때문이다. PCA와 PLS는 시간이 지남에 따라 화학적으로 더 흥미로운 저차 구조를 경험적으로 모델링하고, 데이터의 상호 관계 또는 '잠재 변수'를 활용하며, 회귀, 군집화 및 패턴 인식과 같은 추가 수치 분석을 위한 대체 컴팩트 좌표계를 제공하는 데 매우 효과적인 것으로 나타났다. 특히 부분 최소 자승은 다른 분야에서 정기적으로 사용되기 시작하기 전까지 수년 동안 계량화학 응용 분야에서 널리 사용되었다.

4. 4. 기타 기법

다변량 분석은 계량화학의 초기 응용 분야에서 중요한 측면이었다. 적외선 및 UV/가시 분광법 데이터는 종종 시료당 수천 개의 측정값으로 계산된다. 질량 분석법, 핵 자기 공명, 원자 방출/흡수 및 크로마토그래피 실험 또한 본질적으로 매우 다변량적이다. 이러한 데이터는 주성분 분석(PCA), 부분 최소 자승(PLS) 등의 기법을 사용하는 데 적합하다.[3] PCA와 PLS는 데이터의 상호 관계 또는 '잠재 변수'를 활용하며, 회귀, 군집화 및 패턴 인식과 같은 추가 분석을 위한 좌표계를 제공한다.

분자 모델링, QSAR, 화학정보학, 유전체학, 단백체학, 대사체학대사체학의 '-omics' 분야, 공정 모델링 및 공정 분석 기술과 같은 몇몇 대규모 계량화학 응용 분야는 새로운 영역을 대표하게 되었다.

4. 4. 1. 실험 계획법

실험 계획법은 계량화학에서 핵심적인 연구 분야이며, 화학적 응용 분야의 실험 계획법에 특화된 여러 모노그래프가 있다.[21][22] 건전한 실험 계획법의 원리는 계량화학 커뮤니티 내에서 널리 채택되었지만, 많은 복잡한 실험은 순전히 관찰적이며, 샘플과 샘플 특성의 특성 및 상호 관계에 대한 통제가 거의 없을 수 있다.

4. 4. 2. 신호 처리

신호 처리는 거의 모든 계량화학 응용 분야의 중요한 구성 요소이며, 특히 보정 또는 분류 전에 데이터를 정비하기 위한 신호 전처리가 중요하다.[23] 신호 전처리는 최종 데이터 처리의 결과 해석 방식에 영향을 미칠 수 있다.[24] 계량화학에서 일반적으로 사용되는 기술은 관련 분야에서 사용되는 기술과 밀접하게 관련되어 있다.

4. 4. 3. 성능 특성화 및 성능 지표

계량화학은 성능 특성화, 모델 선택, 검증 및 성능 지표에 큰 비중을 둔다. 정량적 모델의 성능은 일반적으로 관심 속성을 예측하는 데 사용되는 평균 제곱근 오차로 지정되며, 분류기의 성능은 참 양성률/거짓 양성률 쌍(또는 전체 ROC 곡선)으로 지정된다.[25] 계량화학 모델 선택은 재표본 추출(부트스트랩, 순열, 교차 검증 포함)과 같은 도구를 사용한다.

4. 4. 4. 다변량 통계적 공정 관리 (MSPC)

모델링 및 최적화는 역사적으로 계량화학 발전에 큰 비중을 차지한다.[26][27][28] 분광법은 30~40년 동안 제조 공정의 온라인 모니터링에 성공적으로 사용되어 왔으며, 이러한 공정 데이터는 계량화학 모델링에 매우 적합하다. 특히 다변량 통계적 공정 관리(MSPC) 측면에서 배치 및 연속 공정의 다중 방식 모델링은 업계에서 점점 더 일반화되고 있으며 계량화학과 화학 공학에서 활발히 연구되고 있는 분야이다. 원래 용어인 공정 분석 화학[29] 또는 더 새로운 용어인 공정 분석 기술은 계량화학 방법과 다변량 통계적 공정 관리(MSPC)에 크게 의존하고 있다.

4. 4. 5. 다중 방식 방법

다중 방식 방법은 계량화학 응용 분야에서 널리 사용된다.[30][31] 이는 더 널리 사용되는 방법의 고차 확장이다. 예를 들어, 데이터 테이블(행렬 또는 2차 배열)의 분석은 여러 분야에서 일상적이지만, 다중 방식 방법은 3차, 4차 또는 더 높은 차수를 포함하는 데이터 세트에 적용된다. 이러한 유형의 데이터는 화학에서 매우 일반적이다. 예를 들어 액체 크로마토그래피/질량 분석법(LC-MS) 시스템은 분석된 각 샘플에 대해 방출 시간 대 m/z의 대규모 데이터 행렬을 생성한다. 여러 샘플의 데이터는 데이터 큐브를 구성한다. 배치 공정 모델링은 시간 대 공정 변수 대 배치 번호를 갖는 데이터 세트를 포함한다. 이러한 종류의 문제에 적용되는 다중 방식 수학적 방법에는 PARAFAC, 삼선형 분해, 다중 방식 PLS 및 PCA가 포함된다.

참조

[1] 논문 Chemometrics; what do we mean with it, and what do we want from it?
[2] 논문 Chemometrics: Views and Propositions 1975
[3] 논문 O2-PLS, a two-block (X–Y) latent variable regression (LVR) method with an integral OSC filter https://analyticalsc[...]
[4] 서적 Factor Analysis in Chemistry Wiley
[5] 서적 Chemometrics Wiley
[6] 서적 Chemometrics: a textbook Elsevier
[7] 서적 Multivariate Calibration Wiley
[8] 논문 The Start and Early History of Chemometrics: Selected Interviews. Part 1
[9] 논문 The Start and Early History of Chemometrics: Selected Interviews. Part 2
[10] 논문 Chemometrics for Raman Spectroscopy Harmonization http://journals.sage[...] 2022-09
[11] 서적 Handbook of Vibrational Spectroscopy Wiley
[12] 논문 Discordance between Net Analyte Signal Theory and Practical Multivariate Calibration
[13] 논문 Classical and inverse regression methods of calibration in extrapolation
[14] 서적 Chemometrics: mathematics and statistics in chemistry Riedel
[15] 논문 Inverse vs. classical calibration for small data sets
[16] 논문 Class-modelling in food analytical chemistry: Development, sampling, optimisation and validation issues – A tutorial 2017
[17] 논문 Self Modeling Curve Resolution
[18] 논문 Curve Resolution Using a Postulated Chemical Reaction
[19] 논문 Chemometrics Applied to Unravel Multicomponent Processes and Mixtures. Revisiting Latest Trends in Multivariate Resolution
[20] 논문 Multivariate Curve Resolution (MCR) from 2000: Progress in Concepts and Applications
[21] 서적 Experimental design: a chemometric approach Elsevier
[22] 서적 Statistical design – chemometrics Elsevier
[23] 서적 Encyclopedia of Analytical Chemistry Wiley
[24] 논문 The impact of signal pre-processing on the final interpretation of analytical outcomes – A tutorial 2019
[25] 논문 Guidelines for calibration in analytical chemistry Part 3. Uncertainty estimation and figures of merit for multivariate calibration https://zenodo.org/r[...]
[26] 논문 Process Analytical Chemistry: a new paradigm for analytical chemists
[27] 논문 Statistical control of multivariate processes
[28] 논문 An overview of multivariate statistical process control in continuous and batch process performance monitoring
[29] 논문 Chemical sensing in process analysis
[30] 서적 Multi-way analysis with applications in the chemical sciences Wiley
[31] 논문 Overview of chemometrics applied to spectroscopy: 1985–95, Part 3—Multiway analysis



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com