맨위로가기

거리 행렬

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

거리 행렬은 그래프 내 노드 간의 거리를 나타내는 행렬로, 네트워크 분석, 생물 정보학, 데이터 마이닝, 기계 학습, 정보 검색, 화학 등 다양한 분야에서 활용된다. 비 메트릭과 메트릭 거리 행렬, 가법 거리 행렬, 초미터 거리 행렬 등 여러 종류가 있으며, 특히 생물 정보학에서는 계통수 구축, 서열 정렬 등에 사용된다. 데이터 마이닝에서는 군집 분석, k-최근접 이웃 알고리즘 등에 활용되며, 정보 검색에서는 문서 간 유사도 측정에 사용된다. 화학에서는 분자 구조 표현에 활용되며, 이미지 예측, 시계열 객체 분석 등에도 적용된다.

더 읽어볼만한 페이지

  • 계량기하학 - 거리
    거리는 수학에서 두 점 사이를 측정하는 함수, 물리학에서 물체의 위치 변화량, 일상생활에서 두 지점 사이의 길이를 의미하며, 국제단위계에서는 길이로 표현된다.
  • 계량기하학 - 코시 열
    코시 열은 무한수열에서 항들이 뒤로 갈수록 서로 가까워지는 수열로, 수렴열은 항상 코시 열이지만 그 역은 성립하지 않을 수 있으며, 실수의 완비성 정의 및 무한급수 수렴성 판정에 중요한 역할을 하는 개념이다.
  • 생물정보학 - Rosetta@home
    Rosetta@home은 분산 컴퓨팅 플랫폼 BOINC를 활용하여 단백질 구조 예측 연구를 수행하며, 신약 개발 및 질병 연구에 기여하는 것을 목표로 한다.
  • 생물정보학 - 발현체학
  • 행렬 - 스핀 (물리학)
    스핀은 양자역학적 각운동량으로, 양자화된 값을 가지며 자기 쌍극자 모멘트를 유발하여 다양한 분야에 응용되고 스핀트로닉스 기술 발전에 기여하지만, 전자의 스핀 기원은 아직 완전히 밝혀지지 않았다.
  • 행렬 - 파울리 행렬
    파울리 행렬은 양자역학에서 스핀을 나타내는 데 사용되는 에르미트 행렬이자 유니타리 행렬로, 행렬식은 -1이고 대각합은 0이며, 리 대수의 생성원이자 파울리 벡터로 정의되어 다양한 물리학 분야에서 활용된다.
거리 행렬

2. 거리 행렬의 정의 및 종류

거리 행렬은 점, 객체, 또는 데이터 집합 간의 거리를 나타내는 정사각 행렬이다. 일반적으로 거리 행렬은 어떤 그래프의 가중치 인접 행렬로 볼 수 있다.

거리 행렬은 미터법 공리를 명확하게 나타낼 수 있고, 선형대수 기법을 적용하기 용이하다는 장점 때문에 여러 응용 분야에서 사용된다. 미터법 거리의 거리 행렬 M = (xij) (단, 1 ≤ i, j ≤ N)은 다음과 같은 특징을 갖는다.


  • 주 대각선의 모든 항목은 0이다. (즉, xii = 0 (모든 1 ≤ i ≤ N에 대해), 할로우 행렬)
  • 모든 비대각선 항목은 양수이다. (즉, xij > 0 (i ≠ j인 경우), 음이 아닌 행렬)
  • 행렬은 대칭 행렬이다. (즉, xij = xji)
  • 모든 i와 j에 대해, 모든 k에 대해 xij ≤ xik + xkj가 성립한다. (삼각 부등식)


처음 세 가지 공리(동일성, 양수성, 대칭성)를 만족하는 거리 행렬은 '사전 거리 행렬'이라고 불린다. 유클리드 공간에 임베딩될 수 있는 사전 거리 행렬은 유클리드 거리 행렬이라고 한다.

부호 이론에서 블록 코드의 요소 간 거리를 해밍 거리로 나타낼 때 거리 행렬이 사용된다. 이때, 거리 행렬에서 가장 작은 0이 아닌 항목은 코드의 오류 정정 및 감지 능력을 나타낸다.

생물 정보학에서는 계통수를 구축하기 위해 가법 거리 행렬과 초미터 거리 행렬이 사용된다. 가법 거리 행렬은 두 종 사이의 거리가 가장 최근 공통 조상(LCA)을 거쳐 계산되는 특성을 갖는다. 초미터 거리 행렬은 분자 시계가 일정하다는 가정 하에 사용되며, 모든 잎 노드에서 루트 노드까지의 거리가 동일하다는 특징을 갖는다.

거리 행렬은 생물정보학에서 단백질 구조를 나타내거나 서열 공간에서 두 서열 간 거리를 나타내는 등 다양한 분야에서 활용된다. 또한 구조 정렬 및 서열 정렬, NMR 또는 X선 결정학을 통한 단백질 구조 결정에도 사용된다. 거리 상관관계를 정의하는 데에도 사용될 수 있다.

2. 1. 비 메트릭 거리 행렬

일반적으로 거리 행렬은 어떤 그래프의 가중치 인접 행렬이다. 네트워크에서 가중치가 아크에 할당된 유향 그래프에서, 네트워크의 두 노드 간의 거리는 두 노드를 연결하는 최단 경로의 가중치 합의 최솟값으로 정의될 수 있다(경로의 단계 수는 제한됨).[2] 이 거리 함수는 잘 정의되어 있지만, 메트릭은 아니다. 가중치를 결합하고 비교할 수 있어야 한다는 점 외에는 가중치에 대한 제한이 없으므로 일부 응용 프로그램에서 음수 가중치가 사용된다. 경로는 유향이기 때문에 대칭성은 보장될 수 없으며, 음수 가중치 사이클이 존재하면 거리 행렬이 할로우가 아닐 수 있다(단계 수에 대한 제한이 없으면 행렬이 정의되지 않을 수 있음).

위의 내용은 최소-플러스 대수를 사용하여 대수적으로 공식화할 수 있다. 이 시스템에서 행렬 곱셈은 다음과 같이 정의된다. 두 ''n'' × ''n'' 행렬 ''A'' = (''a'') 및 ''B'' = (''b'')가 주어지면, 거리 곱 ''C'' = (''c'') = ''A'' ⭑ ''B''는 다음과 같은 ''n'' × ''n'' 행렬로 정의된다.

:c_{ij} = \min_{k=1}^n \{a_{ik} + b_{kj}\}.

직접 연결되지 않은 비대각선 요소는 최소-플러스 연산이 제대로 작동하도록 무한대 또는 적절한 큰 값으로 설정해야 한다. 이러한 위치의 0은 거리, 비용 등이 없는 가장자리로 잘못 해석된다.

만약 ''W''가 그래프의 에지 가중치를 포함하는 ''n'' × ''n'' 행렬이라면, ''W''(이 거리 곱을 사용하여) 최대 ''k''개의 에지 길이의 경로를 사용하여 정점 간의 거리를 제공하며, 따라서 단계 수 제한이 'k'로 설정될 때 그래프의 거리 행렬이 된다. 음수 가중치의 루프가 없으면 ''W''는 제한 없이 실제 거리 행렬을 제공하는데, 경로에서 반복된 정점을 제거하면 가중치가 낮아질 수 없기 때문이다. 반면에, ''i''와 ''j''가 음수 가중치 루프에 있으면, ''k''가 증가함에 따라 ''W''는 무한정 감소할 것이다.

''n''개의 정점에 대한 임의의 그래프 ''G''는 ''G''의 에지에 해당하는 완전 그래프의 각 에지에 1의 가중치를 할당하고 다른 모든 에지에 무한대를 할당하여 ''n''개의 정점에 대한 가중치 완전 그래프로 모델링할 수 있다. 이 완전 그래프에 대한 ''W''는 ''G''의 인접 행렬이다. ''G''의 거리 행렬은 위와 같이 ''W''에서 계산할 수 있다.

2. 2. 메트릭 거리 행렬

미터법 공리를 명확하게 인코딩할 수 있고 선형대수 기법을 사용하는 데 적합하다는 점에서 거리 행렬 형식이 사용된다. 즉, 가 인 미터법 거리의 거리 행렬이라면,

# 주 대각선 상의 모든 항목은 0이다(즉, 행렬은 할로우 행렬이다). 즉, for all 이다.

# 모든 비대각선 항목은 양수이다( if )(즉, 음이 아닌 행렬이다).

# 행렬은 대칭 행렬이다().

# 모든 와 에 대해, 모든 에 대해 (삼각 부등식)이다. 이는 트로피칼 행렬 곱셈으로 표현할 수 있다.

거리 행렬이 처음 세 가지 공리(동일성, 양수성, 대칭성)를 만족하면 반 미터법을 만들 때 사전 거리 행렬이라고 한다. 유클리드 공간에 임베딩될 수 있는 사전 거리 행렬을 유클리드 거리 행렬이라고 한다. 숫자형 설명자와 범주형 설명자를 모두 포함하는 혼합형 데이터의 경우, 가워 거리가 일반적인 대안이다.

미터법 거리 행렬의 또 다른 일반적인 예는 블록 코드에서 요소가 알파벳을 기준으로 고정된 길이의 문자열이고 그 사이의 거리가 해밍 거리 미터법으로 주어지는 경우 부호 이론에서 발생한다. 거리 행렬에서 가장 작은 0이 아닌 항목은 코드의 오류 정정 및 오류 감지 기능을 측정한다.

2. 3. 가법 거리 행렬

가법 거리 행렬은 생물 정보학에서 계통수를 구축하는 데 사용되는 특수한 유형의 행렬이다. 두 종 i영어와 j영어 사이의 가장 최근 공통 조상(LCA)을 x영어라고 할 때, ''M''''ij'' = ''M''''ix'' + ''M''''xj''가 성립한다. 이것이 가법 거리 행렬의 정의이다. 종 집합 S영어에 대한 거리 행렬 M영어은 다음과 같은 경우에만 가법이라고 한다.

  • S영어에 대한 계통수 T영어가 존재하여,
  • T영어의 모든 변 (''u'',''v'')가 양의 가중치 duv영어와 연관되고,
  • 모든 i영어,j영어 ∈ S영어에 대해, Mij영어는 T영어에서 i영어에서 j영어까지의 경로를 따라 가중치의 합과 같다.


이 경우, M영어을 가법 행렬이라고 하고 T영어를 가법 트리라고 한다. 다음은 가법 거리 행렬과 해당 트리의 예이다.

가법 거리 행렬(왼쪽)과 해당 계통수(오른쪽)

2. 4. 초미터 거리 행렬

분자 시계가 일정한 것을 모델링하는 가산 행렬로 정의된다. 이는 계통수를 구축하는 데 사용된다. 행렬 M은 다음과 같은 조건을 만족하는 트리 T가 존재할 경우 초미터라고 한다.

  • M_{ij}T에서 i에서 j까지의 경로를 따라가는 엣지 가중치의 합과 같다.
  • 트리의 루트는 모든 잎까지의 거리가 동일한 것으로 식별될 수 있다.


다음은 초미터 거리 행렬의 예시와 해당 트리이다.

3. 거리 행렬의 수학적 성질

일반적으로 거리 행렬은 대칭 행렬이며, 주 대각선의 원소는 모두 0이다.[2] 또한, 모든 비대각선 원소는 양수이다. 즉,


  • (모든 에 대해)
  • (인 경우)



삼각 부등식을 만족하는 경우, 즉 모든 , 에 대해 모든 에 대해 조건을 만족하는 경우 메트릭 거리 행렬이 된다. 이러한 성질은 트로피칼 행렬 곱셈으로 표현할 수 있다.

거리 행렬이 처음 세 가지 조건을 만족하면(반 메트릭) 사전 거리 행렬이라고도 한다. 사전 거리 행렬 중 유클리드 공간에 임베딩될 수 있는 경우 유클리드 거리 행렬이라고 한다.

블록 코드에서 요소가 알파벳을 기준으로 고정된 길이의 문자열이고 그 사이의 거리가 해밍 거리로 주어지는 경우, 거리 행렬에서 가장 작은 0이 아닌 항목은 코드의 오류 정정 및 감지 능력을 나타낸다.[2]

4. 다양한 분야에서의 응용

거리 행렬은 화학에서 그래프 이론적(위상적) 및 기하학적(지형적) 버전 모두에서 널리 사용되는 수학적 객체이다.[8] 명시적 및 암시적 형태로 모두 사용된다.

비너 지수와 같이 거리 행렬을 암묵적으로 사용하는 경우도 있는데, 비너 지수는 거리 행렬 원소 합의 절반과 같다.

와이너 숫자와 거리 행렬 간의 변환 공식

4. 1. 생물 정보학

거리 행렬은 생물정보학에서 단백질 구조를 좌표에 독립적인 방식으로 나타내거나, 서열 공간에서 두 서열 간의 쌍별 거리를 나타내는 데 사용된다. 구조 정렬 및 서열 정렬에 사용되며, 핵자기 공명(NMR) 또는 X선 결정학으로부터 단백질 구조를 결정하는 데 사용된다.[3]

거리 상관관계를 정의하는 데에도 사용된다.

가법 거리 행렬은 계통수를 구축하는 데 사용되는 특수한 유형의 행렬이다. 두 종 ''i''와 ''j'' 사이의 가장 최근 공통 조상(LCA)을 ''x''라고 할 때, ''M''''ij'' = ''M''''ix'' + ''M''''xj''가 성립한다.

4. 1. 1. 서열 정렬

거리 행렬은 생물정보학 분야에서 DNA, RNA, 단백질 등 두 개 이상의 생물학적 서열 간 유사성을 비교하고 정렬하는 데 사용된다. 서열 정렬의 주요 방법 중 하나는 동적 프로그래밍이며, 이 방법은 거리 행렬을 채우고 정렬을 얻는 데 사용된다.[3]

니들만-분슈 알고리즘은 전역 정렬을 계산하는 데 사용되며, 거리 행렬을 얻기 위해 동적 프로그래밍을 사용한다. 스미스-워터만 알고리즘 역시 동적 프로그래밍 기반으로, 거리 행렬을 구한 다음 국소적 정렬을 얻는다.

다중 시퀀스 정렬(MSA)은 한 번에 여러 시퀀스를 정렬하기 위한 쌍별 정렬의 확장이다. 다양한 MSA 방법은 전역 및 지역 정렬과 동일한 거리 행렬 개념을 기반으로 한다.

  • 중심 별 방법: 중심 시퀀스 ''S''c영어와 다른 모든 시퀀스 ''S''i영어 사이의 거리를 최소화하는 중심 시퀀스 ''S''c영어를 정의한다. 그런 다음 모든 ''S''i영어에 대해 정렬 거리 ''d''''M''(''S''c,''S''i)영어가 최적의 쌍별 정렬이 되도록 시퀀스 집합 ''S''영어에 대한 다중 정렬 M영어을 생성한다.
  • 점진적 정렬 방법: 먼저 가장 관련 있는 두 시퀀스를 정렬한 다음, 모든 시퀀스가 정렬될 때까지 다음으로 가장 관련 있는 두 시퀀스를 점진적으로 정렬하는 방식으로 MSA를 생성한다.


자체 프로그램을 가진 다른 인기 있는 방법들은 다음과 같다.

  • ClustalW
  • MUSCLE
  • MAFFT
  • MANGO

4. 1. 2. 계통 발생 분석

거리 행렬 방법은 계통 발생 분석에서 분류할 염기 서열 간의 "유전적 거리" 측정에 명시적으로 의존하며, 여러 개의 염기 서열을 입력해야 한다.[4] 이 방법은 각 서열 쌍 간의 거리를 나타내는 행렬을 구성하고, 이를 통해 계통수를 만든다. 이 트리는 관련된 서열을 동일한 내부 노드 아래에 배치하고, 가지 길이는 서열 간 거리를 반영한다. 거리 행렬 방법은 사용된 알고리즘에 따라 뿌리내린 트리 또는 뿌리내리지 않은 트리를 생성할 수 있다.[4]

n개의 종이 주어지면, 입력은 n x n 거리 행렬 M이며, 여기서 Mij는 종 i와 j 사이의 돌연변이 거리이다. 목표는 거리 행렬과 일치하는 차수 3의 트리를 출력하는 것이다.

거리 행렬 방법은 다중 서열 정렬에 자주 사용되지만, 여러 서브트리에 걸쳐 나타나는 국소적 고변이 영역 정보를 효율적으로 사용하지 못하는 단점이 있다.[4] 그러나 빠른 속도와 합리적인 계통 발생 추정치를 제공하며, DNA-DNA 혼성화 분석과 같이 문자 데이터로 변환하기 어려운 데이터도 사용할 수 있다는 장점이 있다.

계통 발생 재구성을 위한 거리 기반 방법에는 다음이 포함된다.

  • 가법 트리 재구성
  • UPGMA
  • 인접 결합법
  • Fitch-Margoliash

4. 2. 데이터 마이닝 및 기계 학습

거리 행렬은 데이터 마이닝기계 학습에서 군집 분석, 분류, 이상 탐지 등 다양한 작업에 사용된다. 예를 들어, k-최근접 이웃 알고리즘, 계층적 군집화 등에서 활용된다.[7] 효과적인 거리 행렬을 사용하면 기계 학습 모델의 성능을 향상시킬 수 있다.[7]

거리 행렬은 신경망에서 이미지 예측 기계 학습 모델의 2D에서 3D 회귀에도 사용될 수 있다.

4. 2. 1. 군집 분석

데이터 마이닝에서는 주어진 데이터 집합에 군집 분석을 적용하여, 다른 그룹과 비교했을 때 얼마나 유사한지에 따라 데이터를 그룹화하는 기능이 흔히 사용된다. 유사성은 거리 척도로 측정할 수 있으므로, 거리 행렬은 군집 분석에서 매우 중요하게 사용된다.[1] 거리 행렬은 집합 내의 모든 서로 다른 데이터 쌍 간의 유사성 척도를 나타내는 방식이다.[1]

거리 행렬은 계통 발생 재구성과 같은 생물 과학 분야에서 흔히 사용되는 휴리스틱 방법인 전통적인 계층적 클러스터링 알고리즘에 필요하다.[2] 데이터 마이닝에서 계층적 클러스터링 알고리즘을 구현할 때, 거리 행렬은 모든 점 간의 모든 쌍별 거리를 포함하며, 거리 행렬의 거리에 전적으로 기반하여 두 개의 다른 점 또는 클러스터 간에 클러스터를 생성하기 시작한다.[2]

점의 개수를 N이라고 하면, 계층적 클러스터링의 복잡성은 다음과 같다.[2]

복잡도설명
시간 복잡도O(N^3)
공간 복잡도O(N^2)


4. 2. 2. k-최근접 이웃 알고리즘

거리 척도는 지도 학습비지도 학습 모두에서 사용되는 여러 기계 학습 알고리즘의 핵심 부분이며, 일반적으로 데이터 포인트 간의 유사성을 계산하는 데 사용된다. 여기서 거리 행렬은 필수적인 요소이다. 효과적인 거리 행렬을 사용하면 분류 작업이든 클러스터링이든 기계 학습 모델의 성능이 향상된다.[7]

거리 행렬은 k-최근접 이웃 알고리즘에서 활용되는데, 이는 분류 및 회귀 작업에 모두 사용될 수 있는 가장 느리지만 가장 간단하고 가장 많이 사용되는 인스턴스 기반 머신 러닝 알고리즘 중 하나이다. 각 테스트 샘플의 예측 결과는 테스트 샘플과 훈련 세트의 각 훈련 샘플 간의 완전한 거리 행렬을 필요로 하기 때문에 가장 느린 머신 러닝 알고리즘 중 하나이다. 거리 행렬이 계산되면, 알고리즘은 테스트 샘플에 가장 가까운 K개의 훈련 샘플을 선택하여 선택된 세트의 다수(분류) 또는 평균(회귀) 값을 기반으로 테스트 샘플의 결과를 예측한다.

  • 예측 시간 복잡도는 O(k * n * d)이며, 여기서 거리 행렬을 구성하기 위해 각 테스트 샘플과 모든 훈련 샘플 간의 거리를 계산한다.
  • k = 선택된 최근접 이웃의 수
  • n = 훈련 세트의 크기
  • d = 데이터에 사용되는 차원의 수


이 분류 중심 모델은 대상과 각 훈련 샘플 간의 거리 행렬을 기반으로 대상의 레이블을 예측하여 대상에 가장 가깝거나 가장 가까운 K개의 샘플 수를 결정한다.

K-nn을 위한 K개의 훈련 샘플을 선택하는 데 사용되는 거리 행렬


K-NN으로 대상 값을 예측하는 머신 러닝 모델

4. 3. 정보 검색

거리 행렬은 정보 검색에서 문서 간 유사도를 측정하고, 이를 바탕으로 다양한 작업을 수행하는 데 활용된다. 예를 들어, 계층적 군집 분석에서는 거리 행렬을 사용하여 유사한 문서들을 묶어 클러스터를 형성하고, 사용자의 검색어와 관련된 문서를 효과적으로 찾아낼 수 있다.[1] 또한, 아이소맵과 같은 차원 축소 기법에서도 거리 행렬을 사용하여 고차원 데이터를 저차원으로 표현함으로써 문서 클러스터링 등의 작업을 효율적으로 수행할 수 있도록 돕는다.[2]

코사인 유사도는 정보 검색에서 문서 간 유사도를 측정하는 데 가장 널리 사용되는 방법 중 하나이며, 유클리드 거리는 평균 보정에 영향을 받지 않는다는 특징이 있다.[3] 이 외에도 최근접 이웃 검색을 위한 가우시안 혼합 거리 등 다양한 거리 측정 방법이 활용된다.[4]

코사인 유사도와 유클리드 거리 사이의 변환 공식


물고기 떼의 집단 행동을 모방한 물고기 떼 탐색 알고리즘에서도 거리 행렬이 활용될 수 있다.[5]

한국은 정보 검색 분야에서 검색 엔진 기술, 자연어 처리 기술 등에서 높은 수준의 기술력을 보유하고 있다.

4. 4. 화학

거리 행렬은 화학에서 두 순열 이성질체 간의 재배열에 필요한 최단 경로를 나타내거나, 분자 구조의 거리 다항식 및 거리 스펙트럼을 구성하는 데 사용된다.[8]

비너 지수와 같이 거리 행렬을 암묵적으로 사용하는 경우도 있다. 비너 지수는 거리 행렬 원소 합의 절반과 같다.

4. 4. 1. 분자 구조 표현

거리 행렬은 화학의 그래프 이론적(위상적) 및 기하학적(지형적) 버전 모두에서 널리 사용되는 수학적 객체이다.[8] 거리 행렬은 화학에서 명시적 및 암시적 형태로 모두 사용된다.

4. 4. 2. 그래프 이론적 거리 행렬

거리 행렬은 화학의 그래프 이론적(위상적) 및 기하학적(지형적) 버전 모두에서 널리 사용되는 수학적 객체이다.[8] 거리 행렬은 화학에서 명시적 및 암시적 형태로 모두 사용된다.

화학에서 사용되는 거리 행렬은 분자 그래프의 2차원 실현에 사용되며, 이는 다양한 응용 분야에서 분자의 주요 기본 특징을 설명하는 데 사용된다.

거리 행렬을 기반으로 한 C6H14의 탄소 골격의 레이블 트리 표현

  • 거리 행렬을 기반으로 분자의 탄소 골격을 나타내는 레이블 트리를 생성한다. 유사한 분자는 다양한 레이블 트리 변형을 가질 수 있기 때문에 거리 행렬은 이 응용 분야에서 필수적이다. 예시에서 거리 행렬을 기반으로 생성된 헥세인 (C6H14) 탄소 골격의 레이블 트리 구조는 거리 행렬과 레이블 트리에 모두 영향을 미치는 다른 탄소 골격 변형을 가지고 있다.
  • 이종 원자를 가진 분자를 나타내는 화학 그래프 이론에서 사용되는 가중치 간선을 가진 레이블 그래프를 생성한다.
  • Le Verrier-Fadeev-Frame(LVFF) 방법은 다환 그래프에서 그래프 중심을 감지하는 프로세스를 가속화하는 데 사용되는 컴퓨터 지향적 방법이다. 그러나 LVFF는 거리 행렬을 입력으로 요구하며, 이는 거리 행렬을 입력받아 LVFF 방법에 필요한 대각화된 값을 반환하는 Householder 삼대각-QL 알고리즘을 구현하여 쉽게 해결할 수 있다.

4. 4. 3. 기하학적 거리 행렬

거리 행렬은 화학의 그래프 이론적(위상적) 및 기하학적(지형적) 버전 모두에서 널리 사용되는 수학적 객체이다.[8] 거리 행렬은 화학에서 명시적 및 암시적 형태로 모두 사용된다.

2,4-디메틸헥산의 기하학적 거리 행렬


그래프 이론적 거리 행렬은 분자의 구조적 특징을 2차원으로 나타내는 반면, 기하학적 거리 행렬은 분자의 3차원(3D) 특성을 인코딩한다. 기하학적 거리 행렬은 분자의 그래프 이론적 거리 행렬을 기반으로 하여 3차원 분자 구조를 표현하고 그래프화하는 데 사용되는 또 다른 유형의 거리 행렬이다.[8] 분자 구조 G|G영어의 기하학적 거리 행렬은 2차원 행렬과 동일한 방식으로 정의되는 실수 대칭 n x n|n x n영어 행렬이다. 그러나 행렬 요소 Dij|Dij영어는 G|G영어에서 i|i영어와 j|j영어 사이의 가장 짧은 데카르트 거리 집합을 보유한다. 지형 행렬이라고도 알려진 기하학적 거리 행렬은 분자의 알려진 기하학적 구조로부터 구성될 수 있다. 예를 들어, '2,4-디메틸헥산'의 탄소 골격의 기하학적 거리 행렬이 위에 나와 있다.

5. 기타 응용 분야

동적 시간 워핑은 시계열 데이터 분석에 사용되는 거리 행렬 기반 알고리즘이다.[1] 신경망에서 이미지 예측 모델의 2D-3D 회귀에 사용될 수 있다.[2]

참조

[1] 서적 Reconstructing the phylogeny: Computational methods Academic Press
[2] 서적 Structural Models: An Introduction to the Theory of Directed Graphs John Wiley & Sons
[3] 서적 Algorithms in bioinformatics: A practical introduction Chapman & Hall
[4] 서적 Inferring phylogenies Sinauer Associates
[5] 논문 The neighbor-joining method: A new method for reconstructing phylogenetic trees https://academic.oup[...] 1987
[6] 논문 Construction of Phylogenetic Trees: A method based on mutation distances as estimated from cytochrome c sequences is of general applicability. https://www.science.[...] 1967
[7] 웹사이트 4 types of distance metrics in machine learning https://www.analytic[...] 2020-02-25
[8] 논문 The distance matrix in chemistry 1992



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com