맨위로가기

덴드로그램

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

덴드로그램은 군집 분석의 결과를 나타내는 데 사용되는 다이어그램이다. 계층적 군집 덴드로그램은 초기 데이터를 나타내는 노드와 데이터가 속한 군집을 나타내는 노드로 구성되며, 화살표는 거리(비유사성)를 나타낸다. 덴드로그램은 UPGMA와 같은 군집화 방법을 사용하여 유전적 거리 행렬을 기반으로 군집화된 예시를 보여준다. R 프로그래밍 언어의 dendextend 패키지는 덴드로그램을 시각화하고 조정하며 비교하는 데 사용된다.

더 읽어볼만한 페이지

  • 클러스터 분석 - 잠재 공간
    잠재 공간은 데이터 항목 집합과 유사성 함수를 활용하여 데이터 특징을 저차원 공간에 표현하는 임베딩 모델을 통해 생성되는 공간으로, 다양한 모델과 기법을 통해 학습되며 여러 분야에 응용된다.
  • 클러스터 분석 - 혼합 모델
    혼합 모델은 여러 확률 분포를 결합하여 전체 데이터 분포를 표현하는 통계적 모델로, 지도 및 비지도 학습의 장점을 활용해 데이터를 분석하고 분류하며, 가우스 혼합 모델과 같이 다양한 분야에서 활용되고, EM 알고리즘으로 매개변수를 추정하고 최적화한다.
  • 그래프 그리기 - 상태도 (오토마타 이론)
    상태도는 유한 오토마타 이론에서 시스템의 상태와 전이를 시각적으로 표현하는 유향 그래프이며, 무어 머신, 밀리 머신, 하렐 상태도 등 다양한 형태로 활용된다.
  • 그래프 그리기 - 하세 도형
    하세 도형은 부분 순서 집합의 원소와 피복 관계를 점과 선으로 나타내어 순서 관계를 시각화하는 그래프 도구이며, 격자 이론, 조합론, 소프트웨어 공학 등에서 활용된다.
  • 트리 구조 - 프림 알고리즘
    프림 알고리즘은 그래프의 최소 비용 신장 트리를 찾는 탐욕 알고리즘으로, 최소 가중치를 가진 간선을 선택하여 트리를 확장하며, 시간 복잡도는 사용되는 자료 구조에 따라 달라진다.
  • 트리 구조 - 해시 트리
    해시 트리는 데이터 무결성 검증에 사용되는 트리 구조로, 잎 노드는 데이터를, 상위 노드는 자식 노드들의 해시 값을 가지며, 루트 해시를 통해 데이터 손상 여부를 효율적으로 판단할 수 있어 P2P 네트워크, 블록체인 등에서 활용된다.
덴드로그램
개요
덴드로그램
평균 연결을 사용한 계층적 클러스터링의 예시
어원고대 그리스어 δένδρον (déndron, "나무") + γράμμα (grámma, "글자, 그림")
정의덴드로그램(dendrogram)은 계층적 클러스터링을 그래픽으로 표현한 것이다.
데이터 포인트 간의 유사성을 보여주는 나무 모양의 다이어그램이다.
유형
계층적 클러스터링덴드로그램은 주로 계층적 클러스터링의 결과를 시각화하는 데 사용된다.
이 방법은 데이터 세트 내에서 유사한 그룹(클러스터)을 찾기 위해 데이터를 계층적으로 그룹화한다.
병합 방식 (Agglomerative)각 데이터 포인트를 개별 클러스터로 시작하여 가장 유사한 클러스터를 반복적으로 병합한다.
분할 방식 (Divisive)전체 데이터 세트를 하나의 클러스터로 시작하여 클러스터를 반복적으로 분할한다.
해석
높이덴드로그램의 높이는 클러스터 간의 거리 또는 비유사성을 나타낸다.
유사성높이가 낮을수록 클러스터 간의 유사성이 높다.
클러스터 결정덴드로그램을 특정 높이에서 "잘라" 클러스터 수를 결정할 수 있다.
활용
분야생물학 (계통 발생 분석, 유전자 발현 데이터 분석)
정보 과학 (클러스터링, 데이터 마이닝)
다양한 분야에서 데이터의 그룹 구조를 이해하는 데 사용
기타 정보
참고덴드로그램은 데이터의 계층 구조를 시각적으로 명확하게 보여준다.
클러스터링 결과를 해석하고 데이터의 패턴을 발견하는 데 유용하다.

2. 군집 분석 예시

군집 분석의 예시로, 다섯 개의 분류군(a에서 e까지)이 UPGMA를 사용하여 유전적 거리 행렬을 기반으로 군집화되는 과정을 덴드로그램으로 나타낼 수 있다. 덴드로그램은 초기 데이터를 나타내는 다섯 개의 노드(개별 분류군)와 나머지 노드는 데이터가 속한 군집을, 화살표는 거리(비유사성)를 나타낸다. 병합된 군집 간의 거리는 단조 증가하며, 병합 수준에 따라 증가한다. 각 노드의 높이는 두 자식 노드 사이의 그룹 간 비유사성 값에 비례한다.[1]

2. 1. UPGMA를 사용한 군집화

군집 분석의 예시로, 다섯 개의 분류군(a에서 e까지)이 UPGMA를 사용하여 유전적 거리 행렬을 기반으로 군집화되었다고 가정해 보자. 계층적 군집 덴드로그램은 초기 데이터를 나타내는 다섯 개의 노드로 구성된 열(여기서는 개별 분류군)을 보여주며, 나머지 노드는 데이터가 속한 군집을 나타내고, 화살표는 거리(비유사성)를 나타낸다. 병합된 군집 간의 거리는 단조 증가하며, 병합 수준에 따라 증가한다. 플롯에서 각 노드의 높이는 두 자식 노드 사이의 그룹 간 비유사성 값에 비례한다(오른쪽에 있는 개별 관측치를 나타내는 모든 노드는 0의 높이로 표시됨).

3. 덴드로그램 관련 소프트웨어

R 패키지 '''dendextend'''는 덴드로그램을 시각화, 조정 및 비교하는 데 사용되는 도구이다. 이 패키지는 2015년에 발표된 Galili의 논문에서 소개되었다.

3. 1. R 패키지: dendextend

R 패키지 '''dendextend'''는 덴드로그램을 시각화, 조정 및 비교하는 데 사용되는 도구이다. 이 패키지는 2015년에 발표된 Galili의 논문에서 소개되었다. dendextend영어 패키지는 덴드로그램을 더 유연하고 다양하게 다룰 수 있도록 돕는다. 예를 들어, 덴드로그램의 가지 색상을 변경하거나, 특정 노드를 강조 표시하거나, 두 개의 덴드로그램을 비교하여 유사성을 시각적으로 확인할 수 있다.

참조

[1] 서적 Molecular Systematics, 2nd edition Sinauer
[2] 저널 Global Diversity of Sponges (Porifera)
[3] 저널 Towards a natural system of organisms: proposal for the domains Archaea, Bacteria, and Eucarya http://www.pnas.org/[...]
[4] 서적 Dictionary of Statistics https://archive.org/[...] Cambridge University Press 1998
[5] 저널 The History of the Cluster Heat Map 2009-05
[6] 웹사이트 Phylogenetic tree (biology) https://www.britanni[...] 2018-10-22
[7] 서적 Abrégé du dictionnaire grec français Hachette 1981-01-01
[8] 웹사이트 Greek-french dictionary online http://www.tabulariu[...] 2018-10-20
[9] 서적 Molecular Systematics, 2nd edition https://archive.org/[...] Sinauer
[10] 서적 Dictionary of Statistics https://archive.org/[...] Cambridge University Press 1998
[11] 저널 The History of the Cluster Heat Map 2009-05
[12] 백과사전 Phylogenetic tree (biology) https://www.britanni[...] 2018-10-22
[13] 서적 Abrégé du dictionnaire grec français Hachette 1981-01-01
[14] 웹인용 Greek-french dictionary online http://www.tabulariu[...] 2018-10-20



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com