스레드 이진 트리

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

스레드 이진 트리는 이진 트리의 포인터를 활용하여 중위 순회 시 각 노드의 이전 노드 또는 다음 노드를 가리키도록 구성한 자료 구조이다. 일반적인 이진 트리의 순회 시 재귀 호출로 인한 스택 공간 사용의 문제점을 해결하고, 특정 노드에서 부모 노드로의 접근을 용이하게 하기 위해 고안되었다. 스레드 이진 트리는 각 노드가 이전 노드 또는 다음 노드 중 하나를 가리키는 단일 스레드와 둘 모두를 가리키는 이중 스레드로 구분된다.

스레드 이진 트리

📚 더 읽어볼만한 페이지

탐색 트리 - AA 트리
AA 트리는 컴퓨터 과학의 자료 구조 중 하나이며, 학술 연구 및 특정 기술 분야에서 활용된다.
탐색 트리 - 스플레이 트리
스플레이 트리는 스플레이 연산을 통해 자가 균형을 유지하며 최근 접근 노드의 빠른 접근을 가능하게 하는 이진 탐색 트리로, 분할 상환 분석 시 평균적으로 O(log n)의 시간 복잡도를 가진다.
이진 트리 - 스플레이 트리
스플레이 트리는 스플레이 연산을 통해 자가 균형을 유지하며 최근 접근 노드의 빠른 접근을 가능하게 하는 이진 탐색 트리로, 분할 상환 분석 시 평균적으로 O(log n)의 시간 복잡도를 가진다.
이진 트리 - 이진 힙
이진 힙은 완전 이진 트리 기반 자료 구조로 우선순위 큐 구현에 사용되며, 힙 속성을 유지하기 위해 삽입/제거 시 상향 또는 하향 힙 연산을 수행하고 배열로 효율적인 구현이 가능하다.

1. 개요
2. 스레딩 (Threading)
3. 필요성 (Motivation)
4. 부모 포인터와의 관계 (Relation to parent pointers)
5. 종류 (Types)
6. 중위 순회 배열 (The array of in-order traversal)
7. 예시 (Example)
8. 널 링크 (Null links)
9. 구현 (Implementation)

2. 스레딩 (Threading)

이진 트리의 비어있는(null) 오른쪽 자식 포인터는 중위 순회 시 다음 노드(후속자)를 가리키고, 비어있는 왼쪽 자식 포인터는 이전 노드(선임자)를 가리키도록 연결하는 것을 '스레딩'(threading)이라고 한다. 이는 트리를 중위 순회 순서로 방문한다고 가정할 때의 방식이다. 하지만 필요에 따라 다른 순회(전위, 후위 등)를 위한 스레드를 추가할 수도 있다. 예를 들어, 사람 정보를 저장한 트리에서 이름순으로 정렬되어 있더라도, 생년월일이나 몸무게 등 다른 기준으로 빠르게 순회할 수 있도록 추가 스레드를 둘 수 있다.

이진 탐색 트리와 같은 트리는 각 노드에 저장된 특정 속성, 흔히 키(key)라고 불리는 값을 기준으로 항목을 정렬하여 저장하는 데 사용된다. 이런 트리에서 유용한 연산 중 하나는 '순회'인데, 이는 키 순서대로 모든 항목을 방문하는 것을 의미한다.

이진 탐색 트리의 모든 노드를 방문하는 간단한 재귀적 중위 순회 알고리즘은 다음과 같다. (t는 노드를 가리키는 포인터 또는 nil을 의미하며, t를 "방문"한다는 것은 해당 노드나 그 내용에 대해 어떤 작업을 수행하는 것을 뜻한다.)

: 알고리즘 traverse(t):
: * 입력: 노드를 가리키는 포인터 t (또는 nil)
: * 만약 t = nil 이면, 종료한다.
: * 아니면:
: traverse(t의 왼쪽 자식)
: t 방문
: ** traverse(t의 오른쪽 자식)

이 재귀 알고리즘은 두 가지 문제점을 가진다. 첫째, 재귀 호출로 인해 트리의 높이에 비례하는 스택 공간이 필요하다. 트리가 비교적 균형 잡혀 있다면 n개의 노드를 가진 트리에서 O(log n) 공간을 사용하지만, 트리가 한쪽으로 치우친 체인 형태가 되면 높이가 n이 되어 O(n) 공간을 사용하게 된다. 둘째, 노드가 자식 노드에 대한 포인터만 가지고 있다면 순회는 항상 루트 노드에서 시작해야 한다. 특정 노드에서 순회를 시작하거나 이어가려면 스레드 포인터와 같은 추가 정보가 필요하다. 스레딩은 이러한 스택 공간 문제와 순회 시작점 문제를 해결하는 데 도움을 줄 수 있다.

스레드를 사용하면 특정 포인터가 실제 자식 노드를 가리키는지, 아니면 스레드(중위 순회 상의 이전/다음 노드)를 가리키는지 구분하기 어려울 수 있다. 이를 구분해야 할 경우, 각 노드에 1비트의 추가 정보를 저장하여 구분할 수 있다.

1968년 도널드 크누스는 그의 저서에서 스택을 사용하지 않고 트리를 수정하지 않으면서 중위 순회를 하는 비재귀적 알고리즘이 있는지 질문했다. 이에 대한 한 가지 해결책으로 1979년 조셉 M. 모리스(Joseph M. Morris)가 트리 스레딩을 제시했다. 크누스는 1969년 개정판에서 스레드 트리 표현법을 펄리스(Perlis)와 손턴(Thornton)이 1960년에 제시한 것으로 언급했다.

3. 필요성 (Motivation)

이진 트리, 특히 이진 탐색 트리는 데이터를 특정 순서(주로 키 기준)로 저장하는 데 유용하다. 이런 트리에서 중요한 연산 중 하나는 저장된 항목들을 키 순서대로 모두 방문하는 순회(traversal)이다.

이진 탐색 트리의 각 노드를 방문하는 간단한 방법은 재귀를 이용한 순회 알고리즘이다. 예를 들어, 중위 순회(in-order traversal)는 일반적으로 왼쪽 서브트리를 먼저 순회하고, 현재 노드를 방문한 뒤, 오른쪽 서브트리를 순회하는 방식으로 재귀적으로 구현된다.

하지만 이 재귀적 방식에는 몇 가지 고려해야 할 점이 있다.
* 스택 공간 사용: 재귀 호출은 프로그램 실행 스택에 정보를 저장해야 하므로, 트리의 높이에 비례하는 메모리 공간을 사용한다. 트리가 비교적 균형 잡혀 있다면 O(log n)의 공간이 필요하지만 (여기서 n은 노드의 개수), 트리가 한쪽으로 치우친 사슬 형태가 되는 최악의 경우에는 트리의 높이가 n이 되어 O(n)의 공간이 필요하게 된다. 노드 수가 매우 많을 경우 이는 상당한 메모리 부담이 될 수 있다.
* 부모 노드 접근의 어려움: 일반적인 이진 트리 구조에서 각 노드는 자식 노드에 대한 정보만 가지고 있을 뿐, 부모 노드를 직접 가리키는 정보는 없다. 따라서 특정 노드에서 부모 노드로 거슬러 올라가기가 번거로우며, 대부분의 순회 알고리즘은 루트에서 시작해야 한다.

이러한 문제점, 특히 추가적인 스택 공간 없이 순회하고 노드의 선행자나 후속자를 쉽게 찾으려는 필요성 때문에 스레드 이진 트리(threaded binary tree) 개념이 등장했다. 스레드 이진 트리는 기존에 사용되지 않던(null 값인) 자식 포인터를 활용하여, 순회 순서상 선행자(predecessor)나 후속자(successor) 노드를 가리키는 스레드(thread)를 연결한다.

컴퓨터 과학자 도널드 커누스는 1968년 그의 저서에서 "스택을 사용하지 않고, 트리의 구조를 변경하지 않으면서 중위 순회를 할 수 있는 비재귀적 알고리즘이 존재하는가?"라는 질문을 제기하며 이러한 필요성을 환기시켰다. 이 문제에 대한 효과적인 해답 중 하나로 1979년 조셉 M. 모리스(Joseph M. Morris)가 제시한 트리 스레딩 기법이 있다. 커누스는 이후 1969년 판에서 스레드 트리 표현 자체는 펄리스와 손턴(Thornton)이 1960년에 먼저 제시했다고 언급했다.

4. 부모 포인터와의 관계 (Relation to parent pointers)

어떤 노드 k가 오른쪽 자식 노드 m을 가지고 있다면, m의 왼쪽 포인터는 왼쪽 자식을 가리키거나 혹은 스레드를 통해 다시 부모 노드인 k를 가리킬 수 있다. 마찬가지로, 노드 k가 왼쪽 자식 노드 n을 가지고 있다면, n의 오른쪽 포인터는 오른쪽 자식을 가리키거나 스레드를 통해 다시 k를 가리킬 수 있다. 이러한 구조는 마치 자식 노드가 부모 노드를 가리키는 것과 유사한 방식으로 부모 노드에 대한 정보를 유지하는 방법이라고 볼 수 있다.

5. 종류 (Types)

스레드 이진 트리는 일반적으로 null 값을 가질 수 있는 포인터를 활용하여 특정 순서로 노드를 연결한다. 예를 들어, 오른쪽 자식 포인터가 null일 경우 중위 순회 순서상 다음 노드(후속자)를 가리키고, 왼쪽 자식 포인터가 null일 경우 중위 순회 순서상 이전 노드(선임자)를 가리키도록 만드는 방식이다. 이렇게 연결된 구조를 스레드라고 부르며, 이를 통해 트리를 특정 순서로 빠르게 순회할 수 있다. 스레드는 중위 순회 외에도 다양한 순서(예: 이름, 생년월일 등)로 노드를 연결하는 데 사용될 수 있다.

스레드 이진 트리는 스레드를 연결하는 방식에 따라 다음과 같이 나눌 수 있다.

* 단일 스레드(Single Threaded): 각 노드가 중위 순회 순서상 이전 노드 또는 다음 노드 중 하나만을 가리키도록 스레드를 설정한다. 즉, 왼쪽 스레드나 오른쪽 스레드 중 하나만 사용한다.
* 이중 스레드(Double Threaded): 각 노드가 중위 순회 순서상 이전 노드 및 다음 노드를 모두 가리키도록 스레드를 설정한다. 즉, 왼쪽 스레드와 오른쪽 스레드를 모두 사용한다.

6. 중위 순회 배열 (The array of in-order traversal)

스레드 이진 트리는 일반적으로 비어있는(null) 오른쪽 자식 포인터가 해당 노드의 중위 순회 상 후행 노드(in-order successor)를 가리키도록 하고, 비어있는 왼쪽 자식 포인터는 중위 순회 상 선행 노드(in-order predecessor)를 가리키도록 연결하여 만들어진다. 이는 트리의 순회 순서가 중위 순회 방식과 동일하다고 가정하는 방식이다.

결과적으로 스레드는 중위 순회 순서에 따라 각 노드의 선행 노드와 후행 노드를 가리키는 역할을 한다.

아래 그림으로 예시된 스레드 트리의 중위 순회 순서는 A, B, C, D, E, F, G, H, I이다. 이 순서에 따라, 노드 E의 선행 노드는 D가 되고, 후행 노드는 F가 된다.

스레드 이진 트리의 중위 순회 예시. 각 노드의 스레드는 중위 순회 순서에 따른 선행 노드와 후행 노드를 가리킨다.

7. 예시 (Example)

일반적인 이진 트리를 스레드 이진 트리로 변환하는 과정은 다음과 같다.

위 그림과 같은 일반적인 이진 트리가 있다고 가정한다. 이 트리의 중위 순회 결과는 D, B, A, E, C 순서이다. 중위 순회 순서를 기반으로 스레드를 연결하면 다음과 같은 스레드 이진 트리를 만들 수 있다.

스레드 이진 트리에서는 중위 순회 시 선행 노드(predecessor)나 후속 노드(successor)를 가리키는 포인터(스레드)를 이용하여 순회를 더 효율적으로 수행할 수 있다. 예를 들어, 노드 D의 오른쪽 포인터는 중위 순회 상 다음 노드인 B를 가리키고, 노드 B의 오른쪽 포인터는 A를 가리킨다. 마찬가지로 노드 A의 왼쪽 포인터는 중위 순회 상 이전 노드인 B를 가리키고, 노드 E의 왼쪽 포인터는 A를 가리킨다.

8. 널 링크 (Null links)

스레드 이진 트리에서 널 링크(null link)는 자식 노드를 가리키는 포인터가 비어 있는 경우를 의미한다. 일반적인 이진 트리에서는 이 포인터들이 단순히 아무것도 가리키지 않지만(NULL), 스레드 이진 트리에서는 이 널 링크를 활용하여 중위 순회 순서상 바로 이전 노드(선행자, predecessor)나 바로 다음 노드(후행자, successor)를 가리키는 특별한 포인터, 즉 '스레드(thread)'로 사용하기도 한다. 예를 들어, 아래 그림과 같은 스레드 트리에서 중위 순회는 A, B, C, D, E, F, G, H, I 순서이며, 노드 E의 선행자는 D, 후행자는 F가 된다.

스레드 이진 트리의 예시. 중위 순회 순서는 A, B, C, D, E, F, G, H, I이다.

n개의 노드를 가진 m-방향 트리(일반적인 이진 트리의 경우 m=2)에서 각 노드는 최대 m개의 자식 포인터를 가질 수 있다. 따라서 이론적으로 가능한 총 자식 포인터의 수는 n × m 개이다. 이 중에서 실제로 트리의 구조를 형성하는 데 사용되는 링크(부모-자식 연결)의 수는 루트 노드를 제외한 모든 노드가 하나의 부모 노드를 가지므로 n−1 개이다.

결과적으로, 트리 내에서 실제로 자식 노드를 가리키지 않는 포인터, 즉 널 링크(무효 링크)의 총 개수는 다음과 같이 계산할 수 있다.

널 링크 개수 = (총 가능한 자식 포인터 수) - (실제 사용된 링크 수)
= n × m − (n−1)

9. 구현 (Implementation)

C 언어를 사용하여 스레드 이진 트리에서 특정 노드의 부모 노드를 찾는 함수의 예시는 다음과 같다. 이 코드는 주어진 노드(`node`)에서 시작하여, 왼쪽 또는 오른쪽 포인터가 스레드인지 확인하며 부모 노드를 탐색한다. 루트 노드의 경우 부모가 없으므로 null을 반환한다. `is_thread()` 함수는 해당 포인터가 실제 자식 노드를 가리키는지, 아니면 스레드를 가리키는지 판별하는 함수라고 가정한다.

Node* parent(Node* node)
{
Node *x, *y, *p;
// 루트 노드는 부모가 없음
if (node == root)
return null;

x = y = node;
while (1)
{
// 오른쪽 포인터가 스레드인 경우
if ( is_thread(y->right) )
{
p = y->right; // 스레드를 따라감
// 스레드가 null이거나, 스레드가 가리키는 노드의 왼쪽 자식이 현재 노드가 아닌 경우
// (즉, 잘못된 스레드이거나 다른 경로로 탐색해야 하는 경우)
if (p == null || p->left != node)
{
p = x; // 탐색 시작점을 x로 재설정
// 왼쪽 자식이 스레드가 아닐 때까지 왼쪽으로 이동
while ( !is_thread(p->left) )
p = p->left;
p = p.left; // 최종적으로 왼쪽 스레드가 가리키는 노드가 부모
}
return p; // 부모 노드 반환
}
// 왼쪽 포인터가 스레드인 경우 (오른쪽과 대칭적인 로직)
else if ( is_thread(x->left) )
{
p = x->left;
if (p == null || p->right != node)
{
p = y;
while ( !is_thread(p->right) )
p = p->right;
p = p.right;
}
return p;
}
// 스레드를 찾지 못한 경우, 왼쪽 및 오른쪽 자식으로 한 단계씩 내려감
x = x->left;
y = y->right;
}
}

스레드 이진 트리에서 부모 노드를 찾는 다른 방법으로는 각 노드에 부모 노드를 직접 가리키는 포인터를 추가하는 방식이 있다. 이 방식을 사용하면 특정 노드에서 부모 노드로 쉽게 이동할 수 있다.

또한, 부모 포인터나 별도의 스택을 사용하지 않고도 스레드를 따라가며 부모 노드를 찾는 것이 가능하다. 예를 들어, 노드 k가 오른쪽 자식 r을 가질 때, r의 왼쪽 포인터는 실제 왼쪽 자식이거나 k를 가리키는 스레드이다. 만약 r이 왼쪽 자식을 가진다면, 그 자식의 왼쪽 포인터 역시 자식이거나 스레드이다. 이 과정을 반복하여 왼쪽 포인터를 계속 따라가면 결국 k를 가리키는 스레드를 찾게 되어 부모 노드 k를 식별할 수 있다. 왼쪽 자식의 경우에도 오른쪽 포인터를 따라가며 유사한 방식으로 부모를 찾을 수 있다. 다만, 이 방법은 탐색 과정이 길어질 수 있어 상대적으로 느릴 수 있다.

파이썬으로 구현한 부모 노드 찾기 함수 예시는 다음과 같다. C 코드와 유사한 논리를 따르며, 실제 파이썬 환경에 맞게 노드 구조나 `is_thread` 함수 등을 정의해야 한다.

def parent(node):
# 루트 노드는 부모가 없음
if node is node.tree.root:
return None

x = node
y = node
while True:
# 오른쪽 포인터가 스레드인 경우
if is_thread(y.right): # is_thread는 스레드 여부 확인 함수로 가정
p = y.right
# 스레드가 None이거나, 스레드가 가리키는 노드의 왼쪽 자식이 현재 노드가 아닌 경우
if p is None or p.left is not node:
p = x
# 왼쪽 자식이 스레드가 아닐 때까지 왼쪽으로 이동
while not is_thread(p.left):
p = p.left
p = p.left # 최종적으로 왼쪽 스레드가 가리키는 노드가 부모
return p # 부모 노드 반환
# 왼쪽 포인터가 스레드인 경우 (오른쪽과 대칭적인 로직)
elif is_thread(x.left):
p = x.left
if p is None or p.right is not node:
p = y
while not is_thread(p.right):
p = p.right
p = p.right
return p
# 스레드를 찾지 못한 경우, 왼쪽 및 오른쪽 자식으로 한 단계씩 내려감
# 실제 구현에서는 x와 y가 유효한 노드인지 확인하는 로직 필요
if x.left is None and y.right is None:
# 이 예시 코드는 특정 조건에서 무한 루프에 빠질 수 있으므로
# 실제 구현 시에는 경계 조건 및 유효성 검사가 필요하다.
break # 루프 탈출 (예외 처리 또는 다른 로직 필요)
if x.left is not None:
x = x.left
else: # x.left가 None이면 더 이상 왼쪽으로 갈 수 없음
# 이 경우 y.right만 따라가거나, 로직 재검토 필요 (소스 기반 단순 이동)
pass # 또는 다른 처리
if y.right is not None:
y = y.right
else: # y.right가 None이면 더 이상 오른쪽으로 갈 수 없음
pass # 또는 다른 처리