중심성은 그래프 이론에서 "어떤 정점이 중요한가?"에 대한 답을 제시하기 위해 사용되는 지표로, 네트워크 내 노드의 중요성을 평가하는 데 활용된다. 중요성은 네트워크 흐름의 유형, 응집력 기여도 등에 따라 다양하게 해석되며, 이에 따라 차수 중심성, 근접 중심성, 매개 중심성, 고유 벡터 중심성 등 다양한 중심성 지표가 개발되었다. 중심성 지표는 네트워크 흐름, 워크 구조, 반경-볼륨 척도, 게임 이론적 관점 등 다양한 특징에 따라 분류될 수 있으며, 노드의 상대적 중요성을 나타내지만 일반적인 노드의 영향력을 측정하는 데는 한계가 있다. 주요 중심성 지표로는 차수 중심성, 근접 중심성, 조화 중심성, 매개 중심성, 고유벡터 중심성, 카츠 중심성, 페이지랭크, 침투 중심성, 교차 클리크 중심성, 프리먼 집중도 등이 있으며, 수송망 분석에도 활용된다.
더 읽어볼만한 페이지
대수적 그래프 이론 - 거리 정규 그래프 거리 정규 그래프는 지름이 d일 때 특정 조건을 만족하며 교차 배열로 특징지어지는 그래프로, 완전 그래프, 순환 그래프, 홀수 그래프 등이 그 예시이다.
대수적 그래프 이론 - 대칭 그래프 대칭 그래프는 그래프 이론에서 그래프의 구조적 규칙성을 나타내는 개념으로, 정점과 간선의 연결 관계가 균일하며 사이클 그래프, 완전 그래프, 하이퍼큐브 그래프 등의 예시가 있고, 네트워크 분석, 암호학, 화학 등 다양한 분야에 응용된다.
네트워크 이론 - 사회 연결망 사회 연결망 분석은 개인이나 집단 간의 관계를 분석하여 사회적 구조와 행동을 이해하는 학제 간 연구 방법론으로, 다양한 이론적 틀을 활용하여 네트워크 내 위치와 정보 접근의 중요성을 분석하며 여러 분야에서 활용된다.
네트워크 이론 - 멩거의 정리 멩거의 정리는 그래프의 연결도가 k일 필요충분조건이 임의의 두 정점 사이를 지나는 서로소인 경로가 k개 이상 존재하는 것임을 나타내는 정리로, 정점 및 변 연결도 버전이 있으며 유향/무향 그래프와 무한 그래프에도 적용 가능하고 네트워크 설계 등에 응용되며 최대 유량 최소 컷 정리 등과 관련이 있다.
그래프 알고리즘 - 페이지랭크 페이지랭크는 래리 페이지와 세르게이 브린이 개발한 알고리즘으로, 하이퍼링크로 연결된 문서 집합에서 웹 페이지의 상대적 중요도를 측정하며, 링크를 투표로 간주하여 페이지 순위를 재귀적으로 결정하고, 구글 검색 엔진의 초기 핵심 알고리즘으로 활용되었으며, 다양한 분야에서 활용된다.
그래프 알고리즘 - 너비 우선 탐색 너비 우선 탐색은 그래프 탐색 알고리즘으로, 큐 자료구조를 사용하여 시작 노드에서 인접한 노드들을 우선적으로 탐색하며, 가중치가 없는 그래프에서 최단 경로를 찾는 데 유용하고 다양한 분야에 활용된다.
중심성
그래프 중심성
유형
그래프 이론
설명
그래프 내에서 정점의 상대적 중요성을 나타내는 측정 방법
중심성 측정 종류
연결 중심성 (Degree Centrality)
정점에 연결된 모서리의 수
근접 중심성 (Closeness Centrality)
그래프의 다른 모든 정점까지의 평균 거리의 역수
매개 중심성 (Betweenness Centrality)
다른 두 정점 사이의 최단 경로에 놓이는 횟수
고유 벡터 중심성 (Eigenvector Centrality)
연결된 정점의 중심성에 비례하는 값
응용 분야
소셜 네트워크 분석
소셜 네트워크에서 영향력 있는 사람 식별
네트워크 과학
네트워크의 구조적 특성 이해
생물학
단백질 상호 작용 네트워크에서 중요한 단백질 식별
뇌 과학
뇌 네트워크에서 중요한 뇌 영역 식별
2. 중심성 지표의 정의 및 특징
중심성 지표는 네트워크에서 어떤 정점이 중요한지를 나타내는 척도이다. "중요성"의 의미는 다양하게 해석될 수 있기 때문에, 여러 종류의 중심성 지표가 존재한다.[4][5][6]
중요성은 네트워크를 통한 흐름 유형이나 네트워크 응집성에 대한 기여도 등 다양한 관점에서 정의될 수 있다.[5][7] 이에 따라 중심성은 여러 범주로 나뉜다.
대부분의 중심성 지표는 주어진 정점을 통과하는 특정 유형의 경로 수를 계산한다. 어떤 경로를 어떻게 계산하느냐에 따라 차수 중심성, 고유 벡터 중심성 등 다양한 중심성 지표가 만들어진다.[4][8] 매개 중심성과 같이 네트워크 연결에 중요한 역할을 하는 정점에 초점을 맞추는 중심성 지표도 있다.
2. 1. 네트워크 흐름에 따른 특징
네트워크는 정보, 자원, 영향력 등이 흘러가는 경로로 볼 수 있다. 중심성은 이러한 흐름의 유형과 경로의 특징에 따라 분류할 수 있다.[5]
흐름의 유형은 다음과 같이 나눌 수 있다.
전송: 분리 불가능한 항목이 한 노드에서 다른 노드로 이동하는 경우이다. 택배 배달이 대표적인 예시이다.
직렬 복제: 항목이 복제되어 소스와 대상 모두 해당 항목을 가지게 되는 경우이다. 소문처럼 정보가 전파되는 경우가 이에 해당한다.
병렬 복제: 항목이 동시에 여러 링크에 복제되는 경우이다. 라디오 방송처럼 여러 청취자에게 동시에 동일한 정보를 제공하는 것이 예시이다.[5]
트레일: 정점을 여러 번 방문할 수 있지만, 한 번 지난 가장자리는 다시 지나지 않는 경로이다.
워크: 정점과 가장자리를 여러 번 방문/통과할 수 있는 경로이다.[5]
이처럼 흐름과 경로의 유형에 따라 다양한 중심성 지표가 존재하며, 어떤 유형을 고려하느냐에 따라 적합한 중심성 지표가 달라진다.[5]
2. 2. 워크 구조에 따른 특징
중심성은 계산 방식에 따라 분류할 수 있다. 주어진 정점에서 시작하거나 끝나는 워크(walk)를 계산하는 반경(radial) 중심성과 주어진 정점을 통과하는 워크를 계산하는 중심(medial) 중심성으로 나눌 수 있다. 또한, 워크의 총 개수(volume)를 측정하는지, 아니면 주어진 정점에서 다른 정점까지의 거리(length)를 측정하는지에 따라서도 분류할 수 있다.[7]
구분
정의
예시
반경 중심성 (Radial Centrality)
주어진 정점에서 시작하거나 끝나는 워크를 계산
차수 중심성(길이가 1인 워크 수 계산), 고유값 중심성(무한대 길이의 워크 수 계산)
중심 중심성 (Medial Centrality)
주어진 정점을 통과하는 워크를 계산
프리먼의 중간 중심성(주어진 정점을 통과하는 최단 경로의 수 계산)[7]
볼륨 중심성 (Volume Centrality)
주어진 유형의 워크의 총 수를 계산
길이 중심성 (Length Centrality)
주어진 정점에서 그래프의 나머지 정점까지의 거리를 측정
근접 중심성(주어진 정점에서 다른 모든 정점까지의 총 측지 거리)[7]
2. 3. 반경-볼륨 중심성의 스펙트럼
많은 중심성 지표는 반경-볼륨 척도(radial-volume measure)로 표현될 수 있다. 이러한 중심성 지표는 특정 정점의 중심성이 그 정점과 연결된 다른 정점들의 중심성의 함수라는 아이디어를 바탕으로 한다. 연결 강도를 어떻게 정의하느냐에 따라 다양한 중심성 지표가 도출될 수 있는데, 그 예는 다음과 같다.
차수 중심성: 길이가 1인 걸음(walk)을 계산한다.[4]
고유벡터 중심성: 길이가 무한대인 걸음(walk)을 계산한다.[4]
알파 중심성: 정점이 외부 영향의 원천을 가질 수 있도록 한다.
부분 그래프 중심성: 닫힌 경로(삼각형, 사각형 등)만 계산한다.
이러한 척도의 핵심은 그래프의 인접행렬의 거듭제곱이 해당 거듭제곱으로 주어진 길이의 걸음의 수를 제공한다는 것이다. 행렬 지수도 주어진 길이의 걸음의 수와 밀접하게 관련되어 있다. 인접 행렬의 초기 변환은 계산되는 걸음 유형의 다른 정의를 가능하게 한다. 두 가지 접근 방식 모두에서, 정점의 중심성은 무한 합으로 표현될 수 있다.
: (행렬 거듭제곱의 경우)
또는
: (행렬 지수의 경우)
여기서
는 걸음 길이,
는 변환된 인접 행렬,
는 합의 수렴을 보장하는 할인 매개변수이다.
보나칙의 척도군은 인접 행렬을 변환하지 않는다. 알파 중심성은 인접 행렬을 해당 해결 공식으로 대체한다. 하위 그래프 중심성은 인접 행렬을 해당 대각합으로 대체한다. 가 0에 가까워지면, 지수는 차수 중심성으로 수렴하고, 가 최대값에 가까워지면, 지수는 고유벡터 중심성으로 수렴한다.[8]
2. 4. 게임 이론적 중심성
대부분의 기존 중심성 척도는 개별 노드의 역할에만 집중하여 노드의 중요성을 평가한다. 그러나 많은 응용 분야에서 노드들이 그룹으로 작용할 때 발생하는 시너지 효과 때문에 이러한 접근 방식은 부적절할 수 있다.
게임 이론적 중심성의 예
예를 들어, 전염병 확산을 막는 문제를 생각해 보자. 네트워크 이미지에서 어떤 노드에 백신을 접종해야 할까? 기존 중심성 척도에 따르면 질병 확산에 가장 중요한 노드를 파악하고자 할 것이다. 하지만 개별 노드의 특징에만 집중하는 중심성 기반 접근 방식은 좋은 방법이 아닐 수 있다. 빨간색 사각형 안의 노드들은 개별적으로는 질병 확산을 막을 수 없지만, 그룹으로 고려하면 , , 노드에서 질병이 시작된 경우 확산을 막을 수 있다.
게임 이론적 중심성은 게임 이론의 도구를 사용하여 이러한 문제와 기회를 해결한다. [9]에서 제안된 접근 방식은 샤플리 값을 사용한다. 샤플리 값 계산의 시간 복잡성 문제 때문에, 이 분야의 대부분의 노력은 네트워크의 특이한 토폴로지나 문제의 특별한 특성에 의존하는 새로운 알고리즘과 방법을 구현하는 데 집중되어 있다. 이러한 접근 방식은 시간 복잡성을 지수에서 다항식으로 줄일 수 있다.
마찬가지로, 권위 분배[10]의 솔루션 개념은 샤플리-슈빅 파워 지수를 샤플리 값 대신 사용하여 플레이어 간의 양자 직접적인 영향을 측정한다. 이 분배는 실제로 일종의 고유 벡터 중심성이다. 이는 Hu (2020)[11]에서 미국의 대학 순위 매기기와 같이 빅 데이터 객체를 정렬하는 데 사용된다.
3. 중심성 지표의 한계
중심성 지표는 특정 응용 분야에 최적화된 경우가 많아 다른 분야에서는 적합하지 않을 수 있다. 예를 들어, 크라크하르트 연 그래프에서는 세 가지 다른 중심성 개념에 따라 가장 중심적인 정점이 다르게 선택된다.[12]
또한, 중심성 지표는 주로 가장 중요한 노드를 식별하는 데 초점을 맞추기 때문에, 네트워크 전체 노드의 영향력을 측정하는 데는 한계가 있다. 중심성 지수는 정점의 상대적 중요도를 나타내도록 설계되었지만,[4][5] 일반적인 노드의 영향력을 측정하도록 설계되지는 않았다. 최근에는 이러한 문제를 해결하기 위해 노드 영향력 지표가 개발되고 있다.
중심성 지수의 한계는 다음과 같이 두 가지로 요약할 수 있다.
순위의 한계: 중심성 순위는 정점을 중요도별로 정렬하지만, 순위 간 중요도 차이를 정량화하지는 않는다. 프리먼 집중도를 통해 어느 정도 완화할 수 있다.[34]
일반화의 어려움: 특정 네트워크에서 가장 중요한 정점을 식별하는 기능이 나머지 정점에 반드시 일반화되지는 않는다.[17][13][14][15] 예를 들어, 구글 이미지 검색 결과는 페이지랭크의 불안정성 때문에 순위가 자주 바뀐다.[16]
복잡한 네트워크는 이질적인 토폴로지를 가지기 때문에, 가장 중요한 정점에 최적인 중심성 지표가 네트워크의 나머지 부분에는 최적이 아닐 수 있다.[17]
4. 주요 중심성 지표
A) 매개 중심성, B) 근접 중심성, C) 고유 벡터 중심성, D) 차수 중심성, E) 조화 중심성 및 F) Katz 중심성의 동일한 임의 기하 그래프의 예.
240px
주요 중심성 지표는 다음과 같다.
차수 중심성: 한 노드에 직접 연결된 링크 수로 정의된다.[18]
근접 중심성: 한 노드와 그래프 내 다른 모든 노드 간 최단 경로의 평균 길이의 역수이다.[19][20]
조화 중심성: 근접 중심성과 유사하지만, 연결되지 않은 노드 쌍의 거리를 0으로 처리하여 계산한다.[22]
매개 중심성: 한 노드가 다른 두 노드 사이의 최단 경로 역할을 하는 횟수를 나타낸다.[25]
고유벡터 중심성: 연결된 노드의 중요도를 함께 고려하여 네트워크에서 노드의 영향력을 측정한다.[27][6]
카츠 중심성: 직접적인 이웃뿐만 아니라 경로를 통해 연결될 수 있는 모든 노드의 수를 측정하며, 멀리 떨어진 노드의 영향은 감소시킨다.[29]
페이지랭크: 고유벡터 중심성과 유사하지만, 스케일링 팩터와 왼쪽 고유 벡터를 사용한다는 차이점이 있다.[31]
침투 중심성: 네트워크를 통한 전염 과정에서 노드의 중요성을 측정하며, 해당 노드를 통과하는 '침투 경로'의 비율을 계산한다.[32]
교차 클리크 중심성: 한 노드가 서로 다른 클리크에 얼마나 연결되어 있는지를 나타낸다.[33]
4. 1. 차수 중심성 (Degree Centrality)
차수 중심성은 한 노드(node)에 직접 연결된 엣지(edge, 연결)의 개수를 나타내는 중심성 지표이다. Degree Centrality영어는 가장 단순하면서도 널리 사용되는 중심성 지표 중 하나이다.[18]
방향성 네트워크(directed network)에서는 들어오는 연결(내차수, in-degree)과 나가는 연결(외차수, out-degree)을 구분하여 계산한다. 예를 들어, 연결이 우정이나 협력을 나타내는 경우, 내차수는 인기의 척도로, 외차수는 사교성의 척도로 해석될 수 있다.
어떤 노드가 네트워크를 통해 흐르는 것(예: 바이러스, 정보)에 즉시 감염될 위험은 차수 중심성과 관련하여 해석할 수 있다. 그래프 에서 개의 정점과 개의 모서리가 있는 주어진 정점 의 차수 중심성은 다음과 같이 정의된다.
:
그래프의 모든 노드에 대한 차수 중심성을 계산하는 것은 그래프의 밀집 인접 행렬 표현에서 가 소요되며, 모서리의 경우 희소 행렬 표현에서 가 소요된다.
노드 수준의 중심성 정의는 전체 그래프로 확장될 수 있다. 를 에서 가장 높은 차수 중심성을 가진 노드로 정의하고, 를 다음 수량을 최대화하는 노드 연결 그래프로 정의한다. (는 에서 가장 높은 차수 중심성을 가진 노드)