맨위로가기

정부호 행렬

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

정부호 행렬은 에르미트 행렬의 고윳값 부호에 따라 분류되는 행렬로, 양의 정부호, 양의 준정부호, 음의 정부호, 음의 준정부호, 부정부호 행렬로 나뉜다. 양의 정부호 행렬은 모든 고윳값이 양수이고, 양의 준정부호 행렬은 모든 고윳값이 0 이상이며, 음의 정부호 행렬은 모든 고윳값이 음수이고, 음의 준정부호 행렬은 모든 고윳값이 0 이하이며, 부정부호 행렬은 양수와 음수 고윳값을 모두 갖는 행렬이다. 양의 정부호 행렬은 이차 형식, 최적화 문제, 통계학의 공분산 행렬 등 다양한 분야에서 활용된다.

더 읽어볼만한 페이지

  • 행렬 - 스핀 (물리학)
    스핀은 양자역학적 각운동량으로, 양자화된 값을 가지며 자기 쌍극자 모멘트를 유발하여 다양한 분야에 응용되고 스핀트로닉스 기술 발전에 기여하지만, 전자의 스핀 기원은 아직 완전히 밝혀지지 않았다.
  • 행렬 - 파울리 행렬
    파울리 행렬은 양자역학에서 스핀을 나타내는 데 사용되는 에르미트 행렬이자 유니타리 행렬로, 행렬식은 -1이고 대각합은 0이며, 리 대수의 생성원이자 파울리 벡터로 정의되어 다양한 물리학 분야에서 활용된다.
정부호 행렬

2. 정의

에르미트 행렬의 고윳값은 항상 실수이다. 에르미트 행렬 M은 그 고윳값의 부호에 따라 다음과 같이 분류된다.[23] 이 분류는 0이 아닌 벡터 x에 대한 이차 형식 x^* M x의 부호와도 밀접하게 연관된다. 여기서 x^*는 벡터 x켤레 전치를 나타내며, M이 에르미트 행렬일 때 x^* M x는 항상 실수이다.


  • 양의 정부호 행렬(positive definite matrix영어): 모든 고윳값이 양수 (x^* M x > 0).
  • 양의 준정부호 행렬(positive semi-definite matrix영어): 모든 고윳값이 0 이상 (x^* M x \ge 0).
  • 음의 정부호 행렬(negative definite matrix영어): 모든 고윳값이 음수 (x^* M x < 0).
  • 음의 준정부호 행렬(negative semi-definite matrix영어): 모든 고윳값이 0 이하 (x^* M x \le 0).
  • 부정부호 행렬(indefinite matrix영어): 양의 고윳값과 음의 고윳값을 모두 가짐.


실수체에서는 에르미트 행렬 대신 대칭행렬을, 켤레 전치 x^* 대신 전치 x^T를 사용하여 유사하게 정의한다.

양의 정부호 행렬은 양의 정부호 대칭 쌍선형 형식 (복소수의 경우 대칭 반쌍선형 형식) 및 벡터 공간의 내적과 관련이 깊다.[20]

복소 행렬 M이 양의 정부호이기 위한 일반적인 정의는 "0이 아닌 모든 복소 벡터 z에 대해 z^* M z가 양의 실수"인 것이며, 이 조건은 M에르미트 행렬임을 내포한다. 실수 행렬의 경우, 대칭행렬이라는 조건 하에서는 "0이 아닌 모든 실수 벡터 z에 대해 z^T M z > 0" 조건만으로도 충분하다. 그러나 대칭행렬이 아닌 실수 행렬이 실수 벡터에 대해 이차 형식이 항상 양수라고 해서 양의 정부호 행렬인 것은 아니다.

2. 1. 실수 행렬

실수체에서 정부호 행렬을 정의할 때는 에르미트 행렬 대신 대칭행렬 M을 사용하고, 켤레 전치 x^* 대신 전치 x^T를 사용한다.[23]

다음 정의에서 \mathbf{x}^\top는 벡터 \mathbf{x}전치 행렬이고, \mathbf{0}n차원 영벡터를 나타낸다.

n \times n 대칭 실수 행렬 M에 대해 다음과 같이 분류한다.

  • 양의 정부호 행렬 (positive definite matrix영어): 모든 영벡터가 아닌 실수 벡터 \mathbf{x} \in \mathbb{R}^n \setminus \{\mathbf{0}\}에 대해 \mathbf{x}^\top M\mathbf{x} > 0을 만족하는 경우이다.

:M \text{ 양의 정부호} \quad \iff \quad \mathbf{x}^\top M\ \mathbf{x} > 0 \text{ for all } \mathbf{x} \in \mathbb{R}^n \setminus \{\mathbf{0}\}

  • 양의 준정부호 행렬 (positive semi-definite matrix영어) 또는 음이 아닌 정부호 행렬: 모든 실수 벡터 \mathbf{x} \in \mathbb{R}^n에 대해 \mathbf{x}^\top M\mathbf{x} \geq 0을 만족하는 경우이다.

:M \text{ 양의 준정부호} \quad \iff \quad \mathbf{x}^\top M\ \mathbf{x} \geq 0 \text{ for all } \mathbf{x} \in \mathbb{R}^n

  • 음의 정부호 행렬 (negative definite matrix영어): 모든 영벡터가 아닌 실수 벡터 \mathbf{x} \in \mathbb{R}^n \setminus \{\mathbf{0}\}에 대해 \mathbf{x}^\top M\mathbf{x} < 0을 만족하는 경우이다.

:M \text{ 음의 정부호} \quad \iff \quad \mathbf{x}^\top M\ \mathbf{x} < 0 \text{ for all } \mathbf{x} \in \mathbb{R}^n \setminus \{\mathbf{0}\}

  • 음의 준정부호 행렬 (negative semi-definite matrix영어) 또는 양이 아닌 정부호 행렬: 모든 실수 벡터 \mathbf{x} \in \mathbb{R}^n에 대해 \mathbf{x}^\top M\mathbf{x} \leq 0을 만족하는 경우이다.

:M \text{ 음의 준정부호} \quad \iff \quad \mathbf{x}^\top M\ \mathbf{x} \leq 0 \text{ for all } \mathbf{x} \in \mathbb{R}^n

  • 부정부호 행렬 (indefinite matrix영어): 양의 준정부호도 아니고 음의 준정부호도 아닌 경우, 즉 \mathbf{x}^\top M\mathbf{x}가 양수와 음수 값을 모두 가질 수 있는 경우이다.


양의 정부호 행렬은 양의 정부호 대칭 쌍선형 형식과 벡터 공간의 내적과 밀접한 관계를 갖는다.[20]

임의의 실행렬은 복소 행렬로 간주할 수도 있다. 복소 행렬의 정부호성은 "임의의 영이 아닌 '''복소''' 열벡터 z에 대해 z^* M z가 반드시 양의 실수가 되는 것"으로 정의하며, 이 조건은 행렬 M에르미트 행렬임을 내포한다.

정부호 '''실''' 행렬 M은 에르미트 행렬이므로 대칭행렬이며, 이차 형식 z^T M z는 임의의 영이 아닌 '''실''' 벡터 z에 대해 양수가 된다. 그러나 단순히 이차 형식이 실수 벡터에 대해 항상 양수라는 조건만으로는 M이 정부호 행렬이라고 하기에 충분하지 않다. 예를 들어,

:M = \begin{bmatrix} 1 & 1 \\ -1 & 1 \end{bmatrix}

일 때, 임의의 실수 벡터 z = (a, b)에 대해 z^T M z = a^2 + b^2z가 영벡터가 아닌 한 항상 양수이다. 하지만 M은 대칭행렬이 아니며, 복소 벡터 z = (1, i)에 대해 z^* M z = \begin{pmatrix} 1 & -i \end{pmatrix} \begin{bmatrix} 1 & 1 \\ -1 & 1 \end{bmatrix} \begin{pmatrix} 1 \\ i \end{pmatrix} = \begin{pmatrix} 1 & -i \end{pmatrix} \begin{pmatrix} 1+i \\ -1+i \end{pmatrix} = (1)(1+i) + (-i)(-1+i) = 1+i + i - i^2 = 1+2i - (-1) = 2+2i로 실수가 아니므로, 복소 행렬의 정의에 따른 정부호 행렬이 아니다.

반면, '''대칭''' 실행렬 M에 대해서는 "임의의 영이 아닌 실 벡터 z에 대해 z^T M z > 0"이라는 조건만으로도 복소 행렬 의미에서의 M의 정부호성이 유도된다. 즉, 대칭 실행렬의 경우 실수 벡터에 대한 조건만 확인하면 된다.

2. 2. 복소수 행렬

에르미트 행렬의 고윳값은 항상 실수이다. n \times n 에르미트 행렬 M은 그 고윳값의 부호 또는 0이 아닌 복소수 벡터 z에 대한 z^* M z 값(여기서 z^*z켤레 전치이며, 이 값은 항상 실수이다)의 부호를 기준으로 다음과 같이 분류할 수 있다.[23] \mathbf{0}n차원 영벡터를 나타낸다.

  • '''양의 정부호 행렬'''(positive definite matrix영어): 모든 고윳값이 양수일 때이다. 이는 0이 아닌 모든 벡터 z \in \mathbb{C}^n에 대해 z^* M z > 0인 것과 같다.

M \text{ 양의 정부호} \quad \iff \quad \mathbf{z}^* M\ \mathbf{z} > 0 \text{ for all } \mathbf{z} \in \mathbb{C}^n \setminus \{ \mathbf{0} \}

  • '''양의 준정부호 행렬'''(positive semi-definite matrix영어) 또는 '''음이 아닌 정부호 행렬'''(nonnegative-definite영어): 모든 고윳값이 음수가 아닐 때이다(0 포함 가능). 이는 모든 벡터 z \in \mathbb{C}^n에 대해 z^* M z \ge 0인 것과 같다.

M \text{ 양의 준정부호} \quad \iff \quad \mathbf{z}^* M\ \mathbf{z} \geq 0 \text{ for all } \mathbf{z} \in \mathbb{C}^n

  • '''음의 정부호 행렬'''(negative definite matrix영어): 모든 고윳값이 음수일 때이다. 이는 0이 아닌 모든 벡터 z \in \mathbb{C}^n에 대해 z^* M z < 0인 것과 같다.

M \text{ 음의 정부호} \quad \iff \quad \mathbf{z}^* M\ \mathbf{z} < 0 \text{ for all } \mathbf{z} \in \mathbb{C}^n \setminus \{\mathbf{0}\}

  • '''음의 준정부호 행렬'''(negative semi-definite matrix영어) 또는 '''양이 아닌 정부호 행렬'''(nonpositive-definite영어): 모든 고윳값이 양수가 아닐 때이다(0 포함 가능). 이는 모든 벡터 z \in \mathbb{C}^n에 대해 z^* M z \le 0인 것과 같다.

M \text{ 음의 준정부호} \quad \iff \quad \mathbf{z}^* M\ \mathbf{z} \leq 0 \text{ for all } \mathbf{z} \in \mathbb{C}^n

  • '''부정부호 행렬'''(indefinite matrix영어): 양의 고윳값과 음의 고윳값을 모두 가질 때이다. 이는 z^* M z가 양수 값을 갖는 z와 음수 값을 갖는 z가 모두 존재하는 것과 같다. 즉, 양의 준정부호도 음의 준정부호도 아닌 경우이다.


실수체에서 정의하는 경우, 에르미트 행렬 M 대신 대칭행렬 M, 켤레 전치 z^* 대신 전치 z^T를 사용한다.

양의 정부호 행렬은 양의 정부호 대칭 쌍선형 형식 (복소수의 경우 대칭 반쌍선형 형식) 및 벡터 공간의 내적과 밀접한 관계를 갖는다.[20]

임의의 실행렬은 복소 행렬로 간주할 수 있으므로, 두 경우에 대한 "정부호"의 정의는 일치해야 한다. 복소 행렬 M이 양의 정부호라는 것은, 0이 아닌 임의의 '''복소''' 벡터 z에 대해 z^* M z가 항상 양의 실수가 되는 것을 의미한다. 이 조건은 M이 에르미트 행렬임을 내포한다. 왜냐하면 A = (M+M^*)/2B = (M-M^*)/(2i)를 생각하면 M = A+iB이고 z^* M z = z^* A z + i z^* B z인데, AB는 에르미트 행렬이므로 z^* A zz^* B z는 실수이다. 만약 z^* M z가 실수라면, 모든 z에 대해 z^* B z = 0이어야 하므로, B는 영행렬이 되고 M = A는 에르미트 행렬이 된다.

이 정의에 따르면, 양의 정부호 '''실''' 행렬 M은 에르미트 행렬이므로 대칭행렬이며, 이차 형식 z^T M z는 0이 아닌 모든 '''실''' 벡터 z에 대해 양수이다. 하지만, 단순히 "이차 형식이 항상 양수"라는 조건만으로는 복소 행렬로서 양의 정부호라고 하기에 충분하지 않다. 예를 들어,

:M = \begin{bmatrix} 1 & 1 \\ -1 & 1 \end{bmatrix}

일 때, 0이 아닌 임의의 실 벡터 z = (a, b)에 대해 z^T M z = (a-b)a + (a+b)b = a^2 + b^2 > 0이지만, 복소 벡터 z = (1, i)에 대해서는 z^* M z = [1 \ -i] \begin{bmatrix} 1 & 1 \\ -1 & 1 \end{bmatrix} \begin{bmatrix} 1 \\ i \end{bmatrix} = [1+i \ 1-i] \begin{bmatrix} 1 \\ i \end{bmatrix} = (1+i) + i(1-i) = 1+i+i-i^2 = 1+2i+1 = 2+2i로 실수가 아니므로, M은 복소 행렬로서 양의 정부호가 아니다.

반면에, '''대칭''' 실행렬 M에 대해서는 "0이 아닌 임의의 실 벡터 z에 대해 z^T M z > 0"이라는 조건만으로도 복소 행렬 의미에서의 양의 정부호성이 유도된다.

2. 3. 비(非)에르미트 행렬의 경우

일부 문헌에서는 에르미트 행렬이 아닐 수 있는 복소수 행렬 M에 대해서도 정부호 행렬을 정의하기도 한다. 이 경우, 일반적인 정의에서 사용되는 x^*Mx가 양의 실수여야 한다는 조건 대신, 그 실수부 인 \operatorname{Re}(x^*Mx)가 0이 아닌 모든 복소 벡터 x에 대해 양수여야 한다는 조건을 사용한다.[19][22]

이 확장된 정의에 따르면, 행렬 M이 (확장된 의미에서) 양의 정부호일 필요충분조건은 M의 에르미트 성분, 즉 \frac{1}{2}(M + M^*) 행렬이 일반적인 (좁은) 의미에서 양의 정부호인 것이다. 여기서 M^*M켤레 전치이다. 즉, 행렬의 정부호성은 그 에르미트 부분에 의해서만 결정된다.

실수 행렬 M의 경우, 이 확장된 정의는 모든 0이 아닌 실수 벡터 \mathbf{x}에 대해 \mathbf{x}^\top M \mathbf{x} > 0 이 성립하는 것과 동치이다. 여기서 \mathbf{x}^\top\mathbf{x}전치 행렬이다. 이 조건은 M대칭행렬일 것을 요구하지 않는다. 또한, 이 조건은 M의 대칭 성분, 즉 \frac{1}{2}(M + M^\top) 행렬이 일반적인 (좁은) 의미에서 양의 정부호인 것과 동치이다. 이는 이차 형식 \mathbf{x}^\top M \mathbf{x} = \sum_{ij} x_i M_{ij} x_j의 값이 행렬 M의 전치에 영향을 받지 않기 때문이다.

예를 들어, 다음과 같은 비대칭 실수 행렬을 생각해보자.

M = \begin{bmatrix} 1 & 1 \\ -1 & 1 \end{bmatrix}

임의의 0이 아닌 실수 벡터 \mathbf{z} = \begin{bmatrix} a \\ b \end{bmatrix}에 대해, \mathbf{z}^\top M \mathbf{z} = (a-b)a + (a+b)b = a^2 + b^2 이므로 항상 양수이다. 따라서 확장된 정의에 따르면 이 행렬 M은 양의 정부호이다. 하지만 일반적인 (좁은) 정의에 따르면, 복소 벡터 \mathbf{z} = \begin{bmatrix} 1 \\ i \end{bmatrix}에 대해 \mathbf{z}^* M \mathbf{z} = \begin{bmatrix} 1 & -i \end{bmatrix} \begin{bmatrix} 1 & 1 \\ -1 & 1 \end{bmatrix} \begin{bmatrix} 1 \\ i \end{bmatrix} = 2 + 2i 가 되어 실수가 아니므로, M은 (좁은 의미의) 양의 정부호 행렬이 아니다.

결과적으로, 고유값이 모두 양수인 비대칭 실수 행렬이라고 해서 반드시 (확장된 의미에서조차) 양의 정부호 행렬인 것은 아니다. 예를 들어, 행렬 M = \begin{bmatrix} 4 & 9 \\ 1 & 4 \end{bmatrix}는 고유값이 모두 양수이지만, \mathbf{x} = \begin{bmatrix} -1 \\ 1 \end{bmatrix}에 대해 \mathbf{x}^\top M \mathbf{x} = -2 로 음수 값을 가지므로 양의 정부호 행렬이 아니다. 이 벡터 \mathbf{x}M의 대칭 성분 \frac{1}{2}(M + M^\top) = \begin{bmatrix} 4 & 5 \\ 5 & 4 \end{bmatrix}의 음의 고유값(-1)에 대응하는 고유벡터이다.

요약하면, 실수 행렬과 복소수 행렬의 정부호성을 다룰 때 나타나는 중요한 차이점은, 복소 힐베르트 공간에서의 유계 연산자 중 양의 정부호인 연산자는 반드시 에르미트 연산자 (자기 수반 연산자)여야 한다는 점이다. 이는 분극 항등식을 통해 증명될 수 있다. 그러나 실수 벡터 공간에서는 이 성질이 일반적으로 성립하지 않는다.

3. 성질

n \times n 복소수 양의 정부호 행렬 M에 대해, 다음의 성질이 항상 성립한다.


  • 고윳값이 모두 양수이다.
  • 임의의 두 벡터 x, y에 대해 = x^* M y로 내적을 정의하는 것이 가능하다. 반대로, 복소수 벡터 공간 \mathbb{C}^n에서 정의할 수 있는 내적은 모두 양의 정부호 행렬에 대한 곱으로 표현이 가능하다.
  • M그람 행렬이다. 즉, 어떠한 선형 독립인 벡터 x_1, \cdots, x_n가 존재하여, M_{ij} = x_i^*x_j가 성립한다.
  • M = L L^*이 성립하는 하삼각행렬 L이 유일하게 존재한다. 이러한 분해를 촐레스키 분해라고 부른다.
  • 대칭행렬의 성질로부터 정부호 행렬의 역행렬도 동일한 정부호 행렬이다.

4. 특징

에르미트 행렬 M양의 정부호 행렬(positive definite matrix영어)이라는 것은 여러 동등한 조건으로 특징지을 수 있다. 이는 수학의 다양한 분야에서 이 개념이 중요하게 사용되는 이유를 설명한다. n \times n 에르미트 행렬 M에 대해 다음 조건들은 모두 동치이다.


  • 고윳값 조건: M의 모든 고윳값이 양의 실수이다. (자세한 내용은 #고유값과의 관계 참조)
  • 이차 형식 / 반쌍선형 형식 조건: 0이 아닌 모든 복소 벡터 \mathbf{z} \in \mathbb{C}^n에 대해 \mathbf{z}^* M \mathbf{z} > 0이다. 여기서 \mathbf{z}^*\mathbf{z}의 켤레전치이다. 실수 대칭행렬의 경우, 0이 아닌 모든 실수 벡터 \mathbf{x} \in \mathbb{R}^n에 대해 \mathbf{x}^\top M \mathbf{x} > 0이다. 여기서 \mathbf{x}^\top\mathbf{x}의 전치이다.
  • 내적 조건: M에 의해 정의된 반쌍선형 형식 \langle \mathbf{x}, \mathbf{y} \rangle = \mathbf{y}^* M \mathbf{x}\mathbb{C}^n 상의 내적을 정의한다.
  • 선두 주 소행렬식 조건 (실베스터의 판정법): M의 모든 선두 주 소행렬식(상단 왼쪽 k \times k 부분 행렬의 행렬식, k=1, \dots, n)이 양수이다. (전체 행렬식과의 관계는 #행렬식과의 관계 참조)
  • 콜레스키 분해 조건: M = L L^*를 만족하는 유일한 하삼각 행렬 L이 존재하며, L의 대각 원소는 모두 양의 실수이다.
  • 그람 행렬 조건: M은 내적 공간에서 선형 독립인 벡터들 \mathbf{x}_1, \dots, \mathbf{x}_n에 대한 그람 행렬이다. 즉, M_{ij} = \langle \mathbf{x}_i, \mathbf{x}_j \rangle이다.
  • 합동 행렬 조건: M은 양의 실수 항목을 가진 대각 행렬과 합동이다.
  • 가역 행렬 분해 조건: 가역 행렬 B가 존재하여 M = B^* B가 성립한다. (실수 행렬의 경우 M = B^\top B)

양의 준정부호 행렬(positive semi-definite matrix영어)은 위의 조건들에서 '양수'를 '음이 아닌 수'로, '0이 아닌 벡터'를 '모든 벡터'로, '선두 주 소행렬식'을 '모든 주 소행렬식'으로, '가역 행렬'을 '행렬'로 바꾸면 유사한 동치 조건들을 만족한다. 예를 들어, 에르미트 행렬이 양의 준정부호일 필요충분조건은 모든 고유값이 음수가 아닌 것이다. 또한, 양의 준정부호 행렬은 가역일 경우에만 양의 정부호 행렬이다.[7] (자세한 내용은 #역행렬과의 관계 참조)
볼록 최적화와의 관계양의 정부호 행렬과 양의 준정부호 실수 행렬은 볼록 최적화에서 중요한 역할을 한다. 여러 실수 변수를 갖는 함수가 두 번 미분 가능할 때, 어떤 점 p에서 함수의 헤세 행렬(2차 편미분 행렬)이 양의 정부호이면 그 함수는 p 근방에서 강볼록 함수이며 유일한 국소 최솟값을 가진다. 반대로 함수가 p 근방에서 볼록 함수이면 헤세 행렬은 p에서 양의 준정부호이다.[2] 이차 함수 f(\mathbf{x}) = \mathbf{x}^\top M \mathbf{x} + \mathbf{b}^\top \mathbf{x} + c (M은 대칭)가 강볼록일 필요충분조건은 M이 양의 정부호인 것이다. 이 경우 함수는 유일한 전역 최솟값을 가진다.
기타 속성

  • 양의 정부호 행렬의 집합은 열린 볼록 원뿔이고, 양의 준정부호 행렬의 집합은 닫힌 볼록 원뿔이다.[2] 즉, M, N이 양의 (준)정부호 행렬이면 0 \le \alpha \le 1인 모든 \alpha에 대해 \alpha M + (1-\alpha)N도 양의 (준)정부호 행렬이다.
  • 만약 M이 실수 양의 정부호 행렬이면, 모든 벡터 \mathbf{v}에 대해 \mathbf{v}^\top M \mathbf{v} \geq m \|\mathbf{v}\|_2^2를 만족하는 양의 실수 m이 존재한다. 이는 M의 가장 작은 고유값에 해당한다. 또한, 충분히 작은 양수 \delta에 대해 M - \delta I도 양의 정부호이다 (M > \delta I).
  • 에르미트 행렬이 음의 정부호일 필요충분조건은 모든 고유값이 음수인 것이다. 음의 준정부호는 모든 고유값이 양수가 아닌 것이다. 부정부호는 양수와 음수 고유값을 모두 갖는 것이다.
  • 행렬 M이 음의 (준)정부호일 필요충분조건은 -M이 양의 (준)정부호인 것이다.

블록 행렬2n \times 2n 블록 행렬 M = \begin{bmatrix} A & B \\ C & D \end{bmatrix} (각 블록은 n \times n)이 에르미트 행렬(즉, A, D는 에르미트, C=B^*)이고 양의 정부호이면, 대각 블록 AD는 반드시 양의 정부호 행렬이어야 한다. 이는 \mathbf{z} = [\mathbf{v}, 0]^\top\mathbf{z} = [0, \mathbf{w}]^\top 형태의 벡터를 \mathbf{z}^* M \mathbf{z} > 0에 대입하여 확인할 수 있다. 더 나아가, M의 모든 주요 부분 행렬은 양의 정부호이다. 역으로, A가 양의 정부호이고 슈어 보수 D - B^* A^{-1} B가 양의 정부호이면 M은 양의 정부호이다.

4. 1. 고유값과의 관계

에르미트 행렬(실수 대칭 행렬 포함) M의 모든 고윳값은 실수이다.[23] 행렬의 정부호성은 이 고유값들의 부호와 밀접한 관련이 있다. M의 고유값 부호에 따라 다음과 같이 분류할 수 있다.[21][23]

  • M양의 정부호 행렬(positive definite matrix영어)일 필요충분조건은 모든 고유값 \lambda가 양수인 것이다 (\lambda > 0). 이는 0이 아닌 모든 벡터 x에 대해 x^* M x > 0인 경우와 같다.
  • M양의 준정부호 행렬(positive semi-definite matrix영어)일 필요충분조건은 모든 고유값 \lambda가 음수가 아닌 것이다 (\lambda \ge 0). 이는 0이 아닌 모든 벡터 x에 대해 x^* M x \ge 0인 경우와 같다.
  • M음의 정부호 행렬(negative definite matrix영어)일 필요충분조건은 모든 고유값 \lambda가 음수인 것이다 (\lambda < 0). 이는 0이 아닌 모든 벡터 x에 대해 x^* M x < 0인 경우와 같다.
  • M음의 준정부호 행렬(negative semi-definite matrix영어)일 필요충분조건은 모든 고유값 \lambda가 양수가 아닌 것이다 (\lambda \le 0). 이는 0이 아닌 모든 벡터 x에 대해 x^* M x \le 0인 경우와 같다.
  • M부정부호 행렬(indefinite matrix영어)일 필요충분조건은 양수인 고유값과 음수인 고유값을 모두 갖는 것이다. 이는 양의 준정부호도 아니고 음의 준정부호도 아닌 경우와 같다.


고유값 분해를 통해 이 관계를 더 명확히 이해할 수 있다. 에르미트 행렬 MM = P D P^*로 분해할 수 있다. 여기서 PM의 고유벡터로 이루어진 정규 직교 기저를 구성하는 유니타리 행렬이고 (P^{-1} = P^*), D는 해당 고윳값들을 대각 원소로 갖는 실수 대각 행렬이다. 행렬 M은 고유벡터 기저 P의 좌표계에서 표현된 대각 행렬 D로 볼 수 있다.

변수 변환 \mathbf{y} = P^*\mathbf{z} (즉, \mathbf{z} = P\mathbf{y})를 이용하면, 이차 형식 \mathbf{z}^* M\mathbf{z}는 다음과 같이 변환된다.

\mathbf{z}^* M\mathbf{z} = (P\mathbf{y})^* (PDP^*) (P\mathbf{y}) = \mathbf{y}^* P^* P D P^* P \mathbf{y} = \mathbf{y}^* I D I \mathbf{y} = \mathbf{y}^* D \mathbf{y}

여기서 P^*P = I (항등행렬)이다. 따라서 \mathbf{z}^* M\mathbf{z}가 모든 0이 아닌 벡터 \mathbf{z}에 대해 양수(또는 음수 등)인 것은 \mathbf{y}^* D \mathbf{y}가 모든 0이 아닌 벡터 \mathbf{y}에 대해 양수(또는 음수 등)인 것과 동치이다.

\mathbf{y}^* D \mathbf{y}D가 대각 행렬이므로 \sum_i D_{ii} |y_i|^2 와 같다. 이 값이 모든 0이 아닌 \mathbf{y}에 대해 양수이려면 모든 대각 원소 D_{ii}, 즉 M의 모든 고유값이 양수여야 한다. 다른 정부호성 조건들도 유사하게 설명될 수 있다. 스펙트럼 정리는 에르미트 행렬의 모든 고유값이 실수임을 보장한다.

4. 2. 역행렬과의 관계

대칭행렬의 성질에 따라, 정부호 행렬의 역행렬 역시 동일한 정부호 성질을 가진다.

  • 실수 대칭행렬(또는 에르미트 행렬) ''A''가 양의 정부호 행렬이면, 행렬 ''A''는 정칙 행렬이고, 역행렬 ''A''−1도 양의 정부호 행렬이다.[9] 만약 ''M'' ≥ ''N'' > 0 이면 ''N''−1 ≥ ''M''−1 > 0 이다.[10]
  • 실수 대칭행렬(또는 에르미트 행렬) ''A''가 음의 정부호 행렬이면, 행렬 ''A''는 정칙 행렬이고, 역행렬 ''A''−1도 음의 정부호 행렬이다.

4. 3. 행렬식과의 관계

실대칭 행렬 또는 에르미트 행렬 A가 양의 정부호 행렬이면, 그 행렬식 det(A)는 양수이다 (det(A) > 0). 이는 행렬식이 모든 고유값의 곱이며, 양의 정부호 행렬의 모든 고유값은 양수이기 때문에 성립한다.

5. 표기법

에르미트 행렬 M 의 정부호성을 나타내는 표기법은 다음과 같다.


  • M \succeq 0 : M 이 양의 준정부호 행렬(positive semidefinite)임을 나타낸다.
  • M \succ 0 : M 이 양의 정부호 행렬(positive definite)임을 나타낸다.
  • M \preceq 0 : M 이 음의 준정부호 행렬(negative semidefinite)임을 나타낸다.
  • M \prec 0 : M 이 음의 정부호 행렬(negative definite)임을 나타낸다.


이 표기법은 양의 준정부호 행렬이 양의 작용소를 정의하는 함수 해석학 분야에서 유래했다. 두 행렬 A B 에 대해 B - A \succeq 0 를 만족하면, B \succeq A 라는 비엄격 부분 순서 관계를 정의할 수 있다. 이 관계는 반사 관계, 반대칭 관계, 추이 관계를 만족하지만, 일반적으로 B - A 가 부정부호(indefinite)일 수 있으므로 전순서는 아니다.

다른 일반적인 표기법으로는 다음이 있다.

  • M \geq 0 : 양의 준정부호 행렬
  • M > 0 : 양의 정부호 행렬
  • M \leq 0 : 음의 준정부호 행렬
  • M < 0 : 음의 정부호 행렬


이 표기법은 모든 원소가 음수가 아닌 음이 아닌 행렬을 나타낼 때도 유사하게 사용될 수 있어 혼동의 여지가 있다.

아래 표는 행렬 A의 정부호성을 나타내는 다른 일반적인 표기법을 요약한 것이다.

정부호성의 표기법
정부호성양의 정부호양의 반정부호음의 정부호음의 반정부호
표기 예A > 0A \geq 0A < 0A \leq 0


6. 분해

n \times n 에르미트 행렬 M은 다음과 같이 분해될 수 있다.

M이 양의 반정부호 행렬이라는 것은, 어떤 행렬 B와 그 켤레 전치 B^*의 곱으로 M을 나타낼 수 있다는 것과 동치이다.

M = B^* B

만약 M이 실수 행렬이라면, B 역시 실수 행렬로 선택할 수 있으며, 이 경우 분해는 다음과 같이 쓸 수 있다.

M = B^\top B

여기서 B^\topB의 전치행렬이다.

M이 양의 정부호 행렬이라는 것은, 위와 같은 분해에서 행렬 B가 가역 행렬이라는 것과 동치이다.

더 일반적으로, M랭크 k인 양의 반정부호 행렬이라는 것은, k \times n 크기이고 랭크가 k인 행렬 B를 사용하여 M = B^* B와 같이 분해할 수 있다는 것과 동치이다. 어떤 분해 M = B^* B에 대해서든, \operatorname{rank}(M) = \operatorname{rank}(B)가 성립한다.[3]

행렬 B의 열벡터를 b_1, \dots, b_n이라고 하면, M(i, j) 성분 M_{ij}는 벡터 b_ib_j의 내적과 같다.

M_{ij} = \langle b_i, b_j \rangle

즉, 에르미트 행렬 M이 양의 반정부호 행렬인 것은 어떤 벡터들 b_1, \dots, b_n의 그램 행렬이라는 것과 동치이며, 양의 정부호 행렬인 것은 어떤 선형 독립인 벡터들의 그램 행렬이라는 것과 동치이다. 일반적으로 벡터 b_1, \dots, b_n의 그램 행렬의 랭크는 이 벡터들이 생성하는 공간의 차원과 같다.[4]

이러한 분해는 유일하지 않다. 만약 M = B^* B이고 Q가 임의의 k \times k 유니타리 행렬 (즉, Q^* Q = Q Q^* = I)이라면, A = Q B에 대해 M = B^* Q^* Q B = A^* A도 성립한다. 이것이 분해가 달라질 수 있는 유일한 방법으로, 분해는 유니타리 변환을 제외하고는 유일하다. 더 정확히 말하면, 만약 Ak \times n 행렬이고 B\ell \times n 행렬이며 A^* A = B^* B를 만족한다면, B = Q A를 만족하는 정규 직교 열을 가진 \ell \times k 행렬 Q (즉, Q^* Q = I_{k \times k})가 존재한다.[5] 만약 \ell = k이면 Q는 유니타리 행렬이다.

실수 행렬의 경우, 이 유일성 문제는 기하학적으로 해석할 수 있다. 실수 유니타리 행렬은 직교 행렬이며, 이는 원점을 고정하는 강체 변환(회전 또는 반사)에 해당한다. 따라서 두 벡터 집합 \{a_i\}\{b_i\}의 내적 a_i \cdot a_jb_i \cdot b_j가 같다는 것은, 강체 변환을 통해 한 벡터 집합을 다른 벡터 집합으로 변환할 수 있다는 의미이다.

=== 촐레스키 분해 ===

에르미트 양의 반정부호 행렬 M은 다음과 같은 형태로 분해할 수 있다.

M = L L^*

여기서 L은 대각 성분이 음수가 아닌 하삼각행렬이다. 이를 촐레스키 분해(Cholesky decomposition)라고 한다.

만약 M이 양의 정부호 행렬이라면, L의 대각 성분은 모두 양수이며, 이 촐레스키 분해는 유일하다. 반대로, L이 대각 성분이 음수가 아닌 하삼각행렬이면 L L^*는 항상 양의 반정부호 행렬이다.

촐레스키 분해는 선형 방정식 시스템을 풀거나 몬테카를로 시뮬레이션 등 수치 계산에서 효율적으로 사용된다.

=== LDL 분해 ===

촐레스키 분해와 밀접하게 관련된 분해로 LDL 분해가 있다.

M = L D L^*

여기서 D대각 행렬이고, L은 대각 성분이 모두 1인 하삼각행렬(단위 하삼각 행렬)이다.

7. 추가 성질

임의의 정방행렬 M, N에 대해, M - N이 양의 준정부호 행렬이면(M - N \ge 0) M \ge N으로 표기한다. 이는 정방행렬 집합에 대한 부분 순서를 정의하며, 이 순서를 뢰브너 순서(Loewner order)라고 한다. 엄격한 부분 순서 M > N도 유사하게 정의할 수 있다.

정부호 행렬과 관련된 몇 가지 추가적인 성질은 다음과 같다.


  • 양의 정부호 행렬의 역행렬도 양의 정부호 행렬이다.
  • 만약 M이 양의 정부호 행렬이고 r > 0이 실수라면, 스칼라 곱 r M도 양의 정부호 행렬이다.[11]
  • 만약 MN이 양의 정부호 행렬이라면, 합 M + N도 양의 정부호 행렬이다.[11] 만약 MN이 양의 준정부호 행렬이라면, 합 M + N도 양의 준정부호 행렬이다. 또한, M이 양의 정부호 행렬이고 N이 양의 준정부호 행렬이면, 합 M + N은 양의 정부호 행렬이다.
  • 만약 MN이 양의 정부호 행렬이라면, 곱 MNMNMN도 양의 정부호 행렬이다. 만약 MN이 가환한다면(MN = NM), 곱 MN도 양의 정부호 행렬이다.
  • 만약 M이 양의 준정부호 행렬이라면, 임의의 (직사각형일 수 있는) 행렬 A에 대해 A^* M A는 양의 준정부호 행렬이다. 만약 M이 양의 정부호 행렬이고 A열 랭크가 가득 찬 행렬(full column rank)이라면, A^* M A는 양의 정부호 행렬이다.[12]
  • 양의 준정부호 행렬의 대각 성분 m_{ii}는 실수이며 음수가 아니다. 결과적으로 대각합 \operatorname{tr}(M) \ge 0이다.[13] 또한, 모든 주 소행렬(특히 2x2)이 양의 준정부호이므로 다음 부등식이 성립한다:

\ \left|m_{ij}\right| \leq \sqrt{m_{ii}m_{jj}} \quad \forall i, j\

그리고 n \ge 1일 때,

\max_{i,j} \left|m_{ij}\right| \leq \max_i m_{ii}

  • 임의의 양의 준정부호 행렬 MN에 대해, \operatorname{tr}(MN) \ge 0이 성립한다. 이는 \operatorname{tr}(MN) = \operatorname{tr}(M^\frac{1}{2}N M^\frac{1}{2})로 표현할 수 있고, M^\frac{1}{2}N M^\frac{1}{2}는 양의 준정부호이므로 그 고윳값의 합인 대각합도 음수가 아니기 때문이다.
  • 만약 M, N \geq 0이면, 아다마르 곱 M \circ N \geq 0이다. 이 결과는 종종 슈어 곱 정리(Schur product theorem)라고 불린다.[15] 아다마르 곱에 관한 두 가지 주목할 만한 부등식은 다음과 같다:
  • 오펜하임 부등식(Oppenheim's inequality): \det(M \circ N) \geq \det (N) \prod\nolimits_i m_{ii}[16]
  • \det(M \circ N) \geq \det(M) \det(N)[17]
  • 만약 M, N \geq 0이면, 크로네커 곱 M \otimes N \geq 0이다.
  • 만약 M, N \geq 0이면, 프로베니우스 내적 M : N \geq 0이다.
  • 양의 준정부호 대칭행렬의 집합은 볼록하다. 즉, MN이 양의 준정부호 대칭 행렬이면, 0과 1 사이의 모든 \alpha에 대해 \alpha M + (1 - \alpha) N 역시 양의 준정부호 행렬이다. 임의의 벡터 \mathbf{x}에 대해 다음이 성립한다:

\mathbf{x}^\top (\alpha M + (1 - \alpha)N)\mathbf{x} = \alpha \mathbf{x}^\top M\mathbf{x} + (1 - \alpha) \mathbf{x}^\top N\mathbf{x} \geq 0

  • 행렬 A의 양의 정부호성은 임의의 벡터 \mathbf{x}와 그 이미지 A \mathbf{x} 사이의 각도 \theta가 항상 -\pi / 2 < \theta < +\pi / 2임을 의미한다. 이는 내적을 사용하여 다음과 같이 표현할 수 있다:

\cos\theta = \frac{ \mathbf{x}^\top A\mathbf{x} }{\lVert \mathbf{x} \rVert \lVert A\mathbf{x} \rVert} = \frac{\langle \mathbf{x}, A\mathbf{x} \rangle}{\lVert \mathbf{x} \rVert \lVert A\mathbf{x} \rVert}

여기서 \theta\mathbf{x}A\mathbf{x} 사이의 각도이다.

8. 응용

양의 정부호 행렬은 물리학, 공학, 통계학, 최적화 이론 등 다양한 분야에서 중요한 개념으로 활용된다. 예를 들어, 열전도율 행렬은 항상 양의 정부호이며, 최적화 문제에서 함수의 볼록성을 판정하거나 통계학에서 공분산 행렬을 다룰 때 중요한 역할을 한다.

8. 1. 열전도율 행렬

푸리에 열전도 법칙은 온도 구배 \ \mathbf{g} = \nabla T\ 의 함수로 열 플럭스 \ \mathbf{q}\ 를 나타낸다. 이방성 매질의 경우, 이 관계는 \ \mathbf{q} = -K \mathbf{g}\ 로 표현된다. 여기서 \ K\ 는 대칭 열전도율 행렬이다.

푸리에 법칙에 음의 부호가 포함된 이유는 열이 항상 온도가 높은 곳에서 낮은 곳으로 흐른다는 관찰 결과를 반영하기 위함이다. 온도 구배 \ \mathbf{g}\ 는 정의상 온도가 낮은 곳에서 높은 곳을 향하는 벡터이므로, 실제 열의 흐름 방향인 열 플럭스 \ \mathbf{q}\ \ \mathbf{g}\ 와 반대 방향이어야 한다. 수학적으로 이는 두 벡터의 내적이 항상 음수여야 함을 의미한다: \ \mathbf{q}^\top \mathbf{g} < 0 ~.

이 조건에 푸리에 법칙 \ \mathbf{q} = -K \mathbf{g}\ 를 대입하면 \ (-K \mathbf{g})^\top \mathbf{g} < 0 \ 이 된다. 행렬 곱의 전치 성질 \ (AB)^\top = B^\top A^\top \ \ K\ 가 대칭 행렬(\ K^\top = K\ )이라는 사실을 이용하면, \ -\mathbf{g}^\top K^\top \mathbf{g} = -\mathbf{g}^\top K \mathbf{g} < 0 \ 이다. 양변에 -1을 곱하면 부등호 방향이 바뀌어 최종적으로 \ \mathbf{g}^\top K\mathbf{g} > 0\ 라는 조건을 얻는다.

이 부등식은 0이 아닌 모든 벡터 \ \mathbf{g}\ 에 대해 성립해야 하므로, 정의에 따라 열전도율 행렬 \ K\ 양의 정부호 행렬이어야 한다.

8. 2. 최적화

실수 n \times n 행렬 M과 관련된 이차 형식은 모든 벡터 \mathbf{x} \in \mathbb{R}^n에 대해 Q(\mathbf{x}) = \mathbf{x}^\top M \mathbf{x}로 정의되는 함수 Q : \mathbb{R}^n \to \mathbb{R}이다. 이때 행렬 M은 대칭 행렬 \tfrac{1}{2} \left(M + M^\top \right)로 대체하여 생각할 수 있다. 왜냐하면 비대칭 부분은 이차 형식 계산 과정에서 사라지기 때문이다.

대칭 행렬 M이 양의 정부호일 필요충분조건은 해당 이차 형식 Q(\mathbf{x})가 강볼록 함수라는 것이다.

더 일반적으로, \mathbb{R}^n에서 \mathbb{R}로의 모든 이차 함수는 다음과 같은 형태로 쓸 수 있다.

f(\mathbf{x}) = \mathbf{x}^\top M \mathbf{x} + \mathbf{b}^\top \mathbf{x} + c

여기서 M은 대칭 n \times n 행렬이고, \mathbf{b}는 실수 n 벡터이며, c는 실수 상수이다. 이 이차 함수는 M이 양의 정부호일 때만 강볼록하며, 따라서 유일한 유한 전역 최솟값을 가진다.

  • 만약 M이 양의 정부호이면, 함수 f(\mathbf{x})는 강볼록하다. 함수의 기울기2M\mathbf{x} + \mathbf{b}이며, 기울기가 0이 되는 지점(\mathbf{x} = -\frac{1}{2}M^{-1}\mathbf{b})이 유일하게 존재한다. 함수가 강볼록하므로 이 지점에서 전역 최솟값을 갖는다.
  • 만약 M이 양의 정부호가 아니라면, \mathbf{v}^\top M \mathbf{v} \leq 0인 벡터 \mathbf{v}가 존재한다. 이 방향으로 함수값의 변화를 보면 f(t\mathbf{v}) = t^2 (\mathbf{v}^\top M \mathbf{v}) + t (\mathbf{b}^\top \mathbf{v}) + ct에 대한 아래로 볼록하지 않은 포물선이거나 직선이 된다. 따라서 함수는 강볼록하지 않으며 전역 최솟값을 갖지 않을 수 있다.


이러한 성질 때문에 양의 정부호 행렬은 최적화 문제에서 매우 중요한 역할을 한다. 어떤 이차 형식 f(\mathbf{x}) = \mathbf{x}^\top M \mathbf{x} (여기서 M은 대칭)이 있을 때, M이 양의 정부호라는 것은 f(\mathbf{x})\mathbf{x} = \mathbf{0}에서 유일한 최솟값 0을 가지며, 다른 모든 \mathbf{x}에 대해서는 f(\mathbf{x}) > 0임을 의미한다.

더 나아가, n개의 실수 변수를 가지는 두 번 미분 가능한 일반적인 함수 f(x_1, \ldots, x_n)의 경우, 어떤 지점에서 기울기가 0이고 그 지점에서의 헤세 행렬(모든 2차 편도함수로 이루어진 행렬)이 양의 준정부호이면 함수는 그 지점에서 국소 최솟값을 갖는다. 만약 헤세 행렬이 양의 정부호이면, 그 지점은 엄격한 국소 최솟값이다. 음의 정부호 및 음의 준정부호 행렬의 경우에도 최대값에 대해 유사한 결과를 얻을 수 있다.

8. 3. 통계학

통계학에서, 공분산 행렬은 다변량 확률 분포의 경우 항상 양의 준정부호 행렬이며, 한 변수가 다른 변수의 정확한 선형 함수가 아닌 이상 양의 정부호 행렬이다. 반대로, 모든 양의 준정부호 행렬은 어떤 다변량 분포의 공분산 행렬이다.

참조

[1] 서적 Parameter Estimation for Scientists and Engineers John Wiley & Sons 2007-03
[2] 서적 Convex Optimization Cambridge University Press 2004-03-08
[3] 간행물
[4] 간행물
[5] 간행물
[6] 간행물
[7] 간행물
[8] 간행물
[9] 간행물
[10] 간행물
[11] 간행물
[12] 간행물
[13] 간행물
[14] 학술지 Bounds for Eigenvalues using Traces Elsevier
[15] 간행물
[16] 간행물
[17] 학술지 Hadamard products and multivariate statistical analysis
[18] 서적 Positive Definite Matrices Princeton University Press
[19] 웹사이트 Positive definite matrix http://mathworld.wol[...] Wolfram Research 2012-07-26
[20] 기타 Stewart, J. (1976). Positive definite functions and generalizations, an historical survey. Rocky Mountain J. Math, 6(3). http://projecteuclid[...]
[21] 서적 Elementary Linear Algebra: Applications Version John Wiley & Sons 2010
[22] 웹사이트 Positive Definite Matrix 2012-07-26
[23] 웹인용 http://elearning.koc[...]



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com