맨위로가기

사영작용소

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

사영 작용소는 벡터 공간 V 위의 선형 변환 P가 P²=P를 만족하는 경우를 말한다. 힐베르트 공간에서는 = 를 만족하면 직교 사영, 그렇지 않으면 사각 사영이라고 한다. 정사각 행렬 P에 대해 P² = P이면 투영 행렬이라고 하며, 실수 행렬에서 P² = P = Pᵀ, 복소수 행렬에서 P² = P = P*이면 직교 투영 행렬이라고 한다. 사영 작용소는 부분 벡터 공간과 그 여공간의 쌍과 일대일 대응하며, 최소 제곱법을 정의하는 데 사용된다. 사영은 선형 최소 제곱법, QR 분해, 특이값 분해 등 다양한 선형대수 알고리즘에 활용되며, 작용소 K-이론, 폰 노이만 대수, 양자역학 등 다양한 분야에 응용된다.

2. 정의

벡터 공간 V 위의 선형 변환 P\colon V\to VP^2=P를 만족하면, '''사영 작용소'''라고 한다.

내적이 주어진 힐베르트 공간 V에서, 모든 \mathbf x, \mathbf y \in V에 대해 \langle P \mathbf x, \mathbf y \rangle = \langle \mathbf x, P \mathbf y \rangle를 만족하는 사영 작용소 P는 '''직교 사영'''이라고 한다. 힐베르트 공간에서 직교 사영이 아닌 사영은 '''사각 사영'''이라고 한다.

3. 분류

벡터 공간선형 변환 P\colon V\to VP^2=P를 만족하면, '''사영 작용소'''라고 한다. 유한 차원 벡터 공간에서 사영 작용소는 부분 벡터 공간과 그 여공간의 쌍과 일대일 대응한다. 사영 작용소 P에 대해, 벡터 공간은 P의 직합으로 분해된다.

:V=P(V)\oplus\ker P

내적 공간에서, 모든 \mathbf x, \mathbf y \in V에 대해 \langle P \mathbf x, \mathbf y \rangle = \langle \mathbf x, P \mathbf y \rangle를 만족하면 '''직교 사영'''이라고 한다. 직교 사영이 아닌 경우 '''사영(oblique) 사영'''이라고 한다.

정사각 행렬 P에 대해,


  • P^2 = P일 경우 '''투영 행렬'''이라고 한다.[2]
  • 실수 행렬에 대해 P^2 = P = P^{\mathrm T}이고, 복소수 행렬에 대해 P^2 = P = P^{*}일 경우 '''직교 투영 행렬'''이라고 하며, 여기서 P^{\mathrm T}P전치 행렬이고, P^{*}P의 에르미트 전치 행렬이다.[3]
  • 직교 투영 행렬이 아닌 투영 행렬을 '''사각 투영 행렬'''이라고 한다.

4. 성질

사영 작용소의 고윳값은 0 또는 1이다. 사영 작용소 P행렬 지수 함수는 다음과 같다.

:\exp P=1+(e-1)P

사영의 상과 커널은 상호 보완적이다. 즉, PQ = I - P는 상호 보완적이며, 연산자 Q도 사영이다. 이때 P의 상과 커널은 Q의 커널과 상이 되며, 그 반대도 성립한다.

사영의 곱은 일반적으로 사영이 아니지만, 두 사영이 교환하면 그 곱은 사영이 된다. 그러나 교환하지 않는 두 사영의 곱이 사영이 되는 경우도 존재한다.

직교 사영은 유계 작용소이다.

4. 1. 직교 사영

내적 공간 V의 사영 작용소 P\colon V\to V에 대하여, 다음 세 조건이 서로 동치이다.

  • \ker PP(V)직교 여공간이다. 즉, 임의의 a,b\in V에 대하여, \langle Pa,b-Pb\rangle=0이다.
  • 자기 수반 작용소이다.
  • 최소 제곱법을 정의한다. 즉, 임의의 b\in VPb\ne a\in P(V)에 대하여, \Vert b-Pb\Vert<\Vert b-a\Vert


벡터 공간 W가 내적을 가지고 있으며 완비(즉, 힐베르트 공간)인 경우, 직교성 개념을 사용할 수 있다. '''직교 투영'''은 치역 U와 핵 V가 직교 부분 공간인 투영이다. 따라서 W의 모든 \mathbf x\mathbf y에 대해, \langle P \mathbf x, (\mathbf y - P \mathbf y) \rangle = \langle (\mathbf x - P \mathbf x) , P \mathbf y \rangle = 0이다. 이는 다음과 같다.

: \langle \mathbf x, P \mathbf y \rangle = \langle P \mathbf x, P \mathbf y \rangle = \langle P \mathbf x, \mathbf y \rangle

투영이 직교 투영이기 위한 필요충분 조건은 자기 수반일 때이다. P의 자기 수반 및 멱등성을 사용하면 W의 모든 \mathbf x\mathbf y에 대해 P\mathbf{x} \in U, \mathbf{y} - P\mathbf{y} \in V이며,

: \langle P \mathbf x, \mathbf y - P \mathbf y \rangle = \langle \mathbf x, \left(P-P^2\right) \mathbf y \rangle = 0

여기서 \langle \cdot, \cdot \rangleW와 관련된 내적이다. 따라서 P I - P 는 직교 투영이다.[4] P가 직교이면 자기 수반이라는 것은 \langle (\mathbf x - P \mathbf x) , P \mathbf y \rangle = \langle P \mathbf x, (\mathbf y - P \mathbf y) \rangle = 0에서

: \langle \mathbf x, P \mathbf y \rangle = \langle P \mathbf x, P\mathbf y \rangle = \langle P \mathbf x, \mathbf y \rangle = \langle \mathbf x, P^* \mathbf y \rangle

W의 모든 xy에 대해; 따라서 P=P^*가 성립한다.

닫힌 부분 공간으로의 직교 투영의 존재는 힐베르트 투영 정리에서 따른다. 직교 투영은 유계 작용소이다. 이는 벡터 공간의 모든 \mathbf v에 대해 다음이 성립하기 때문이다. (코시-슈바르츠 부등식):

:\left \| P \mathbf v\right\|^2 = \langle P \mathbf v, P \mathbf v \rangle = \langle P \mathbf v, \mathbf v \rangle \leq \left\|P \mathbf v\right\| \cdot \left\|\mathbf v\right\|

따라서 \left\|P \mathbf v\right\| \leq \left\|\mathbf v\right\|이다.

유한 차원 복소수 또는 실수 벡터 공간의 경우, 표준 내적을 \langle \cdot, \cdot \rangle 대신 사용할 수 있다. 예를 들어, 삼차원 공간 '''R'''3 의 점 (''x'', ''y'', ''z'') 를 점 (''x'', ''y'', 0) 으로 사상하는 사상은 ''xy''-평면 위로의 사영이다. 이 사상은 행렬

:P =\begin{bmatrix} 1 & 0 & 0\\ 0 & 1 & 0\\ 0 & 0 & 0\end{bmatrix}

에 의해 표현된다. 실제로, 이 행렬 ''P'' 의 임의의 벡터에 대한 작용은

:P\begin{bmatrix} x\\ y\\ z\end{bmatrix} =\begin{bmatrix}

x\\ y\\ 0\end{bmatrix}

이 되고, 이것이 사영을 정하는 것 (즉, ''P'' = ''P''2 를 만족하는 것) 은

:P^2\begin{bmatrix} x\\ y\\ z\end{bmatrix} = P\begin{bmatrix} x\\ y\\ 0\end{bmatrix} =\begin{bmatrix} x\\ y\\ 0\end{bmatrix}

라는 계산으로 확인할 수 있다.

직선 위로의 직교 투영의 경우가 가장 간단하다. 직선 위의 단위 벡터 ''u''를 취하면, 해당 투영은

: P_u = u u^\top

로 주어진다. 이 작용소는 ''u''를 바꾸지 않고, 또한 ''u''에 직교하는 모든 벡터를 영으로 만든다.

''u''1, ..., ''u''''k''를 부분 공간 ''U''의 정규 직교 기저로 하고, 각 열 벡터가 ''u''1, ..., ''u''''k''가 되는 ''k''차 정방 행렬을 ''A''로 쓰면, 소기의 투영은

: P_A = A A^\top

로 표현된다. 이것은 내적을 사용하면

: P_A = \sum_i \langle u_i,\bullet\rangle u_i

라고 쓸 수도 있다.

(반드시 정규 직교가 아닌) 기저 ''u''1, …, ''u''''k''를 열 벡터로 갖는 행렬을 ''A''로 쓰면, 구하는 투영은

:P_A = A (A^\top A)^{-1} A^\top

로 쓸 수 있다.

이 투영의 치역이 되는 벡터 공간이 (기저가 아닌) 틀 (frame)로 표현될 때 (즉, 생성원의 수가 차원의 값보다 클 때)에는, 상기 공식은

:P_A = A (A^\top A)^+ A^\top

이라는 형태가 된다. 여기서 A^+는 무어-펜로즈 유사 역행렬을 나타낸다.

4. 2. 사영 (Oblique Projection)

변환 ''T''는 ''k''를 따라 ''m''으로의 사영이다. ''T''의 치역은 ''m''이고, 핵은 ''k''이다.


직교 사영이 아닌 사영을 의미한다. 때때로 '''사영작용소'''라는 용어는 비직교 사영을 지칭하는 데 사용된다. 이러한 사영은 2차원 그림에서 공간 도형을 표현하는 데에도 사용되지만, 직교 사영만큼 자주 사용되지는 않는다.

사영은 커널과 해당 범위(커널의 여집합)를 특징짓는 데 사용되는 기저 벡터에 의해 정의된다. 이러한 기저 벡터가 커널에 직교하지 않으면 사영은 사영작용소가 된다.

P \colon V \to VP^2 = P를 만족하는 선형 연산자이고, P가 영 연산자가 아니라고 가정한다. 벡터 \mathbf u_1, \ldots, \mathbf u_kP의 치역에 대한 기저를 형성하고, 이러한 벡터들을 n \times k 행렬 A로 구성한다. 치역과 커널은 상호 보완적인 공간이므로, 커널의 차원은 n - k이다. 따라서 커널의 직교 여집합의 차원은 k이다. 벡터 \mathbf v_1, \ldots, \mathbf v_k가 사영의 커널의 직교 여집합에 대한 기저를 형성하고, 이러한 벡터들을 행렬 B로 구성한다. 그러면 사영 P는 다음 식으로 주어진다.[12][13]

: P = A \left(B^\mathsf{T} A\right)^{-1} B^\mathsf{T}.

P가 직교 사영인 경우, A = B로 놓을 수 있으며, P=A \left(A^\mathsf{T} A\right)^{-1} A^\mathsf{T}가 된다. 일반적으로, 벡터 공간이 복소수체 위에 있는 경우, 에르미트 전치 행렬 A^*를 사용하고 공식 P=A \left(A^* A\right)^{-1} A^*를 갖는다. A가 전체 열 랭크를 가지므로, 행렬 A의 무어-펜로즈 역행렬은 A^{+}= (A^*A)^{-1}A^*로 표현할 수 있으며, 따라서 P=A A^{+}이다.

I-P 또한 사영이다. PI-P의 특이값은 A정규 직교 기저를 통해 계산할 수 있다.

Q_AA의 정규 직교 기저라고 하고, Q_A^{\perp}Q_A직교 여공간이라고 하자. 행렬 Q_A^T A (B^T A)^{-1} B^T Q_A^{\perp} 의 특이값을 양수 값 \gamma_1 \ge \gamma_2 \ge \ldots \ge \gamma_k 로 나타낸다. 이를 통해 P의 특이값은 다음과 같다:[14]

:\sigma_i =

\begin{cases}

\sqrt{1+\gamma_i^2} & 1 \le i \le k \\

0 & \text{otherwise}

\end{cases}



그리고 I-P의 특이값은 다음과 같다.

:\sigma_i =

\begin{cases}

\sqrt{1+\gamma_i^2} & 1 \le i \le k \\

1 & k+1 \le i \le n-k \\

0 & \text{otherwise}

\end{cases}


5. 표준형

위의 d차원 벡터 공간에서의 임의의 사영 작용소 P=P^2대각화 가능 행렬이다. 그 최소 다항식이 x^2-x를 나누며, 이는 서로 다른 선형 인수로 분해되기 때문이다. 따라서 P가 다음과 같은 형태를 갖는 기저가 존재한다.

:P = I_r\oplus 0_{d-r}

여기서 rP의 계수이다. I_r는 크기가 r인 항등 행렬이고, 0_{d-r}은 크기가 d-r인 영 행렬이며, \oplus는 직접합 연산자이다.

벡터 공간이 복소수이고 내적이 주어지면, ''P''의 행렬이 다음과 같은 ''정규 직교'' 기저가 존재한다.[15]

:P = \begin{bmatrix}1&\sigma_1 \\ 0&0\end{bmatrix} \oplus \cdots \oplus \begin{bmatrix}1&\sigma_k \\ 0&0\end{bmatrix} \oplus I_m \oplus 0_s.

여기서 \sigma_1 \geq \sigma_2\geq \dots \geq \sigma_k > 0이다. 정수 k,s,m과 실수 \sigma_i는 고유하게 결정된다. 2k+s+m=d이다. I_m \oplus 0_s 요소는 P가 ''직교'' 사영으로 작용하는 최대 불변 부분 공간에 해당한다 (따라서 P 자체가 k=0일 때만 직교).\sigma_i 블록은 ''사선'' 구성 요소에 해당한다.

6. 노름 공간 위의 사영 작용소

바나흐 공간과 같이 무한 차원 노름 공간에서도 사영 작용소를 정의할 수 있다. 유한 차원 벡터 공간과 달리, 연속성, 닫힌 부분 공간 등 해석학적 개념이 추가적으로 고려되어야 한다.

바나흐 공간 XX = U \oplus V 와 같이 부분 공간 UV의 직접 합으로 표현될 때, P(u+v) = u로 정의되는 연산자 PU를 치역으로, V를 핵으로 갖는 사영 작용소이다. 또한 P^2 = P를 만족한다. 역으로, P^2 = P를 만족하는 사영 작용소 P가 주어지면, (1-P)^2 = (1-P) 역시 성립하므로 1-P도 사영 작용소가 된다. 이때, X\operatorname{rg}(P) \oplus \operatorname{rg}(1 - P)로 분해된다.

하지만 유한 차원과 달리 사영 작용소가 항상 연속일 필요는 없다. X의 부분 공간 U가 노름 위상에서 닫혀 있지 않으면, U로의 사영은 연속이 아니다. 연속 사영 P의 치역은 닫힌 부분 공간이어야 하며, 연속 사영의 핵(일반적으로 연속 선형 연산자의 핵)은 닫혀 있다. 따라서 연속 사영 PX를 두 개의 닫힌 부분 공간의 직접 합으로 분해한다: X = \operatorname{rg}(P) \oplus \ker(P) = \ker(1-P) \oplus \ker(P).

UX의 닫힌 부분 공간이고, X = U \oplus V인 닫힌 부분 공간 V가 존재하면, 치역이 U이고 핵이 V인 사영 P는 연속이다. 이는 폐그래프 정리를 통해 증명할 수 있다.

일반적으로 닫힌 부분 공간 U에 대해 닫힌 보완 부분 공간 V가 항상 존재하지는 않지만, 힐베르트 공간에서는 직교 여집합을 이용하여 항상 존재한다. 바나흐 공간의 경우, 한-바나흐 정리에 의해 일차원 부분 공간은 항상 닫힌 보완 부분 공간을 갖는다.

7. 응용

내적 공간 V 및 부분 벡터 공간 W\subset V이 주어졌을 때, 벡터 b\in VW에 대한 '''최적 근사'''는 주어진 조건을 만족시키는 Pb\in W이다. 최적 근사는 존재한다면 유일하지만, 일반적으로 존재하지 않는다. 만약 W를 상으로 하는 자기 수반 사영 작용소 P\colon V\to V가 존재한다면, 각 bW를 통한 최적 근사는 Pb이다. 특히, W가 유한 차원 벡터 공간이라면 이러한 자기 수반 사영 작용소는 항상 존재한다. 연립 일차 방정식의 최소 제곱법은 이에 대한 특수한 경우이다.

벡터 공간 V가 직교 벡터 \mathbf u_1, \mathbf u_2, \dots, \mathbf u_p에 의해 span되어 있고, y를 벡터라고 할 때, \mathbf yV로의 투영은 다음과 같이 정의할 수 있다.

\operatorname{proj}_V \mathbf y = \frac{\mathbf y \cdot \mathbf u^i}{\mathbf u^i \cdot \mathbf u^i } \mathbf u^i

여기서 반복되는 인덱스는 합산된다(아인슈타인 합 표기법). 벡터 \mathbf y는 직교 합으로 쓸 수 있으며, \operatorname{proj}_V \mathbf y는 때때로 \hat{\mathbf y}로 표시된다. 선형대수학에는 이 \mathbf z\mathbf y에서 V까지의 가장 작은 거리(''직교 거리'')이며, 기계 학습과 같은 분야에서 일반적으로 사용된다는 정리가 있다.

''y''가 벡터 공간 ''V''로 투영되고 있다.


투영은 다음과 같은 선형 대수 문제에 대한 계산 알고리즘에서 중요한 역할을 한다.[1]

사영은 멱등 작용소의 특별한 것이며, 해석학적으로는 직교 사영은 특성 함수의 비가환적인 일반화가 된다.[1] 양자론에서는, 어떤 조건을 만족하는 상태의 전체는 상태 공간의 부분 공간으로 간주할 수 있으므로, 양자 역학적인 명제와 부분 공간, 즉 투영 연산자를 대응시킬 수 있다(양자 논리).[2]

통계 역학에서는 운동의 조립화를 투영 연산자를 사용하여 정식화하는 방법(투영 연산자 방법)이 있다.[2]

분자 대칭성, 분자 진동, 격자 진동, 결정파동 함수에서는 임의의 함수에서 어떤 대칭성에 따르는 함수만을 만들고 싶을 때 투영 연산자가 사용된다. 예를 들어 투영 연산자를 사용하면, 기약 표현의 표현 행렬로부터 그 기저 함수(기준 진동, 기준 모드 등)를 구할 수 있다.[2]

8. 일반화

일반적으로, 노름 벡터 공간 사이의 사상 T\colon V \to W가 주어졌을 때, 커널의 직교 여공간에서 이 사상이 등거리 사상인지 질문할 수 있다. 즉, (\ker T)^\perp \to W가 등거리 사상인지 묻는 것이다 ( 부분 등거리 사상 참조). 특히 이는 전사여야 한다. 직교 투영의 경우, ''W''가 ''V''의 부분 공간일 때 해당한다. 리만 기하학에서, 이는 리만 피복 사상의 정의에 사용된다.

보다 일반적으로, 노름 공간 사이의 사상 ''T'': ''V'' → ''W''가 주어졌을 때, 핵의 직교 여공간 상의 등거리 사상이 되도록 요구할 수 있다. 이때 (\ker T)^\perp \to W는 등거리 사상이며, 특히 전사여야 한다. 직교 투영의 경우는 ''W''가 ''V''의 부분 공간일 때이다. 리만 기하학에서 이 개념은 리만 침몰의 정의에 사용된다.

참조

[1] 문서 Meyer, pp 386+387
[2] 서적 Matrix Analysis, second edition Cambridge University Press 2013
[3] 서적 Matrix Analysis, second edition Cambridge University Press 2013
[4] 문서 Meyer, p. 433
[5] 문서 Meyer, p. 431
[6] 문서 Meyer, equation (5.13.4)
[7] 간행물 Linear Algebra and Matrix Analysis for Statistics https://books.google[...] Chapman and Hall/CRC 2014
[8] 문서 Meyer, equation (5.13.3)
[9] 문서 "See also [[Linear least squares (mathematics)#Properties of the least-squares estimators|Linear least squares (mathematics) § Properties of the least-squares estimators]]."
[10] 간행물 Linear Algebra and Matrix Analysis for Statistics https://books.google[...] Chapman and Hall/CRC 2014
[11] 간행물 Revisiting Spherical Trigonometry with Orthogonal Projectors 2004
[12] 간행물 Linear Algebra and Matrix Analysis for Statistics https://books.google[...] Chapman and Hall/CRC 2014
[13] 문서 Meyer, equation (7.10.39)
[14] 간행물 Computationally Efficient Decompositions of Oblique Projection Matrices 2020
[15] 논문 Unitary similarity of projectors 1991-08
[16] 논문 Unitary similarity of projectors http://www.springerl[...] 1991



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com