케일리-해밀턴 정리

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

케일리-해밀턴 정리는 가환환 K 위의 n × n 정사각 행렬 M의 특성 다항식을 p(x) = det(x - M) = ∑k=0n pk xk ∈ K[x]로 정의할 때, p(M) = ∑k=0n pk Mk = 0이 성립한다는 정리이다. 이 정리는 행렬의 거듭제곱을 낮은 차수의 행렬 다항식으로 표현하고, 역행렬을 계산하는 데 활용되며, 대수적 정수의 최소 다항식을 구하는 데도 사용된다. 케일리-해밀턴 정리는 다양한 증명 방법을 통해 증명될 수 있으며, 임의의 가환환의 원소를 갖는 행렬에 대해 성립한다. 또한, 자기 사상 환 위의 행렬을 이용하여 일반화된 형태로 이해할 수 있으며, 나카야마 보조정리의 근원이 된다.

케일리-해밀턴 정리
개요
종류선형대수학
분야수학
설명모든 가환환 위의 정사각행렬은 자신의 특성 방정식을 만족한다.
역사
이름의 유래아서 케일리와 윌리엄 로언 해밀턴의 이름에서 유래
내용
내용n × n 행렬 A에 대해, λ를 변수로 하는 특성 다항식 det(λIn − A)을 p(λ)라고 하면, p(A) = 0이다.
예시
2 × 2 행렬A =
https://upload.wikimedia.org/wikipedia/commons/thumb/0/0a/Cayley-Hamilton_theorem_2x2_example.svg/300px-Cayley-Hamilton_theorem_2x2_example.svg.png
https://upload.wikimedia.org/wikipedia/commons/thumb/0/0a/Cayley-Hamilton_theorem_2x2_example.svg/300px-Cayley-Hamilton_theorem_2x2_example.svg.png
3 × 3 행렬A =
https://upload.wikimedia.org/wikipedia/commons/thumb/c/c6/Cayley-Hamilton_theorem_3x3_example.svg/300px-Cayley-Hamilton_theorem_3x3_example.png
https://upload.wikimedia.org/wikipedia/commons/thumb/c/c6/Cayley-Hamilton_theorem_3x3_example.svg/300px-Cayley-Hamilton_theorem_3x3_example.png
📚 더 읽어볼만한 페이지
  • 윌리엄 로언 해밀턴 - 해밀토니언 (양자역학)
    양자역학에서 해밀토니언은 계의 총 에너지를 나타내는 연산자로서, 고전역학의 해밀토니안에서 유래하며 슈뢰딩거 방정식을 통해 계의 시간적 진화를 결정하고, 그 고유값은 허용된 에너지 준위를 나타낸다.
  • 윌리엄 로언 해밀턴 - 해밀턴의 원리
    해밀턴의 원리는 일반화 좌표계에서 계의 변화가 작용 범함수의 극값을 가지며, 라그랑지안을 시간으로 적분한 작용을 통해 기술되고, 오일러-라그랑주 방정식과의 동등성을 가지며 다양한 물리적 현상 기술에 적용된다.
  • 선형대수학 정리 - 스펙트럼 정리
    스펙트럼 정리는 에르미트 행렬, 정규 행렬, 자기 수반 연산자 등의 고유 벡터와 고유값의 존재를 다루며, 행렬 대각화 및 힐베르트 공간 작용소 분석에 활용되고 함수 미적분학 정의에도 기여한다.
  • 선형대수학 정리 - 페론-프로베니우스 정리
  • 행렬론 - 행렬식
    행렬식은 정사각 행렬에 대해 정의되는 값으로, 선형 방정식의 해를 구하고 선형 독립성을 확인하며 기저의 방향과 부피를 계산하는 데 사용되며, 가우스 소거법 등의 계산 기법과 가역성 판단, 고유값 연관성 등의 성질을 갖는다.
  • 행렬론 - 행렬 분해
    행렬 분해는 주어진 행렬을 특정 성질을 갖는 여러 행렬의 곱으로 표현하는 방법으로, 수치 해석에서 행렬 알고리즘 구현 및 선형 연립 방정식 해를 구하거나 행렬 특성 분석에 활용되며 LU 분해, QR 분해, 특잇값 분해 등이 있다.

2. 정의

가환환 K 위의 n\times n 정사각 행렬 M\in\operatorname{Mat}(n;K)의 특성 다항식은 다음과 같다.

:p(x)=\det(x-M)=\sum_{k=0}^np_kx^k\in K[x]

여기서 \det행렬식이다. 케일리-해밀턴 정리에 따르면, 다음이 성립한다.

:p(M)=\sum_{k=0}^np_kM^k=0

특히, K일 경우 M최소 다항식은 특성 다항식의 약수이다.

3. 증명

케일리-해밀턴 정리는 다양한 방법으로 증명할 수 있다. 여러 증명 방법이 존재하며, 이들은 사용하는 수학적 개념과 접근 방식에 따라 다음과 같이 분류할 수 있다.

* 행렬식을 이용한 증명: 고전적 수반 행렬을 사용하여 증명한다.
* 삼각화를 이용한 증명: 행렬을 상삼각 행렬로 변환하여 증명한다.
* 단인자를 이용한 증명: 단자(單因子) 이론을 사용하여 증명한다.
* 여인자 행렬을 이용한 증명: 여인자 행렬을 사용하여 증명한다.
* 행렬 계수 다항식을 이용한 증명: 행렬을 계수로 갖는 다항식을 사용하여 증명한다.
* 두 증명 (행렬식, 행렬 계수 다항식)의 절충: 행렬식을 이용한 증명과 행렬 계수 다항식을 이용한 증명을 결합하여 증명한다.
* 자기 사상 환 위의 행렬을 이용한 증명: 자기 사상 환 위의 행렬을 사용하여 증명하며, 나카야마 보조정리와 관련이 있다.
* 추상대수학적 방법을 이용한 증명: 하세-슈미트 미분의 성질이나 외대수를 이용하는 추상대수학적 방법으로 증명한다.
* 조합론적 증명: 라이프니츠 공식을 이용하거나, 트레이스 모노이드 이론을 사용하여 증명한다.

각 증명 방법에 대한 자세한 내용은 하위 섹션에서 확인할 수 있다.

3.1. 행렬식을 통한 증명

가환환 K[M]=\{q(M)\colon q\in K[x]\}\subseteq\operatorname{Mat}(n;K) 위의 n\times n 행렬 N\in\operatorname{Mat}(n;K[M])을 다음과 같이 정의한다.

:N_{ij}=\delta_{ij}M-M_{ij}\in K[M]

여기서 \delta_{ij}크로네커 델타이다.

열벡터 공간 K^n의 표준 기저를 \{e_1,\dots,e_n\}라고 하고, N고전적 수반 행렬\operatorname{adj}N라고 하면, 다음이 성립한다.

:\sum_{j=1}^nN_{ij}e_j=0
:((\operatorname{adj}N)N)_{kj}=\delta_{kj}\det N
:\det N=p(M)

따라서 임의의 k\in\{1,\dots,n\}에 대하여, 다음이 성립한다.

:\begin{align}0
&=\sum_{i=1}^n\sum_{j=1}^n(\operatorname{adj}N)_{ki}N_{ij}e_j\\
&=\sum_{j=1}^n\sum_{i=1}^n(\operatorname{adj}N)_{ki}N_{ij}e_j\\
&=\sum_{j=1}^n((\operatorname{adj}N)N)_{kj}e_j\\
&=\sum_{j=1}^n\delta_{kj}(\det N)e_j\\
&=(\det N)e_k\\
&=p(M)e_k
\end{align}

즉, p(M)=0이다.

3.2. 삼각화를 통한 증명

K영어정역일 경우, 행렬의 삼각화를 이용하여 증명할 수 있다. 먼저, 상삼각 행렬의 경우에 대해 증명하고, 일반적인 행렬은 삼각화 가능 행렬임을 이용하여 증명한다.

A의 고유 다항식을 p_A (t) = \det(t I_n - A), 고유값을 \lambda_1, \cdots, \lambda_n이라고 하면, 다음과 같다.
:p_A (t)=(t- \lambda_1 ) \cdots (t- \lambda_n )

A를 상삼각화한 행렬을 B라고 하면, 이때 대각 성분에 고유값 \lambda_1, \cdots, \lambda_n이 나열된다.
:B:= P^{-1}AP = \begin{pmatrix}
\lambda_1 & & &* & \\
& \lambda_2 & & & \\
& &\lambda_3 & & \\
& & &\ddots & \\
& & & &\lambda_n
\end{pmatrix}

:\begin{align} p_A (A)
&= (A- \lambda_1 I) \cdots (A- \lambda_n I) \\
&= (PBP^{-1}- \lambda_1 I) \cdots (PBP^{-1}- \lambda_n I) \\
&= P\{(B- \lambda_1 I) \cdots (B- \lambda_n I)\}P^{-1} \ \cdots \ (1) \\
\end{align}
여기서 p_B (B)=(B- \lambda_1 I) \cdots (B- \lambda_n I)를 계산한다.

C_k :=B- \lambda_k I\ (k=1,2, \cdots ,n)라고 두면, C_k는 상삼각행렬이고, (k, k) 성분은 0이다.

C_1 C_2를 계산하면 다음과 같다.
:\left(\begin{array}{c|c|cc}
0 &* &\cdots &* \\\hline
&* &\cdots &* \\\hline
& &\ddots &\vdots \\
& & &*
\end{array}\right) \left(\begin{array}{c|c|cc}
* &* &\cdots &* \\\hline
&0 &\cdots &* \\\hline
& &\ddots &\vdots \\
& & &*
\end{array}\right)=\left(\begin{array}{c|c|cc}
0 &0 &\cdots &* \\\hline
&0 &\cdots &* \\\hline
& &\ddots &\vdots \\
& & &*
\end{array}\right)
따라서, 제2열까지는 성분이 모두 0이 된다. 마찬가지로, 귀납적으로, C_k를 곱하면, 제k열까지의 성분은 모두 0이 된다. 이를 n번째까지 반복하면 다음과 같다.
:C_1 \cdots C_n =O
따라서 (1)은
:P(C_1 \cdots C_n)P^{-1}=O이다. (증명 끝)

3.3. 단인자를 통한 증명

단자(單因子) 이론을 사용하면 쉽게 유도할 수 있다. 단, 단자 표준형의 존재 및 유일성을 증명하려면 상당한 과정이 필요하다.

문헌에 게재된 방법에 따른다.

의 단자 표준형은 \deg \det(xI-A)=n이므로, 다음과 같은 형태가 된다.

:P(x)(xI-A)Q(x)=\begin{pmatrix}
e_1(x) & & \\
&\ddots & \\
& &e_n(x) \\
\end{pmatrix}

여기서 는 모닉 다항식이고, 이다. 즉, 는 로 나누어 떨어진다.

단자 이론에서 알려진 결과에 따르면, 마지막 단자 는 의 최소 다항식 와 같다.

:\begin{align}
p_A(x) &=\det(xI-A) \\
&=\det P(x)^{-1} \sdot (e_1(x) \cdots e_{n-1}(x) \phi_A(x)) \sdot \det Q(x)^{-1}
\end{align}

따라서 고유 다항식 는 최소 다항식 로 나누어 떨어진다는 것을 알 수 있다. 그러므로 이다. (증명 종료)

3.4. 여인자 행렬을 통한 증명

여인자 행렬(수반 행렬)을 이용하여 케일리-해밀턴 정리를 증명할 수 있다. 이를 위해 다항식을 원소로 갖는 행렬을 사용한다.

행렬 tI_n - A는 특성 다항식이 p(t)이고, 다항식은 가환환을 형성하므로, 여인자 행렬 B = \operatorname{adj}(tI_n-A)를 갖는다.

수반 행렬의 기본 관계에 따라 다음이 성립한다.

:(t I_n - A)B = \det(t I_n - A) I_n = p(t) I_n.

Bt에 대한 다항식을 원소로 갖는 행렬이므로, 각 i에 대해 t^i의 계수를 모아 행렬 B_i를 구성할 수 있다.

:B = \sum_{i = 0}^{n - 1} t^i B_i.

(B의 원소 정의에 따라 t^{n-1}보다 높은 거듭제곱은 나타나지 않는다.)

이제 양변을 전개하면 다음과 같다.

:\begin{align}
p(t) I_n &= (t I_n - A)B \\
&=(t I_n - A)\sum_{i = 0}^{n - 1} t^i B_i \\
&=\sum_{i = 0}^{n - 1} tI_n\cdot t^i B_i - \sum_{i = 0}^{n - 1} A\cdot t^i B_i \\
&=\sum_{i = 0}^{n - 1} t^{i + 1} B_i- \sum_{i = 0}^{n - 1} t^i AB_i \\
&=t^n B_{n - 1} + \sum_{i = 1}^{n - 1} t^i(B_{i - 1} - AB_i) - AB_0.
\end{align}

p(t)I_n=t^nI_n+t^{n-1}c_{n-1}I_n+\cdots+tc_1I_n+c_0I_n 와 같이 전개하여, t의 각 거듭제곱의 계수가 같아야 한다는 사실로부터 다음 연립방정식을 얻는다.

:B_{n - 1} = I_n, \qquad B_{i - 1} - AB_i = c_i I_n\quad \text{for }1 \leq i \leq n-1, \qquad -A B_0 = c_0 I_n.

각 방정식에 A^i를 곱하고 모두 더하면 좌변은 소거합이 되어 0이 되고, 우변은 p(A)가 된다.

:0 = p(A).

따라서 케일리-해밀턴 정리가 증명된다.

3.5. 행렬 계수 다항식을 이용한 증명

케일리-해밀턴 정리는 대수적으로 닫힌 체에 대한 행렬의 조르당 정규형 존재의 직접적인 결과이다. 이 섹션에서는 행렬 계수를 갖는 다항식을 이용하여 직접 증명하는 방법을 제시한다.

행렬에 대한 케일리-해밀턴 정리의 명제를 얻으려면 다음과 같은 두 단계가 필요하다.

먼저 특성 다항식의 계수 는 행렬식의 에 관한 다항식 전개에 의해 결정된다.

:A = \left(a_{ij}\right)_{i,j=1}^n

:\begin{align}
p(t) & = \det(t I_n - A) =
\begin{vmatrix}t-a_{1,1}&-a_{1,2}&\cdots&-a_{1,n} \\
-a_{2,1}&t-a_{2,2}&\cdots&-a_{2,n} \\
\vdots & \vdots & \ddots & \vdots \\
-a_{n,1}&-a_{n,2}& \cdots& t-a_{n,n} \end{vmatrix} \\[5pt]
& = t^n+c_{n-1}t^{n-1}+\cdots+c_1t+c_0,
\end{align}

그런 다음 이러한 계수는 의 거듭제곱의 선형 결합에 사용되며, 이는 영행렬과 같다.

:A^n+c_{n-1}A^{n-1} + \cdots + c_1 A + c_0 I_n = \begin{pmatrix} 0 & \cdots & 0 \\ \vdots & \ddots & \vdots \\ 0 & \cdots & 0 \end{pmatrix}.

좌변은 의 성분 의 집합에서 (엄청난) 다항식 표현인 엔트리를 갖는 행렬로 계산될 수 있으므로, 케일리-해밀턴 정리는 이러한 표현 각각이 과 같다고 말한다. 임의의 고정된 값에 대해, 이러한 항등식은 지루하지만 간단한 대수적 조작으로 얻을 수 있다. 그러나 이러한 계산은 케일리-해밀턴 정리가 모든 가능한 크기 의 행렬에 대해 유효해야 하는 이유를 보여줄 수 없으므로, 모든 에 대한 균일한 증명이 필요하다.

3.6. 두 증명 (행렬식, 행렬 계수 다항식)의 절충

Cayley–Hamilton theorem영어는 행렬식을 통한 증명과 행렬 계수 다항식을 이용한 증명을 결합하여 증명할 수 있다. 유클리드 나눗셈을 이용하여 몫과 나머지를 구하고, 가환 다항식 환 내에서 평가 사상을 적용한다.

이 증명에서는 다항식을 원소로 갖는 행렬을 사용한다. 행렬 는 행렬식의 특성 다항식이 이고, 다항식은 가환환을 형성하므로, 수반 행렬 를 갖는다.

B=\operatorname{adj}(tI_n-A).

수반 행렬의 기본 관계에 따라 다음이 성립한다.

(t I_n - A)B = \det(t I_n - A) I_n = p(t) I_n.

역시 에 대한 다항식을 원소로 갖는 행렬이므로, 각 에 대해, 각 원소에서 의 계수를 수집하여 숫자의 행렬 를 형성할 수 있으며, 다음을 얻는다.

B = \sum_{i = 0}^{n - 1} t^i B_i.

의 원소가 정의되는 방식에 따라 보다 높은 거듭제곱은 발생하지 않는다. 이는 계수가 행렬인 다항식처럼 보이지만, 다항식 원소를 갖는 행렬을 개의 상수 행렬의 선형 결합으로 작성하는 방법일 뿐이며, 계수 는 이러한 관점을 강조하기 위해 행렬의 왼쪽에 쓰여졌다.

양선형성을 통해 방정식의 행렬 곱을 전개하면 다음과 같다.

\begin{align}
p(t) I_n &= (t I_n - A)B \\
&=(t I_n - A)\sum_{i = 0}^{n - 1} t^i B_i \\
&=\sum_{i = 0}^{n - 1} tI_n\cdot t^i B_i - \sum_{i = 0}^{n - 1} A\cdot t^i B_i \\
&=\sum_{i = 0}^{n - 1} t^{i + 1} B_i- \sum_{i = 0}^{n - 1} t^i AB_i \\
&=t^n B_{n - 1} + \sum_{i = 1}^{n - 1} t^i(B_{i - 1} - AB_i) - AB_0.
\end{align}

다음을 전개하면,

p(t)I_n=t^nI_n+t^{n-1}c_{n-1}I_n+\cdots+tc_1I_n+c_0I_n,

다항식 원소를 갖는 두 행렬의 등식을 얻고, 상수 행렬의 선형 결합으로 작성한다. 의 거듭제곱을 계수로 사용한다.

두 표현 모두에서 계수가 인 상수 행렬이 같아야 한다. 에서 0까지 에 대해 방정식을 작성하면 다음과 같다.

B_{n - 1} = I_n, \qquad B_{i - 1} - AB_i = c_i I_n\quad \text{for }1 \leq i \leq n-1, \qquad -A B_0 = c_0 I_n.

로 의 계수 방정식을 왼쪽에서 곱하고 합산한다.

A^n B_{n-1} + \sum\limits_{i=1}^{n-1}\left( A^i B_{i-1} - A^{i+1}B_i\right) -A B_0 = A^n+c_{n-1} A^{n-1} + \cdots + c_1A + c_0I_n.

좌변은 소거합을 형성하고 완전히 상쇄된다. 우변은 p(A)로 합산된다.

0 = p(A).

이것으로 증명이 완료된다.

3.7. 자기 사상 환 위의 행렬을 이용한 증명

자기 사상 환 위의 행렬을 이용한 케일리-해밀턴 정리의 증명은 다음과 같다. 이 증명은 나카야마 보조정리와 관련이 있다.

우선, 행렬의 성분과 자기 사상을 구분해야 한다. 행렬 A = (a_{ij})_{i,j=1}^n에 대해, a_{ij}는 스칼라 값으로, Aa_{ij}I_n으로 실현되는 행렬의 링의 원소로 생각할 수 있다. 하지만, 행렬을 원소로 갖는 행렬은 블록 행렬과 혼동될 수 있으며, 블록 행렬에 대한 행렬식 개념은 일반적으로 성립하지 않으므로 주의해야 한다.

따라서, An-차원 벡터 공간 V (또는 이 체가 아닌 경우 자유 -가군)의 자기 사상 \varphi와 구분하고, End(V) 위의 행렬을 사용한다. 여기서 End(V)는 V의 모든 자기 사상들의 집합이다.

\varphi I_n-A의 행렬식(\det(\varphi I_n - A))은 R[\varphi]에서 정의할 수 있다. 여기서 R[\varphi]는 항등원과 \varphi에 의해 생성된 부분환이다.

이제, A가 기저 e_1, \ldots, e_n에서 \varphi의 행렬이라는 사실로부터 다음 식을 얻는다.

:\varphi(e_i) = \sum_{j = 1}^n A_{j,i} e_j \quad\text{for }i=1,\ldots,n.

이를 행렬-벡터 곱을 이용하여 다시 쓰면 다음과 같다.

:\varphi I_n \cdot E = A^\operatorname{tr}\cdot E,

여기서 E\in V^n는 성분 e_ii인 요소이다. 이를 정리하면,

:(\varphi I_n-A^\operatorname{tr})\cdot E = 0\in V^n

이 된다. 여기서 \varphi I_n-A전치 행렬과 그 행렬식(R[\varphi]의 요소)인 p(\varphi)를 확인할 수 있다.

이제 \varphi I_n-A^\operatorname{tr}의 수반 행렬을 왼쪽에 곱하면,

:
\begin{align}
0 &= \operatorname{adj}(\varphi I_n-A^\operatorname{tr}) \cdot \left((\varphi I_n-A^\operatorname{tr})\cdot E\right) \\[1ex]
&= \left(\operatorname{adj}(\varphi I_n-A^\operatorname{tr}) \cdot (\varphi I_n-A^\operatorname{tr})\right) \cdot E \\[1ex]
&= \left(\det(\varphi I_n - A^\operatorname{tr})I_n\right) \cdot E \\[1ex]
&= (p(\varphi)I_n)\cdot E
\end{align}


가 성립한다. 이 식의 성분 ip(\varphi)(e_i) = 0 \in V를 의미하며, p(\varphi)는 모든 e_i에서 0이 된다. 따라서, p(\varphi) = 0 \in End(V)이며, 증명이 완료된다.

이 증명에서 중요한 점은, 특성 다항식이 취해지는 행렬 A가 해당 다항식에 대입된 값 \varphi와 같을 필요가 없다는 것이다. 즉, \varphi

:\varphi(e_i) = \sum_j A_{j,i} e_j

를 만족하는 V의 자기 사상이면 충분하며, V를 생성하는 일부 요소 시퀀스 e_1, \ldots, e_n에 대해 성립하면 된다.

3.8. 추상대수학적 방법을 이용한 증명

하세-슈미트 미분의 기본적인 성질을 이용한 증명 방법이 있다. 외대수를 이용하여 증명한다.

3.9. 조합론적 증명

라이프니츠 공식을 특성 다항식에 대해 전개하여 증명하는 방법(스트라우빙)과, 트레이스 모노이드 이론을 사용하여 일반화하는 방법(포아타와 카르티에)이 있다.

n \times n 행렬 A = \left(a_{ij}\right)_{i,j=1}^n에 대한 케일리-해밀턴 정리의 명제를 얻으려면, 두 단계가 필요하다. 먼저 특성 다항식의 계수 c_i는 행렬식의 t에 관한 다항식 전개에 의해 결정된다.

\begin{align}
p(t) & = \det(t I_n - A) =
\begin{vmatrix}t-a_{1,1}&-a_{1,2}&\cdots&-a_{1,n} \\
-a_{2,1}&t-a_{2,2}&\cdots&-a_{2,n} \\
\vdots & \vdots & \ddots & \vdots \\
-a_{n,1}&-a_{n,2}& \cdots& t-a_{n,n} \end{vmatrix} \\[5pt]
& = t^n+c_{n-1}t^{n-1}+\cdots+c_1t+c_0,
\end{align}

그런 다음 이러한 계수는 A의 거듭제곱의 선형 결합에 사용되며, 이는 n \times n 영행렬과 같다.

A^n+c_{n-1}A^{n-1} + \cdots + c_1 A + c_0 I_n = \begin{pmatrix} 0 & \cdots & 0 \\ \vdots & \ddots & \vdots \\ 0 & \cdots & 0 \end{pmatrix}.

좌변은 A의 성분 a_{i,j}의 집합에서 (엄청난) 다항식 표현인 엔트리를 갖는 n \times n 행렬로 계산될 수 있으므로, 케일리-해밀턴 정리는 이러한 n^2 표현 각각이 0과 같다고 말한다. 임의의 고정된 n 값에 대해, 이러한 항등식은 지루하지만 간단한 대수적 조작으로 얻을 수 있다. 그러나 이러한 계산은 케일리-해밀턴 정리가 모든 가능한 크기 n의 행렬에 대해 유효해야 하는 이유를 보여줄 수 없으므로, 모든 n에 대한 균일한 증명이 필요하다.

4. 예

1×1 행렬 의 경우, 특성 다항식은 로 주어지며, 따라서 은 자명하다.

구체적인 예시로,
A = \begin{pmatrix}1&2\\3&4\end{pmatrix}
라고 하자. 이것의 특성 다항식은 다음과 같다.

\begin{align}
p(\lambda) &= \det(\lambda I_2-A) = \det\!\begin{pmatrix}\lambda-1&-2\\-3&\lambda-4\end{pmatrix} \\
&=(\lambda-1)(\lambda-4)-(-2)(-3)=\lambda^2-5\lambda-2.
\end{align}


케일리-해밀턴 정리는
p(A) = A^2-5A-2I_2 = \begin{pmatrix}0&0\\0&0\\\end{pmatrix}
가 성립한다고 주장한다. 이는 실제로 계산을 통해 확인할 수 있다.

일반적인 2×2 행렬
A=\begin{pmatrix}a&b\\c&d\\\end{pmatrix}
의 경우, 특성 다항식은 로 주어지므로, 케일리-해밀턴 정리는 다음과 같다.
p(A) = A^2-(a+d)A+(ad-bc)I_2 = \begin{pmatrix}0&0\\0&0\end{pmatrix};
이는 의 성분을 계산하면 명백해진다.

4.1. 행렬의 거듭제곱

케일리-해밀턴 정리를 이용하면 행렬의 거듭제곱을 더 낮은 차수의 행렬 다항식으로 나타낼 수 있다.

예를 들어, 행렬 A = \begin{pmatrix}1&2\\3&4\end{pmatrix}를 생각해보자. 이 행렬의 특성 다항식은 p(\lambda) = \lambda^2 - 5\lambda - 2이다. 케일리-해밀턴 정리에 따르면, A^2 - 5A - 2I_2 = 0이 성립한다. 여기서 I_22차 단위행렬이다.

이 식을 변형하면 A^2 = 5A + 2I_2를 얻는다. 이를 이용하여 A^3을 계산하면 다음과 같다.

:A^3 = (5A + 2I_2)A = 5A^2 + 2A = 5(5A + 2I_2) + 2A = 27A + 10I_2

마찬가지로, A^4는 다음과 같이 계산된다.

:A^4 = A^3A = (27A + 10I_2)A = 27A^2 + 10A = 27(5A + 2I_2) + 10A = 145A + 54I_2

이처럼 케일리-해밀턴 정리를 이용하면, 높은 차수의 행렬 거듭제곱을 낮은 차수의 행렬 다항식으로 표현하여 계산할 수 있다. 일반적으로, 크기가 n인 정사각 행렬의 k차 거듭제곱은 최대 n-1차 행렬 다항식으로 표현 가능하다.

4.2. 역행렬

Cayley–Hamilton theorem영어를 이용하면 역행렬을 계산할 수 있다. 특히, 2 × 2 및 3 × 3 행렬의 역행렬을 구하는 공식을 유도할 수 있다.

예를 들어 행렬 A가 다음과 같다고 하자.

:A = \begin{pmatrix}1&2\\3&4\end{pmatrix}.

이 행렬의 특성 다항식은 다음과 같다.

:p(\lambda) = \lambda^2-5\lambda-2.

케일리-해밀턴 정리에 의해 다음이 성립한다.

:p(A) = A^2-5A-2I_2 = \begin{pmatrix}0&0\\0&0\\\end{pmatrix}.

이 식을 변형하면 A의 역행렬을 얻을 수 있다.

:A^{-1}=\frac{A-5I_2}{2}~.

다른 예로, 행렬 A가 다음과 같다고 하자.

:A =
\begin{bmatrix}
1 & 2 & 1 \\
2 & 1 & 3 \\
3 & 2 & 3 \\
\end{bmatrix}

이 경우, 케일리-해밀턴 정리를 적용하여 정리하면 A의 역행렬을 얻을 수 있다.

:A^{-1}=\frac{A^2-5A-6I_3}{4}~.

4.3. 행렬 함수

Cayley–Hamilton theorem영어를 이용하면 행렬 함수를 다항식으로 귀착시킬 수 있다.

해석 함수
:f(x) = \sum_{k=0}^\infty a_k x^k
와 행렬 의 차수 의 특성 다항식 가 주어지면, 이 함수는 다음과 같이 나눗셈을 사용하여 표현할 수 있다.
:f(x) = q(x) p(x) + r(x),
여기서 는 어떤 몫 다항식이고 는 인 나머지 다항식이다.

케일리-해밀턴 정리에 의해, 를 행렬 로 대체하면 이 되므로 다음을 얻는다.
:f(A) = r(A).

따라서 행렬 의 해석 함수는 차수가 보다 작은 행렬 다항식으로 표현할 수 있다.

나머지 다항식을 다음과 같이 나타낸다.
:r(x) = c_0 + c_1 x + \cdots + c_{n-1} x^{n-1}.
이므로, 의 개의 고유값을 함수 에 대입하면 다음을 얻는다.
: f(\lambda_i) = r(\lambda_i) = c_0 + c_1 \lambda_i + \cdots + c_{n-1} \lambda_i^{n-1}, \qquad \text{for } i=1,2,...,n.
이것은 개의 선형 방정식 시스템으로, 계수 를 결정하기 위해 풀 수 있다. 따라서 다음을 얻는다.
:f(A) = \sum_{k=0}^{n-1} c_k A^k.

고유값이 반복되는 경우, 즉 for some , 두 개 이상의 방정식이 동일하므로 선형 방정식을 고유하게 풀 수 없다. 이러한 경우, 중복도 인 고유값에 대해, 의 처음 개의 도함수가 해당 고유값에서 0이 된다. 이로 인해 추가 개의 선형 독립적인 해가 생성된다.
:\left.\frac{\mathrm{d}^k f(x)}{\mathrm{d}x^k}\right|_{x=\lambda} = \left.\frac{\mathrm{d}^k r(x)}{\mathrm{d}x^k}\right|_{x=\lambda}\qquad \text{for } k = 1, 2, \ldots, m-1,
이는 다른 해와 결합되어 를 풀기 위한 필요한 개의 방정식을 생성한다.

점 를 지나는 다항식을 구하는 것은 본질적으로 보간법 문제이며, 라그랑주 또는 뉴턴 보간법 기법을 사용하여 풀 수 있으며, 실베스터 공식으로 이어진다.

;예시 1
:예를 들어, 다음과 같은 다항식 표현을 찾아야 한다고 가정해 보자.
:f(A) = e^{At} \qquad \mathrm{where} \qquad A = \begin{pmatrix}1&2\\0&3\end{pmatrix}.

:특성 다항식은 이고, 고유값은 이다. 라고 하자. 고유값에서 를 평가하면 두 개의 선형 방정식, 및 을 얻는다.

:이 방정식을 풀면 및 이 된다. 따라서 다음이 성립한다.
:e^{At} = c_0 I_2 + c_1 A = \begin{pmatrix}c_0 + c_1 & 2 c_1\\ 0 & c_0 + 3 c_1\end{pmatrix} = \begin{pmatrix}e^{t} & e^{3t} - e^{t} \\ 0 & e^{3t}\end{pmatrix}.

:만약, 그 대신, 함수가 였다면, 계수는 및 가 되었을 것이므로
:\sin(At) = c_0 I_2 + c_1 A = \begin{pmatrix}\sin t & \sin 3t - \sin t \\ 0 & \sin 3t\end{pmatrix}.
:로 구해진다.

;예시 2
:마찬가지로,
:f(A) = e^{At} \qquad(A = \begin{pmatrix}
0 &1 \\
-1 &0
\end{pmatrix})
:을 생각한다. 의 고유 다항식은 , 고유값은 이다. 앞과 마찬가지로, 고유값에 관한 연립 방정식
::,
::
:을 풀어서,
::
:을 얻는다. 이 경우의
:e^{At} = (\cos t)I_2 + (\sin t)A = \begin{pmatrix}
\cos t &\sin t \\
-\sin t &\cos t
\end{pmatrix}
:는 회전 행렬이다.

이러한 이용법의 표준적인 예는 에 부속하는 리 대수로부터의 지수 사상이다. 이것은 행렬 지수 함수 \exp\colon \mathfrak g \to G;
:tX \mapsto e^{tX} = \textstyle\sum\limits_{n=0}^\infty \dfrac{t^nX^n}{n!} = I + tX + \dfrac{t^2X^2}{2} + \cdots \qquad(t \in \mathbb{R}, X \in \mathfrak{g})
로 주어진다. 그 다항식 표현은 에 대해서는 오래전부터 알려져 있으며, 파울리 행렬 를 사용하여
:e^{i(\theta/2)(\hat n \cdot \sigma)} = I_2 \cos \theta/2 + i(\hat n \cdot \sigma) \sin \theta/2
로 쓸 수 있다. 도 마찬가지로
:e^{i\theta(\hat n \cdot \mathbf J)} = I_3 + i(\hat n \cdot \mathbf J) \sin \theta + (\hat n \cdot \mathbf J)^2 (\cos \theta - 1)
로 쓸 수 있다(이것은 로드리게스 회전 공식이다). 표기법에 대해서는 을 참조하라.

나중에는 다른 군에 대한 표현도 알려져 있으며, 예를 들어 로렌츠 군 , , , 등. 여기서 는 시공간의 이며 는 그 단일 연결 피복(더 정확하게는, 의 연결 성분 의 단일 연결 피복)이다. 얻어진 다항식 표현은 이러한 군의 표준 표현(standard representation)에 적용된다. 행렬의 거듭제곱을 계산하기 위해 고유값에 대한 어느 정도의 지식이 필요하다. 의(그리고 의) 닫힌 공식은 최근 모든 기약 표현(예: 임의의 )에 대해 얻어졌다.

5. 응용

케일리-해밀턴 정리는 다양한 분야에 응용된다.

* 행렬식 및 역행렬 계산: 행렬식과 역행렬 계산에 활용된다. 벨 다항식을 이용해 특성 다항식의 계수를 구하고, 이를 통해 행렬식과 역행렬 계산 공식을 유도할 수 있다.
* 고차 거듭제곱 계산: 행렬의 고차 거듭제곱을 낮은 차수의 행렬 다항식으로 표현할 수 있다. 예를 들어 행렬 A = {{lang에 대해, 케일리-해밀턴 정리를 적용하면 A2 = 5A + 2I2 로 나타낼 수 있다. 이를 반복하면 임의의 고차 거듭제곱을 최대 n-1차(n은 행렬의 크기) 행렬 다항식으로 표현할 수 있다.
* 대수적 수론: 대수적 정수의 최소 다항식 계산에 사용된다.

5.1. 행렬식 및 역행렬 계산

케일리-해밀턴 정리를 이용하면 행렬식과 역행렬을 계산할 수 있다. 벨 다항식을 이용하여 특성 다항식의 계수를 계산하고, 이를 통해 행렬식과 역행렬을 계산하는 공식을 유도할 수 있다.

n차 정방 행렬의 특성 다항식은 다음과 같다.
:p(t)=t^n+c_{n-1}t^{n-1}+\dots+c_1t+c_0

여기서 n-i차 계수 cn-i는 A의 고유값들이 이루는 i차 기본 대칭식과 같다. 특히 상수항 (0차 계수) c0는 고유값의 총곱이므로, 이는 A의 행렬식 det A와 같다.

뉴턴 항등식을 사용하면 기본 대칭식은 멱합 대칭식으로 나타낼 수 있으므로, cn-i는 고유값의 멱합 대칭식 s_k = \textstyle\sum\limits_{i=1}^n {\lambda_i}^k로 나타낼 수 있으며, 다음과 같다.
:s_k = \textstyle\sum\limits_{i=1}^n {\lambda_i}^k = \operatorname{tr} A^k
따라서, cn-i는 Ak트레이스로 나타낼 수 있다. 특히 c_{n-1} = \operatorname{tr}A이다.

케일리-해밀턴 정리에 의해, 일반적인 n차 정칙행렬 A (즉, A의 행렬식은 0이 아니다)에 대해, 그 역행렬 A-1은 A의 n-1차 이하의 행렬 다항식으로 나타낼 수 있다. 실제로, 다음 식에서

:p(A)=A^n+c_{n-1}A^{n-1}+\cdots+c_1A+(-1)^n\det(A)I_n =O

상수항을 이항하면
:-(-1)^n \det(A) I_n = A(A^{n-1}+c_{n-1}A^{n-2}+\cdots+c_1I_n)
양변에 A-1를 곱하면
:A^{-1} = \frac{(-1)^{n-1}}{\det A} (A^{n-1}+c_{n-1}A^{n-2}+\cdots+c_1I_n)
을 얻는다.

일반적으로, 계수 ci를 주는 공식은 완전 지수형 벨 다항식에 의해 다음과 같이 주어진다.
:c_{n-k} = \frac{(-1)^k}{k!} B_k(s_1, -1! s_2, 2! s_3, \cdots, (-1)^{k-1}(k-1)! s_k)

특히 A의 행렬식은 c0이므로, 트레이스를 포함하는 표현(트레이스 항등식)으로 다음과 같이 쓸 수 있다.
:\det(A) = \frac{1}{n!} B_n(s_1, -1! s_2, 2! s_3, \cdots, (-1)^{n-1}(n-1)! s_n)

마찬가지로, 다음과 같은 표현도 가능하다.
:A^{-1} = \frac{1}{\det A} \textstyle\sum\limits_{k=0}^{n-1} (-1)^{n+k-1} \dfrac{A^{n-k-1}}{k!} B_k(s_1, -1! s_2, 2! s_3, \cdots, (-1)^{k-1}(k-1)! s_k)

벨 다항식의 처음 부분은 B0 = 1, B1(x1) = x1, B2(x1, x2) = x12 + x2, ... 이므로, 이것들을 이용하여 2차의 경우 고유 다항식의 계수 ci를 구체적으로 계산하면 다음과 같다.

:\begin{align}
&c_2 = B_0 = 1,\quad c_1 = \frac{-1}{1!} B_1(s_1) = - s_1 = - \operatorname{tr}(A) \\
&c_0 = \frac{1}{2!} B_2(s_1, -1! s_2) = \frac{1}{2}(s_1^2 - s_2) = \frac{1}{2}((\operatorname{tr}(A))^2 - \operatorname{tr}(A^2))
\end{align}

c0은 행렬식이므로, 이 경우 역행렬은 다음과 같이 계산할 수 있다.
:A^{-1} = \frac{-1}{\det A}(A + c_1 I_2) = \frac{-2(A - \operatorname{tr}(A) I_2)}{(\operatorname{tr}(A))^2 - \operatorname{tr}(A^2)}

3차 정방 행렬 A에 대한 케일리-해밀턴 정리의 주장은 다음과 같이 쓸 수 있다.
:A^3- (\operatorname{tr}A)A^2+\frac{1}{2}((\operatorname{tr}A)^2-\operatorname{tr}(A^2))A-\det(A)I_3=O

마찬가지로 n = 3인 경우 행렬식은 다음과 같이 쓸 수 있다.
:\begin{align}
\det(A) &= \frac{1}{3!} B_3(s_1, -1! s_2, 2! s_3) = \frac{1}{6}(s_1^3 + 3 s_1 (-s_2) + 2 s_3) \\
&= \tfrac{1}{6}((\operatorname{tr}A)^3-3\operatorname{tr}(A^2)(\operatorname{tr}A)+2\operatorname{tr}(A^3))
\end{align}

4차 정방 행렬 A에 대한 정리의 주장은 다음과 같이 쓸 수 있다.
:A^4-(\operatorname{tr}A)A^3 + \tfrac{1}{2}\bigl((\operatorname{tr}A)^2-\operatorname{tr}(A^2)\bigr)A^2 - \tfrac{1}{6}\bigl( (\operatorname{tr}A)^3-3\operatorname{tr}(A^2)(\operatorname{tr}A)+2\operatorname{tr}(A^3)\bigr)A + \det(A)I_4 = O

이 경우 행렬식은 다음과 같다.
:\tfrac{1}{24}((\operatorname{tr}A)^4-6 \operatorname{tr}(A^2)(\operatorname{tr}A)^2+3(\operatorname{tr}(A^2))^2+8\operatorname{tr}(A^3)\operatorname{tr}(A) -6\operatorname{tr}(A^4))

계수 ck에 대한 더 복잡한 표현은, 뉴턴 항등식이나 파데예프-르베리에 알고리즘 등에서 유도할 수 있다.

5.2. 고차 거듭제곱 계산

Cayley–Hamilton theorem영어에 따르면, 행렬의 고차 거듭제곱은 낮은 차수의 행렬 다항식으로 표현할 수 있다.

예를 들어, 행렬 A가 다음과 같이 주어졌다고 하자.

:A = \begin{bmatrix}1&2\\3&4\end{bmatrix}

이 행렬의 특성 다항식은 다음과 같다.

:p(\lambda)=\begin{vmatrix}\lambda-1&-2\\-3&\lambda-4\end{vmatrix}=(\lambda-1)(\lambda-4)-2\cdot3=\lambda^2-5\lambda-2

케일리-해밀턴 정리에 따르면 다음 식이 성립한다.

:A^2-5A-2I_2=0 (여기서 I_2단위행렬이다.)

이를 정리하면 다음과 같다.

:A^2=5A+2I_2

이 식을 이용하여 A4을 계산할 수 있다.

:A^3=(5A+2I_2)A=5A^2+2A=5(5A+2I_2)+2A=27A+10I_2

:A^4=A^3A=(27A+10I_2)A=27A^2+10A=27(5A+2I_2)+10A=145A+54I_2

이처럼 케일리-해밀턴 정리를 이용하면, 행렬의 고차 거듭제곱을 낮은 차수의 다항식으로 나타낼 수 있다. 일반적으로, 크기가 n인 정사각 행렬의 경우, 임의의 차수 k의 행렬 거듭제곱은 최대 n-1차 행렬 다항식으로 표현 가능하다.

5.3. 대수적 수론

대수적 정수의 최소 다항식을 계산하는 데 케일리-해밀턴 정리가 사용될 수 있다. 예를 들어, \mathbb{Q}의 유한 차수 확대 \mathbb{Q}[\alpha_1,\ldots,\alpha_k]와 그 원소인 대수적 정수 \alpha (이는 첨가된 원소의 멱곱 \alpha_1^{n_1}\cdots\alpha_k^{n_k}\mathbb{Q}-선형 결합으로 쓸 수 있다)가 주어졌을 때, \alpha를 곱하는 \mathbb{Q}-선형 변환
:\cdot \alpha \colon \mathbb{Q}[\alpha_1,\cdots,\alpha_k] \to \mathbb{Q}[\alpha_1,\cdots,\alpha_k]
의 표현 행렬을 A로 쓰면, A에 케일리-해밀턴 정리를 적용하여 \alpha의 최소 다항식을 구할 수 있다.

6. 일반화

케일리-해밀턴 정리는 임의의 가환환의 원소를 갖는 행렬에 대해 성립하며, $e_1, ..., e_n$의 원소에 의해 생성된 $R$-가군 $\varphi$가 다음을 만족할 때마다 $p(\varphi) = 0$이 성립함을 보여준다.

\varphi(e_j)=\sum a_{ij}e_i, \qquad j =1, \ldots, n.

이 정리의 더 일반적인 버전은 가환대수학대수기하학의 유명한 나카야마 보조정리의 근원이다.

케일리-해밀턴 정리는 비가환환인 사원수에 대한 행렬에서도 성립한다.

7. "단락적인 증명"의 오류에 관한 주의

케일리-해밀턴 정리를 증명할 때, 고유 다항식
: p(\lambda) = \det(\lambda I_n - A)
\lambdaA로 치환하여
: p(A)=\det(A I_n - A) = \det(A-A)=0
을 얻는 것은 잘못된 논법이다.

이 논법이 잘못된 이유는 다음과 같다.

* 위 식의 좌변은 n차 정사각행렬이고, 우변은 스칼라 0이므로 (n=1이 아닌 한) 모순이다.
* 위 식의 우변의 \lambda는 스칼라여야 행렬식으로서 의미를 가지는데, 행렬식 전개 전에 \lambdaA로 치환하면 의미가 없어진다.

2차 정사각 행렬의 경우를 예로 들면,
: p(\lambda) = \begin{vmatrix}
\lambda-a &-b \\
-c &\lambda-d
\end{vmatrix}
\lambdaA=\begin{pmatrix}
a &b \\
c &d
\end{pmatrix} 로 치환하면 행렬식으로서의 의미가 없어진다는 것을 알 수 있다.

하지만, 스칼라인 부분을 스칼라 행렬(단위 행렬의 스칼라 배)로 치환한 블록 행렬
: \begin{pmatrix} \begin{pmatrix}
a &b \\
c &d
\end{pmatrix} - aI_2 &-bI_2 \\
-cI_2 &\begin{pmatrix}
a &b \\
c &d
\end{pmatrix} - dI_2
\end{pmatrix}=\left(\begin{array}{cc|cc}
0 &b &-b &0 \\
c &d-a &0 &-b \\\hline
-c &0 &a-d &b \\
0 &-c &c &0
\end{array}\right)
를 고려하면 유효한 식이 되며, 이 행렬식은 실제로 0이 된다. 그러나 이 행렬은 위에서 \det의 인수로 삼은 AI_n - A가 아니다.

이 논법이 다른 다중 선형 형식에는 적용될 수 없음을 퍼머넌트를 이용해 보일 수 있다. perm(\lambda I_n - A)라고 하면, 같은 논법으로 perm(A I_n - A) = 0 이 증명되어야 하지만, 이는 오류이다. 2차 정사각 행렬의 경우, \operatorname{perm} \begin{pmatrix}
a &b \\
c &d
\end{pmatrix} = ad + bc이므로, q(\lambda) = \operatorname{perm} (\lambda I_2 - A) = \lambda^2 - (a+d)\lambda + (ad+bc)이며, 여기에 A를 대입하면
: q(A)=A^2-(a+d)A+(ad+bc)I_2=\begin{pmatrix}
2bc &0 \\
0 &2bc
\end{pmatrix}는 일반적으로 영행렬이 아니다.