케일리-해밀턴 정리

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

케일리-해밀턴 정리는 가환환 K 위의 n × n 정사각 행렬 M의 특성 다항식을 p(x) = det(x - M) = ∑k=0n pk xk ∈ K[x]로 정의할 때, p(M) = ∑k=0n pk Mk = 0이 성립한다는 정리이다. 이 정리는 행렬의 거듭제곱을 낮은 차수의 행렬 다항식으로 표현하고, 역행렬을 계산하는 데 활용되며, 대수적 정수의 최소 다항식을 구하는 데도 사용된다. 케일리-해밀턴 정리는 다양한 증명 방법을 통해 증명될 수 있으며, 임의의 가환환의 원소를 갖는 행렬에 대해 성립한다. 또한, 자기 사상 환 위의 행렬을 이용하여 일반화된 형태로 이해할 수 있으며, 나카야마 보조정리의 근원이 된다.

케일리-해밀턴 정리

개요

종류	선형대수학
분야	수학
설명	모든 가환환 위의 정사각행렬은 자신의 특성 방정식을 만족한다.

역사

이름의 유래	아서 케일리와 윌리엄 로언 해밀턴의 이름에서 유래

내용

내용	n × n 행렬 A에 대해, λ를 변수로 하는 특성 다항식 det(λI_n − A)을 p(λ)라고 하면, p(A) = 0이다.

예시

2 × 2 행렬	A = https://upload.wikimedia.org/wikipedia/commons/thumb/0/0a/Cayley-Hamilton_theorem_2x2_example.svg/300px-Cayley-Hamilton_theorem_2x2_example.svg.png
3 × 3 행렬	A = https://upload.wikimedia.org/wikipedia/commons/thumb/c/c6/Cayley-Hamilton_theorem_3x3_example.svg/300px-Cayley-Hamilton_theorem_3x3_example.png

📚 더 읽어볼만한 페이지

선형대수학 정리 - 스펙트럼 정리
스펙트럼 정리는 에르미트 행렬, 정규 행렬, 자기 수반 연산자 등의 고유 벡터와 고유값의 존재를 다루며, 행렬 대각화 및 힐베르트 공간 작용소 분석에 활용되고 함수 미적분학 정의에도 기여한다.
선형대수학 정리 - 페론-프로베니우스 정리
윌리엄 로언 해밀턴 - 해밀토니언 (양자역학)
양자역학에서 해밀토니언은 계의 총 에너지를 나타내는 연산자로서, 고전역학의 해밀토니안에서 유래하며 슈뢰딩거 방정식을 통해 계의 시간적 진화를 결정하고, 그 고유값은 허용된 에너지 준위를 나타낸다.
윌리엄 로언 해밀턴 - 해밀턴의 원리
해밀턴의 원리는 일반화 좌표계에서 계의 변화가 작용 범함수의 극값을 가지며, 라그랑지안을 시간으로 적분한 작용을 통해 기술되고, 오일러-라그랑주 방정식과의 동등성을 가지며 다양한 물리적 현상 기술에 적용된다.
행렬론 - 행렬식
행렬식은 정사각 행렬에 대해 정의되는 값으로, 선형 방정식의 해를 구하고 선형 독립성을 확인하며 기저의 방향과 부피를 계산하는 데 사용되며, 가우스 소거법 등의 계산 기법과 가역성 판단, 고유값 연관성 등의 성질을 갖는다.
행렬론 - 행렬 분해
행렬 분해는 주어진 행렬을 특정 성질을 갖는 여러 행렬의 곱으로 표현하는 방법으로, 수치 해석에서 행렬 알고리즘 구현 및 선형 연립 방정식 해를 구하거나 행렬 특성 분석에 활용되며 LU 분해, QR 분해, 특잇값 분해 등이 있다.

2. 정의

가환환 $K$ 위의 $n\times n$ 정사각 행렬 $M\in\operatorname{Mat}(n;K)$ 의 특성 다항식은 다음과 같다.

: $p(x)=\det(x-M)=\sum_{k=0}^np_kx^k\in K[x]$

여기서 $\det$ 는 행렬식이다. 케일리-해밀턴 정리에 따르면, 다음이 성립한다.

: $p(M)=\sum_{k=0}^np_kM^k=0$

특히, $K$ 가 체일 경우 $M$ 의 최소 다항식은 특성 다항식의 약수이다.

3. 증명

케일리-해밀턴 정리는 다양한 방법으로 증명할 수 있다. 여러 증명 방법이 존재하며, 이들은 사용하는 수학적 개념과 접근 방식에 따라 다음과 같이 분류할 수 있다.

* 행렬식을 이용한 증명: 고전적 수반 행렬을 사용하여 증명한다.
* 삼각화를 이용한 증명: 행렬을 상삼각 행렬로 변환하여 증명한다.
* 단인자를 이용한 증명: 단자(單因子) 이론을 사용하여 증명한다.
* 여인자 행렬을 이용한 증명: 여인자 행렬을 사용하여 증명한다.
* 행렬 계수 다항식을 이용한 증명: 행렬을 계수로 갖는 다항식을 사용하여 증명한다.
* 두 증명 (행렬식, 행렬 계수 다항식)의 절충: 행렬식을 이용한 증명과 행렬 계수 다항식을 이용한 증명을 결합하여 증명한다.
* 자기 사상 환 위의 행렬을 이용한 증명: 자기 사상 환 위의 행렬을 사용하여 증명하며, 나카야마 보조정리와 관련이 있다.
* 추상대수학적 방법을 이용한 증명: 하세-슈미트 미분의 성질이나 외대수를 이용하는 추상대수학적 방법으로 증명한다.
* 조합론적 증명: 라이프니츠 공식을 이용하거나, 트레이스 모노이드 이론을 사용하여 증명한다.

각 증명 방법에 대한 자세한 내용은 하위 섹션에서 확인할 수 있다.

3.1. 행렬식을 통한 증명

가환환 $K[M]=\{q(M)\colon q\in K[x]\}\subseteq\operatorname{Mat}(n;K)$ 위의 $n\times n$ 행렬 $N\in\operatorname{Mat}(n;K[M])$ 을 다음과 같이 정의한다.

: $N_{ij}=\delta_{ij}M-M_{ij}\in K[M]$

여기서 $\delta_{ij}$ 는 크로네커 델타이다.

열벡터 공간 $K^n$ 의 표준 기저를 $\{e_1,\dots,e_n\}$ 라고 하고, $N$ 의 고전적 수반 행렬을 $\operatorname{adj}N$ 라고 하면, 다음이 성립한다.

: $\sum_{j=1}^nN_{ij}e_j=0$
: $((\operatorname{adj}N)N)_{kj}=\delta_{kj}\det N$
: $\det N=p(M)$

따라서 임의의 $k\in\{1,\dots,n\}$ 에 대하여, 다음이 성립한다.

: $\begin{align}0&=\sum_{i=1}^n\sum_{j=1}^n(\operatorname{adj}N)_{ki}N_{ij}e_j\\&=\sum_{j=1}^n\sum_{i=1}^n(\operatorname{adj}N)_{ki}N_{ij}e_j\\&=\sum_{j=1}^n((\operatorname{adj}N)N)_{kj}e_j\\&=\sum_{j=1}^n\delta_{kj}(\det N)e_j\\&=(\det N)e_k\\&=p(M)e_k\end{align}$

즉, $p(M)=0$ 이다.

3.2. 삼각화를 통한 증명

K^영어가 정역일 경우, 행렬의 삼각화를 이용하여 증명할 수 있다. 먼저, 상삼각 행렬의 경우에 대해 증명하고, 일반적인 행렬은 삼각화 가능 행렬임을 이용하여 증명한다.

A의 고유 다항식을 $p_A (t) = \det(t I_n - A)$ , 고유값을 $\lambda_1, \cdots, \lambda_n$ 이라고 하면, 다음과 같다.
: $p_A (t)=(t- \lambda_1 ) \cdots (t- \lambda_n )$

A를 상삼각화한 행렬을 B라고 하면, 이때 대각 성분에 고유값 $\lambda_1, \cdots, \lambda_n$ 이 나열된다.
: $B:= P^{-1}AP = \begin{pmatrix}\lambda_1 & & &* & \\& \lambda_2 & & & \\& &\lambda_3 & & \\& & &\ddots & \\& & & &\lambda_n\end{pmatrix}$

: $\begin{align} p_A (A)&= (A- \lambda_1 I) \cdots (A- \lambda_n I) \\&= (PBP^{-1}- \lambda_1 I) \cdots (PBP^{-1}- \lambda_n I) \\&= P\{(B- \lambda_1 I) \cdots (B- \lambda_n I)\}P^{-1} \ \cdots \ (1) \\\end{align}$
여기서 $p_B (B)=(B- \lambda_1 I) \cdots (B- \lambda_n I)$ 를 계산한다.

$C_k :=B- \lambda_k I\ (k=1,2, \cdots ,n)$ 라고 두면, $C_k$ 는 상삼각행렬이고, $(k, k)$ 성분은 0이다.

$C_1 C_2$ 를 계산하면 다음과 같다.
: $\left(\begin{array}{c|c|cc}0 &* &\cdots &* \\\hline&* &\cdots &* \\\hline& &\ddots &\vdots \\& & &*\end{array}\right) \left(\begin{array}{c|c|cc}* &* &\cdots &* \\\hline&0 &\cdots &* \\\hline& &\ddots &\vdots \\& & &*\end{array}\right)=\left(\begin{array}{c|c|cc}0 &0 &\cdots &* \\\hline&0 &\cdots &* \\\hline& &\ddots &\vdots \\& & &*\end{array}\right)$
따라서, 제2열까지는 성분이 모두 0이 된다. 마찬가지로, 귀납적으로, $C_k$ 를 곱하면, 제k열까지의 성분은 모두 0이 된다. 이를 n번째까지 반복하면 다음과 같다.
: $C_1 \cdots C_n =O$
따라서 (1)은
: $P(C_1 \cdots C_n)P^{-1}=O$ 이다. (증명 끝)

3.3. 단인자를 통한 증명

단자(單因子) 이론을 사용하면 쉽게 유도할 수 있다. 단, 단자 표준형의 존재 및 유일성을 증명하려면 상당한 과정이 필요하다.

문헌에 게재된 방법에 따른다.

의 단자 표준형은 $\deg \det(xI-A)=n$ 이므로, 다음과 같은 형태가 된다.

: $P(x)(xI-A)Q(x)=\begin{pmatrix}e_1(x) & & \\&\ddots & \\& &e_n(x) \\\end{pmatrix}$

여기서 는 모닉 다항식이고, 이다. 즉, 는 로 나누어 떨어진다.

단자 이론에서 알려진 결과에 따르면, 마지막 단자 는 의 최소 다항식 와 같다.

: $\begin{align}p_A(x) &=\det(xI-A) \\&=\det P(x)^{-1} \sdot (e_1(x) \cdots e_{n-1}(x) \phi_A(x)) \sdot \det Q(x)^{-1}\end{align}$

따라서 고유 다항식 는 최소 다항식 로 나누어 떨어진다는 것을 알 수 있다. 그러므로 이다. (증명 종료)

3.4. 여인자 행렬을 통한 증명

여인자 행렬(수반 행렬)을 이용하여 케일리-해밀턴 정리를 증명할 수 있다. 이를 위해 다항식을 원소로 갖는 행렬을 사용한다.

행렬 $tI_n - A$ 는 특성 다항식이 $p(t)$ 이고, 다항식은 가환환을 형성하므로, 여인자 행렬 $B = \operatorname{adj}(tI_n-A)$ 를 갖는다.

수반 행렬의 기본 관계에 따라 다음이 성립한다.

: $(t I_n - A)B = \det(t I_n - A) I_n = p(t) I_n.$

$B$ 는 $t$ 에 대한 다항식을 원소로 갖는 행렬이므로, 각 $i$ 에 대해 $t^i$ 의 계수를 모아 행렬 $B_i$ 를 구성할 수 있다.

: $B = \sum_{i = 0}^{n - 1} t^i B_i.$

( $B$ 의 원소 정의에 따라 $t^{n-1}$ 보다 높은 거듭제곱은 나타나지 않는다.)

이제 양변을 전개하면 다음과 같다.

: $\begin{align}p(t) I_n &= (t I_n - A)B \\&=(t I_n - A)\sum_{i = 0}^{n - 1} t^i B_i \\&=\sum_{i = 0}^{n - 1} tI_n\cdot t^i B_i - \sum_{i = 0}^{n - 1} A\cdot t^i B_i \\&=\sum_{i = 0}^{n - 1} t^{i + 1} B_i- \sum_{i = 0}^{n - 1} t^i AB_i \\&=t^n B_{n - 1} + \sum_{i = 1}^{n - 1} t^i(B_{i - 1} - AB_i) - AB_0.\end{align}$

$p(t)I_n=t^nI_n+t^{n-1}c_{n-1}I_n+\cdots+tc_1I_n+c_0I_n$ 와 같이 전개하여, $t$ 의 각 거듭제곱의 계수가 같아야 한다는 사실로부터 다음 연립방정식을 얻는다.

: $B_{n - 1} = I_n, \qquad B_{i - 1} - AB_i = c_i I_n\quad \text{for }1 \leq i \leq n-1, \qquad -A B_0 = c_0 I_n.$

각 방정식에 $A^i$ 를 곱하고 모두 더하면 좌변은 소거합이 되어 0이 되고, 우변은 $p(A)$ 가 된다.

: $0 = p(A).$

따라서 케일리-해밀턴 정리가 증명된다.

3.5. 행렬 계수 다항식을 이용한 증명

케일리-해밀턴 정리는 대수적으로 닫힌 체에 대한 행렬의 조르당 정규형 존재의 직접적인 결과이다. 이 섹션에서는 행렬 계수를 갖는 다항식을 이용하여 직접 증명하는 방법을 제시한다.

행렬에 대한 케일리-해밀턴 정리의 명제를 얻으려면 다음과 같은 두 단계가 필요하다.

먼저 특성 다항식의 계수 는 행렬식의 에 관한 다항식 전개에 의해 결정된다.

: $A = \left(a_{ij}\right)_{i,j=1}^n$

: $\begin{align}p(t) & = \det(t I_n - A) =\begin{vmatrix}t-a_{1,1}&-a_{1,2}&\cdots&-a_{1,n} \\-a_{2,1}&t-a_{2,2}&\cdots&-a_{2,n} \\\vdots & \vdots & \ddots & \vdots \\-a_{n,1}&-a_{n,2}& \cdots& t-a_{n,n} \end{vmatrix} \\[5pt]& = t^n+c_{n-1}t^{n-1}+\cdots+c_1t+c_0,\end{align}$

그런 다음 이러한 계수는 의 거듭제곱의 선형 결합에 사용되며, 이는 영행렬과 같다.

: $A^n+c_{n-1}A^{n-1} + \cdots + c_1 A + c_0 I_n = \begin{pmatrix} 0 & \cdots & 0 \\ \vdots & \ddots & \vdots \\ 0 & \cdots & 0 \end{pmatrix}.$

좌변은 의 성분 의 집합에서 (엄청난) 다항식 표현인 엔트리를 갖는 행렬로 계산될 수 있으므로, 케일리-해밀턴 정리는 이러한 표현 각각이 과 같다고 말한다. 임의의 고정된 값에 대해, 이러한 항등식은 지루하지만 간단한 대수적 조작으로 얻을 수 있다. 그러나 이러한 계산은 케일리-해밀턴 정리가 모든 가능한 크기 의 행렬에 대해 유효해야 하는 이유를 보여줄 수 없으므로, 모든 에 대한 균일한 증명이 필요하다.

3.6. 두 증명 (행렬식, 행렬 계수 다항식)의 절충

Cayley–Hamilton theorem^영어는 행렬식을 통한 증명과 행렬 계수 다항식을 이용한 증명을 결합하여 증명할 수 있다. 유클리드 나눗셈을 이용하여 몫과 나머지를 구하고, 가환 다항식 환 내에서 평가 사상을 적용한다.

이 증명에서는 다항식을 원소로 갖는 행렬을 사용한다. 행렬 는 행렬식의 특성 다항식이 이고, 다항식은 가환환을 형성하므로, 수반 행렬 를 갖는다.

$B=\operatorname{adj}(tI_n-A).$

수반 행렬의 기본 관계에 따라 다음이 성립한다.

$(t I_n - A)B = \det(t I_n - A) I_n = p(t) I_n.$

역시 에 대한 다항식을 원소로 갖는 행렬이므로, 각 에 대해, 각 원소에서 의 계수를 수집하여 숫자의 행렬 를 형성할 수 있으며, 다음을 얻는다.

$B = \sum_{i = 0}^{n - 1} t^i B_i.$

의 원소가 정의되는 방식에 따라 보다 높은 거듭제곱은 발생하지 않는다. 이는 계수가 행렬인 다항식처럼 보이지만, 다항식 원소를 갖는 행렬을 개의 상수 행렬의 선형 결합으로 작성하는 방법일 뿐이며, 계수 는 이러한 관점을 강조하기 위해 행렬의 왼쪽에 쓰여졌다.

양선형성을 통해 방정식의 행렬 곱을 전개하면 다음과 같다.

$\begin{align}p(t) I_n &= (t I_n - A)B \\&=(t I_n - A)\sum_{i = 0}^{n - 1} t^i B_i \\&=\sum_{i = 0}^{n - 1} tI_n\cdot t^i B_i - \sum_{i = 0}^{n - 1} A\cdot t^i B_i \\&=\sum_{i = 0}^{n - 1} t^{i + 1} B_i- \sum_{i = 0}^{n - 1} t^i AB_i \\&=t^n B_{n - 1} + \sum_{i = 1}^{n - 1} t^i(B_{i - 1} - AB_i) - AB_0.\end{align}$

다음을 전개하면,

$p(t)I_n=t^nI_n+t^{n-1}c_{n-1}I_n+\cdots+tc_1I_n+c_0I_n,$

다항식 원소를 갖는 두 행렬의 등식을 얻고, 상수 행렬의 선형 결합으로 작성한다. 의 거듭제곱을 계수로 사용한다.

두 표현 모두에서 계수가 인 상수 행렬이 같아야 한다. 에서 0까지 에 대해 방정식을 작성하면 다음과 같다.

$B_{n - 1} = I_n, \qquad B_{i - 1} - AB_i = c_i I_n\quad \text{for }1 \leq i \leq n-1, \qquad -A B_0 = c_0 I_n.$

로 의 계수 방정식을 왼쪽에서 곱하고 합산한다.

$A^n B_{n-1} + \sum\limits_{i=1}^{n-1}\left( A^i B_{i-1} - A^{i+1}B_i\right) -A B_0 = A^n+c_{n-1} A^{n-1} + \cdots + c_1A + c_0I_n.$

좌변은 소거합을 형성하고 완전히 상쇄된다. 우변은 $p(A)$ 로 합산된다.

$0 = p(A).$

이것으로 증명이 완료된다.

3.7. 자기 사상 환 위의 행렬을 이용한 증명

자기 사상 환 위의 행렬을 이용한 케일리-해밀턴 정리의 증명은 다음과 같다. 이 증명은 나카야마 보조정리와 관련이 있다.

우선, 행렬의 성분과 자기 사상을 구분해야 한다. 행렬 $A = (a_{ij})_{i,j=1}^n$ 에 대해, $a_{ij}$ 는 스칼라 값으로, $A$ 는 $a_{ij}I_n$ 으로 실현되는 행렬의 링의 원소로 생각할 수 있다. 하지만, 행렬을 원소로 갖는 행렬은 블록 행렬과 혼동될 수 있으며, 블록 행렬에 대한 행렬식 개념은 일반적으로 성립하지 않으므로 주의해야 한다.

따라서, $A$ 를 $n$ -차원 벡터 공간 V (또는 이 체가 아닌 경우 자유 -가군)의 자기 사상 $\varphi$ 와 구분하고, End(V) 위의 행렬을 사용한다. 여기서 End(V)는 V의 모든 자기 사상들의 집합이다.

$\varphi I_n-A$ 의 행렬식( $\det(\varphi I_n - A)$ )은 $R[\varphi]$ 에서 정의할 수 있다. 여기서 $R[\varphi]$ 는 항등원과 $\varphi$ 에 의해 생성된 부분환이다.

이제, $A$ 가 기저 $e_1, \ldots, e_n$ 에서 $\varphi$ 의 행렬이라는 사실로부터 다음 식을 얻는다.

: $\varphi(e_i) = \sum_{j = 1}^n A_{j,i} e_j \quad\text{for }i=1,\ldots,n.$

이를 행렬-벡터 곱을 이용하여 다시 쓰면 다음과 같다.

: $\varphi I_n \cdot E = A^\operatorname{tr}\cdot E,$

여기서 $E\in V^n$ 는 성분 $e_i$ 가 $i$ 인 요소이다. 이를 정리하면,

: $(\varphi I_n-A^\operatorname{tr})\cdot E = 0\in V^n$

이 된다. 여기서 $\varphi I_n-A$ 의 전치 행렬과 그 행렬식( $R[\varphi]$ 의 요소)인 $p(\varphi)$ 를 확인할 수 있다.

이제 $\varphi I_n-A^\operatorname{tr}$ 의 수반 행렬을 왼쪽에 곱하면,

: $\begin{align}0 &= \operatorname{adj}(\varphi I_n-A^\operatorname{tr}) \cdot \left((\varphi I_n-A^\operatorname{tr})\cdot E\right) \\[1ex]&= \left(\operatorname{adj}(\varphi I_n-A^\operatorname{tr}) \cdot (\varphi I_n-A^\operatorname{tr})\right) \cdot E \\[1ex]&= \left(\det(\varphi I_n - A^\operatorname{tr})I_n\right) \cdot E \\[1ex]&= (p(\varphi)I_n)\cdot E\end{align}$

가 성립한다. 이 식의 성분 $i$ 는 $p(\varphi)(e_i) = 0 \in V$ 를 의미하며, $p(\varphi)$ 는 모든 $e_i$ 에서 0이 된다. 따라서, $p(\varphi) = 0 \in End(V)$ 이며, 증명이 완료된다.

이 증명에서 중요한 점은, 특성 다항식이 취해지는 행렬 $A$ 가 해당 다항식에 대입된 값 $\varphi$ 와 같을 필요가 없다는 것이다. 즉, $\varphi$ 가

: $\varphi(e_i) = \sum_j A_{j,i} e_j$

를 만족하는 $V$ 의 자기 사상이면 충분하며, $V$ 를 생성하는 일부 요소 시퀀스 $e_1, \ldots, e_n$ 에 대해 성립하면 된다.

3.8. 추상대수학적 방법을 이용한 증명

하세-슈미트 미분의 기본적인 성질을 이용한 증명 방법이 있다. 외대수를 이용하여 증명한다.

3.9. 조합론적 증명

라이프니츠 공식을 특성 다항식에 대해 전개하여 증명하는 방법(스트라우빙)과, 트레이스 모노이드 이론을 사용하여 일반화하는 방법(포아타와 카르티에)이 있다.

$n \times n$ 행렬 $A = \left(a_{ij}\right)_{i,j=1}^n$ 에 대한 케일리-해밀턴 정리의 명제를 얻으려면, 두 단계가 필요하다. 먼저 특성 다항식의 계수 $c_i$ 는 행렬식의 $t$ 에 관한 다항식 전개에 의해 결정된다.

$\begin{align}p(t) & = \det(t I_n - A) =\begin{vmatrix}t-a_{1,1}&-a_{1,2}&\cdots&-a_{1,n} \\-a_{2,1}&t-a_{2,2}&\cdots&-a_{2,n} \\\vdots & \vdots & \ddots & \vdots \\-a_{n,1}&-a_{n,2}& \cdots& t-a_{n,n} \end{vmatrix} \\[5pt]& = t^n+c_{n-1}t^{n-1}+\cdots+c_1t+c_0,\end{align}$

그런 다음 이러한 계수는 $A$ 의 거듭제곱의 선형 결합에 사용되며, 이는 $n \times n$ 영행렬과 같다.

$A^n+c_{n-1}A^{n-1} + \cdots + c_1 A + c_0 I_n = \begin{pmatrix} 0 & \cdots & 0 \\ \vdots & \ddots & \vdots \\ 0 & \cdots & 0 \end{pmatrix}.$

좌변은 $A$ 의 성분 $a_{i,j}$ 의 집합에서 (엄청난) 다항식 표현인 엔트리를 갖는 $n \times n$ 행렬로 계산될 수 있으므로, 케일리-해밀턴 정리는 이러한 $n^2$ 표현 각각이 $0$ 과 같다고 말한다. 임의의 고정된 $n$ 값에 대해, 이러한 항등식은 지루하지만 간단한 대수적 조작으로 얻을 수 있다. 그러나 이러한 계산은 케일리-해밀턴 정리가 모든 가능한 크기 $n$ 의 행렬에 대해 유효해야 하는 이유를 보여줄 수 없으므로, 모든 $n$ 에 대한 균일한 증명이 필요하다.

4. 예

1×1 행렬 의 경우, 특성 다항식은 로 주어지며, 따라서 은 자명하다.

구체적인 예시로,
$A = \begin{pmatrix}1&2\\3&4\end{pmatrix}$
라고 하자. 이것의 특성 다항식은 다음과 같다.
$\begin{align}p(\lambda) &= \det(\lambda I_2-A) = \det\!\begin{pmatrix}\lambda-1&-2\\-3&\lambda-4\end{pmatrix} \\&=(\lambda-1)(\lambda-4)-(-2)(-3)=\lambda^2-5\lambda-2.\end{align}$

케일리-해밀턴 정리는
$p(A) = A^2-5A-2I_2 = \begin{pmatrix}0&0\\0&0\\\end{pmatrix}$
가 성립한다고 주장한다. 이는 실제로 계산을 통해 확인할 수 있다.

일반적인 2×2 행렬
$A=\begin{pmatrix}a&b\\c&d\\\end{pmatrix}$
의 경우, 특성 다항식은 로 주어지므로, 케일리-해밀턴 정리는 다음과 같다.
$p(A) = A^2-(a+d)A+(ad-bc)I_2 = \begin{pmatrix}0&0\\0&0\end{pmatrix};$
이는 의 성분을 계산하면 명백해진다.

4.1. 행렬의 거듭제곱

케일리-해밀턴 정리를 이용하면 행렬의 거듭제곱을 더 낮은 차수의 행렬 다항식으로 나타낼 수 있다.

예를 들어, 행렬 $A = \begin{pmatrix}1&2\\3&4\end{pmatrix}$ 를 생각해보자. 이 행렬의 특성 다항식은 $p(\lambda) = \lambda^2 - 5\lambda - 2$ 이다. 케일리-해밀턴 정리에 따르면, $A^2 - 5A - 2I_2 = 0$ 이 성립한다. 여기서 $I_2$ 는 2차 단위행렬이다.

이 식을 변형하면 $A^2 = 5A + 2I_2$ 를 얻는다. 이를 이용하여 $A^3$ 을 계산하면 다음과 같다.

: $A^3 = (5A + 2I_2)A = 5A^2 + 2A = 5(5A + 2I_2) + 2A = 27A + 10I_2$

마찬가지로, $A^4$ 는 다음과 같이 계산된다.

: $A^4 = A^3A = (27A + 10I_2)A = 27A^2 + 10A = 27(5A + 2I_2) + 10A = 145A + 54I_2$

이처럼 케일리-해밀턴 정리를 이용하면, 높은 차수의 행렬 거듭제곱을 낮은 차수의 행렬 다항식으로 표현하여 계산할 수 있다. 일반적으로, 크기가 $n$ 인 정사각 행렬의 $k$ 차 거듭제곱은 최대 $n-1$ 차 행렬 다항식으로 표현 가능하다.

4.2. 역행렬

Cayley–Hamilton theorem^영어를 이용하면 역행렬을 계산할 수 있다. 특히, 2 × 2 및 3 × 3 행렬의 역행렬을 구하는 공식을 유도할 수 있다.

예를 들어 행렬 A가 다음과 같다고 하자.

: $A = \begin{pmatrix}1&2\\3&4\end{pmatrix}.$

이 행렬의 특성 다항식은 다음과 같다.

: $p(\lambda) = \lambda^2-5\lambda-2.$

케일리-해밀턴 정리에 의해 다음이 성립한다.

: $p(A) = A^2-5A-2I_2 = \begin{pmatrix}0&0\\0&0\\\end{pmatrix}.$

이 식을 변형하면 A의 역행렬을 얻을 수 있다.

: $A^{-1}=\frac{A-5I_2}{2}~.$

다른 예로, 행렬 A가 다음과 같다고 하자.

: $A =\begin{bmatrix}1 & 2 & 1 \\2 & 1 & 3 \\3 & 2 & 3 \\\end{bmatrix}$

이 경우, 케일리-해밀턴 정리를 적용하여 정리하면 A의 역행렬을 얻을 수 있다.

: $A^{-1}=\frac{A^2-5A-6I_3}{4}~.$

4.3. 행렬 함수

Cayley–Hamilton theorem^영어를 이용하면 행렬 함수를 다항식으로 귀착시킬 수 있다.

해석 함수
: $f(x) = \sum_{k=0}^\infty a_k x^k$
와 행렬 의 차수 의 특성 다항식 가 주어지면, 이 함수는 다음과 같이 나눗셈을 사용하여 표현할 수 있다.
: $f(x) = q(x) p(x) + r(x),$
여기서 는 어떤 몫 다항식이고 는 인 나머지 다항식이다.

케일리-해밀턴 정리에 의해, 를 행렬 로 대체하면 이 되므로 다음을 얻는다.
: $f(A) = r(A).$

따라서 행렬 의 해석 함수는 차수가 보다 작은 행렬 다항식으로 표현할 수 있다.

나머지 다항식을 다음과 같이 나타낸다.
: $r(x) = c_0 + c_1 x + \cdots + c_{n-1} x^{n-1}.$
이므로, 의 개의 고유값을 함수 에 대입하면 다음을 얻는다.
: $f(\lambda_i) = r(\lambda_i) = c_0 + c_1 \lambda_i + \cdots + c_{n-1} \lambda_i^{n-1}, \qquad \text{for } i=1,2,...,n.$
이것은 개의 선형 방정식 시스템으로, 계수 를 결정하기 위해 풀 수 있다. 따라서 다음을 얻는다.
: $f(A) = \sum_{k=0}^{n-1} c_k A^k.$

고유값이 반복되는 경우, 즉 for some , 두 개 이상의 방정식이 동일하므로 선형 방정식을 고유하게 풀 수 없다. 이러한 경우, 중복도 인 고유값에 대해, 의 처음 개의 도함수가 해당 고유값에서 0이 된다. 이로 인해 추가 개의 선형 독립적인 해가 생성된다.
: $\left.\frac{\mathrm{d}^k f(x)}{\mathrm{d}x^k}\right|_{x=\lambda} = \left.\frac{\mathrm{d}^k r(x)}{\mathrm{d}x^k}\right|_{x=\lambda}\qquad \text{for } k = 1, 2, \ldots, m-1,$
이는 다른 해와 결합되어 를 풀기 위한 필요한 개의 방정식을 생성한다.

점 를 지나는 다항식을 구하는 것은 본질적으로 보간법 문제이며, 라그랑주 또는 뉴턴 보간법 기법을 사용하여 풀 수 있으며, 실베스터 공식으로 이어진다.

;예시 1
:예를 들어, 다음과 같은 다항식 표현을 찾아야 한다고 가정해 보자.
: $f(A) = e^{At} \qquad \mathrm{where} \qquad A = \begin{pmatrix}1&2\\0&3\end{pmatrix}.$

:특성 다항식은 이고, 고유값은 이다. 라고 하자. 고유값에서 를 평가하면 두 개의 선형 방정식, 및 을 얻는다.

:이 방정식을 풀면 및 이 된다. 따라서 다음이 성립한다.
: $e^{At} = c_0 I_2 + c_1 A = \begin{pmatrix}c_0 + c_1 & 2 c_1\\ 0 & c_0 + 3 c_1\end{pmatrix} = \begin{pmatrix}e^{t} & e^{3t} - e^{t} \\ 0 & e^{3t}\end{pmatrix}.$

:만약, 그 대신, 함수가 였다면, 계수는 및 가 되었을 것이므로
: $\sin(At) = c_0 I_2 + c_1 A = \begin{pmatrix}\sin t & \sin 3t - \sin t \\ 0 & \sin 3t\end{pmatrix}.$
:로 구해진다.

;예시 2
:마찬가지로,
: $f(A) = e^{At} \qquad(A = \begin{pmatrix}0 &1 \\-1 &0\end{pmatrix})$
:을 생각한다. 의 고유 다항식은 , 고유값은 이다. 앞과 마찬가지로, 고유값에 관한 연립 방정식
::,
::
:을 풀어서,
::
:을 얻는다. 이 경우의
: $e^{At} = (\cos t)I_2 + (\sin t)A = \begin{pmatrix}\cos t &\sin t \\-\sin t &\cos t\end{pmatrix}$
:는 회전 행렬이다.

이러한 이용법의 표준적인 예는 에 부속하는 리 대수로부터의 지수 사상이다. 이것은 행렬 지수 함수 $\exp\colon \mathfrak g \to G;$
: $tX \mapsto e^{tX} = \textstyle\sum\limits_{n=0}^\infty \dfrac{t^nX^n}{n!} = I + tX + \dfrac{t^2X^2}{2} + \cdots \qquad(t \in \mathbb{R}, X \in \mathfrak{g})$
로 주어진다. 그 다항식 표현은 에 대해서는 오래전부터 알려져 있으며, 파울리 행렬 를 사용하여
: $e^{i(\theta/2)(\hat n \cdot \sigma)} = I_2 \cos \theta/2 + i(\hat n \cdot \sigma) \sin \theta/2$
로 쓸 수 있다. 도 마찬가지로
: $e^{i\theta(\hat n \cdot \mathbf J)} = I_3 + i(\hat n \cdot \mathbf J) \sin \theta + (\hat n \cdot \mathbf J)^2 (\cos \theta - 1)$
로 쓸 수 있다(이것은 로드리게스 회전 공식이다). 표기법에 대해서는 을 참조하라.

나중에는 다른 군에 대한 표현도 알려져 있으며, 예를 들어 로렌츠 군 , , , 등. 여기서 는 시공간의 이며 는 그 단일 연결 피복(더 정확하게는, 의 연결 성분 의 단일 연결 피복)이다. 얻어진 다항식 표현은 이러한 군의 표준 표현(standard representation)에 적용된다. 행렬의 거듭제곱을 계산하기 위해 고유값에 대한 어느 정도의 지식이 필요하다. 의(그리고 의) 닫힌 공식은 최근 모든 기약 표현(예: 임의의 )에 대해 얻어졌다.

5. 응용

케일리-해밀턴 정리는 다양한 분야에 응용된다.

* 행렬식 및 역행렬 계산: 행렬식과 역행렬 계산에 활용된다. 벨 다항식을 이용해 특성 다항식의 계수를 구하고, 이를 통해 행렬식과 역행렬 계산 공식을 유도할 수 있다.
* 고차 거듭제곱 계산: 행렬의 고차 거듭제곱을 낮은 차수의 행렬 다항식으로 표현할 수 있다. 예를 들어 행렬 A = {{lang에 대해, 케일리-해밀턴 정리를 적용하면 A² = 5A + 2I₂ 로 나타낼 수 있다. 이를 반복하면 임의의 고차 거듭제곱을 최대 n-1차(n은 행렬의 크기) 행렬 다항식으로 표현할 수 있다.
* 대수적 수론: 대수적 정수의 최소 다항식 계산에 사용된다.

5.1. 행렬식 및 역행렬 계산

케일리-해밀턴 정리를 이용하면 행렬식과 역행렬을 계산할 수 있다. 벨 다항식을 이용하여 특성 다항식의 계수를 계산하고, 이를 통해 행렬식과 역행렬을 계산하는 공식을 유도할 수 있다.

n차 정방 행렬의 특성 다항식은 다음과 같다.
: $p(t)=t^n+c_{n-1}t^{n-1}+\dots+c_1t+c_0$

여기서 n-i차 계수 c_n-i는 A의 고유값들이 이루는 i차 기본 대칭식과 같다. 특히 상수항 (0차 계수) c₀는 고유값의 총곱이므로, 이는 A의 행렬식 det A와 같다.

뉴턴 항등식을 사용하면 기본 대칭식은 멱합 대칭식으로 나타낼 수 있으므로, c_n-i는 고유값의 멱합 대칭식 $s_k = \textstyle\sum\limits_{i=1}^n {\lambda_i}^k$ 로 나타낼 수 있으며, 다음과 같다.
: $s_k = \textstyle\sum\limits_{i=1}^n {\lambda_i}^k = \operatorname{tr} A^k$
따라서, c_n-i는 A^k의 트레이스로 나타낼 수 있다. 특히 $c_{n-1} = \operatorname{tr}A$ 이다.

케일리-해밀턴 정리에 의해, 일반적인 n차 정칙행렬 A (즉, A의 행렬식은 0이 아니다)에 대해, 그 역행렬 A^-1은 A의 n-1차 이하의 행렬 다항식으로 나타낼 수 있다. 실제로, 다음 식에서

: $p(A)=A^n+c_{n-1}A^{n-1}+\cdots+c_1A+(-1)^n\det(A)I_n =O$

상수항을 이항하면
: $-(-1)^n \det(A) I_n = A(A^{n-1}+c_{n-1}A^{n-2}+\cdots+c_1I_n)$
양변에 A^-1를 곱하면
: $A^{-1} = \frac{(-1)^{n-1}}{\det A} (A^{n-1}+c_{n-1}A^{n-2}+\cdots+c_1I_n)$
을 얻는다.

일반적으로, 계수 c_i를 주는 공식은 완전 지수형 벨 다항식에 의해 다음과 같이 주어진다.
: $c_{n-k} = \frac{(-1)^k}{k!} B_k(s_1, -1! s_2, 2! s_3, \cdots, (-1)^{k-1}(k-1)! s_k)$

특히 A의 행렬식은 c₀이므로, 트레이스를 포함하는 표현(트레이스 항등식)으로 다음과 같이 쓸 수 있다.
: $\det(A) = \frac{1}{n!} B_n(s_1, -1! s_2, 2! s_3, \cdots, (-1)^{n-1}(n-1)! s_n)$

마찬가지로, 다음과 같은 표현도 가능하다.
: $A^{-1} = \frac{1}{\det A} \textstyle\sum\limits_{k=0}^{n-1} (-1)^{n+k-1} \dfrac{A^{n-k-1}}{k!} B_k(s_1, -1! s_2, 2! s_3, \cdots, (-1)^{k-1}(k-1)! s_k)$

벨 다항식의 처음 부분은 B₀ = 1, B₁(x₁) = x₁, B₂(x₁, x₂) = x₁² + x₂, ... 이므로, 이것들을 이용하여 2차의 경우 고유 다항식의 계수 c_i를 구체적으로 계산하면 다음과 같다.

: $\begin{align}&c_2 = B_0 = 1,\quad c_1 = \frac{-1}{1!} B_1(s_1) = - s_1 = - \operatorname{tr}(A) \\&c_0 = \frac{1}{2!} B_2(s_1, -1! s_2) = \frac{1}{2}(s_1^2 - s_2) = \frac{1}{2}((\operatorname{tr}(A))^2 - \operatorname{tr}(A^2))\end{align}$

c₀은 행렬식이므로, 이 경우 역행렬은 다음과 같이 계산할 수 있다.
: $A^{-1} = \frac{-1}{\det A}(A + c_1 I_2) = \frac{-2(A - \operatorname{tr}(A) I_2)}{(\operatorname{tr}(A))^2 - \operatorname{tr}(A^2)}$

3차 정방 행렬 A에 대한 케일리-해밀턴 정리의 주장은 다음과 같이 쓸 수 있다.
: $A^3- (\operatorname{tr}A)A^2+\frac{1}{2}((\operatorname{tr}A)^2-\operatorname{tr}(A^2))A-\det(A)I_3=O$

마찬가지로 n = 3인 경우 행렬식은 다음과 같이 쓸 수 있다.
: $\begin{align}\det(A) &= \frac{1}{3!} B_3(s_1, -1! s_2, 2! s_3) = \frac{1}{6}(s_1^3 + 3 s_1 (-s_2) + 2 s_3) \\&= \tfrac{1}{6}((\operatorname{tr}A)^3-3\operatorname{tr}(A^2)(\operatorname{tr}A)+2\operatorname{tr}(A^3))\end{align}$

4차 정방 행렬 A에 대한 정리의 주장은 다음과 같이 쓸 수 있다.
: $A^4-(\operatorname{tr}A)A^3 + \tfrac{1}{2}\bigl((\operatorname{tr}A)^2-\operatorname{tr}(A^2)\bigr)A^2 - \tfrac{1}{6}\bigl( (\operatorname{tr}A)^3-3\operatorname{tr}(A^2)(\operatorname{tr}A)+2\operatorname{tr}(A^3)\bigr)A + \det(A)I_4 = O$

이 경우 행렬식은 다음과 같다.
: $\tfrac{1}{24}((\operatorname{tr}A)^4-6 \operatorname{tr}(A^2)(\operatorname{tr}A)^2+3(\operatorname{tr}(A^2))^2+8\operatorname{tr}(A^3)\operatorname{tr}(A) -6\operatorname{tr}(A^4))$

계수 c_k에 대한 더 복잡한 표현은, 뉴턴 항등식이나 파데예프-르베리에 알고리즘 등에서 유도할 수 있다.

5.2. 고차 거듭제곱 계산

Cayley–Hamilton theorem^영어에 따르면, 행렬의 고차 거듭제곱은 낮은 차수의 행렬 다항식으로 표현할 수 있다.

예를 들어, 행렬 A가 다음과 같이 주어졌다고 하자.

: $A = \begin{bmatrix}1&2\\3&4\end{bmatrix}$

이 행렬의 특성 다항식은 다음과 같다.

: $p(\lambda)=\begin{vmatrix}\lambda-1&-2\\-3&\lambda-4\end{vmatrix}=(\lambda-1)(\lambda-4)-2\cdot3=\lambda^2-5\lambda-2$

케일리-해밀턴 정리에 따르면 다음 식이 성립한다.

: $A^2-5A-2I_2=0$ (여기서 $I_2$ 는 단위행렬이다.)

이를 정리하면 다음과 같다.

: $A^2=5A+2I_2$

이 식을 이용하여 A⁴을 계산할 수 있다.

: $A^3=(5A+2I_2)A=5A^2+2A=5(5A+2I_2)+2A=27A+10I_2$

: $A^4=A^3A=(27A+10I_2)A=27A^2+10A=27(5A+2I_2)+10A=145A+54I_2$

이처럼 케일리-해밀턴 정리를 이용하면, 행렬의 고차 거듭제곱을 낮은 차수의 다항식으로 나타낼 수 있다. 일반적으로, 크기가 $n$ 인 정사각 행렬의 경우, 임의의 차수 $k$ 의 행렬 거듭제곱은 최대 $n-1$ 차 행렬 다항식으로 표현 가능하다.

5.3. 대수적 수론

대수적 정수의 최소 다항식을 계산하는 데 케일리-해밀턴 정리가 사용될 수 있다. 예를 들어, 체 $\mathbb{Q}$ 의 유한 차수 확대 $\mathbb{Q}[\alpha_1,\ldots,\alpha_k]$ 와 그 원소인 대수적 정수 $\alpha$ (이는 첨가된 원소의 멱곱 $\alpha_1^{n_1}\cdots\alpha_k^{n_k}$ 의 $\mathbb{Q}$ -선형 결합으로 쓸 수 있다)가 주어졌을 때, $\alpha$ 를 곱하는 $\mathbb{Q}$ -선형 변환
: $\cdot \alpha \colon \mathbb{Q}[\alpha_1,\cdots,\alpha_k] \to \mathbb{Q}[\alpha_1,\cdots,\alpha_k]$
의 표현 행렬을 $A$ 로 쓰면, $A$ 에 케일리-해밀턴 정리를 적용하여 $\alpha$ 의 최소 다항식을 구할 수 있다.

6. 일반화

케일리-해밀턴 정리는 임의의 가환환의 원소를 갖는 행렬에 대해 성립하며, $e_1, ..., e_n$의 원소에 의해 생성된 $R$-가군 $\varphi$가 다음을 만족할 때마다 $p(\varphi) = 0$이 성립함을 보여준다.

$\varphi(e_j)=\sum a_{ij}e_i, \qquad j =1, \ldots, n.$

이 정리의 더 일반적인 버전은 가환대수학 및 대수기하학의 유명한 나카야마 보조정리의 근원이다.

케일리-해밀턴 정리는 비가환환인 사원수에 대한 행렬에서도 성립한다.

7. "단락적인 증명"의 오류에 관한 주의

케일리-해밀턴 정리를 증명할 때, 고유 다항식
: $p(\lambda) = \det(\lambda I_n - A)$
의 $\lambda$ 를 $A$ 로 치환하여
: $p(A)=\det(A I_n - A) = \det(A-A)=0$
을 얻는 것은 잘못된 논법이다.

이 논법이 잘못된 이유는 다음과 같다.

* 위 식의 좌변은 $n$ 차 정사각행렬이고, 우변은 스칼라 $0$ 이므로 ( $n=1$ 이 아닌 한) 모순이다.
* 위 식의 우변의 $\lambda$ 는 스칼라여야 행렬식으로서 의미를 가지는데, 행렬식 전개 전에 $\lambda$ 를 $A$ 로 치환하면 의미가 없어진다.

2차 정사각 행렬의 경우를 예로 들면,
: $p(\lambda) = \begin{vmatrix}\lambda-a &-b \\-c &\lambda-d\end{vmatrix}$
의 $\lambda$ 를 $A=\begin{pmatrix}a &b \\c &d\end{pmatrix}$ 로 치환하면 행렬식으로서의 의미가 없어진다는 것을 알 수 있다.

하지만, 스칼라인 부분을 스칼라 행렬(단위 행렬의 스칼라 배)로 치환한 블록 행렬
: $\begin{pmatrix} \begin{pmatrix}a &b \\c &d\end{pmatrix} - aI_2 &-bI_2 \\-cI_2 &\begin{pmatrix}a &b \\c &d\end{pmatrix} - dI_2\end{pmatrix}=\left(\begin{array}{cc|cc}0 &b &-b &0 \\c &d-a &0 &-b \\\hline-c &0 &a-d &b \\0 &-c &c &0\end{array}\right)$
를 고려하면 유효한 식이 되며, 이 행렬식은 실제로 $0$ 이 된다. 그러나 이 행렬은 위에서 $\det$ 의 인수로 삼은 $AI_n - A$ 가 아니다.

이 논법이 다른 다중 선형 형식에는 적용될 수 없음을 퍼머넌트를 이용해 보일 수 있다. perm( $\lambda I_n - A$ )라고 하면, 같은 논법으로 perm( $A I_n - A$ ) = 0 이 증명되어야 하지만, 이는 오류이다. 2차 정사각 행렬의 경우, $\operatorname{perm} \begin{pmatrix}a &b \\c &d\end{pmatrix} = ad + bc$ 이므로, $q(\lambda) = \operatorname{perm} (\lambda I_2 - A) = \lambda^2 - (a+d)\lambda + (ad+bc)$ 이며, 여기에 $A$ 를 대입하면
: $q(A)=A^2-(a+d)A+(ad+bc)I_2=\begin{pmatrix}2bc &0 \\0 &2bc\end{pmatrix}$ 는 일반적으로 영행렬이 아니다.