맨위로가기

행렬 지수 함수

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

행렬 지수 함수는 정사각 행렬을 다른 정사각 행렬로 변환하는 함수로, 무한 급수 또는 초기값 문제의 해로 정의될 수 있다. 이 함수는 복소수 지수 함수의 테일러 급수와 유사하며, 항상 수렴하므로 항상 존재한다. 행렬 지수 함수는 기본 성질, 가환성과 관련된 성질, 가역성과 관련된 성질, 특별한 행렬에 대한 성질 등 다양한 성질을 만족하며, 선형 미분 방정식의 해를 구하는 데 사용될 수 있다. 특히, 동차 및 비동차 선형 미분 방정식을 풀거나 지수 적분기 연구에 활용된다. 행렬 지수 함수는 또한 행렬의 행렬 거듭제곱을 정의하는 데 사용되며, 사상(mapping)을 제공한다.

더 읽어볼만한 페이지

  • 거듭제곱 - 지수 함수
    지수 함수는 양의 상수 *a*를 밑으로 하는 *y = ax* 형태의 함수이며, 특히 자연로그의 역함수인 *ex*는 다양한 정의와 응용을 가지며 복소수로 확장될 수 있다.
  • 거듭제곱 - 반감기
    반감기는 어떤 양이 원래 값의 절반으로 줄어드는 데 걸리는 시간을 의미하며, 방사성 붕괴, 화학 반응 등 다양한 분야에서 활용되고 방사성 동위원소의 안정성을 나타내는 지표이다.
  • 행렬론 - 행렬식
    행렬식은 정사각 행렬에 대해 정의되는 값으로, 선형 방정식의 해를 구하고 선형 독립성을 확인하며 기저의 방향과 부피를 계산하는 데 사용되며, 가우스 소거법 등의 계산 기법과 가역성 판단, 고유값 연관성 등의 성질을 갖는다.
  • 행렬론 - 행렬 분해
    행렬 분해는 주어진 행렬을 특정 성질을 갖는 여러 행렬의 곱으로 표현하는 방법으로, 수치 해석에서 행렬 알고리즘 구현 및 선형 연립 방정식 해를 구하거나 행렬 특성 분석에 활용되며 LU 분해, QR 분해, 특잇값 분해 등이 있다.
  • 리 군 - 리 대수
    리 대수는 가환환 위의 가군과 리 괄호 연산으로 구성되며 쌍선형성, 교대성, 야코비 항등식을 만족하고, 리 군 연구와 분류, 표현 이론에 중요한 역할을 한다.
  • 리 군 - 보렐-베유-보트 정리
    보렐-베유-보트 정리는 복소수 반단순 리 군의 표현론에서 층 코호몰로지를 사용하여 리 군의 기약 표현을 설명하며, 보렐-베유 정리와 보트의 일반화를 포함한다.
행렬 지수 함수
정의
영어Matrix exponential
일본어行列指数関数 (Gyōretsu shisū kansū)
한국어행렬 지수 함수
설명스칼라 숫자의 지수화를 일반화한 행렬 연산이다.
표기법
표기exp(X)
e
설명여기서 X는 n×n 행렬이다.
정의
정의행렬 X의 지수 함수는 멱급수로 정의된다.
속성
주요 속성행렬 지수 함수는 다양한 속성을 갖는다.

2. 정의

행렬 지수 함수는 정사각행렬을 다른 정사각행렬로 보내는 행렬 함수다.

2. 1. 무한 급수 정의

정사각행렬 A에 대한 행렬 지수 함수 e^A 또는 \exp(A)는 다음과 같은 무한 급수로 정의된다.[2]

:\exp(X)=\sum_{k=0}^\infty\frac1{k!}X^k.

이는 복소수 지수 함수의 테일러 급수 \exp(z)=\sum_{k=0}^\infty \frac{1}{k!}z^k 와 같은 꼴이다. 위의 급수는 항상 수렴하므로, 행렬 지수는 항상 존재한다. 여기서 I는 항등 행렬, A^kAk제곱을 의미한다.

3. 성질

행렬 지수 함수는 다음과 같은 중요한 성질들을 만족한다.


  • (영행렬 O에 대한 행렬 지수 함수는 단위행렬 I이다.)
  • (여기서 a, b는 임의의 복소수이다.)
  • 두 행렬 X와 Y가 가환이면, , 즉, 이다.
  • * 단, 일반적으로 가환하지 않는 두 행렬의 경우에는 성립하지 않는다.
  • 가 가역이면
  • . 따라서 가 대칭 행렬이면 그 행렬 지수도 대칭이며, 가 왜대칭이면 는 직교 행렬이 된다.
  • . 따라서 가 에르미트이면 도 에르미트이며, 가 왜에르미트이면 는 유니타리 행렬이 된다.
  • 야코비 공식에 따르면, 임의의 복소 정방 행렬에 대해 (대각합 항등식)이 성립한다.[3] 이 공식은 행렬 지수 함수가 항상 가역 행렬임을 보여준다.

3. 1. 기본 성질


  • 영행렬 0에 대한 행렬 지수 함수는 단위행렬이다. 즉, \exp(0)=I이다.
  • 만약 두 행렬 X, YXY=YX를 만족하면, \exp(X)\exp(Y)=\exp(X+Y)=\exp(Y)\exp(X)이다.
  • * 이 성질의 특수한 경우로, 임의의 복소수 a, b에 대해 \exp(aX)\exp(bX)=\exp((a+b)X)가 성립한다.
  • * 하지만 일반적으로 가환하지 않는 두 행렬에 대해서는 \exp(X)\exp(Y)\ne\exp(X+Y)\ne\exp(Y)\exp(X)이다.
  • 만약 Y가역행렬이면, Y\exp(X)Y^{-1}=\exp(YXY^{-1})이다.
  • \det(\exp X)=\exp(\operatorname{tr}X)이다.
  • * 따라서, \det(\exp X)>0이고, 행렬 지수 함수는 항상 가역행렬이다.
  • 행렬 지수 함수는 다음과 같은 초기조건문제의 해로 표현될 수 있다.
  • * \mathbf x'(t)=A\mathbf x(t)
  • * \mathbf x(0)=\mathbf x_0
  • * 위의 초기조건문제의 해는 \mathbf x(t)=\exp(At)\mathbf x_0이다.
  • X전치 행렬X^T라고 하면, \exp(X^T) = (\exp X)^T이다. 따라서 X가 대칭 행렬이면 \exp(X)도 대칭 행렬이다. 또한 X반대칭 행렬이면 e^X는 직교 행렬이다.
  • X의 켤레 전치 행렬을 X^*라고 하면, \exp(X^*) = (\exp X)^*이다. 따라서 X에르미트 행렬이면 e^X도 에르미트 행렬이고, X가 반 에르미트 행렬이면 e^X는 유니타리 행렬이다.

3. 2. 가환성과 관련된 성질

행렬 지수 함수는 다음과 같은 성질을 만족한다. 여기서 대문자는 임의의 정사각행렬, 소문자는 임의의 복소수를 의미한다.

  • (영행렬에 대한 지수 함수는 단위 행렬이다.)
  • (지수 법칙의 특수한 경우)
  • 만약 이면, 즉, 두 행렬 X와 Y가 가환이면,
  • * 단, 일반적으로 가환하지 않는 두 행렬의 경우 이다.
  • 가 가역이면


일반적인 지수 함수가 를 만족하는 것처럼, 가환 행렬에 대해서도 같은 관계가 성립한다. 그러나 가환하지 않는 행렬에 대해서는 위의 등식이 반드시 성립하지는 않으며, 이 경우 베이커-캠벨-하우스도르프 공식을 사용하여 를 계산할 수 있다.

역은 일반적으로 성립하지 않는다. 즉, 등식 는 와 가 가환함을 의미하지 않는다.

3. 3. 가역성과 관련된 성질

가 가역이면[3]

:e^{YXY^{-1}} = Ye^XY^{-1}

야코비 공식에 따르면, 임의의 복소 정방 행렬에 대해 다음의 대각합 항등식이 성립한다.[3]

:\det (e^A) = e^{\operatorname{tr}(A)}~.

위 등식은 계산에 도움이 될 뿐만 아니라, 우변이 항상 0이 아니므로 좌변의 행렬식이 0이 아니며, 따라서 행렬 지수 함수 e^A는 항상 가역 행렬임을 보여준다.[3]

3. 4. 특별한 행렬에 대한 성질


  • (영행렬의 행렬 지수는 단위 행렬이다.)
  • (여기서 a, b는 임의의 복소수)
  • 이면,
  • 가 가역이면,
  • . 이로부터 가 대칭 행렬이면 그 행렬 지수 도 대칭이며, 가 왜대칭이면 는 직교 행렬이 된다.
  • . 이로부터 가 에르미트이면 도 에르미트이며, 가 왜에르미트이면 는 유니타리 행렬이 된다.


고려하는 행렬이 사영 행렬이라면, 이는 멱등이므로, 행렬 지수는

:

가 됨을 지수 함수의 정의로부터 쉽게 알 수 있다.

3. 5. 리 곱 공식

비록 ''X''와 ''Y''가 서로 교환하지 않더라도, 지수 ''e''''X'' + ''Y''는 리 곱 공식을 사용하여 계산할 수 있다.[4]

:e^{X+Y} = \lim_{k\to\infty} \left(e^{\frac{1}{k}X}e^{\frac{1}{k}Y}\right)^k.

위 식을 근사하기 위해 큰 유한 ''k''를 사용하는 것은 수치적 시간 진화에서 자주 사용되는 Suzuki-Trotter 전개의 기초이다.

3. 6. 베이커-캠벨-하우스도르프 공식

Baker–Campbell–Hausdorff formula|베이커-캠벨-하우스도르프 공식영어으로 계산할 수 있다.[5]

:Z = X + Y + \frac{1}{2}[X,Y] + \frac{1}{12}[X,[X,Y]] - \frac{1}{12}[Y,[X,Y]]+ \cdots,

여기서 나머지 항들은 모두 XY를 포함하는 반복적인 교환자들이다. 만약 XY가 교환 가능하면, 모든 교환자는 0이 되고, 단순히 Z = X + Y가 된다.

가환 행렬 X, Y가 교환 가능(XY = YX)하다면,

:e^{X+Y} = e^X e^Y

가 성립한다. 그러나 가환하지 않은 행렬에 대해서는 위의 관계가 성립하지 않는다. 이 경우, e^{X+Y}의 계산에 베이커-캠벨-하우스도르프 공식을 이용할 수 있다.

3. 7. 골든-톰슨 부등식

에르미트 행렬의 행렬 지수 함수의 대각합과 관련된 주목할 만한 정리이다.

만약 A와 B가 에르미트 행렬이라면, 다음 부등식이 성립한다.[6]

:

이때, 가환성은 조건으로 요구되지 않는다. 골든-톰슨 부등식이 세 행렬로 확장될 수 없음을 보여주는 반례가 있으며, 에르미트 행렬 A, B, C에 대해 tr(exp(A)exp(B)exp(C))가 항상 실수를 보장하지 않는다. 그러나 리브는[7][8] 다음 식을 통해 세 행렬에 대해 일반화할 수 있음을 증명했다.

:

4. 계산

행렬 지수 함수를 계산하는 것은 쉽지 않으며, 여러 가지 방법이 사용된다. 이는 수학 및 수치 해석 분야에서 활발히 연구되는 주제이다. 매트랩, GNU 옥타브, R, SciPy와 같은 프로그램들은 파데 근사를 사용하여 행렬 지수 함수를 계산한다.[14][15][16][17]

일반적으로, 행렬의 거듭제곱을 정확하고 정밀하게 계산하는 것은 매우 어렵다. 이는 현재 수학, 특히 수치 해석 분야에서 중요한 연구 주제 중 하나이다. MATLAB이나 GNU Octave와 같은 프로그램들은 파데 근사를 사용한다.[25][26]

이 절에서는 원칙적으로 모든 행렬에 적용 가능하며, 작은 행렬에 대해 명시적으로 수행할 수 있는 방법을 다룬다.[18]

4. 1. 대각화 가능 행렬

행렬이 대각 행렬인 경우:

:A = \begin{bmatrix}

a_1 & 0 & \cdots & 0 \\

0 & a_2 & \cdots & 0 \\

\vdots & \vdots & \ddots & \vdots \\

0 & 0 & \cdots & a_n

\end{bmatrix} ,

그 지수 함수는 주 대각선상의 각 항목에 지수를 취해 얻을 수 있다.

:e^A = \begin{bmatrix}

e^{a_1} & 0 & \cdots & 0 \\

0 & e^{a_2} & \cdots & 0 \\

\vdots & \vdots & \ddots & \vdots \\

0 & 0 & \cdots & e^{a_n}

\end{bmatrix} .

이 결과는 대각화 가능 행렬의 지수도 계산할 수 있게 해준다. ''A'' = ''UDU''−1 이고 ''D''가 대각 행렬이라면, ''e''''A'' = ''Ue''''D''''U''−1이다. 실베스터 공식을 적용해도 같은 결과를 얻을 수 있다. (대각 행렬의 덧셈과 곱셈, 그리고 지수화는 요소별 덧셈, 곱셈, 지수화와 같다는 점에 유의. 특히 "1차원" 지수화는 대각선의 경우 요소별로 적용된다.)

예를 들어, 행렬

A = \begin{bmatrix}

1 & 4\\

1 & 1\\

\end{bmatrix}

는 다음과 같이 대각화할 수 있다.

:\begin{bmatrix}

  • 2 & 2\\

1 & 1\\

\end{bmatrix}\begin{bmatrix}

  • 1 & 0\\

0 & 3\\

\end{bmatrix}\begin{bmatrix}

  • 2 & 2\\

1 & 1\\

\end{bmatrix}^{-1}.

따라서,

:e^A = \begin{bmatrix}

  • 2 & 2\\

1 & 1\\

\end{bmatrix}e^\begin{bmatrix}

  • 1 & 0\\

0 & 3\\

\end{bmatrix}\begin{bmatrix}

  • 2 & 2\\

1 & 1\\

\end{bmatrix}^{-1}=\begin{bmatrix}

  • 2 & 2\\

1 & 1\\

\end{bmatrix}\begin{bmatrix}

\frac{1}{e} & 0\\

0 & e^3\\

\end{bmatrix}\begin{bmatrix}

  • 2 & 2\\

1 & 1\\

\end{bmatrix}^{-1} = \begin{bmatrix}

\frac{e^4+1}{2e} & \frac{e^4-1}{e}\\

\frac{e^4-1}{4e} & \frac{e^4+1}{2e}\\

\end{bmatrix}.

4. 2. 멱영 행렬

행렬 N이 어떤 정수 ''q''에 대해 N^q = 0이면 멱영이라고 한다. 이 경우 행렬 지수 함수 e^N은 급수 전개를 통해 직접 계산할 수 있는데, 급수가 유한한 항에서 끝나기 때문이다.

:e^N = I + N + \frac{1}{2}N^2 + \frac{1}{6}N^3 + \cdots + \frac{1}{(q - 1)!}N^{q-1}

급수는 유한한 단계를 가지므로, 이는 효율적으로 계산할 수 있는 행렬 다항식이다.

요르단-슈발레 분해에 따르면, 복소수를 성분으로 갖는 임의의 n \times n 행렬 ''X''는 다음과 같이 표현할 수 있다.

:X = A + N

여기서,

  • ''A''는 대각화 가능하고
  • ''N''은 멱영 행렬이며
  • ''A''는 ''N''과 가환이다.


이는 다음과 같이 이전의 두 경우로 축소하여 ''X''의 지수 함수를 계산할 수 있음을 의미한다.

:e^X = e^{A+N} = e^A e^N

마지막 단계를 수행하려면 ''A''와 ''N''의 가환성이 필요하다는 점에 유의해야 한다.

멱영 행렬 N는 적당한 양의 정수 q에 대해 N^q = 0을 만족한다. N승 e^N은 지수 함수의 정의 급수로부터 직접

:e^N = I + N + \frac{1}{2}N^2 + \frac{1}{6}N^3 + \cdots + \frac{1}{(q-1)!}N^{q-1}

로 계산할 수 있다(급수는 유한 항으로 끝난다).

4. 3. 조르당 표준형

요르단-슈발레 분해에 따르면, 복소수를 성분으로 갖는 임의의 n \times n 행렬 ''X''는 다음과 같이 표현할 수 있다.[23]

:X = A + N

여기서,

  • ''A''는 대각화 가능하고
  • ''N''은 멱영 행렬이며
  • ''A''는 ''N''과 가환이다.


이는 ''X''의 지수 함수를 다음과 같이 이전의 두 경우로 축소하여 계산할 수 있음을 의미한다.

:e^X = e^{A+N} = e^A e^N.

마지막 단계를 수행하려면 ''A''와 ''N''의 가환성이 필요하다.

대수적으로 닫힌 체인 경우, 밀접하게 관련된 방법으로 조르당 표준형을 사용할 수 있다. X = PJP^{-1}라고 가정하면, 여기서 JX의 조르당 표준형이다. 그러면

:e^{X} = Pe^{J}P^{-1}.

또한

:\begin{align}

J &= J_{a_1}(\lambda_1) \oplus J_{a_2}(\lambda_2) \oplus \cdots \oplus J_{a_n}(\lambda_n), \\

e^J &= \exp \big( J_{a_1}(\lambda_1) \big) \oplus \exp \big( J_{a_2}(\lambda_2) \big) \oplus \cdots \oplus \exp \big( J_{a_n}(\lambda_n) \big).

\end{align}

이므로, 조르당 블록의 행렬 지수 함수를 계산하는 방법만 알면 된다. 각 조르당 블록은 다음과 같은 형태를 갖는다.

:\begin{align}

& & J_a(\lambda) &= \lambda I + N \\

&\Rightarrow & e^{J_a(\lambda)} &= e^{\lambda I + N} = e^\lambda e^N.

\end{align}

여기서 N은 특별한 멱영 행렬이다. J의 행렬 지수 함수는 다음과 같이 주어진다.

:e^J = e^{\lambda_1} e^{N_{a_1}} \oplus e^{\lambda_2} e^{N_{a_2}} \oplus \cdots \oplus e^{\lambda_n} e^{N_{a_n}}

4. 4. 실베스터 공식

케일리-해밀턴 정리에 의해, ''n×n'' 행렬 는 ''A''의 처음 ''n''−1 거듭제곱의 선형 결합으로 표현될 수 있다. 2×2 대각화 가능 행렬의 경우, 실베스터 공식은 와 같이 표현된다. 여기서 ''B''는 ''A''의 프로베니우스 공변량이다.

이러한 ''B''는 (단위 행렬)와 에 대해 위 식과 그 첫 번째 미분을 에서 평가하여 구할 수 있다.

이 절차는 결함 행렬에도 적용 가능하다.[22] 아래는 4×4 행렬의 예시이다.

다음 행렬 ''A''를 고려한다.

:A = \begin{bmatrix} 1 & 1 & 0 & 0 \\ 0 & 1 & 1 & 0 \\ 0 & 0 & 1 & -\frac{1}{8} \\ 0 & 0 & \frac{1}{2} & \frac{1}{2} \end{bmatrix}

이 행렬은 고윳값 와 을 가지며, 각 고윳값의 중복도는 2이다.

각 고윳값에 ''t''를 곱한 지수 함수, 를 생각한다. 그리고 각 지수화된 고윳값에 해당하는 미정 계수 행렬 를 곱한다. 고윳값의 대수적 중복도가 1보다 크면, 선형 독립성을 위해 각 반복마다 ''t''를 추가로 곱한다.

(만약 어떤 고윳값의 중복도가 3이라면, 세 개의 항 B_{i_1} e^{\lambda_i t}, ~ B_{i_2} t e^{\lambda_i t}, ~ B_{i_3} t^2 e^{\lambda_i t} 이 필요하다. 모든 고윳값이 서로 다르면, ''B''는 프로베니우스 공변량이 되며, 이들을 구하는 것은 4개 고윳값의 반데르몬드 행렬의 역행렬을 구하는 것과 같다.)

이 항들을 모두 더하면 다음과 같다. (여기서는 4개의 항)

:e^{At} = B_{1_1} e^{\lambda_1 t} + B_{1_2} t e^{\lambda_1 t} + B_{2_1} e^{\lambda_2 t} + B_{2_2} t e^{\lambda_2 t}

:e^{At} = B_{1_1} e^{\frac{3}{4} t} + B_{1_2} t e^{\frac{3}{4} t} + B_{2_1} e^{1 t} + B_{2_2} t e^{1 t}

''A''의 처음 세 거듭제곱과 항등 행렬로 미지 행렬 ''B''를 구하기 위해, 위 식에서 ''t'' = 0일 때의 방정식과, ''t''에 대해 미분한 방정식이 필요하다.

:A e^{A t} = \frac{3}{4} B_{1_1} e^{\frac{3}{4} t} + \left( \frac{3}{4} t + 1 \right) B_{1_2} e^{\frac{3}{4} t} + 1 B_{2_1} e^{1 t} + \left(1 t + 1 \right) B_{2_2} e^{1 t}

다시 한번 미분하면,

:\begin{align} A^2 e^{At} &= \left(\frac{3}{4}\right)^2 B_{1_1} e^{\frac{3}{4} t} + \left( \left(\frac{3}{4}\right)^2 t + \left( \frac{3}{4} + 1 \cdot \frac{3}{4}\right) \right) B_{1_2} e^{\frac{3}{4} t} + B_{2_1} e^{1 t} + \left(1^2 t + (1 + 1 \cdot 1 )\right) B_{2_2} e^{1 t} \\ &= \left(\frac{3}{4}\right)^2 B_{1_1} e^{\frac{3}{4} t} + \left( \left(\frac{3}{4}\right)^2 t + \frac{3}{2} \right) B_{1_2} e^{\frac{3}{4} t} + B_{2_1} e^{t} + \left(t + 2\right) B_{2_2} e^{t} \end{align}

한 번 더 미분하면,

:\begin{align} A^3 e^{At} &= \left(\frac{3}{4}\right)^3 B_{1_1} e^{\frac{3}{4} t} + \left( \left(\frac{3}{4}\right)^3 t + \left( \left(\frac{3}{4}\right)^2 + \left(\frac{3}{2}\right) \cdot \frac{3}{4}\right) \right) B_{1_2} e^{\frac{3}{4} t} + B_{2_1} e^{1 t} + \left(1^3 t + (1 + 2) \cdot 1 \right) B_{2_2} e^{1 t} \\ &= \left(\frac{3}{4}\right)^3 B_{1_1} e^{\frac{3}{4} t}\! + \left( \left(\frac{3}{4}\right)^3 t\! + \frac{27}{16} \right) B_{1_2} e^{\frac{3}{4} t}\! + B_{2_1} e^{t}\! + \left(t + 3\cdot 1\right) B_{2_2} e^{t} \end{align}

(일반적으로, ''n''−1번의 미분이 필요하다.)

이제 ''t'' = 0을 대입하여 계수 행렬 ''B''를 구하면,

:\begin{align} I &= B_{1_1} + B_{2_1} \\ A &= \frac{3}{4} B_{1_1} + B_{1_2} + B_{2_1} + B_{2_2} \\ A^2 &= \left(\frac{3}{4}\right)^2 B_{1_1} + \frac{3}{2} B_{1_2} + B_{2_1} + 2 B_{2_2} \\ A^3 &= \left(\frac{3}{4}\right)^3 B_{1_1} + \frac{27}{16} B_{1_2} + B_{2_1} + 3 B_{2_2} \end{align}

결과는 다음과 같다.

:\begin{align} B_{1_1} &= 128 A^3 - 366 A^2 + 288 A - 80 I \\ B_{1_2} &= 16 A^3 - 44 A^2 + 40 A - 12 I \\ B_{2_1} &= -128 A^3 + 366 A^2 - 288 A + 80 I \\ B_{2_2} &= 16 A^3 - 40 A^2 + 33 A - 9 I \end{align}

''A''의 값을 대입하면,

:\begin{align} B_{1_1} &= \begin{bmatrix}0 & 0 & 48 & -16\\ 0 & 0 & -8 & 2\\ 0 & 0 & 1 & 0\\ 0 & 0 & 0 & 1\end{bmatrix}\\ B_{1_2} &= \begin{bmatrix}0 & 0 & 4 & -2\\ 0 & 0 & -1 & \frac{1}{2}\\ 0 & 0 & \frac{1}{4} & -\frac{1}{8}\\ 0 & 0 & \frac{1}{2} & -\frac{1}{4} \end{bmatrix}\\ B_{2_1} &= \begin{bmatrix}1 & 0 & -48 & 16\\ 0 & 1 & 8 & -2\\ 0 & 0 & 0 & 0\\ 0 & 0 & 0 & 0\end{bmatrix}\\ B_{2_2} &= \begin{bmatrix}0 & 1 & 8 & -2\\ 0 & 0 & 0 & 0\\ 0 & 0 & 0 & 0\\ 0 & 0 & 0 & 0\end{bmatrix} \end{align}

최종적으로, 행렬 지수 함수는 다음과 같다.

:e^{tA} = \begin{bmatrix} e^t & te^t & \left(8t - 48\right) e^t\! + \left(4t + 48\right)e^{\frac{3}{4}t} & \left(16 - 2\,t\right)e^t\! + \left(-2t - 16\right)e^{\frac{3}{4}t}\\ 0 & e^t & 8e^t\! + \left(-t - 8\right) e^{\frac{3}{4}t} & -2e^t + \frac{t + 4}{2}e^{\frac{3}{4}t}\\ 0 & 0 & \frac{t + 4}{4}e^{\frac{3}{4}t} & -\frac{t}{8}e^{\frac{3}{4}t}\\ 0 & 0 & \frac{t}{2}e^{\frac{3}{4}t} & -\frac{t - 4}{4}e^{\frac{3}{4}t} \end{bmatrix}

이 절차는 푸처 알고리즘보다 간결하다.

4. 5. 로랑 급수

케일리-해밀턴 정리에 따라 행렬 지수 함수는 n-1차 다항식으로 표현될 수 있다.

와 가 한 변수의 0이 아닌 다항식이고, 이며, 메로모픽 함수

f(z)=\frac{e^{t z}-Q_t(z)}{P(z)}

전해석 함수라면,

e^{t A} = Q_t(A).

가 성립한다. 이를 증명하려면 위의 두 등식 중 첫 번째에 를 곱하고 를 로 대체한다.

이러한 다항식 는 다음과 같이 찾을 수 있다. - 실베스터 공식 참조. 를 의 근으로 놓고, 는 와 의 에서의 주요 부분의 곱으로 계산된다. 이는 관련 프로베니우스 공변량에 비례한다. 가 의 모든 근을 순회하는 경우, ''Qa,t''의 합 ''St''를 특정 로 사용할 수 있다. 다른 모든 는 에 의 배수를 더하여 얻을 수 있다. 특히, , 즉 라그랑주-실베스터 다항식은 차수가 보다 작은 유일한 이다.

4. 6. 파데 근사

일반적인 행렬 거듭제곱의 계산을 정확도와 정밀도를 가지고 수행하는 것은 매우 어려우며, 현재에도 수학, 특히 수치 해석에서 중요한 연구 주제 중 하나이다. MATLAB이나 GNU Octave는 파데 근사를 사용한다.[25][26]

5. 응용

행렬 지수 함수는 연립 상미분 방정식의 수치 해법인 지수 적분기 연구에서 중요하게 여겨진다.[28]

5. 1. 선형 미분 방정식

행렬 지수 함수는 선형 상미분 방정식 시스템을 푸는 데 중요한 역할을 한다.

다음과 같은 초기 조건 문제를 생각해 보자.

:\mathbf x'(t)=A\mathbf x(t)

:\mathbf x(0)=\mathbf x_0

여기서 \mathbf x(t)는 벡터 함수, A는 상수 행렬, \mathbf x_0는 초기 조건 벡터이다. 이 문제의 해는 다음과 같이 행렬 지수 함수를 사용하여 표현할 수 있다.

:\mathbf x(t)=\exp(At)\mathbf x_0

행렬 지수 함수는 동차 방정식뿐만 아니라, 다음과 같은 비동차 방정식도 풀 수 있다.

:\frac{d}{dt} y(t) = Ay(t) + z(t), \quad y(0) = y_0.

이에 대한 예시는 응용 섹션에서 확인할 수 있다.

만약 A가 상수 행렬이 아닌, 시간에 따라 변하는 함수 A(t)라면, 다음과 같은 미분 방정식

:\frac{d}{dt} y(t) = A(t) \, y(t), \quad y(0) = y_0,

에 대한 닫힌 형식의 해는 일반적으로 존재하지 않는다. 하지만, 마그누스 급수를 이용하면 해를 무한 급수 형태로 나타낼 수 있다.

5. 1. 1. 동차 선형 미분 방정식

행렬 지수 함수는 선형 미분 방정식 시스템에 적용될 수 있다. (행렬 미분 방정식도 참조). 다음과 같은 형태의 ''동차'' 미분 방정식은

:\mathbf{y}' = A\mathbf{y}

는 해 e^{At} \mathbf{y}(0)를 갖는다.

벡터

:\mathbf{y}(t) = \begin{bmatrix} y_1(t) \\ \vdots \\y_n(t) \end{bmatrix} ~,

를 고려하면, ''동차'' 연립 선형 미분 방정식은 다음과 같이 표현될 수 있다.

:\mathbf{y}'(t) = A\mathbf{y}(t).

5. 1. 2. 비동차 선형 미분 방정식

비동차(Inhomogeneous) 선형 미분 방정식은 다음과 같은 형태로 표현될 수 있다.

:\mathbf{y}'(t) = A\mathbf{y}(t)+\mathbf{b}(t).

여기서 '''y'''(t)는 다음과 같은 열 벡터이다.

:\mathbf{y}(t) = \begin{bmatrix} y_1(t) \\ \vdots \\y_n(t) \end{bmatrix} ~.

이 방정식의 해는 적분 인자 e^{-At}를 사용하여 구할 수 있다. 양변에 e^{-At}를 곱하면 다음과 같이 정리된다.

:\begin{align}

& & e^{-At}\mathbf{y}'-e^{-At}A\mathbf{y} &= e^{-At}\mathbf{b} \\

&\Rightarrow & e^{-At}\mathbf{y}'-Ae^{-At}\mathbf{y} &= e^{-At}\mathbf{b} \\

&\Rightarrow & \frac{d}{dt} \left(e^{-At}\mathbf{y}\right) &= e^{-At}\mathbf{b}~.

\end{align}

두 번째 단계는 AB = BA인 경우 e^{At}B = Be^{At}가 성립하기 때문에 가능하다.

e^{At}를 계산하고, 위 식을 t에 대해 적분하면 시스템의 해를 구할 수 있다.

최종적으로 해는 다음과 같이 주어진다.[1]

:\mathbf{y}(t) = e^{At}\mathbf{y}(0) + \int_0^t e^{A(t-s)}\mathbf{b}(s)ds

여기서 e^{\textbf{A}t}는 행렬 지수 함수이므로 e^{\textbf{A}t} e^{-\textbf{A}t} = I (단위행렬)가 성립한다. 즉, \exp{\textbf{A}t} = \exp{(- \textbf{A}t)^{-1}}이다.

6. 지수 사상

행렬의 지수 함수는 항상 가역 행렬이다. e^X의 역행렬은 e^{-X}로 주어진다. 이는 복소수의 지수 함수가 항상 0이 아닌 것과 유사하다. 따라서 행렬 지수 함수는 다음과 같은 사상을 제공한다.

:\exp \colon M_n(\Complex) \to \mathrm{GL}(n, \Complex)

여기서 M_n(\Complex)는 모든 ''n''×''n'' 행렬의 공간이고, \mathrm{GL}(n, \Complex)는 차수 n의 일반 선형군으로, 즉 모든 ''n''×''n'' 가역 행렬의 이다. 사실, 이 사상은 전사 함수인데, 이는 모든 가역 행렬이 다른 행렬의 지수 함수로 표현될 수 있다는 것을 의미한다.[9]

임의의 두 행렬 XY에 대해,

:\left\| e^{X+Y} - e^X\right\| \le \|Y\| e^{\|X\|} e^{\|Y\|},

여기서 \| \cdot \|는 임의의 행렬 노름을 나타낸다. 결과적으로 지수 함수는 M_n(\Complex)의 콤팩트 집합에서 연속이고 립시츠 연속이다.

사상

:t \mapsto e^{tX}, \qquad t \in \R

는 일반 선형군에서 매끄러운 곡선을 정의하며, t=0에서 항등원을 통과한다.

사실, 이것은 일반 선형군의 1-매개변수 부분군을 제공하는데, 왜냐하면

:e^{tX}e^{sX} = e^{(t + s)X}.

이기 때문이다. 점 ''t''에서의 이 곡선의 도함수 (또는 접선 벡터)는 다음과 같다.

:\frac{d}{dt}e^{tX} = Xe^{tX} = e^{tX}X.

t=0에서의 도함수는 단순히 행렬 ''X''인데, 이는 ''X''가 이 1-매개변수 부분군을 생성한다는 것을 의미한다.

더 일반적으로,[10] 일반적인 t에 의존하는 지수 X(t)에 대해,

:\frac{d}{dt}e^{X(t)} = \int_0^1 e^{\alpha X(t)} \frac{dX(t)}{dt} e^{(1 - \alpha) X(t)}\,d\alpha ~.

위의 식 e^{X(t)}를 적분 기호 밖으로 가져와 Hadamard 보조정리를 사용하여 피적분 함수를 전개하면 행렬 지수 함수의 도함수에 대한 다음과 같은 유용한 식을 얻을 수 있다.[11]

:\left(\frac{d}{dt}e^{X(t)}\right)e^{-X(t)} = \frac{d}{dt}X(t) + \frac{1}{2!} \left[X(t), \frac{d}{dt}X(t)\right] + \frac{1}{3!} \left[X(t), \left[X(t), \frac{d}{dt}X(t)\right]\right] + \cdots

7. 행렬의 행렬 거듭제곱

다른 행렬의 행렬 지수 함수(행렬-행렬 지수 함수)[24]는 다음과 같이 정의된다.

:X^Y = e^{\log(X) \cdot Y}

: ^Y\!X = e^{Y \cdot \log(X)}

정규이자 비특이 ''n'' × ''n'' 행렬 ''X'' 및 임의의 복소수 ''n'' × ''n'' 행렬 ''Y''에 대해.

행렬-행렬 지수 함수의 경우, 행렬-행렬 곱셈 연산자가 교환 법칙을 따르지 않기 때문에 왼쪽 지수 함수''Y''''X''와 오른쪽 지수 함수 ''X''''Y'' 사이에 차이가 있다. 또한,


  • ''X''가 정규이고 비특이 행렬이면, ''X''''Y''''Y''''X''는 동일한 고유값을 갖는다.
  • ''X''가 정규이고 비특이 행렬이며, ''Y''가 정규이고, ''XY'' = ''YX''이면, ''X''''Y'' = ''Y''''X''이다.
  • ''X''가 정규이고 비특이 행렬이며, ''X'', ''Y'', ''Z''가 서로 교환 가능하면, ''X''''Y''+''Z'' = ''X''''Y''·''X''''Z''''Y''+''Z''''X'' = ''Y''''X''·''Z''''X''이다.


행렬 지수 함수와 행렬 로그 함수가 알려져 있다면, 정규 및 가역인 ''n''차 정방 행렬 ''X''와 ''n''차 복소 정방 행렬 ''Y''에 대해, 행렬의 행렬 거듭제곱(matrix-matrix exponential)[27]

:\begin{align}

X^Y &= e^{\log(X) \cdot Y}, \\

\!{}^Y \!\!X\, &= e^{Y \cdot \log(X)}

\end{align}

로 정의할 수 있다. 여기서 행렬 곱셈은 비가환적이므로, 행렬의 행렬 거듭제곱도 왼쪽 거듭제곱''Y''''X''과 오른쪽 거듭제곱 ''X''''Y''의 구별이 생긴다는 점에 유의해야 한다. 더 나아가,

  • ''X''가 정규이고 가역적이면, ''X''''Y''''Y''''X''는 고유값 집합이 일치한다.
  • ''X''가 정규이고 가역적이며, ''Y''가 정규이고, ''XY'' = ''YX''가 성립한다면, ''X''''Y'' = ''Y''''X''가 성립한다.
  • ''X''가 정규이고 가역적이며, ''X'', ''Y'', ''Z''가 어떤 두 개도 가환적이면, ''X''''Y''+''Z'' = ''X''''Y''·''X''''Z'', ''Y''+''Z''''X'' = ''Y''''X''·''Z''''X''가 성립한다.

참조

[1] 서적
[2] 서적
[3] 서적
[4] 서적
[5] 서적
[6] 서적 Matrix Analysis Springer
[7] 논문 Convex trace functions and the Wigner–Yanase–Dyson conjecture http://www.numdam.or[...]
[8] 논문 Remarks on two theorems of E. Lieb http://projecteuclid[...]
[9] 서적
[10] 논문 Exponential Operators and Parameter Differentiation in Quantum Physics
[11] 서적
[12] 논문 Twice differentiable spectral functions https://people.orie.[...] 2001
[13] 논문 Speckle reduction in matrix-log domain for synthetic aperture radar imaging 2022
[14] 웹사이트 Matrix exponential – MATLAB expm – MathWorks Deutschland http://www.mathworks[...] Mathworks.de 2011-04-30
[15] 웹사이트 GNU Octave – Functions of a Matrix http://www.network-t[...] Network-theory.co.uk 2007-01-11
[16] 웹사이트 R - pkg {Matrix}: Matrix Exponential https://search.r-pro[...] 2005-02-28
[17] 웹사이트 scipy.linalg.expm function documentation http://docs.scipy.or[...] The SciPy Community 2015-01-18
[18] 서적
[19] 문서 in a Euclidean space
[20] 서적 Space Time Matter https://books.google[...] Dover
[21] 서적 Relativistic Quantum Mechanics https://archive.org/[...] McGraw-Hill
[22] 간행물 The equivalence of definitions of a matric function https://www.jstor.or[...]
[23] 문서 This can be generalized; in general, the exponential of {{math|''J''''n''(''a'')}} is an upper triangular matrix with {{math|''e''''a''/0!}} on the main diagonal, {{math|''e''''a''/1!}} on the one above, {{math|''e''''a''/2!}} on the next one, and so on.
[24] 웹사이트 Iterated Exponentiation, Matrix-Matrix Exponentiation, and Entropy http://www.rockefell[...] Academic Press, Inc. 1994
[25] 웹사이트 Matrix exponential - MATLAB expm - MathWorks Deutschland http://www.mathworks[...] Mathworks.de 2013-06-05
[26] 웹사이트 GNU Octave - Functions of a Matrix http://www.network-t[...] Network-theory.co.uk 2013-06-05
[27] 간행물 Iterated Exponentiation, Matrix-Matrix Exponentiation, and Entropy http://www.rockefell[...] Academic Press, Inc.
[28] 문서



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com