맨위로가기

헤세 행렬

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

헤세 행렬은 실함수의 이계도함수를 정사각 행렬 형태로 나타낸 것으로, 함수의 극대/극소, 최적화 문제, 컴퓨터 비전 등 다양한 분야에 활용된다. 함수 f의 헤세 행렬은 기울기의 야코비 행렬의 전치 행렬이며, 2차 편미분이 연속일 경우 대칭 행렬이 된다. 헤세 행렬의 행렬식은 헤시안이라고 불리며, 이계도함수 판정법을 통해 함수의 임계점 성질을 파악하는 데 사용된다. 최적화 문제에서는 뉴턴형 방법에 활용되며, 경계 헤세 행렬과 벡터-값 함수, 복소 헤세 행렬, 리만 다양체 상의 헤세 행렬 등으로 일반화될 수 있다.

더 읽어볼만한 페이지

  • 모스 이론 - 렙셰츠 초평면 정리
    렙셰츠 초평면 정리는 복소수체 위의 사영 대수다양체 X와 초평면의 교집합 Y에 대해, X\setminus Y가 매끄러운 다양체일 때, 특이 호몰로지 군, 특이 코호몰로지 군, 호모토피 군 사이의 특정 군 준동형들이 동형사상 또는 전사 함수가 됨을 보이는 정리이며, 상대 호몰로지 군, 상대 코호몰로지 군, 상대 호모토피 군의 소멸 정리와 동치이다.
  • 모스 이론 - 류스테르니크-시니렐만 범주
    류스테르니크-시니렐만 범주는 위상 공간의 복잡성을 측정하는 불변량으로, 특정 덮개로 분해하는 데 필요한 최소 단계 수를 나타내며, 위상수학, 미분기하학, 대수적 위상수학 등에서 중요한 역할을 한다.
  • 특이점 이론 - 임계점 (수학)
    임계점은 매끄러운 다양체 위의 미분 가능한 실수 함수에서 특정 조건을 만족하는 점으로, 실변수 함수의 경우 미분 불가능하거나 도함수가 0인 정의역 내의 값이며, 함수의 극값 위치를 찾는 데 중요한 역할을 한다.
  • 특이점 이론 - 특이점 (대수기하학)
    특이점은 스킴의 각 점에서의 줄기 국소환이 정칙 국소환이 되지 못하는 점으로, 대수적으로 닫힌 체 위의 정칙 스킴인 비특이 대수다양체는 초곡면의 편미분이 동시에 소멸되는 점으로 정의되며 야코비 행렬의 계수로 판별된다.
  • 다변수 미적분학 - 음함수와 양함수
    음함수와 양함수는 함수의 표현 방식에 따른 분류로, 독립변수와 종속변수의 관계가 명시적으로 나타나는 경우를 양함수, 관계식이 한 식 안에 포함된 경우를 음함수라 하며, 음함수는 양함수로 표현하기 어렵거나 불가능한 경우가 있고, 음함수 미분법, 음함수 정리 등을 통해 여러 분야에서 활용된다.
  • 다변수 미적분학 - 편평도
    편평도는 아직 내용이 없어 정의를 내릴 수 없는 위키백과 페이지이다.
헤세 행렬
개요
유형정방행렬
기호Hf
정의2차 편미분 행렬
정의
요소(Hf)ij = ∂²f/∂xi∂xj
변수f는 스칼라 함수
xi는 i번째 변수
성질
대칭성f의 2차 편미분이 연속이면 대칭
응용지역 극값 찾기
볼록 함수 판별
뉴턴 방법

2. 정의

실함수한국어 f(x_{1}, x_{2}, x_{3}, ..., x_{n})이 주어졌을 때, '''헤세 행렬'''은 이 함수의 모든 이계 편미분들을 원소로 하는 정사각행렬이다. 헤세 행렬은 함수의 기울기 벡터의 야코비 행렬로도 표현 가능하다.[1]

2. 1. 기본 정의

n개의 변수를 갖는 실함수 f(x_{1}, x_{2}, ..., x_{n})에 대해, 헤세 행렬은 다음과 같이 정의된다.

:H_f = \begin{bmatrix}

\frac{\partial^{2} f}{\partial x_{1}^2} & \frac{\partial^{2} f}{\partial x_{1} \partial x_{2}} & \cdots & \frac{\partial^{2} f}{\partial x_{1} \partial x_{n}} \\

\frac{\partial^{2} f}{\partial x_{2} \partial x_{1}} & \frac{\partial^{2} f}{\partial x_{2}^2} & \cdots & \vdots \\

\vdots & \vdots & \ddots & \vdots \\

\frac{\partial^{2} f}{\partial x_{n} \partial x_{1}} & \cdots & \cdots & \frac{\partial^{2} f}{\partial x_{n}^2}

\end{bmatrix}

즉, i번째 행과 j번째 열의 요소는 다음과 같다.

:(\mathbf H_f)_{i,j} = \frac{\partial^2 f}{\partial x_i \, \partial x_j}.

헤세 행렬은 함수의 기울기 벡터 \nabla f에 대한 야코비 행렬의 전치행렬로도 설명이 가능하다. 즉, \mathbf{H}(f(\mathbf{x})) = \mathbf{J}(\nabla f(\mathbf{x}))^\mathsf{T}.

함수 f의 이계도함수가 연속이라면 혼합 편미분은 같다. 그 때 이 행렬은 대칭행렬이다.

2. 2. 야코비 행렬과의 관계

함수 f의 헤세 행렬은 함수 f기울기야코비 행렬의 전치 행렬이다. 즉, \mathbf{H}(f(\mathbf{x})) = \mathbf{J}(\nabla f(\mathbf{x}))^\mathsf{T}이다.[1]

3. 성질

함수 f의 이계도함수가 연속이면 혼합 편미분은 같아지므로 헤세 행렬은 대칭행렬이 된다. 함수 f의 헤세 행렬은 함수 f기울기야코비 행렬의 전치 행렬이다. 즉, \mathbf{H}(f(\mathbf{x})) = \mathbf{J}(\nabla f(\mathbf{x}))^\mathsf{T}이다.

3. 1. 대칭성

함수 f의 이계도함수가 연속이면 혼합 편미분은 같다. 이때 이 행렬은 대칭행렬이다. 2차 편미분이 모두 연속적이라면, 헤세 행렬은 2차 도함수의 대칭성에 의해 대칭 행렬이다.

함수 f의 헤세 행렬의 주대각선 상 이외의 성분을 '''혼합 미분''' (mixed derivatives)이라고 한다. 혼합 미분이 모두 연속일 때, 미분 순서를 고려하지 않아도 된다.

예를 들어,

:\frac {\partial}{\partial x} \left( \frac { \partial f }{ \partial y} \right) =

\frac {\partial}{\partial y} \left( \frac { \partial f }{ \partial x} \right)

이것은 다음과 같이 쓸 수도 있다.

:f_{yx} = f_{xy} \,

즉, ''f'' 의 이차 미분이 모두 연속인 영역 ''D'' 에서, ''f'' 의 헤세 행렬은 대칭 행렬이다.

3. 2. 헤세 행렬식

2차 도함수의 대칭성에 의해 대칭 행렬이 되는 헤세 행렬의 행렬식을 헤세 행렬식이라고 한다.[1]

4. 응용

헤세 행렬은 함수의 극값 판정, 최적화, 영상 처리 등 다양한 분야에서 활용된다.


  • 극값 판정: 함수의 임계점에서 헤세 행렬의 고윳값 부호를 통해 극대, 극소, 안장점 여부를 판별할 수 있다. 자세한 내용은 #이계도함수 판정법 문단을 참고할 수 있다.
  • 최적화: 뉴턴 방법과 같은 수리 최적화 문제에서 함수의 국소적 테일러 급수의 이차항 계수로 활용된다.
  • 영상 처리: 컴퓨터 비전에서 가우시안 라플라시안(LoG) 블롭 검출기, 헤세 행렬식(DoH) 블롭 검출기 등 영상 처리 연산에 사용된다.[8]
  • 기타 응용: 적외선 분광법에서 분자 진동수 계산,[8] 통계 진단, 국소 민감도 분석,[9] 모스 이론 및 재앙 이론에서 임계점 분류[2][3][4] 등에 활용된다.

4. 1. 이계도함수 판정법

함수 f:U\sub\mathbb{R}^n\to\mathbb{R}n=2테일러 급수는 헤세 행렬을 이용해서 나타낼 수 있다. \mathbf{h}\in\mathbb{R}^n에 대해 \Delta f:= f\left(\mathbf{x}_0+\mathbf{h}\right) -f\left(\mathbf{x}_0\right) \approx J\left(\mathbf{x}_0\right)\mathbf{h}+\frac{1}{2}\mathbf{h}^TH_f \left(\mathbf{x}_0\right)\mathbf{h}이다. (여기서 \mathbf{h}^T\mathbf{h}가 열벡터라고 할 때 그 전치행렬인 행벡터를 의미한다.) 만약 \mathbf{x}_0임계점이라면 \mathbf{D}f\left(\mathbf{x}_0\right) =0이므로 \Delta f \approx \frac{1}{2}\mathbf{h}^TH_f\left(\mathbf{x}_0\right)\mathbf{h}이다. 즉, 상수가 아닌 가장 첫 번째 항이 바로 헤세 행렬이 된다.

이계도함수 판정법은 헤세 행렬의 정부호성에 따라 임계점의 종류(극대, 극소, 안장점)를 판별하는 방법이다. 헤세 행렬의 고윳값 부호를 통해 임계점의 종류를 판별한다.

국소 극소 또는 극대에 충분한 2차 조건은 헤세 행렬의 주 소행렬(부분 행렬의 행렬식)의 수열로 표현될 수 있다. 이는 구속 최적화를 위한 경계 헤세 행렬에 대해 주어지는 조건의 특별한 경우이다(구속 조건의 수는 0). 구체적으로, 최소값에 대한 충분 조건은 이러한 모든 주 소행렬이 양수여야 하는 반면, 최대값에 대한 충분 조건은 소행렬이 부호를 교대로 가져야 하며, 1 \times 1 소행렬은 음수여야 한다.

4. 1. 1. 극값 판정

함수 f의 이계도함수가 연속이면 헤세 행렬은 대칭행렬이므로 스펙트럼 정리에 따라 헤세 행렬을 직교대각화할 수 있다. 헤세 행렬의 고윳값 부호에 따라 이차형식의 정부호성을 판별하여 극값을 판정한다.

  • 헤세 행렬의 고윳값이 모두 양수일 경우, 이차형식은 양의 정부호이고, 임계점은 극솟값이다.
  • 헤세 행렬의 고윳값이 모두 음수일 경우, 이차형식은 음의 정부호이고, 임계점은 극댓값이다.
  • 헤세 행렬의 고윳값에 양수와 음수가 섞여 있는 경우, 이차형식은 부정부호(indefinite)이고, 임계점은 안장점이 된다.


볼록 함수의 헤세 행렬은 반 양의 정부호 행렬이다. 헤세 행렬이 양의 정부호 행렬이면 f는 고립된 국소 극솟값을 갖고, 음의 정부호 행렬이면 f는 고립된 국소 극댓값을 갖는다. 헤세 행렬이 양의 고윳값과 음의 고윳값을 모두 가지면 안장점이다. 그렇지 않으면 테스트는 결정적이지 않다.

반 양의 정부호 및 반 음의 정부호 헤세 행렬의 경우 테스트는 결정적이지 않지만, 모스 이론의 관점에서 더 많은 것을 말할 수 있다.

변수가 하나 또는 두 개인 함수의 이계도함수 판정법은 일반적인 경우보다 간단하다. 한 변수의 경우 헤세 행렬은 하나의 이계도함수를 포함한다. 이계도함수가 양수이면 국소 극솟값, 음수이면 국소 극댓값, 0이면 테스트는 결정적이지 않다. 두 변수의 경우 행렬식을 사용할 수 있는데, 행렬식은 고윳값의 곱이기 때문이다. 행렬식이 양수이면 고윳값이 모두 양수이거나 모두 음수이다. 행렬식이 음수이면 두 고윳값의 부호가 다르다. 0이면 이계도함수 판정법은 결정적이지 않다.

4. 1. 2. 임계점 분류

함수의 기울기가 어떤 점 '''x'''에서 0이면, ''f''는 '''x'''에서 임계점 또는 정류점을 갖는다. '''x'''에서의 헤세 행렬의 행렬식은 판별식이라고 불리며, 이 행렬식이 0이면 '''x'''는 ''f''의 퇴화 임계점 또는 비모스 임계점이라고 불린다. 그렇지 않으면 비퇴화 임계점이며, ''f''의 모스 임계점이라고 불린다.[2][3][4]

헤세 행렬은 모스 이론에서 중요한 역할을 하는데, 그 이유는 헤세 행렬의 커널과 고유값이 임계점의 분류를 가능하게 하기 때문이다.

4. 2. 최적화

헤세 행렬은 함수의 국소적 테일러 급수의 이차항의 계수이므로 뉴턴 방법 등 대규모 수리 최적화 문제에 사용된다. 즉,

:y = f(\mathbf{x} + \Delta\mathbf{x})\approx f(\mathbf{x}) + \nabla f(\mathbf{x})^\mathsf{T} \Delta\mathbf{x} + \frac{1}{2} \, \Delta\mathbf{x}^\mathsf{T} \mathbf{H}(\mathbf{x}) \, \Delta\mathbf{x}

여기서 \nabla f기울기 \left(\frac{\partial f}{\partial x_1}, \ldots, \frac{\partial f}{\partial x_n}\right)이다.

전체 헤세 행렬을 계산하고 저장하는 데는 \Theta\left(n^2\right) 메모리가 필요하다. 이는 인공 신경망, 조건부 확률장과 같이 많은 수의 매개변수를 가진 통계 모델손실 함수와 같은 고차원 함수에는 실현 불가능하다. 이러한 상황을 위해 절단 뉴턴법과 준 뉴턴법 알고리즘이 개발되었다. 후자의 알고리즘군은 헤세 행렬의 근사치를 사용하며, 가장 인기 있는 준 뉴턴 알고리즘 중 하나는 BFGS이다.[5]

이러한 근사치는 최적화 알고리즘이 헤세 행렬을 선형 연산자 \mathbf{H}(\mathbf{v})로만 사용한다는 사실을 이용하며, 헤세 행렬이 기울기의 국소 전개에도 나타난다는 것을 먼저 알아차림으로써 진행할 수 있다.

:\nabla f (\mathbf{x} + \Delta\mathbf{x}) = \nabla f (\mathbf{x}) + \mathbf{H}(\mathbf{x}) \, \Delta\mathbf{x} + \mathcal{O}(\|\Delta\mathbf{x}\|^2)

어떤 스칼라 r에 대해 \Delta \mathbf{x} = r \mathbf{v}라고 하면,

:\mathbf{H}(\mathbf{x}) \, \Delta\mathbf{x} = \mathbf{H}(\mathbf{x})r\mathbf{v} = r\mathbf{H}(\mathbf{x})\mathbf{v} = \nabla f (\mathbf{x} + r\mathbf{v}) - \nabla f (\mathbf{x}) + \mathcal{O}(r^2),

즉,

:\mathbf{H}(\mathbf{x})\mathbf{v} = \frac{1}{r} \left[\nabla f(\mathbf{x} + r \mathbf{v}) - \nabla f(\mathbf{x})\right] + \mathcal{O}(r)

따라서 기울기가 이미 계산된 경우, 대략적인 헤세 행렬은 기울기 크기에 대한 선형적인 스칼라 연산으로 계산할 수 있다.

4. 3. 영상 처리

컴퓨터 비전 분야에서 가우시안 라플라시안(LoG) 블롭 검출기, 헤세 행렬식(DoH) 블롭 검출기 및 스케일 공간과 같은 영상 처리 연산자를 표현하는 데 일반적으로 사용된다.[8]

4. 4. 기타 응용

헤세 행렬은 적외선 분광법에서 분자 진동수를 계산하거나,[8] 통계 진단, 국소 민감도 분석 등에 활용된다.[9] 모스 이론과 재앙 이론에서 헤세 행렬의 커널과 고유값이 임계점 분류를 가능하게 하므로 중요한 역할을 한다.[2][3][4]

함수를 다양체로 간주했을 때, 함수의 임계점에서 평가된 헤세 행렬의 행렬식은 가우스 곡률과 같다. 그 점에서 헤세 행렬의 고유값은 함수의 주 곡률이며, 고유 벡터는 곡률의 주 방향이다.

5. 일반화

헤세 행렬은 다변수 복소수 함수 및 리만 다양체 상의 함수로 일반화할 수 있다.


  • 복소 헤세 행렬: 다변수 복소수 함수 f\colon\Complex^n \to \Complex에서, {\mathbb{C}}^n{\mathbb{R}}^{2n}와 동일시하면 일반적인 "실수" 헤세 행렬은 2n \times 2n 행렬이 된다. 하지만, 다변수 복소수 함수는 정칙 함수이므로, 코시-리만 조건을 만족한다. 따라서 정칙적 변화에 불변하는 정보를 담고 있는 헤세 행렬의 부분, 즉 \left(\frac{\partial^2f}{\partial z_j \partial\bar{z}_k}\right)_{j,k}를 복소 헤세 행렬로 정의한다. f가 정칙 함수이면 복소 헤세 행렬은 항상 0이 되므로, 복소 헤세 행렬은 매끄럽지만 정칙적이지 않은 함수를 연구하는 데 사용된다. (예: 레비 의사 볼록성) 정칙 함수를 다룰 때는 헤세 행렬 \left(\frac{\partial^2f}{\partial z_j \partial z_k}\right)_{j,k}를 고려할 수 있다.
  • 리만 다양체 상의 헤세 행렬: 리만 다양체 (M,g)와 그 레비-치비타 접속 \nabla가 주어졌을 때, 매끄러운 함수 f\colon M \to \mathbb{R}의 헤세 텐서 \operatorname{Hess}(f) \in \Gamma(T^*M \otimes T^*M)\operatorname{Hess}(f) := \nabla \nabla f = \nabla df로 정의된다. 여기서 함수의 1차 공변 미분은 일반적인 미분과 같다. 국소 좌표 \left\{x^i\right\}에서 헤세 행렬은 \operatorname{Hess}(f)=\nabla_i\, \partial_j f \ dx^i \!\otimes\! dx^j = \left(\frac{\partial^2 f}{\partial x^i \partial x^j} - \Gamma_{ij}^k \frac{\partial f}{\partial x^k}\right) dx^i \otimes dx^j로 표현된다. (\Gamma^k_{ij}크리스토펠 기호)

5. 1. 경계 헤세 행렬

'''경계 헤세 행렬'''은 제약 조건이 있는 최적화 문제에서 2계 도함수 검정에 사용된다. 함수 f가 주어지고, 제약 함수 g(\mathbf{x}) = c를 추가하면, 경계 헤세 행렬은 라그랑주 승수 \Lambda(\mathbf{x}, \lambda) = f(\mathbf{x}) + \lambda[g(\mathbf{x}) - c]의 헤세 행렬이다.[10]

:\mathbf H(\Lambda) =

\begin{bmatrix}

0 & \dfrac{\partial g}{\partial x_1} & \dfrac{\partial g}{\partial x_2} & \cdots & \dfrac{\partial g}{\partial x_n} \\[2.2ex]

\dfrac{\partial g}{\partial x_1} & \dfrac{\partial^2 \Lambda}{\partial x_1^2} & \dfrac{\partial^2 \Lambda}{\partial x_1\,\partial x_2} & \cdots & \dfrac{\partial^2 \Lambda}{\partial x_1\,\partial x_n} \\[2.2ex]

\dfrac{\partial g}{\partial x_2} & \dfrac{\partial^2 \Lambda}{\partial x_2\,\partial x_1} & \dfrac{\partial^2 \Lambda}{\partial x_2^2} & \cdots & \dfrac{\partial^2 \Lambda}{\partial x_2\,\partial x_n} \\[2.2ex]

\vdots & \vdots & \vdots & \ddots & \vdots \\[2.2ex]

\dfrac{\partial g}{\partial x_n} & \dfrac{\partial^2 \Lambda}{\partial x_n\,\partial x_1} & \dfrac{\partial^2 \Lambda}{\partial x_n\,\partial x_2} & \cdots & \dfrac{\partial^2 \Lambda}{\partial x_n^2}

\end{bmatrix}

= \begin{bmatrix}

0 & \dfrac{\partial g}{\partial \mathbf x} \\

\left(\dfrac{\partial g}{\partial \mathbf x}\right)^\mathsf{T} & \dfrac{\partial^2 \Lambda}{\partial \mathbf x^2}

\end{bmatrix}

예를 들어, m개의 제약 조건이 있다면, 좌상단 코너의 0은 m \times m 블록의 영행렬이며, 상단에 m개의 테두리 행과 왼쪽에 m개의 테두리 열이 있다.

극값이 임계점에서 양의 정부호 또는 음의 정부호 헤세 행렬로 특징지어진다는 규칙은 여기서 적용될 수 없다. 테두리 헤세 행렬은 음의 정부호도 양의 정부호도 될 수 없기 때문이다. 왜냐하면 \mathbf{z}^\mathsf{T} \mathbf{H} \mathbf{z} = 0\mathbf{z}가 유일한 비영 엔트리가 첫 번째 항목인 벡터일 때 성립하기 때문이다.

2계 도함수 검정은 여기서 테두리 헤세 행렬의 특정 n - m개의 부분 행렬의 행렬식 부호 제한으로 구성된다.[11] 직관적으로, m개의 제약 조건은 문제를 n - m개의 자유 변수를 갖는 문제로 축소하는 것으로 생각할 수 있다. 예를 들어, 제약 조건 x_1 + x_2 + x_3 = 1 하에서 f\left(x_1, x_2, x_3\right)의 최대화는 f\left(x_1, x_2, 1 - x_1 - x_2\right)의 제약 조건 없는 최대화로 축소될 수 있다.

구체적으로, 테두리 헤세 행렬의 주 대각선 부분 행렬(좌상단 정렬된 부분 행렬의 행렬식)의 수열에 부호 조건이 부과된다. 여기서 처음 2 m개의 주 대각선 부분 행렬은 무시되고, 가장 작은 부분 행렬은 잘린 처음 2 m + 1개의 행과 열로 구성되며, 다음은 잘린 처음 2 m + 2개의 행과 열로 구성되는 등 마지막은 전체 테두리 헤세 행렬이다. 만약 2 m + 1n + m보다 크다면, 가장 작은 주 대각선 부분 행렬은 헤세 행렬 자체가 된다.[12] 따라서 n - m개의 부분 행렬을 고려해야 하며, 각 부분 행렬은 후보 최대 또는 최소로 간주되는 특정 점에서 평가된다. 국소 최대의 충분 조건은 이러한 부분 행렬이 (-1)^{m+1}의 부호를 가진 가장 작은 부분 행렬과 부호가 교대로 나타나는 것이다. 국소 최소의 충분 조건은 이러한 모든 부분 행렬이 (-1)^m의 부호를 갖는 것이다. (m=0인 제약 조건이 없는 경우, 이러한 조건은 테두리가 없는 헤세 행렬이 각각 음의 정부호 또는 양의 정부호가 되는 조건과 일치한다.)

5. 2. 벡터-값 함수

만약 ''f''가 벡터장 '''f''' : ℝn → ℝm 이라면, 즉

'''f'''('''x''') = (''f''1('''x'''), ''f''2('''x'''), …, ''f''m('''x'''))

이면, 2차 편미분들의 모음은 ''n'' × ''n'' 행렬이 아니라 3차 텐서가 된다. 이는 ''m''개의 헤세 행렬의 배열로 생각할 수 있으며, 각 행렬은 '''f'''의 각 성분에 해당한다.

'''H'''('''f''') = ('''H'''(''f''1), '''H'''(''f''2), …, '''H'''(''f''m)).

이 텐서는 ''m'' = 1일 때 일반적인 헤세 행렬로 축소된다.

5. 3. 복소 헤세 행렬

다변수 복소수 함수의 맥락에서, 헤세 행렬은 일반화될 수 있다. f\colon\Complex^n \to \Complex,이고, f\left(z_1, \ldots, z_n\right).라고 표기한다. {\mathbb{C}}^n{\mathbb{R}}^{2n}와 동일시하면, 일반적인 "실수" 헤세 행렬은 2n \times 2n 행렬이다. 다변수 복소수 함수에서 연구 대상은 정칙 함수이므로, n차원 Cauchy-Riemann 조건의 해이다. 따라서 일반적으로 좌표의 정칙적 변화에 불변하는 정보를 포함하는 헤세 행렬의 부분을 살펴본다. 이 "부분"이 소위 복소 헤세 행렬로, 행렬 \left(\frac{\partial^2f}{\partial z_j \partial\bar{z}_k}\right)_{j,k}.이다. f가 정칙 함수이면 복소 헤세 행렬은 항등적으로 0이 되므로, 복소 헤세 행렬은 매끄럽지만 정칙적이지 않은 함수를 연구하는 데 사용된다. 예를 들어 레비 의사 볼록성을 참조하라. 정칙 함수를 다룰 때는 헤세 행렬 \left(\frac{\partial^2f}{\partial z_j \partial z_k}\right)_{j,k}.를 고려할 수 있다.

5. 4. 리만 다양체 상의 헤세 행렬

리만 다양체 (M,g)와 그 레비-치비타 접속 \nabla가 주어졌을 때, 매끄러운 함수 f\colon M \to \mathbb{R}의 헤세 텐서 \operatorname{Hess}(f) \in \Gamma(T^*M \otimes T^*M)는 다음과 같이 정의된다.

:\operatorname{Hess}(f) := \nabla \nabla f = \nabla df

여기서 함수의 1차 공변 미분은 일반적인 미분과 같다.

국소 좌표 \left\{x^i\right\}에서 헤세 행렬은 다음과 같이 표현된다.

:\operatorname{Hess}(f)=\nabla_i\, \partial_j f \ dx^i \!\otimes\! dx^j = \left(\frac{\partial^2 f}{\partial x^i \partial x^j} - \Gamma_{ij}^k \frac{\partial f}{\partial x^k}\right) dx^i \otimes dx^j

여기서 \Gamma^k_{ij}크리스토펠 기호이다.

헤세 행렬은 다음과 같이 다르게 표현할 수도 있다.

:\operatorname{Hess}(f)(X, Y) = \langle \nabla_X \operatorname{grad} f,Y \rangle

:\operatorname{Hess}(f)(X,Y) = X(Yf)-df(\nabla_XY)

참조

[1] 서적 Calculus Concepts and Methods Cambridge University Press
[2] 서적 Advanced Calculus: A Geometric View https://books.google[...] Springer Science & Business Media 2010
[3] 서적 Recent Developments in General Relativity https://books.google[...] Springer Science & Business Media 2011
[4] 서적 Catastrophe theory Westview Press
[5] 서적 Numerical Optimization Springer Verlag
[6] 간행물 Fast exact multiplication by the Hessian http://www.bcl.hamil[...]
[7] 간행물 On the covariance-Hessian relation in evolution strategies Elsevier
[8] 간행물 Calculation of the infrared spectra of proteins http://link.springer[...] 2014-12-24
[9] 간행물 Matrix differential calculus with applications in the multivariate linear model and its diagnostics 2022-03
[10] 웹사이트 Econ 500: Quantitative Methods in Economic Analysis I https://www2.econ.ia[...] 2004-10-07
[11] 서적 Matrix Differential Calculus with Applications in Statistics and Econometrics John Wiley & Sons
[12] 서적 Fundamental Methods of Mathematical Economics https://archive.org/[...] McGraw-Hill
[13] 서적 Calculus Concepts and Methods Cambridge University Press
[14] 서적 Variational analysis https://books.google[...] Springer-Verlag
[15] 문서 Matrix Differential Calculus with Applications in Statistics and Econometrics Wiley



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com