기울기 (벡터)

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

기울기(Gradient)는 스칼라 함수 f(x)에 대한 나블라 연산자를 이용한 벡터 미분 연산으로, 함수의 각 성분에 대한 편미분으로 구성된 열벡터이다. 3차원 데카르트 좌표계, 원통 좌표계, 구면 좌표계 등 다양한 좌표계에서 기울기를 표현할 수 있으며, 등위선과 직교하는 성질을 갖는다. 기울기는 함수가 가장 가파르게 상승하는 방향을 나타내며, 방향 도함수를 최대화하는 방향과 일치한다. 또한, 기울기는 전미분과 밀접한 관련이 있으며, 야코비 행렬과 프레셰 도함수로 일반화될 수 있다.

기울기 (벡터)
개요
유형다변수 함수의 미분
분야미적분학, 다변수 미적분학
표기법∇(f), grad f
관련 개념방향 미분, 미분, 야코비 행렬, 헤세 행렬
정의
정의함수 값의 가장 가파른 증가 방향을 나타내는 벡터
유클리드 공간에서 정의유클리드 공간에서 스칼라 값 함수 f의 기울기는 각 점에 대해 다음과 같은 벡터를 정의함: ∇f = (∂f/∂x₁, ..., ∂f/∂xₙ)
함수f : ℝⁿ → ℝ
미분 가능성 조건모든 편미분이 존재하고 연속이어야 함
성질
방향 미분과의 관계기울기는 방향 미분을 최대화하는 방향을 나타냄
직교성기울기는 함수 등고선에 직교함
미분과의 관계기울기는 함수의 미분과 관련됨 (미분은 공간쌍대 벡터로 해석됨)
응용
최적화최적화 문제에서 함수가 증가하는 방향을 찾는 데 사용됨
경사 하강법기울기는 경사 하강법과 같은 최적화 알고리즘에 핵심적으로 활용됨
머신 러닝인공 신경망 학습의 역전파 과정에서 중요한 역할 수행
물리학전위 이론 및 기타 분야에서 폭넓게 응용됨
추가 정보
주의사항기울기는 미분가능 함수에 대해서만 정의됨.
📚 더 읽어볼만한 페이지
  • 미분의 일반화 - 야코비 행렬
    야코비 행렬은 열린 집합 U에서 정의된 함수 f의 각 성분 편도함수를 요소로 가지는 행렬이며, 함수가 미분 가능할 때 전미분을 나타내고, n=m일 경우 행렬식은 함수의 동작에 대한 정보를 제공하며 다양한 분야에 응용된다.
  • 미분의 일반화 - 미분 (주요 부분)
    미분은 함수의 변화율을 나타내는 수학적 개념으로, 독립 변수의 변화에 따른 종속 변수의 순간적인 변화를 선형 함수로 나타내며, 선형 근사, 오차 추정, 미분 방정식 해결 등 다양한 분야에 응용된다.
  • 벡터 미적분학 - 벡터장
    벡터장은 유클리드 공간이나 미분다양체의 각 점에 벡터를 대응시키는 사상으로, 유클리드 공간에서는 벡터값 함수로 표현되고 미분다양체에서는 접다발의 단면이나 도함수로 정의되며, 물리학, 기상, 유체역학, 전자기학, 컴퓨터 그래픽스 등 다양한 분야에서 응용된다.
  • 벡터 미적분학 - 회전 (벡터)
    회전(벡터)은 벡터장의 국소적인 회전 정도를 나타내는 벡터량으로, 벡터장을 선적분한 값과 폐곡선이 둘러싸는 면적의 비의 극한으로 정의되며, 물리적 현상 기술에 중요한 역할을 한다.
  • 미분학 - 음함수와 양함수
    음함수와 양함수는 함수의 표현 방식에 따른 분류로, 독립변수와 종속변수의 관계가 명시적으로 나타나는 경우를 양함수, 관계식이 한 식 안에 포함된 경우를 음함수라 하며, 음함수는 양함수로 표현하기 어렵거나 불가능한 경우가 있고, 음함수 미분법, 음함수 정리 등을 통해 여러 분야에서 활용된다.
  • 미분학 - 연쇄 법칙
    연쇄 법칙은 둘 이상의 미분 가능한 함수 합성의 미분법을 제공하며, z의 y에 대한 순간적인 변화율과 y의 x에 대한 순간적인 변화율을 곱하여 z의 x에 대한 순간적인 변화율을 계산하는 직관적인 아이디어를 바탕으로 실변수 함수, 다변수 함수 등 다양한 경우에 적용된다.

2. 정의

스칼라 함수 f의 기울기는 \boldsymbol{\nabla} f로 표현하며, \nabla 기호는 벡터 미분 연산자로 나블라(nabla) 혹은 델(del)연산자라고 부른다. 기울기는 f의 각 성분의 편미분으로 구성된 벡터로 정의되며, 다음과 같이 표시한다.

: \boldsymbol{\nabla} f = \left(\frac{\partial f}{\partial x_1 }, \dots, \frac{\partial f}{\partial x_n } \right)

3차원 직교 좌표계에서 함수 f(x,y,z)= \ 2x+3y^2-\sin(z)의 기울기는 다음과 같다.

:\boldsymbol{\nabla} f= \begin{pmatrix}
{\frac{\partial f}{\partial x}},
{\frac{\partial f}{\partial y}},
{\frac{\partial f}{\partial z}}
\end{pmatrix} =
\begin{pmatrix}
{2},
{6y},
{-\cos(z)}
\end{pmatrix}

함수 의 기울기를 함수의 의사색상 그림 위에 화살표로 표시했습니다.
함수 의 기울기를 함수의 의사색상 그림 위에 화살표로 표시했습니다.


기울기는 주어진 점에서 함수 값이 가장 빠르게 증가하는 방향과 그 증가율을 나타낸다. 예를 들어, 온도가 스칼라장 로 주어지는 방에서 각 지점 의 기울기는 온도가 가장 빠르게 상승하는 방향을 가리키며, 기울기의 크기는 그 방향에서 온도가 얼마나 빨리 상승하는지를 나타낸다.

함수 의 기울기를 아래 평면에 투영된 벡터장으로 나타낸 그림.
함수 의 기울기를 아래 평면에 투영된 벡터장으로 나타낸 그림.

--

기울기는 내적을 통해 다른 방향으로의 변화율도 측정할 수 있다. 예를 들어, 언덕의 가장 가파른 경사가 40%일 때, 언덕 위로 직접 올라가는 도로의 경사는 40%이지만, 비스듬히 올라가는 도로의 경사는 더 완만하다. 도로가 언덕 위 방향과 60° 각도를 이룬다면, 도로를 따라가는 경사는 기울기 벡터와 도로를 따라가는 단위 벡터 사이의 내적, 즉 40%에 60°의 코사인을 곱한 20%가 된다.

2.1. 다양한 좌표계에서의 기울기

직교 좌표계에서 기울기는 다음과 같이 주어진다.

\nabla f = \frac{\partial f}{\partial x} \mathbf{i} + \frac{\partial f}{\partial y} \mathbf{j} + \frac{\partial f}{\partial z} \mathbf{k},

여기서 \mathbf{i}, \mathbf{j}, \mathbf{k}는 각각 x, y, z 좌표 방향의 표준 단위 벡터이다. 예를 들어, 함수
f(x,y,z)= 2x+3y^2-\sin(z)
의 기울기는
\nabla f(x, y, z) = 2\mathbf{i}+ 6y\mathbf{j} -\cos(z)\mathbf{k}
또는
\nabla f(x, y, z) =
\begin{bmatrix}
2 \\
6y \\
-\cos z
\end{bmatrix}.

이다.

원통좌표계에서 기울기는 다음과 같이 주어진다.

\nabla f(\rho, \varphi, z) = \frac{\partial f}{\partial \rho}\mathbf{e}_\rho + \frac{1}{\rho}\frac{\partial f}{\partial \varphi}\mathbf{e}_\varphi + \frac{\partial f}{\partial z}\mathbf{e}_z,

여기서 \rho는 축 방향 거리, \varphi방위각, z는 축 좌표이고, \mathbf{e}_\rho, \mathbf{e}_\varphi, \mathbf{e}_z는 좌표 방향을 따라 향하는 단위 벡터이다.

구면좌표계에서 기울기는 다음과 같이 주어진다.

\nabla f(r, \theta, \varphi) = \frac{\partial f}{\partial r}\mathbf{e}_r + \frac{1}{r}\frac{\partial f}{\partial \theta}\mathbf{e}_\theta + \frac{1}{r \sin\theta}\frac{\partial f}{\partial \varphi}\mathbf{e}_\varphi,

여기서 r은 반지름 거리, \varphi는 방위각, \theta는 극각이고, \mathbf{e}_r, \mathbf{e}_\theta, \mathbf{e}_\varphi는 좌표 방향을 가리키는 국소 단위 벡터(즉, 정규화된 공변 기저)이다.

다른 직교좌표계에서의 기울기에 대해서는 직교좌표계(3차원 미분 연산자)를 참조하라.

일반적인 곡선좌표계의 경우, 좌표는 x^1, \dots, x^i, \dots, x^n로 나타낼 수 있으며, 여기서 n은 정의역의 차원 수이다. 여기서 위첨자는 좌표 또는 성분 목록에서의 위치를 나타낸다. 지표 변수 i는 임의의 원소 x^i를 가리킨다. 아인슈타인 표기법을 사용하면 기울기는 다음과 같이 쓸 수 있다.

\nabla f = \frac{\partial f}{\partial x^{i}}g^{ij} \mathbf{e}_j

여기서 \mathbf{e}_i = \partial \mathbf{x}/\partial x^i\mathbf{e}^i = \mathrm{d}x^i는 각각 정규화되지 않은 국소 공변 기저와 반공변 기저를 나타내며, g^{ij}는 역 메트릭 텐서이고, 아인슈타인 합 규약에 따라 ij에 대한 합을 의미한다.

좌표가 직교좌표계일 경우, 정규화된 기저를 사용하여 축척 인자(또는 라메 계수)를 통해 기울기를 표현할 수 있다.

3. 성질

기울기는 등위선과 직교한다. 함수값이 가장 크게 증가하는 방향을 가리킨다. 기울기와 단위 벡터의 내적은 해당 방향으로의 방향 도함수를 나타낸다.

함수 의 기울기를 함수의 의사색상 그림 위에 화살표로 표시했다.
함수 의 기울기를 함수의 의사색상 그림 위에 화살표로 표시했다.

함수 의 기울기를 아래 평면에 투영된 벡터장으로 나타낸 그림.
함수 의 기울기를 아래 평면에 투영된 벡터장으로 나타낸 그림.

350px
350px


예를 들어 방안의 온도 분포가 스칼라장 로 주어지는 방을 생각해 보자. 각 지점 에서의 온도는 이다. 방의 각 지점에서 해당 지점의 의 기울기는 온도가 가장 빠르게 상승하는 방향을 나타낸다. 기울기의 크기는 그 방향에서 온도가 얼마나 빨리 상승하는지를 나타낸다.

다른 예시로, 지점 에서 해수면 위의 높이가 인 표면을 생각할 때, 어떤 지점에서 의 기울기는 그 지점에서 가장 가파른 기울기 방향을 가리키는 평면 벡터이다. 그 지점에서 경사의 가파른 정도는 기울기 벡터의 크기로 주어진다.

기울기는 내적을 통해 스칼라장이 다른 방향으로 어떻게 변하는지 측정하는 데에도 사용할 수 있다. 예를 들어 언덕의 가장 가파른 경사가 40%라고 가정하면, 직접 언덕 위로 올라가는 도로의 경사는 40%이지만, 언덕 주변으로 비스듬히 올라가는 도로의 경사는 더 완만할 것이다.

기울기 벡터장은 보존 벡터장이며, 선적분 값은 경로에 무관하고 시작점과 끝점에만 의존한다. (기울기 정리)

4. 수학적 해석

기울기는 전미분과 밀접한 관련이 있으며, 서로 전치행렬(쌍대) 관계이다. 미분과의 관계에서 설명하듯이, 기울기와 전미분은 같은 성분을 가지지만 서로 다른 수학적 객체를 나타낸다.

기울기는 함수의 선형 근사에 사용될 수 있다. 예를 들어, 유클리드 공간 \R^n에서 \R로의 함수 f의 임의의 점 x_0에서의 기울기는 fx_0에서의 최적 선형 근사를 특징짓는다. 즉, x_0에 가까운 x에 대해 다음과 같은 선형 근사식을 얻을 수 있다.

: f(x) \approx f(x_0) + (\nabla f)_{x_0}\cdot(x-x_0)

여기서 (\nabla f)_{x_0}x_0에서의 f의 기울기이며, 점은 \R^n에서의 내적이다. 이 식은 fx_0에서의 다변수 테일러 급수 전개의 처음 두 항을 취한 것과 같다.

기울기는 프레셰 도함수의 특수한 경우이다. 함수 f가 프레셰 미분 가능하면, f의 전미분은 f의 프레셰 도함수이며, 따라서 \nabla fU에서 공간 \R^n으로의 사상으로 다음을 만족한다.

:\lim_{h\to 0} \frac

👆
좌우로 밀어서 보기
{\|h\|} = 0

여기서 점은 내적이다.

결과적으로, 기울기는 일반적인 미분이 갖는 미분 법칙(선형성, 곱의 법칙, 연쇄 법칙)을 만족한다.

4.1. 미분과의 관계

스칼라 함수 f(x)의 기울기는 \boldsymbol{\nabla} f로 표현하며, 여기서 \nabla 기호는 벡터 미분 연산자로 나블라(nabla) 혹은 델(del)연산자라고 불린다. 기울기는 f의 각 성분의 편미분으로 구성된 열벡터로 정의된다.

기울기는 전미분(전미분) df와 밀접한 관련이 있으며, 이 둘은 서로 전치행렬(쌍대) 관계에 있다. \R^n의 벡터를 열벡터로, 코벡터(선형 사상 \R^n \to \R)를 행벡터로 나타내는 관례를 사용하면, 기울기 \nabla f와 미분 df는 각각 열벡터와 행벡터로 표현되며, 같은 성분을 가지지만 서로 전치 관계에 있다.

:\nabla f(p) = \begin{bmatrix}\frac{\partial f}{\partial x_1}(p) \\ \vdots \\ \frac{\partial f}{\partial x_n}(p) \end{bmatrix} ;
:df_p = \begin{bmatrix}\frac{\partial f}{\partial x_1}(p) & \cdots & \frac{\partial f}{\partial x_n}(p) \end{bmatrix} .

이 둘은 같은 성분을 가지지만, 서로 다른 종류의 수학적 객체를 나타낸다. 각 점에서 미분은 코탄젠트 벡터, 즉 선형 형식(또는 코벡터)이며, (벡터) 입력의 주어진 무한소 변화에 대한 (스칼라) 출력의 변화량을 나타낸다. 반면에 각 점에서 기울기는 탄젠트 벡터이며, (벡터) 입력의 무한소 변화를 나타낸다.

계산적으로, 주어진 탄젠트 벡터가 있으면, 그 벡터는 미분(행렬로서)과 곱해질 수 있으며, 이는 기울기와의 내적을 취하는 것과 같다.

미분 가능한 함수
:f : \R^n \to \R
의 점 x\R^n 에서의 최적 선형 근사는 \R^n 에서 \R 로의 선형 사상이며, x 에서 f 의 미분 또는 전미분이라고 한다.

기울기는 다음 공식을 통해 미분과 관련된다.
:(\nabla f)_x\cdot v = df_x(v)
여기서 v\R^n 이고, \cdot 는 내적이다. 벡터와 기울기의 내적을 취하는 것은 벡터를 따라 방향 도함수를 취하는 것과 같다.

\R^n 에 표준 유클리드 메트릭을 가정하면, 기울기는 다음과 같은 대응하는 열벡터이다.
:(\nabla f)_i = df^\mathsf{T}_i.

함수에 대한 최적의 선형 근사는 도함수가 아닌 기울기를 이용하여 나타낼 수 있다. 유클리드 공간 \R^n에서 \R로의 함수 f\R^n 내 임의의 특정 점 x_0에서의 기울기는 x_0에서 f에 대한 최적의 선형 근사를 특징짓는다. 근사는 다음과 같다.

:f(x) \approx f(x_0) + (\nabla f)_{x_0}\cdot(x-x_0)

xx_0에 가까울 때, 여기서 (\nabla f)_{x_0}x_0에서 계산된 f의 기울기이고, 점은 \R^n에서의 내적을 나타낸다. 이 방정식은 x_0에서 f의 다변수 테일러 급수 전개의 처음 두 항과 동일하다.

5. 일반화

야코비 행렬은 여러 변수의 벡터값 함수와 유클리드 공간 또는 더 일반적으로 다양체 사이의 미분 가능 함수에 대한 기울기의 일반화이다. 바나흐 공간 사이의 함수에 대한 추가적인 일반화는 프레셰 도함수이다.

f : \mathbb{R}^n \to \mathbb{R}^m 와 같이 각 1계 편도함수가 \mathbb{R}^n에서 존재하는 함수를 가정하자. 그러면 f의 야코비 행렬은 m \times n 행렬로 정의되며, \mathbf{J}_\mathbb{f}(\mathbb{x}) 또는 간단히 \mathbf{J}로 표기한다. (i, j)번째 항목은 \mathbf J_{ij} = {\partial f_i} / {\partial x_j}이다. 명시적으로
\mathbf J = \begin{bmatrix}
\dfrac{\partial \mathbf{f}}{\partial x_1} & \cdots & \dfrac{\partial \mathbf{f}}{\partial x_n} \end{bmatrix}
= \begin{bmatrix}
\nabla^\mathsf{T} f_1 \\
\vdots \\
\nabla^\mathsf{T} f_m
\end{bmatrix}
= \begin{bmatrix}
\dfrac{\partial f_1}{\partial x_1} & \cdots & \dfrac{\partial f_1}{\partial x_n}\\
\vdots & \ddots & \vdots\\
\dfrac{\partial f_m}{\partial x_1} & \cdots & \dfrac{\partial f_m}{\partial x_n} \end{bmatrix}.

벡터장의 전미분은 벡터에서 벡터로의 선형 사상이므로 텐서 양이다.

직교 좌표계에서 벡터장 \mathbf{f} = (f^1, f^2, f^3)의 기울기는 다음과 같이 정의된다.

\nabla \mathbf{f}=g^{jk}\frac{\partial f^i}{\partial x^j} \mathbf{e}_i \otimes \mathbf{e}_k,

(아인슈타인 합 규약을 사용하고 벡터 \mathbf{e}_i\mathbf{e}_k텐서곱은 (2,0)형의 다이어드 텐서이다). 전반적으로 이 식은 야코비 행렬의 전치와 같다.

\frac{\partial f^i}{\partial x^j} = \frac{\partial (f^1,f^2,f^3)}{\partial (x^1,x^2,x^3)}.

곡선 좌표계 또는 더 일반적으로 곡면 다양체에서 기울기는 크리스토펠 기호를 포함한다.

\nabla \mathbf{f}=g^{jk}\left(\frac{\partial f^i}{\partial x^j}+{\Gamma^i}_{jl}f^l\right) \mathbf{e}_i \otimes \mathbf{e}_k,

여기서 g^{jk}는 역 계량 텐서의 성분이고 \mathbf{e}_i는 좌표 기저 벡터이다.

더 불변적으로 표현하면, 벡터장 \mathbf{f}의 기울기는 레비-치비타 연결과 계량 텐서로 정의될 수 있다.

\nabla^a f^b = g^{ac} \nabla_c f^b ,

여기서 \nabla_c는 연결이다.

리만 다양체 (M, g) 상의 임의의 매끄러운 함수 f에 대해, f의 기울기는 임의의 벡터장 X에 대해 다음을 만족하는 벡터장 \nabla f이다.

g(\nabla f, X) = \partial_X f,

즉,

g_x\big((\nabla f)_x, X_x \big) = (\partial_X f) (x),

여기서 g_x( , )는 메트릭 g에 의해 정의된 x에서의 접벡터의 내적을 나타내고, \partial_X f는 임의의 점 x \in Mx에서 평가된 X 방향의 f의 방향 도함수에 대응시키는 함수이다. 다시 말해, M의 열린 부분집합에서 \mathbb{R}^n의 열린 부분집합으로의 좌표 차트 \varphi에서, (\partial_X f)(x)는 다음과 같이 주어진다.

\sum_{j=1}^n X^{j} \big(\varphi(x)\big) \frac{\partial}{\partial x_{j}}(f \circ \varphi^{-1}) \Bigg|_{\varphi(x)},

여기서 X^j는 이 좌표 차트에서 Xj번째 성분을 나타낸다.

따라서, 기울기의 국소적 형태는 다음과 같은 형태를 취한다.

\nabla f = g^{ik} \frac{\partial f}{\partial x^k} {\textbf e}_i .

M = \mathbb{R}^n인 경우를 일반화하면, 함수의 기울기는 외미분과 관련이 있다. 왜냐하면

(\partial_X f) (x) = (df)_x(X_x) .

좀 더 정확히 말하면, 기울기 \nabla f는 메트릭 g에 의해 정의된 뮤지컬 아이소모피즘

\sharp=\sharp^g\colon T^*M\to TM

("sharp"라고 부름)을 사용하여 미분 1-형식 df에 관련된 벡터장이다. \mathbb{R}^n 상의 함수의 외미분과 기울기 사이의 관계는 메트릭이 내적에 의해 주어지는 평평한 메트릭인 특수한 경우이다.

유형다변수 함수의 미분
분야미적분학, 다변수 미적분학
표기법∇(f), grad f
관련 개념방향 미분, 미분, 야코비 행렬, 헤세 행렬
정의
정의함수 값의 가장 가파른 증가 방향을 나타내는 벡터
유클리드 공간에서 정의유클리드 공간에서 스칼라 값 함수 f의 기울기는 각 점에 대해 다음과 같은 벡터를 정의함: ∇f = (∂f/∂x₁, ..., ∂f/∂xₙ)
함수f : ℝⁿ → ℝ
미분 가능성 조건모든 편미분이 존재하고 연속이어야 함
성질
방향 미분과의 관계기울기는 방향 미분을 최대화하는 방향을 나타냄
직교성기울기는 함수 등고선에 직교함
미분과의 관계기울기는 함수의 미분과 관련됨 (미분은 공간쌍대 벡터로 해석됨)
응용
최적화최적화 문제에서 함수가 증가하는 방향을 찾는 데 사용됨
경사 하강법기울기는 경사 하강법과 같은 최적화 알고리즘에 핵심적으로 활용됨
머신 러닝인공 신경망 학습의 역전파 과정에서 중요한 역할 수행
물리학전위 이론 및 기타 분야에서 폭넓게 응용됨
추가 정보
주의사항기울기는 미분가능 함수에 대해서만 정의됨.