맨위로가기

변분법

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

변분법은 범함수의 극값을 찾는 수학적 방법으로, 17세기 뉴턴의 최소 저항 문제에서 시작되어 오일러, 라그랑주 등에 의해 발전했다. 핵심 개념은 범함수의 극댓값 또는 극솟값인 정류값을 찾는 것이며, 오일러-라그랑주 방정식은 이를 위한 필요 조건을 제공한다. 변분법은 광학의 페르마의 원리, 고전역학의 해밀턴 원리, 기하학의 측지선 계산 등 다양한 분야에 응용되며, 최적 제어, 양자 역학, 통계, 머신러닝, 이미지 처리 등에서 활용된다.

더 읽어볼만한 페이지

  • 변분법 - 오일러-라그랑주 방정식
    오일러-라그랑주 방정식은 변분법으로 범함수의 정류점을 찾는 편미분 방정식으로, 라그랑주 역학 등 다양한 분야에 활용되며 뉴턴 역학을 일반화한 것으로 여겨진다.
  • 변분법 - 페르마의 원리
    페르마의 원리는 빛이 이동하는 경로는 빛의 속도가 가장 짧은 시간의 경로를 따른다는 원리이며, 굴절 현상을 설명하고 기하광학 법칙들을 통합하는 데 기여했다.
  • 수학적 최적화 - 제약된 최적화
    제약된 최적화는 제약 조건을 만족하는 해 중에서 목적 함수를 최적화하는 해를 찾는 문제로, 자원 할당, 스케줄링 등에 활용되며, 다양한 제약 조건과 해법을 통해 해결될 수 있습니다.
  • 수학적 최적화 - 모서리해
    모서리 해는 경제학에서 소비자가 예산 제약 하에 효용을 극대화할 때, 두 상품 중 하나만 소비하는 경우를 의미하며, 이는 소비자의 극단적인 선택이나 완전 대체재 관계에서 가격이 낮은 상품만 구매하는 경우 등에 나타나는 현상입니다.
  • 해석학 (수학) - 수학적 최적화
    수학적 최적화는 주어진 집합에서 실수 또는 정수 변수를 갖는 함수의 최댓값이나 최솟값을 찾는 문제로, 변수 종류, 제약 조건, 목적 함수 개수에 따라 다양한 분야로 나뉘며 여러 학문 분야에서 활용된다.
  • 해석학 (수학) - 라플라스 변환
    라플라스 변환은 함수 f(t)를 복소수 s를 사용하여 적분을 통해 다른 함수 F(s)로 변환하는 적분 변환이며, 선형성을 가지고 미분방정식 풀이 등 공학 분야에서 널리 사용된다.
변분법
개요
분야수학, 물리학
하위 분야최적 제어 이론
역사적 배경
발달1630년대 - 17세기
주요 인물레온하르트 오일러
조제프루이 라그랑주
아이작 뉴턴
주요 개념
범함수함수를 입력으로 받아 실수를 출력하는 함수
변분함수를 약간 변화시키는 것
정상 함수변분에 대해 범함수의 값이 변하지 않는 함수
오일러-라그랑주 방정식정상 함수를 찾기 위한 필요조건을 나타내는 미분 방정식
응용 분야
기하학최단 경로 문제
등주 문제
브라키스토크론 문제
측지선 찾기
물리학최소 작용의 원리
해밀턴의 원리
장론
경제학최적 성장 모형
공학최적 제어 이론
관련 항목
해석학함수해석학
최적화 이론
미분 기하학
편미분 방정식
페르마 원리

2. 역사

변분법의 역사는 1687년 뉴턴이 제기한 뉴턴의 최소 저항 문제와 1696년 요한 베르누이가 제시한 최단 강하선 문제에서 시작되었다고 볼 수 있다.[2][31] 이 문제들은 곧바로 야코프 베르누이와 기욤 드 로피탈 같은 수학자들의 관심을 끌었다. 하지만 이 분야를 체계적으로 발전시킨 첫 인물은 1733년부터 연구를 시작한 레온하르트 오일러였다. 조제프루이 라그랑주는 오일러의 연구에 큰 영향을 받았으며, 변분법 이론 발전에 중요한 기여를 했다. 1755년, 당시 19세였던 라그랑주가 발표한 연구를 접한 오일러는 기존의 기하학적 접근 방식 대신 라그랑주의 순수 해석적 접근법을 받아들였다. 그리고 1756년 자신의 강의 Elementa Calculi Variationumla에서 이 분야를 변분법이라고 명명했다.[3][4][32][33]

1786년 아드리앵마리 르장드르는 변분 문제에서 극대값과 극소값을 구별하는 방법을 제시했지만, 이는 완전하지는 않았다. 아이작 뉴턴과 고트프리트 라이프니츠 역시 초기에 이 문제에 관심을 보였다.[5][34] 이후 극값 판별 문제에 대해 빈첸초 브루나치 (1810), 카를 프리드리히 가우스 (1829), 시메옹 드니 푸아송 (1831), 미하일 오스트로그라츠키 (1834), 카를 구스타프 야코프 야코비 (1837) 등이 기여했다. 19세기 중반에는 사루스 (1842)의 연구가 중요한 일반적 성과로 평가받았으며, 이는 오귀스탱루이 코시 (1844)에 의해 요약되고 개선되었다. 이외에도 여러 수학자들이 가치 있는 연구를 남겼지만, 19세기 변분법 분야에서 가장 중요한 업적은 카를 바이어슈트라스의 것으로 평가받는다. 그의 강의는 변분법 이론의 획기적인 발전을 이끌었으며, 이론을 엄밀하고 확고한 기초 위에 올려놓았다고 여겨진다. 1900년에 발표된 다비트 힐베르트힐베르트 문제 중 20번째 문제와 23번째 문제는 변분법의 추가적인 발전을 촉진하는 계기가 되었다.[5][34]

20세기에는 다비트 힐베르트, 에미 뇌터, 레오니다 토넬리, 앙리 르베그, 자크 아다마르 등 많은 수학자들이 변분법 발전에 크게 기여했다.[5][34] 마스턴 모스는 변분법을 응용하여 현재 모스 이론이라고 불리는 새로운 분야를 개척했다.[6][35] 레프 폰트랴긴, 라프 로크펠러 및 F. H. 클라크는 최적 제어 이론 분야에서 변분법을 위한 새로운 수학적 도구를 개발했다.[6][35] 한편, 리처드 벨먼이 개발한 동적 계획법은 변분법의 대안적인 접근 방식으로 제시되기도 했다.[7][8][9][36][37][38]

3. 주요 개념

변분법은 함수를 입력으로 받아 스칼라 값을 출력하는 특별한 종류의 함수, 즉 범함수의 최대 또는 최소값(통칭하여 '''극값''')을 찾는 문제에 중점을 둔다.[10][39] 범함수는 종종 "함수의 함수"로 설명된다.

어떤 함수 ''f''가 주어졌을 때, 이 함수 근방의 다른 함수 ''y''에 대해 범함수 값의 변화 Δ''J'' = ''J''[''y''] - ''J''[''f'']가 항상 같은 부호를 가지면, 범함수 ''J''[''y'']는 함수 ''f''에서 극값을 갖는다고 말한다. 이때 함수 ''f''를 '''극값 함수''' 또는 극값점이라고 부른다. 극값은 변화량 Δ''J''의 부호에 따라 국소 최댓값(Δ''J'' ≤ 0) 또는 국소 최솟값(Δ''J'' ≥ 0)으로 나뉜다.

특히, 연속 함수 공간에서 다루는 극값은 관련 함수의 도함수 조건에 따라 '''약한 극값'''과 '''강한 극값'''으로 구분된다.[11][40] 강한 극값은 더 엄격한 조건을 만족해야 하므로 찾기 어렵지만, 약한 극값이기도 하다.[12][41] 약한 극값을 찾기 위한 중요한 필요 조건 중 하나로 오일러-라그랑주 방정식이 있다.[13][42]

3. 1. 범함수

변분법은 함수의 최대 또는 최소 (통칭하여 '''극값''')를 다루는 분야이다. 함수스칼라 값으로 대응시키는 것을 범함수라고 하며, 이는 "함수의 함수"로 설명될 수 있다. 범함수는 특정 함수 공간에 속하는 함수 y에 대해 정의되며, 어떤 함수 f에서 극값을 가질 수 있다. 범함수 J[y]가 함수 f에서 극값을 갖는다는 것은, f의 임의로 작은 근방 안에 있는 모든 함수 y에 대해 \Delta J = J[y] - J[f]부호가 일정하다는 것을 의미한다.[10] 이때 함수 f를 '''극값 함수''' 또는 극값점이라고 부른다.

극값 J[f]f의 임의로 작은 근방 내 모든 곳에서 \Delta J \leq 0이면 국소 최댓값, \Delta J \geq 0이면 국소 최솟값이라고 한다. 연속 함수로 이루어진 함수 공간에서, 해당 범함수의 극값은 관련 함수의 1차 도함수가 연속인지 아닌지에 따라 '''강한 극값''' 또는 '''약한 극값'''으로 나뉜다.[11]

범함수의 강한 극값과 약한 극값은 모두 연속 함수 공간을 대상으로 하지만, 강한 극값은 공간 내 함수의 1차 도함수까지 연속이어야 한다는 추가 조건이 있다. 따라서 강한 극값은 약한 극값이기도 하지만, 그 역은 항상 성립하지는 않는다. 일반적으로 강한 극값을 찾는 것이 약한 극값을 찾는 것보다 더 어렵다.[12] 약한 극값을 찾기 위한 필요 조건의 한 예로 오일러-라그랑주 방정식이 있다.[13]

3. 2. 정류값 (Extrema)

변분법은 범함수의 극댓값과 극솟값을 연구하는 분야이며, 이 둘을 합쳐 '''정류값'''(Extremum)이라고 부른다. 함수변수에 따라 값이 정해지듯이, 범함수는 함수에 따라 값이 정해지므로 흔히 '함수의 함수'로 설명된다.

범함수 J[y]는 특정 함수 f에서 정류값을 가질 수 있다. 이는 f를 기준으로 아주 작은 변화를 주었을 때, 범함수의 변화량 \Delta J = J[y] - J[f]가 항상 같은 부호를 갖는다는 의미이다.[10][39] 이때 함수 f를 '''정류 함수'''(stationary function) 또는 정류점이라고 한다.

정류값 J[f]는 다음과 같이 분류된다.

  • 극댓값: f의 아주 작은 근방에 있는 모든 함수 y에 대해 \Delta J \le 0일 경우.
  • 극솟값: f의 아주 작은 근방에 있는 모든 함수 y에 대해 \Delta J \ge 0일 경우.


연속 함수로 이루어진 함수 공간에서 범함수의 정류값은 정류 함수 f의 1차 도함수가 연속인지 여부에 따라 두 가지로 나뉜다.[11][40]

  • '''약한 극값''' (Weak extremum): 정류 함수 f의 1차 도함수가 연속일 필요는 없다.
  • '''강한 극값''' (Strong extremum): 정류 함수 f의 1차 도함수까지 연속이어야 한다는 더 강한 조건이 요구된다.


강한 극값은 정의상 약한 극값이기도 하지만, 그 반대는 항상 성립하지는 않는다. 따라서 강한 극값을 찾는 것이 약한 극값을 찾는 것보다 일반적으로 더 어렵다.[12][41] 약한 극값을 찾기 위한 필요 조건 중 하나로 오일러-라그랑주 방정식이 사용된다.[13][42]

3. 3. 변분

변분법은 범함수의 변분, 즉 범함수의 인수인 함수의 작은 변화로 인해 발생하는 범함수 값의 작은 변화에 주목한다.

'''제1 변분'''은 범함수 변화량의 선형적인 부분을 의미한다.[22][43] 예를 들어, 함수 y = y(x)를 인수로 받는 범함수 J[y]가 있다고 하자. 인수인 함수 yy + h로 약간 변했을 때 (h = h(x)y와 같은 함수 공간에 속하는 함수이다), 범함수의 변화량 \Delta J[h]는 다음과 같이 정의된다.[23][44]

\Delta J[h] = J[y+h] - J[y].

범함수 J[y]가 '''미분가능'''하다는 것은, 어떤 선형 범함수 \varphi[h]가 존재하여[24][45] 다음 식을 만족할 때를 말한다.

\Delta J[h] = \varphi [h] + \varepsilon \|h\|.

여기서 \|h\|는 함수 h의 노름(주어진 구간에서 함수 절댓값의 최댓값)[25][46]이며, \|h\| \to 0일 때 \varepsilon \to 0이다. 이 선형 범함수 \varphi[h]J[y]의 '''제1 변분'''이라고 하며, \delta J[h]로 표기한다.[26][47] 제1 변분은 단순히 변분, 미분 또는 제1 미분이라고도 불린다.

\delta J[h] = \varphi[h].

'''제2 변분'''은 범함수 변화량의 이차적인 부분을 의미한다.[22][43] 범함수 J[y]가 '''두 번 미분가능'''하다는 것은, 제1 변분 \varphi_1[h]와 이차 범함수[27][48] \varphi_2[h]가 존재하여 다음 식을 만족할 때를 말한다.

\Delta J[h] = \varphi_1 [h] + \varphi_2 [h] + \varepsilon \|h\|^2.

여기서 \|h\| \to 0일 때 \varepsilon \to 0이다. 이 이차 범함수 \varphi_2[h]J[y]의 '''제2 변분'''이라고 하며, \delta^2 J[h]로 표기한다.[28][49] 제2 변분은 제2 미분이라고도 불린다.

\delta^2 J[h] = \varphi_2[h].

제2 변분 \delta^2 J[h]가 '''강하게 양'''이라는 것은, 어떤 상수 k > 0가 존재하여 모든 함수 h에 대해 다음 부등식이 성립하는 것을 의미한다.[29][50]

\delta^2J[h] \ge k \|h\|^2.

이 개념들을 사용하여 범함수의 최소값에 대한 다음과 같은 충분 조건을 명시할 수 있다.

'''최소값에 대한 충분 조건:''' 범함수 J[y]y = \hat{y}에서 제1 변분 \delta J[h] = 0이고 제2 변분 \delta^2 J[h]가 강하게 양이면 최소값을 갖는다.[30][51] 이는 일반적인 함수의 최소값을 찾을 때, 제1 도함수가 0이고 제2 도함수가 양수인 점을 찾는 것과 유사한 원리이다.

4. 오일러-라그랑주 방정식

오일러-라그랑주 방정식은 어떤 범함수(함수의 함수)를 최소 또는 최대로 만드는 함수를 찾기 위한 핵심적인 미분 방정식이다. 구체적으로, 다음과 같은 형태의 범함수 S(q)를 고려한다.

:\displaystyle S(q) = \int_a^b L(t,q(t),q'(t))\, \mathrm{d}t

여기서 각 기호는 다음을 의미한다.


  • q(t): 찾고자 하는 함수. 시간 t에 따라 변하며, 구간 [a, b]에서 정의되고 미분 가능하다. 양 끝점에서의 값 q(a) = x_a, q(b) = x_b는 고정되어 있다.
  • q'(t): 함수 q(t)의 시간에 대한 도함수.
  • L(t, q(t), q'(t)): 라그랑지언이라고 불리는 함수로, 시간 t, 함수 q(t)의 값, 그리고 그 도함수 q'(t)에 의존한다.


범함수 S(q)의 값을 극값(최소 또는 최대)으로 만드는 함수 q(t)는 다음 오일러-라그랑주 방정식을 만족해야 한다.

:\frac{\partial L}{\partial q} - \frac{d}{dt} \frac{\partial L}{\partial q'} = 0

이 방정식은 일반적으로 함수 q(t)에 대한 2차 상미분 방정식으로 나타난다. 이 방정식을 풀면 범함수 S(q)를 극값으로 만드는 후보 함수 q(t)를 찾을 수 있다. 오일러-라그랑주 방정식은 범함수가 극값을 갖기 위한 필요 조건이지만, 그것만으로는 충분 조건이 되지 않는다. 즉, 이 방정식을 만족하는 함수가 반드시 극값을 보장하는 것은 아니다.[14] 상세한 유도 과정과 다양한 응용 사례는 하위 섹션에서 다룬다.

4. 1. 유도

오일러-라그랑주 방정식은 어떤 범함수(함수의 함수)를 최소 또는 최대로 만드는 함수를 찾기 위한 핵심 방정식이다. 여기서는 범함수 J[y] = \int_a^b F(x,y(x),y'(x))\, dx 를 극값(최대 또는 최소)으로 만드는 함수 y=f(x)를 찾는 과정을 유도한다.

함수 f(x)가 주어진 범함수 J[y]를 극값으로 만든다고 가정하자. 또한, f(x)는 두 번 연속적으로 미분 가능하며, 정해진 경계값 f(a)=y_a, f(b)=y_b를 만족한다고 가정한다. F(x, y, y')는 그 변수들에 대해 연속적인 편미분값을 가진다고 가정한다.

만약 f(x)가 범함수 J를 극값으로 만든다면, f(x)에 아주 작은 변화를 주었을 때 J의 값은 거의 변하지 않아야 한다. 이를 수학적으로 표현하기 위해, f(x)에 작은 변화(변분) \epsilon\eta(x)를 더한 함수 g_\epsilon(x) = f(x) + \epsilon\eta(x)를 도입한다. 여기서 \epsilon은 0에 가까운 작은 실수이고, \eta(x)는 미분 가능한 함수이며 양 끝점에서 0, 즉 \eta(a) = \eta(b) = 0을 만족한다. 항 \epsilon \eta는 함수 f변분이라고 하며 \delta f로 표시하기도 한다.[1]

이제 범함수 Jy 대신 g_\epsilon(x)를 대입하면, J\epsilon에 대한 함수가 된다.

\Phi(\varepsilon) = J[g_\epsilon] = J[f+\varepsilon\eta] = \int_a^b F(x, f(x)+\epsilon\eta(x), f'(x)+\epsilon\eta'(x))\, dx

f(x)J를 극값으로 만들므로, 함수 \Phi(\epsilon)\epsilon = 0에서 극값을 가져야 한다. 따라서 \epsilon = 0에서 \Phi(\epsilon)의 미분은 0이 되어야 한다.

\Phi'(0) = \left.\frac{d\Phi}{d\varepsilon}\right|_{\varepsilon = 0} = \int_a^b \left.\frac{dF}{d\varepsilon}\right|_{\varepsilon = 0} dx = 0

연쇄 법칙을 사용하여 F\epsilon에 대해 미분하면 다음과 같다. (x\epsilon과 무관)

\frac{dF}{d\varepsilon}=\frac{\partial F}{\partial g_\epsilon}\frac{dg_\epsilon}{d\varepsilon} + \frac{\partial F}{\partial g'_\epsilon}\frac{dg'_\epsilon}{d\varepsilon} = \frac{\partial F}{\partial g_\epsilon}\eta(x) + \frac{\partial F}{\partial g'_\epsilon}\eta'(x)

여기서 g_\epsilon = f + \epsilon\eta 이고 g'_\epsilon = f' + \epsilon\eta' 이다.

\epsilon = 0일 때 g_\epsilon = f이고 g'_\epsilon = f'이므로, \Phi'(0)은 다음과 같이 계산된다.

\Phi'(0) = \int_a^b \left[ \frac{\partial F}{\partial f}\eta(x) + \frac{\partial F}{\partial f'}\eta'(x) \right]\, dx = 0

여기서 \frac{\partial F}{\partial f}\frac{\partial F}{\partial f'}(x, f(x), f'(x))에서 계산된 값이다.

적분의 두 번째 항에 부분적분을 적용하면,

\int_a^b \frac{\partial F}{\partial f'}\eta'(x)\, dx = \left[ \frac{\partial F}{\partial f'} \eta(x) \right]_a^b - \int_a^b \eta(x) \frac{d}{dx}\left(\frac{\partial F}{\partial f'}\right)\, dx

경계 조건 \eta(a) = \eta(b) = 0에 의해 우변의 첫 번째 항 \left[ \frac{\partial F}{\partial f'} \eta(x) \right]_a^b는 0이 된다.

따라서 \Phi'(0)=0 식은 다음과 같이 정리된다.

\int_a^b \frac{\partial F}{\partial f}\eta(x)\, dx - \int_a^b \eta(x) \frac{d}{dx}\left(\frac{\partial F}{\partial f'}\right)\, dx = \int_a^b \left( \frac{\partial F}{\partial f} - \frac{d}{dx}\frac{\partial F}{\partial f'} \right) \eta(x)\, dx = 0

이 등식은 경계 조건 \eta(a) = \eta(b) = 0을 만족하는 ''임의의'' 미분 가능한 함수 \eta(x)에 대해 성립해야 한다. 변분법의 기본정리에 따르면, 이 적분값이 항상 0이 되기 위해서는 괄호 안의 피적분 함수 부분이 반드시 0이어야 한다.

\frac{\partial F}{\partial f} - \frac{d}{dx} \frac{\partial F}{\partial f'} = 0

이것이 바로 '''오일러-라그랑주 방정식'''이다. 이 방정식은 범함수 J[f]가 극값을 갖기 위한 필요 조건이며, 일반적으로 f(x)를 구하기 위한 상미분 방정식이다.

4. 2. 응용

변분법은 다양한 물리 및 기하학 문제에서 최적의 해를 찾는 데 강력한 도구로 사용된다. 대표적인 응용 사례는 다음과 같다.
1. 두 점 사이의 최단 경로2차원 평면 위의 두 점 \left(a, y_a\right)\left(b, y_b\right)를 잇는 가장 짧은 곡선을 찾는 문제는 변분법의 고전적인 예시다. 두 점을 잇는 임의의 곡선 y=f(x) (단, f(a)=y_a, f(b)=y_b)의 호의 길이는 다음 범함수로 표현된다.

: L\left[f\right] = \int_a^b \sqrt{1 + f'\left(x\right)^2}\, dx

이 범함수 L[f]를 최소화하는 함수 f(x)를 찾기 위해 오일러-라그랑주 방정식을 적용하면,

: \frac{\partial L}{\partial f} -\frac{d}{dx} \frac{\partial L}{\partial f'}=0

여기서 L = \sqrt{1 + [ f'(x) ]^2} 이다. Lf에 명시적으로 의존하지 않으므로 \frac{\partial L}{\partial f} = 0 이다. 따라서 방정식은 다음과 같이 간단해진다.

: \frac{d}{dx}\left( \frac{\partial L}{\partial f'} \right) = \frac{d}{dx}\left( \frac{f'(x)}{\sqrt{1 + f'(x)^2}} \right) = 0

평균값 정리에 따라 미분해서 0이 되는 함수는 상수이므로,

: \frac{f'\left(x\right)}{\sqrt{1 + f'\left(x\right)^2}} = c (c는 상수)

이 식을 f'(x)에 대해 풀면 f'(x) = m (m은 상수)을 얻는다. 이를 적분하면 f(x) = mx + b (b는 적분 상수)가 되므로, 두 점 사이의 최단 경로는 직선임을 알 수 있다.[15]
2. 페르마의 원리페르마의 원리는 빛이 두 점 사이를 이동할 때, 이동 시간이 최소가 되는 경로, 즉 광학적 길이가 최소화되는 경로를 따라 진행한다는 원리이다. 매질 내에서 빛의 경로는 굴절률 n(x,y)에 따라 달라진다. 경로를 y=f(x)로 표현할 때, 광학적 길이 A[f]는 다음과 같은 범함수로 주어진다.

: A[f] = \int_{x_0}^{x_1} n(x,f(x)) \sqrt{1 + f'(x)^2} dx

이 범함수 A[f]를 최소화하는 경로 f(x)오일러-라그랑주 방정식을 만족해야 한다.

: -\frac{d}{dx} \left[\frac{ n(x,f) f'}{\sqrt{1 + f'^2}} \right] + \frac{\partial n(x,f)}{\partial f} \sqrt{1 + f'^2} = 0

이 방정식의 해를 통해 빛의 경로를 결정할 수 있다. 특히, 빛이 서로 다른 굴절률 n_-n_+를 가진 두 매질의 경계면(x=0)을 통과할 때, 스넬의 법칙이 유도된다. 스넬의 법칙은 경계면에서 광학적 길이의 제1 변분이 0이 되는 조건과 동등하며, 다음과 같이 표현된다.

: n_{(-)}\frac{f'(0^-)}{\sqrt{1 + f'(0^-)^2}} = n_{(+)}\frac{f'(0^+)}{\sqrt{1 + f'(0^+)^2}}

여기서 좌변 항의 \frac{f'(0^-)}{\sqrt{1 + f'(0^-)^2}}는 입사각의 사인값에 해당하고, 우변 항의 \frac{f'(0^+)}{\sqrt{1 + f'(0^+)^2}}는 굴절각의 사인값에 해당한다. 페르마의 원리와 변분법은 라그랑지안 광학과 해밀턴 광학의 이론적 기초를 제공한다.
3. 작용 원리 (해밀턴 원리)고전역학에서 시스템의 운동을 설명하는 또 다른 중요한 원리는 해밀턴의 원리, 또는 최소 작용의 원리이다. 시스템의 라그랑지안 L은 운동에너지 T와 퍼텐셜 에너지 U의 차이(L = T - U)로 정의된다. 작용 S는 라그랑지안을 시간에 대해 적분한 값이다.

: S = \int_{t_0}^{t_1} L(x, \dot x, t) \, dt

여기서 x(t)는 시스템의 경로, \dot x(t)는 속도이다. 해밀턴의 원리는 자연계의 실제 운동 경로는 작용 S를 정류(stationary)시키는 경로, 즉 S의 변분이 0이 되는 경로(\delta S = 0)라는 것이다.

작용 원리에 오일러-라그랑주 방정식을 적용하면 라그랑주 방정식을 얻는다.

: \frac{d}{dt} \frac{\partial L}{\partial \dot x} = \frac{\partial L}{\partial x}

이 방정식은 뉴턴의 운동 방정식과 동등하며, 시스템의 운동을 기술한다.

해밀턴 역학은 라그랑지안 대신 해밀토니안 H를 사용하여 시스템을 기술하는 방식이다. 해밀토니안은 라그랑지안을 르장드르 변환하여 얻으며, 일반적으로 시스템의 총 에너지(H = T + U)에 해당한다.

: H(x, p, t) = p \,\dot x - L(x,\dot x, t) (여기서 p = \frac{\partial L}{\partial \dot x}는 일반화 운동량이다.)

해밀턴 역학에서는 시스템의 상태 변화를 해밀턴-야코비 방정식으로 설명하기도 한다.

4. 3. 벨트라미 항등식

오일러-라그랑주 방정식은 특정 조건 하에서 더 간단한 형태로 표현될 수 있다. 만약 라그랑지언 L이 독립 변수 x에 명시적으로 의존하지 않고, 오직 함수 f(x)와 그 도함수 f'(x)를 통해서만 x에 의존하는 경우, 즉 \frac{\partial L}{\partial x} = 0인 경우가 있다.

이러한 특별한 경우에 오일러-라그랑주 방정식은 다음과 같은 벨트라미 항등식으로 단순화된다:[16]

L - f' \frac{\partial L}{\partial f'} = C \, ,

여기서 C는 적분 상수이다. 이 항등식의 좌변은 f'(x)에 대한 라그랑지언 L르장드르 변환에 해당한다.

벨트라미 항등식은 물리 문제에서 중요한 의미를 가진다. 만약 독립 변수 x가 시간 t를 나타낸다면, \frac{\partial L}{\partial t} = 0이라는 조건은 시스템의 라그랑지언이 시간에 대해 변하지 않음을 의미한다. 뇌터 정리에 따르면, 이러한 시간 대칭성은 어떤 물리량의 보존으로 이어진다. 벨트라미 항등식에서 상수 C는 바로 이 보존량과 관련이 있다. 구체적으로, 시스템의 해밀토니안 H = f' \frac{\partial L}{\partial f'} - L-C와 같으며, 많은 물리계에서 해밀토니안은 시스템의 총 에너지에 해당한다. 따라서 벨트라미 항등식은 특정 조건 하에서의 에너지 보존 법칙을 나타내는 식으로 해석될 수 있다.

4. 4. 뒤 부아-레몽 정리

지금까지의 논의는 극값 함수가 두 번 연속 미분을 갖는다고 가정했지만, 적분 J의 존재는 시험 함수의 일계 미분만을 요구한다. 일계 변동이 극값에서 사라진다는 조건은 오일러-라그랑주 방정식약한 형태로 간주될 수 있다. 뒤 부아-레몽 정리는 이 약한 형태가 강한 형태를 함축한다는 것을 보여준다. 만약 라그랑지안 L이 모든 인수에 대해 연속적인 일계 및 이계 도함수를 갖고, 그리고

\frac{\partial^2 L}{\partial f'^2} \ne 0,

이면 함수 f는 두 번 연속 미분 가능하며, 오일러-라그랑주 방정식을 만족한다.

5. 오일러-푸아송 방정식

범함수 Sy(x)의 고계 도함수에 의존하는 경우, 즉

S = \int_{a}^{b} f(x, y(x), y'(x), \dots, y^{(n)}(x)) dx,

와 같이 표현될 때, 오일러-라그랑주 방정식오일러-푸아송 방정식으로 일반화된다.[17] 이 경우 함수 y는 다음의 오일러-푸아송 방정식을 만족해야 한다.

\frac{\partial f}{\partial y} - \frac{d}{dx} \left( \frac{\partial f}{\partial y'} \right) + \dots + (-1)^{n} \frac{d^n}{dx^n} \left[ \frac{\partial f}{\partial y^{(n)}} \right]= 0.

6. 라브렌티예프 현상

힐베르트오일러-라그랑주 방정식이 정류 해를 제공하기 위한 좋은 조건을 처음으로 제시했다. 볼록 영역 내에서 세 번 미분 가능한 양의 라그랑지안에서 해는 경계를 따라 가거나 내부에서 오일러-라그랑주 방정식을 만족하는 가산 개의 단면으로 구성된다고 보았다.

그러나 1926년 라브렌티예프는 최적의 해가 존재하지 않으면서도, 단면의 수를 늘려 최적 값에 임의로 가까워질 수 있는 상황이 있음을 보였다. 라브렌티예프 현상(Явление Лаврентьева|야블레니예 라브렌티예바rus)은 서로 다른 허용 함수 클래스 사이에서 최소화 문제의 하한(infimum) 값이 달라지는 현상을 말한다.[18] 예를 들어, 1934년 마니아(Manià)가 제시한 다음 문제를 살펴보자:

L[x] = \int_0^1 (x^3-t)^2 x'^6,

{A} = \{x \in W^{1,1}(0,1) : x(0)=0,\ x(1)=1\}.

여기서 W^{1,1}(0,1)소볼레프 공간의 일종으로, 함수 자체와 그 도함수가 적분 가능한 함수들의 모임이다.

이 문제에서 x(t) = t^{\frac{1}{3}}는 범함수 L[x]의 값을 0으로 만들어 최소화한다. 하지만 이 함수는 t=0에서 도함수 x'(t) = \frac{1}{3}t^{-\frac{2}{3}}가 무한대로 발산하므로, W^{1,1}(0,1) 공간에는 속하지만 도함수가 유계인 더 제한적인 함수 공간 W^{1, \infty}(0,1)(즉, 립시츠 연속 함수들의 공간)에는 속하지 않는다. 마니아는 W^{1, \infty}(0,1)에 속하는 어떤 함수 x를 사용하든 L[x]의 값은 특정 양수 값보다 항상 크다는 것을 보였다. 이는 더 넓은 함수 공간(W^{1,1})에서의 하한(0)과 더 좁은 함수 공간(W^{1,\infty})에서의 하한(양수 값) 사이에 차이가 발생함을 의미하며, 이것이 바로 라브렌티예프 현상이다.

전통적으로 라브렌티예프 현상의 예시는 W^{1,1}W^{1,\infty} 공간 사이에서 나타났지만, Ball과 Mizel은 1 \leq p < q < \infty인 경우에 대해 W^{1,p}W^{1,q} 사이에서도 라브렌티예프 현상을 보이는 첫 번째 범함수를 제시했다.[19]

이러한 현상이 발생하지 않도록 보장하는 몇 가지 조건들이 알려져 있다. 예를 들어, 라그랑지안이 '표준 성장 조건'을 만족하거나, 라그랑지안이 독립 변수(t 등)에 명시적으로 의존하지 않거나, 또는 Cesari의 조건(D)을 만족하는 근사 수열이 존재하는 경우 등이다. 하지만 이러한 조건들은 종종 특정 상황에만 적용 가능하며, 제한된 종류의 범함수에만 해당될 수 있다.

라브렌티예프 현상은 반발 속성(repulsion property)과 관련이 있다. 라브렌티예프 현상을 보이는 모든 범함수는 약한 반발 속성을 나타내는 것으로 알려져 있다.[20]

7. 여러 변수 함수

예를 들어, \varphi(x, y)x,y 평면의 영역 D 위의 막의 변위를 나타낸다면, 그 위치 에너지는 표면적에 비례한다.

U[\varphi] = \iint_D \sqrt{1 +\nabla \varphi \cdot \nabla \varphi} \,dx\,dy.

플라토 문제는 영역 D의 경계에서 주어진 값을 가지면서 표면적을 최소화하는 함수를 찾는 문제이다. 이 문제의 해는 '''극소 곡면'''이라고 불린다. 이 문제에 대한 오일러-라그랑주 방정식은 다음과 같은 비선형 방정식이다.

\varphi_{xx}(1 + \varphi_y^2) + \varphi_{yy}(1 + \varphi_x^2) - 2\varphi_x \varphi_y \varphi_{xy} = 0.

자세한 내용은 Courant (1950)에서 찾아볼 수 있다.

실제로는 막의 작은 변위만을 고려하는 경우가 많으며, 이 경우 변위가 없을 때와의 에너지 차이는 다음 식으로 근사할 수 있다.

V[\varphi] = \frac{1}{2}\iint_D \nabla \varphi \cdot \nabla \varphi \, dx\, dy.

이 범함수 VD의 경계에서 지정된 값을 가지는 모든 시험 함수 \varphi 중에서 최소화되어야 한다. 만약 u가 최소화 함수이고 vD의 경계에서 0이 되는 임의의 매끄러운 함수라면, V[u + \varepsilon v]의 1차 변동은 0이 되어야 한다.

\left.\frac{d}{d\varepsilon} V[u + \varepsilon v]\right|_{\varepsilon=0} = \iint_D \nabla u \cdot \nabla v \, dx\,dy = 0.

만약 u가 두 번 미분 가능하다면, 발산 정리를 적용하여 다음을 얻을 수 있다.

\iint_D \nabla \cdot (v \nabla u) \,dx\,dy =

\iint_D \nabla u \cdot \nabla v + v \nabla \cdot \nabla u \,dx\,dy = \int_C v \frac{\partial u}{\partial n} \, ds,

여기서 CD의 경계이고, sC를 따라가는 호의 길이이며, \partial u / \partial nC에서 u의 법선 방향 도함수이다. vC에서 0이고 1차 변동이 0이므로, 결과는 다음과 같다.

\iint_D v\nabla \cdot \nabla u \,dx\,dy =0

이는 D의 경계에서 0이 되는 모든 매끄러운 함수 v에 대해 성립한다. 1차원 적분의 경우와 유사한 논증을 통해 다음을 보일 수 있다.

\nabla \cdot \nabla u= 0 \quad \text{in } D.

즉, 최소화 함수 u라플라스 방정식을 만족해야 한다.

이러한 추론 과정에는 최소화 함수 u가 두 번 미분 가능하다는 가정이 필요하다는 어려움이 있다. 리만(Riemann)은 물리적 문제와의 연관성을 통해 매끄러운 최소화 함수의 존재가 보장된다고 주장했다. 즉, 실제 막은 최소 위치 에너지를 갖는 형태로 존재할 것이라는 가정이다. 리만은 그의 스승 페터 구스타프 르죈 디리클레를 기리기 위해 이 아이디어를 디리클레 원리라고 명명했다. 그러나 바이어슈트라스(Weierstrass)는 해가 존재하지 않는 변분 문제의 예를 제시하며 디리클레 원리에 반례를 들었다. 예를 들어, \varphi(-1)=-1\varphi(1)=1을 만족하는 모든 함수 \varphi 중에서 다음 범함수를 최소화하는 문제를 생각해보자.

W[\varphi] = \int_{-1}^{1} (x\varphi')^2 \, dx

이 범함수 W의 값은 원점 근처의 작은 구간에서 −1과 1 사이를 급격하게 변화하는 구간별 선형 함수를 선택함으로써 얼마든지 작게 만들 수 있다. 하지만 W=0을 만족시키는 함수는 존재하지 않는다. 디리클레 원리의 유효성에 대한 논쟁은 턴불(Turnbull)에 의해 설명된다.[21] 결국 디리클레 원리는 유효하지만, 그 증명에는 타원형 편미분 방정식에 대한 정교한 정규성 이론의 적용이 필요하다는 것이 밝혀졌다. 자세한 내용은 Jost 및 Li–Jost (1998)를 참조하라.

막의 위치 에너지에 대한 더 일반적인 표현은 다음과 같다.

V[\varphi] = \iint_D \left[ \frac{1}{2} \nabla \varphi \cdot \nabla \varphi + f(x,y) \varphi \right] \, dx\,dy \, + \int_C \left[ \frac{1}{2} \sigma(s) \varphi^2 + g(s) \varphi \right] \, ds.

여기서 f(x,y)는 영역 D에서의 외부 힘 밀도, g(s)는 경계 C에서의 외부 힘, \sigma(s)C에 작용하는 탄성력(탄성 계수)에 해당한다. 경계 값에 제한을 두지 않고 위치 에너지를 최소화하는 함수를 u라고 하자. 만약 fg가 연속이라면, 정규성 이론에 따라 최소화 함수 u는 두 번 미분 가능하다. 첫 번째 변분을 계산할 때, 증분 함수 v에 대해 경계 조건을 부과할 필요가 없다. V[u + \varepsilon v]의 첫 번째 변분은 다음과 같다.

\iint_D \left[ \nabla u \cdot \nabla v + f v \right] \, dx\, dy + \int_C \left[ \sigma u v + g v \right] \, ds = 0.

발산 정리를 적용하면 다음을 얻는다.

\iint_D \left[ -v \nabla \cdot \nabla u + v f \right] \, dx \, dy + \int_C v \left[ \frac{\partial u}{\partial n} + \sigma u + g \right] \, ds =0.

먼저 v = 0 on C인 경우를 고려하면 경계 적분이 사라지고, 이전과 같이 다음 결론을 얻는다.

- \nabla \cdot \nabla u + f =0 \quad \text{in } D.

그 다음, v가 임의의 경계 값을 가질 수 있도록 허용하면, 이는 u가 다음 경계 조건을 만족해야 함을 의미한다.

\frac{\partial u}{\partial n} + \sigma u + g =0, \quad \text{on } C.

이 경계 조건은 u의 최소화 속성으로부터 유도된 것이며, 사전에 부과된 것이 아니다. 이러한 조건을 '''자연 경계 조건'''이라고 한다.

앞선 논의는 \sigmaC 위에서 항상 0인 경우에는 유효하지 않다. 이 경우, 상수 함수 \varphi \equiv c를 시험 함수로 사용할 수 있다. 이러한 시험 함수에 대해,

V[c] = c\left[ \iint_D f \, dx\,dy + \int_C g \, ds \right].

만약 대괄호 안의 양이 0이 아니라면, c를 적절히 선택하여 V가 임의의 값을 가지도록 만들 수 있다. 따라서 변분 문제는 다음 조건이 만족되지 않으면 의미가 없다.

\iint_D f \, dx\,dy + \int_C g \, ds =0.

이 조건은 시스템에 작용하는 총 외부 힘이 평형 상태에 있음을 의미한다. 만약 힘들이 평형 상태에 있다면, 변분 문제는 해를 가지지만, 해에 임의의 상수를 더해도 여전히 해가 되므로 해는 유일하지 않다. 더 자세한 내용과 예시는 Courant와 Hilbert (1953)에서 찾아볼 수 있다.

8. 고유값 문제

1차원 및 다차원 '''고유값 문제'''는 변분 문제로 공식화될 수 있다.[1] 슈트름-리우빌 이론과 밀접한 관련이 있다.

슈트름-리우빌 고유값 문제는 다음과 같은 일반적인 이차 형식과 관련된다.

Q[y] = \int_{x_1}^{x_2} \left[ p(x) y'(x)^2 + q(x) y(x)^2 \right] \, dx,

여기서 함수 y는 경계 조건 y(x_1)=0, \quad y(x_2)=0을 만족해야 한다. 정규화 적분 R은 다음과 같이 정의된다.

R[y] =\int_{x_1}^{x_2} r(x)y(x)^2 \, dx.

함수 p(x)r(x)는 항상 양수이며 0보다 충분히 큰 값을 가진다고 가정한다. 주요 변분 문제는 주어진 경계 조건을 만족하는 모든 함수 y 중에서 비율 Q/R을 최소화하는 함수를 찾는 것이다. 이는 R[y]를 상수로 고정하고 Q[y]를 최소화하는 문제와 동일하다. 이 최소화 문제를 푸는 함수 u오일러-라그랑주 방정식을 만족한다.

-(p u')' +q u -\lambda r u = 0,

여기서 \lambda는 비율 \lambda = \frac{Q[u]}{R[u]}이다. 최소값을 만드는 함수 u는 두 번 미분 가능하며 위 오일러-라그랑주 방정식을 만족시킨다는 것을 보일 수 있다.[2] 이때의 \lambda는 주어진 방정식과 경계 조건을 만족하는 가장 작은 고유값이며 \lambda_1로 표시한다. 해당 고유값에 대응하는 최소화 함수는 u_1(x)로 표시된다.

고유값의 이러한 변분적 특성은 고유값의 근사값을 구하는 레일리-리츠 방법으로 이어진다. 이 방법에서는 해 u를 기저 함수(예: 삼각 함수)의 선형 결합으로 근사하고, 이 선형 결합 중에서 비율 Q/R을 최소화하는 계수를 찾아 유한 차원에서의 최소화 문제를 푼다. 이 방법은 종종 매우 정확한 근사값을 제공한다.[1]

다음으로 작은 고유값과 고유 함수는 첫 번째 고유함수 u_1(x)와 직교한다는 추가 제약 조건, 즉

\int_{x_1}^{x_2} r(x) u_1(x) y(x) \, dx = 0

하에서 Q를 최소화하여 얻을 수 있다. 이 과정을 반복하면 문제에 대한 모든 고유값과 고유함수를 순서대로 얻을 수 있다.[1]

변분 문제는 더 일반적인 경계 조건에도 적용될 수 있다. 함수 y가 양 끝점에서 0이 되어야 한다는 조건 대신, 끝점에서 특별한 조건을 부과하지 않고 범함수 Q[y]를 다음과 같이 설정할 수 있다.

Q[y] = \int_{x_1}^{x_2} \left[ p(x) y'(x)^2 + q(x)y(x)^2 \right] \, dx + a_1 y(x_1)^2 + a_2 y(x_2)^2,

여기서 a_1a_2는 임의의 상수이다. 이 경우, Q/R 비율을 최소화하는 함수 u오일러-라그랑주 방정식 -(p u')' + q u -\lambda r u =0 (단, x_1 < x < x_2)을 만족할 뿐만 아니라, 다음과 같은 경계 조건도 만족해야 한다.

-p(x_1)u'(x_1) + a_1 u(x_1)=0, \quad \hbox{and} \quad p(x_2) u'(x_2) + a_2 u(x_2)=0.

이러한 경계 조건은 최소화를 위한 시험 함수에 미리 부과된 것이 아니라 최소화 과정의 결과로 자연스럽게 도출되므로 '''자연 경계 조건'''이라고 불린다.[1]

고차원에서의 고유값 문제도 1차원 경우와 유사하게 정의된다. 예를 들어, 3차원 공간에서 경계 B를 가진 영역 D가 주어졌을 때, 범함수 QR을 다음과 같이 정의할 수 있다.

Q[\varphi] = \iiint_D \left( p(X) |\nabla \varphi|^2 + q(X) \varphi^2 \right) \, dV + \iint_B \sigma(S) \varphi^2 \, dS,

R[\varphi] = \iiint_D r(X) \varphi(X)^2 \, dV.

경계 B에 대한 조건 없이 비율 Q[\varphi] / R[\varphi]를 최소화하는 함수를 u라고 하면, u가 만족하는 오일러-라그랑주 방정식은 다음과 같은 편미분 방정식 형태가 된다.

-\nabla \cdot (p(X) \nabla u) + q(x) u - \lambda r(x) u=0,

여기서 \lambda = \frac{Q[u]}{R[u]}이다. 최소화 함수 u는 또한 경계 B에서 다음과 같은 자연 경계 조건을 만족해야 한다.

p(S) \frac{\partial u}{\partial n} + \sigma(S) u = 0,

여기서 \frac{\partial u}{\partial n}는 경계면 B에서의 법선 방향 미분이다. 이 결과는 타원형 편미분 방정식에 대한 정칙성 이론에 의존한다.[3] 고유값의 완전성, 점근적 성질, 고유 함수의 마디(node)에 관한 결과를 포함한 많은 확장 내용은 Courant와 Hilbert(1953)에서 찾아볼 수 있다.[4]

9. 변분 및 최소값에 대한 충분 조건

변분법은 범함수의 인수인 함수에 작은 변화가 생길 때 범함수 값이 얼마나 변하는지, 즉 범함수의 '변분'을 다룬다. 이 변화량에서 선형적인 부분을 '''제1 변분'''이라 하고, 이차적인 부분을 '''제2 변분'''이라고 한다.[22][43]

예를 들어, 함수 y = y(x)를 인수로 갖는 범함수 J[y]가 있다고 하자. 인수 함수 yy와 같은 함수 공간에 속하는 작은 변화 함수 h = h(x)를 더해 y + h로 만들었을 때, 범함수 값의 변화량 \Delta J[h]는 다음과 같이 정의된다.[23][44]

\Delta J[h] = J[y+h] - J[y].

범함수 J[y]가 '''미분가능'''하다는 것은, 어떤 선형 범함수 \varphi[h]가 존재하여[24][45] 다음 식을 만족하는 것을 의미한다.

\Delta J[h] = \varphi [h] + \varepsilon \|h\|.

여기서 \|h\|는 함수 h의 노름 (예: 균일 노름)이며,[25][46] \|h\| \to 0일 때 \varepsilon \to 0이다. 이 선형 범함수 \varphi[h]J[y]의 '''제1 변분'''이라 하고, \delta J[h]로 표기한다.[26][47]

\delta J[h] = \varphi[h].

범함수 J[y]가 '''두 번 미분가능'''하다는 것은, 제1 변분 \varphi_1[h]와 이차 범함수 \varphi_2[h]가 존재하여[27][48] 다음 식을 만족하는 것을 의미한다.

\Delta J[h] = \varphi_1 [h] + \varphi_2 [h] + \varepsilon \|h\|^2.

여기서 \|h\| \to 0일 때 \varepsilon \to 0이다. 이 이차 범함수 \varphi_2[h]J[y]의 '''제2 변분'''이라 하고, \delta^2 J[h]로 표기한다.[28][49]

\delta^2 J[h] = \varphi_2[h].

제2 변분 \delta^2 J[h]가 '''강하게 양(strongly positive)'''이라는 것은, 어떤 상수 k > 0가 존재하여 모든 h에 대해 다음 부등식이 성립하는 것을 의미한다.[29][50]

\delta^2J[h] \ge k \|h\|^2.

이러한 정의들을 바탕으로, 범함수가 최소값을 갖기 위한 충분 조건은 다음과 같다.

'''최소값에 대한 충분 조건:'''

범함수 J[y]y = \hat{y}에서 제1 변분 \delta J[h] = 0이고 제2 변분 \delta^2 J[h]가 강하게 양이면, y = \hat{y}에서 최소값(극소값)을 갖는다.[30][51] 이는 일반적인 함수에서 제1 도함수가 0이고 제2 도함수가 양수일 때 극소값을 갖는다는 조건과 유사하다. 더 자세한 충분 조건(약한 최소값, 강한 최소값)은 관련 문헌에서 찾아볼 수 있다.

10. 응용 분야

변분법은 다양한 과학 및 공학 분야에서 중요한 도구로 사용된다. 주요 응용 분야는 다음과 같다.

'''광학'''

페르마의 원리에 따르면, 빛은 두 점 사이를 이동할 때 광학적 길이가 최소가 되는 경로를 따른다. 경로를 y=f(x)로 표현하고, 매질의 굴절률n(x,y)라고 할 때, 광학적 길이는 범함수 A[f]로 주어진다.

A[f] = \int_{x_0}^{x_1} n(x,f(x)) \sqrt{1 + f'(x)^2} dx

이 범함수의 제1 변분 \delta A를 계산하고 오일러-라그랑주 방정식을 적용하면 빛의 경로를 결정하는 방정식을 얻을 수 있다.

-\frac{d}{dx} \left[\frac{ n(x,f_0) f_0'}{\sqrt{1 + f_0'^2}} \right] + n_y (x,f_0) \sqrt{1 + f_0'(x)^2} = 0

이러한 접근 방식은 라그랑지안 광학 및 해밀턴 광학의 기초가 된다.

특히, 빛이 서로 다른 굴절률(n_{(-)}, n_{(+)})을 가진 매질의 경계면(x=0)을 통과할 때, 경로 함수 f(x)는 연속이지만 그 도함수 f'(x)는 불연속일 수 있다. 이 경우, 제1 변분 \delta A가 0이 되는 조건은 다음과 같다.

\delta A[f_0,f_1] = f_1(0)\left[ n_{(-)}\frac{f_0'(0^-)}{\sqrt{1 + f_0'(0^-)^2}} - n_{(+)}\frac{f_0'(0^+)}{\sqrt{1 + f_0'(0^+)^2}} \right] = 0

이는 입사각과 굴절각 사이의 관계를 나타내는 스넬의 법칙, 즉 n_{(-)} \sin \theta_{inc} = n_{(+)} \sin \theta_{ref}과 동일하다. 결국 스넬의 법칙은 광학적 경로 길이의 변분이 사라진다는 조건과 같음을 알 수 있다.

'''역학'''

고전역학에서 작용 S는 라그랑지안 L을 시간에 대해 적분한 값으로 정의된다. 라그랑지안은 시스템의 운동 에너지 T와 포텐셜 에너지 U의 차이(L = T - U)이다. 해밀턴 원리(작용 원리)는 보존적인 홀로노믹 시스템의 실제 운동 경로는 작용 적분

S = \int_{t_0}^{t_1} L(x, \dot x, t) \, dt

을 정상(stationary) 상태로 만드는 경로라는 원리이다. 이 원리로부터 유도되는 오일러-라그랑주 방정식은 라그랑주 방정식으로 알려져 있으며, 뉴턴의 운동 방정식과 동등하다.

\frac{d}{dt} \frac{\partial L}{\partial \dot x} = \frac{\partial L}{\partial x}

해밀턴 역학은 라그랑지안을 르장드르 변환하여 해밀토니안 H(시스템의 총 에너지, H = T + U)를 도입하는 방식이다.

H(x, p, t) = p \,\dot x - L(x,\dot x, t)

여기서 p는 일반화 운동량(p = \frac{\partial L}{\partial \dot x})이다. 해밀턴 역학의 기본 방정식은 해밀턴-야코비 방정식으로 표현될 수도 있다.

\frac{\partial \psi}{\partial t} + H\left(x,\frac{\partial \psi}{\partial x},t\right) = 0

'''기타 응용 분야'''

변분법은 위에서 설명한 광학 및 역학 외에도 다양한 문제 해결에 활용된다.


  • 현수선 모양 유도
  • 뉴턴의 최소 저항 문제 해결
  • 최단 강하 곡선 문제 해결
  • 등시 곡선 문제 해결
  • 등주 문제 해결
  • 측지선 계산
  • 최소 곡면 탐색 및 플라토 문제 해결
  • 최적 제어 이론
  • 해석 역학 (라그랑주 역학, 해밀턴 역학)의 정립
  • 기하 광학 (라그랑지안 광학, 해밀턴 광학)
  • 양자역학의 변분 원리: 바닥 상태 및 일부 들뜬 상태 에너지 근사 계산
  • 변분 베이즈 방법: 베이즈 추론기계 학습에서 적분 근사
  • 일반 상대성 이론의 변분법: 일반 상대성 이론 문제 해결
  • 유한 요소법: 미분 방정식의 경계값 문제에 대한 수치 해법
  • 전체 변동 노이즈 제거: 이미지 처리에서 노이즈 필터링 기법

참조

[1] 서적
[2] 서적 Calculus of variations https://books.google[...] Dover Publications
[3] 서적 Leonhard Euler: Life, Work and Legacy Elsevier
[4] 서적 A History of the Calculus of Variations from the 17th through the 19th Century https://books.google[...] Springer Science & Business Media
[5] 서적 The Calculus of Variations Springer
[6] 간행물 Brief Survey of the History of the Calculus of Variations and its Applications
[7] 서적 Dynamic programming and optimal control Athena Scientific
[8] 논문 Dynamic Programming and a new formalism in the calculus of variations
[9] 웹사이트 Richard E. Bellman Control Heritage Award http://a2c2.org/awar[...] 2013-07-28
[10] 서적 Methods of Mathematical Physics Interscience Publishers, Inc.
[11] 서적
[12] 서적
[13] 서적
[14] 서적 Methods of Mathematical Physics Interscience Publishers, Inc.
[15] 서적 Lectures on the principles of demonstrative mathematics https://books.google[...]
[16] 웹사이트 Euler–Lagrange Differential Equation http://mathworld.wol[...] Wolfram
[17] 서적 A First Course in the Calculus of Variations American Mathematical Society
[18] 논문 Sopra un esempio di Lavrentieff 1934
[19] 논문 One-dimensional Variational problems whose Minimizers do not satisfy the Euler-Lagrange equation. 1985
[20] 논문 The Weak Repulsion property 2007
[21] 웹사이트 Riemann biography http://turnbull.mcs.[...] U. St. Andrew
[22] 서적
[23] 서적
[24] 서적
[25] 서적
[26] 서적
[27] 서적
[28] 서적
[29] 서적
[30] 서적
[31] 서적 Calculus of variations http://store.doverpu[...] Dover Publications
[32] 서적 Leonhard Euler: Life, Work and Legacy Elsevier
[33] 서적 A History of the Calculus of Variations from the 17th through the 19th Century https://books.google[...] Springer Science & Business Media
[34] 서적 The Calculus of Variations Springer
[35] 간행물 Brief Survey of the History of the Calculus of Variations and its Applications
[36] 서적 Dynamic programming and optimal control Athena Scientific
[37] 논문 Dynamic Programming and a new formalism in the calculus of variations http://www.ncbi.nlm.[...]
[38] 뉴스 Richard E. Bellman Control Heritage Award http://a2c2.org/awar[...] 2013-07-28
[39] 서적 Methods of Mathematical Physics Interscience Publishers, Inc
[40] harvnb
[41] harvnb
[42] harvnb
[43] harvnb
[44] harvnb
[45] harvnb
[46] harvnb
[47] harvnb
[48] harvnb
[49] harvnb
[50] harvnb
[51] harvnb



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com