볼록 함수
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
볼록 함수는 실수 벡터 공간의 볼록 집합에서 정의된 함수로, 특정 부등식을 만족하는 함수를 의미한다. 이러한 함수는 임의의 두 점 사이의 직선이 함수의 그래프 위에 있거나 접해야 하는 특징을 가지며, 강볼록 함수, 오목 함수, 강오목 함수 등으로 세분화된다. 볼록 함수의 성질은 여러 변수의 함수에 대해서도 간단하게 표현될 수 있으며, 연속성, 미분 가능성, 젠센 부등식 등과 관련이 있다. 볼록 함수는 여러 연산을 통해 보존되며, 강볼록 함수는 이차 함수만큼 빠르게 증가하는 함수로, 유일한 전역 최솟값을 가진다. 균등 볼록 함수는 강볼록 함수를 일반화한 개념이며, 다양한 수학적 예시와 경제학에서의 활용을 포함한다.
실수 벡터 공간의 볼록 집합 에 대해 정의된 함수 가 있다고 하자.
"볼록"이라는 용어는 종종 "아래로 볼록" 또는 "위로 오목"이라고 불리며, 오목이라는 용어는 종종 "아래로 오목" 또는 "위로 볼록"이라고 불린다.[3][4][5] "볼록"이라는 용어가 "위" 또는 "아래" 키워드 없이 사용될 경우, 이는 엄격하게 컵 모양 그래프()를 지칭한다. 예를 들어, 젠센 부등식은 볼록 또는 아래로 볼록 함수와 관련된 부등식을 나타낸다.[6]
2. 정의
다음 조건을 만족하면 를 '''볼록 함수'''라고 정의한다.
:
위 부등식에서 등호가 성립하지 않고 항상 가 성립하면, 즉 모든 와 모든 에 대해,
:
이면 는 '''강볼록 함수'''이다.
가 볼록 함수이면 는 오목 함수이다.[3][4][5] "볼록"이라는 용어가 "위" 또는 "아래" 키워드 없이 사용될 경우, 이는 엄격하게 컵 모양 그래프 를 지칭한다.[6]
2. 1. 확장된 실수 값을 갖는 함수의 볼록성
함수 가 확장된 실수선 에 값을 갖는 경우, 볼록성의 정의에는 약간의 주의가 필요하다. 또는 일 때, 또는 이면 는 정의되지 않을 수 있다( 및 는 정의되지 않기 때문). 따라서, 과 인 모든 에 대하여:
를 만족하는 두 번째 명제를 사용하여 볼록 함수를 정의한다.
합 도 정의되지 않으므로 볼록 확장 실수 값 함수는 일반적으로 와 중 정확히 하나만 값으로 갖도록 허용된다.
3. 성질
볼록 함수의 많은 성질들은 여러 변수의 함수에 대해서도 한 변수의 함수와 동일하게 간단하게 표현될 수 있다. 여러 변수의 경우에 대한 성질은 이후에 더 자세히 다룬다.
3. 1. 한 변수 볼록 함수의 성질
어떤 열린 구간에서 정의된 한 실수 변수의 볼록 함수는 그 구간에서 연속 함수이다. 이 함수는 좌미분과 우미분을 가지며, 이것들은 단조 감소하지 않음이다. 결과적으로, 이 함수는 최대 가산 개의 점을 제외하고 모두 미분 가능한 함수이다.
한 변수의 미분 가능한 함수가 어떤 구간에서 볼록 함수일 필요충분조건은 그 함수의 도함수가 단조 감소하지 않음인 것이다.
한 변수의 미분 가능한 함수는 그 그래프가 모든 접선 위에 놓일 때 그 구간에서 볼록하다. 즉, 다음 부등식이 성립한다:[7]
: (구간 내의 모든 x와 y에 대해)
두 번 미분 가능한 한 변수의 함수가 어떤 구간에서 볼록 함수일 필요충분조건은 그 이계도함수가 그 구간에서 0 이상인 것이다. 시각적으로, 두 번 미분 가능한 볼록 함수는 "위로 굽어"진다. 이계도함수가 모든 점에서 양수이면 함수는 엄격히 볼록하지만, 그 역은 성립하지 않는다. 예를 들어, 는 엄격히 볼록하지만, 에서 이계도함수는 0이다.
만약 가 한 실수 변수의 볼록 함수이고 이면, 는 양의 실수 와 에 대해 초가산적이다. 즉, 이다.
함수 가 모든 에 대해 다음을 만족하면 구간에서 중점 볼록이다.
:
연속 함수인 경우, 중점 볼록성은 볼록성과 동치이다.[8]
3. 2. 여러 변수 볼록 함수의 성질
여러 변수의 두 번 미분 가능한 함수는 볼록 집합의 내부에서 이차 편미분의 헤세 행렬이 양의 준정부호인 경우에만 볼록 집합에서 볼록하다.[9] 볼록 함수 에 대해 준위 집합 및 는 일 때 볼록 집합이다. 볼록 함수의 모든 지역 최솟값은 전역 최솟값이다. 엄밀히 볼록 함수는 최대 하나의 전역 최솟값을 갖는다.[9] 젠센 부등식은 모든 볼록 함수 에 적용된다. 가 의 도메인에서 값을 갖는 확률 변수인 경우, 이며 여기서 는 수학적 기대를 나타낸다.
4. 볼록성 보존 연산
- 음이 아닌 가중 합:
: 만약 w₁, ..., wₙ ≥ 0이고 f₁, ..., fₙ이 모두 볼록 함수이면, w₁f₁ + ... + wₙfₙ도 볼록 함수이다. 특히, 두 볼록 함수의 합은 볼록 함수이다.[10] 이 속성은 무한 합, 적분 및 기대값에도 적용된다(존재하는 경우).
- 원소별 최댓값: {fᵢ}ᵢ∈I를 볼록 함수들의 모임이라고 하자. 그러면 g(x) = supᵢ∈I fᵢ(x)는 볼록 함수이다. g(x)의 정의역은 표현식이 유한한 점들의 모임이다. 중요한 특수한 경우:
:: 만약 f₁, ..., fₙ이 볼록 함수이면, g(x) = max{f₁(x), ..., fₙ(x)}도 볼록 함수이다.
:: 댄스킨 정리: 만약 f(x,y)가 x에 대해 볼록 함수이면, g(x) = sup_(y∈C) f(x,y)는 C가 볼록 집합이 아니더라도 x에 대해 볼록 함수이다.
- 합성:
:: 만약 f와 g가 볼록 함수이고, g가 단변수 정의역에서 증가하지 않는 함수이면, h(x) = g(f(x))는 볼록 함수이다. 예를 들어, f가 볼록 함수이면, eᶠ⁽ˣ⁾도 볼록 함수인데, 그 이유는 eˣ가 볼록 함수이고 단조 증가 함수이기 때문이다.
:: 만약 f가 오목 함수이고 g가 볼록 함수이며 단변수 정의역에서 감소하지 않는 함수이면, h(x) = g(f(x))는 볼록 함수이다.
:: 볼록성은 아핀 맵에 대해 불변한다. 즉, f가 정의역 Dƒ ⊆ ℝᵐ을 가지는 볼록 함수이면, g(x) = f(Ax+b)도 볼록 함수이며, 여기서 A ∈ ℝᵐˣⁿ, b ∈ ℝᵐ이고 정의역은 Dg ⊆ ℝⁿ이다.
- 최소화: 만약 f(x,y)가 (x,y)에 대해 볼록 함수이면, g(x) = inf_(y∈C) f(x,y)는 x에 대해 볼록 함수이다. 단, C가 볼록 집합이고 g(x) ≠ -∞이어야 한다.
5. 강볼록 함수 (Strongly Convex Functions)
강볼록성은 엄격 볼록성을 확장하고 매개변수화한 개념이다. 강볼록 함수는 이차 함수만큼 빠르게 증가하는 함수이다.[11] 강볼록 함수는 엄격 볼록 함수이지만 그 역은 성립하지 않는다.
미분 가능한 함수 가 정의역의 모든 점 에 대해 다음 부등식을 만족하는 경우 매개변수 으로 강볼록이라고 한다.[12]
:
또는 더 일반적으로,
:
여기서 는 임의의 내적이고, 는 해당 노름이다. 일부 저자들은 이 부등식을 만족하는 함수를 타원형 함수라고도 부른다.[13]
이에 상응하는 조건은 다음과 같다.[14]
:
함수가 강볼록하기 위해 미분 가능해야 하는 것은 아니다. 매개변수 을 갖는 강볼록 함수에 대한 세 번째 정의[14]는 정의역의 모든 와 에 대해,
:
이 정의는 일 때 엄격 볼록성에 대한 정의에 접근하고, 일 때 볼록 함수의 정의와 동일하다는 점에 유의해야 한다. 그럼에도 불구하고, 어떤 에 대해서도 엄격 볼록하지만 강볼록하지 않은 함수가 존재한다.
함수 가 2번 연속 미분 가능한 경우, 정의역의 모든 에 대해 가 성립하면 매개변수 으로 강볼록하다. 여기서 는 항등 행렬이고 는 헤세 행렬이며, 부등식 는 가 양의 준정부호임을 의미한다. 이는 의 최소 고윳값이 모든 에 대해 최소 이상이어야 한다는 요구와 같다. 정의역이 실수선인 경우, 는 2차 도함수 이므로 조건은 이 된다. 인 경우 이는 헤세 행렬이 양의 준정부호임을 의미하며 (또는 정의역이 실수선인 경우, 임을 의미) 함수가 볼록하고, 아마도 엄격히 볼록하지만 강볼록하지 않음을 의미한다.
함수 는 다음 함수가
:
볼록한 경우에만 매개변수 ''m''으로 강볼록하다.
강볼록 함수는 일반적으로 볼록 또는 엄격 볼록 함수보다 다루기 쉬운데, 그 이유는 더 작은 클래스이기 때문이다. 엄격 볼록 함수와 마찬가지로 강볼록 함수는 콤팩트 집합에서 고유한 최소값을 갖는다.
5. 1. 강볼록 함수의 성질
''f''가 파라미터 ''m''을 갖는 강볼록 함수라면, 다음 성질을 만족한다.[15]- 모든 실수 ''r''에 대해, 레벨 집합 {''x'' | ''f''(''x'') ≤ ''r''}은 콤팩트하다.
- 함수 ''f''는 ''Rn''에서 유일한 전역 최솟값을 갖는다.
6. 균등 볼록 함수 (Uniformly Convex Functions)
균등 볼록 함수[16][17]는 모듈러스 φ|피영어를 가지며, 정의 구역 내의 모든 x|엑스영어, y|와이영어와 t|티영어 ∈ [0, 1]에 대해 다음을 만족하는 함수 f|에프영어를 말한다.
:
여기서 φ|피영어는 음이 아닌 함수이며, 0에서만 0이 된다. 이는 강볼록 함수의 개념을 일반화한 것으로, 로 놓으면 강볼록성의 정의를 얻을 수 있다.
일부 저자는 모듈러스 φ|피영어가 증가 함수일 것을 요구하지만,[18] 모든 저자가 이 조건을 요구하는 것은 아니다.[19]
7. 예시
- f(x) = x²는 f''(x) = 2 > 0 이므로, 볼록 함수이다. 또한 강볼록 함수(따라서 엄격히 볼록 함수)이며, 강볼록 상수는 2이다.[2]
- f(x) = x⁴는 f''(x) = 12x² ≥ 0 이므로 볼록 함수이다. 모든 점에서 이계도함수가 엄격하게 양수는 아니지만, 엄격히 볼록하다. 강볼록 함수는 아니다.[2]
- 절댓값 함수 f(x) = |x|는 (삼각 부등식에 반영되어 있듯이) 볼록 함수이며, x = 0 지점에서 미분 가능하지 않더라도 그렇다. 엄격히 볼록 함수는 아니다.[2]
- p ≥ 1에 대한 함수 f(x) = |x|p는 볼록 함수이다.[2]
- 지수 함수 f(x) = ex는 볼록 함수이다. f''(x) = ex > 0 이므로 엄격히 볼록 함수이기도 하지만, 이계도함수가 임의로 0에 가까워질 수 있으므로 강볼록 함수는 아니다. 좀 더 일반적으로, 함수 f가 볼록 함수라면 g(x) = ef(x)는 로그 볼록 함수이다.[20]
- f(0) = f(1) = 1, 0 < x < 1에 대해 f(x) = 0으로 정의된 [0,1]을 정의역으로 하는 함수 f는 볼록 함수이다. 열린 구간 (0, 1)에서는 연속이지만, 0과 1에서는 연속이 아니다.[2]
- 함수 x³는 이계도함수 6x를 가지므로, x ≥ 0인 집합에서는 볼록 함수이고 x ≤ 0인 집합에서는 오목 함수이다.[2]
- 볼록 함수가 아니면서 단조 함수인 함수의 예로는 f(x) = √x와 g(x) = log x가 있다.[2]
- 단조 함수가 아니지만 볼록 함수인 함수의 예로는 h(x) = x²와 k(x) = -x가 있다.[2]
- 함수 f(x) = 1/x는 f''(x) = 2/x³을 가지며, x > 0일 때 0보다 크므로 f(x)는 구간 (0, ∞)에서 볼록 함수이다. 구간 (-∞, 0)에서는 오목 함수이다.[2]
- f(0) = ∞인 함수 f(x) = 1/x²는 구간 (0, ∞)에서 볼록 함수이고, 구간 (-∞, 0)에서도 볼록 함수이지만, x = 0에서 특이점이 있으므로 구간 (-∞, ∞)에서는 볼록 함수가 아니다.[2]
- LogSumExp 함수(소프트맥스 함수)는 볼록 함수이다.[2]
- 양의 정부호 행렬의 영역에서 함수 -logdet(X)는 볼록 함수이다.[7]
- 모든 실수 값을 갖는 선형 변환은 볼록하지만, 엄격한 볼록 함수는 아니다. f가 선형 함수일 경우, f(a + b) = f(a) + f(b)이기 때문이다. 이 명제는 "볼록"을 "오목"으로 대체해도 성립한다.[2]
- f(x) = aTx + b 형태를 갖는 모든 실수 값을 갖는 아핀 함수는 동시에 볼록 함수이자 오목 함수이다.[2]
- 노름은 삼각 부등식과 양의 동차성에 의해 볼록 함수이다.[2]
- 음이 아닌 행렬의 스펙트럼 반경은 대각 성분에 대한 볼록 함수이다.[21]
8. 기타
경제학에서 곡선이 원점을 향해 활처럼 튀어나온 형태를 '''원점에 대해 볼록'''[24] 또는 '''원점을 향해 볼록'''[25]이라고 부르기도 한다.
참조
[1]
웹사이트
Lecture Notes 2
https://www.stat.cmu[...]
2017-03-03
[2]
웹사이트
Concave Upward and Downward
https://www.mathsisf[...]
[3]
서적
Calculus
Cengage Learning
[4]
서적
Methods of Mathematics Applied to Calculus, Probability, and Statistics
https://books.google[...]
Courier Corporation
[5]
서적
Mathematical Analysis
https://books.google[...]
Mir Publishers
[6]
서적
The Probability Companion for Engineering and Computer Science
https://books.google[...]
Cambridge University Press
[7]
서적
Convex Optimization
https://web.stanford[...]
Cambridge University Press
2011-10-15
[8]
서적
Distributions and Fourier Transforms
https://books.google[...]
Academic Press
2012-08-29
[9]
웹사이트
If f is strictly convex in a convex set, show it has no more than 1 minimum
https://math.stackex[...]
Math StackExchange
2013-03-21
[10]
간행물
Resolvent positive linear operators exhibit the reduction phenomenon. Proceedings of the National Academy of Sciences
[11]
웹사이트
Strong convexity · Xingyu Zhou's blog
https://xingyuzhou.o[...]
2023-09-27
[12]
서적
Convex Analysis and Optimization
https://archive.org/[...]
Athena Scientific
[13]
서적
Introduction to numerical linear algebra and optimisation
Cambridge University Press
[14]
서적
Introductory Lectures on Convex Optimization: A Basic Course
https://archive.org/[...]
Kluwer Academic Publishers
[15]
웹사이트
Optimization III: Convex Optimization
http://www2.isye.gat[...]
2023
[16]
서적
Convex Analysis in General Vector Spaces
World Scientific
[17]
서적
Convex Analysis and Monotone Operator Theory in Hilbert Spaces
https://archive.org/[...]
Springer
[18]
서적
Convex Analysis and Monotone Operator Theory in Hilbert Spaces
https://archive.org/[...]
Springer
[19]
서적
Convex Analysis in General Vector Spaces
World Scientific
[20]
학술저널
A Convexity Property of Positive Matrices
[21]
간행물
Convexity of the dominant eigenvalue of an essentially nonnegative matrix. Proceedings of the American Mathematical Society
https://www.ams.org/[...]
[22]
문서
downward-convex function
[23]
문서
concave function
[24]
문서
芦谷 (2009)
[25]
문서
神部、寶多、濱田 (2006)
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com