맨위로가기

비례위험모형

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

비례위험모형은 생존 분석에 사용되는 통계적 모형으로, 사건 발생 위험이 시간에 따라 어떻게 변화하는지, 그리고 설명 변수가 위험에 미치는 영향을 분석한다. 콕스 모델은 비례 위험 가정을 바탕으로 효과 매개변수를 추정하는 방법으로, 기준 위험 함수를 고려하지 않고 공변량의 효과를 파악한다. 콕스 모형은 다양한 소프트웨어에서 구현되며, 시간 종속 변수와 계수를 포함하도록 확장될 수 있다.

더 읽어볼만한 페이지

  • 생존분석 - 감마 분포
    감마 분포는 형상 모수와 척도 모수로 정의되는 연속 확률 분포로, 확률 밀도 함수가 감마 함수로 표현되며, 베이즈 통계학에서 켤레 사전 분포로 활용되고, 형상 모수가 양의 정수일 때는 얼랑 분포를 나타낸다.
  • 생존분석 - 로그순위법
    로그순위법은 생존 분석에서 두 그룹 간 생존 곡선을 비교하는 통계적 방법으로, 임상 시험과 역학 연구 등에서 치료법이나 요인이 생존 기간에 미치는 영향을 평가하는 데 활용된다.
비례위험모형
일반 정보
분야생존 분석
유형통계 모델
종속 변수시간-이벤트
예측 변수공변량
그룹
관련 모델

2. 배경

콕스 모델은 비례위험 가정을 바탕으로 생존 함수와 변수 사이에 로그-선형 관계가 있다고 가정하고, 회귀분석 방법을 이용하여 중간에 관찰이 중단된 자료(중도 절단 자료)를 처리한다.[1][23]

생존 모형은 크게 두 부분으로 구성된다고 볼 수 있다. 첫째는 '기준 위험 함수'(\lambda_0(t))로, 설명 변수들이 기준 수준일 때 시간 단위당 사건 발생 위험이 시간에 따라 어떻게 변하는지를 나타낸다. 둘째는 효과 매개변수로, 설명 변수(공변량)에 따라 위험이 어떻게 달라지는지를 설명한다. 예를 들어, 의학 연구에서는 치료 방법 배정뿐만 아니라 연구 시작 시점의 연령, 성별, 다른 질병 유무와 같은 환자 특성을 설명 변수로 포함하여 결과의 변동성을 줄이거나 교락 효과를 제어한다.[1][23]

'비례 위험 조건'은 설명 변수가 위험에 곱셈적으로 영향을 미친다는 것을 의미한다.[1][23] 예를 들어, 특정 약물 치료가 모든 시간 t에서 환자의 위험을 절반으로 줄일 수 있다고 가정해 보자. 이때 기준 위험 자체는 시간에 따라 변할 수 있지만, 약물의 효과(위험을 절반으로 줄이는 비율)는 시간에 관계없이 일정하다는 것이 비례 위험 가정이다. 그러나 이것이 환자의 수명을 반드시 두 배로 늘린다는 의미는 아니다. 설명 변수가 수명에 미치는 정확한 영향은 기준 위험 함수 \lambda_0(t)의 형태에 따라 달라진다. 설명 변수는 단순히 '예/아니오' 형태의 이진 변수일 필요는 없다. 연속적인 값을 가지는 공변량 x의 경우, 일반적으로 위험이 지수 함수적으로 반응한다고 가정한다. 즉, x가 한 단위 증가할 때마다 위험이 일정한 비율로 증가하거나 감소한다.[1][23]

항목 i에 대한 변수 벡터를 X_i = \{X_{i1}, \dots, X_{ip}\}라고 할 때, 콕스 모델에서 시간 t에서의 위험 함수 \lambda(t)는 다음과 같이 표현된다.



\lambda(t|X_i) = \lambda_0(t)\exp(\beta_1X_{i1} + \cdots + \beta_pX_{ip}) = \lambda_0(t)\exp(X_i \cdot \beta).



여기서 \lambda_0(t)는 기준 위험 함수이고, \exp(X_i \cdot \beta)는 설명 변수 X_i의 효과를 나타내는 부분이다. \beta는 각 설명 변수에 대한 회귀 계수 벡터이다.

3. 콕스 모델

콕스 모델은 비례위험의 가정이 성립하고 생존함수와 변수 사이에 로그-선형관계가 있다는 가정 하에, 회귀분석 방법을 이용하여 중도 절단된 자료를 처리한다.

피험자 i에 대한 공변량 벡터를 X_i = (X_{i1}, \dots, X_{ip})라고 할 때, 콕스 비례 위험 모형의 위험 함수 \lambda(t)는 다음과 같은 형태를 가진다.



\begin{align}

\lambda(t|X_i) &= \lambda_0(t)\exp(\beta_1X_{i1} + \cdots + \beta_pX_{ip}) \\

&= \lambda_0(t)\exp(X_i \cdot \beta)

\end{align}



이 식은 공변량 벡터 X_i를 가진 피험자 i의 시간 t에서의 위험 함수를 나타낸다. 여기서 \lambda_0(t)기준선 위험(baseline hazard)으로, 모든 피험자에게 동일하게 적용되는 시간 t에 따른 기본적인 위험 수준을 의미한다. 피험자 간의 위험률 차이는 오직 공변량의 효과를 나타내는 \exp(X_i \cdot \beta) 항에 의해서만 결정된다.

데이비드 콕스 경은 비례 위험 가정이 성립한다면(또는 성립한다고 가정하면), 전체 위험 함수(\lambda_0(t) 포함)를 구체적으로 알지 못하더라도 효과 매개변수 \beta를 추정할 수 있다는 점을 발견했다. 이러한 생존 데이터 분석 접근 방식을 콕스 비례 위험 모형,[2] 또는 줄여서 콕스 모형, 비례 위험 모형이라고 부른다.[3] 그러나 콕스는 비례 위험 가정을 생물학적으로 해석하는 것이 매우 까다로울 수 있다고 지적하기도 했다.[4][5]

콕스 모델은 부분 우도(partial likelihood)라는 개념을 사용하여 매개변수 \beta를 추정한다. 이는 시간 경과에 따른 위험의 변화를 직접 모델링하지 않고도 공변량의 영향을 추정할 수 있게 해준다. 이 모델을 통해 추정된 공변량의 효과는 종종 위험비(hazard ratio)로 해석된다.

3. 1. 비례성

먼저, 단일 공변량 x와 단일 계수 \beta_1만 있다고 가정해 보자. 이때 모형은 다음과 같다.

\lambda(t|x) = \lambda_0(t)\exp(\beta_1 x)

여기서 공변량 x의 값을 1만큼 증가시키는 효과를 살펴보자.

\begin{align}

\lambda(t|x+1) &= \lambda_0(t)\exp(\beta_1(x+1)) \\

&= \lambda_0(t)\exp(\beta_1x+\beta_1)\\

&= \Bigl( \lambda_0(t)\exp(\beta_1x) \Bigr) \exp(\beta_1) \\

&= \lambda(t|x) \exp(\beta_1)

\end{align}

이 식은 공변량을 1 증가시키면 원래의 위험률(\lambda(t|x))이 상수 \exp(\beta_1)만큼 곱해지는 것을 보여준다. 즉, 위험률이 \exp(\beta_1)배만큼 증가(또는 감소)한다. 식을 약간 재정렬하면 다음과 같다.

\frac{\lambda(t|x+1)}{\lambda(t|x)} = \exp(\beta_1)

이 식의 우변(\exp(\beta_1))은 시간에 따라 변하지 않는 상수이다. 즉, 공변량 값이 다른 두 경우의 위험률 비율은 시간에 관계없이 일정하다. 이러한 관계, 즉 두 값의 비율이 일정한 것을 비례 관계라고 한다.

더 일반적으로, 각각 공변량 벡터 X_iX_j를 갖는 두 대상 ''i''와 ''j''를 생각해 보자. 이 두 대상의 위험률 비율은 다음과 같이 계산된다.

\begin{align}

\frac{\lambda(t|X_i)}{\lambda(t|X_j)}&=\frac{\lambda_0(t)\exp(X_i \cdot \beta)}{\lambda_0(t)\exp(X_j \cdot \beta)}\\

&=\frac{\cancel{\lambda_0(t)}\exp(X_i \cdot \beta)}{\cancel{\lambda_0(t)}\exp(X_j \cdot \beta)}\\

&=\exp((X_i - X_j) \cdot \beta)

\end{align}

여기서도 우변은 시간에 의존하지 않는다. 시간 t에 따라 변하는 유일한 요소인 기저 위험률 \lambda_0(t)가 분자와 분모에서 약분되어 사라지기 때문이다. 따라서 서로 다른 공변량 값을 가진 두 대상의 위험률 비율은 시간에 관계없이 일정하며, 이를 위험률의 비례성이라고 한다. 이것이 콕스 모형의 핵심 가정이다.

3. 2. 절편 항의 부재

일반적으로 회귀 모형에는 절편 항(상수 항 또는 바이어스 항이라고도 함)이 포함되지만, 콕스 비례 위험 모형에는 기준 위험률 \lambda_0(t)가 그 역할을 대신하기 때문에 별도의 절편 항이 없다. 기준 위험률 \lambda_0(t)는 모든 개체의 공통적인 기본 위험 수준을 나타낸다.

만약 모형에 절편 항 \beta_0을 명시적으로 포함시킨다고 가정해보자. 이 경우 위험 함수는 다음과 같이 표현될 수 있다.

\begin{align}

\lambda(t|X_i) &= \lambda_0(t)\exp(\beta_1X_{i1} + \cdots + \beta_pX_{ip} + \beta_0)\\

&= \lambda_0(t)\exp(X_i \cdot \beta)\exp(\beta_0) \\

&= \left ( \exp(\beta_0)\lambda_0(t)\right ) \exp(X_i \cdot \beta) \\

&= \lambda^*_0(t)\exp(X_i \cdot \beta)

\end{align}

여기서 \exp(\beta_0)\lambda_0(t)를 새로운 기준 위험률 \lambda^*_0(t)로 재정의할 수 있다. 즉, 절편 항 \beta_0은 기존의 기준 위험률 \lambda_0(t)에 흡수되어 새로운 기준 위험률 \lambda^*_0(t)를 형성하게 된다. 따라서 기준 위험률은 대상의 공변량(설명 변수)에 의존하지 않는 위험률의 모든 부분을 포함하며, 여기에는 모든 대상에 대해 상수인 절편 항도 포함된다고 볼 수 있다. 결국, 콕스 모형에서 별도의 절편 항을 설정하는 것은 불필요하다.

3. 3. 유일한 시간을 위한 가능도

콕스 부분가능도는 기본 위험 함수에 대한 브레슬로우 추정치를 사용하여 전체 가능도에 대입한 다음, 그 결과가 두 개의 인자의 곱이라는 것을 관찰하여 얻을 수 있다. 첫 번째 인자는 아래에 제시된 부분 가능도로, 기본 위험 함수 항은 소거된다. 이 부분 가능도는 단순히 사건 발생 시간 집합과 피험자의 공변량 집합이 주어졌을 때, 실제로 발생한 순서대로 피험자가 사건을 경험했을 확률을 나타낸다. 두 번째 인자는 회귀 계수와는 무관하며, 중도절단 패턴을 통해서만 데이터에 의존한다. 이러한 이유로 비례위험모형으로 추정된 공변량의 효과는 위험비로 보고될 수 있다.

사건 순서에 대한 부분 가능도를 계산하기 위해, 사건이 발생한 M개의 표본을 발생 시간의 오름차순(Y_1 < Y_2 < \dots < Y_M)으로 정렬한다. 시간 Y_i에서 관측된 사건이 피험자 i에게 발생할 확률 L_i(\beta)는 다음과 같이 표현된다.



L_i(\beta)

=\frac{\lambda(Y_i\mid X_i)}{\sum_{j:Y_j\ge Y_i} \lambda(Y_i\mid X_j)}

=\frac{\lambda_0(Y_i)\theta_i}{\sum_{j:Y_j\ge Y_i} \lambda_0(Y_i)\theta_j}

=\frac{\theta_i}{\sum_{j:Y_j\ge Y_i} \theta_j}



여기서 \theta_j = \exp(X_j \cdot \beta)이고, 합계는 시간 Y_i 이전에 사건이 발생하지 않은 피험자 j의 집합(피험자 i 자신 포함)에 대한 것이다. 이 확률값은 0과 1 사이의 값을 가진다 (0 < L_i(\beta) \le 1).

피험자들이 통계적으로 서로 독립적이라고 가정하면, 관찰된 모든 사건의 동시 확률은 각 사건에 대한 부분 가능도의 곱으로 나타낼 수 있다. 사건이 발생한 피험자를 C_i=1로 표시할 때, 전체 부분 가능도는 다음과 같다.[6]



L(\beta) = \prod_{i:C_i=1} L_i(\beta)



해당 로그 부분 가능도는 다음과 같다.



\ell(\beta) = \sum_{i:C_i=1} \left(X_i \cdot \beta - \log \sum_{j:Y_j\ge Y_i}\theta_j\right)



이 로그 부분 가능도 함수를 \beta에 대해 최대화하여 모형 매개변수의 최대 부분 가능도 추정치를 얻을 수 있다. 중요한 점은 시간 경과에 따른 위험 함수 \lambda_0(t)를 특정하지 않고도 공변량의 효과(\beta)를 추정할 수 있다는 것이다.

부분 스코어 함수는 로그 부분 가능도의 1차 도함수로 다음과 같다.



\ell^\prime(\beta) = \sum_{i:C_i=1} \left(X_i - \frac{\sum_{j:Y_j\ge Y_i}\theta_jX_j}{\sum_{j:Y_j\ge Y_i}\theta_j}\right)



부분 로그 가능도의 헤세 행렬은 2차 도함수로 다음과 같다.



\ell^{\prime\prime}(\beta) = -\sum_{i:C_i=1} \left(\frac{\sum_{j:Y_j\ge Y_i}\theta_jX_jX_j^\prime}{\sum_{j:Y_j\ge Y_i}\theta_j} - \frac{\left[\sum_{j:Y_j\ge Y_i}\theta_jX_j\right] \left[\sum_{j:Y_j\ge Y_i}\theta_jX_j^\prime\right]}{\left[\sum_{j:Y_j\ge Y_i}\theta_j\right]^2}\right)



이 스코어 함수와 헤세 행렬을 이용하여 뉴턴-랩슨 알고리즘으로 부분 가능도를 최대화할 수 있다. 추정된 \beta 값에서 계산된 헤세 행렬의 역행렬은 추정값의 근사 분산-공분산 행렬로 사용될 수 있으며, 이를 통해 회귀 계수의 근사 표준 오차를 구할 수 있다.

3. 4. 동률 시간이 존재하는 경우의 가능도

시간 데이터에 동률이 존재하는 경우를 처리하기 위해 몇 가지 방법이 제안되었다. 브레슬로우 방법(Breslow's method)은 동률이 있는 경우에도 기존 절차를 수정 없이 사용하는 접근 방식이다. 더 나은 결과를 제공한다고 여겨지는 대안적인 접근 방식은 에프론 방법(Efron's method)이다.[7] t_j를 고유한 시간, H_jY_i = t_j 이고 C_i = 1인 인덱스 i의 집합, m_j = |H_j|로 나타낸다. 에프론 방법은 다음 부분 가능도를 최대화한다.



L(\beta) = \prod_j \frac{\prod_{i\in H_j}\theta_i}{\prod_{\ell=0}^{m_j-1} \left[\sum_{i:Y_i\ge t_j}\theta_i - \frac{\ell}{m_j} \sum_{i\in H_j} \theta_i\right]

}.



대응되는 로그 부분 가능도는 다음과 같다.



\ell(\beta) = \sum_j \left(\sum_{i\in H_j} X_i \cdot \beta -\sum_{\ell=0}^{m_j-1}\log\left(\sum_{i:Y_i\ge t_j}\theta_i - \frac{\ell}{m_j} \sum_{i\in H_j}\theta_i\right)\right),



스코어 함수는 다음과 같다.



\ell^\prime(\beta) = \sum_j \left(\sum_{i\in H_j} X_i -\sum_{\ell=0}^{m_j-1}\frac{\sum_{i:Y_i\ge t_j}\theta_iX_i - \frac{\ell}{m_j}\sum_{i\in H_j}\theta_iX_i}{\sum_{i:Y_i\ge t_j}\theta_i - \frac{\ell}{m_j}\sum_{i\in H_j}\theta_i}\right),



그리고 헤세 행렬은 다음과 같다.



\ell^{\prime\prime}(\beta) = -\sum_j \sum_{\ell=0}^{m_j-1} \left(\frac{\sum_{i:Y_i\ge t_j}\theta_iX_iX_i^\prime - \frac{\ell}{m_j}\sum_{i\in H_j}\theta_iX_iX_i^\prime}{\phi_{j,\ell,m_j}} - \frac{Z_{j,\ell,m_j} Z_{j,\ell,m_j}^\prime}{\phi_{j,\ell,m_j}^2}\right),



여기서,



\phi_{j,\ell,m_j} = \sum_{i:Y_i\ge t_j}\theta_i - \frac{\ell}{m_j}\sum_{i\in H_j}\theta_i





Z_{j,\ell,m_j} = \sum_{i:Y_i\ge t_j}\theta_iX_i - \frac{\ell}{m_j}\sum_{i\in H_j}\theta_iX_i.



H_j가 비어 있는 경우(시간 t_j의 모든 관측값이 중도절단된 경우), 이 식들의 합은 0으로 처리된다.

4. 예시

다음은 콕스 비례위험모형의 실제 사용에 대한 몇 가지 예시이다.

4. 1. 단일 이진 공변량

수술 후 5년의 관찰 기간 동안 환자의 생존 여부를 관심 결과로 가정해 보자. 환자는 5년 이내에 사망할 수도 있고, 5년 이상 생존할 수도 있다. 사망한 경우 사망 시점이 기록되고, 5년 이상 생존한 경우 그 사실만 기록된다. 수술은 두 병원, ''A'' 또는 ''B'' 중 한 곳에서 이루어졌으며, 병원 위치가 5년 생존율과 관련이 있는지 알아보고자 한다. 특히 병원 B에서 수술받은 경우와 비교하여 병원 A에서 수술받은 경우의 위험률(hazard rate)이 상대적으로 얼마나 증가(또는 감소)하는지 파악하는 것이 목표이다.

아래는 예시 데이터로, 각 행은 한 명의 환자를 나타낸다. ''T''는 환자가 사망했거나 5년까지 관찰된 기간(월 단위)이고, ''C''는 환자가 5년 내에 사망했는지 여부(True/False)를 나타낸다. 병원 위치는 이진 변수 ''X''로 표시하며, 병원 ''A''는 1, 병원 ''B''는 0으로 코딩했다.

병원XT (월)C (사망 여부)
B060False
B032True
B060False
B060False
B060False
A14True
A118True
A160False
A19True
A131True
A153True
A117True



단일 공변량을 사용하는 콕스 비례위험모형은 다음과 같이 표현할 수 있다. 여기서 \beta_1은 병원의 영향을 나타내는 계수이고, ''i''는 각 환자를 의미한다.



\overbrace{\lambda(t|X_{i})}^{\text{환자 i의 위험률}} = \underbrace{\lambda_0(t)}_{\text{기준선 위험률}}\cdot\overbrace{\exp(\beta_1 X_{i})}^{\text{환자 i의 위험 스케일링 팩터}}



통계 소프트웨어를 사용하여 \beta_1 값을 추정한 결과 약 2.12를 얻었다고 가정하자. 위험비(Hazard Ratio, HR)는 이 값의 지수인 \exp(\beta_1) = \exp(2.12)로 계산된다. 두 병원 간의 위험률 비율을 비교하면 다음과 같다.



\frac{\lambda(t|X=1)}{\lambda(t|X=0)} = \frac{\cancel{\lambda_0(t)}\exp(\beta_1 \cdot 1)}{\cancel{\lambda_0(t)}\exp(\beta_1 \cdot 0)} = \exp(\beta_1)



따라서 병원 A(X=1)와 병원 B(X=0)의 위험비는 \exp(2.12) \approx 8.32이다. 통계적 유의성을 잠시 고려하지 않는다면, 이 결과는 병원 A에서 수술받은 환자가 병원 B에서 수술받은 환자에 비해 특정 시점에서의 순간적인 사망 위험이 약 8.3배 더 높다는 것을 의미한다.

이 해석에는 몇 가지 중요한 주의사항이 따른다.

# 사망 위험이 8.3배 더 높다는 것이 병원 A에서 8.3배 더 많은 환자가 사망한다는 의미는 아니다. 생존 분석은 사건 발생 여부뿐만 아니라 사건 발생 속도(얼마나 빨리 발생하는지)를 함께 고려한다.

# "사망 위험"은 비율(rate)의 개념으로, 단위 시간당 사건 발생률을 의미한다 (예: 속도). 하지만 상대적 위험률인 위험비는 단위가 없는 비교값이다. 즉, 병원 A의 사망 위험률이 병원 B(기준 집단)의 사망 위험률보다 8.3배 더 높다는 의미이다.

# 반대로 병원 B의 위험률은 병원 A에 비해 1/8.32 = \exp(-2.12) \approx 0.12배이다.

# 이 모형만으로는 각 병원에서의 생존 확률 자체를 직접 추론하기는 어렵다. 생존 확률을 계산하려면 \beta_1 추정치뿐만 아니라 기준선 위험률 \lambda_0(t)의 추정치가 필요하지만, 일반적인 콕스 모형 추정 과정에서는 기준선 위험률을 직접 추정하지 않는 경우가 많다.

# 콕스 모형에서 시간에 따라 변하는 유일한 부분은 기준선 위험률 \lambda_0(t)이다. 위험비 \exp(\beta_1)는 시간에 따라 변하지 않는다고 가정하므로, 시간 단위를 월 대신 년으로 측정했더라도 \beta_1 추정치와 위험비는 동일하게 계산된다.

# 이 분석 결과는 병원 위치와 사망 위험 간의 연관성을 보여줄 뿐, 병원 자체가 위험률 차이를 유발했다고 단정하기는 어렵다. 데이터가 관찰 연구에서 얻어진 경우, 인과관계를 추론하는 데에는 한계가 있다.

4. 2. 단일 연속형 공변량

생존 분석은 다양한 분야에서 활용될 수 있는데, 여기서는 경제학 분야의 예시를 통해 연속형 공변량을 사용하는 경우를 살펴보자. 특정 회사가 IPO를 한 지 1년이 되는 시점의 주가수익비율(P/E)이 그 회사의 미래 생존 가능성에 어떤 영향을 미치는지 분석하는 문제이다. 여기서 회사의 "시작 시점"은 IPO 1주년으로 보고, "종료 시점"은 회사가 파산, 매각되거나 비공개 회사로 전환되는 등의 사건으로 간주한다. 즉, IPO 1주년 시점의 P/E 비율이 회사의 생존 기간에 미치는 영향을 알고자 하는 것이다.

분석을 위해 가상의 12개 회사에 대한 생존 데이터가 아래 표와 같이 주어졌다고 가정하자. 표에서 ''T''는 IPO 1주년부터 종료 시점까지의 기간(일 단위)을 나타내며, 만약 종료 이벤트 없이 관찰이 종료되었다면(예: 2022년 1월 1일), 해당 시점까지의 기간을 나타낸다. ''C''는 관찰 종료일(2022년 1월 1일) 이전에 종료 이벤트가 발생했는지 여부를 나타내는 지표이다(True: 발생, False: 발생 안 함/중도절단). P/E는 IPO 1주년 시점의 주가수익비율이다.

가상 회사 데이터 예시
회사 번호IPO 1주년 날짜종료 날짜*종료 여부(C)생존 기간(T, 일)P/E
02000-11-052011-01-22True37309.7
12000-12-012003-03-30True84912.0
22011-01-052012-03-30True4503.0
32010-05-292011-02-22True2695.3
42005-06-232022-01-01False603610.8
52000-06-102002-07-24True7746.3
62011-07-112014-05-01True102511.6
72007-09-272022-01-01False521010.3
82006-07-302010-06-03True14048.0
92000-07-132001-07-19True3714.0
102013-06-102018-10-10True19485.9
112011-07-162014-08-15True11268.3



'''*''' 종료 날짜는 파산, 매각 등 이벤트 발생일 또는 관찰 종료일(2022-01-01)을 의미한다.

이전 예시들과 달리 이 데이터에는 연속형 변수인 P/E가 포함되어 있다. 콕스 모델은 다음과 같이 설정할 수 있다.

\lambda(t|P_{i}) = \lambda_0(t)\cdot\exp(\beta_1 P_{i})

여기서 P_i는 회사 ''i''의 P/E 비율을 나타낸다. 이 데이터를 콕스 모델에 적용하면, 모델의 계수 \beta_1의 추정값을 얻을 수 있으며, 이 예시에서는 -0.34라고 가정하자. 따라서 특정 회사의 위험 함수 추정치는 다음과 같다.

\lambda(t|P_{i}) = \lambda_0(t)\cdot\exp(-0.34 P_{i})

콕스 모델의 특성상 기준 위험 \lambda_0(t) 자체는 추정되지 않으므로, 특정 시점의 절대적인 위험 수준을 계산할 수는 없다. 하지만 두 회사 ''i''와 ''j'' 사이의 상대적인 위험 비율은 계산할 수 있다.

\begin{align}

\frac{\lambda(t|P_{i})}{\lambda(t|P_{j})}

&= \frac{ \cancel{\lambda_0(t)}\cdot\exp(-0.34 P_{i})}{\cancel{\lambda_0(t)}\cdot \exp(-0.34 P_{j})} \\

&= \exp(-0.34 (P_{i} - P_{j}))

\end{align}

이 식의 우변에 있는 값들은 모두 알려진 값(또는 추정된 값 \beta_1과 데이터 P_i, P_j)이므로, 두 회사 간의 위험 비율 계산이 가능하다. 또한, 계산된 위험 비율 식에는 시간에 따라 변하는 항(t)이 없으므로, 두 회사의 위험 비율은 시간이 지나도 일정하게 유지된다. 이것이 바로 '비례 위험' 가정이다. 예를 들어, P/E가 각각 6.3과 3.0인 회사 5와 회사 2의 위험 비율은 다음과 같이 계산된다: \exp(-0.34 (6.3 - 3.0)) = 0.33. 이는 주어진 기간 내에서 회사 5가 파산이나 매각 등으로 사라질 위험이 회사 2의 약 1/3 수준임을 의미한다. P/E가 높은 회사 5의 위험이 더 낮게 나타난 것이다(\beta_1이 음수이므로).

결과 해석 시 다음과 같은 점에 유의해야 한다.

# 위험 비율 (\exp(\beta_1)) 해석: 흔히 "위험 비율"이라고 부르는 값은 \exp(\beta_1)이며, 이 예시에서는 \exp(-0.34) \approx 0.71이다. 이 값은 공변량(여기서는 P/E) 값이 1단위 차이 나는 두 대상 간의 위험 비율로 해석될 수 있다. 즉, 회사 ''i''의 P/E가 회사 ''j''보다 정확히 1만큼 높다면(P_{i} = P_{j} + 1), 회사 ''i''의 위험은 회사 ''j''의 위험의 \exp(-0.34 \times 1) = 0.71배가 된다. P/E가 1단위 높을수록 종료 위험이 약 29% 낮아지는 것이다.

# 기준 위험 (\lambda_0(t)) 해석의 한계: 기준 위험 \lambda_0(t)는 모든 공변량의 값이 0일 때의 위험 함수, 즉 \lambda(t|P_{i}=0) = \lambda_0(t)\cdot\exp(-0.34 \cdot 0) = \lambda_0(t)로 생각할 수 있다. 따라서 기준 위험을 P/E가 0인 "기준 회사"의 위험으로 해석할 수도 있다. 하지만 이 예시에서 P/E가 0이라는 것은 현실적으로 불가능하며(주가가 0이거나 이익이 무한대여야 함), 의미를 부여하기 어렵다. 따라서 "모든 공변량이 0일 때의 위험"이라는 해석이 더 적절하지만, 이 예시처럼 공변량 0이 불가능한 경우에는 기준 위험 자체의 직접적인 해석은 제한적이다.

# 개별 위험 인자 (\exp(\beta_1 P_{i})) 해석의 문제점: \exp(\beta_1 P_{i}) 값 자체를 회사 ''i''의 위험 수준을 나타내는 지표로 해석하고 싶을 수 있다. 하지만 이 값은 \exp(\beta_1 P_{i}) = \frac{\exp(\beta_1 P_{i})}{\exp(\beta_1 \cdot 0)} = \frac{\lambda(t|P_{i})}{\lambda(t|P=0)}와 같이, P/E가 0인 가상의 기준 회사 대비 회사 ''i''의 위험 비율을 의미한다. 위에서 언급했듯이 P/E=0인 기준 회사는 현실성이 없으므로, \exp(\beta_1 P_{i}) 값 자체를 독립적으로 해석하는 것은 이 예시에서는 의미가 없다. 중요한 것은 P/E 값이 다른 두 실제 회사 간의 위험 비율이다.

5. 시간 종속 예측 변수 및 계수

안데르센과 길(Andersen and Gill)의 계수 과정 공식을 사용하면 콕스 모형을 확장하여 시간에 따라 변하는 변수, 시간에 따라 달라지는 층화, 그리고 각 대상자별로 여러 사건이 발생하는 경우까지 다룰 수 있다.[8][29] 예를 들어, 시간에 따라 변하는 회귀 변수를 사용하는 위험 모형은 실업 보험이 실업 기간에 미치는 영향을 추정하는 데 사용될 수 있다.[9][10][30][31]

콕스 모형은 시간 종속 공변량(즉, 예측 변수)을 허용하도록 일반화될 수 있다. 즉, 예측 변수의 값이 시간에 따라 변할 수 있다는 의미이다.

나아가, 콕스 모형은 시간 종속 계수를 허용하도록 더 일반화될 수 있다. 이는 어떤 처치(예: 약물 투여)의 효과가 시간에 따라 달라질 수 있음을 의미한다. 예를 들어, 특정 약물이 이환율 발생 직후에는 매우 효과적이지만 시간이 지남에 따라 그 효과가 점차 감소하는 경우가 있을 수 있다.[11][32] 이러한 경우, 계수가 시간에 따라 변하지 않는다는 가설(정상성 가설)을 검증해 볼 수 있다. 더 자세한 내용과 관련 소프트웨어(R 패키지) 정보는 Martinussen과 Scheike (2006)의 연구에서 찾아볼 수 있다.[11][12][32][33] 신뢰성 계산 분야에서도 시간 종속 공변량을 사용한 콕스 모형의 적용이 고려되고 있다.[34]

이와 관련하여, 공변량의 효과를 곱셈적이 아닌 덧셈 형태로 지정하는 부가적 위험 모형도 이론적으로 가능하다.[13][26] 이 모형은 다음과 같이 표현된다.



\lambda(t|X_i) = \lambda_0(t) + \beta_1X_{i1} + \cdots + \beta_pX_{ip} = \lambda_0(t) + X_i \cdot \beta.



하지만 로그 가능도를 최대화하는 방식으로 모형을 추정할 경우, 위험 함수 \lambda(t\mid X_i)의 값이 음수가 되지 않도록 제약을 가해야 하는 복잡성이 있다. 이러한 이유로 부가적 위험 모형은 실제 분석에서는 자주 사용되지 않는다. 반면, 최소 제곱법을 목표로 할 경우에는 음수 제한이 엄격하게 요구되지는 않는다.

6. 기준 위험 함수 지정

콕스 모형은 특정 상황에서 기준 위험 함수 \lambda_0(t)를 구체적인 함수 형태로 지정하여 특화할 수 있다. 예를 들어, 기준 위험 함수가 와이블 분포의 위험 함수 형태를 따른다고 가정하면, 이를 '와이블 비례 위험 모형'이라고 부른다. 와이블 분포를 기준 위험 함수로 사용하는 경우는 해당 모형이 비례 위험 모형이면서 동시에 가속 고장 시간 모형의 성질도 만족하는 유일한 경우이다.

이처럼 기준 위험 함수를 특정 분포로 지정하는 모형을 '모수적 비례 위험 모형'이라고 하며, 기준 위험 함수를 특정하지 않는 일반적인 콕스 비례 위험 모형은 '반모수 모형'으로 분류된다.

일부 연구자들은 기준 위험 함수를 특정 모수적 형태로 지정하는 경우에도, 이 분야에 대한 데이비드 콕스의 기여를 인정하여 '콕스 비례 위험 모형'이라는 용어를 사용하기도 한다.[14][35]

'콕스 회귀 모형'이라는 용어는 시간 의존적 요인을 포함하도록 확장된 모형을 지칭하는 데 쓰이기도 하지만, 콕스 비례 위험 모형 자체가 회귀분석의 일종으로 볼 수 있으므로 용어 사용에 혼란이 있을 수 있다.

7. 푸아송 모델과의 관계

비례 위험 모형과 푸아송 회귀 모형 사이에는 관계가 있다. 이 관계를 이용하여, 푸아송 회귀 분석용 소프트웨어를 통해 비례 위험 모형을 근사적으로 적합시키기도 한다. 이렇게 하는 주된 이유는 계산 속도가 훨씬 빠르다는 장점 때문이다. 과거 컴퓨터 성능이 낮았던 시절에는 이러한 방식이 더욱 중요하게 여겨졌으나, 오늘날에도 대규모 데이터 집합이나 복잡한 문제를 다룰 때 여전히 유용하게 사용될 수 있다. Laird와 Olivier (1981)는 이 관계에 대한 수학적 세부 사항을 제시했으며[15], 그들은 "우리는 [푸아송 모형]이 참이라고 가정하는 것이 아니라, 단지 우도(likelihood)를 유도하기 위한 장치로 사용할 뿐이다"라고 언급했다. McCullagh와 Nelder의 저서 『일반화 선형 모형』에도 비례 위험 모형을 일반화 선형 모형으로 변환하는 방법에 대한 장이 있다.[16]

8. 고차원 설정

고차원 설정에서는 공변량의 수 p가 표본 크기 n에 비해 클 수 있다. 이러한 경우 Lasso 방법은 모형을 선택하는 데 사용되는 고전적인 전략 중 하나이다. Tibshirani(1997)는 비례 위험 회귀 모수 추정을 위한 Lasso 절차를 제안했다.[17] 회귀 모수 β의 Lasso 추정량은 L1-노름 제약 조건 하에서 Cox 부분 로그-우도 함수의 음의 값을 최소화하는 값으로 정의된다.

:

\ell(\beta) = \sum_j \left(\sum_{i\in H_j} X_i \cdot \beta -\sum_{\ell=0}^{m_j-1}\log\left(\sum_{i:Y_i\ge t_j}\theta_i - \frac{\ell}{m_j}\sum_{i\in H_j}\theta_i\right)\right)

+ \lambda \|\beta\|_1



최근 이 주제에 대한 이론적인 발전이 있었다.[18][19][20][21]

9. 소프트웨어 구현


  • '''매스매티카(Wolfram Mathematica)''': ''CoxModelFit'' 함수.[22]
  • '''R''': '''survival''' 패키지 내의 ''coxph()'' 함수.
  • '''SAS''': ''phreg'' 프로시저.
  • '''Stata''': ''stcox'' 명령어.
  • '''파이썬(Python)''': '''lifelines''' 라이브러리 내의 ''CoxPHFitter'', '''statsmodels''' 라이브러리 내의 ''phreg''.
  • '''SPSS''': '''Cox 회귀''' 분석 기능에서 사용 가능.
  • '''MATLAB''': ''fitcox'' 또는 ''coxphfit'' 함수.
  • '''줄리아(Julia)''': '''Survival.jl''' 라이브러리에서 사용 가능.
  • '''JMP''': '''비례 위험 적합''' 플랫폼에서 사용 가능.
  • '''프리즘(Prism)''': 생존 분석 및 다변수 분석 기능에서 사용 가능.

참조

[1] 논문 Analysis of Survival Data under the Proportional Hazards Model
[2] 논문 Regression Models and Life-Tables
[3] 논문 Fifty Years of the Cox Model 2023-03-10
[4] 논문 A Conversation with Sir David Cox
[5] 간행물 Some remarks on the analysis of survival data
[6] 문서 Each failure contributes to the likelihood function
[7] 논문 The Efficiency of Cox's Likelihood Function for Censored Data
[8] 논문 Cox's regression model for counting processes, a large sample study.
[9] 논문 Unemployment Insurance and Unemployment Spells http://www.nber.org/[...]
[10] 논문 Unemployment Duration, Benefit Duration, and the Business Cycle http://www.bde.es/f/[...]
[11] 서적 Dynamic Regression Models for Survival Data Springer
[12] 웹사이트 timereg: Flexible Regression Models for Survival Data https://cran.r-proje[...]
[13] 간행물 Some remarks on the analysis of survival data
[14] 논문 Generating survival times to simulate Cox proportional hazards models
[15] 논문 Covariance Analysis of Censored Survival Data Using Log-Linear Analysis Techniques
[16] 서적 Generalized Linear Models Chapman & Hall/CRC
[17] 논문 The Lasso method for variable selection in the Cox model
[18] 논문 Regularization for Cox's proportional hazards model with NP-dimensionality
[19] 논문 Structured Estimation in Nonparametric Cox Model
[20] 논문 Non-asymptotic oracle inequalities for the high-dimensional Cox regression via Lasso
[21] 논문 Oracle inequalities for the lasso in the Cox model
[22] 웹사이트 CoxModelFit https://reference.wo[...]
[23] 논문 Analysis of Survival Data under the Proportional Hazards Model
[24] 논문 Regression Models and Life-Tables
[25] 논문 A Conversation with Sir David Cox
[26] 간행물 Some remarks on the analysis of survival data
[27] 문서 Each failure contributes to the likelihood function
[28] 논문 The Efficiency of Cox's Likelihood Function for Censored Data
[29] 논문 Cox's regression model for counting processes, a large sample study.
[30] 논문 Unemployment Insurance and Unemployment Spells http://www.nber.org/[...]
[31] 논문 Unemployment Duration, Benefit Duration, and the Business Cycle http://www.bde.es/f/[...]
[32] 서적 Dynamic Regression Models for Survival Data Springer
[33] 웹사이트 timereg: Flexible Regression Models for Survival Data https://cran.r-proje[...] 2021-10-17
[34] 논문 Decline and repair, and covariate effects http://usir.salford.[...]
[35] 논문 Generating survival times to simulate Cox proportional hazards models
[36] 논문 Covariance Analysis of Censored Survival Data Using Log-Linear Analysis Techniques
[37] 서적 Generalized Linear Models Chapman & Hall/CRC
[38] 논문 The Lasso method for variable selection in the Cox model
[39] 논문 Regularization for Cox's proportional hazards model with NP-dimensionality
[40] 논문 Structured Estimation in Nonparametric Cox Model
[41] 논문 Non-asymptotic oracle inequalities for the high-dimensional Cox regression via Lasso
[42] 논문 Oracle inequalities for the lasso in the Cox model
[43] 저널 Survival Analysis Part II: Multivariate data analysis – an introduction to concepts and methods 2003-08-04



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com