3. 참조 무결성
외래 키는 참조 무결성을 보장하는 데 중요한 역할을 한다. 참조 무결성은 참조하는 테이블의 외래 키 값이 참조되는 테이블의 기본 키 값과 일치하거나 NULL이어야 함을 의미한다. 이 규칙을 두 테이블 간의 참조 무결성 제약 조건이라고 한다.
이러한 제약 조건 위반은 많은 데이터베이스 문제의 원인이 될 수 있으므로, 대부분의 데이터베이스 관리 시스템은 모든 널이 아닌 외래 키가 참조 테이블의 행에 해당하는지 확인하는 메커니즘을 제공한다.
예를 들어, 모든 고객 데이터를 포함하는 CUSTOMER 테이블과 모든 고객 주문을 포함하는 ORDER 테이블이 있다고 가정할 때, 비즈니스에서 각 주문이 단일 고객을 참조해야 한다고 가정한다. 이를 데이터베이스에 반영하기 위해 ORDER 테이블에 외래 키 열(예: CUSTOMERID)을 추가하여 CUSTOMER의 기본 키(예: ID)를 참조한다. 테이블의 기본 키는 고유해야 하고 CUSTOMERID는 해당 기본 키 필드의 값만 포함하므로, 값이 있는 경우 CUSTOMERID는 주문을 한 특정 고객을 식별한다고 가정할 수 있다. 그러나 CUSTOMER 테이블의 행이 삭제되거나 ID 열이 변경될 때 ORDER 테이블이 최신 상태로 유지되지 않으면 더 이상 그렇게 가정할 수 없으며, 이러한 테이블을 사용하는 것이 더 어려워질 수 있다.
4. 참조 동작
관계 데이터베이스 관리 시스템(RDBMS) 혹은 SQL 데이터베이스 관리 시스템은 참조 정합성 제약을 강제 적용하기 위해, 참조되는 테이블의 행을 삭제하거나 갱신할 때 데이터 정합성을 유지해야 한다. 참조하는 테이블에 해당 행이 남아있다면, 참조 정합성을 고려해야 한다. 데이터베이스 언어 표준 SQL:2003은 이러한 경우를 위해 5가지 참조 동작을 규정한다.
* CASCADE
* RESTRICT
* NO ACTION
* SET NULL
* SET DEFAULT
각 참조 동작은 참조되는 테이블의 행이 변경될 때, 참조하는 테이블의 외래 키 값을 어떻게 처리할지 정의한다. 예를 들어, `CASCADE`는 참조되는 행이 삭제되면 참조하는 행도 함께 삭제하고, `RESTRICT`는 참조하는 행이 있으면 참조되는 행의 삭제나 갱신을 막는다. `NO ACTION`은 SQL 문 실행 종료 시점에 참조 정합성을 검사하며, `SET NULL`은 참조되는 행이 삭제되거나 갱신될 때 외래 키 값을 `NULL`로 설정한다. `SET DEFAULT`는 외래 키 값을 기본값(default)으로 설정한다.
4.1. CASCADE
관계 데이터베이스 관리 시스템(RDBMS)이나 SQL 데이터베이스 관리 시스템에서 참조되는 테이블의 행이 삭제 또는 업데이트될 때, CASCADE 옵션을 사용하면 참조하는 테이블의 해당 행도 함께 삭제 또는 업데이트된다.
* 삭제 시 연쇄 삭제: 참조되는 테이블의 행이 삭제되면, 참조하는 테이블에서 해당 외래 키를 가진 모든 행이 자동으로 삭제된다.
* 업데이트 시 연쇄 업데이트: 참조되는 테이블의 행이 업데이트되면, 참조하는 테이블의 외래 키 값도 동일한 값으로 자동 업데이트된다.
이러한 연쇄 삭제(cascade delete) 및 연쇄 업데이트(cascade update) 기능을 통해 데이터의 연쇄적인 변경을 자동으로 처리하여 참조 정합성을 유지할 수 있다.
4.2. RESTRICT
참조하는 테이블에 해당 외래 키 값을 가진 행이 존재하면, 참조되는 테이블의 행을 삭제하거나 업데이트할 수 없다. 데이터 변경을 제한하여 참조 무결성을 엄격하게 유지한다. Microsoft SQL Server 2012 및 이전 버전에서는 지원되지 않는다.
4.3. NO ACTION
관계 데이터베이스 관리 시스템(RDBMS) 또는 SQL 데이터베이스 관리 시스템에서 사용되는 참조 조작 중 하나이다. NO ACTION은 참조되는 테이블에 대해 `UPDATE` 또는 `DELETE`가 실행될 때, 데이터베이스 관리 시스템이 SQL 문 실행 종료 시점에 참조 정합성을 만족하는지 검사한다.
NO ACTION은 `RESTRICT`와 유사하지만, 참조 무결성 검사 시점에 차이가 있다. `RESTRICT`는 `UPDATE` 또는 `DELETE` 문을 실행하기 전에 검사를 수행하는 반면, NO ACTION은 SQL 문 실행이 종료된 후에 참조 무결성을 검사한다.
트리거나 SQL 문 자체의 시맨틱스에 의해 외래 키 제약이 충족되면 SQL 문 실행이 성공한다. 만약 외래 키 제약이 충족되지 않으면 SQL 문 실행은 실패한다.
4.4. SET NULL
관계 데이터베이스 관리 시스템(RDBMS)이나 SQL 데이터베이스 관리 시스템에서 참조되는 테이블의 행이 삭제 또는 갱신될 때, 참조하는 테이블의 해당 외래 키 값을 `NULL`로 설정한다. 이 옵션은 외래 키에 `NULL` 설정을 허용하는 경우에만 사용할 수 있다. `NULL`의 의미에 따라, 참조하는 테이블에서 `NULL` 값을 가진 행은 참조되는 테이블의 행을 필요로 하지 않는다.
일반적으로 SET NULL에 대해 DBMS이 취하는 조치는 ON DELETE 또는 ON UPDATE 모두 동일하며, 영향을 받는 참조 속성의 값은 NULL로 변경된다.
4.5. SET DEFAULT
SET NULL과 비슷하지만, 참조되는 테이블의 행이 갱신되거나 삭제되었을 경우, 참조하는 테이블의 외래 키 값은 속성의 기본값(default)으로 설정된다.
5. 데이터베이스 설계와 외래 키
외래 키는 참조하는 테이블의 한 키(속성 또는 속성 집합)에 해당하며, 참조하는 쪽의 관계 변수는 참조되는 쪽 테이블의 키를 가리킨다. 참조하는 테이블 속성 행의 값은 참조되는 쪽 테이블의 행 값에 대응된다. 따라서 참조하는 테이블의 행에는 참조되는 테이블에 없는 값을 포함할 수 없다. 이러한 참조 관계는 두 테이블을 연관시키기 위한 관계 데이터베이스 정규화의 본질적인 부분이다. 참조하는 테이블의 여러 행이 참조되는 테이블의 동일한 행을 참조할 수 있다.
참조하는 테이블과 참조되는 테이블이 동일할 수도 있다. 이 경우 외래 키는 자기 자신을 참조하는 것이 된다. 이러한 외래 키는 SQL:2003에서 '자기 참조' 외래 키 혹은 '재귀적' 외래 키로 규정되어 있다.
하나의 테이블은 여러 개의 외래 키를 포함할 수 있으며, 이러한 외래 키들은 각각 서로 다른 테이블을 참조할 수 있다. 각 외래 키는 관계 데이터베이스 관리 시스템(RDBMS)에 의해 개별적으로 강제 적용된다. 따라서 테이블 사이에 연속되는 관련성을 외래 키를 사용해 정의할 수 있다.
설계 관점에서 '외래 키-기본 키' 관계가 없어야 하는데 있거나, 있어야 하는데 없는 경우가 있는데, 이러한 경우는 데이터베이스 설계에 문제를 유발할 수 있다. 외래 키를 포함하는 테이블을 자식 테이블, 후보 키를 포함하는 테이블을 참조 테이블 또는 부모 테이블이라고 한다. 외래 키의 목적은 참조 테이블의 특정 행을 식별하는 것이므로, 일반적으로 외래 키는 기본 테이블의 일부 행에서 후보 키와 같거나 값이 없어야 한다(NULL 값). 이 규칙을 두 테이블 간의 참조 무결성 제약 조건이라고 한다.
이러한 제약 조건 위반은 많은 데이터베이스 문제의 원인이 될 수 있으므로, 대부분의 데이터베이스 관리 시스템은 널이 아닌 모든 외래 키가 참조 테이블의 행에 해당하는지 확인하는 메커니즘을 제공한다.
예를 들어, 고객 데이터를 포함하는 CUSTOMER 테이블과 고객 주문을 포함하는 ORDER 테이블이 있다고 가정해 보자. 각 주문이 단일 고객을 참조해야 한다면, ORDER 테이블에 외래 키 열(CUSTOMERID)을 추가하여 CUSTOMER의 기본 키(ID)를 참조하게 할 수 있다. CUSTOMERID는 해당 기본 키 필드의 값만 포함하므로, CUSTOMERID는 주문을 한 특정 고객을 식별한다고 가정할 수 있다. 그러나 CUSTOMER 테이블의 행이 삭제되거나 ID 열이 변경될 때 ORDER 테이블이 최신 상태로 유지되지 않으면 문제가 발생할 수 있다.
외래 키는 데이터베이스 설계에서 필수적인 역할을 한다. 데이터베이스 설계의 중요한 부분 중 하나는 외래 키를 사용하여 한 테이블에서 다른 테이블을 참조함으로써 실제 엔티티 간의 관계가 데이터베이스에 반영되도록 하는 것이다. 데이터베이스 설계의 또 다른 중요한 부분은 테이블을 분리하고 외래 키를 통해 다시 구성할 수 있는 데이터베이스 정규화이다.
6. 예시
외래 키는 데이터베이스에서 관계를 설정하는 중요한 개념이다. 다음은 외래 키의 이해를 돕기 위한 몇 가지 예시이다.
* 예시 1: 공급업체와 송장: 회계 데이터베이스에서 각 송장(invoice)은 특정 공급업체와 연결된다. 공급업체 정보(이름, 주소 등)는 별도의 '공급업체' 테이블에 보관되며, 각 공급업체는 '공급업체 번호'로 식별된다. 각 송장 레코드에는 해당 송장의 '공급업체 번호'가 포함되어 있다. 여기서 '공급업체 번호'는 '공급업체' 테이블의 기본 키이며, '송장' 테이블의 외래 키는 이 기본 키를 가리킨다.
* 관계형 스키마 (기본 키는 굵게, 외래 키는 이탤릭체):
* 공급업체 (공급업체번호, 이름, 주소)
* 송장 (송장번호, 텍스트, 공급업체번호)
* 예시 2: 부서와 사원: 기업에서 각 사원은 하나의 부서에 속한다. 이 관계는 '사원' 테이블의 외래 키를 통해 강제되며, 이 외래 키는 '부서' 테이블을 참조한다.
* '부서' 테이블의 각 부서는 부서명과 고유 식별자인 "부서 ID"를 가진다. '사원' 테이블은 "부서 ID"를 속성으로 가지며, 이 "부서 ID"는 외래 키로서 '부서' 테이블의 "부서 ID"를 참조한다.
관계형 데이터베이스 관리 시스템(RDBMS) 또는 SQL 데이터베이스 관리 시스템(SQL DBMS)은 '사원' 정보가 '부서' 테이블의 부서를 참조하지 않고 생성되는 것을 방지하고, 특정 부서를 참조하는 사원이 있을 때 해당 부서가 삭제되는 것을 방지한다.
6.1. 예시 1: 공급업체와 송장
외래 키를 설명하기 위한 첫 번째 예시로, 회계 데이터베이스에 송장(invoice) 테이블이 있고 각 송장이 특정 공급업체와 연결되어 있다고 가정한다. 공급업체 세부 정보(이름, 주소 등)는 별도의 테이블에 보관되며, 각 공급업체에는 이를 식별하기 위해 '공급업체 번호'가 부여된다. 각 송장 레코드에는 해당 송장의 공급업체 번호가 포함된 속성이 있다. 이때, '공급업체 번호'는 공급업체 테이블의 기본 키이다. 송장 테이블의 외래 키는 해당 기본 키를 가리킨다.
관계형 스키마는 다음과 같다. (기본 키는 굵게, 외래 키는 이탤릭체로 표시)
* 공급업체 (공급업체번호, 이름, 주소)
* 송장 (송장번호, 텍스트, 공급업체번호)
이에 해당하는 데이터 정의 언어 명령문은 다음과 같다.
```sql
CREATE TABLE Supplier (
SupplierNumber INTEGER NOT NULL,
Name VARCHAR(20) NOT NULL,
Address VARCHAR(50) NOT NULL,
CONSTRAINT supplier_pk PRIMARY KEY(SupplierNumber),
CONSTRAINT number_value CHECK(SupplierNumber > 0)
)
CREATE TABLE Invoice (
InvoiceNumber INTEGER NOT NULL,
Text VARCHAR(4096),
SupplierNumber INTEGER NOT NULL,
CONSTRAINT invoice_pk PRIMARY KEY(InvoiceNumber),
CONSTRAINT inumber_value CHECK (InvoiceNumber > 0),
CONSTRAINT supplier_fk
FOREIGN KEY(SupplierNumber) REFERENCES Supplier(SupplierNumber)
ON UPDATE CASCADE ON DELETE RESTRICT
)
```
관계형 모델의 스키마는 다음과 같다. (기본 키는 굵게 표시)
* Supplier ( SupplierNumber, Name, Address, Type )
* Invoices ( InvoiceNumber, SupplierNumber, Text )
이 스키마에 해당하는 데이터 정의 언어 (DDL)에 의한 정의는 다음과 같다.
```sql
CREATE TABLE Supplier (
SupplierNumber INTEGER NOT NULL,
Name VARCHAR(20) NOT NULL,
Address VARCHAR(50) NOT NULL,
Type VARCHAR(10),
CONSTRAINT supplier_pk PRIMARY KEY(SupplierNumber),
CONSTRAINT number_value CHECK (SupplierNumber > 0) )
```
```sql
CREATE TABLE Invoices (
InvoiceNumber INTEGER PRIMARY KEY,
SupplierNumber INTEGER NOT NULL,
Text VARCHAR(4096),
CONSTRAINT invoice_pk PRIMARY KEY(InvoiceNumber),
CONSTRAINT inumber_value CHECK (InvoiceNumber > 0),
CONSTRAINT supplier_fk FOREIGN KEY(SupplierNumber)
REFERENCES Supplier(SupplierNumber)
ON UPDATE CASCADE ON DELETE RESTRICT )
6.2. 예시 2: 부서와 사원
어떤 기업에는 여러 부서가 있으며, 각 부서의 사원은 어느 하나의 부서에 속해 있다. 이 현상은 관계형 데이터베이스에서 사원 테이블의 외래 키에 의해 강제 적용된다. 이 외래 키는 부서 테이블을 참조한다.
부서 테이블의 각 부서는 부서명을 가지며 "부서 ID"라는 해당 부서의 고유 식별자를 갖는다. 사원 테이블은 "부서 ID"를 속성으로 가지며, "부서 ID" 속성은 외래 키로서 앞서 말한 부서 테이블의 "부서 ID"를 참조한다.
관계형 데이터베이스 관리 시스템(RDBMS) 또는 SQL 데이터베이스 관리 시스템(SQL DBMS)은 각 사원의 정보가 부서 테이블의 부서를 참조하지 않고 생성되는 것을 강제적으로 방지하며, 부서 테이블의 특정 부서를 참조하는 사원이 존재할 때 해당 부서가 삭제되는 것을 강제적으로 방지한다.