고유얼굴

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요
2. 역사
- 2.1. 초기 연구 (Sirovich와 Kirby)
- 2.2. 얼굴 인식 적용 (Turk와 Pentland)
3. 생성
4. 얼굴 인식에서의 활용
5. 한계 및 발전 방향
- 5.1. 고유얼굴의 지속적인 활용 가능성
6. 기타 응용
참조

1. 개요

고유얼굴은 얼굴 이미지의 저차원 표현을 찾는 방법으로, 주성분 분석(PCA)을 사용하여 얼굴 이미지를 재구성하는 데 사용되는 기본 특징을 형성한다. 1991년 M. 터크와 A. 펜틀랜드에 의해 얼굴 인식 방법으로 제시되었으며, 얼굴 인식 시스템의 속도와 효율성을 높이는 데 기여했다. 고유얼굴은 조명, 스케일, 이동에 민감하고 표정 변화를 포착하는 데 어려움이 있다는 한계가 있지만, 다양한 응용 분야에서 활용되며, 얼굴 인식 외에도 필기 인식, 구술 인식, 화자 인식, 수화/손 제스처 해석, 의료 영상 분석 등에도 적용된다.

더 읽어볼만한 페이지

얼굴 인식 - 얼굴 인식 시스템
얼굴 인식 시스템은 디지털 이미지나 비디오에서 사람 얼굴을 감지하고 식별하는 기술로, 다양한 알고리즘 발전을 거쳐 보안, 신원 확인 등에 활용되지만, 편향성, 개인 정보 침해, 기술적 한계와 같은 윤리적 문제도 야기한다.
얼굴 인식 - 얼굴 검출
얼굴 검출은 이미지나 비디오에서 사람의 얼굴 위치를 파악하는 기술이며, 하르 유사 특징, 국부 이진 패턴 등을 사용하여 얼굴 여부를 판단하고, 안면 인식, 사진 촬영 등 다양한 분야에 응용된다.
컴퓨터 비전 - 합성곱 신경망
합성곱 신경망(CNN)은 이미지, 영상 등 시각 데이터 처리에 특화된 인공 신경망으로, 합성곱층, 풀링층, 완전 연결층으로 구성되어 특징 추출, 차원 축소, 최종 분류 또는 예측을 수행하며 이미지 인식, 영상 분석, 자연어 처리 등 다양한 분야에 응용된다.
컴퓨터 비전 - 광학 흐름
광학 흐름은 비디오나 이미지에서 보이는 객체, 표면, 엣지의 움직임 패턴을 나타내며, 움직임 예측, 비디오 압축, 장면 구조 추정, 로봇 내비게이션 등 다양한 분야에 활용되는 중요한 기술이다.

고유얼굴
개요
종류	고유 벡터
분야	컴퓨터 비전, 이미지 처리, 얼굴 인식
사용 목적	얼굴 인식, 데이터 압축
상세 정보
특징	얼굴 이미지의 주성분을 나타내는 고유 벡터 집합
생성 방법	얼굴 이미지 데이터셋 준비 각 이미지 벡터로 변환 평균 얼굴 계산 공분산 행렬 계산 공분산 행렬의 고유 벡터 및 고유값 계산 고유값이 큰 순서대로 고유 벡터 선택
장점	계산 효율성 데이터 압축 얼굴 인식 성능
단점	조명, 표정, 자세 변화에 민감 데이터셋에 의존적
활용 분야	얼굴 인식 시스템 얼굴 검출 얼굴 추적 감정 인식 데이터 압축
관련 기술	주성분 분석 (PCA) 선형 판별 분석 (LDA) 독립 성분 분석 (ICA) 얼굴 인식 알고리즘
기타
창시자	시로비치와 커비
발표 년도	1987년
주요 연구자	매튜 터크 알렉스 펜트랜드

2. 역사

주성분 분석을 이용한 고유얼굴 접근 방식은 1980년대 후반 시로비치(Sirovich)와 커비(Kirby)에 의해 처음 제안되었으며,^[2] 1991년 터크(Turk)와 펜틀랜드(Pentland)에 의해 얼굴 인식에 본격적으로 적용되었다.^[3] 이후 고유얼굴 방법은 정확도를 향상시키기 위한 전처리 방법을 포함하도록 확장되었고,^[4] 여러 매니폴드 접근법을 사용하여 서로 다른 대상과^[5]^[6] 눈과 같은 서로 다른 특징에 대한 고유얼굴 세트를 구축했다.^[7]

2. 1. 초기 연구 (Sirovich와 Kirby)

주성분 분석을 이용한 고유얼굴 접근 방식은 얼굴 이미지의 저차원 표현을 찾는 것에서 시작되었다. 1980년대 후반, 시로비치(Sirovich)와 커비(Kirby)는 얼굴 이미지 모음에 주성분 분석을 적용하여 일련의 기본 특징을 형성할 수 있음을 보였다.^[2] 이 기본 이미지들은 고유 그림(eigenpictures)이라고 하며, 원래 훈련 세트의 이미지를 재구성하기 위해 선형적으로 결합될 수 있다. 훈련 세트가 ''M''개의 이미지로 구성된 경우, 주성분 분석은 ''N''개의 이미지로 구성된 기본 세트를 형성할 수 있으며, 여기서 ''N < M''이다. 재구성 오류는 고유 그림의 수를 늘림으로써 줄어들지만, 필요한 수는 항상 ''M''보다 작게 선택된다. 예를 들어, ''M''개의 얼굴 이미지 훈련 세트에 대해 ''N''개의 고유얼굴을 생성해야 하는 경우, 각 얼굴 이미지는 모든 ''K''개의 "특징" 또는 고유얼굴의 "비율"로 구성될 수 있다고 말할 수 있다: 얼굴 이미지₁ = (E₁의 23%) + (E₂의 2%) + (E₃의 51%) + ... + (E_n의 1%).

2. 2. 얼굴 인식 적용 (Turk와 Pentland)

1991년 M. 터크와 A. 펜틀랜드는 시로비치와 커비의 연구를 확장하여 고유얼굴(eigenface)을 이용한 얼굴 인식 방법을 제시했다.^[3] 이들은 공분산 행렬의 고유 벡터를 효율적으로 계산하는 방법을 제시하여, 당시 컴퓨터 성능으로도 많은 수의 얼굴 이미지에 대한 고유값 분해를 수행할 수 있도록 했다. 얼굴 이미지는 일반적으로 고차원 공간을 차지하며, 기존의 주성분 분석은 그러한 데이터 세트에 대해 다루기 어려웠다. 터크와 펜틀랜드의 논문은 픽셀 수가 아닌 이미지 수로 크기가 조정된 행렬을 기반으로 고유 벡터를 추출하는 방법을 시연했다.

이후 고유얼굴 방법은 정확도를 향상시키기 위한 전처리 방법을 포함하도록 확장되었다.^[4] 또한 여러 매니폴드 접근법을 사용하여 서로 다른 대상^[5]^[6]과 눈과 같은 서로 다른 특징에 대한 고유얼굴 세트를 구축했다.^[7]

3. 생성

'''고유얼굴'''(Eigenface)은 인간의 얼굴 이미지 집합에 주성분 분석(PCA)을 적용하여 생성되는 일종의 "표준화된 얼굴 재료"이다. 여러 얼굴 사진을 통계 분석하여 얻어지며, 모든 사람의 얼굴은 이러한 표준 얼굴들의 조합으로 표현될 수 있다. 예를 들어, 어떤 사람의 얼굴은 평균 얼굴에 고유얼굴 1의 10%, 고유얼굴 2의 55%, 고유얼굴 3의 -3%를 더하여 구성할 수 있다. 대부분의 얼굴은 소수의 고유얼굴 조합만으로도 비교적 정확하게 표현 가능하다.^[1] 또한, 얼굴 이미지를 디지털 사진 대신 각 고유얼굴에 대한 값 목록으로 저장하므로 저장 공간을 절약할 수 있다.

고유얼굴 생성 및 인식 기술은 얼굴 인식뿐만 아니라 필기 인식, 구술 인식, 화자 인식, 수화/제스처 해석, 의료 영상 분석 등 다양한 분야에 응용된다. 이러한 이유로 '고유 이미지'라는 용어가 사용되기도 한다.^[1]

3. 1. 주성분 분석(PCA)

주성분 분석(PCA)은 고차원 데이터에서 분산이 가장 큰 방향(주성분)을 찾아내어 데이터를 저차원으로 투영하는 통계적 기법이다. 얼굴 이미지 데이터에 PCA를 적용하면, 얼굴의 변동성을 가장 잘 설명하는 특징 벡터들을 얻을 수 있으며, 이 벡터들이 고유얼굴이 된다.

이미지의 공분산 행렬에 직접 PCA를 수행하는 것은 계산상 어려움이 따를 수 있다. 예를 들어, 100 × 100 픽셀의 작은 이미지를 사용하더라도 각 이미지는 10,000차원 공간의 한 점이 되고, 공분산 행렬 '''S'''는 10,000 × 10,000 = 10⁸개의 원소를 가진 행렬이 된다. 그러나 공분산 행렬의 랭크는 훈련 예제의 수에 의해 제한된다. 만약 ''N''개의 훈련 예제가 있다면, 0이 아닌 고유값을 갖는 고유 벡터는 최대 ''N'' − 1개가 된다. 훈련 예제의 수가 이미지의 차원보다 작다면, 주성분을 다음과 같이 더 쉽게 계산할 수 있다.

'''T'''를 각 열이 평균을 뺀 이미지를 포함하는 전처리된 훈련 예제의 행렬이라고 할 때, 공분산 행렬은 '''S''' = '''TT'''^T로 계산할 수 있으며, '''S'''의 고유 벡터 분해는 다음과 같다.

:

\mathbf{Sv}_i = \mathbf{T}\mathbf{T}^T\mathbf{v}_i = \lambda_i \mathbf{v}_i

하지만 '''TT'''^T는 큰 행렬이므로, 대신 다음 식의 고유값 분해를 사용한다.

:

\mathbf{T}^T\mathbf{T}\mathbf{u}_i = \lambda_i \mathbf{u}_i

이 방정식의 양변에 '''T'''를 곱하면 다음을 얻을 수 있다.

:

\mathbf{T}\mathbf{T}^T\mathbf{T}\mathbf{u}_i = \lambda_i \mathbf{T}\mathbf{u}_i

이는 만약 '''u'''_i가 '''T'''^T'''T'''의 고유 벡터라면, '''v'''_i = '''Tu'''_i는 '''S'''의 고유 벡터라는 의미이다. 100 × 100 픽셀의 300개의 이미지로 이루어진 훈련 세트가 있다면, 행렬 '''T'''^T'''T'''는 300 × 300 행렬이며, 이는 10,000 × 10,000 공분산 행렬보다 훨씬 더 다루기 쉽다. 하지만 결과 벡터 '''v'''_i는 정규화되지 않았음에 유의해야 하며, 정규화가 필요하다면 추가 단계로 적용해야 한다.

고유얼굴 집합을 생성하는 과정은 다음과 같다.

1. 훈련 예제 집합을 준비한다. 훈련 예제 집합 '''T'''를 구성하는 얼굴 이미지군은 이미 준비되어 있는 것으로 한다.

2. 평균을 감산한다. 평균 행렬 '''A'''를 계산하여 '''T'''에 있는 오리지널에서 감산한다. 결과를 변수 '''S'''에 격납한다.

3. 공분산 행렬을 계산한다.

4. 공분산 행렬로부터 고유 벡터와 고유값을 계산한다.

5. 주성분을 선택한다.

5번째 단계 이전에 다수의 고유얼굴이 생성되지만, 실제로 필요로 하는 것은 극히 일부이다. 그들 중에서 가장 고유값이 높은 것을 선택한다. 예를 들어, 100×100의 이미지를 사용하는 경우, 1만 개의 고유 벡터가 생성된다. 대부분의 개인은 100에서 150개의 데이터베이스로 특정할 수 있으므로, 1만 개 중에서 대부분은 버려지고, 가장 중요한 것만 남겨진다.

3. 2. 고유얼굴 생성 과정

고유얼굴 집합을 생성하는 과정은 다음과 같다.

1. 훈련 집합 준비: 동일한 조명 조건에서 촬영하고 눈과 입이 정렬된 얼굴 이미지들을 준비한다. 모든 이미지는 공통된 픽셀 해상도(''r'' × ''c'')로 리샘플링한다. 각 이미지는 원본 이미지의 픽셀 행을 연결하여 하나의 벡터로 처리하고, ''r'' × ''c''개 요소를 가진 단일 열을 생성한다. 훈련 집합의 모든 이미지는 단일 행렬 '''T'''에 저장되며, 여기서 행렬의 각 열은 이미지이다.

2. 평균 계산 및 감산: 평균 이미지 '''a'''를 계산하고 '''T'''의 각 원본 이미지에서 뺀다.

3. 공분산 행렬 계산 및 고유 벡터, 고유값 추출: 공분산 행렬 '''S'''의 고유 벡터와 고유값을 계산한다. 각 고유 벡터는 원본 이미지와 동일한 차원을 가지므로 이미지 자체로 볼 수 있다. 이 공분산 행렬의 고유 벡터를 고유얼굴이라고 한다. 이는 이미지가 평균 이미지와 다른 방향을 나타낸다. 이 단계는 계산 비용이 많이 들 수 있지만, '''S'''를 명시적으로 계산하지 않고 고유 벡터를 효율적으로 계산할 수 있다.

4. 주성분 선택: 고유값을 내림차순으로 정렬하고 그에 따라 고유 벡터를 정렬한다. 주성분 수 ''k''는 총 분산에 대한 임계값 ε를 설정하여 임의로 결정된다. 총 분산은

v = (\lambda_{1}+\lambda_{2}+...+\lambda_{n})

이며, ''n'' = 구성 요소 수,

\lambda

는 구성 요소 고유값을 나타낸다.

5. k 값 결정:

\frac{(\lambda_{1}+\lambda_{2}+...+\lambda_{k})}{v} > \epsilon

를 만족하는 가장 작은 ''k'' 값을 찾는다.

이렇게 생성된 고유얼굴들을 사용하여 기존 얼굴과 새로운 얼굴을 나타낼 수 있다. 새로운 이미지를 고유얼굴에 투영하면 새 얼굴이 평균 얼굴과 어떻게 다른지 기록할 수 있다. 각 고유얼굴과 관련된 고유값은 훈련 집합의 이미지가 해당 방향에서 평균 이미지와 얼마나 다른지를 나타낸다. 이미지의 고유 벡터 하위 집합에 이미지를 투영하면 정보가 손실되지만, 가장 큰 고유값을 가진 고유얼굴을 유지하여 손실을 최소화한다. 예를 들어 100 × 100 이미지를 사용하면 10,000개의 고유 벡터가 생성되지만, 실제로는 대부분의 얼굴을 100~150개의 고유얼굴 투영을 통해 식별할 수 있다.

고유얼굴에는 다양한 명암 패턴이 나타나는데, 이는 얼굴의 다양한 특징을 선택하고 평가하는 방식을 보여준다. 대칭성 평가, 머리카락 선 평가, 코나 입 크기 평가 등의 패턴이 있으며, 특정하기 어려운 패턴을 가진 고유얼굴도 존재한다.^[1]

고유얼굴은 다수 얼굴 이미지의 통계 분석을 통해 얻어지는 "표준화된 얼굴 요소" 집합으로, 사람의 얼굴은 이러한 표준 얼굴들의 조합으로 간주할 수 있다. 개별 얼굴은 일련의 수치로 표현되므로, 디지털 사진을 보관할 필요 없이 저장 공간을 절약할 수 있다.^[1]

3. 3. 고유얼굴의 의미

고유얼굴은 많은 얼굴 사진의 통계 분석에서 파생된 "표준화된 얼굴 재료"로 간주될 수 있다. 모든 인간의 얼굴은 이러한 표준 얼굴의 조합으로 간주될 수 있다. 예를 들어, 어떤 사람의 얼굴은 평균 얼굴과 고유얼굴 1의 10%, 고유얼굴 2의 55%, 고유얼굴 3의 -3%로 구성될 수 있다. 놀랍게도, 대부분의 얼굴을 상당히 근사하기 위해 많은 고유얼굴을 결합할 필요는 없다. 또한, 사람의 얼굴은 디지털 사진으로 기록되는 것이 아니라 데이터베이스에 사용된 각 고유얼굴에 대한 값 목록(값 하나)으로 기록되므로 각 사람의 얼굴에 대해 훨씬 적은 공간이 사용된다.

생성된 고유얼굴은 특정 패턴으로 배열된 밝고 어두운 영역으로 나타난다. 이 패턴은 얼굴의 서로 다른 특징이 평가되고 점수를 매기기 위해 어떻게 선택되는지를 보여준다. 대칭 여부, 어떤 스타일의 수염이 있는지, 헤어라인이 어디에 있는지, 코나 입의 크기에 대한 평가를 수행하는 패턴이 있을 것이다. 다른 고유얼굴은 식별하기 덜 간단한 패턴을 가지며, 고유얼굴의 이미지는 얼굴과 거의 닮지 않을 수 있다.

고유얼굴은 다수의 얼굴 이미지의 통계 분석으로부터 얻어지는 "표준화된 얼굴의 요소"의 집합이다. 사람의 얼굴은 그러한 표준 얼굴의 조합으로 간주할 수 있다. 예를 들어, 어떤 사람의 얼굴은 고유얼굴 1로부터 10%, 고유얼굴 2로부터 55%, 고유얼굴 3으로부터 -3%를 합성한 것이 될지도 모른다. 어떤 개인의 얼굴과 고유얼굴과의 관계를 나타내는 값은 100%에서 -100%까지 있으며, 값이 높을수록 그 고유얼굴과 닮았다는 것을 의미한다. 놀랍게도, 평균적인 얼굴을 얻는 데에 그렇게 많은 수의 고유얼굴은 필요하지 않다. 또한, 개개의 얼굴은 일련의 수치로 나타내어지므로, 개개의 얼굴의 디지털 사진을 데이터베이스에 보관할 필요가 없고, 필요한 저장 공간은 극적으로 줄어든다.

4. 얼굴 인식에서의 활용

고유얼굴은 얼굴 인식을 위해 만들어졌으며, 시스템의 속도와 효율성 면에서 다른 기술에 비해 장점이 있다. 고유얼굴은 주로 차원 축소 방법이므로, 시스템은 비교적 적은 데이터 세트로 많은 피사체를 표현할 수 있다. 이미지 크기가 크게 줄어들어도 비교적 변화가 적지만, 보이는 이미지와 프로브 이미지 간의 차이가 클 때는 상당한 실패가 발생한다.

얼굴 인식을 위해 갤러리 이미지(시스템에 보이는 이미지)는 각 고유얼굴이 해당 이미지에 기여하는 정도를 설명하는 가중치 모음으로 저장된다. 새로운 얼굴이 분류를 위해 시스템에 제시되면, 이미지를 고유얼굴 모음에 투영하여 자체 가중치를 찾는다. 이 가중치는 갤러리 세트의 모든 가중치와 비교되어 가장 가까운 일치를 찾는다. 가장 가까운 이웃 방법은 두 벡터 사이의 유클리드 거리를 찾는 간단한 접근 방식이며, 여기서 최솟값을 가장 가까운 피사체로 분류한다.^[8]

각 갤러리 이미지의 가중치는 해당 피사체가 아닌 해당 이미지를 설명하는 정보만 전달한다. 정면 조명 아래의 한 피사체의 이미지는 강한 왼쪽 조명 아래의 동일한 피사체의 이미지와 매우 다른 가중치를 가질 수 있다. 이는 이러한 시스템의 적용을 제한한다.

고유얼굴을 보완하는 다른 기법으로 고유 특징이라고 불리는 것도 개발되었다. 경쟁 기법으로는 피셔 얼굴이 있다. 피셔 얼굴은 고유얼굴에 비해 조명이나 각도의 차이에 영향을 덜 받는다는 특징이 있다.

4. 1. 인식 과정

고유얼굴을 사용한 인식 과정은 쿼리 이미지를 계산된 고유얼굴로 구성된 얼굴 공간에 투영하고, 해당 얼굴 공간에서 얼굴 클래스에 가장 가까운 일치를 찾는 것이다. 이 과정은 다음과 같이 요약할 수 있다.
의사 코드^[8]

입력 이미지 벡터 $U\in\Re^n$ 와 데이터베이스의 평균 이미지 벡터 $M$ 이 주어지면, k번째 고유얼굴의 가중치를 다음과 같이 계산한다.

:

w_k = V_k^T(U-M)

그런 다음 가중치 벡터 $W = [w_1, w_2,..., w_k,..., w_n]$ 를 형성한다.
W를 데이터베이스에 있는 이미지의 가중치 벡터 $W_m$ 과 비교한다. 이때 유클리드 거리를 계산한다.

:

d = \| W-W_m \|^2

만약 $d < \epsilon_1$ 이면, 데이터베이스의 m번째 항목은 인식 후보가 된다.
만약 $\epsilon_1 < d < \epsilon_2$ 이면, U는 알 수 없는 얼굴일 가능성이 있으며, 데이터베이스에 추가할 수 있다.
만약 $d > \epsilon_2$ 이면, U는 얼굴 이미지가 아니다.

인식 과정 설명1. 갤러리 이미지 저장: 시스템에 보이는 갤러리 이미지들은 각 고유얼굴이 해당 이미지에 얼마나 기여하는지를 나타내는 가중치 모음으로 저장된다.

2. 새로운 얼굴 투영: 분류를 위해 새로운 얼굴이 시스템에 제시되면, 이 이미지를 고유얼굴 모음에 투영하여 자체 가중치를 찾는다. 이를 통해 프로브 얼굴(새로운 얼굴)을 설명하는 일련의 가중치가 생성된다.

3. 가중치 비교 및 분류: 이 가중치는 갤러리 세트의 모든 가중치와 비교되어 가장 가까운 일치를 찾는다. 가장 가까운 이웃 방법은 두 벡터 사이의 유클리드 거리를 찾는 간단한 접근 방식이며, 여기서 최솟값을 갖는 것이 가장 가까운 피사체로 분류된다.
고유얼굴 방법의 한계각 갤러리 이미지의 가중치는 해당 피사체가 아닌 해당 이미지를 설명하는 정보만을 전달한다. 예를 들어, 정면 조명 아래의 한 피사체의 이미지는 강한 왼쪽 조명 아래의 동일한 피사체의 이미지와 매우 다른 가중치를 가질 수 있다. 이러한 점은 시스템 적용에 제약을 가한다.
실험 결과원래 고유얼굴 논문의 실험 결과에 따르면, 조명 변화 시 평균 96%, 방향 변화 시 85%, 크기 변화 시 64%의 정확도를 보였다.
고유얼굴 방법의 확장

고유 특징: 얼굴 측정값(얼굴 특징 간의 거리 측정)과 고유얼굴 표현을 결합한다.
피셔 얼굴: 선형 판별 분석을 사용하며,^[9] 얼굴의 조명 및 포즈 변화에 덜 민감하다. 레이블이 지정된 데이터를 사용하여 차원 축소 단계에서 클래스별 정보를 더 많이 유지한다.
능동적인 외형 모델: 능동적인 모양 모델을 사용하여 얼굴의 윤곽을 설명한다. 주성분 분석을 통해 다양한 얼굴 변화를 캡슐화하는 모델의 기본 세트를 형성한다.

현대의 많은 접근 방식은 여전히 차원 축소 수단 또는 다양한 변화 모드에 대한 기본 이미지를 형성하기 위해 주성분 분석을 사용한다.

4. 2. 고유얼굴 기반 얼굴 인식의 장단점

고유얼굴을 사용한 얼굴 인식 시스템은 성능과 효율성이 우수하다. 고유얼굴은 주로 차원 축소 방법이므로 시스템은 비교적 적은 데이터 세트로 많은 피사체를 표현할 수 있기 때문이다. 또한 매우 빠르기 때문에 짧은 시간에 다수의 얼굴 이미지를 처리할 수 있다.^[8] 그러나 조명이나 각도의 차이에 약하다는 단점이 있다. 시스템이 제대로 작동하려면 비슷한 조명에서 정면으로 촬영해야 한다.^[8]
장점:

훈련 과정이 완전히 자동화되어 코딩하기 쉽다.
고유얼굴은 얼굴 이미지 표현의 통계적 복잡성을 적절하게 줄여준다.
데이터베이스의 고유얼굴이 계산되면 실시간으로 얼굴 인식을 수행할 수 있다.
고유얼굴은 대규모 데이터베이스를 처리할 수 있다.

단점:

조명, 스케일 및 이동에 매우 민감하며, 고도로 제어된 환경이 필요하다.
고유얼굴은 표정 변화를 포착하는 데 어려움이 있다.
가장 중요한 고유얼굴은 주로 조명 인코딩에 관한 것이며, 실제 얼굴에 대한 유용한 정보를 제공하지 않는다.

실제로 조명 방해에 대처하기 위해 고유얼굴 방법은 일반적으로 데이터 세트에서 처음 세 개의 고유얼굴을 버린다. 조명이 일반적으로 얼굴 이미지의 가장 큰 변화의 원인이 되기 때문에 처음 세 개의 고유얼굴은 주로 3차원 조명 변화에 대한 정보를 포착하며, 이는 얼굴 인식에 거의 기여하지 않는다. 이러한 세 개의 고유얼굴을 버림으로써 얼굴 인식 정확도가 상당량 향상되지만, 피셔 얼굴 및 선형 공간과 같은 다른 방법이 여전히 유리하다.^[8]

원래 고유얼굴 논문의 실험 결과는 다음과 같다.^[8]

조건	정답률
조명 변화 시	96%
방향 변화 시	85%
크기 변화 시	64%

4. 3. 성능 향상 기법

고유얼굴은 얼굴 인식을 위해 개발되었으며, 시스템의 속도와 효율성 면에서 다른 기술에 비해 장점이 있다. 고유얼굴은 차원 축소 방법이기 때문에 시스템은 비교적 적은 데이터 세트로 많은 피사체를 표현할 수 있다. 그러나 보이는 이미지와 프로브 이미지 간의 차이가 클 때는 상당한 실패가 시작된다.

얼굴 인식을 위해 갤러리 이미지(시스템에서 보이는 이미지)는 각 고유얼굴이 해당 이미지에 기여하는 정도를 설명하는 가중치 모음으로 저장된다. 새로운 얼굴이 분류를 위해 시스템에 제시되면, 이미지를 고유얼굴 모음에 투영하여 자체 가중치를 찾는다. 이렇게 하면 프로브 얼굴을 설명하는 일련의 가중치가 제공된다. 그런 다음 이 가중치를 갤러리 세트의 모든 가중치에 대해 분류하여 가장 가까운 일치를 찾는다. 가장 가까운 이웃 방법은 두 벡터 사이의 유클리드 거리를 찾는 간단한 접근 방식이며, 여기서 최솟값을 가장 가까운 피사체로 분류할 수 있다.^[8]

직관적으로, 고유얼굴 방법을 사용한 인식 프로세스는 쿼리 이미지를 계산된 고유얼굴로 구성된 얼굴 공간에 투영하고 해당 얼굴 공간에서 얼굴 클래스에 가장 가까운 일치를 찾는 것이다.

각 갤러리 이미지의 가중치는 해당 피사체가 아닌 해당 이미지를 설명하는 정보만 전달한다. 정면 조명 아래의 한 피사체의 이미지는 강한 왼쪽 조명 아래의 동일한 피사체의 이미지와 매우 다른 가중치를 가질 수 있다. 이는 이러한 시스템의 적용을 제한한다. 원래 고유얼굴 논문의 실험 결과는 다음과 같다. 조명 변화 시 평균 96%, 방향 변화 시 85%, 크기 변화 시 64%.^[8]

고유얼굴 방법에 대한 다양한 확장이 이루어졌다. 고유 특징 방법은 얼굴 측정값(얼굴 특징 간의 거리 측정)과 고유얼굴 표현을 결합한다. 피셔 얼굴은 선형 판별 분석을 사용하며^[9] 얼굴의 조명 및 포즈 변화에 덜 민감하다. 피셔 얼굴은 차원 축소 단계에서 클래스별 정보를 더 많이 유지하기 위해 레이블이 지정된 데이터를 사용한다.

고유얼굴 및 피셔 얼굴에 대한 또 다른 대안은 능동적인 외형 모델이다. 이 접근 방식은 능동적인 모양 모델을 사용하여 얼굴의 윤곽을 설명한다. 많은 얼굴 윤곽을 수집하면 주성분 분석을 사용하여 다양한 얼굴의 변화를 캡슐화하는 모델의 기본 세트를 형성할 수 있다.

많은 현대적 접근 방식은 여전히 차원 축소 수단 또는 다양한 변화 모드에 대한 기본 이미지를 형성하기 위해 주성분 분석을 사용한다.

고유 얼굴을 사용한 얼굴 인식 시스템은 성능과 효율 면에서 우수하다. 매우 빠르기 때문에 짧은 시간에 다수의 얼굴 이미지를 처리할 수 있다. 단점으로는 조명이나 각도의 차이에 약하다는 점이 있다. 시스템이 제대로 작동하려면 비슷한 조명에서 정면으로 촬영해야 한다. 고유 얼굴을 사용한 얼굴 인식 시스템은 정밀도가 높다는 것이 나타났다. 어떤 평가 결과에 따르면, 조명을 변화시킨 경우 96%, 각도를 변화시킨 경우 85%, 크기를 변화시킨 경우 64%의 정답률이었다.^[8]

고유 얼굴을 보완하는 다른 기법으로 eigenfeatures라고 불리는 것도 개발되었다. 경쟁 기법으로는 fisherface가 있다. fisherface는 고유 얼굴에 비해 조명이나 각도의 차이에 영향을 덜 받는다는 특징이 있다.

5. 한계 및 발전 방향

고유얼굴 방법은 조명, 스케일, 이동에 매우 민감하며, 고도로 제어된 환경이 필요하다는 단점이 있다.^[1] 또한, 표정 변화를 포착하는 데 어려움이 있으며, 주로 조명 인코딩에 관한 것이라 실제 얼굴에 대한 유용한 정보를 제공하지 않는다.^[1]

실제로 조명 방해에 대처하기 위해 데이터 세트에서 처음 세 개의 고유얼굴을 버리는 경우가 많다. 이는 처음 세 개의 고유얼굴이 주로 3차원 조명 변화에 대한 정보를 포착하여 얼굴 인식에 거의 기여하지 않기 때문이다.^[1] 이러한 세 개의 고유얼굴을 버림으로써 얼굴 인식 정확도가 향상되지만, 피셔얼굴 및 선형 공간과 같은 다른 방법이 여전히 유리하다.^[1]

수화 인식을 위해 이 기술을 응용하는 연구도 이루어지고 있다.^[1]

5. 1. 고유얼굴의 지속적인 활용 가능성

고유얼굴을 사용한 얼굴 인식 시스템은 성능과 효율 면에서 우수하며, 매우 빠르게 다수의 얼굴 이미지를 처리할 수 있다.^[1] 그러나 조명이나 각도의 차이에 약하다는 단점이 있다.^[1] 시스템이 제대로 작동하려면 비슷한 조명에서 정면으로 촬영해야 한다.^[1]

어떤 평가 결과에 따르면, 고유얼굴을 사용한 얼굴 인식 시스템은 조명을 변화시킨 경우 96%, 각도를 변화시킨 경우 85%, 크기를 변화시킨 경우 64%의 정답률을 보였다.^[1]

고유얼굴을 보완하는 다른 기법으로 eigenfeatures라고 불리는 것도 개발되었다.^[1] 경쟁 기법으로는 fisherface가 있는데, 이는 고유얼굴에 비해 조명이나 각도의 차이에 영향을 덜 받는다는 특징이 있다.^[1]

6. 기타 응용

고유얼굴을 만들고 인식에 사용하는 기술은 얼굴 인식 외에도 필기 인식, 구화 인식, 화자 인식, 수화/손 제스처 해석 및 의료 영상 분석에도 사용된다. 따라서 일부는 고유얼굴이라는 용어를 사용하지 않고 '고유 이미지'를 사용하는 것을 선호한다.

참조

_[1] 논문 Analysis and Comparison of Eigenspace-Based Face Recognition Approaches http://www.cec.uchil[...] 2002-11
_[2] 논문 Low-dimensional procedure for the characterization of human faces
_[3] 학회자료 Face recognition using eigenfaces http://www.cs.ucsb.e[...] 1991
_[4] 서적 Empirical Evaluation Methods in Computer Vision WORLD SCIENTIFIC
_[5] 학회자료 What is the set of images of an object under all possible lighting conditions?
_[6] 서적 Intelligent Data Engineering and Automated Learning - IDEAL 2011
_[7] 학회자료 Beyond eigenfaces: probabilistic matching for face recognition 1998
_[8] 논문 Eigenfaces for recognition http://www.cs.ucsb.e[...]
_[9] 논문 Eigenfaces vs. Fisherfaces: recognition using class specific linear projection http://apps.dtic.mil[...] 1997-07

본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com