맨위로가기

디지털 화상 처리

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

디지털 화상 처리는 디지털 이미지를 개선하고 분석하기 위한 기술로, 1960년대에 개발되어 위성 영상, 의료 영상, 광학 문자 인식 등에 응용되었다. 초기에는 고가의 처리 비용으로 인해 제한적이었으나, 1970년대 저렴한 컴퓨터와 전용 하드웨어의 등장으로 널리 사용되기 시작했다. 현재는 디지털 카메라, 의료 영상, 자율 주행, 영화 제작 등 다양한 분야에서 활용되며, 통계적 분류, 특징 추출, 패턴 인식, 인공 신경망 등 다양한 기술을 포함한다. 디지털 화상 처리는 열악한 조명, 이미지 왜곡, 객체 감지 문제, 계산 자원 부족 등의 과제를 안고 있다.

2. 역사

디지털 화상 처리 기술은 1960년대 제트 추진 연구소, MIT, 벨 연구소, 메릴랜드 대학교 등에서 개발되기 시작했다.[6][49] 이 기술은 위성 영상, 유선 사진 표준 변환, 의료 영상, 영상 전화, 광학 문자 인식, 사진 개선 등 다양한 분야에 응용되었다.[6]

초기에는 컴퓨터 성능의 한계로 인해 처리 비용이 매우 높았으나, 1970년대부터 컴퓨터 기술이 발전하고 가격이 저렴해지면서 디지털 화상 처리가 널리 확산되었다. 1994년에는 의료용 디지털 영상 처리 기술이 스페이스 재단의 스페이스 기술 명예의 전당에 오르기도 했다.

2. 1. 초기 개발

디지털 영상 처리 기술의 대부분은 1960년대 제트 추진 연구소, MIT, 벨 연구소, 메릴랜드 대학교 등에서 개발되었으며, 위성 영상, 유선사진 표준 변환, 의료 영상, 영상 전화, 광학 문자 인식, 사진 개선 등에 응용되었다.[6] 초기 이미지 처리의 목적은 이미지 품질 향상이었으며, 사람들의 시각적 효과를 개선하기 위한 것이었다. 이미지 처리에서 입력은 낮은 품질의 이미지이고, 출력은 품질이 향상된 이미지이다. 일반적인 이미지 처리에는 이미지 향상, 복원, 인코딩 및 압축이 포함된다. 최초의 성공적인 응용 분야는 미국의 제트 추진 연구소(JPL)였다. JPL은 1964년 우주 탐사선 레인저 7호가 보낸 수천 장의 달 사진에 기하 보정, 계조 변환, 노이즈 제거 등과 같은 이미지 처리 기술을 사용하여 태양의 위치와 달의 환경을 고려, 컴퓨터로 달 표면 지도를 성공적으로 매핑하였다. 이후, 우주선이 보낸 거의 10만 장의 사진에 대해 더 복잡한 이미지 처리가 수행되어 달의 지형도, 컬러 맵 및 파노라마 모자이크를 얻었으며, 이는 뛰어난 결과를 달성했고 달 착륙을 위한 탄탄한 기반을 마련했다.[7] 그러나 당시 컴퓨터 장비를 이용한 처리 비용은 상당히 높았다.

1970년대 값싼 컴퓨터와 전용 하드웨어가 이용 가능해지면서 디지털 영상 처리는 급격히 증가하였다. 그 후 텔레비전 표준 전환과 같은 몇몇 전용 문제를 위해 영상은 실시간으로 처리 가능하게 되었다. 범용 컴퓨터가 빨라지면서, 가장 특화되고 컴퓨터 집약적인 작업을 위한 전용 하드웨어의 역할을 떠맡기 시작했다.

2000년대 빠른 컴퓨터와 신호 처리가 가능해지면서, 디지털 영상 처리는 영상 처리의 가장 일반적인 형태가 되었고, 방법이 다양할 뿐만 아니라 가격도 저렴하기 때문에 일반적으로 사용되고 있다.

2. 2. 대중화

1960년대에 제트 추진 연구소, 매사추세츠 공과대학교(MIT), 벨 연구소, 메릴랜드 대학교 등에서 디지털 화상 처리 기술의 대부분이 개발되었다. 이러한 기술은 위성 사진 분석, 유선 전송 사진 기술, 의료 영상 처리, 화상 전화, 광학 문자 인식, 사진 이미지 개선 등에 사용되었다.[6] 그러나 당시 컴퓨터 장비를 이용한 처리 비용은 상당히 높았다.

1970년대에는 컴퓨터 가격이 하락하고, 전용 장비가 실용화되면서 디지털 화상 처리가 점차 일반화되기 시작했다. 또한 범용 컴퓨터의 저가격화와 고성능화에 따라 디지털 화상 처리는 전용 장비에서 범용 컴퓨터로 수행되게 되었다.

2000년대에 들어서면서 하드웨어가 더욱 발전하여 대부분의 이미지 처리가 디지털 화상 처리가 되었다. 현재 디지털 화상 처리는 가장 다양한 기법일 뿐만 아니라 가장 저렴한 기법이기도 하다.

2. 3. 발전

디지털 영상 처리 기술은 1960년대 제트 추진 연구소, MIT, 벨 연구소, 메릴랜드 대학교 등에서 개발되었다.[6][49] 이 기술은 위성 영상, 유선 사진 표준 변환, 의료 영상, 영상 전화, 광학 문자 인식, 사진 개선 등에 응용되었다.[6][49] 초기 이미지 처리의 목적은 이미지 품질을 향상시켜 사람들의 시각적 효과를 개선하는 것이었다.

그러나 당시 컴퓨터 장비로는 처리 비용이 매우 비쌌다. 1970년대에 저렴한 컴퓨터와 전용 하드웨어가 보급되면서 디지털 영상 처리가 확산되었다. 범용 컴퓨터가 빨라지면서 전용 하드웨어의 역할을 대신하기 시작했다.

2000년대에 들어 빠른 컴퓨터와 신호 처리 기술이 발전하면서 디지털 영상 처리는 가장 일반적인 영상 처리 형태가 되었고, 다양한 방법과 저렴한 비용으로 널리 사용되고 있다. 1994년, 의료용 디지털 영상 처리 기술은 스페이스 재단의 스페이스 기술 명예의 전당에 헌액되었다.

3. 핵심 기술

디지털 화상 처리는 다양한 알고리즘을 사용하여 아날로그 방식으로는 구현할 수 없는 복잡한 처리를 가능하게 한다.

디지털 화상 처리의 핵심 기술은 다음과 같다:



디지털 화상 처리에 사용되는 주요 기법은 다음과 같다:

3. 1. 기본 작업

디지털 화상 처리는 훨씬 더 복잡한 알고리즘의 사용을 허용하며, 따라서 간단한 작업에서 더 정교한 성능을 제공하고 아날로그 방식으로는 불가능한 방법의 구현을 가능하게 한다.[45]

특히, 디지털 화상 처리는 다음과 같은 분야의 구체적인 응용이며, 실용적인 기술이다.

디지털 화상 처리에 사용되는 몇 가지 기술은 다음과 같다.

디지털 필터는 디지털 이미지를 흐리게 하거나 선명하게 하는 데 사용된다. 필터링은 다음을 통해 수행할 수 있다.[45]

  • 공간 영역에서 특별히 설계된 커널(필터 배열)과의 컨볼루션
  • 주파수(푸리에) 영역에서 특정 주파수 영역 마스킹


다음 예제는 두 가지 방법을 모두 보여준다.[46]

필터 유형커널 또는 마스크예시
원본 이미지]]
공간 로우패스]]
공간 하이패스]]
푸리에 표현의사 코드:--|]]
푸리에 로우패스--|]]--|]]
푸리에 하이패스--|]]--|]]



아핀 변환은 다음 예와 같이 크기 조정, 회전, 이동, 미러링 및 전단을 포함한 기본 이미지 변환을 가능하게 한다.[46]

변환 이름아핀 행렬예시
항등]]
반사]]
크기 조정]]
회전]]
전단]]



아핀 행렬을 이미지에 적용하려면 이미지를 각 항목이 해당 위치의 픽셀 강도에 해당하는 행렬로 변환한다. 그런 다음 각 픽셀의 위치는 이미지에서 해당 픽셀의 좌표를 나타내는 벡터 [x, y]로 표현할 수 있으며, 여기서 x와 y는 이미지 행렬의 픽셀 행과 열이다. 이를 통해 좌표를 아핀 변환 행렬과 곱할 수 있으며, 이 행렬은 픽셀 값이 출력 이미지로 복사될 위치를 제공한다.

그러나 이동 변환이 필요한 변환을 허용하려면 3차원 동차 좌표가 필요하다. 세 번째 차원은 일반적으로 0이 아닌 상수(일반적으로 1)로 설정되어 새 좌표가 [x, y, 1]이 되도록 한다. 이를 통해 좌표 벡터를 3 x 3 행렬로 곱할 수 있으며, 이동 시프트를 활성화할 수 있다. 따라서 상수 1인 세 번째 차원은 이동을 허용한다.

행렬 곱셈은 결합 법칙이 성립하므로, 여러 아핀 변환을 개별 변환의 각 행렬을 변환이 수행되는 순서대로 곱하여 단일 아핀 변환으로 결합할 수 있다. 이렇게 하면 점 벡터에 적용할 때 벡터 [x, y, 1]에 수행된 모든 개별 변환과 동일한 결과를 제공하는 단일 행렬이 생성된다. 따라서 아핀 변환 행렬 시퀀스를 단일 아핀 변환 행렬로 줄일 수 있다.

예를 들어 2차원 좌표는 원점 (0, 0)에 대한 회전만 허용한다. 그러나 3차원 동차 좌표를 사용하여 먼저 모든 점을 (0, 0)으로 이동한 다음 회전을 수행하고 마지막으로 원점 (0, 0)을 원래 점으로 다시 이동할 수 있다(첫 번째 이동의 반대). 이러한 3개의 아핀 변환은 단일 행렬로 결합할 수 있으므로 이미지의 모든 점을 중심으로 회전할 수 있다.[47]

수학적 형태학은 이미지 노이즈 제거에 적합하다. 구조 요소는 수학적 형태학에서 중요하며, 다음은 구조 요소에 관한 예시이다.

노이즈 제거 함수, 이미지 I, 구조 요소 B는 다음과 같다.

(I') = \begin{bmatrix}

45 & 50 & 65 \\

40 & 60 & 55 \\

25 & 15 & 5

\end{bmatrix}

B = \begin{bmatrix}

1 & 2 & 1 \\

2 & 1 & 1 \\

1 & 0 & 3

\end{bmatrix}


  • 팽창(Dilation)(I, B)(i,j) = max\{I(i+m, j+n) + B(m,n)\}로 정의한다. 팽창(I,B) = D(I,B)라고 한다.


D(I', B)(1,1) = max(45+1,50+2,65+1,40+2,60+1,55+1,25+1,15+0,5+3) = 66

  • 침식(Erosion)(I, B)(i,j) = min\{I(i+m, j+n) - B(m,n)\}로 정의한다. 침식(I,B) = E(I,B)라고 한다.


E(I', B)(1,1) = min(45-1,50-2,65-1,40-2,60-1,55-1,25-1,15-0,5-3) = 2

  • 팽창 후

(I') = \begin{bmatrix}

45 & 50 & 65 \\

40 & 66 & 55 \\

25 & 15 & 5

\end{bmatrix}


  • 침식 후

(I') = \begin{bmatrix}

45 & 50 & 65 \\

40 & 2 & 55 \\

25 & 15 & 5

\end{bmatrix}



열림 연산은 단순히 먼저 침식을 수행한 다음 팽창을 수행하는 것이고, 닫힘 연산은 그 반대이다. 실제로는 D(I,B) 및 E(I,B)는 컨볼루션으로 구현될 수 있다.

구조 요소마스크코드예시
원본 이미지NoneMatlab을 사용하여 원본 이미지를 읽는다.
원본 연꽃
팽창Matlab을 사용하여 팽창을 수행한다.
팽창 방법을 사용한 노이즈 제거 그림
침식Matlab을 사용하여 침식을 수행한다.
열림Matlab을 사용하여 열림을 수행한다.
닫힘Matlab을 사용하여 닫힘을 수행한다.
닫힘 방법을 사용한 노이즈 제거 그림



영상 품질은 카메라 진동, 과다 노출, 회색 레벨 분포의 과도한 집중, 잡음 등에 의해 영향을 받을 수 있다. 예를 들어, 잡음 문제는 평활화 방법을 통해 해결할 수 있으며, 회색 레벨 분포 문제는 히스토그램 평활화를 통해 개선할 수 있다.

'''평활화 방법'''

그림에서 만족스럽지 못한 색상이 있는 경우, 만족스럽지 못한 색상 주변의 몇 가지 색상을 선택하여 평균을 구하는 방법이 있다. 이것이 평활화 방법을 생각하는 쉬운 방법이다.

평활화 방법은 마스크와 컨볼루션을 사용하여 구현할 수 있다. 아래와 같이 작은 이미지와 마스크를 예로 들어 보겠다.


  • 이미지는 다음과 같다.



\begin{bmatrix}

2 & 5 & 6 & 5\\

3 & 1 & 4 & 6 \\

1 & 28 & 30 & 2 \\

7 & 3 & 2 & 2

\end{bmatrix}


  • 마스크는 다음과 같다.

\begin{bmatrix}

1/9 & 1/9 & 1/9 \\

1/9 & 1/9 & 1/9 \\

1/9 & 1/9 & 1/9

\end{bmatrix}



컨볼루션과 평활화 후 이미지는 다음과 같다.



\begin{bmatrix}

2 & 5 & 6 & 5\\

3 & 9 & 10 & 6 \\

1 & 9 & 9 & 2 \\

7 & 3 & 2 & 2

\end{bmatrix}



image[1, 1], image[1, 2], image[2, 1], image[2, 2]를 관찰한다.

원본 이미지 픽셀은 1, 4, 28, 30이다. 평활화 마스크를 적용한 후 픽셀은 각각 9, 10, 9, 9가 된다.

new image[1, 1] = \tfrac{1}{9} * (image[0,0]+image[0,1]+image[0,2]+image[1,0]+image[1,1]+image[1,2]+image[2,0]+image[2,1]+image[2,2])

new image[1, 1] = floor(\tfrac{1}{9} * (2+5+6+3+1+4+1+28+30)) = 9

new image[1, 2] = floor({\tfrac{1}{9} * (5+6+5+1+4+6+28+30+2)) = 10

new image[2, 1] = floor(\tfrac{1}{9} * (3+1+4+1+28+30+7+3+2)) = 9

new image[2, 2] = floor(\tfrac{1}{9} * (1+4+6+28+30+2+3+2+2)) = 9

'''회색 레벨 히스토그램 방법'''

일반적으로 이미지에서 얻은 회색 레벨 히스토그램은 아래와 같다. 이미지에서 히스토그램을 균일 분포로 변경하는 것을 일반적으로 히스토그램 평활화라고 한다.

그림 1


그림 2


이산 시간에서 회색 레벨 히스토그램의 면적은 \sum_{i=0}^{k}H(p_i)(그림 1 참조)이고, 균일 분포의 면적은 \sum_{i=0}^{k}G(q_i)(그림 2 참조)이다. 면적은 변하지 않으므로, \sum_{i=0}^{k}H(p_i) = \sum_{i=0}^{k}G(q_i)이다.

균일 분포에서 q_i의 확률은 \tfrac{N^2}{q_k - q_0}이며 0 < i < k 이다.

연속 시간에서 방정식은 \displaystyle \int_{q_0}^{q} \tfrac{N^2}{q_k - q_0}ds = \displaystyle \int_{p_0}^{p}H(s)ds이다.

또한 함수의 정의에 따르면 회색 레벨 히스토그램 방법은 f(p)=q를 만족하는 함수 f를 찾는 것과 같다.

개선 방법문제점개선 전과정개선 후
평활화 방법잡음Matlab을 사용하여, 0.01 파라미터의 소금-후추 잡음을 추가하여 잡음이 있는 이미지를 생성한다.
히스토그램 평활화회색 레벨 분포의 과도한 집중
히스토그램 평활화 참조


3. 2. 세부 기술

디지털 화상 처리는 훨씬 더 복잡한 알고리즘의 사용을 가능하게 하여, 간단한 작업에서 더 정교한 성능을 제공하고 아날로그 방식으로는 불가능한 방법의 구현을 가능하게 한다.

특히, 디지털 화상 처리는 다음과 같은 분야의 구체적인 응용이며, 실용적인 기술이다.

디지털 화상 처리에 사용되는 몇 가지 기술은 다음과 같다.

4. 응용 분야

디지털 화상 처리는 의료, 영화, 보안, 자율 주행 등 다양한 분야에 응용된다.


  • 의료 영상: 1972년 고드프리 하운스필드가 발명한 X선 컴퓨터 단층 촬영(CT) 장치는 디지털 화상 처리 기술을 의료 분야에 적용한 대표적인 사례이다. CT는 인체 단면 영상을 획득하여 질병 진단에 활용되며, 하운스필드는 이 공로로 1979년 노벨 생리학·의학상을 수상했다.[7] 2010년까지 전 세계적으로 50억 건 이상의 의료 영상 연구가 수행되었으며,[40][41] 의료 영상 장비는 반도체 산업 기술을 기반으로 제조된다.[43][44]
  • 영화 및 영상 콘텐츠 제작: 1973년 영화 ''웨스트월드''는 디지털 화상 처리를 사용하여 안드로이드 시점을 묘사한 최초의 장편 영화이다.[48] 또한, 크로마키 효과 등에도 널리 사용된다.
  • 보안: 얼굴 검출과 같은 기술은 수학적 형태학, 이산 코사인 변환(DCT), 투영(수학) 등을 활용하여 구현된다.
    얼굴 감지 과정
  • 자율 주행: 디지털 화상 처리는 통계적 분류, 특징 추출, 패턴 인식 등 다양한 알고리즘을 활용하여 자율 주행 자동차의 핵심 기술로 활용된다.


디지털 화상 처리에는 주성분 분석, 독립 성분 분석, 자기 조직화 맵, 은닉 마르코프 모델, 인공 신경망, 그래프 컷과 같은 기법이 사용된다.

4. 1. 디지털 카메라

디지털 카메라는 일반적으로 원본 데이터를 이미지 센서에서 표준 이미지 파일 형식의 색깔 수정 이미지로 변환하는 전용 디지털 영상 처리 칩을 포함한다. 디지털 카메라의 이미지는 종종 품질을 개선하기 위해 추가 처리를 받는데, 이점이 디지털 카메라가 필름 카메라에 비해 갖는 명백한 이점이다. 디지털 영상 처리는 일반적으로 다양한 방법으로 영상을 조작할 수 있는 특수 소프트웨어 프로그램으로 행해진다.

또한, 많은 디지털 카메라는 사진사가 개별 사진의 표현된 명도 범위를 더 잘 이해하는데 도움이 되도록, 영상의 히스토그램을 볼 수 있게 해준다.[15]

현대 이미지 센서의 기반은 1955년에서 1960년 사이에 벨 연구소에서 발명된 금속 산화물 반도체(MOS) 기술이다.[8][9][10][11][12][13][14] 이는 전하 결합 소자(CCD)와 이후 CMOS 센서를 포함한 디지털 반도체 이미지 센서의 개발로 이어졌다.[8]

전하 결합 소자는 1969년 벨 연구소의 윌러드 S. 보일과 조지 E. 스미스에 의해 발명되었다. MOS 기술을 연구하는 동안, 그들은 전하가 자기 버블의 유사체이며 작은 MOS 커패시터에 저장될 수 있다는 것을 깨달았다. 일련의 MOS 커패시터를 줄지어 반도체 소자 제조하는 것이 비교적 간단했기 때문에, 그들은 전하가 하나에서 다음으로 이동할 수 있도록 적절한 전압을 연결했다.[8] CCD는 나중에 텔레비전 방송을 위한 최초의 디지털 비디오 카메라에 사용된 반도체 회로이다.[16]

NMOS 로직 능동 픽셀 센서(APS)는 1980년대 중반 일본의 올림푸스에 의해 발명되었다. 이는 MOS 반도체 소자 제조의 발전에 의해 가능해졌으며, MOSFET 축소가 더 작은 마이크론 및 서브마이크론 수준에 도달했다.[17][18] NMOS APS는 1985년 올림푸스의 나카무라 츠토무 팀에 의해 제작되었다.[19] CMOS 능동 픽셀 센서(CMOS 센서)는 이후 1993년 미국 항공우주국(NASA) 제트 추진 연구소의 에릭 포섬 팀에 의해 개발되었다.[20] 2007년까지 CMOS 센서의 판매량은 CCD 센서를 넘어섰다.[21]

MOS 이미지 센서는 광 마우스 기술에 널리 사용된다. 1980년 제록스의 리처드 F. 라이언이 발명한 최초의 광 마우스는 5μm NMOS 로직 집적 회로 센서 칩을 사용했다.[22][23] 1999년에 출시된 최초의 상업용 광 마우스인 인텔리마우스 이후, 대부분의 광 마우스 장치는 CMOS 센서를 사용한다.[24][25]

4. 2. 의료 영상

1972년, 영국의 회사 EMI의 엔지니어 고드프리 하운스필드는 머리 진단을 위한 X선 컴퓨터 단층 촬영(CT) 장치를 발명했는데, 이는 일반적으로 CT(컴퓨터 단층 촬영)로 불린다. CT 핵심 방법은 인간 머리의 단면을 통해 X선을 투사하는 것을 기반으로 하며, 이는 컴퓨터에 의해 처리되어 단면 이미지를 재구성하는데, 이를 영상 재구성이라고 한다. 1975년, EMI는 전신용 CT 장치를 성공적으로 개발하여 인체의 다양한 부위의 단층 영상을 선명하게 획득할 수 있게 되었다. 이 혁신적인 진단 기술로 하운스필드와 물리학자 앨런 코맥은 1979년 노벨 생리학·의학상을 수상했다.[7] 의료 분야의 디지털 영상 처리 기술은 1994년 우주 재단의 우주 기술 명예의 전당에 헌액되었다.[39]

2010년까지 전 세계적으로 50억 건 이상의 의료 영상 연구가 수행되었다.[40][41] 2006년 의료 영상으로 인한 방사선 노출은 미국 전체 이온화 방사선 노출의 약 50%를 차지했다.[42] 의료 영상 장비는 반도체 산업의 기술을 사용하여 제조되며, 여기에는 CMOS 집적 회로 칩, 전력 반도체 소자, 이미지 센서(특히 CMOS 센서) 및 바이오센서와 같은 센서, 그리고 마이크로컨트롤러, 마이크로프로세서, 디지털 신호 프로세서, 미디어 프로세서 및 시스템 온 칩 장치와 같은 프로세서가 포함된다. 2015년 기준으로, 의료 영상 칩의 연간 출하량은 4,600만 개에 달했으며, 시장 가치는 11억달러 달러를 기록했다.[43][44]

4. 3. 보안

디지털 화상 처리에서는 다양한 화상 처리 알고리즘을 활용할 수 있으며, 아날로그 화상에서는 불가능한 처리도 가능하게 된다.

특히, 다음 기술은 디지털 화상 처리 없이는 실현할 수 없다.

다음과 같은 기법이 디지털 화상 처리에서 사용된다.

4. 4. 자율 주행

디지털 화상 처리에서는 다양한 화상 처리 알고리즘을 활용할 수 있으며, 아날로그 화상에서는 불가능한 처리도 가능하게 된다. 특히, 통계적 분류, 특징 추출, 패턴 인식, 멀티 스케일 신호 해석 기술은 디지털 화상 처리 없이는 실현할 수 없다.

디지털 화상 처리에는 주성분 분석, 독립 성분 분석, 자기 조직화 맵, 은닉 마르코프 모델, 인공 신경망, 그래프 컷과 같은 기법이 사용된다.

4. 5. 영화 및 영상 콘텐츠 제작

''웨스트월드''(1973)는 디지털 화상 처리를 사용하여 안드로이드의 시점을 시뮬레이션하기 위해 픽셀화된 사진을 사용한 최초의 장편 영화이다.[48] 화상 처리는 또한 배우의 배경을 자연 또는 예술적인 풍경으로 대체하는 크로마키 효과를 생성하는 데 광범위하게 사용된다.

디지털 화상 처리에서는 다양한 화상 처리 알고리즘을 활용할 수 있으며, 아날로그 화상에서는 불가능한 처리도 가능하게 된다.

4. 6. 기타

현대 이미지 센서의 기반은 1955년에서 1960년 사이에 벨 연구소에서 발명된 금속 산화물 반도체(MOS) 기술이다.[8][9][10][11][12][13][14] 이는 전하 결합 소자(CCD)와 이후 CMOS 센서를 포함한 디지털 반도체 이미지 센서의 개발로 이어졌다.[8]

전하 결합 소자는 1969년 벨 연구소의 윌러드 S. 보일과 조지 E. 스미스에 의해 발명되었다.[15] NMOS 로직 능동 픽셀 센서(APS)는 1980년대 중반 일본의 올림푸스에 의해 발명되었다.[17][18] CMOS 능동 픽셀 센서(CMOS 센서)는 이후 1993년 미국 항공우주국(NASA) 제트 추진 연구소의 에릭 포섬 팀에 의해 개발되었다.[20] 2007년까지 CMOS 센서의 판매량은 CCD 센서를 넘어섰다.[21]

MOS 이미지 센서는 광 마우스 기술에 널리 사용된다. 1980년 제록스의 리처드 F. 라이언이 발명한 최초의 광 마우스는 5μm NMOS 로직 집적 회로 센서 칩을 사용했다.[22][23] 1999년에 출시된 최초의 상업용 광 마우스인 인텔리마우스 이후, 대부분의 광 마우스 장치는 CMOS 센서를 사용한다.[24][25]

1972년, 영국의 회사 EMI의 엔지니어 고드프리 하운스필드는 머리 진단을 위한 X선 컴퓨터 단층 촬영(CT) 장치를 발명했으며, 이는 일반적으로 CT(컴퓨터 단층 촬영)로 불린다. 1975년, EMI는 전신용 CT 장치를 성공적으로 개발하여 인체의 다양한 부위의 단층 영상을 선명하게 획득할 수 있게 되었다. 이 혁신적인 진단 기술로 하운스필드와 물리학자 앨런 코맥은 1979년 노벨 생리학·의학상을 수상했다.[7] 의료 분야의 디지털 영상 처리 기술은 1994년 우주 재단의 우주 기술 명예의 전당에 헌액되었다.[39]

2010년까지 전 세계적으로 50억 건 이상의 의료 영상 연구가 수행되었다.[40][41] 2006년 의료 영상으로 인한 방사선 노출은 미국 전체 이온화 방사선 노출의 약 50%를 차지했다.[42] 2015년 기준으로, 의료 영상 칩의 연간 출하량은 4,600만 개에 달했으며, 시장 가치는 110억달러를 기록했다.[43][44]

얼굴 검출수학적 형태학, 일반적으로 DCT라고 하는 이산 코사인 변환, 그리고 수평 투영(수학)을 사용하여 구현할 수 있다.

'''특징 기반 방법을 사용한 일반적인 방법'''

얼굴 검출의 특징 기반 방법은 피부 톤, 가장자리 감지, 얼굴 모양 및 얼굴의 특징(눈, 입 등)을 사용하여 얼굴 검출을 수행한다.

'''과정 설명'''

# 주어진 얼굴 이미지 배치에서 먼저 얼굴 이미지를 샘플링하여 피부 톤 범위를 추출한다.

## 구조적 유사성 지수 측도(SSIM)를 적용하여 피부 톤을 추출하는 측면에서 이미지를 비교할 수 있다.

## 일반적으로 HSV 또는 RGB 색상 공간이 피부 필터에 적합하다.

# 피부 톤으로 이미지를 필터링한 후 얼굴 가장자리를 얻기 위해 형태학과 DCT를 사용하여 노이즈를 제거하고 누락된 피부 영역을 채운다.

## 열기 방법 또는 닫기 방법을 사용하여 누락된 피부를 채울 수 있다.

## DCT는 피부와 유사한 톤의 객체를 피하기 위한 것이다.

## Sobel 연산자 또는 기타 연산자를 적용하여 얼굴 가장자리를 감지할 수 있다.

# 눈과 같은 인간 특징의 위치를 ​​지정하기 위해 투영을 사용하고 투영의 히스토그램에서 피크를 찾으면 입, 머리카락 및 입술과 같은 세부 특징을 얻는 데 도움이 된다.

## 투영은 이미지의 고주파수를 보기 위해 이미지를 투영하는 것일 뿐이며, 이는 일반적으로 특징 위치이다.

디지털 화상 처리에서는 다양한 화상 처리 알고리즘을 활용할 수 있으며, 아날로그 화상에서는 불가능한 처리도 가능하게 된다.

특히, 다음 기술은 디지털 화상 처리 없이는 실현할 수 없다.

다음과 같은 기법이 디지털 화상 처리에서 사용된다.

5. 과제

영상 품질은 카메라 진동, 과다 노출, 회색 레벨 분포의 과도한 집중, 잡음 등에 의해 영향을 받을 수 있다. 예를 들어, 잡음 문제는 평활화 방법을 통해 해결할 수 있으며, 회색 레벨 분포 문제는 히스토그램 평활화를 통해 개선할 수 있다.

'''평활화 방법'''

평활화 방법은 그림에서 만족스럽지 못한 색상이 있는 경우, 해당 색상 주변의 몇 가지 색상을 선택하여 평균을 구하는 방식으로 이루어진다. 이는 마스크와 컨볼루션을 사용하여 구현할 수 있다.

'''회색 레벨 히스토그램 방법'''

일반적으로 이미지에서 얻은 회색 레벨 히스토그램은 그림 1과 같다. 이미지에서 히스토그램을 균일 분포(그림 2)로 변경하는 것을 히스토그램 평활화라고 한다.

이산 시간에서 회색 레벨 히스토그램의 면적은 \sum_{i=0}^{k}H(p_i)(그림 1 참조)이고, 균일 분포의 면적은 \sum_{i=0}^{k}G(q_i)(그림 2 참조)이다. 면적은 변하지 않으므로, \sum_{i=0}^{k}H(p_i) = \sum_{i=0}^{k}G(q_i)이다.

균일 분포에서 q_i의 확률은 \tfrac{N^2}{q_k - q_0}이며 0 < i < k 이다. 연속 시간에서 방정식은 \displaystyle \int_{q_0}^{q} \tfrac{N^2}{q_k - q_0}ds = \displaystyle \int_{p_0}^{p}H(s)ds이다.

회색 레벨 히스토그램 방법은 f(p)=q를 만족하는 함수 f를 찾는 것이다.

개선 방법문제점개선 전과정개선 후
평활화 방법잡음
히스토그램 평활화회색 레벨 분포의 과도한 집중히스토그램 평활화 참조



# '''잡음 및 왜곡''': 열악한 조명, 제한된 센서, 파일 압축으로 인한 이미지 결함은 선명하지 않은 이미지를 초래하여 정확한 이미지 변환에 영향을 미칠 수 있다.

# '''이미지 품질의 가변성''': 흐릿한 이미지와 불완전한 세부 정보를 포함하여 이미지 품질 및 해상도의 변화는 데이터베이스 전체에서 균일한 처리를 방해할 수 있다.

# '''객체 감지 및 인식''': 특히 여러 객체와 폐색이 있는 복잡한 시나리오에서 이미지 내의 객체를 식별하고 인식하는 것은 중요한 과제이다.

# '''데이터 주석 및 라벨링''': 기계 인식을 위한 다양하고 여러 이미지에 라벨을 지정하는 것은 추가 처리 정확성에 매우 중요하며, 잘못된 식별은 비현실적인 결과를 초래할 수 있다.

# '''계산 자원 집약도''': 이미지 처리를 위한 적절한 계산 자원에 접근하는 것은 어렵고 비용이 많이 들 수 있으며, 충분한 자원이 없으면 진행을 방해한다.

참조

[1] 논문 What is a Signal? [Lecture Notes]
[2] 서적 Digital image processing Pearson
[3] 논문 Modern Trends in Improving the Technical Characteristics of Devices and Systems for Digital Image Processing 2024
[4] 논문 Efficient color image steganography based on new adapted chaotic dynamical system with discrete orthogonal moment transforms https://linkinghub.e[...] 2024-02
[5] 논문 Computational Algorithms on Medical Image Processing https://www.eurekase[...] 2020-05-28
[6] 서적 Picture Processing by Computer Academic Press
[7] 서적 Digital image processing Prentice Hall 2008
[8] 서적 The Electronics Revolution: Inventing the Future https://books.google[...] Springer 2017
[9] 간행물 Oxidation of semiconductive surfaces for controlled diffusion https://patents.goog[...]
[10] 논문 Surface Protection and Selective Masking during Diffusion in Silicon https://iopscience.i[...] 1957
[11] 논문 Silicon-Silicon Dioxide Surface Device https://doi.org/10.1[...] 1961
[12] 서적 History of Semiconductor Engineering Springer-Verlag Berlin Heidelberg 2007
[13] 논문 The mechanisms for silicon oxidation in steam and oxygen https://linkinghub.e[...] 1960
[14] 서적 History of Semiconductor Engineering Springer Science & Business Media 2007
[15] 서적 Scientific charge-coupled devices https://books.google[...] SPIE Press
[16] 논문 Charge Coupled Semiconductor Devices 1970
[17] 서적 Charge-Coupled Devices and Solid State Optical Sensors III 1993-07-12
[18] 웹사이트 Active Pixel Sensors http://ericfossum.co[...] 2019-08-29
[19] 논문 A new MOS phototransistor operating in a non-destructive readout mode 1985
[20] 논문 A Review of the Pinned Photodiode for CCD and CMOS Image Sensors 2014
[21] 뉴스 CMOS Image Sensor Sales Stay on Record-Breaking Pace http://www.icinsight[...] 2019-10-06
[22] 서적 Advances in Embedded Computer Vision Springer 2014
[23] 서적 VLSI Systems and Computations Computer Science Press 1981-08
[24] 웹사이트 How Computer Mice Work https://computer.how[...] 2019-10-09
[25] 웹사이트 Building the First Digital Camera http://hackaday.com/[...] 2016-04-30
[26] 논문 How I Came Up With the Discrete Cosine Transform https://www.scribd.c[...] 2019-10-10
[27] 웹사이트 T.81 – Digital compression and coding of continuous-tone still images – requirements and guidelines https://www.w3.org/G[...] CCITT 2019-07-12
[28] 웹사이트 The JPEG image format explained https://home.bt.com/[...] BT Group 2019-08-05
[29] 웹사이트 What Is a JPEG? The Invisible Object You See Every Day https://www.theatlan[...] 2019-09-13
[30] 뉴스 JPeg lockdown: Restriction options sought by committee https://www.bbc.co.u[...] BBC News 2019-09-13
[31] 논문 RNS-Based FPGA Accelerators for High-Quality 3D Medical Image Wavelet Processing Using Scaled Filter Coefficients 2022
[32] 논문 ROI-Based Compression Strategy of 3D MRI Brain Datasets for Wireless Communications https://linkinghub.e[...] 2021-06
[33] 논문 A lossless compression method for multi-component medical images based on big data mining 2021-06-11
[34] 서적 Power MOSFETS: theory and applications https://books.google[...] Wiley 1989
[35] 뉴스 The Surprising Story of the First Microprocessors https://spectrum.iee[...] Institute of Electrical and Electronics Engineers 2019-10-13
[36] 웹사이트 1979: Single Chip Digital Signal Processor Introduced https://www.computer[...] Computer History Museum 2019-10-14
[37] 웹사이트 30 years of DSP: From a child's toy to 4G and beyond https://www.edn.com/[...] 2012-08-27
[38] 간행물 Reminiscences of the Early Work in DCT: Interview with K.R. Rao http://ticsp.cs.tut.[...] 2012
[39] 웹사이트 Space Technology Hall of Fame:Inducted Technologies/1994 http://www.spacetech[...] Space Foundation 2010-01-07
[40] 간행물 Radiation-reduction strategies in cardiac computed tomographic angiography 2010-11
[41] 간행물 Pancreatic tumors imaging: An update https://iris.uniroma[...] 2016-04
[42] 간행물 Multiparametric MR Imaging of Breast Cancer 2016-02
[43] 뉴스 Medical Imaging Chip Global Unit Volume To Soar Over the Next Five Years https://siliconsemic[...] 2019-10-25
[44] 간행물 Multiparametric magnetic resonance for the non-invasive diagnosis of liver disease 2014-01
[45] 간행물 A High Performance Architecture for Implementation of 2-D Convolution with Quadrant Symmetric Kernels 2008
[46] 서적 Digital Image Processing, 3rd Pearson Hall 2008
[47] 서적 Affine Transformations https://people.cs.cl[...] A K Peters/CRC Press 2019-03-26
[48] 웹사이트 A Brief, Early History of Computer Graphics in Film http://www.beanbloss[...] 2010-03-24
[49] 서적 Picture Processing by Computer Academic Press 1969



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com