전이학습

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

전이 학습은 기계 학습의 한 분야로, 기존에 학습된 지식을 새로운 관련 작업에 적용하여 학습 효율을 높이는 기술이다. 1970년대부터 연구가 시작되어 1990년대에 로리엔 프랫 등에 의해 알고리즘이 공식화되었으며, 앤드루 응은 전이 학습이 지도 학습 다음으로 기계 학습의 상업적 성공을 이끌 것이라고 강조했다. 전이 학습은 도메인과 태스크를 정의하여, 소스 도메인과 태스크의 지식을 활용해 타겟 도메인에서 학습을 개선하는 것을 목표로 한다. 암 진단, 건물 운영, 게임, 문서 분류, 문자 인식, 의료 영상, 스팸 필터링 등 다양한 분야에 응용되며, 최근에는 뇌파와 근전도 신호 간의 전이 학습 연구도 이루어지고 있다.

전이학습

📚 더 읽어볼만한 페이지

기계 학습 - 비지도 학습
비지도 학습은 레이블이 없는 데이터를 통해 패턴을 발견하고 데이터 구조를 파악하는 것을 목표로 하며, 주성분 분석, 군집 분석, 차원 축소 등의 방법을 사용한다.
기계 학습 - 지도 학습
지도 학습은 레이블된 데이터를 사용하여 입력 데이터와 출력 레이블 간의 관계를 학습하는 기계 학습 분야로, 예측 모델 생성, 알고리즘 선택, 모델 최적화, 정확도 평가 단계를 거치며, 회귀 및 분류 문제에 적용되고 다양한 확장 기법과 성능 평가 방법을 활용한다.

1. 개요
2. 역사
- 2.1. 초기 연구 (1970년대 ~ 1990년대)
- 2.2. 2000년대 이후의 발전
3. 정의
4. 응용 분야
5. 한국의 전이 학습 연구 동향
6. 한계 및 극복 과제
7. 관련 기술

2. 역사

1976년, 스테보 보지노브스키(Stevo Bozinovski)와 안테 풀고시(Ante Fulgosi)는 신경망 훈련에서의 전이 학습을 다룬 논문을 발표했다. 이 논문은 이 주제에 대한 수학적 및 기하학적 모델을 제시했다. 1981년에는 컴퓨터 터미널의 글자를 나타내는 이미지 데이터 세트에 전이 학습을 적용하는 것을 고려한 보고서가 발표되었으며, 긍정적 및 부정적 전이 학습을 실험적으로 시연했다.

1992년, 로리엔 프랫은 차별성 기반 전이(DBT) 알고리즘을 공식화했다. 1993년, 로리엔 프랫(Lorien Pratt)은 기계 학습에서의 전이에 관한 논문을 발표하고, 식별성에 기반한 전이 알고리즘을 공식화했다.

1998년까지 이 분야는 다중 작업 학습을 포함하도록 발전했으며, 보다 공식적인 이론적 기반도 갖추게 되었다. 전이 학습에 관한 영향력 있는 출판물로는 1998년의 책 Learning to Learn, 2009년의 조사 및 2019년의 조사가 있다.

앤드루 응은 NIPS 2016 튜토리얼에서 전이 학습이 지도 학습 다음으로 기계 학습의 상업적 성공을 이끄는 원동력이 될 것이라고 언급하며 그 중요성을 강조했다.

2020년 논문 "Rethinking Pre-Training and self-training"에서 조프 외 연구진은 사전 훈련이 정확도를 저해할 수 있으며, 대신 자기 훈련을 옹호한다고 보고했다.

2.1. 초기 연구 (1970년대 ~ 1990년대)

1976년, 보지노브스키(Bozinovski)와 풀고시(Fulgosi)는 신경망 훈련에서의 전이 학습을 다룬 논문을 발표했다. 이 논문은 이 주제에 대한 수학적 및 기하학적 모델을 제시했다. 1981년에는 컴퓨터 터미널의 글자를 나타내는 이미지 데이터 세트에 전이 학습을 적용하는 것을 고려한 보고서가 발표되었으며, 긍정적 및 부정적 전이 학습을 실험적으로 시연했다.

1992년, 로리엔 프랫은 차별성 기반 전이(DBT) 알고리즘을 공식화했다. 1993년, 로리엔 프랫(Lorien Pratt)은 기계 학습에서의 전이에 관한 논문을 발표했다.

1998년까지 이 분야는 다중 작업 학습을 포함하도록 발전했으며, 보다 공식적인 이론적 기반도 갖추게 되었다.

앤드류 응은 2016년 NIPS 튜토리얼에서 전이 학습이 지도 학습 이후 기계 학습 상업적 성공의 다음 동력이 될 것이라고 말했다.

2.2. 2000년대 이후의 발전

1976년, 보지노브스키(Bozinovski)와 풀고시(Fulgosi)는 신경망 훈련에서의 전이 학습을 다룬 논문을 발표하고, 이 주제에 대한 수학적 및 기하학적 모델을 제시했다. 1981년에는 컴퓨터 터미널의 글자를 나타내는 이미지 데이터 세트에 전이 학습을 적용하는 것을 고려한 보고서가 발표되었으며, 긍정적 및 부정적 전이 학습을 실험적으로 시연했다.

1992년, 로리엔 프랫은 차별성 기반 전이(DBT) 알고리즘을 공식화했다. 1993년에는 기계 학습에서의 전이에 관한 논문을 발표했다.

1998년까지 이 분야는 다중 작업 학습을 포함하도록 발전했으며, 보다 공식적인 이론적 기반도 갖추게 되었다. 전이 학습에 관한 영향력 있는 출판물로는 1998년의 책 Learning to Learn과 2009년 및 2019년의 조사가 있다.

앤드루 응은 2016년 NIPS 튜토리얼에서 전이 학습이 지도 학습 이후 기계 학습 상업적 성공의 다음 동력이 될 것이라고 말했다.

2020년 논문 "Rethinking Pre-Training and self-training"에서 조프 외 연구진은 사전 훈련이 정확도를 저해할 수 있으며, 대신 자기 훈련을 옹호한다고 보고했다.

3. 정의

전이 학습의 정의는 도메인과 태스크 측면에서 제공된다. 도메인 $\mathcal{D}$ 는 특징 공간 $\mathcal{X}$ 와 주변 확률 분포 $P(X)$ 로 구성되며, 여기서 $X = \{x_1,...,x_n\} \in \mathcal{X}$ 이다. 특정 도메인 $\mathcal{D} = \{\mathcal{X}, P(X)\}$ 가 주어지면, 태스크는 레이블 공간 $\mathcal{Y}$ 와 목표 예측 함수 $f:\mathcal{X} \rightarrow \mathcal{Y}$ 의 두 가지 구성 요소로 이루어진다. 함수 $f$ 는 새로운 인스턴스 $x$ 에 해당하는 레이블 $f(x)$ 를 예측하는 데 사용된다. $\mathcal{T} = \{\mathcal{Y}, f(x)\}$ 로 표시되는 이 태스크는 쌍 $\{x_i, y_i\}$ 로 구성된 훈련 데이터로부터 학습되며, 여기서 $x_i \in \mathcal{X}$ 이고 $y_i \in \mathcal{Y}$ 이다.

소스 도메인 $\mathcal{D}_S$ 와 학습 태스크 $\mathcal{T}_S$ , 타겟 도메인 $\mathcal{D}_T$ 와 학습 태스크 $\mathcal{T}_T$ 가 주어졌을 때, $\mathcal{D}_S \neq \mathcal{D}_T$ 이거나 $\mathcal{T}_S \neq \mathcal{T}_T$ 인 경우, 전이 학습은 $\mathcal{D}_S$ 와 $\mathcal{T}_S$ 의 지식을 사용하여 $\mathcal{D}_T$ 에서 타겟 예측 함수 $f_T (\cdot)$ 의 학습을 개선하는 것을 목표로 한다.

4. 응용 분야

마르코프 논리 네트워크 및 베이즈 네트워크에서 전이 학습을 위한 알고리즘을 사용할 수 있다. 전이 학습은 암의 아형 발견, 건물 운영, 일반적인 게임 플레이/General game playing^영어, 문서 분류, 문자 인식, 의료 영상, 스팸 필터링에 응용되고 있다.

2020년에는 뇌파 기록(EEG) 파형의 움직임을 제스처 인식 영역에서 정신 상태 인식 영역으로 분류할 때, 그 물리적 성질이 유사하기 때문에 근육으로부터의 전기 근운동 기록(EMG) 신호 간에 전이 학습이 가능하다는 것이 발견되었다. 또한, 이 관계는 역으로도 작용하여, 뇌파 기록이 근운동 기록을 더욱 분류할 수 있다는 것도 나타났다. 이 실험에서는 신경망 및 합성곱 신경망의 정확도가, 최초 에포크(학습 전, 즉 표준적인 무작위 가중치 분포와의 비교)와 점근(학습 프로세스의 종료) 모두에서, 전이 학습에 의해 향상되는 것을 알 수 있었다. 즉, 알고리즘은 다른 도메인에 접하게 함으로써 개선되었다. 더욱이, 사전 학습된 모델의 최종 사용자는 완전 결합층의 구조를 변경함으로써, 더 우수한 성능을 얻을 수 있다.

코드 관련 기계 학습 영역에서는, 전이 학습이 보안 취약점을 자동으로 수정하는 데 도움이 된다는 것이 나타났다.

4.1. 컴퓨터 비전

마르코프 논리 네트워크 및 베이즈 네트워크에서 전이 학습을 위한 알고리즘을 사용할 수 있다. 전이 학습은 암 하위 유형 발견, 건물 활용, 일반 게임 플레이, 텍스트 분류, 숫자 인식, 의료 영상 및 스팸 필터링에 적용되었다.

2020년에는 근육의 근전도 신호 (EMG)와 뇌파도 (EEG)의 행동 분류에서 전이 학습이 가능하다는 것이 밝혀졌다. 이는 제스처 인식 도메인에서 정신 상태 인식 도메인 간에, 그리고 그 반대로도 적용되어, 뇌파도가 EMG를 분류하는 데 사용될 수 있음을 보여주었다. 실험에서는 인공 신경망과 합성곱 신경망의 정확도가 학습 전과 학습 과정의 끝 모두 전이 학습을 통해 향상되었다. 또한, 사전 훈련된 모델의 최종 사용자는 완전 연결 계층의 구조를 변경하여 성능을 향상시킬 수 있다.

4.2. 자연어 처리

마르코프 논리 네트워크 및 베이즈 네트워크에서 전이 학습을 위한 알고리즘을 사용할 수 있다. 전이 학습은 암 하위 유형 발견, 건물 활용, 일반 게임 플레이, 텍스트 분류, 숫자 인식, 의료 영상 및 스팸 필터링에 적용되었다.

2020년에는 근육의 근전도 신호 (EMG)와 뇌파도 (EEG)의 행동 분류에서 전이 학습이 가능하다는 것이 밝혀졌다. 이는 제스처 인식 도메인에서 정신 상태 인식 도메인 간에 물리적 특성이 유사하기 때문이다. 이러한 관계는 양방향으로 작동하여 뇌파도가 EMG를 분류하는 데 사용될 수 있음을 보여주었다. 실험에서는 인공 신경망과 합성곱 신경망의 정확도가 학습 전과 학습 과정의 끝 모두 전이 학습을 통해 향상되었다. 즉, 다른 도메인에 노출되면 결과가 향상된다. 또한, 사전 훈련된 모델의 최종 사용자는 완전 연결 계층의 구조를 변경하여 성능을 향상시킬 수 있다.

4.3. 기타 분야

마르코프 논리 네트워크 및 베이즈 네트워크에서 전이 학습을 위한 알고리즘을 사용할 수 있다. 전이 학습은 암 하위 유형 발견, 건물 활용, 일반 게임 플레이, 텍스트 분류, 숫자 인식, 의료 영상 및 스팸 필터링에 적용되었다.

2020년에는 유사한 물리적 특성으로 인해 근육의 근전도 신호 (EMG)와 뇌파도 (EEG)의 행동 분류, 즉 제스처 인식 도메인에서 정신 상태 인식 도메인 간에 전이 학습이 가능하다는 것이 밝혀졌다. 이러한 관계는 양방향으로 작동하여 뇌파도가 마찬가지로 EMG를 분류하는 데 사용될 수 있음을 보여주었다. 실험에서는 인공 신경망과 합성곱 신경망의 정확도가 학습 전(표준 임의 가중치 분포와 비교)과 학습 과정의 끝(점근선) 모두 전이 학습을 통해 향상되었다는 점에 주목했다. 즉, 다른 도메인에 노출되면 결과가 향상된다. 또한, 사전 훈련된 모델의 최종 사용자는 완전 연결 계층의 구조를 변경하여 성능을 향상시킬 수 있다.

코드 관련 기계 학습 영역에서는, 전이 학습이 보안 취약점을 자동으로 수정하는 데 도움이 된다는 것이 나타났다.

5. 한국의 전이 학습 연구 동향

6. 한계 및 극복 과제

7. 관련 기술

* 교차 - 두 부모의 유전 정보를 결합하여 새로운 자손을 생성하는 데 사용되는 유전 연산자이다.
* 도메인 적응 - 기계 학습 및 전이 학습과 관련된 학문 분야 중 하나이다.
* 일반적 게임 플레이 - 하나 이상의 게임을 잘 플레이할 수 있도록 인공지능 프로그램을 설계하는 것이다.
* 멀티태스크 학습 - 태스크 간의 공통성과 차이점을 활용하면서 여러 학습 태스크를 동시에 해결하는 기계 학습의 한 분야이다.
* 멀티태스크 최적화 - 여러 개의 자기 완결형 태스크를 동시에 해결하는 데 초점을 맞춘 최적화 관련 개념이다.
* 제로샷 학습 - 기계 학습에서의 문제 설정 중 하나이다.