과소적합
"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
과소적합은 통계 및 기계 학습에서 모델이 데이터의 내재된 구조를 충분히 포착하지 못하는 현상입니다. 과소적합 모델은 학습 데이터에서 제대로 학습하지 못하여, 새로운 데이터에 대한 예측 성능이 떨어지는 경향을 보입니다. 이는 모델이 너무 단순하거나, 데이터의 복잡성을 반영하기에 충분한 특성(feature)을 고려하지 않았을 때 발생할 수 있습니다.
과소적합 | |
---|---|
과소적합 | |
![]() | |
개요 | |
정의 | 통계학 및 머신 러닝에서, 과소적합(영어: underfitting)은 데이터 모델링 시 모델이 데이터를 충분히 학습하지 못하여 발생하는 현상이다. |
설명 | 이는 모델이 데이터의 기본적인 패턴이나 추세를 제대로 파악하지 못하여 훈련 데이터와 새로운 데이터 모두에서 낮은 성능을 보이는 경우를 의미한다. |
원인 | 모델의 복잡성이 너무 낮은 경우 (예: 선형 모델을 사용하여 비선형 데이터를 모델링하는 경우) 훈련 데이터의 양이 부족한 경우 모델 훈련 시간이 충분하지 않은 경우 |
결과 | 높은 편향 (bias): 모델이 데이터의 복잡성을 제대로 반영하지 못함. 낮은 분산 (variance): 모델이 훈련 데이터에 너무 단순하게 맞춰져 새로운 데이터에 대한 일반화 능력이 떨어짐. |
예시 | 선형 회귀 모델을 사용하여 이차 함수 형태의 데이터를 예측하는 경우, 모델은 데이터의 곡선 형태를 따라가지 못하고 직선으로 예측하므로 과소적합이 발생한다. |
해결 방법 | |
모델 복잡성 증가 | 더 복잡한 모델을 사용 (예: 선형 모델 대신 다항 회귀 모델, 의사 결정 트리 모델, 신경망 모델 등을 사용) |
특성 추가 | 모델이 학습할 수 있는 추가적인 특성(feature)을 데이터에 추가 |
훈련 데이터 증가 | 모델 훈련에 사용되는 데이터의 양을 늘림 |
훈련 시간 증가 | 모델이 데이터를 충분히 학습할 수 있도록 훈련 시간을 늘림 |
정규화 감소 | 모델의 복잡성을 제한하는 정규화(regularization) 기법의 강도를 줄임 |
과대적합과의 비교 | |
과소적합 | 모델이 너무 단순하여 데이터의 패턴을 제대로 학습하지 못함. 훈련 데이터와 테스트 데이터 모두에서 낮은 성능을 보임. |
과대적합 | 모델이 훈련 데이터를 너무 과도하게 학습하여 훈련 데이터에서는 높은 성능을 보이지만, 새로운 데이터에 대한 일반화 능력이 떨어짐. |
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com