정보 이득
1. 개요
정보 이득은 이전 상태에서 주어진 정보를 갖는 상태로 변경될 때 정보 엔트로피의 변화를 의미한다. 이는 정보 엔트로피의 감소로, 관찰 집합 내의 불순도 또는 불확실성의 척도이다. 정보 이득은 의사 결정 트리에서 특징이 클래스에 대해 제공하는 정보의 양을 측정하는 척도로 사용되며, 데이터를 분할하는 방식을 결정한다. 정보 이득은 연속형 및 이산형 변수 모두에서 작동하며, 결정 트리에서 최적의 분할을 선택하는 데 활용된다. 하지만, 많은 고유값을 가진 속성에 정보 이득을 적용할 때 과적합의 문제가 발생할 수 있으며, 이를 해결하기 위해 정보 이득률을 사용하는 방법이 제안되었다.
정보 이득
개요
| 정의 | 의사 결정 트리에서 특성이 주어졌을 때 목표 변수에 대한 정보 획득량 |
|---|---|
| 약자 | I(X; A) |
| 종류 | 통계, 머신 러닝 |
상세 내용
| 설명 | 정보 획득은 의사 결정 트리 학습 알고리즘에서 사용하는 휴리스틱이다. 정보 획득은 속성 A를 기준으로 데이터의 엔트로피를 감소시키는 양을 계산한다. |
|---|---|
| 계산 방법 | 속성 A를 기준으로 분할하여 얻은 정보 획득은 다음과 같이 계산된다. I(S, A) = H(S) - Σv∈Values(A) |Sv|/|S| * H(Sv) 여기서 H(S)는 집합 S의 엔트로피, A는 속성, Values(A)는 속성 A가 가질 수 있는 값의 집합, Sv는 A의 값이 v인 S의 부분집합이다. |
| 활용 | 정보 획득은 의사 결정 트리를 구축할 때 어떤 속성을 먼저 분할해야 하는지 결정하는 데 사용된다. 정보 획득이 가장 높은 속성이 먼저 분할된다. |
추가 정보
| 주의 사항 | 정보 획득은 속성에 따라 여러 값을 가질 때 편향될 수 있다. |
|---|---|
| 관련 개념 | 엔트로피 의사 결정 트리 지니 불순도 |
📚 더 읽어볼만한 페이지
-
정보 이론 -
양자 컴퓨터
양자 컴퓨터는 양자역학적 현상을 이용하여 정보를 처리하는 컴퓨터로, 큐비트를 통해 0과 1을 동시에 표현하여 특정 연산에서 기존 컴퓨터보다 빠른 속도를 보이며 암호 해독, 신약 개발 등 다양한 분야에 혁신을 가져올 것으로 기대된다. -
정보 이론 -
정보 엔트로피
정보 엔트로피는 확률 변수의 불확실성을 측정하는 방법으로, 사건 발생 가능성이 낮을수록 정보량이 커진다는 원리에 기반하며, 데이터 압축, 생물다양성 측정, 암호화 등 다양한 분야에서 활용된다. -
통계학 -
확률
확률은 사건의 가능성을 수치화한 개념으로, 도박에서 시작되어 수학적으로 발전했으며, 다양한 해석과 요소, 응용 분야를 가지며 양자역학, 사회 현상 등에도 적용된다. -
통계학 -
사분위수
사분위수는 정렬된 데이터를 4등분하는 세 개의 값으로 데이터 분포 요약 및 이상치 탐지에 활용되며, 제1사분위수(Q₁)는 하위 25%, 제2사분위수(Q₂ 또는 중앙값)는 하위 50%, 제3사분위수(Q₃)는 하위 75%를 나타낸다.
2. 정의
일반적으로, 기대되는 정보 이득은 이전 상태에서 주어진 정보를 갖는 상태로 바뀔 때 정보 엔트로피 H의 변화이다.
:
:를 각각 형식으로 나타내보면, 는 와 해당 클래스 라벨인 번째 속성의 값이다. 속성 에 대한 정보 이득은 다음과 같이 엔트로피 로 정의된다.
: