스펙트럴 플럭스
1. 개요
스펙트럴 플럭스는 현재 프레임과 이전 프레임 간의 스펙트럼 크기 차이를 계산하여 얻는 값이다. 주로 악기의 음이 시작되는 순간, 즉 온셋(onset)을 감지하는 데 사용되며, 소리 에너지의 증가를 감지하는 데 효과적이다. 스펙트럴 플럭스 계산 시 L1-노름 또는 L2-노름, 스펙트럼 정규화 여부 등 다양한 변형이 존재한다.
2.1. 기본 공식
3. 변형
기본 공식에서는 L2-노름(제곱 차이의 합)을 사용하지만, L1-노름(절대 차이의 합)을 사용하는 구현도 있다. 온셋(onset) 감지의 경우, 에너지의 증가는 중요하지만 감소는 중요하지 않으므로 일부 알고리즘은 에너지 증가가 있는 빈에서 계산된 값만 포함한다.
일부 구현에서는 스펙트럴 플럭스를 계산할 때 스펙트럼을 정규화하지 않기도 한다.
일부 구현에서는 L2-노름(제곱 차이의 합) 대신 L1-노름(절대 차이의 합)을 사용한다. 또한 스펙트럼을 정규화하지 않는 구현도 존재한다.
온셋 감지의 경우, 에너지의 증가는 중요하지만 감소는 중요하지 않으므로, 에너지 증가가 있는 빈에서 계산된 값만 포함하는 알고리즘도 사용된다.
3.1. L1-노름과 L2-노름
기본 공식에서는 L2-노름(제곱 차이의 합)을 사용하지만, L1-노름(절대 차이의 합)을 사용하는 구현도 있다. 온셋(onset) 감지의 경우, 에너지의 증가는 중요하지만 감소는 중요하지 않으므로 일부 알고리즘은 에너지 증가가 있는 빈에서 계산된 값만 포함한다.
3.3. 에너지 증가
일부 구현에서는 L2-노름(제곱 차이의 합) 대신 L1-노름(절대 차이의 합)을 사용한다. 또한 스펙트럼을 정규화하지 않는 구현도 존재한다.
온셋 감지의 경우, 에너지의 증가는 중요하지만 감소는 중요하지 않으므로, 에너지 증가가 있는 빈에서 계산된 값만 포함하는 알고리즘도 사용된다.
4. 사용 분야
스펙트럴 플럭스는 전 프레임과 비교하여 늘어난 에너지에 관한 정보만 포함하므로, 악기의 한 음이 시작되는 순간(Onset)을 찾아 내는 목적으로 주로 쓰인다. 이는 소리 에너지의 증가를 감지하는 데 효과적이기 때문이다.
4.1. 온셋 감지(Onset Detection)
스펙트럴 플럭스는 전 프레임과 비교하여 늘어난 에너지에 관한 정보만 포함하므로, 악기의 한 음이 시작되는 순간(Onset)을 찾아 내는 목적으로 주로 쓰인다. 이는 소리 에너지의 증가를 감지하는 데 효과적이기 때문이다.