밴 (컴퓨팅)
1. 개요
밴(ban)은 앨런 튜링과 I.J. 굿이 제2차 세계 대전 중 에니그마 암호 해독을 위해 개발한 정보 측정 단위이다. 밴버리즘 과정에서 정보의 양을 측정하기 위해 사용되었으며, 데시밴(deciban)은 밴의 하위 단위이다. 데시밴은 로그 확률 및 베이즈 요인을 측정하는 데 사용되며, 확률비의 무게를 나타낸다. 10 데시밴은 10:1의 확률비에 해당한다.
| 단위 계열 | SI 단위 |
|---|---|
| 측정량 | 정보량 (정보 이론) |
| 기호 | dit |
| 명명 유래 | 랠프 하틀리 |
| 1 dit (십진수) | log10 비트 (≒ 3.3219 비트) nat (≒ 2.3026 nat) |
|---|---|
| 1 비트 | dit (≒ 0.3010 dit) |
| 1 nat | ln(10) dit (≒ 0.4343 dit) |
| 다른 이름 | decit hartley |
|---|---|
| 설명 | 1 하틀리는 10개의 가능한 값 중 하나를 구별하는 데 필요한 정보의 양이다. |
| 정보 이론 | 샤논 (이진수) nat (밑 e) 하틀리 (밑 10) |
|---|---|
| 데이터 저장 | 비트 (이진) 트릿 (삼진) 디트 (십진) |
| 양자 정보 | 큐비트 (이진) 큐트릿 (삼진) 큐디트 (d차원) |
2. 역사
정보량 단위에는 여러 이름이 사용되어 왔다. '밴(ban)'과 '데시밴(deciban)'은 1940년 앨런 튜링과 I. J. Good이 블레츨리 파크에서 에니그마 암호 해독을 위해 발명한 단위이다. '하틀리(Hartley)'는 1928년 정보량 측정을 제안한 랄프 하틀리의 이름에서 유래했다.
과거에는 클로드 섀넌이 비트 대신 사용했던 '섀넌'이라는 용어도 있었으나, 21세기 초 IEC 80000-13 표준에서는 정보량 단위로 '하틀리'를 사용하도록 명시했다. 한편, '디트(dit)'는 'decimal digit'의 약자이다.
2.1. 앨런 튜링과 I.J. 굿의 공헌
밴과 데시밴은 1940년 앨런 튜링과 어빙 존 "잭" 굿에 의해 발명되었다. 이 단위들은 제2차 세계 대전 중 블레츨리 파크의 암호 해독자들이 독일 해군의 에니그마 암호 기계 설정을 알아내기 위해 사용한 밴버리즘 절차에서 정보의 양을 측정하는 데 활용되었다.
'밴(Ban)'이라는 이름은 이 과정에서 사용된 방대한 양의 카드가 약 약 48.28km 떨어진 영국 밴버리 마을에서 인쇄되었기 때문에 붙여졌다.
I.J. 굿은 특정 가설을 지지하는 증거의 가중치를 측정하기 위해 데시밴 값을 순차적으로 더하는 방식이 본질적으로 베이즈 추론과 같다고 주장했다. 반면, 도널드 A. 길리스는 밴이 칼 포퍼가 제시한 검증의 엄격성 척도와 사실상 동일하다고 보았다.
2.2. 랄프 하틀리와 하틀리
정보 단위의 동의어인 '하틀리'는 랄프 하틀리의 이름을 따서 명명되었다. 랄프 하틀리는 1928년에 정보를 표현하는 데 있어 구별 가능한 상태의 수와 동일한 로그 밑수를 사용하여 정보량을 측정할 것을 제안했다. 그는 십진수의 정보량을 측정할 경우 밑수 10을 사용할 것을 제안했다.
3. 확률의 단위로써의 사용
데시밴(deciban)은 특히 로그 확률이나 로짓을 측정하는 데 유용한 단위이다. 정보 이론에서는 베이즈 요인이나 증거 가중치와 같은 정보의 척도를 나타내는 데 사용된다. 예를 들어, 10 데시밴은 10:1의 확률비에 해당하며, 20 데시밴은 100:1의 확률비에 해당한다. 통계학자 I. J. 굿은 1 데시밴 정도의 증거 가중치 변화(확률비가 동일 확률 1:1에서 약 5:4로 변하는 정도)가 인간이 어떤 가설에 대한 믿음의 정도를 합리적으로 정량화할 수 있는 가장 미세한 정도라고 보았다. 정수 데시밴 값과 이에 해당하는 확률비 및 확률 간의 관계는 아래 하위 섹션에서 더 자세히 다룬다.
3.1. 확률비와 데시밴
데시밴은 로그 오즈(log-odds) 또는 로짓(logit)을 측정하는 데 유용한 단위로, 정보 이론에서는 베이즈 인자(Bayes factor)나 증거 가중치(weight of evidence)와 같은 정보의 척도를 나타내는 데 사용된다. 정보의 가중치는 확률비(odds)로 표현되는데, 데시밴은 이 확률비의 상용로그 값에 10을 곱한 값이다.
예를 들어, 확률비가 10:1이면 10 데시밴에 해당하고, 확률비가 100:1이면 20 데시밴에 해당한다. 통계학자 I. J. 굿(I. J. Good)은 1 데시밴 정도의 증거 가중치 변화(이는 확률비가 1:1에서 약 5:4로 변하는 정도에 해당)가 인간이 어떤 가설에 대한 믿음의 정도를 합리적으로 구분할 수 있는 가장 작은 단위라고 보았다.
정수 데시밴 값에 해당하는 확률비는 아래 표와 같이 간단한 정수 비율로 근사할 수 있다. 확률은 소수점 아래 두 자리까지 계산한 근사치이며, 필요에 따라 더 정확한 비율이 제시된다.
| 데시밴 (dBan) | 확률비 (Odds) (정확값: 10dBan/10) | 근사 확률비 | 근사 비율 | 정확한 비율 (필요시) | 확률 (%) |
|---|---|---|---|---|---|
| 0 | 1 | 1 | 1:1 | 50 | |
| 1 | 1.2589... | 1.26 | 5:4 | 56 | |
| 2 | 1.5848... | 1.58 | 3:2 | 8:5 | 61 |
| 3 | 1.9952... | 2.00 | 2:1 | 67 | |
| 4 | 2.5118... | 2.51 | 5:2 | 71.5 | |
| 5 | 3.1622... | 3.16 | 3:1 | 19:6, 16:5 | 76 |
| 6 | 3.9810... | 3.98 | 4:1 | 80 | |
| 7 | 5.0118... | 5.01 | 5:1 | 83 | |
| 8 | 6.3095... | 6.31 | 6:1 | 19:3, 25:4 | 86 |
| 9 | 7.9432... | 7.94 | 8:1 | 89 | |
| 10 | 10 | 10 | 10:1 | 91 |
3.2. 데시밴-확률 변환표
데시밴은 특히 로그 확률이나 로짓(로그 오즈)을 측정하는 데 유용한 단위이다. 정보 이론에서는 베이즈 요인이나 증거 가중치를 나타내는 척도로 사용된다. 예를 들어, 10 데시밴은 10:1의 오즈(odds)에 해당하고, 20 데시밴은 100:1의 오즈에 해당한다. 통계학자 I.J. 굿(I. J. Good)은 1 데시밴 정도의 증거 가중치 변화(오즈가 동일 확률 1:1에서 약 5:4로 변하는 정도)가 인간이 어떤 가설에 대한 믿음의 정도를 합리적으로 구분할 수 있는 가장 작은 단위에 해당한다고 보았다.
정수 데시밴 값에 해당하는 오즈는 종종 간단한 정수 비율로 근사할 수 있다. 아래 표는 각 데시밴 값에 해당하는 정확한 오즈 값, 근사값, 근사 비율 (약 5% 오차 내), 더 정확한 비율 (1% 오차 내), 그리고 해당 오즈가 나타내는 확률(%)을 보여준다.
| | 정확한 값 || 근사 값 || 근사 비율 || 정확한 비율 || 확률 | |||||
|---|---|---|---|---|---|
| 0 | 100/10 | 1 | 1:1 | 50% | |
| 1 | 101/10 | 1.26 | 5:4 | 56% | |
| 2 | 102/10 | 1.58 | 3:2 | 8:5 | 61% |
| 3 | 103/10 | 2.00 | 2:1 | 67% | |
| 4 | 104/10 | 2.51 | 5:2 | 71.5% | |
| 5 | 105/10 | 3.16 | 3:1 | 19:6, 16:5 | 76% |
| 6 | 106/10 | 3.98 | 4:1 | 80% | |
| 7 | 107/10 | 5.01 | 5:1 | 83% | |
| 8 | 108/10 | 6.31 | 6:1 | 19:3, 25:4 | 86% |
| 9 | 109/10 | 7.94 | 8:1 | 89% | |
| 10 | 1010/10 | 10 | 10:1 | 91% |