符号木の可視化(左枝=0, 右枝=1)
ノードは頻度(重み)を表示。葉は記号:頻度。
符号表
| 記号 | 頻度 | 確率 | 符号 | 長さ | p×長さ |
|---|
学習モード(構築手順の可視化)
構築ステップ
現在のグループ(多い順/進捗反映)
| 順位 | 記号 | 頻度 | 確率 |
|---|
出現頻度の高い記号に短いビット列、低い記号に長いビット列を割り当て、全体の平均符号長を最小化する可変長接頭語コード(prefix-free code)。
出現頻度(確率)の高い記号ほど短いビット列、低い記号ほど長いビット列を機械的に割り当て、平均符号長を最小化する可変長の接頭語(prefix-free)符号です。
| 記号 | 頻度 | 確率 | 符号 | 長さ | p×長さ |
|---|
| 順位 | 記号 | 頻度 | 確率 |
|---|
H ≤ L < H+1(非負の確率)。表示を目安に妥当性を確認。各文字の「ビット長 × 出現確率」を足し合わせれば、平均ビット長(平均符号長)が求まります。
L = 1×0.5 + 2×0.3 + 3×0.1 + 3×0.1 = 0.5 + 0.6 + 0.3 + 0.3 = 1.7 ビット
接頭語条件(prefix-free)とは、任意の2つの符号語について「一方が他方の先頭(接頭語)になっていない」ことを指します。簡単に言うと、どの符号語も他の符号語で始まらない、という条件です。