ハフマン符号化によるテキスト圧縮
Text compression with Huffman coding
a
,
b
,
c
,
d
の4文字からなるテキストの圧縮
出現確率が不明の場合
When probability is unknown
各文字に2ビット必要
2 bits requred for each character
a
の確率が50%,
b
が25%,
c
,
d
が12.5\%の場合
aを0,
b
を10,
c
を100,
d
を101と符号化
1*0.5 + 2 * 0.25 + 2 * 3 * 0.125 = 平均1.75ビット/文字
算術符号化 = ハフマン符号化の拡張
Arithmetic coding = extension to Huffman coding