小码哥《恋上数据结构与算法》笔记(十五):哈夫曼编码

964 阅读1分钟

我的Github地址

小码哥《恋上数据结构与算法》笔记

极客时间《iOS开发高手课》笔记

iOS大厂面试高频算法题总结

iOS面试资料汇总

一、哈夫曼编码

  • 哈夫曼编码,它是现代压缩算法的基础。
  • 假设把字符串"ABBBCCCCCCDDDDDDEE"转成二进制编码进行传输。
    • 可以转成ASCII编码(65-691000001 - 1000101),但是有点冗长,如果希望编码更短呢?
    • 可以先约定5个字母对应的二进制
    • 如果使用哈夫曼编码,可以压缩至41个二进制位,约为原来长度的68.3%

二、哈夫曼树

  • 先计算出每个字母的出现频率(权值,这里直接用出现次数)。
  • 利用这些权值,构建一颗哈夫曼树。

三、构建哈夫曼树(假设有n个权值)

  • 以权值作为根节点构建n棵二叉树,组成森林。
  • 在森林中选出2个根节点最小的树合并,作为一颗新树的左右子树,且新树的根节点为其左右子树根节点之和。
  • 从森林中删除刚才选取的2棵树,并将新树加入森林。
  • 重复2,3步骤,直到森林只剩一棵树为止,该树即为哈夫曼树。

四、构建哈夫曼编码