携手创作,共同成长!这是我参与「掘金日新计划 · 8 月更文挑战」的第18天,点击查看活动详情
哈夫曼树是什么
给定 n 个权值作为 n 个叶子节点,构造一棵二叉树,若该树的带权路径长度(Weighted Path Length of Tree)达到最小, 称这样的二叉树为最优二叉树,也称为哈夫曼树(Huffman Tree)
哈夫曼树是带权路径长度最短的树,权值较大的节点离根较近。
哈夫曼树的构造
步骤:
- 从小到大进行排序, 将每一个数据,每个数据都是一个节点 , 每个节点可以看成是一颗最简单的二叉树
- 取出根节点权值最小的两颗二叉树
- 组成一颗新的二叉树, 该新的二叉树的根节点的权值是前面两颗二叉树根节点权值的和
- 再将这颗新的二叉树,以根节点的权值大小 再次排序,不断重复 1-2-3-4 的步骤,直到数列中,所有的数据都被处理,就得到一颗赫夫曼树
图解: 以数组{13, 7, 8, 3, 29, 6, 1}为例,要求转成一颗赫夫曼树
- 首先把原数组以从小到大顺序来排列{1,3,6,7,8,13,29}
- 把每个数据看做是一个节点,取出节点权值最小的两个节点 1, 3 组成一颗新的二叉树,该二叉树权值为 3+1 = 4。
3. 在原序列中将第 2 步取出的两个权值最小的移除,然后将第 2 步生成的新节点的权值加入到原序列中,并重新排序,然后生成新的二叉树。
4. 按以上步骤不断生成新的树。
代码实现
package huffmanTree;
import java.util.ArrayList;
import java.util.Collections;
import java.util.List;
public class HuffmanTreeDemo {
public static void main(String[] args) {
int arr[] = {13,7,8,3,29,6,1};
Node root = creatHuffmanTree(arr);
preOrder(root);
}
public static void preOrder(Node root){
if(root != null){
root.preOrder();
}else{
System.out.println("树是空树");
}
}
public static Node creatHuffmanTree(int arr[]){
//为了操作方便
//1.先遍历arr数组
//2.将arr的每个元素构成一个Node
//3.将Node放入到ArrayList中
List<Node> nodes = new ArrayList<>();
for(int value:arr){
nodes.add(new Node(value));
}
while(nodes.size() > 1){
Collections.sort(nodes);
System.out.println("从小到大排序后的权值为" + nodes);
//取出根节点权值最小的两个节点
Node leftNode = nodes.get(0);
Node rightNode = nodes.get(1);
//构建一个新的二叉树
Node parent = new Node(leftNode.value + rightNode.value);
parent.left = leftNode;
parent.right = rightNode;
//从ArrayList中删除处理过的二叉树节点
nodes.remove(leftNode);
nodes.remove(rightNode);
//将parent加入到nodes中
nodes.add(parent);
}
//返回哈夫曼树的root节点
return nodes.get(0);
}
}
//为了让node对象持续排序Collections集合排序
//让node实现comparable接口
class Node implements Comparable<Node>{
int value;//节点权值
Node left;//左子节点
Node right;//右子节点
public Node(int value){
this.value = value;
}
@Override
public String toString() {
return "Node{" +
"value=" + value +
'}';
}
@Override
public int compareTo(Node o) {
return this.value - o.value;
}
//前序遍历
public void preOrder(){
System.out.println(this);
if(this.left != null){
this.left.preOrder();
}
if(this.right != null){
this.right.preOrder();
}
}
}
哈夫曼编码
以字符的使用频率做权构建一棵哈夫曼树,然后利用哈夫曼树对字符进行编码,称为哈夫曼编码
设计思想
-
将所要编码的字符作为叶子节点,该字符在文件中的使用频率作为叶子节点的的权值,以自底向上的方式、通过执行n-1次的“合并”运算后构造出最终所要求的树,即哈夫曼树,它的核心思想是让权值大的叶子离根最近
-
采用的贪心策略:每次从树的集合中取出双亲为0且权值最小的两棵树作为左、右子树,构造一棵新树,新树根节点的权值为其左右孩子节点权值之和,将新树插入到树的集合中