【数据结构】从零认识线段树

1,912 阅读5分钟

线段树又称区间树,英文叫Segment Tree。

线段树主要用于解决区间内的统计查询问题。

对于给定的区间

更新:更新区间中一个元素或一个区间的值。

查询:查询一个区间[i,j]的最大值,最小值,或者区间和等。

与数组的时间复杂度对比

线段树的结构图:

上面两个图都是线段树,我们可以发现真正的值都存储在树的叶子节点,而其他节点都存储的是区间的值。

当结点数不能被2整除时,让左孩子取少的结点,右孩子取多的结点。

线段树不是完全二叉树,是平衡二叉树(所有叶子结点的最大深度与最小深度相差小于等于1)。

这里我们使用数组的方式来存储线段树,首先我们需要知道有n个元素的线段树,用数组表示需要多少个节点?

由此可知我们需要一个大小为4n的数组来存储含有n个元素的线段树。

创建线段树

public class SegmentTree<E> {

    /**
     * 把线段树看成满二叉树的表示
     */
    private E[] tree;
    private E[] data;
    /**
     * 用于定义线段树的两个区间是如何融合的
     */
    private Merger<E> merger;

    public SegmentTree(E[] arr, Merger<E> merger){

        this.merger = merger;

        data = (E[])new Object[arr.length];
        for (int i = 0; i < arr.length; i++){
            data[i] = arr[i];
        }

        tree = (E[])new Object[4 * arr.length];
        buildSegmentTree(0, 0, data.length - 1);
    }

    /**
     * 在treeIndex的位置创建表示区间[l...r]的线段树
     * @param treeIndex
     * @param l
     * @param r
     */
    private void buildSegmentTree(int treeIndex, int l, int r){

        if (l == r){
            tree[treeIndex] = data[l];
            return;
        }

        int leftTreeIndex = leftChild(treeIndex);
        int rightTreeIndex = rightChild(treeIndex);

        /**
         * 这样写避免l+r超出整型范围
         */
        int mid = l + (r - l) / 2;
        /**
         * 递归创建左右子树
         */
        buildSegmentTree(leftTreeIndex, l, mid);
        buildSegmentTree(rightTreeIndex, mid + 1, r);

        tree[treeIndex] = merger.merge(tree[leftTreeIndex], tree[rightTreeIndex]);
    }

    public int getSize(){
        return data.length;
    }

    public E get(int index){
        if (index < 0 || index >= data.length){
            throw new IllegalArgumentException("Index is illegal.");
        }
        return data[index];
    }

    /**
     * 返回左孩子节点索引
     * @param index
     * @return
     */
    private int leftChild(int index){
        return 2 * index + 1;
    }

    /**
     * 返回右孩子节点索引
     * @param index
     * @return
     */
    private int rightChild(int index){
        return 2 * index + 2;
    }
}

融合器接口

public interface Merger<E> {

    E merge(E a, E b);
}

通过这个接口用户可以自定义线段树两个区间融合的方式,如求和,求最值等。

区间查询

如上图需要查询[2,5]区间内的元素和,首先我们可以知道[0,7]这个区间被分成了[0,3]和[4,7],我们需要在左子树中查询[2,3],在右子树中查询[4,5],然后递归这个过程,即在[0,3]节点的左右孩子中查找[2,3],在[4,7]节点的左右孩子中查找[4,5]。

代码实现:

/**
 * 返回区间[queryL, queryR]的值
 * @param queryL
 * @param queryR
 * @return
 */
public E query(int queryL, int queryR){

    if (queryL < 0 || queryL >= data.length ||
            queryR < 0 || queryR >= data.length || queryL > queryR){
        throw new IllegalArgumentException("Index is illegal.");
    }
    return query(0, 0, data.length - 1, queryL, queryR);
}

/**
 * 在以treeIndex为根的线段树中[l,r]的范围里,搜索区间[queryL,queryR]的值
 * @param treeIndex
 * @param l
 * @param r
 * @param queryL
 * @param queryR
 * @return
 */
private E query(int treeIndex, int l, int r, int queryL, int queryR){

    /**
     * 递归终止条件
     */
    if (l == queryL && r == queryR){
        return tree[treeIndex];
    }

    int mid = l + (r - l) / 2;
    int leftTreeIndex = leftChild(treeIndex);
    int rightTreeIndex = rightChild(treeIndex);

    /**
     * 查询区间只在左孩子或右孩子中的情况
     */
    if (queryL >= mid + 1){
        return query(rightTreeIndex, mid + 1, r, queryL, queryR);
    } else if (queryR <= mid){
        return query(leftTreeIndex, l, mid, queryL, queryR);
    }

    /**
     * 查询区间同时分布于左右孩子的情况
     */
    E leftResult = query(leftTreeIndex, l, mid, queryL, mid);
    E rightResult = query(rightTreeIndex, mid + 1, r, mid + 1, queryR);
    return merger.merge(leftResult, rightResult);
}

测试:

public class Main {

    public static void main(String[] args) {

        Integer[] nums = {-2, 0, 3, -5, 2, -1};
        SegmentTree<Integer> segmentTree = new SegmentTree<>(nums, (a, b) -> a + b);
        //System.out.println(segmentTree);
        System.out.println(segmentTree.query(0, 2));
    }
}

输出结果:

练习题(leetcode303)

303. 区域和检索 - 数组不可变

给定一个整数数组 nums,求出数组从索引 i 到 j (i ≤ j) 范围内元素的总和,包含 i, j 两点。

示例:

给定 nums = [-2, 0, 3, -5, 2, -1],求和函数为 sumRange()

sumRange(0, 2) -> 1
sumRange(2, 5) -> -1
sumRange(0, 5) -> -3

说明:

你可以假设数组不可变。 会多次调用 sumRange 方法。

思路:

这道题就是典型的不涉及更新的线段树区间求和,用我们上面已经实现的代码把merger接口定义为求和即可。

代码:

class NumArray {

        private interface Merger<E> {

            E merge(E a, E b);
        }

        private class SegmentTree<E> {

            /**
             * 把线段树看成满二叉树的表示
             */
            private E[] tree;
            private E[] data;
            /**
             * 用于定义线段树的两个区间是如何融合的
             */
            private Merger<E> merger;

            public SegmentTree(E[] arr, Merger<E> merger){

                this.merger = merger;

                data = (E[])new Object[arr.length];
                for (int i = 0; i < arr.length; i++){
                    data[i] = arr[i];
                }

                tree = (E[])new Object[4 * arr.length];
                buildSegmentTree(0, 0, data.length - 1);
            }

            /**
             * 在treeIndex的位置创建表示区间[l...r]的线段树
             * @param treeIndex
             * @param l
             * @param r
             */
            private void buildSegmentTree(int treeIndex, int l, int r){

                if (l == r){
                    tree[treeIndex] = data[l];
                    return;
                }

                int leftTreeIndex = leftChild(treeIndex);
                int rightTreeIndex = rightChild(treeIndex);

                /**
                 * 这样写避免l+r超出整型范围
                 */
                int mid = l + (r - l) / 2;
                /**
                 * 递归创建左右子树
                 */
                buildSegmentTree(leftTreeIndex, l, mid);
                buildSegmentTree(rightTreeIndex, mid + 1, r);

                tree[treeIndex] = merger.merge(tree[leftTreeIndex], tree[rightTreeIndex]);
            }

            public int getSize(){
                return data.length;
            }

            public E get(int index){
                if (index < 0 || index >= data.length){
                    throw new IllegalArgumentException("Index is illegal.");
                }
                return data[index];
            }

            /**
             * 返回左孩子节点索引
             * @param index
             * @return
             */
            private int leftChild(int index){
                return 2 * index + 1;
            }

            /**
             * 返回右孩子节点索引
             * @param index
             * @return
             */
            private int rightChild(int index){
                return 2 * index + 2;
            }

            /**
             * 返回区间[queryL, queryR]的值
             * @param queryL
             * @param queryR
             * @return
             */
            public E query(int queryL, int queryR){

                if (queryL < 0 || queryL >= data.length ||
                        queryR < 0 || queryR >= data.length || queryL > queryR){
                    throw new IllegalArgumentException("Index is illegal.");
                }
                return query(0, 0, data.length - 1, queryL, queryR);
            }

            /**
             * 在以treeIndex为根的线段树中[l,r]的范围里,搜索区间[queryL,queryR]的值
             * @param treeIndex
             * @param l
             * @param r
             * @param queryL
             * @param queryR
             * @return
             */
            private E query(int treeIndex, int l, int r, int queryL, int queryR){

                /**
                 * 递归终止条件
                 */
                if (l == queryL && r == queryR){
                    return tree[treeIndex];
                }

                int mid = l + (r - l) / 2;
                int leftTreeIndex = leftChild(treeIndex);
                int rightTreeIndex = rightChild(treeIndex);

                /**
                 * 查询区间只在左孩子或右孩子中的情况
                 */
                if (queryL >= mid + 1){
                    return query(rightTreeIndex, mid + 1, r, queryL, queryR);
                } else if (queryR <= mid){
                    return query(leftTreeIndex, l, mid, queryL, queryR);
                }

                /**
                 * 查询区间同时分布于左右孩子的情况
                 */
                E leftResult = query(leftTreeIndex, l, mid, queryL, mid);
                E rightResult = query(rightTreeIndex, mid + 1, r, mid + 1, queryR);
                return merger.merge(leftResult, rightResult);
            }
        }

        private SegmentTree<Integer> segmentTree;

        public NumArray(int[] nums) {

            if (nums.length > 0){
                Integer[] data = new Integer[nums.length];
                for (int i = 0; i < nums.length; i++){
                    data[i] = nums[i];
                }
                segmentTree = new SegmentTree<>(data, ((a, b) -> a + b));
            }
        }

        public int sumRange(int i, int j) {

            if(segmentTree == null){
                throw new IllegalArgumentException("");
            }
            return segmentTree.query(i, j);
        }
    }

Writtern by Autu.

2019.7.1