最短路径算法:Bellman-ford算法

2,055 阅读4分钟

最短路径问题

在图结构中,求解最短路径问题有多种算法,Bellman-Ford是其中之一,它可以处理含有负权边的情况,同样是单源最短路径算法,而之前讲到的Dijkstra算法不能处理含有负权边的情况。对应的代价就是其算法时间复杂度要高一些。后面我们会分析。

这里能处理负权边是针对有向图的,因为对无向图来说,含有负权边就意味着含有负权回路,在有负权回路的这种情况下求最短路径是无解的,因为每经过一次负权回路,距离都会减少,就会无限循环下去。

在继续往下讲之前,先补充一个图最短路径的一个性质:最短路径的子路径也是最短路径,数学描述如下:有向图G=(V,E),设p=(v_0,v_1,...,v_k)为从点v_0到点v_k的一条最短路径,且0≤i≤j≤k,设p_{ij}=(v_i,v_{i+1},...,v_j)为路径p中从点v_i到点v_j的子路径,那么p_{ij}也是这两点之间的一条最短路径。可用反证法来证明:

证明:如果将路径p分解为v_0-v_i-v_j-vk,则有w(p)=w(p_{0i})+w(p_{ij})+w(p_{jk})。假设存在一条从v_iv_j的一条更短的路径p_{ij}'w(p_{ij}'<w(p_ij))。则新路径权值为w(p_{0i})+w(p_{ij}')+w(p_{jk}) < w(p),这与p是最短路径相矛盾。

Bellman-Ford算法

与Dijkstra算法类似,Bellman-Ford算法也是通过不断的“松弛”操作来求得最终解。“松弛”就是如下的操作过程:w(u,v)表示uv之间的权值,d[v]表示从源点s到顶点v的距离,若存在边e(u,v),使得:d[v] > d[u] + w(u,v)(即发现了优于当前的路径),则更新d[v] = d[u] + w(u,v),并更新路径prev[v] = u。可以看到每一次“松弛”都会更逼近最优解。Dijkstra算法通过优先队列每次选择当前未被处理过的距离最小的顶点,对该顶点未被处理过的边进行松弛。而Bellman-Ford算法则简单的松弛所有的边,反复执行|V|-1次(|V|为顶点的的个数),时间复杂度O(|V||E|)。可以看出,Bellman-Ford松弛的次数远多于Dijkstra,所以其时间复杂度相比Dijkstra要高。

伪代码如下:

function BellmanFord(list vertices, list edges, vertex source)
    // step 1 初始化, dist[v]表示源节点到顶点v的距离值,prev[v]表示顶点v的前驱顶点
    for each vertex v in vertices
        dist[v] = inf
        prev[v] = null

    dist[source] = 0

    // step 2 迭代松弛|V|-1次
    for i from 1 to size(vertices) -1 
        for each edge(u,v) with weight(u,v)  in edges
            if dist[u] + weight(u,v) < dist[v]
                dist[v] = dist[u] + weight(u,v)
                prev[v] = u
    
    // step 3 检查是否有负权回路
    for each edge(u,v) with weight(u,v) in edges
        if dist[u] + weight(u,v) < dist[v]
            error "检测到负权回路"

    return dist[], prev[]

对算法的优化: 在实际应用中,Bellman-Ford算法其实不用迭代松弛|V|-1次,理论上图中存在的最大的路径长度为|V|-1,实际上往往要小于这个|V|-1,即,在|V|-1次迭代松弛之前就已经收敛了,计算出最短路径了,所以可在循环中设置判定,在某次循环中不再进行松弛时,表明当前已收敛,可退出步骤2,进行下一步检查是否有负权回路。

怎么理解这个算法呢? 假设某顶点与源顶点没有连通,即没有边,那么这个点就不会被松弛,距离不会被更新,依旧为无穷大。如果顶点与源顶点是连通的,在不存在负权回路的情况下,一定存在一条最短路径,这条最短路径p=(v_0,v_1,...,v_k)为源点sv之间的任意一条最短路径(这里v_0=sv_k=v)。最大会有多少条边呢?假设图有|V|个顶点,那么有k≤|V|-1。在进行第一轮松弛时,被松弛的边中一定会包含边(v_0,v_1),结合文章开头讲到的最短路径的子路径也一定是最短路径的性质,v_1已经得到了其最短路径,在第二轮松弛过程中,被松弛的边中一定会包含边(v_1,v_2),经过此次松弛后,v_2也已经得到了其最短路径。以此类推,在第k轮松弛中,被松弛的边中一定包含了边(v_{k-1},v_k),之后v_k也得到其最短路径。也就是说,凡是与源顶点最短路径经过的边数为k的顶点,在第k轮松弛时一定会被确认(最短路径被找到)。所以,我们需要松弛多少轮呢,最多|V|-1次就可以了。

算法的数学证明可以参考《图论》或《算法导论》中的证明过程。

代码实现见bellman_ford.cpp。最后再分析一下时间复杂度,最坏的情况O(|V||E|),这个比较好理解,最好的情况O(|E|),一次松弛所有边的操作就可以了,对应的就是边松弛的顺序恰好是最短路径树的生成顺序。

算法的应用

其中一个应用就是路由协议了(距离向量协议),对此实现了一个路由协议测试工程,代码见router。实现了一个通过路由表的方式进行的路由算法。


最后,欢迎关注微信公众号:一日思考,一起学习与进步。