图解:有向环、拓扑排序与Kosaraju算法

·  阅读 3292
图解:有向环、拓扑排序与Kosaraju算法

图算法第三篇 图解:有向环、拓扑排序与Kosaraju算法

首先来看一下今天的内容大纲,内容非常多,主要是对算法思路与来源的讲解,图文并茂,希望对你有帮助~

1.有向图的概念和表示

概念

有向图与上一篇文章中的无向图相对,边是有方向的,每条边所连接的两个顶点都是一个有序对,它们的邻接性都是单向的。

一幅有方向的图(或有向图)是由一组顶点和一组有方向的边组成的,每条有方向的边都连接着一对有序的顶点。

其实在有向图的定义这里,我们没有很多要说明的,因为大家会觉得这种定义都是很自然的,但是我们要始终记得有方向这件事!

数据表示

我们依然使用邻接表存储有向图,其中v-->w表示为顶点v的邻接链表中包含一个顶点w。注意因为方向性,这里每条边只出现一次!

我们来看一下有向图的数据结构如何实现,下面给出了一份Digraph类(Directed Graph)

package Graph.Digraph;
import java.util.LinkedList;

public class Digraph{
    private final int V;//顶点数目
    private int E;//边的数目
    private LinkedList<Integer> adj[];//邻接表

    public Digraph(int V){
        //创建邻接表
        //将所有链表初始化为空
        this.V=V;this.E=0;
        adj=new LinkedList[V];
        for(int v=0;v<V;++v){
            adj[v]=new LinkedList<>();
        }
    }

    public int V(){ return V;}//获取顶点数目
    public int E(){ return E;}//获取边的数目

    //注意,只有这里与无向图不同
    public void addEdge(int v,int w){
        adj[v].add(w);//将w添加到v的链表中
        E++;
    }

    public Iterable<Integer> adj(int v){
        return adj[v];
    }

    //获取有向图的取反
    public Digraph reverse(){
        Digraph R=new Digraph(V);
        for(int v=0;v<V;v++){
            for(int w:adj(V))
                R.addEdge(w, v);//改变加入的顺序
        }
        return R;
    }
}
复制代码

如果你已经掌握了无向图的数据表示,你会发现有向图只是改了个名字而已,只有两处需要注意的地方:addEdge(v,w)方法reverse()方法。在添加一条边时因为有了方向,我们只需要在邻接表中增加一次;reverse()方法能够返回一幅图的取反(即每个方向都颠倒过来),它会在以后的应用中发挥作用,现在我们只要有个印象就行。

2.有向图的可达性

在无向图(上一篇文章)中,我们使用深度优先搜索可以找到一条路径,使用广度优先搜索可以找到两点间的最短路径。仔细想一下,它们是否对有向图适用呢?是的,同样的代码就可以完成这个任务,我们不需要做任何的改动(除了Graph换成Digraph)

因为这些内容在上篇文章中都已经详细介绍过,所以就不展开了,有兴趣的话可以翻一下上篇文章,有详细的图示讲解。

3.环和有向无环图

我们在实际生活中可能会面临这样一个问题:优先级限制下的调度问题。说人话就是你需要做一些事情,比如A,B,C,但是做这三件事情有一定的顺序限制,做B之前必须完成A,做C之前必须完成B…………你的任务就是给出一个解决方案(如何安排各种事情的顺序),使得限制都不冲突。

如上图,第一种和第二种情况都比较好办,但是第三种?是不是哪里出了问题!!!

对于上面的调度问题,我们可以通过有向图来抽象,顶点表示任务,箭头的方向表示优先级。不难发现,只要有向图中存在有向环,任务调度问题就不可能实现!所以,我们下面要解决两个问题:

  • 如何检测有向环(只检查存在性,不考虑有多少个)
  • 对于一个不存在有向环的有向图,如何排序找到解决方案(任务调度问题)

1.寻找有向环

我们的解决方案是采用深度优先搜索。因为由系统维护的递归调用栈表示的正是“当前”正在遍历的有向路径。一旦我们找到了一条有向边v-->w,并且w已经存在于栈中,就找到了一个环。因为栈表示的是一条由w指向v的有向路径,而v-->w正好补全了这个环。同时,如果没有找到这样的边,则意味着这幅有向边是无环的。

我们所使用的数据结构:

  • 基本的dfs算法
  • 新增一个onStack[]数组用来显式地记录栈上的顶点(即一个顶点是否在栈上)

我们还是以一个具体的过程为例讲解

具体的代码我想已经难不倒你了,我们一起来看看吧

package Graph.Digraph;

import java.util.Stack;

public class DirectedCycle {
    private boolean [] marked;
    private int [] edgeTo;
    private Stack<Integer> cycle;//有向环中的所有顶点(如果存在)
    private boolean[] onStack; //递归调用的栈上的所有顶点

    public DirectedCycle(Digraph G){
        onStack=new boolean[G.V()];
        edgeTo=new int[G.V()];
        marked=new boolean[G.V()];
        
        for(int v=0;v<G.V();v++){
            if(!marked[v]) dfs(G,v);
        }
    }

    private void dfs(Digraph G,int v){
        onStack[v]=true;//进入dfs时,顶点v入栈
        marked[v]=true;
        for(int w:G.adj(v)){
            if(this.hasCycle()) return;
            else if(!marked[w]){
                edgeTo[w]=v;dfs(G,w);
            }
            else if(onStack[w]){
                //重点
                cycle=new Stack<Integer>();
                for(int x=v;x!=w;x=edgeTo[x])
                    cycle.push(x);

                cycle.push(w);
                cycle.push(v);
            }
        }
        //退出dfs时,将顶点v出栈
        onStack[v]=false;
    }

    public boolean hasCycle(){
        return cycle!=null;
    }

    public Iterable<Integer> cycle(){
        return cycle;
    }
}
复制代码

该类为标准的递归 dfs() 方法添加了一个布尔类型的数组 onStack[] 来保存递归调用期间栈上的 所有顶点。当它找到一条边 v → ww 在栈中时,它就找到了一个有向环。环上的所有顶点可以通过 edgeTo[] 中的链接得到。

在执行 dfs(G,v) 时,查找的是一条由起点到 v 的有向路径。要保存这条路径, DirectedCycle维护了一个由顶点索引的数组 onStack[],以标记递归调用的栈上的所有顶点(在调用 dfs(G,v) 时将 onStack[v] 设为 True,在调用结束时将其设为 false)。DirectedCycle 同时也 使用了一个 edgeTo[] 数组,在找到有向环时返回环中的所有顶点,

2.拓扑排序

如何解决优先级限制下的调度问题?其实这就是拓扑排序

拓扑排序的定义:给定一幅有向图,将所有的顶点排序,使得所有的有向边均从排在前面的元素指向排在后面的元素(或者说明无法做到这一点)

下面是一个典型的例子(排课问题)

它还有一些其他的典型应用,比如:

现在,准备工作已经差不多了,请集中注意力,这里的思想可能不是很好理解。紧跟我的思路。

现在首先假设我们有一副有向无环图,确保我们可以进行拓扑排序;通过拓扑排序,我们最终希望得到一组顶点的先后关系,排在前面的元素指向排在后面的元素,也就是对于任意的一条边v——>w,我们得到的结果应该保证顶点v顶点w前面;

我们使用dfs解决这个问题,在调用dfs(v),以下三种情况必有其一:

  • dfs(w)已经被调用过且已经返回了(此时w已经被标记)
  • dfs(w)已经被调用过且还没有返回(仔细想想这种情况,这是不可能存在的)
  • dfs(w)还没有被调用(w还没有被标记),此时情况并不复杂,接下来会调用dfs(w),然后返回dfs(w),然后调用dfs(v)

简而言之,我们可以得到一个很重要的结论:dfs(w)始终会在dfs(v)之前完成。 换句话说,先完成dfs的顶点排在后面

请确保你完全理解了上面的思想,接下来其实就相对容易了。我们创建一个栈,每当一个顶点dfs完成时,就将这个顶点压入栈。 最后,出栈就是我们需要的顺序


其实到这里拓扑排序基本上就已经被我们解决了,不过这里我们拓展一下,给出一些常见的排序方式,其中我们刚才说到的其实叫做逆后序排序。它们都是基于dfs

  • 前序:在递归调用之前将顶点加入队列
  • 后序:在递归调用之后将顶点加入队列
  • 逆后序:在递归调用之后将顶点压入栈

我们在这里一并实现这三个排序方法,在递归中它们表现得十分简单

package Graph.Digraph;

import java.util.ArrayList;
import java.util.LinkedList;
import java.util.Queue;
import java.util.Stack;

public class DepthFirstOrder {

    private boolean [] marked;
    private Queue<Integer> pre;//所有顶点的前序排列
    private Queue<Integer> post;//所有顶点的后序排列
    private Stack<Integer> reversePost;//所有顶点的逆后序排列

    public DepthFirstOrder(Digraph G){
        pre=new LinkedList<>();
        post=new LinkedList<>();
        reversePost = new Stack<>();

        marked=new boolean[G.V()];

        for(int v=0;v<G.V();v++){
            if(!marked[v]) dfs(G,v);
        }
    }

    private void dfs(Digraph G,int v){
        pre.offer(v);

        marked[v]=true;
        for(int w:G.adj(v))
            if(!marked[w])
                dfs(G, w);
        post.offer(v);
        reversePost.push(v);
    }

    //这里可以不用管
    public Iterable<Integer> pre()  
    {  return pre;  } 
   public Iterable<Integer> post() 
   {  return post;  } 
   public Iterable<Integer> reversePost() 
   {  return reversePost;  }
}
复制代码

恭喜你,到这儿我们已经完全可以实现拓扑排序,下面的Topological类实现了这个功能。在给定的有向图包含环的时候,order()方法返回null,否则会返回一个能够给出拓扑有序的所有顶点的迭代器(当然,你也可以很简单的将排序顶点打印出来)。具体的代码如下:

package Graph.Digraph;

public class Topological {

    private Iterable<Integer> order;//顶点的拓扑顺序

    public Topological(Digraph G){
        //判断给定的图G是否有环
        DirectedCycle cyclefinder=new DirectedCycle(G);
        if(!cyclefinder.hasCycle()){
            DepthFirstOrder dfs=new DepthFirstOrder(G);
            order = dfs.reversePost();
        }
    }

    public Iterable<Integer> order(){
        return order;
    }

    //判断图G是不是有向无环图
    public boolean isDAG(){
        return order!=null;
    }
    
}
复制代码

到这儿,有向环的检测与拓扑排序的内容就结束了,接下来我们要考虑有向图的强连通性问题

4.强连通分量

1.强连通的定义

回想一下我们在无向图的时候,当时我们就利用深度优先搜索解决了一幅无向图的连通问题。根据深搜能够到达所有连通的顶点,我们很容易解决这个问题。但是,问题变成有向图,就没有那么简单了!下面分别是无向图和有向图的两个例子:

无向图的各连通分量

定义。如果两个顶点vw是互相可达的,则称它们为强连通的。也就是说,既存在一条从vw的有向路径,也存在一条从wv的有向路径。如果一幅有向图中的任意两个顶点都是强 连通的,则称这幅有向图也是强连通的。

以下是另一些强连通的例子:

强连通的有向图

2.强连通分量

在有向图中,强连通性其实是顶点之间的一种等价关系,因为它有以下性质

  • 自反性:任意顶点 v 和自己都是强连通的
  • 对称性:如果 v 和 w 是强连通的,那么 w 和 v 也是强连通的
  • 传递性:如果 v 和 w 是强连通的且 w 和 x 也是强连通的,那 么 v 和 x 也是强连通的

因为等价,所以和无向图一样,我们可以将一幅图分为若干个强连通分量,每一个强连通分量中的所有顶点都是强连通的。这样的话,任意给定两个顶点判断它们之间的强连通关系,我们就直接判断它们是否在同一个强连通分量中就可以了!

有向图的强连通分量

接下来,我们需要设计一种算法来实现我们的目标————将一幅图分为若干个强连通分量。我们先来总结一下我们的目标:


3.Kosaraju算法

Kosaraju算法就是一种经典的解决强连通性问题的算法,它实现很简单,但是不好理解why,希望你打起精神,我希望我能够把它讲明白(也只是希望,我会尽量,如果不清楚的话,强烈建议结合算法4一起食用)


回忆一下我们之前在无向图的部分如何解决连通性问题的,一次dfs能够恰好遍历一个连通分量,所以我们可以通过dfs来计数,获取每个顶点的id[];所以,我们在解决有向图的强连通性问题时,也希望能够利用一次dfs能够恰好遍历一个连通分量的性质;不过,在有向图中,它失效了,来看一下图一:

图一

在图一中,dfs遍历会存在两种情况:

第一种情况:如果dfs的起点时顶点A,那么一次dfs遍历会遍历整个区域一和区域二,但是区域一与区域二并不是强连通的,这就是有向图给我们带来的困难!

第二种情况:如果dfs的起点是顶点D,则第一次dfs会遍历区域二,第二次dfs会遍历区域一,这不就是我们想要的吗?

所以,第二个情况给了我们一个努力的方向!也就是如果我们人为地,将所有的可能的情况都变成第二种情况,事情不就解决了!

有了方向,那么接下来,我们来看一幅真实的有向图案例,如图二所示,这是一幅有向图,它的各个强连通分量在图中用灰色标记;我们的操作是将每个强连通分量看成一个顶点(比较大而已),那么会产生什么后果呢?我们的原始的有向图就会变成一个有向无环图!

图二

ps:想一想为什么不能存在环呢?因为前提我们把所有的强连通分量看成了一个个顶点,如果顶点A顶点B之间存在环,那AB就会构成一个更大的强连通分量!它们本应属于一个顶点!

在得到一幅有向无环图(DAG)之后,事情没有那么复杂了。现在,我们再回想一下我们的目的————在图一中,我们希望区域二先进行dfs,也就是箭头指向的区域先进行dfs。在将一个个区域抽象成点后,问题归结于在一幅有向无环图中,我们要找到一种顺序,这种顺序的规则是箭头指向的顶点排在前

到这儿,我们稍微好好想想,我们的任务就是找到一种进行dfs的顺序,这种顺序,是不是和我们在前面讲到的某种排序十分相似呢?我想你已经不难想到了,就是拓扑排序!但是和拓扑排序是完全相反的。

我们把箭头理解为优先级,对于顶点A指向顶点B,则A的优先级高于B。那么对于拓扑排序,优先级高者在前;对于我们的任务,优先级低者在前(我们想要的结果就是dfs不会从优先级低的地方跑到优先级高的地方)

对于图二:我们想要的结果如图三所示:

如果我们从顶点1开始进行dfs,依次向右,那么永远不会发生我们不希望的情况!因为箭头是单向的!

我想,到这儿,你应该差不多理解我的意思了。我们还有最后一个小问题————如何获取拓扑排序的反序?

其实解决方法很简单:对于一个有向图G,我们先取反(reverse方法),将图G的所有边的顺序颠倒,然后获取取反后的图的逆后序排序(我们不能称为拓扑排序,因为真实情况是有环的);最后,我们利用刚才获得的顶点顺序对原图G进行dfs即可,这时它的原理与上一篇文章无向图的完全一致!

最后,总结一下Kosaraju算法的实现步骤:

  • 1.在给定的一幅有向图 G 中,使用 DepthFirstOrder 来计算它的反向图 GR 的逆后序排列。
  • 2.在 G 中进行标准的深度优先搜索,但是要按照刚才计算得到的顺序而非标准的顺序来访问 所有未被标记的顶点。

具体的实现代码只在无向图的实现CC类中增加了两行代码(改变dfs的顺序)

package Graph.Digraph;

public class KosarajuSCC 
{ 
   private boolean[] marked;   // 已访问过的顶点 
   private int[] id;           // 强连通分量的标识符 
   private int count;          // 强连通分量的数量
   public KosarajuSCC(Digraph G) 
   { 
      marked = new boolean[G.V()]; 
      id = new int[G.V()]; 
      DepthFirstOrder order = new DepthFirstOrder(G.reverse()); //重点
      for (int s : order.reversePost()) //重点
         if (!marked[s]) 
         {  dfs(G, s); count++;  }
    }
   private void dfs(Digraph G, int v) 
   { 
      marked[v] = true; 
      id[v] = count; 
      for (int w : G.adj(v)) 
         if (!marked[w]) 
             dfs(G, w); 
   }
   public boolean stronglyConnected(int v, int w) 
   {  return id[v] == id[w];  }
   public int id(int v) 
   {  return id[v];  }
   public int count()
   { return count;}
}
复制代码

最后,附上一幅具体的操作过程:

有了Kosaraju算法,我们很容易能够判断

  • 给定的两个顶点的连通性(上文代码stronglyConnected)
  • 该图中有多少个强连通分量(上文代码count)

后记

好了,关于有向图的内容就到这里了,我希望通过这篇文章你能够彻底理解这三种算法!,下一篇文章小超与你不见不散!

最后送你一幅图算法的思维导图

后台回复【图算法】可获得xmind格式,我只想说:真的好多内容!😥

码字绘图不易,如果觉得本文对你有帮助,关注作者就是最大的支持!顺手点个在看更感激不尽!

欢迎大家关注我的公众号:小超说 ,之后我会继续创作算法与数据结构以及计算机基础知识的文章。也可以加我微信chao_hey(备注:职业-城市) ,我们一起交流,一起进步!

本文参考:《算法》(第四版)

分类:
后端
标签:
收藏成功!
已添加到「」, 点击更改