【重学算法】拓扑排序

344 阅读2分钟

拓扑排序本身就是基于有向无环图的一个算法,使用拓扑排序可以解决编译依赖问题,然而不能解决存在环像 a->b->c->a 这样的循环依赖问题。

  1. Kahn

先从图中找出一个入度为 0 的顶点,将其输出到拓扑排序的结果序列中(对应代码中就是把它打印出来),并且把这个顶点从图中删除(也就是把这个顶点可达的顶点的入度都减 1)。我们循环执行上面的过程,直到所有的顶点都被输出。最后输出的序列,就是满足局部依赖关系的拓扑排序。

使用Kahn算法实现拓扑排序的Java代码实现:

public void topoSortByKahn() {

  int[] inDegree = new int[v]; // 统计每个顶点的入度

  for (int i = 0; i < v; ++i) {

    for (int j = 0; j < adj[i].size(); ++j) {

      int w = adj[i].get(j); // i->w

      inDegree[w]++;

    }

  }

  LinkedList queue = new LinkedList<>();

  for (int i = 0; i < v; ++i) {

    if (inDegree[i] == 0) queue.add(i);

  }

  while (!queue.isEmpty()) {

    int i = queue.remove();

    System.out.print("->" + i);

    for (int j = 0; j < adj[i].size(); ++j) {

      int k = adj[i].get(j);

      inDegree[k]--;

      if (inDegree[k] == 0) queue.add(k);

    }

  }

}  

2. DFS

拓扑排序也可以用深度优先遍历来实现。

首先是通过邻接表构造逆邻接表。邻接表中,边 s->t 表示 s 先于 t 执行,也就是 t 要依赖 s。在逆邻接表中,边 s->t 表示 s 依赖于 t,s 后于 t 执行。其次,递归处理每个顶点,对于顶点 vertex 来说,我们先输出它可达的所有顶点,也就是说,先把它依赖的所有的顶点输出了,然后再输出自己。

使用DFS实现拓扑排序的Java代码实现:

public void topoSortByDFS() {

  // 先构建逆邻接表,边s->t表示,s依赖于t,t先于s

  LinkedList inverseAdj[] = new LinkedList[v];

  for (int i = 0; i < v; ++i) { // 申请空间

    inverseAdj[i] = new LinkedList<>();

  }

  for (int i = 0; i < v; ++i) {

    for (int j = 0; j < adj[i].size(); ++j) {

      int w = adj[i].get(j);

      inverseAdj[w].add(i);

    }

  }

  boolean[] visited = new boolean[v];

  for (int i = 0; i < v; ++i) {

    if (visited[i] == false) {

      visited[i] = true;

      dfs(i, inverseAdj, visited);

    }

  }

}

private void dfs(

    int vertex, LinkedList inverseAdj[], boolean[] visited) {

    for (int i = 0; i < inverseAdj[vertex].size(); ++i) {

      int w = inverseAdj[vertex].get(i);

      if (visited[w] == true) continue;

      visited[w] = true;

      dfs(w, inverseAdj, visited);

    }

    System.out.print("->" + vertex);

}  

  1. 时间复杂度分析

从 Kahn 代码中可以看出来,每个顶点被访问了一次,每个边也都被访问了一次,所以,Kahn 算法的时间复杂度就是 O(V+E)(V 表示顶点个数,E 表示边的个数)。DFS 算法的时间复杂度我们之前分析过。每个顶点被访问两次,每条边都被访问一次,所以时间复杂度也是 O(V+E)。