阅读 341

广度优先搜索算法(Breath-first Search)是如何搜索一张图的?

算法导论(MIT 6.006 第13讲)

什么是图搜索?

搜索可以理解为探索,给定一个图上的点S和A,需要找到从S到A的一个路径

图的基础概念

一个图用 G=(V,E) 表示,V是顶点的集合,E是边的集合。如下所示有两种图

  1. 无向图,V={a,b,c},E={{a,b},{b,c},{a,c}}

2. 有向图,V={a,b,c},E={(a,b),(b,a),(c,a),(b,c)}

实际应用有哪些?

网络爬虫、社交网络、网络包传播、垃圾回收算法等

如何用算法表示图?

使用邻接表。它是一个数组(Adj表示)大小是 |V|,每个元素是指向一个链表的指针,遍历的方法如下

for each vertex u in V
    Adj[u] stores u's neighbors 
复制代码

比如,上所述的有向图来说 Adj[a]={b},Adj[b]={a,c},对无向图来讲 Adj[a]={(a,c),(a,b)}

这种表现形式所需要的空间大小为 \Theta(V+E),|V|个顶点和|E|条边

广度优先算法是如何搜索一张图的?

目标:对于一个给定的节点S \inV,通过它来遍历它所能到达的所有节点
时间要求:O(V+E)
思路:查看给定节点,通过0步移动,能够到达的节点,这个节点就是s本身,然后从s移动一步,也就是s的邻接表,找到他能到达的节点,依次类推,需要避免重复

BFS(s,Adj):
    level={s:0} //第0步能到达的节点
    parent={s:None}
    i=1 //第0步就是s,已经到达,从第一步开始
    frontier=[s] //前一层已经经过的节点 level=i-1
    while frontier: //在已经经过的节点找它的相邻节点
        next=[] //当前层找到的节点
        for u in frontier:
            for v in Adj[u]:
                if  v not in level: //当前节点没有在其它层出现过,从而避免重复
                    level[v]=i 
                    parent[v]=u
                    next.append(v)
        frontier=next 
        i+=1 //走下一层
复制代码

以无向图为例

  1. 初始状态,处于第0层,i=0,s没有父节点,已经经过的节点只有s

2. 从s移动0步,s的相邻节点是a和x,他们没有在之前的level存在,所以需要添加到level中。执行完后

level={s:0,a:1,x:1}  
parent={s:None,a:s,x:s}  
frontier={a,s}  
i=2
复制代码

3. 以新的frontier为基础,再往前一步,发现a有z和s,但是s已经经历过了,不再添加,依次类推x。执行完之后

level={s:0,a:1,x:1,z:2,x:2}  
parent={s:None,a:s,x:s,z:a,d:x,c:x}  
frontier={z,d,c}  
i=3
复制代码

  1. 以新的frontier为基础,再往前一步,发现z的唯一邻接节点只有a,但是a已经在level 1中,不再添加。执行完之后
level={s:0,a:1,x:1,z:2,x:2,f:3,v:3}  
parent={s:None,a:s,x:s,z:a,d:x,c:x,f:d,v:c} frontier优先存的是d  
frontier={f,v}  
i=4
复制代码

5. 以新的frontier为基础,再往前一步,发现f,v的邻接节点都已经计算过,不再计入,因此最后

frointer={}  
i=5
复制代码

至此结束

耗时分析

BFS所做的策略是先找到每一层的节点,再去找它的邻接表,耗时可以从两部分来看,1个是必须遍历所有节点,为V,另外每一层遍历的边的数量为 \sumv\inV|Adj[v]|,即每个顶点的边的个数,对于有向图来讲是E,无向图就是2E,这样总的时间就是 \theta(V+E)

优点

  1. 当想知道某个节点到原点s的最短路径时,可以直接从level上获取,并且parent提供的指针就是这条路径
  2. 能直接感知到从s能否到达某个节点t