Python 笔记 - 从迭代器、生成器到协程(一)

1,420 阅读5分钟
原文链接: www.jianshu.com

最近看了一篇老的教程,结合最近开始使用的python3,简单介绍一下python中协程的用法,本文中实例的代码都是在python3.5中可以运行的。

协程的内容受以下教程的启发较大:

dabeaz.com/coroutines/

1、迭代器(Iterator)VS. 生成器(Generator)?

这两个概念相关性很大,简单来说:

  • 迭代器就是实现了__next__和__iter__方法的对象,这个对象可以被迭代
  • 生成器是用函数+yield的方式实现迭代协议的一种语法,它看似函数、但却不是普通的函数,而且生成器不仅能实现迭代、还能实现协程的功能。

先看一个手动定义一个迭代器的例子:

#定义一个迭代器类
from random import randint

class Iter(object):
    def __init__(self,n):
        #初始化时确定迭代器的最大迭代次数
        self.n = n
        self.i= 0

    def __iter__(self):
        return self

    def __next__(self):
        if self.i < self.n:
            self.i = self.i+1
            #每次迭代都返回一个100以内的随机数
            return randint(0,100)
        else:
            #迭代器中总需要返回一个StopIteration的异常退出迭代
            raise StopIteration

if __name__ == '__main__':
    #实例化一个迭代器对象
    c=Iter(10)
    for x in c:
    print(x)
    #还有一种迭代方法
    print('\n')
    d=Iter(20)
    print(d.__next__())
    print(d.__next__())
    print(d.__next__())
输出如下:
44
54
65
22
83
30
86
87
75
46


100
9
1

实现的同样的迭代逻辑,来看看生成器的代码的写法:

#定义一个生成器
from random import randint
def Gen(n):
    i=0 
    while (i < n): 
        i=i+1
        yield randint(0,100)

if __name__ == '__main__':
    c=Gen(10)
    for x in c:
        print (x)

从上面的代码可以看出,实现相同的逻辑,定义一个生成器远比写一个迭代器简单。迭代器是写一个类,生成器是定义一个函数。

对比一下上面两个例子的迭代器的对象和生成器函数的返回是不一样的,但是,他们都实现了同一个功能

  1. 一个可迭代的对象<sample1.Iter object at 0x7f855b64aa58>
  2. 一个生成器对象<generator object Gen at 0x7f855b647f68>

2、生成器的yield语法糖

yield是一个很有意思的语法糖,如果在一个函数中有yield,那么这个函数就不再是一个函数了,它将返回一个生成器对象。

2.1生成器的执行顺序

生成器的执行顺序:

  1. 在调用__next__()或者进入for循环之后,函数执行到yield就返回一个值,然后函数暂停。
  2. 在下次调用__next__()之后,生成器开始执行yield之后的语句。

例子:

def Gen(n):
    i=0
    while (i<n):
        yield i
        i=i+1
        yield 'step1'
        yield 'step2' 
#Gen(5)得到一个生成器对象        
c=Gen(5)
#执行结果
c.__next__()
>>0
c.__next__()
>>'step1'
c.__next__()
>>'step2'
c.__next__()
>>1
c.__next__()
>>'step1'
c.__next__()
>>'step2'
c.__next__()
>>2

2.2生成器对象的成员函数

在2.1的最后一个例子里面,如果查看生成器的帮助文档help(c),可以看到生成器对象有几个比较重要的成员函数:

  1. __next__()和__iter__():有这两个函数,生成器就具有了可迭代性
  2. send():这个函数很有用,可以用来给生成器函数传递一个新的值
  3. close():关闭这个生成器,关闭之后生成器就不可再调用
  4. throw():给生成器传入一个异常
2.2.1 send()

例子:

#send函数的用法
from random import randint

def Gen(n):
    i=0 
    while (i<n):
        i=i+1
        #yeild语句,在重新开始执行的时候可以获得一个值,这个值就是由send函数输入的
        res = yield randint(0,100)
        if res=='stop':
            print ('forced stop')
            break
if __name__=='__main__':
    #初始化一个生成器对象
    c=Gen(10)
    print (c.__next__())
    print (c.__next__())
    #传入‘start’字符串,
    print (c.send('start'))
    #传入‘stop’字符串,生成器跳出while循环
    print (c.send('stop'))
    #继续迭代生成器将报错
    print (c.__next__())

执行结果:
95
77
49
forced stop
Traceback (most recent call last):
  File "sample3.py", line 17, in <module>
    print (c.send('stop'))
StopIteration

从执行结果来看,

  • 调用前两个next和第三个send函数,生成器都会yield出结果。
  • 第四次调用send函数之后,也开始了迭代,不过由于退出了while循环,没有再一次回到yield,所以最终的结果里面只有三个数字
  • 最后一次调用next函数,出现报错,因为生成器已经关闭。
2.2.2 close()

例子:

#close函数的用法
from random import randint

def Gen(n):
    i=0 
    while (i<n):
        i=i+1
        yield randint(0,100)

if __name__=='__main__':
    c=Gen(10)
    print (c.__next__())
    print (c.__next__())
    #close生成器之后,再调用next将报错
    c.close()
    print (c.__next__())

执行结果:
81
65
Traceback (most recent call last):
  File "sample4.py", line 15, in <module>
    print (c.__next__())
StopIteration

close函数的用法就是关闭生成器对象,其实调用send或者next函数都会‘open’这个生成器,期间生成器都会记录执行的中间结果,直到生成器被关闭为止

2.2.3 throw()

例子:

#throw函数的用法
from random import randint

def Gen(n):
    i=0 
    while (i<n):
        i=i+1
        try:
            res = yield randint(0,100)
        except IOError:
            print ('get the IO Error')

if __name__=='__main__':
    c=Gen(10)
    print (c.__next__())
    #给生成器扔进去一个异常    
    c.throw(IOError)
    print (c.__next__())

执行结果:
39
get the IO Error
19

可以看到生成器内部成功的捕获并处理了这个异常,并且没有阻断生成器后面的执行流程