【Python高级语法】——生成器(generator)

128 阅读6分钟

携手创作,共同成长!这是我参与「掘金日新计划 · 8 月更文挑战」的第15天,点击查看活动详情

生成器generator

在这里插入图片描述

1.引出生成器

  通过列表⽣成式,我们可以直接创建⼀个列表。但是,受到内存限制,列表容量肯定是有限的。⽽且,创建⼀个包含非常多个元素的列表,不仅占⽤很⼤的存储空间,如果我们仅仅需要访问前⾯⼏个元素,那后⾯绝⼤多数元素占⽤的空间都⽩⽩浪费了。

# -*- coding: utf-8 -*-
# @File  : 引出生成器.py
# @author: Flyme awei 
# @email : Flymeawei@163.com
# @Time  : 2022/8/20 21:00

# 列表生成式
lst = [i for i in range(10)]
print(lst)
print(type(lst))

# [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
# <class 'list'>

  所以,如果列表元素可以按照某种算法推算出来,那我们是否可以在循环的过程中不断推算出后续的元素呢?接下来,引出我们的生成器


2.创建生成器

  • 通过列表生成式创建
# -*- coding: utf-8 -*-
# @File  : 创建生成器.py
# @author: Flyme awei 
# @email : Flymeawei@163.com
# @Time  : 2022/8/20 20:59

g = (i for i in range(10))
print(g)
print(type(g))

# <generator object <genexpr> at 0x0000021B19A11D60>
# <class 'generator'>

  这样就不必创建完整的list,从⽽节省⼤量的空间。在Python中,这种⼀边循环⼀边计算的机制,称为⽣成器:generator

  创建列表生成器的区别仅在于最外层的 [ ]( )lst 是⼀个列表,⽽ g 是⼀个⽣成器。我们可以直接打印出 lst 的每⼀个元素,但我们怎么打印出 g 的每⼀个元素呢?如果要⼀个⼀个打印出来,可以通过 next() 函数获得⽣成器的下⼀个返回值:

  • 通过 next() 函数获得⽣成器的下⼀个返回值
# -*- coding: utf-8 -*-
# @File  : 创建生成器.py
# @author: Flyme awei 
# @email : Flymeawei@163.com
# @Time  : 2022/8/20 20:59

lst = [i for i in range(10)]
g = (i for i in range(10))
print(g)
print(type(g))


print(next(g))  # 0
print(next(g))  # 1
print(next(g))  # 2
print(next(g))  # 3
print(next(g))  # 4
print(next(g))  # 5
print(next(g))  # 6
print(next(g))  # 7
print(next(g))  # 8
print(next(g))  # 9
print(next(g)) 

在这里插入图片描述

  ⽣成器保存的是算法,每次调⽤ next(g) ,就计算出 g 的下⼀个元素的值,直到计算到最后⼀个元素,没有更多的 元素时,抛出 StopIteration 的异常。

  当然,这种不断调⽤ next() 实在是太繁琐了,虽然是点一次出现一次,但正 确的⽅法是使⽤ for 循环,因为⽣成器也是可迭代对象。

  • 也可以通过for-in循环打印出来
# -*- coding: utf-8 -*-
# @File  : 创建生成器.py
# @author: Flyme awei 
# @email : Flymeawei@163.com
# @Time  : 2022/8/20 20:59

g = (i for i in range(10))
print(g)
print(type(g))


# print(next(g))  # 0
# print(next(g))  # 1
# print(next(g))  # 2
# print(next(g))  # 3
# print(next(g))  # 4
# print(next(g))  # 5
# print(next(g))  # 6
# print(next(g))  # 7
# print(next(g))  # 8
# print(next(g))  # 9
# print(next(g))

for i in g:
    print(i)

在这里插入图片描述

  所以,我们创建了⼀个⽣成器后,基本上永远不会调⽤ next() ,⽽是通过 for 循环来迭代它,并且不需要关心StopIteration 异常。

  generator非常强大。如果推算的算法比较复杂,用类似列表生成式的 for 循环无法实 现的时候,还可以用函数来实现。比如,著名的斐波拉契数列Fibonacci,除第一个和第二个数外,任意一个 数都可由前两个数相加得到:1, 1, 2, 3, 5, 8, 13, 21, 34, ...

  斐波拉契数列用列表生成式写不出来,但是,用函数把它打印出来却很容易:

代码如下

# -*- coding: utf-8 -*-
# @File  : 函数写斐波那契数列.py
# @author: Flyme awei 
# @email : Flymeawei@163.com
# @Time  : 2022/8/20 21:14


# 定义一个斐波那契函数
def fib(times):
    # 初始化
    n = 0
    a, b = 0, 1
    while n < times:
        print(b)
        a, b = b, a+b
        n += 1


fib(6)

在这里插入图片描述

  仔细观察,可以看出,fib函数实际上是定义了斐波拉契数列的推算规则,可以从第一个元素开始,推算出后续任意的元素,这种逻辑其实非常类似generator

  也就是说,上面的函数离generator仅一步之遥。要把 fib 函数变 成generator,只需要把 print(b) 改为 yield(b) 就可以了。

  • 通过yield关键字创建
# -*- coding: utf-8 -*-
# @File  : yield创建生成器.py
# @author: Flyme awei 
# @email : Flymeawei@163.com
# @Time  : 2022/8/20 21:17


def fib(times):
    # 初始化
    n = 0
    a, b = 0, 1
    while n < times:
        yield b
        a, b = b, a+b
        n += 1


f = fib(6)
print(f)
# <generator object fib at 0x00000197C5E56350>
# f 是一个生成器对象

print(next(f))
print(next(f))
print(next(f))
print(next(f))
print(next(f))
print(next(f))

在这里插入图片描述

  在上⾯fib的例⼦,我们在循环过程中不断调⽤ yield ,就会不断中断。当然要给循环设置⼀个条件来退出循环,不然就会产⽣⼀个⽆限数列出来。同样的,把函数改成generator后,我们基本上从来不会⽤ next() 来获取下⼀个返 回值,⽽是直接使⽤ for 循环来迭代:

# -*- coding: utf-8 -*-
# @File  : yield创建生成器.py
# @author: Flyme awei 
# @email : Flymeawei@163.com
# @Time  : 2022/8/20 21:17


def fib(times):
    # 初始化
    n = 0
    a, b = 0, 1
    while n < times:
        yield b
        a, b = b, a+b
        n += 1


f = fib(6)
print(f)
# <generator object fib at 0x00000197C5E56350>
# f 是一个生成器对象

for i in f:
    print(i)

在这里插入图片描述


3.遍历生成器的方式

  • 通过next()函数

  • 通过 for- in循环打印

  • objict内置的__next__()方法

  • send() 方法,生成器的第一个值必须是send(None),后面没有限制

# -*- coding: utf-8 -*-
# @File  : 遍历生成器.py
# @author: Flyme awei 
# @email : Flymeawei@163.com
# @Time  : 2022/8/20 21:24


# 创建一个生成器g
g = (i for i in range(10))

print(next(g))  # 0
print(next(g))  # 1


print(g.__next__())  # 2
print(g.__next__())  # 3

print(g.send(None))  # 4
print(g.send(''))  # 5
print(g.send(1))  # 6

for i in g:
    print(i)
# 7
# 8
# 9

在这里插入图片描述

4.生成器总结

  ⽣成器是这样⼀个函数,它记住上⼀次返回时在函数体中的位置。对⽣成器函数的第⼆次(或第 n 次)调⽤跳转⾄该函数中间,⽽上次调⽤的所有局部变量都保持不变。

  ⽣成器不仅记住了它数据状态;⽣成器还记住了它在流控制构造(在命令式编程中,这种构造不只是数据值)中的位置。

生成器的特点:

  • 节约内存

  • 迭代到下⼀次的调⽤时,所使⽤的参数都是第⼀次所保留下的,在整个所有函数调⽤的参数都是第⼀次所调⽤时保留的,⽽不是新创建的。