关于 Python 中闭包的一些理解

1,235 阅读3分钟
原文链接: www.vimiix.com

看不懂的定义:闭包是由函数及其相关的引用环境组合而成的实体(即:闭包=函数+引用环境)。

既然是看不懂的定义,真看不懂上面定义的话就忽略吧。

在python中,函数可以作为另一个函数的参数或返回值,可以赋给一个变量。函数可以嵌套定义,即在一个函数内部可以定义另一个函数,有了嵌套函数这种结构,便会产生闭包问题。

好理解一点的定义:如果在一个内部函数里,对在外部作用域(但不是在全局作用域)的变量进行引用,那么内部函数就被认为是闭包(closure)

举个栗子:

def outer(x):
    def inner(y):
        return x + y
    return inner

结合代码分析定义:

如果在一个内部函数里 — inner()就是内部函数。

对在外部作用域(但不是在全局作用域)的变量进行引用 — x就是被引用的变量,x在外部作用域,但不在全局作用域。

那么内部函数就被认为是闭包 —- inner就是一个闭包。

关于闭包很难理解的一个问题,我尝试用图形化思维来理解

先看一个简单的循环

for i in range(3):
    print i

在程序里面经常会出现这类的循环语句,python的一个现象是,当循环结束以后,循环体中的临时变量i不会销毁,而是继续存在于执行环境中。还有一个python的现象是,python的函数只有在执行时,才会去找函数体里的变量的值。

这段话特别需要记住两点:

  1. 当循环结束时,循环体中的临时变量i不会销毁
  2. python的函数只有在执行时,才会去找函数体里的变量的值

记住上面两点后,下面看经典的难理解的栗子:

def foo():
    func_list = []
    for i in range(3):
        def inner():
            return i*i
        func_list.append(inner)
    return func_list
f = foo()

在这个例子中,每次循环都创建一个新的函数,并且将创建的三个 函数对象都添加到 func_list这个列表中

f = foo()这里调用foo(),f中就保存了一个列表对象,这个列表中保存了3个函数对象。

不妨打印一下看看 f 中三个元素的值:

>>> print f[0],'\n',f[1],'\n',f[2]
 
 

从打印信息可以看出, f 中存放了3个函数名相同,但内存地址不同,的函数对象。

此时调用一下三个函数

>>> f[0]()
4
>>> f[1]()
4
>>> f[2]()
4

可能有些人认为这段代码的执行结果应该是0,1,4.但是实际的结果是4,4,4。这是因为当把函数对象加入func_list列表里时,python还没有给i赋值,只有当执行时,再去找i的值是什么,这时在第一个for循环结束以后,i的值是2,所以以上代码的执行结果是4,4,4.

不好理解的话,画个流程图( 点击图片查看大图):

这里也可以直观的理解文章开始提到的闭包的定义公式( 闭包=函数+引用环境)

结果全部都是 4,原因就在于返回的函数引用了变量i,但它并非立刻执行。等到3个函数被调用时,它们所引用的变量i已经变成了2,因此最终结果为4。

返回闭包时牢记的一点就是: 返回函数不要引用任何循环变量,或者后续会发生变化的变量。

如果要正确的输出引用循环变量后的值,只需要将每次循环变量锁定到闭包中,具体实现如下:

def foo():
      func_list = []
      for i in range(3):
            def inner( x = i):
                  print x*x
            func_list.append(inner)
      return func_list
f = foo()

这样的话,打印调用每个闭包后的结果为 0 , 1, 4

>>> f[0]()
0
>>> f[1]()
1
>>> f[2]()
4