浅析Python闭包如何捕获自由变量

 更新时间:2026年05月06日 09:04:29   作者:SilentSamsara  
本文主要讲述了Python中作用域和闭包的相关知识,包括LEGB作用域规则、global和nonlocal关键字的区别与应用、闭包的完整执行流程、闭包变量的生命周期以及闭包的常见应用场景和错误处理

一、从一个计数器开始

学作用域的时候,通常会遇到这样的代码:

def make_counter():
    count = 0
    def counter():
        count += 1   # 这里会报错
        return count
    return counter

c = make_counter()
print(c())  # UnboundLocalError: local variable 'count' referenced before assignment

这不是 bug——这是 Python 作用域规则在说话。报错的原因和 count += 1 这行代码里发生了什么有关,也在某种程度上揭示了闭包的本质。

要彻底理解这段代码,得先搞清楚 Python 的作用域规则,以及闭包是怎么工作的。

二、LEGB 规则:名字查找的顺序

Python 查找变量名时,按 LEGB 的顺序逐层搜索:

  • L(Local):当前函数内部定义的变量
  • E(Enclosing):外层嵌套函数中的变量
  • G(Global):模块级全局变量
  • B(Built-in):Python 内置名字,比如 lenprint

用代码验证这个顺序:

x = "global"  # G 层

def outer():
    x = "enclosing"  # E 层

    def inner():
        x = "local"  # L 层
        print(x)  # -> local(找到了就停)

    inner()

outer()

每层可以定义和上层同名的变量,彼此互不干扰。Python 之所以这样做,是因为名字查找发生在运行时而非编译时——解释器执行到哪一行,才去相应的作用域里找变量。

LEGB 规则可视化:

查找时从内向外逐层搜索,找到即停。

三、global关键字:打破 E 层

回到开头的计数器报错。count += 1 等价于:

count = count + 1

Python 看到这行代码时,发现等号左边有 count,就认为 count 应该是当前作用域的局部变量。但 countouter() 的作用域里(E 层),不在 counter() 的作用域里(L 层)——Python 拒绝在 E 层创建同名 L 层变量,所以报了 UnboundLocalError

解决方式一:把 count 提升到全局作用域:

count = 0

def make_counter():
    global count  # 声明接下来访问全局的 count
    count += 1
    return count

print(make_counter())  # 1
print(make_counter())  # 2

global 有个严重问题:它让 count 变成模块级全局变量。多个 make_counter() 实例会共享同一个 count,完全破坏了隔离性。

四、nonlocal关键字:访问 E 层变量

nonlocalglobal 的近亲,但作用域不同。它允许在 L 层函数中修改 E 层(嵌套外层)的变量:

def make_counter():
    count = 0

    def counter():
        nonlocal count  # 声明:接下来对 count 的赋值操作,作用于外层的 count
        count += 1
        return count

    return counter

c = make_counter()
print(c())  # 1
print(c())  # 2
print(c())  # 3

nonlocal 不会在 L 层创建新变量,也不涉及 G 层——它直接作用于最近一层外层函数的变量。

global vs nonlocal 的区别:

关键字作用层行为
global模块级 G 层读写全局变量,多个函数共享
nonlocal嵌套外层 E 层读写外层函数变量,多个闭包独立

五、闭包的完整执行流程

理解 nonlocal 后,再看闭包的完整执行流程。回到最初报错的代码,但这次不加任何关键字:

def make_counter():
    count = 0  # <- E 层变量

    def counter():
        print("count 当前值:", count)  # 读 E 层变量 - 没问题
        return count  # 读 E 层变量 - 没问题

    return counter

读操作(不加 nonlocal)不会报错——Python 允许读取外层变量。只有写操作(count = somethingcount += something)才会触发 UnboundLocalError,因为等号左边让 Python 认为这是一个新的 L 层变量。

当 Python 看到 nonlocal count 时,在编译期(生成字节码时)就已经把这件事记下来了:

import dis

def make_counter():
    count = 0

    def counter():
        nonlocal count
        count += 1
        return count

    return counter

# counter 函数的字节码
dis.dis(counter := make_counter())

关键字节码:

  5           2 LOAD_GLOBAL          0 (count)
              4 LOAD_CONST           1 (1)
              6 BINARY_OP            0 (+)
              8 STORE_FAST           0 (count)
              10 LOAD_FAST           0 (count)
             12 RETURN_VALUE

LOAD_GLOBAL 0 (count)nonlocal 的实现方式——如果不用 nonlocal,这行会变成 LOAD_FAST(读 L 层变量),然后 STORE_FAST 会触发 UnboundLocalError

六、闭包变量的生命周期

闭包有一个经常被忽视的特性:闭包变量的生命周期和闭包本身一样长

def make_multiplier(factor):
    # factor 绑定在 make_multiplier 的局部作用域里
    def multiply(value):
        return value * factor
    return multiply

doubler = make_multiplier(2)

# make_multiplier() 已经执行完毕退出了
# 但 doubler 仍然持有 factor=2
print(doubler(5))   # 10
print(doubler(100)) # 200

factor 原本在 make_multiplier() 的局部作用域里。函数退出后,局部变量通常应该被销毁——但 doubler 还在使用它,所以 Python 的垃圾回收机制检测到 factor 仍有外部引用,就把它保留下来,通过 cell 对象包装后存入 doubler.__closure__

这就是为什么 doubler.__closure__[0].cell_contents 能读取到 2——cell 对象就是闭包变量在内存中的载体。

>>> doubler.__closure__
(<cell at 0x...: int object at 0x...>,)
>>> doubler.__closure__[0].cell_contents
2

一个更复杂的例子,验证多个闭包共享同一个外层变量:

def processor(initial=0):
    total = initial

    def add(x):
        nonlocal total
        total += x
        return total

    def subtract(x):
        nonlocal total
        total -= x
        return total

    return add, subtract

add, subtract = processor(100)

print(add(30))     # 130,total = 100 + 30
print(subtract(20)) # 110,total = 130 - 20
print(add(10))     # 120,total = 110 + 10

addsubtract 指向同一个 cell 对象——修改 total 对两个函数都生效。这是闭包的"共享状态"特性,常用于事件处理器、回调函数等场景。

七、闭包的典型应用场景

场景一:函数工厂(最常见用法)

根据不同参数生成专用函数:

def power_factory(exp):
    def power(base):
        return base ** exp
    return power

square = power_factory(2)
cube = power_factory(3)

print(square(5))  # 25
print(cube(5))    # 125

exp 被捕获在闭包里,squarecube 各有独立的 exp 值,互不干扰。相比写死参数,函数工厂更灵活,避免了为每种指数写专门的函数。

场景二:带记忆的递归函数

def memoized_fibonacci():
    cache = {}  # E 层变量

    def fib(n):
        if n in cache:
            return cache[n]
        if n <= 1:
            result = n
        else:
            result = fib(n-1) + fib(n-2)
        cache[n] = result
        return result

    return fib

fib = memoized_fibonacci()
print(fib(100))  # 354224848179261915075
print(fib(200))  # 280571172992510140037611908417314019

cache 字典在闭包里持久化,每次递归调用都能访问同一个缓存——避免了普通递归中子问题被重复计算的问题。

场景三:装饰器(闭包的直接应用)

装饰器本质上就是闭包:

import functools
import time

def timing_decorator(fn):
    @functools.wraps(fn)
    def wrapper(*args, **kwargs):
        # fn 和 elapsed_time 都是闭包变量
        start = time.perf_counter()
        result = fn(*args, **kwargs)
        elapsed = time.perf_counter() - start
        print(f"{fn.__name__} 耗时 {elapsed:.4f}s")
        return result
    return wrapper

wrapper 捕获了 fn(被装饰的函数)和 elapsed_time(计时变量)两个自由变量。timing_decorator 返回的 wrapper 闭包里装着被装饰函数的引用,调用时真正执行的是 wrapper,而非原函数。

八、闭包的常见错误:迟绑定

这是闭包里最隐蔽的错误。当闭包在循环中创建时,所有闭包实例捕获的是同一个变量,而变量的值以闭包被调用时的值为准——而不是创建时的值:

def create_multipliers():
    multipliers = []
    for i in range(5):
        multipliers.append(lambda x: x * i)  # i 是自由变量
    return multipliers

fns = create_multipliers()

# 全部返回 4*4=16,而不是 0*4, 1*4, 2*4, 3*4, 4*4
print([fn(4) for fn in fns])  # [16, 16, 16, 16, 16]

循环结束时 i = 4,所有闭包引用的是同一个 i,所以调用时都得到 4 * 4 = 16

解决方式:用默认参数在闭包创建时立即捕获当前值:

def create_multipliers_fixed():
    multipliers = []
    for i in range(5):
        multipliers.append(lambda x, i=i: x * i)  # i=i 把当前值绑定为默认值
    return multipliers

fns = create_multipliers_fixed()
print([fn(4) for fn in fns])  # [0, 4, 8, 12, 16]

lambda x, i=i: ... 里,i=i 的右边 i 是自由变量,在定义时取值为当前的循环变量;左边 i 是默认参数,绑定到 lambda 的 L 层作用域。每次循环迭代时,i 的当前值被"拍"进默认参数,之后循环继续,i 变化也不影响已经绑定好的默认参数。

functools.partial 也能解决:

import functools

def create_multipliers_partial():
    multipliers = []
    for i in range(5):
        multipliers.append(functools.partial(lambda x, i: x * i, i=i))
    return multipliers

九、__closure__与自由变量的深度解析

可以用 __code__.co_freevars 直接看到函数捕获了哪些自由变量:

def outer(x):
    def inner(y):
        # z 从更外层捕获
        def deeper(z):
            return x + y + z
        return deeper
    return inner

# 查看各层函数的自由变量
outer_fn = outer(10)
inner_fn = outer_fn(20)
deeper_fn = inner_fn(30)

>>> outer_fn.__code__.co_freevars
('x',)
>>> inner_fn.__code__.co_freevars
('x', 'y')
>>> deeper_fn.__code__.co_freevars
('x', 'y', 'z')

# __closure__ 的顺序和 co_freevars 一一对应
>>> deeper_fn.__closure__
(<cell at ...: int object at ...>, <cell at ...: int object at ...>, <cell at ...: int object at ...>)
>>> deeper_fn.__closure__[0].cell_contents, \
     deeper_fn.__closure__[1].cell_contents, \
     deeper_fn.__closure__[2].cell_contents
(10, 20, 30)

co_freevars 是字节码层面的元信息,告诉解释器哪些名字是自由变量;__closure__ 是这些自由变量对应的 cell 对象序列,两者顺序一致。

十、知识点总结

到此这篇关于浅析Python闭包如何捕获自由变量的文章就介绍到这了,更多相关Python闭包捕获自由变量内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • 使用Python获取网段IP个数以及地址清单的方法

    使用Python获取网段IP个数以及地址清单的方法

    今天小编就为大家分享一篇使用Python获取网段IP个数以及地址清单的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-11-11
  • 如何让python程序正确高效地并发

    如何让python程序正确高效地并发

    这篇文章主要介绍了如何让python程序正确高效地并发,文章围绕主题的相关资料展开详细的内容介绍,具有一定的参考价值,需要的小伙伴可以参考一下
    2022-06-06
  • 使用Python开发游戏运行脚本实现模拟点击

    使用Python开发游戏运行脚本实现模拟点击

    这篇文章主要介绍了使用Python开发游戏运行脚本实现模拟点击,这样我们要想实现手游脚本开发的第一步,就是下载Android模拟器,然后在对安卓模拟器进行鼠标和键盘的模拟,以此来实现自动化游戏脚本,需要的朋友可以参考下
    2021-11-11
  • 解决python3 json数据包含中文的读写问题

    解决python3 json数据包含中文的读写问题

    今天小编就为大家分享一篇解决python3 json数据包含中文的读写问题,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-05-05
  • python文件和目录操作方法大全(含实例)

    python文件和目录操作方法大全(含实例)

    这篇文章主要介绍了python文件和目录的操作方法,简明总结了文件和目录操作中常用的模块、方法,并列举了一个综合实例,需要的朋友可以参考下
    2014-03-03
  • 用python 批量操作redis数据库

    用python 批量操作redis数据库

    这篇文章主要介绍了如何用python 批量操作redis数据库,帮助大家更好的理解和学习使用python,感兴趣的朋友可以了解下
    2021-03-03
  • Win10下安装并使用tensorflow-gpu1.8.0+python3.6全过程分析(显卡MX250+CUDA9.0+cudnn)

    Win10下安装并使用tensorflow-gpu1.8.0+python3.6全过程分析(显卡MX250+CUDA9.

    这篇文章主要介绍了Win10下安装并使用tensorflow-gpu1.8.0+python3.6全过程(显卡MX250+CUDA9.0+cudnn),本文给大家介绍的非常详细,具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-02-02
  • Python连接PostgreSQL数据库并查询数据的详细指南

    Python连接PostgreSQL数据库并查询数据的详细指南

    在现代软件开发中,数据库是存储和检索数据的核心组件,PostgreSQ是一个功能强大的开源对象关系数据库系统,它以其稳定性、强大的功能和灵活性而闻名,Python作为一种流行的编程语言,与PostgreSQL的结合使用非常广泛,本文介绍了Python连接PostgreSQL数据库并查询数据
    2024-12-12
  • Python 中pandas.read_excel详细介绍

    Python 中pandas.read_excel详细介绍

    这篇文章主要介绍了Python 中pandas.read_excel详细介绍的相关资料,需要的朋友可以参考下
    2017-06-06
  • pycharm如何中导入本地下载好的库

    pycharm如何中导入本地下载好的库

    这篇文章主要介绍了pycharm如何中导入本地下载好的库问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2024-08-08

最新评论