前言
Python中最遭人诟病的设计之一就是GIL。
GIL**(全局解释器锁)是 CPython 的一个互斥锁,确保任何时刻只有一个线程可以执行 Python 字节码,这样可以避免多个线程同时操作内部数据结构而引发竞争条件或内存错误。
简单来说,就是为了安全牺牲性能,在单核 CPU 时代无可厚非,但在多核 CPU 盛行的当下,已然过时。
Python 3.14 中,发布了两个版本,默认版本是包含GIL的版本,另一个可选“Free-threaded”版本包含了通过 PEP 703 引入的无 GIL 设计。
本文就来实测一下,在 python 3.14 中,取消 GIL 的版本是否有效。
实践测试
1. python 3.10 版本测试
首先测试一下 python 3.10,作为对照组的表现。
1.创建环境
uv venv --python 3.10
2.激活环境
.venv\Scripts\activate
3.编写并运行多线程测试脚本
让 Ai 编写了一个测试脚本,它选取了 Mandelbrot 集合进行模拟计算。
Mandelbrot 集合是一组复数集合点,这些点通过特定的迭代计算后不会发散。
import threading, time, sys
def mandelbrot_section(n, max_iter, y_start, y_end):
width = height = n
for py in range(y_start, y_end):
for px in range(width):
x0 = (px / width) * 3.5 - 2.5
y0 = (py / height) * 2.0 - 1.0
x = y = 0.0
iters = 0
while x*x + y*y <= 4.0 and iters < max_iter:
x, y = x*x - y*y + x0, 2*x*y + y0
iters += 1
def run_benchmark(n=500, max_iter=200, thread_counts=[1, 2, 4]):
# print("GIL enabled?", sys._is_gil_enabled())
print(f"== mandelbrot({n}×{n}, iter={max_iter}) ==")
for num_threads in thread_counts:
threads = []
start = time.time()
rows_per_thread = n // num_threads
for i in range(num_threads):
y_start = i * rows_per_thread
y_end = n if i == num_threads - 1 else (i + 1) * rows_per_thread
th = threading.Thread(target=mandelbrot_section, args=(n, max_iter, y_start, y_end))
threads.append(th)
th.start()
for th in threads:
th.join()
total = time.time() - start
print(f"{num_threads} threads total: {total:.2f}s")
print()
if __name__ == "__main__":
run_benchmark(n=500, max_iter=200, thread_counts=[1, 2, 4])
多线程输出结果。
== mandelbrot(500×500, iter=200) ==
1 threads total: 1.84s
2 threads total: 1.83s
4 threads total: 1.82s
采用多个线程运算,效果几乎不变,说明 GIL 生效。
在此版本中,为了发挥多核并行计算优势,只能采用多进程的方式。
import multiprocessing
import time
def mandelbrot_section(n, max_iter, y_start, y_end):
width = height = n
for py in range(y_start, y_end):
for px in range(width):
x0 = (px / width) * 3.5 - 2.5
y0 = (py / height) * 2.0 - 1.0
x = y = 0.0
iters = 0
while x * x + y * y <= 4.0 and iters < max_iter:
x, y = x * x - y * y + x0, 2 * x * y + y0
iters += 1
def run_benchmark(n=500, max_iter=200, proc_counts=[1, 2, 4]):
print(f"== mandelbrot({n}×{n}, iter={max_iter}) ==")
for num_procs in proc_counts:
procs = []
start = time.time()
rows_per_proc = n // num_procs
for i in range(num_procs):
y_start = i * rows_per_proc
y_end = n if i == num_procs - 1 else (i + 1) * rows_per_proc
p = multiprocessing.Process(target=mandelbrot_section, args=(n, max_iter, y_start, y_end))
procs.append(p)
p.start()
for p in procs:
p.join()
total = time.time() - start
print(f"{num_procs} processes total: {total:.2f}s")
print()
if __name__ == "__main__":
multiprocessing.freeze_support() # for Windows support
run_benchmark(n=500, max_iter=200, proc_counts=[1, 2, 4])
结果如下。
== mandelbrot(500×500, iter=200) ==
1 processes total: 1.60s
2 processes total: 0.91s
4 processes total: 0.81s
2. python 3.14 特定版本测试
1.创建环境
uv venv --python 3.14+freethreaded
2.激活环境
.venv\Scripts\activate
3.运行 GIL 检查脚本
import sys
print(sys._is_gil_enabled())
输出 False,说明 GIL 关闭成功。
4.运行多线程脚本
运行和上面一致的多线程测试脚本,输出结果如下:
== mandelbrot(500×500, iter=200) ==
1 threads total: 1.69s
2 threads total: 0.94s
4 threads total: 0.72s
由此可以看出,多线程加速处理能够成功生效。
总结
虽然 python 3.14(freethreaded)移除了 GIL 这个历史包袱,但很多第三方依赖仍然需要进行适配,短期不建议直接应用于生产环境,期待后续发展。