AI对Python代码的理解,基于历史训练数据集。那如果刚刚发布的Python3.14呢?哪个AI能马上理解它?
背景知识,Python各版本的发布时间:
- python 3.10:2021 年 10 月
- python 3.11:2022 年 10 月
- python 3.12:2023 年 10 月
- python 3.13:2024 年 10 月
- python 3.14:2025 年 10 月 7日 (本文写于2025年10月11日)
我个人对Python3.14版本最关心的,其实就是PEP 649/749,Lazy Evaluation of Annotations,或者叫Deferred Evaluation Of Annotations。 这个是对写代码有影响的,其他比如去掉解释器锁啊,JIT编译啊,都是背后的性能优化,不影响我怎么写代码。
所以针对这个问题,让各个AI写一些代码,评测AI是否已经理解Python3.14了。
输入给AI的问题如下:
write python code to demo type system/annotation in v3.14
先看国外的几个AI模型,都由Github Copilot来测试了。
Claude Sonnet 4.5
网络上的的代码之神,来看看他的回答:
坦率的说,比较失望,列了一大堆,但都不是3.14的新特性。
GPT-5
人狠话不多,一句聊天的话也没有,直接上代码了
但仔细看代码,都不是3.14的最新特性。
Grok
自动开了搜索(使用的是bing),也是无聊天废话,直接出代码
在代码里的 example 1,2,都精准的出现了3.14的新特性:
Gemini Flash
Gemini Flash是强制上网搜索的,关都关不掉:
它正确的指出了Python3.14的发布时间(应该是上网搜的),在聊天部分,也提到了3.14在写代码时,不用再写
from __future__ import annotations,不过在示例代码中没有对应的例子。
Gemini Pro
Gemini Pro反而是不联网搜索的,结果也是有点失望,没有提到重点。
小结一下的话,回答问题前上网搜的,比如Grok, Gemini Flash,都能准确回答并生成代码。没有上网搜的,都回答的不太好。
然后再看看国内的几家,都由网页版来测试。如果网页版本上可选是否联网搜索,都特意不选,看看数据库的知识是否最新。
千问和通义千问
(上面是千问)
(上面是通义千问)
这2个网址还不太一样(见截图上面url部分),但结论差不多,都没有回答到3.14的新特性,数据库中的Python版本都还是3.12.
另外再说一下,这2个都没有开深度思考(下同),也特意没开联网搜索(下同)。
DeepSeek官网版、DeepSeek元宝版、腾讯混元
(官网版)
(元宝版)
(混元)
结果基本相同,都没有回答最新特性,都只认识Python3.12。DeepSeek数据库应该是到23年10月,混元数据库到了24年中,但也还不认识3.13。
豆包
一样,回答的不是最新的特性。但豆包有个特点,就是它的回答风格和Claude特别的像,下面有2个回答的对比。
是不是风格很像?截图的时候如果不截Copilot图标(Claude是在Github Copilot里测试的),估计都分不清谁是谁了。
智谱 GLM4.6
也是有2个网站,不同的域名。
(应该是国外版)
(国内版)
最大的亮点出现了:chat.z.ai版本回答平平,但chatglm.cn版本非常准确的回答出了3.14版本在typing/annotation上的最大变化。我震惊了,再次确认它没有联网。这个水平和联网版的Gemini Flash和Grok一样了!它也是唯一提到了3.13版的AI,其他AI都只知道3.12.所以我大胆的猜测,GLM4.6的数据版本是比较新的!
minimax 一言 书生 讯飞
都测试了,但都没有亮点,算正常AI水平吧。
一言是唯一一个用中文回答英文问题的AI。
书生只认识Python3.11 (其他AI基本至少到了Python3.12)。
小结就不写了,怕被骂不专业。但后面我会多用用chatglm.cn!(有广告费吗,私信v我500!)