「数学天才」陶哲轩：GPT-4 无法攻克一个未解决的数学问题，但对工作有帮助

2023-04-10 1,362 阅读4分钟

编辑：桃子

【新智元导读】数学天才陶哲轩的研究也用上了 AI 工具 GPT-4。有了 GPT-4，你想做的，只需复制、粘贴、一键完成！

当红炸子鸡 ChatGPT，也成为数学天才陶哲轩的研究工具了。

近日，他在网上称自己发现了一些 ChatGPT 的小用例。

首先，它很擅长解析代码格式的文档（在这种情况下是 #arXiv 搜索的 API），然后返回一个正确格式的代码查询（后来它还提供了一些工作的 python 代码，以我要求的方式调用这个 API，尽管我不得不手动安装一个包来使它运行）。其次，我让它想出一些，聪明的学生在本科线性代数课上可能会问的问题（为此我提供了一些样本题目），它给出了一些很好的例子，让我对课程可能方向，以及潜在的作业问题有所启发。
总之，我发现 ChatGPT 等 AI 工具虽然不能帮我攻克一个未解决的数学问题，但对其他工作相关的问题很有用，尽管事后经常需要进行一些手动调整。

GPT-4 和 GPT-3.5 差别不大

GPT-4 是怎样擅长解析代码格式的文档？

陶哲轩让 GPT-4 对所有的 arXiv 文章进行搜索查询，这些文章的元数据是一个给定的关键词（比如，「Collatz」），并且是在一定的日期范围内提交的（比如，在 2011-2016 之间）。根据下面的文档，这样的查询的格式是什么？

对此，GPT-4 不仅给出了代码，还列出了查询的分类。

网友问，作为一个阅读工具，给定一篇论文，让它提出审稿人或演讲者可能会问哪些问题？在这一方面 GPT-4 做得如何？

对此，陶哲轩拿去测评了一番，大赞「确实不错」。

「这里是最近一篇论文的前几页。你能提出一些听众在听关于这篇论文的讲座时可能提出的问题吗？」

ChatGPT 回答「当然，这里有一些数学家在听了关于这篇论文的讲座后可能会问的问题」。然后，巴拉巴拉列出了 7 个问题。

细心网友发现陶哲轩发帖的截图是 GPT-4。

便问道，「你认为以前的 ChatGPT 和基于 GPT-4 模型的新助手之间有什么区别？」

陶哲轩称，「到目前为止，GPT-4 的答复稍微有用一些，而且符合我的要求，但我没有看到质量上的重大差别。」

ChatGPT 加入工作流

ChatGPT 的诞生，许多人都在惊呼自己的工作要被 AI 替代了。

就连天才数学家陶哲轩也上手 ChatGPT 了。

3 月 5 日，陶哲轩在网上称自己决定尝试以不同的方式将 AI 工具纳入我的工作流程。其中就包括 GPT-4、DeepL 等工具。

在此期间，ChatGPT 隐藏功能都被他挖掘了出来，比如寻找公式、解析代码格式的文档、改写论文语句等等。

比如，ChatGPT 有时可以在数学中做一个半成品的语义检索，也就是用它来生成一些提示。

比如，陶哲轩让 ChatGPT 从描述中识别库默尔定理，它没能给出正确答案，但根据它给出的近似答案（Legendre 公式）。

对此，陶哲轩称，人工智能在数学中的作用是提供一个初步的近似答案，然后可以结合传统搜索引擎轻松找到正确答案。

陶哲轩还发现了 ChatGPT 在处理数学问题时的亮点，能够识别不同语言的数学概念音译版。

另外，可以要求 ChatGPT 转换从 MathSciNet 获得的一堆参考文献，并在 LaTeX 书目环境下将其格式化为 \ bibitems。

然而 ChatGPT 就没有犯错的时候吗？

在一个关于「素数是否无穷多」的证明问题中，陶哲轩发现 ChatGPT 给出的答案并不是完全正确的。

从另一面看，他发现 ChatGPT 给出的论证思路是可以被固定下来的，并且这个思路他之前都从未见过。

复制、粘贴、一键完成！

挖掘 GPT-4 的用例，网友们也是花了不少功夫。

让 GPT-4 评审论文不仅合理，而且还能击中要点。

「作为一个学者，我不知道如何看待这个问题：我把我的一篇旧论文放到 GPT-4 中（分成两部分），要求一个经济社会学家进行严厉但公平的同行评审。」

它创造了一个完全合理的同行评审，踩中了我的评审员提出的许多要点。

对许多人来讲，想要做什么，直接问 GPT-4，「复制、粘贴、一键完成！」

就比如用 GPT-4 做一个复杂的游戏。

网友把 GPT-4、Replit、MidJourney、Claude 组建成一个人工智能助手团队，从头开始创建了一个 3D 太空跑酷游戏。

然鹅，自己竟对 Javascript 或 3D 游戏编程一无所知。

参考资料：

mathstodon.xyz/@tao