Thinking Claude：独家实测，超越o1，引领AI思维新时代在人工智能领域的激烈竞争中，一个由17岁高中生涂津

引言

在人工智能领域的激烈竞争中，一个由17岁高中生涂津豪（Richards Tu）开发的神级Prompt"Thinking Claude"引起了全球性的关注。这个创新性的提示词框架不仅让Claude的思维过程更接近人类，还显著提升了其回答的质量和深度。作为阿里巴巴全球数学竞赛AI赛道的全球第一名得主，涂津豪用他的创新之作向我们展示了AI思维框架的无限可能。更为重要的是，本文将深入探讨这个被称为"满血o1"的强化版Claude是如何实现的，以及我独家实测的精彩体验。

Thinking Claude的核心理念

Thinking Claude的核心在于让AI在回答问题之前进行全面、自然且未经过滤的思考。这种思考不是简单的逻辑推导，而是更接近人类的"意识流"思维方式。

项目介绍：thinkingclaude.com/zh-CN/#get-…
项目仓库：github.com/richards199…

项目介绍页面有提示词的英文全文较长，在此不赘述。总结其主要特点包括：

自然流动的思维过程：摒弃了传统的结构化思维方式，采用更接近人类思维的流畅表达。
多维度分析：根据问题的复杂性、时间敏感性、可用信息等多个维度调整思考深度。
真实的思考体验：通过使用"嗯..."、"这很有趣，因为..."等自然语言表达，展现真实的思考过程。
递归思维：能够在宏观和微观层面同时进行分析，保持思维的连贯性和深度。

下图是该提示词框架的主要功能。

Thinking Claude的主要功能

工作原理与设计特点

项目网站对该提示词框架的工作原理介绍如下图。

Thinking Claude的工作原理

突破性的思维框架设计

从框架设计角度来看，Thinking Claude的实现是一个精心设计的多层次思维系统，它要求Claude像人类大脑一样工作，包含了多个关键环节：

自适应深度分析系统
- 智能深度调节：根据问题复杂度自动调整思考深度，就像人类面对不同难度的问题会投入不同的思考精力
- 上下文感知：能够理解问题的背景和潜在含义，不仅看到表面的问题描述
- 资源优化分配：根据时间紧迫性和问题重要性合理分配思考资源
多维度思维矩阵
- 技术维度：处理具体的技术细节和实现方案
- 逻辑维度：确保推理过程的严密性和连贯性
- 创造维度：产生新的想法和解决方案
- 情感维度：理解和回应问题中的情感元素

革命性的思维过程实现

Thinking Claude的思维过程看起来很复杂，不过主要是分成了以下三个阶段来处理任何问题和任务：

初始认知阶段
- 首先进行问题重述，确保准确理解用户需求
- 建立初步的问题地图，识别关键点和潜在挑战
- 激活相关知识库，为深入分析做准备
深度解析阶段
- 问题分解：将复杂问题拆分成可管理的子问题
- 多角度分析：从不同维度审视问题
- 关联性挖掘：发现问题之间的潜在联系
创造性思维阶段
- 平行思维：同时保持多个可能的解决方案
- 发散思维：探索非常规的解决途径
- 收敛思维：筛选和优化最佳方案

独家使用评测

项目官网介绍了两种使用的方式：直接粘贴指令到Claude项目和使用Chrome扩展来观察Claude的思维过程。

Thinking Claude的使用说明

在网上，Thinking Claude的提示词框架被誉为非常强大，但我认为，实际体验比听说更重要。因此，我决定使用Monica来测试这个提示词框架。主要原因是，claude.ai当前不支持网络搜索和大文件数据分析，智能体的能力还不够完善。同时，Monica可以选择Claude最新版本的模型，这让我对测试结果感到非常期待。

大语言模型翻车经典案例实测

其实大语言模型的数学能力一直是个硬伤，比如最经典的，9.8还是9.11大？和Strawberry这个单词有几个r？这两个简单的问题，大模型在不使用任何插件的情况下屡屡翻车，直到o1出来以后，推理能力才得以改善，正好试试看这个Thinking Claude是否可以提升大模型的推理能力。

Claude 3.5 Sonnet没有提示词的表现

下图是Claude 3.5 Sonnet没有使用Thinking Claude提示词的表现，可以看到，两个经典问题回答都错了，一本正经的胡说八道。

Claude 3.5 Sonnet没有提示词的表现

Claude 3.5 Sonnet使用提示词的表现

下图是Claude 3.5 Sonnet使用了Thinking Claude提示词的表现，可以看到，Sonnet终于能够正常的进行逻辑推理了，智力果然提升了！！！而且思考的过程看起来也挺有意思的，还把大模型常犯的错误也指出来了！这推理能力，赶上o1了要！再加上目前o1什么插件也不支持，还不能算是智能体，而Monica的Sonnet可是可以任意调用搜索，数据分析，Artifacts，DALL·E 3等等工具。感觉智能体能力又要上一个台阶了！

Claude 3.5 Sonnet使用提示词的表现

升级版Monica智能体能力实测

既然 Sonnet 的思考能力提高了，那智能体的综合任务执行能力应该也会相应提高。我迫不及待地尝试了几个任务。

计算器制品设计

首先是一个简单的需求：帮我设计一个计算器。Monica展现出了如下真实的思考过程：

嗯...设计一个计算器，这是一个看似简单但实际上包含很多维度需要考虑的任务。

首先，让我思考一下用户需求...一个计算器最基本的功能是什么？数字运算显然是核心，但具体到什么程度呢？基础的加减乘除是必须的，但可能还需要一些更高级的功能，比如百分比计算、平方根等。

等等，在进入具体功能之前，我应该先考虑这个计算器的形式。是要设计一个网页版的计算器吗？这样的话，我可以使用HTML和CSS来创建一个视觉上吸引人的界面，再用JavaScript处理计算逻辑。这让我想起了经典的iOS计算器设计，简洁但功能强大。

说到界面，我需要考虑：
- 按钮的布局和排列
- 颜色方案（要确保良好的对比度）
- 响应式设计（在不同设备上都能正常显示）
- 用户交互反馈

从技术实现角度来看，我需要：
- 一个清晰的显示屏来显示输入和结果
- 数字按钮（0-9）
- 基本运算符按钮（+、-、×、÷）
- 等号按钮
- 清除按钮
- 可能还需要一些特殊功能按钮

我觉得可以使用artifact语法来创建一个网页版计算器，使用React组件来实现。这样可以确保代码的可维护性和交互的流畅性。

让我设计一个简洁但实用的界面，包含基本计算功能，同时保持美观和易用性。我会使用Tailwind CSS来处理样式，这样可以确保设计的一致性和响应式表现。

然后就给我了一个iOS风格的计算器！

iOS风格的计算机制品

相当的赞啊，说实话，我还挺喜欢看AI的思考过程呢，感觉这种自问自答的方式展现了AI真实的思考过程，相当有亲和力。

股票投资分析报告自动生成

接下来上难度，拿出我之前测试Monica数据分析和制品能力的股票投资分析报告自动生成例子来试试。为了综合考察智能体的能力，我在提示词里专门指定了工具使用的规则，让Monica配合使用代码解释器和制品工具。提示词如下：

分析这个股票数据集，帮我挑选一下近期值得投资的股票。只能用代码解释器分析数据，不要用代码解释器制作图表，请用代码解释器将所需数据格式化后打印到终端显示，然后使用制品工具根据打印的数据生成HTML报告，可用echart实现图表的可视化。

然后Monica就开启思考模式了！升级版的Monica首先仔细分解了一下我的任务，然后分析了一下数据集，根据不同思考维度还给投资设计了一个评分系统！最后帮我生成了一个可视化报告！整个过程可谓丝滑啊！思考过程和执行任务的详细过程如下图所示：

产生的报告如下图所示：

启用思考模式的Monica股票投资分析报告

作为对比，之前的报告长这样：

没启用思考模式的Monica股票投资分析报告

不得不说，综合分析能力上了一个台阶，分析的深度和广度都有所提高，我感觉回不去了，之后要更加依赖思考模式的Monica了！

未来展望

Thinking Claude代表了AI提示词工程的一个重要突破。它不仅提升了Claude的回答质量，更重要的是开创了一种让AI思维更接近人类的新方向。在人工智能快速发展的今天，这样的创新让我们看到了AI与人类思维进一步融合的可能性。感觉o1的插件支持要加快了，不然要被Claude全面赶超了！

如对AI智能体相关信息感兴趣，或需进一步交流，请关注微信公众号【AI智能体研究】