引言
在人工智能领域的激烈竞争中,一个由17岁高中生涂津豪(Richards Tu)开发的神级Prompt"Thinking Claude"引起了全球性的关注。这个创新性的提示词框架不仅让Claude的思维过程更接近人类,还显著提升了其回答的质量和深度。作为阿里巴巴全球数学竞赛AI赛道的全球第一名得主,涂津豪用他的创新之作向我们展示了AI思维框架的无限可能。更为重要的是,本文将深入探讨这个被称为"满血o1"的强化版Claude是如何实现的,以及我独家实测的精彩体验。
Thinking Claude的核心理念
Thinking Claude的核心在于让AI在回答问题之前进行全面、自然且未经过滤的思考。这种思考不是简单的逻辑推导,而是更接近人类的"意识流"思维方式。
项目介绍页面有提示词的英文全文较长,在此不赘述。总结其主要特点包括:
- 自然流动的思维过程:摒弃了传统的结构化思维方式,采用更接近人类思维的流畅表达。
- 多维度分析:根据问题的复杂性、时间敏感性、可用信息等多个维度调整思考深度。
- 真实的思考体验:通过使用"嗯..."、"这很有趣,因为..."等自然语言表达,展现真实的思考过程。
- 递归思维:能够在宏观和微观层面同时进行分析,保持思维的连贯性和深度。
下图是该提示词框架的主要功能。
工作原理与设计特点
项目网站对该提示词框架的工作原理介绍如下图。
突破性的思维框架设计
从框架设计角度来看,Thinking Claude的实现是一个精心设计的多层次思维系统,它要求Claude像人类大脑一样工作,包含了多个关键环节:
-
自适应深度分析系统
- 智能深度调节:根据问题复杂度自动调整思考深度,就像人类面对不同难度的问题会投入不同的思考精力
- 上下文感知:能够理解问题的背景和潜在含义,不仅看到表面的问题描述
- 资源优化分配:根据时间紧迫性和问题重要性合理分配思考资源
-
多维度思维矩阵
- 技术维度:处理具体的技术细节和实现方案
- 逻辑维度:确保推理过程的严密性和连贯性
- 创造维度:产生新的想法和解决方案
- 情感维度:理解和回应问题中的情感元素
革命性的思维过程实现
Thinking Claude的思维过程看起来很复杂,不过主要是分成了以下三个阶段来处理任何问题和任务:
-
初始认知阶段
- 首先进行问题重述,确保准确理解用户需求
- 建立初步的问题地图,识别关键点和潜在挑战
- 激活相关知识库,为深入分析做准备
-
深度解析阶段
- 问题分解:将复杂问题拆分成可管理的子问题
- 多角度分析:从不同维度审视问题
- 关联性挖掘:发现问题之间的潜在联系
-
创造性思维阶段
- 平行思维:同时保持多个可能的解决方案
- 发散思维:探索非常规的解决途径
- 收敛思维:筛选和优化最佳方案
独家使用评测
项目官网介绍了两种使用的方式:直接粘贴指令到Claude项目和使用Chrome扩展来观察Claude的思维过程。
在网上,Thinking Claude的提示词框架被誉为非常强大,但我认为,实际体验比听说更重要。因此,我决定使用Monica来测试这个提示词框架。主要原因是,claude.ai当前不支持网络搜索和大文件数据分析,智能体的能力还不够完善。同时,Monica可以选择Claude最新版本的模型,这让我对测试结果感到非常期待。
大语言模型翻车经典案例实测
其实大语言模型的数学能力一直是个硬伤,比如最经典的,9.8还是9.11大?和Strawberry这个单词有几个r?这两个简单的问题,大模型在不使用任何插件的情况下屡屡翻车,直到o1出来以后,推理能力才得以改善,正好试试看这个Thinking Claude是否可以提升大模型的推理能力。
Claude 3.5 Sonnet没有提示词的表现
下图是Claude 3.5 Sonnet没有使用Thinking Claude提示词的表现,可以看到,两个经典问题回答都错了,一本正经的胡说八道。
Claude 3.5 Sonnet使用提示词的表现
下图是Claude 3.5 Sonnet使用了Thinking Claude提示词的表现,可以看到,Sonnet终于能够正常的进行逻辑推理了,智力果然提升了!!!而且思考的过程看起来也挺有意思的,还把大模型常犯的错误也指出来了!这推理能力,赶上o1了要!再加上目前o1什么插件也不支持,还不能算是智能体,而Monica的Sonnet可是可以任意调用搜索,数据分析,Artifacts,DALL·E 3等等工具。感觉智能体能力又要上一个台阶了!
升级版Monica智能体能力实测
既然 Sonnet 的思考能力提高了,那智能体的综合任务执行能力应该也会相应提高。我迫不及待地尝试了几个任务。
计算器制品设计
首先是一个简单的需求:帮我设计一个计算器。Monica展现出了如下真实的思考过程:
嗯...设计一个计算器,这是一个看似简单但实际上包含很多维度需要考虑的任务。
首先,让我思考一下用户需求...一个计算器最基本的功能是什么?数字运算显然是核心,但具体到什么程度呢?基础的加减乘除是必须的,但可能还需要一些更高级的功能,比如百分比计算、平方根等。
等等,在进入具体功能之前,我应该先考虑这个计算器的形式。是要设计一个网页版的计算器吗?这样的话,我可以使用HTML和CSS来创建一个视觉上吸引人的界面,再用JavaScript处理计算逻辑。这让我想起了经典的iOS计算器设计,简洁但功能强大。
说到界面,我需要考虑:
- 按钮的布局和排列
- 颜色方案(要确保良好的对比度)
- 响应式设计(在不同设备上都能正常显示)
- 用户交互反馈
从技术实现角度来看,我需要:
- 一个清晰的显示屏来显示输入和结果
- 数字按钮(0-9)
- 基本运算符按钮(+、-、×、÷)
- 等号按钮
- 清除按钮
- 可能还需要一些特殊功能按钮
我觉得可以使用artifact语法来创建一个网页版计算器,使用React组件来实现。这样可以确保代码的可维护性和交互的流畅性。
让我设计一个简洁但实用的界面,包含基本计算功能,同时保持美观和易用性。我会使用Tailwind CSS来处理样式,这样可以确保设计的一致性和响应式表现。
然后就给我了一个iOS风格的计算器!
相当的赞啊,说实话,我还挺喜欢看AI的思考过程呢,感觉这种自问自答的方式展现了AI真实的思考过程,相当有亲和力。
股票投资分析报告自动生成
接下来上难度,拿出我之前测试Monica数据分析和制品能力的股票投资分析报告自动生成例子来试试。为了综合考察智能体的能力,我在提示词里专门指定了工具使用的规则,让Monica配合使用代码解释器和制品工具。提示词如下:
分析这个股票数据集,帮我挑选一下近期值得投资的股票。只能用代码解释器分析数据,不要用代码解释器制作图表,请用代码解释器将所需数据格式化后打印到终端显示,然后使用制品工具根据打印的数据生成HTML报告,可用echart实现图表的可视化。
然后Monica就开启思考模式了!升级版的Monica首先仔细分解了一下我的任务,然后分析了一下数据集,根据不同思考维度还给投资设计了一个评分系统!最后帮我生成了一个可视化报告!整个过程可谓丝滑啊!思考过程和执行任务的详细过程如下图所示:
产生的报告如下图所示:
作为对比,之前的报告长这样:
不得不说,综合分析能力上了一个台阶,分析的深度和广度都有所提高,我感觉回不去了,之后要更加依赖思考模式的Monica了!
未来展望
Thinking Claude代表了AI提示词工程的一个重要突破。它不仅提升了Claude的回答质量,更重要的是开创了一种让AI思维更接近人类的新方向。在人工智能快速发展的今天,这样的创新让我们看到了AI与人类思维进一步融合的可能性。感觉o1的插件支持要加快了,不然要被Claude全面赶超了!
如对AI智能体相关信息感兴趣,或需进一步交流,请关注微信公众号【AI智能体研究】