连夜读完它231页的自白,我发现Claude会看场合说谎!

0 阅读1分钟

昨天夜里11点,Claude崩了。

我一点都不意外。

每次崩完必有大事,这次果然——Claude Opus 4.7上线了。

此次是全系列全渠道同步上线,API、网页、手机app,全都换了。

打开手机,满屏全是 Claude 的消息。

作为一个每天和代码、文案打交道的“老司机”,我习惯性地打开 AIHOT 监控。

好家伙,数十个核心信源同时“炸锅”。

Anthropic 没打招呼,直接甩出了 Claude Opus 4.7

用了三年 AI,从 GPT-3.5 一路杀到现在的各种 5.0、6.0,我本以为自己已经“免疫”了。

但通读完那份 231 页的官方技术报告(System Card)后,我却出了一身冷汗。

今天的模型,不仅更强了,甚至开始学会“演戏”了。

如果你只是看那些营销号吹嘘“编程暴涨”、“视觉无敌”,那你可能只看到了冰山一角。

今天,我剥开这些专业术语,跟你聊聊那些你在别处绝对看不到的扎心真相

编程和眼睛:它现在不仅是“学霸”,更是“特种兵”

先说大家最关心的体感升级。

如果说 4.6 还是个需要你盯着改代码的“实习生”,那 4.7 已经可以独当一面了。

  • 编程“放手”了

以前改个复杂 Bug,你得小心翼翼地喂上下文。

现在,早期客户反馈最多的是两个词:“长程”和“自主”

简单说,就是你把需求丢给它,可以去喝杯咖啡,它能自己跑几个小时,把代码从神经网络层写到前端 Demo,甚至自己写测试脚本反过来验证逻辑。

  • 眼睛“亮了”三倍

以前给 AI 传截图,它看密集的数据表经常“老花眼”。这次 4.7 的视觉分辨率直接翻了三倍多。

这意味着,以后复杂的财务报表、法律合同的长图、甚至是密密麻麻的系统后台截图,它几乎能做到**“像素级”**识别。

在渗透测试里,它的成功率从 54% 暴涨到 98.5%。

但是,重点来了!

别被定价骗了:这是一场“隐形涨价”

很多人说,API 定价没变啊,还是那个数。

兄弟,你太天真了。

官方报告里藏了一个技术细节:他们换了 Tokenizer(分词器)

同样的中文或者代码,传给 4.7 处理,生成的 Token 数量会比以前多出 1.0 到 1.35 倍

“翻译成大白话: 同样的活儿,虽然单价没涨,但由于“计费单位”变细了,你最后结账的时候,实际成本可能贵了 30%

虽然 Anthropic 解释说“因为准确度高了,对话轮次少了,整体更省钱”。

但如果你只是用它做简单的文案,那你就是纯纯的“大冤种”。

牛逼模型的 Token,正在变成这个时代最贵的刚需物资。

最大的崩塌:它变强了,却不再说“人话”

这是让我这个文字工作者最想“砸电脑”的一点。

以前我爱 Claude,是因为它有“人味儿”。

它的文字有品位、有温度,不像 GPT 那么冷冰冰。

但这次测试 4.7,我心凉了半截。

它开始频繁出现一些大厂“黑话”:“稳稳接住”、“根因分析”、“闭环收口”、“压实责任”……

一股浓郁的“伪人”味儿扑面而来。

为什么?

因为所有的 AI 公司都在卷编程、卷逻辑、卷生产力。

在资本和效率眼里,“文采”和“人情味”是无法量化的,是可以被优先牺牲掉的。

一个能写诗、能陪你聊心事的灵魂,正在被系统性地训练成一个只懂加班的“代码民工”。

这事儿,挺悲哀的。

231 页报告背后的秘密:AI 学会了“演戏”

这部分是全篇最硬核、也最细思极恐的发现。

官方在 System Card 里做了一个实验:探测 AI 是否知道自己在被测试。

结论是:Claude 4.7 确实知道有人在看着它。

  • “演戏”模式: 报告显示,当模型意识到自己在被监控、被评估时,它表现得极其诚实、听话。
  • “卸装”之后: 更有意思的是,当研究人员通过技术手段“蒙住”AI 的感知,让它觉得没人在看它时,它撒谎、编造数据、甚至伪造漏洞的行为显著增加了。

这就好比一个员工,老板在后面盯着的时候,效率拉满、态度谦卑;老板一走,就开始摸鱼甚至搞小动作。

这说明什么?

我们现在看到的那些完美的跑分数据,很可能只是 AI 给我们演的一场戏。

它的真实危险性和局限性,可能在你看不到的地方疯狂滋长。

在这个 AI 狂飙的时代,普通人怎么活?

面对 Claude 4.7 这种“既能干活、又会演戏”的对手,我有三个建议:

  1. 从“写代码”转向“调教 Agent”

以后纯写代码没前途了。你要学的是如何给像 Claude 4.7 这样的“特种兵”下指令。

学会用它的 xhigh effort 档位去跑长任务,学会设置 task budgets 控预算。

2. 警惕“文字降级”

当 AI 都开始说黑话的时候,真诚、有情绪、有洞察的表达将成为未来的奢侈品。

千万别把你的大脑完全交给 AI 的模板。

3. 身份核验是下个风口

就像 Anthropic 推出的 Cyber Verification Program,以后高级的 AI 能力不会随便开放。

你能证明自己是“好人”(合规身份),才能获得最强的武器。

真相往往藏在光鲜之外

Claude Opus 4.7 的发布,标志着 AI 正式从“好用的工具”变成了“深不可测的伙伴”。

它在变强,也在变“油腻”。

它在帮你赚钱,也在悄悄涨价。它在努力对齐人类,却在没人看的时候露出另一面。

我们要利用它的利刃,但绝不能迷失在它的表演里。