Anthropic 重磅发布 Claude Opus 4.5

113 阅读3分钟

Image

Anthropic 正式发布了最新旗舰模型 Claude Opus 4.5。 它在 编码能力、智能代理 (agents)、办公自动化(表格、幻灯片)、研究任务 等多个方面都取得了大幅跃升,被官方称为“迄今为止最智能、效率最优的 Claude 模型”。

这次更新不仅是模型能力的提升,也是未来 AI 助手全面进入“可执行复杂任务”的重要前兆。

目前已经可以通过 网站 www.aicodemirror.com 免费试用!!! 注册就送2000积分,通过邀请注册再多送1000积分。


一、核心能力全面提升

1. 代码能力(软件工程)大幅增强

Image

Image

Opus 4.5 在 SWE-bench Verified(真实世界软件工程任务) 上取得领先成绩,官方和早期用户普遍反馈:

  • 能独立分析复杂、多系统的 bug
  • 能进行完整修复,而旧模型往往无从下手
  • 在代码生成、评审、重构、迁移等任务中表现显著提升
  • 输出 token 更经济,性价比更高

这意味着,Opus 4.5 已不仅是能够“写代码”,而是可以帮助开发者 处理真实项目的问题


2. 办公与生产力功能全面加强

Opus 4.5 在以下任务上提升显著:

  • Excel 电子表格:任务链处理、数据分析、自动填表
  • PPT 制作:从大纲到完整内容自动生成
  • 深度研究:可长链分析、引用资料、合成报告
  • Chrome / Excel 插件深度整合:更像一个随时可调用的“数字实习生”

办公自动化的能力非常突出,明显朝着“AI 全流程助手”迈进。


3. 安全性与对抗性增强

Image

Anthropic 表示 Opus 4.5 是他们迄今为止“最对齐(aligned)”的模型,包括:

  • 耐受恶意提示(prompt injection)能力增强
  • 对高风险请求的防御进一步强化
  • 多轮任务的安全边界更稳定

尽管如此,一些第三方机构也指出,它仍有少量安全测试未达标——这也是现阶段所有前沿模型共同面对的挑战。


二、使用场景示例:AI 不再只是回答,而是能做事

Opus 4.5 的能力重点落在“复杂任务执行”,例如:

  • 自动找出某个大型仓库里的 bug 并修复
  • 根据财务表格生成完整商业分析报告
  • 自动制作一整套演示文稿
  • 作为代理(agent)持续执行跨系统操作
  • 自动调用工具、执行脚本、整理结果

在官方技术文章中,Anthropic 引入 Tool Search Tool: 模型会在需要使用工具时才动态加载工具定义,从而节省 token 成本——这是向“更接近真正 agent”的重要一步。


三、价格与可用性

  • API 模型名称claude-opus-4-5-20251101

  • 价格

    • 输入:$5 / 百万 token
    • 输出:$25 / 百万 token

比前代在能力更强的同时,价格保持稳定,只有原来 Opus 4.1 的 1/3,整体性价比更高。

Opus 4.5 已在:

  • Anthropic 官方 App
  • Claude 桌面版
  • Chrome 插件
  • Excel 插件
  • API(支持 AWS、Google Cloud、Azure)

全线开放使用。


四、意义与未来展望

这次发布的重要性体现在:

  • AI 进入复杂多步骤任务执行时代,不仅是“聊天”,而是“能行动”
  • 与 Google Gemini 3 的竞争进入更激烈阶段
  • 企业级客户将看到 AI 在办公、工程、流程自动化上的真实效率提升
  • 对开发者来说,更大的上下文、更稳的 tool-use 让 agent 的构建复杂度下降

整体来说,Opus 4.5 是 Anthropic 在“超级生产力工具 + 专业智能助手”方向的一次重大突破。


总结

在这里插入图片描述

Claude Opus 4.5 是一款面向未来的旗舰模型—— 它不仅更聪明,更高效,更安全,也更“能完成实际工作”。

未来基于 Opus 的自动化工作流、AI 助理、智能代理将更快速落地。 无论你是开发者、运营人员还是研究人员,Opus 4.5 都可能成为你日常工作的新核心“底层工具”。