最近好忙,地表最强模型 Grok 3 刚出没多久,昨晚又一直在留意 DeepSeek 的第二个开源项目,没想到等来的却是 Anthropic 放出的深夜炸弹——全球首个混合推理模型 Claude 3.7 Sonnet 问世!
送大家几个API KEY测试这两个模型,额度有限,先到先得!
推荐使用 NextChat 或者 CherryStudio 两个应用,配置好以下参数:
API 地址:4.0.wokaai.com/v1/chat/com…
API KEY:sk-2BmlmsbTR1PuNd9gSvvLwKtuCuY0CFyg6MfjGJ5KO13T8uU7(Grok3请使用这个key)
sk-l9WohUOS6Ul49nMJ4YawqnZNH4DXaSScdtRlBIUkbz4ru3kO(Claude3.7请使用这个key)
模型名:claude-3-7-sonnet-20250219、claude-3-7-sonnet-thinking、grok-3、grok-3-deepsearch、grok-3-reasoner
以下是 Claude 3.7 的一些亮点介绍!
一、核心亮点:混合推理与智能编程的完美融合
(一)Claude 3.7 Sonnet:混合推理的先驱
Claude 3.7 Sonnet 作为 Anthropic 的最新力作,是首个混合推理模型(Hybrid Reasoning Model)。它最大的优势在于能够灵活切换即时响应与深度推理模式。在标准模式下,它能针对简单查询或即时响应需求,提供接近实时的答案,如同 ChatGPT 或早期 Claude 模型般迅速;而在扩展思考模式下,面对复杂的多步骤任务,它能模拟人类思考过程,逐步剖析问题、探索多种可能性,最终给出精准且深思熟虑的回答。这种在快速回答和深入推理之间的无缝切换,使它在处理数学、物理、指令跟随和编码任务时,展现出超越前代模型的卓越性能。
(二)Claude Code:开发者的智能编程伴侣
Claude Code 是 Anthropic 为开发者量身打造的智能代码助手,集成了代码搜索、自动修改、测试以及 GitHub 集成等强大功能。它不仅能一次性完成复杂编程任务,大幅节省开发者的时间和精力,还能在代码库管理、全栈开发等方面提供高效支持,助力开发者提升工作效率和代码质量。
二、性能优化:成本与质量的精准平衡
Claude 3.7 Sonnet 通过 API 让用户可以自由控制 AI 的思考 token 数量,从而灵活权衡速度与质量。例如,在需要快速获取答案时,用户可设置较低的 token 限制,以实现即时响应;而在进行学术研究或复杂编码任务时,则可允许 AI 更长时间思考,获取高质量、深度推理的结果。这种用户控制权的赋予,是 Anthropic 相较于其他模型的创新之处,用户无需在不同模型间切换,在一个模型内调整参数即可满足多样需求。
在编程能力方面,Claude 3.7 Sonnet 实现了全面优化。在代码生成、前端开发、复杂代码库管理以及全栈开发等领域,其性能大幅提升,在多项权威测试中击败同类 AI 模型。在 SWE-bench 基准测试中,Claude 3.7 Sonnet 在 “定制支架” 下的准确率高达 70.3%(基础表现为 62.3%),而其他竞品模型如 Claude 3.5 Sonnet、OpenAI o1、OpenAI o3 - mini(高)和 DeepSeek R1 等,准确率均在 49% 左右。
三、安全性与透明性:AI 发展的坚实保障
在安全性提升上,Claude 3.7 Sonnet 取得显著成效。它误拒无害请求的概率降低了 45%,同时增强了对提示注入攻击(PromptInjection Attacks)的防御能力,能够更安全地处理敏感信息,减少被恶意操纵的风险。
在透明性方面,Claude 3.7 Sonnet 通过 “草稿纸” 功能,将模型的推理步骤直观呈现给用户,增加了模型的可解释性。用户不仅能获得高质量答案,还能追踪推理路径,发现潜在错误或提出改进建议,使 AI 的输出更加值得信赖。
四、定价与可用性:多维度满足用户需求
(一)定价策略
Claude 3.7 Sonnet 的定价模式为每百万输入令牌 3 美元,每百万输出令牌 15 美元。与 OpenAI o3 - mini(输入 1.10 美元 / 百万,输出 4.40 美元 / 百万)和 DeepSeek R1(输入 0.55 美元 / 百万,输出 2.19 美元 / 百万)相比,虽价格偏高,但考虑到其独特的混合能力,或能减少用户对多种模型的需求,从长期来看,可能为用户带来更优的性价比。
(二)可用性
在可用性上,订阅用户涵盖免费版、Pro、Team 和 Enterprise 用户均可访问 Claude 3.7 Sonnet,不过扩展思考模式仅限付费用户使用。API 访问可通过沃卡全模型API 4.0.wokaai.com 无限制使用。