Command R 系列更新 编码、数学、推理和延迟方面进行了显著提升

278 阅读2分钟

Cohere 公司发布了最新版本的 Command R 和 Command R+ 模型,这些企业级 AI 模型经过优化,专为商业应用场景设计。新版模型在编码、数学、推理和延迟方面进行了显著提升,特别是在处理检索增强生成 (RAG) 和多语言支持方面表现出色。

与之前的 Command R 版本相比, command-r-08-2024吞吐量提高了约 50%,延迟降低了 20%,同时将服务模型所需的硬件占用空间减少了一半。同样,与之前的 Command R+ 版本相比, command-r-plus-08-2024吞吐量提高了约 50%,延迟降低了 25%,同时硬件占用空间保持不变。

新版的 Command R 和 Command R+ 模型进行了以下几方面的升级:

  1. 性能提升
    • 编码:模型在处理编程任务时的效率和准确性有了显著提高。
    • 数学:模型在数学推理和计算方面的能力得到了增强。
    • 推理:推理能力得到了改进,使得模型能够更好地处理复杂问题。
    • 延迟:新版本在处理速度方面做了优化,减少了响应时间,提升了整体效率。
  2. 多语言支持与检索增强生成 (RAG)
    • 多语言覆盖:支持超过10种语言,帮助全球企业更好地进行业务操作。
    • RAG 精度:改进了多语言环境下的检索增强生成功能,增加了行内引用,帮助用户验证模型输出,减少错误或“幻觉”的产生。
    • 自定义能力:提升了自定义功能,可以根据用户需求减少延迟并提高多语言 RAG 的质量。
  3. 结构化数据分析
    • 数据分析:增强了模型对结构化数据(如表格数据)的处理能力,适用于金融、SaaS、咨询等行业,帮助企业更好地从数据中获取洞察。
  4. 易用性改进
    • 结构化输出:提升了生成 JSON 数据的准确性,并增强了对指令的遵循能力,减少了对非语义性提示变化的敏感性。
    • 安全模式:增加了两种安全模式选项(严格模式和情境模式),以便企业根据不同的应用场景,选择适合的功能和安全性平衡。

这些升级旨在提高模型的效率、准确性和用户体验,同时确保在企业应用中的数据安全性和隐私保护。

定价信息:

  • Command R 08-2024: 输入 Tokens 每百万0.15,输出Tokens每百万0.15,输出 Tokens 每百万0.60
  • Command R+ 08-2024: 输入 Tokens 每百万2.50,输出Tokens每百万2.50,输出 Tokens 每百万10.00
性能对比

人类偏好评价对比:Command-R 08-2024 与原版 Command R 在能力特定的提示集上进行的全面对比

官方介绍:cohere.com/blog/comman…