Cohere 公司发布了最新版本的 Command R 和 Command R+ 模型,这些企业级 AI 模型经过优化,专为商业应用场景设计。新版模型在编码、数学、推理和延迟方面进行了显著提升,特别是在处理检索增强生成 (RAG) 和多语言支持方面表现出色。
与之前的 Command R 版本相比, command-r-08-2024
吞吐量提高了约 50%,延迟降低了 20%,同时将服务模型所需的硬件占用空间减少了一半。同样,与之前的 Command R+ 版本相比, command-r-plus-08-2024
吞吐量提高了约 50%,延迟降低了 25%,同时硬件占用空间保持不变。
新版的 Command R 和 Command R+ 模型进行了以下几方面的升级:
- 性能提升:
- 编码:模型在处理编程任务时的效率和准确性有了显著提高。
- 数学:模型在数学推理和计算方面的能力得到了增强。
- 推理:推理能力得到了改进,使得模型能够更好地处理复杂问题。
- 延迟:新版本在处理速度方面做了优化,减少了响应时间,提升了整体效率。
- 多语言支持与检索增强生成 (RAG):
- 多语言覆盖:支持超过10种语言,帮助全球企业更好地进行业务操作。
- RAG 精度:改进了多语言环境下的检索增强生成功能,增加了行内引用,帮助用户验证模型输出,减少错误或“幻觉”的产生。
- 自定义能力:提升了自定义功能,可以根据用户需求减少延迟并提高多语言 RAG 的质量。
- 结构化数据分析:
- 数据分析:增强了模型对结构化数据(如表格数据)的处理能力,适用于金融、SaaS、咨询等行业,帮助企业更好地从数据中获取洞察。
- 易用性改进:
- 结构化输出:提升了生成 JSON 数据的准确性,并增强了对指令的遵循能力,减少了对非语义性提示变化的敏感性。
- 安全模式:增加了两种安全模式选项(严格模式和情境模式),以便企业根据不同的应用场景,选择适合的功能和安全性平衡。
这些升级旨在提高模型的效率、准确性和用户体验,同时确保在企业应用中的数据安全性和隐私保护。
定价信息:
- Command R 08-2024: 输入 Tokens 每百万0.60
- Command R+ 08-2024: 输入 Tokens 每百万10.00
性能对比
人类偏好评价对比:Command-R 08-2024 与原版 Command R 在能力特定的提示集上进行的全面对比