引言:智能模型新时代的开启
OpenAI 始终致力于将智能技术带入更多人的日常生活。近日,正式推出了GPT-4o Mini,这一小型模型以其极高的性价比成为市场焦点。通过大幅降低成本,这款新模型将推动 AI 应用的普及,开启智能模型的新篇章。
但是想用GPT-4o还是要开通PLUS,可以参考这篇文章国内升级ChatGPT-Plus教程,订阅GTP4.0o
GPT-4o Mini 的优势
GPT-4o Mini 在多项核心领域展现出色性能,尤其是在文本智能和多模态推理方面表现卓越。在 MMLU 测试中取得了 82% 的高分,并在 LMSYS 排行榜上的对话偏好方面超越了 GPT-4。这款模型的定价为每百万输入 token 仅 15 美分,每百万输出 token 60 美分,相比之前的前沿模型,价格低了一个数量级,比 GPT-3.5 Turbo 更是便宜超过 60%。
多任务处理能力
GPT-4o Mini 具备低成本和低延迟的优势,使其能够高效处理多种任务,如:
- 并行调用多个 API 或执行多个模型调用
- 处理大量上下文信息(例如完整的代码库或对话历史)
- 快速响应用户查询,提供实时文本反馈(如客户支持聊天机器人)
强大的多模态支持
目前,GPT-4o Mini 支持文本和视觉输入输出,未来还将扩展至支持图像、视频和音频输入输出。其上下文窗口高达 128K tokens,每次请求支持最多 16K 输出 tokens,并且知识库已更新至 2023 年 10 月。改进后的 tokenizer 使处理非英语文本更加经济高效。
卓越的文本智能与多模态推理
GPT-4o Mini 在各类学术基准测试中表现卓越,超越了 GPT-3.5 Turbo 及其他小型模型。它支持与 GPT-4o 相同的语言范围,并在函数调用上表现强劲,开发者可以利用其构建与外部系统交互的应用。此外,它在长上下文处理方面也显著优于 GPT-3.5 Turbo。
关键基准测试表现
任务 | GPT-4o Mini | Gemini Flash | Claude Haiku |
---|---|---|---|
推理任务 | 82.0% | 77.9% | 73.8% |
数学和编码能力 | 87.0% (MGSM) | 75.5% | 71.7% |
编码性能 | 87.2% (HumanEval) | 71.5% | 75.9% |
多模态推理 | 59.4% (MMMU) | 56.1% | 50.2% |
价格与可用性
GPT-4o Mini 现已作为文本和视觉模型在 Assistants API、Chat Completions API 和 Batch API 中提供。开发者每百万输入 tokens 支付 15 美分,每百万输出 tokens 支付 60 美分(相当于标准书籍的 2500 页)。GPT-4o Mini 的微调功能也将在未来几天内推出。
从今天起,ChatGPT 的免费用户、Plus 用户和团队用户都可以访问 GPT-4o Mini,这款模型将取代 GPT-3.5。同时,企业用户也将在下周开始使用这一新模型,这与我们致力于让 AI 的益处惠及所有人的使命相一致。
未来展望
近年来,AI 技术突飞猛进,成本显著下降。GPT-4o Mini 的每 token 成本相比 2022 年推出的 text-davinci-003 下降了 99%。我们将继续努力,在降低成本的同时提升模型能力。
展望未来,智能模型将无缝集成到每个应用程序和网站中。GPT-4o Mini 正在为开发者铺平道路,使他们能够更高效、更经济地构建和扩展强大的 AI 应用。AI 的未来将变得更加普及、可靠,并深度融入我们的数字生活中。我们期待继续引领这一趋势。