【最新】OpenAI震撼发布全新模型，GPT-3.5光荣退役，引领大模型成本两年内狂降99%的革新在科技界掀起新一波浪潮

在科技界掀起新一波浪潮的OpenAI，近日突发重磅新模型——GPT-4o mini，这款模型不仅能力直逼原版GPT-4，更在价格上实现了惊人的飞跃

随着GPT-4o mini的登场，昔日的明星模型GPT-3.5在ChatGPT应用中已正式退役，取而代之的是更为强大且经济的GPT-4o mini，免费用户现已能直接体验这一升级。同时，配套的API也已全面开放，支持高达128k的输入tokens（涵盖图像与文本），并突破性地支持16k输出tokens，远超近期竞争对手Claude 3.5 Sonnet的8k输出能力。

GPT-4o mini凭借其低成本、低延迟的特性，被官方强烈推荐用于多种高需求场景，包括链式或并行化模型调用、处理大规模上下文输入（如完整代码库或对话历史）以及实现快速、实时的文本交互（如客服系统）。更令人振奋的是，未来几天内，用户还将有机会参与GPT-4o mini的微调过程，进一步定制模型以满足个性化需求。

GPT-4o mini 是 OpenAI 推出的一款轻量化大语言模型，它在保持高性能的同时大幅减少了资源消耗，使得更多用户可以轻松访问并利用其先进的自然语言处理能力。以下是 GPT-4o mini 的一些关键技术内核：

轻量化设计参数减少：通过优化算法和模型结构，显著减少了模型的参数数量，降低了计算复杂度。模型压缩技术：应用了多种压缩方法，如量化、剪枝等，进一步缩小了模型体积，提高了加载速度。
高效算法改进的Transformer架构：继承了 GPT 系列的核心 Transformer 架构，并进行了针对性优化，以提高效率和性能。稀疏激活机制：引入了稀疏激活（sparse activation）技术，使得模型只在必要时激活特定神经元，从而节省计算资源。
指令层次结构安全策略增强的安全性：作为首个使用“指令层次结构”安全策略的 AI 模型，GPT-4o mini 在追求高性能和低成本的同时更加注重用户的安全。OpenAI 邀请了多位跨领域专家对模型进行了风险评估，并根据反馈对模型进行了优化，提高了模型的鲁棒性和输出可靠性。
多模态支持文本与视觉双重输入：GPT-4o mini 支持多模态融合能力，能够处理和生成基于文本和图像的数据类型响应，为跨模态内容的应用开辟了新纪元。上下文理解扩展：支持高达 128K tokens 的上下文输入以及 16K tokens 的输出长度，极大地增强了对话、写作等场景中的表现力。那我们该怎么使用GPT4o呢？

参考文章：

报告丨清华大学：从ChatGPT到AIGC发展（近200页PPT）

AIGC (AI-Generated Content) 技术深度探索：现状、挑战与未来愿景

北大最新综述精读：RAG在AIGC中的前世今生，覆盖300篇论文！

《万字长文带你解读AIGC》系列之技术篇

36氪研究院｜2024年AIGC行业研究：多模态大模型与商业应用