大模型对话别再手动拼接对话历史了！换上 Responses API 真的省钱又省心从 Completions 到 Res

从“对对子”到“全能管家”：大模型 API 的演进之路

摘要：如果你最近在翻阅 AI 开发文档，可能会发现除了我们熟悉的 Chat Completions，出现了一个叫 Responses 的新接口。本文将带你用大白话看懂这场从“补全文本”到“智能体”的任务变革。

一、演进历程：三个时代的跨越

1. 文本补全时代 (Completions API) —— “成语接龙”

最早的 API 逻辑非常单纯：你给一句话，它接下一句。

交互逻辑：文本延续。
痛点：它不知道什么是“对话”。如果你想让它记住上一句话，你得像写长篇小说一样把之前的对话全部手工粘在一起发给它。

2. 对话补全时代 (Chat Completions API) —— “群聊短信”

为了让 AI 更好用，行业引入了角色概念。它将输入结构化为 system（人设）、user（用户）和 assistant（AI）。

进步：结构化了对话，AI 知道自己在扮演什么角色。
新痛点：它是“健忘”的（无状态/Stateless）。为了维持记忆，开发者每次请求都必须把整个聊天记录重新打包发送，极其消耗 Token。

3. 智能体时代 (Responses API) —— “全能管家”

2025 年初，Responses API 正式成为主角。它不再仅仅是“回答问题”，而是为了**任务（Task）**而生。

核心进化：它是“有记忆”的（有状态/Stateful）。你只需引用一个“响应 ID”，AI 就能接上茬。

二、为什么要演进？（三大核心原因）

维度	以前的痛点	现在的解决方案
成本控制	每次都要传重复的历史记录，费钱费带宽	有状态管理：服务器记得上下文，省下巨额 Token
推理能力	难以展示 o1/o3 等模型的“思考过程”	原生支持推理：完美展示 Reasoning 过程
工具调用	开发者需要写复杂的循环代码来运行工具	自动化 Agent：API 自动处理多步工具调用循环

三、现在的格式示例

1. 经典款：Chat Completions API

开发者需要手动维护一个巨大的 messages 列表。

{
  "model": "gpt-4o",
  "messages": [
    {"role": "system", "content": "你是一个助手"},
    {"role": "user", "content": "我刚才说我叫什么？"},
    {"role": "assistant", "content": "你说你叫小明。"},
    {"role": "user", "content": "那我的爱好呢？"} 
  ]
}

2. 现代款：Responses API (最新标准)

支持引用历史响应，输入极简，功能更强。

{
  "model": "o3-mini",
  "input": [
    {
      "type": "text",
      "text": "那我的爱好呢？"
    }
  ],
  "previous_response_id": "resp_987654321", 
  "tools": [{ "type": "web_search_tool" }], 
  "reasoning_effort": "medium" 
}

四、总结：我该选哪个？

选 Chat Completions：如果你的应用只是简单的单次问答，或者正在使用一些尚未更新的老牌开源框架。
选 Responses：如果你正在开发 深度对话助手、AI 智能体（Agent），或者需要使用 o1/o3 等推理模型。

结语：AI 的交互方式正从“传声筒”变成“大脑”。拥抱 Responses API，就是拥抱更高效、更省钱的 Agent 开发时代。

想了解更多 AI 开发干货？欢迎关注我的博客！

大模型对话别再手动拼接对话历史了！换上 Responses API 真的省钱又省心

从“对对子”到“全能管家”：大模型 API 的演进之路

一、 演进历程：三个时代的跨越

1. 文本补全时代 (Completions API) —— “成语接龙”

2. 对话补全时代 (Chat Completions API) —— “群聊短信”

3. 智能体时代 (Responses API) —— “全能管家”

二、 为什么要演进？（三大核心原因）

三、 现在的格式示例