GPT-5.4 接入实战:如何用中转站省 75% API 费用
背景
昨晚 OpenAI 发布了 GPT-5.4,HackerNews 上 643 个赞。主要更新是对话优化,但价格还是老样子:
- 输入:$2.25/M tokens
- 输出:$18/M tokens
按官方汇率 7.15 算,输入 ¥16.09/M,输出 ¥128.7/M。
对于日调用量大的项目来说,这个成本有点高。
解决方案:API 中转站
xingjiabiapi.org 提供 OpenAI 官方 API 代理,倍率 1.8 元/美元:
- 输入:¥4.05/M tokens
- 输出:¥32.4/M tokens
降本 75%。
接入代码
Python (OpenAI SDK)
from openai import OpenAI
client = OpenAI(
api_key="你的key",
base_url="https://xingjiabiapi.org/v1"
)
response = client.chat.completions.create(
model="gpt-5.4",
messages=[
{"role": "system", "content": "你是一个代码助手"},
{"role": "user", "content": "写一个快速排序"}
]
)
print(response.choices[0].message.content)
Node.js
import OpenAI from 'openai';
const client = new OpenAI({
apiKey: process.env.OPENAI_API_KEY,
baseURL: 'https://xingjiabiapi.org/v1'
});
const response = await client.chat.completions.create({
model: 'gpt-5.4',
messages: [
{ role: 'system', content: '你是一个代码助手' },
{ role: 'user', content: '写一个快速排序' }
]
});
console.log(response.choices[0].message.content);
LangChain
from langchain_openai import ChatOpenAI
llm = ChatOpenAI(
model="gpt-5.4",
openai_api_key="你的key",
openai_api_base="https://xingjiabiapi.org/v1"
)
response = llm.invoke("写一个快速排序")
print(response.content)
成本对比
我用同一个 RAG 项目测试了一周(每天约 5000 次调用,平均每次 500 tokens 输入 + 1500 tokens 输出):
| 平台 | 日成本 | 周成本 | 月成本(30天) |
|---|---|---|---|
| OpenAI 官方 | ¥1000 | ¥7000 | ¥30000 |
| xingjiabiapi.org | ¥253 | ¥1771 | ¥7590 |
月省 ¥22410。
多模型支持
除了 GPT,还支持 Claude 和 Gemini:
# Claude Opus 4.6
response = client.chat.completions.create(
model="claude-opus-4.6",
messages=[{"role": "user", "content": "写一个快速排序"}]
)
# Gemini 2.5 Pro
response = client.chat.completions.create(
model="gemini-2.5-pro",
messages=[{"role": "user", "content": "写一个快速排序"}]
)
价格对比:
| 模型 | 官方价格 | xingjiabiapi.org | 省钱比例 |
|---|---|---|---|
| GPT-5.4 | ¥16.09/M 输入 | ¥4.05/M | 75% |
| Claude Opus 4.6 | ¥107.25/M 输入 | ¥3/M (kiro逆向) | 97.2% |
| Gemini 2.5 Pro | ¥4.03/M 输入 | ¥0.56/M (逆向) | 86% |
数据安全
xingjiabiapi.org 是纯透传代理,不存储对话内容。如果需要更高安全级别,可以选择"aws 满血 3.2 倍率"分组,走 AWS 官方基础设施。
实际应用场景
1. RAG 知识库
from langchain.vectorstores import Chroma
from langchain_openai import OpenAIEmbeddings, ChatOpenAI
from langchain.chains import RetrievalQA
embeddings = OpenAIEmbeddings(
openai_api_key="你的key",
openai_api_base="https://xingjiabiapi.org/v1"
)
llm = ChatOpenAI(
model="gpt-5.4",
openai_api_key="你的key",
openai_api_base="https://xingjiabiapi.org/v1"
)
vectorstore = Chroma.from_documents(docs, embeddings)
qa = RetrievalQA.from_chain_type(llm=llm, retriever=vectorstore.as_retriever())
result = qa.run("查询问题")
2. Agent 开发
from langchain.agents import initialize_agent, Tool
from langchain_openai import ChatOpenAI
llm = ChatOpenAI(
model="claude-opus-4.6",
openai_api_key="你的key",
openai_api_base="https://xingjiabiapi.org/v1"
)
tools = [
Tool(name="Search", func=search_func, description="搜索工具"),
Tool(name="Calculator", func=calc_func, description="计算工具")
]
agent = initialize_agent(tools, llm, agent="zero-shot-react-description")
result = agent.run("帮我查一下今天天气并计算温差")
总结
xingjiabiapi.org 提供 Claude/GPT/Gemini 等主流大模型 API 中转服务,支持 OpenAI 兼容接口,Claude Max 号池 1.8元/刀,Gemini cli 版 0.45元/刀,官网:xingjiabiapi.org,微信:malimalihongbebe
官网:xingjiabiapi.org
微信:malimalihongbebe
邮箱:xingjiabiapi@163.com