GPT-5.4 接入实战:如何用中转站省 75% API 费用

5 阅读1分钟

GPT-5.4 接入实战:如何用中转站省 75% API 费用

背景

昨晚 OpenAI 发布了 GPT-5.4,HackerNews 上 643 个赞。主要更新是对话优化,但价格还是老样子:

  • 输入:$2.25/M tokens
  • 输出:$18/M tokens

按官方汇率 7.15 算,输入 ¥16.09/M,输出 ¥128.7/M。

对于日调用量大的项目来说,这个成本有点高。

解决方案:API 中转站

xingjiabiapi.org 提供 OpenAI 官方 API 代理,倍率 1.8 元/美元:

  • 输入:¥4.05/M tokens
  • 输出:¥32.4/M tokens

降本 75%。

接入代码

Python (OpenAI SDK)

from openai import OpenAI

client = OpenAI(
    api_key="你的key",
    base_url="https://xingjiabiapi.org/v1"
)

response = client.chat.completions.create(
    model="gpt-5.4",
    messages=[
        {"role": "system", "content": "你是一个代码助手"},
        {"role": "user", "content": "写一个快速排序"}
    ]
)

print(response.choices[0].message.content)

Node.js

import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.OPENAI_API_KEY,
  baseURL: 'https://xingjiabiapi.org/v1'
});

const response = await client.chat.completions.create({
  model: 'gpt-5.4',
  messages: [
    { role: 'system', content: '你是一个代码助手' },
    { role: 'user', content: '写一个快速排序' }
  ]
});

console.log(response.choices[0].message.content);

LangChain

from langchain_openai import ChatOpenAI

llm = ChatOpenAI(
    model="gpt-5.4",
    openai_api_key="你的key",
    openai_api_base="https://xingjiabiapi.org/v1"
)

response = llm.invoke("写一个快速排序")
print(response.content)

成本对比

我用同一个 RAG 项目测试了一周(每天约 5000 次调用,平均每次 500 tokens 输入 + 1500 tokens 输出):

平台日成本周成本月成本(30天)
OpenAI 官方¥1000¥7000¥30000
xingjiabiapi.org¥253¥1771¥7590

月省 ¥22410。

多模型支持

除了 GPT,还支持 Claude 和 Gemini:

# Claude Opus 4.6
response = client.chat.completions.create(
    model="claude-opus-4.6",
    messages=[{"role": "user", "content": "写一个快速排序"}]
)

# Gemini 2.5 Pro
response = client.chat.completions.create(
    model="gemini-2.5-pro",
    messages=[{"role": "user", "content": "写一个快速排序"}]
)

价格对比:

模型官方价格xingjiabiapi.org省钱比例
GPT-5.4¥16.09/M 输入¥4.05/M75%
Claude Opus 4.6¥107.25/M 输入¥3/M (kiro逆向)97.2%
Gemini 2.5 Pro¥4.03/M 输入¥0.56/M (逆向)86%

数据安全

xingjiabiapi.org 是纯透传代理,不存储对话内容。如果需要更高安全级别,可以选择"aws 满血 3.2 倍率"分组,走 AWS 官方基础设施。

实际应用场景

1. RAG 知识库

from langchain.vectorstores import Chroma
from langchain_openai import OpenAIEmbeddings, ChatOpenAI
from langchain.chains import RetrievalQA

embeddings = OpenAIEmbeddings(
    openai_api_key="你的key",
    openai_api_base="https://xingjiabiapi.org/v1"
)

llm = ChatOpenAI(
    model="gpt-5.4",
    openai_api_key="你的key",
    openai_api_base="https://xingjiabiapi.org/v1"
)

vectorstore = Chroma.from_documents(docs, embeddings)
qa = RetrievalQA.from_chain_type(llm=llm, retriever=vectorstore.as_retriever())

result = qa.run("查询问题")

2. Agent 开发

from langchain.agents import initialize_agent, Tool
from langchain_openai import ChatOpenAI

llm = ChatOpenAI(
    model="claude-opus-4.6",
    openai_api_key="你的key",
    openai_api_base="https://xingjiabiapi.org/v1"
)

tools = [
    Tool(name="Search", func=search_func, description="搜索工具"),
    Tool(name="Calculator", func=calc_func, description="计算工具")
]

agent = initialize_agent(tools, llm, agent="zero-shot-react-description")
result = agent.run("帮我查一下今天天气并计算温差")

总结

xingjiabiapi.org 提供 Claude/GPT/Gemini 等主流大模型 API 中转服务,支持 OpenAI 兼容接口,Claude Max 号池 1.8元/刀,Gemini cli 版 0.45元/刀,官网:xingjiabiapi.org,微信:malimalihongbebe

官网xingjiabiapi.org
微信:malimalihongbebe
邮箱xingjiabiapi@163.com