首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
147API
掘友等级
深圳开放未来智能有限公司
🌐147ai.com-海内外大模型API 中转服务商 AI知识分享 / 大模型API中转
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
147API
@深圳开放未来智能有限公司
·
7小时前
关注
结构化输出稳定性工程:Pydantic 校验 + 修复重试的最小可用模板
这篇直接给你“能抄走”的最小闭环:**约束 → 提取JSON → 校验 → 修复重试(有限次)→ 降级**,并附 Python 模板(把 `call_llm` 换成你的调用...
0
评论
分享
147API
@深圳开放未来智能有限公司
·
1天前
关注
大模型降本三板斧:缓存 / 摘要压缩 / 多模型路由(可复制 Python 骨架)
这篇直接给你一个工程可落地的三板斧组合: 1) 缓存:少调一次就少花一次钱 2) 摘要/压缩:把 token 控进预算 3) 多模型路由:把请求派给“合适的模型”,并有回退...
0
评论
分享
147API
@深圳开放未来智能有限公司
·
2天前
关注
计费/限流变了别慌:Python 情景评估“旧价vs新价”成本冲击 + 并发估算
这篇直接给你一份最小 Python 脚本:读 jsonl 日志,统计 P50/P95 token 和延迟,然后输出成本冲击与并发估算。...
0
评论
分享
147API
@深圳开放未来智能有限公司
·
3天前
关注
LLM 推理成本与容量规划:Python 读日志算 P50/P95 token、月账单、并发
上线大模型应用后,“成本/延迟”几乎都会比你想象的复杂: 不是因为公式难,而是因为你没把数据打出来。 这篇给你一个工程可落地的最小方案。...
0
评论
分享
147API
@深圳开放未来智能有限公司
·
8天前
关注
LLM 应用评测闭环:eval.jsonl + LLM-as-judge + 线上指标(含 Python 最小实现)
你改 prompt、换模型、加 RAG、加工具调用之后,最难的问题往往不是“怎么改”,而是: 这篇直接给你一个最小可落地的评测闭环...
0
评论
分享
147API
@深圳开放未来智能有限公司
·
9天前
关注
长上下文 vs RAG:工程决策表 + token/成本测算 + 最小可运行 Python 脚手架
这篇给你可落地的三件套: 决策表:长上下文 / RAG / 混合怎么选 token/成本测算:不求精确,但要能估数量级 最小可运行脚手架:同一份回归集对比两条链路(长上下文...
0
评论
分享
147API
@深圳开放未来智能有限公司
·
10天前
关注
向量库选型与 Hybrid 检索配方:pgvector / Milvus / ES / FAISS(含 Python 伪代码 + hit@k 回归脚手架)
你需要的是:Hybrid(BM25+Vector)+ 可观测 + 评测闭环。 这篇直接给你工程可落地的东西。...
0
评论
分享
147API
@深圳开放未来智能有限公司
·
11天前
关注
Chunk 分块工程模板:按文档类型切分 + 参数表 + TopK 排错 + hit@k 脚手架
RAG(知识库问答)里,分块(chunking)经常被低估: 你后面检索、重排、prompt、甚至换模型的上限,很大程度由 chunk 决定。 这篇不讲“分块玄学”,直接给...
0
评论
分享
147API
@深圳开放未来智能有限公司
·
12天前
关注
RAG 全链路排错清单:打印 TopK、算 hit@k、做引用校验(含 Python 最小脚手架)
RAG(知识库问答)最难受的不是“模型答错”,而是: 我先给一个工程结论: RAG 失败 80% 在检索链路,不在生成。 所以这篇不讲玄学 prompt,直接给你一套“工程...
0
评论
分享
147API
@深圳开放未来智能有限公司
·
16天前
关注
把大模型 PoC 做成可上线项目:7 步交付清单 + 验收标准 + 评测脚手架
大模型项目最常见的翻车方式不是“做不出来”,而是: PoC 演示很强,上线效果不稳、成本不可控、问题不可定位。 这篇给你一套工程化路线图:从 PoC 到生产,拆成 7 步...
0
评论
分享
147API
@深圳开放未来智能有限公司
·
17天前
关注
闭源 API / 私有化 / 混合方案怎么选?(附决策树 + 成本拆解表 + 接入层骨架)
这篇我给你三个可直接拿去用的东西: 决策树:按问题走就能选 成本拆解表:别只算 token 接入层骨架:后面做路由/灰度/评测更省事...
0
评论
分享
147API
@深圳开放未来智能有限公司
·
18天前
关注
Chat / RAG / Agent 最小实现模板:一张选型表 + 三段 Python 骨架
如果你想做大模型落地,最容易走偏的地方不是“模型选错”,而是形态选错: Chat 能搞定的事情你上 Agent,RAG 该上的地方你用 Prompt 硬编,最后就是维护成本...
3
评论
分享
147API
@深圳开放未来智能有限公司
·
21天前
关注
10分钟跑通 147ai:OpenAI 兼容 chat/completions 最小模板(curl + Python)
10分钟跑通 147ai:OpenAI 兼容 chat/completions 最小模板(curl + Python)...
1
1
分享
个人成就
文章被点赞
4
文章被阅读
398
掘力值
157
关注了
0
关注者
0
收藏集
0
关注标签
12
加入于
2025-12-26