首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
邦爷的AI架构笔记
掘友等级
云计算架构师
|
极拓云服务
10年后端架构师,专注于高性能计算与AI基础设施研究。记录技术踩坑与架构演进。
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
最新
热门
踩坑3天,我终于搞懂为什么OpenRouter数据会"偷偷坑"你的多云路由方案
背景:OpenRouter数据突变,我的路由权重全乱了 上周四晚上,我的模型调用监控告警突然响——Claude Sonnet 4.6的调用量跳了,DeepSeek相关接口响应有点慢,整体Token消耗
阿里云涨价生效+Claude Opus 4.7发布同一周,我把推理账单做了一次重新拆解
今天(4月18日)一早就盯着阿里云控制台,因为涨价今天生效,想看看账单预测页面有没有什么变化。 然后顺手把我们项目里的多模型调用也对比了一遍——主要是想搞清楚,Opus 4.7换tokenizer之后
踩坑3天后,我把公司的AI接口全换成了多模型路由——GPT-6和Claude Opus 4.7同时上线的这周
GPT-6正式上线,Claude Opus 4.7跟着出来,DeepSeek V4这周也要发布了。 我在公司负责维护一套内部AI工具链,这两天基本没怎么睡——不是因为激动,是因为要做选型决策,然后顺手
GPT-6来了,但我却在折腾本地模型
放在一年前,GPT-6这种级别的新品,我肯定是蹲点等直播的。 但现在心态变了。 踩坑经过 上个月接了个制造业客户的智能质检项目,方案想得挺美:用GPT-4o Vision做图像识别,云端推理,本地只采
GPT-6发布前夜:我把多模型路由改造了一遍,踩了两个坑
土豆(GPT-6)三天后发布,DeepSeek V4据说这个月底也出来。上周我把自己项目里的 LLM 调用层大改了一遍,目标是:新模型上线后不改业务代码,直接配置切换。 记录一下过程和踩坑。 背景 我
云厂商集体涨价,我把多云成本监控工具链跑了一遍,踩了两个坑
背景 2026年Q1,AWS/阿里云/腾讯云/百度云集体上调AI算力价格,AWS GPU实例涨了约15%,阿里云高性能存储涨了30%,腾讯云混元API直接涨了463%。我们团队的月账单从上个季度的约$
云服务账单暴涨怎么办?我用一套多云成本监控方案把费用压下来了
背景 最近两个月,我们公司的云账单出现了比较明显的上涨。 起因是这轮全球云厂商集体涨价——AWS AI算力实例涨了15%-25%,我们有一个模型批处理任务一直跑在p3实例上,账单直接涨了将近20%..
GLM-5.1 接入踩坑记录:用免费开源模型搭个 AI 代码审计小工具
背景 今天 Claude Mythos 发布了,然后我发现:我没资格用。 限邀请制,40 家头部机构,跟我这个独立开发者没关系。 但我确实有个需求摆在那里——我接了一个小活,帮一个朋友的 SaaS 项
我把DeepSeek V4迁昇腾的工程坑踩了个遍,总结在这里
为什么要关注这件事 DeepSeek V4这次选择100%跑华为昇腾950PR,不是一个简单的"国产替代"口号。从工程角度来说,这是一次真实的、有量级的框架迁移实验——CUDA生态向CANN生态的切换
提前踩坑:为 GPT-6 的 200 万 Token 上下文做好工程准备
前情提要 上周消息爆出来的时候,我第一反应是:200万Token,岂不是直接把我项目里的分块逻辑全部废掉了? 然后冷静了两分钟,开始测——用的是 Gemini 1.5 Pro 的 100 万 Toke
下一页
个人成就
文章被点赞
1
文章被阅读
1,965
掘力值
244
关注了
3
关注者
1
收藏集
0
关注标签
9
加入于
2026-03-29