
获得徽章 0
- 目前公认的编程模型是 Top 1 是 claude 4 sonnet. 很多人甚至愿意花每月 $200 订阅。
claude 4 sonnet 在今年5月发布,紧接着在几个月内,qwen3-coder, kimi-k2, glm-4.5, deepseek-v3.1 相继发布。虽然比不上 claude, 但是编程能力大大增强,而且极具性价比。
照这个趋势,猜测明年的模型,编程能力应该能赶上或超过 claude 4 sonnet 了,而且价格会大大降低。
所以,当下不必关心用什么模型,也不一定必须要花很多钱。当下最应该关注怎么用好 AI Coding Agent ,目标是如何做到每天消耗尽可能多的 token 去完成更多的事。展开1点赞 - AI Coding 领域非常火爆,作为开发者,也要琢磨如何抓住这个机会。
这里的开发者指的是纯靠写代码赚钱的人,不是“独立开发者”,不是“写代码的PM”,也不是“写代码的老板”。
AI Coding 必然会替代大量代初级开发者,不过并没有替代中高级开发者(也许永远不会替代 ),所以,中高级开发者有机会通过 AI Coding 为自己多赚钱(而不是为老板赚钱)展开赞过评论1 - 多路召回比关键词检索和向量检索更强,因为它结合多种方法,能找得更准、找得更多、不容易漏掉好内容。
多路召回的知识库准备:
1 数据准备
a 数据源
b 数据获取、解析、清洗
c 文本分块:切片
d 数据入库:关系型数据库
2 建立全文检索引擎(比如基于 BM25 算法)
3 建立向量检索引擎(比如使用 FAISS)
基于多路召回的问答流程(串行多路召回):
1 用户提问
2 召回
a 初筛:全文检索(关键词检索)
b 精排:向量检索
c 融合:将多个通道召回的结果融合。使用简单的算法或重排序模型实现。
3 生成提示词:结合用户提问和召回片段构造提示词
4 调用大模型,获取回答展开赞过评论1 - GPT-4o mini 只有 80 亿参数,GPT-3.5 有 1750 亿参数,但是 4o mini 的质量明显优于 3.5. 原因:
1. 训练方法:采用MoE架构动态激活专家模块,结合知识蒸馏和指令层次训练,提升参数效率与任务精准度。
2. 数据层面:精选多语言及专业领域高质量数据,强化专项能力,减少冗余信息干扰。展开评论点赞 - 评论点赞