
获得徽章 0
目前公认的编程模型是 Top 1 是 claude 4 sonnet. 很多人甚至愿意花每月 $200 订阅。
claude 4 sonnet 在今年5月发布,紧接着在几个月内,qwen3-coder, kimi-k2, glm-4.5, deepseek-v3.1 相继发布。虽然比不上 claude, 但是编程能力大大增强,而且极具性价比。
照这个趋势,猜测明年的模型,编程能力应该能赶上或超过 claude 4 sonnet 了,而且价格会大大降低。
所以,当下不必关心用什么模型,也不一定必须要花很多钱。当下最应该关注怎么用好 AI Coding Agent ,目标是如何做到每天消耗尽可能多的 token 去完成更多的事。
claude 4 sonnet 在今年5月发布,紧接着在几个月内,qwen3-coder, kimi-k2, glm-4.5, deepseek-v3.1 相继发布。虽然比不上 claude, 但是编程能力大大增强,而且极具性价比。
照这个趋势,猜测明年的模型,编程能力应该能赶上或超过 claude 4 sonnet 了,而且价格会大大降低。
所以,当下不必关心用什么模型,也不一定必须要花很多钱。当下最应该关注怎么用好 AI Coding Agent ,目标是如何做到每天消耗尽可能多的 token 去完成更多的事。
展开
1
点赞
AI Coding 领域非常火爆,作为开发者,也要琢磨如何抓住这个机会。
这里的开发者指的是纯靠写代码赚钱的人,不是“独立开发者”,不是“写代码的PM”,也不是“写代码的老板”。
AI Coding 必然会替代大量代初级开发者,不过并没有替代中高级开发者(也许永远不会替代 ),所以,中高级开发者有机会通过 AI Coding 为自己多赚钱(而不是为老板赚钱)
这里的开发者指的是纯靠写代码赚钱的人,不是“独立开发者”,不是“写代码的PM”,也不是“写代码的老板”。
AI Coding 必然会替代大量代初级开发者,不过并没有替代中高级开发者(也许永远不会替代 ),所以,中高级开发者有机会通过 AI Coding 为自己多赚钱(而不是为老板赚钱)
展开
评论
1
多路召回比关键词检索和向量检索更强,因为它结合多种方法,能找得更准、找得更多、不容易漏掉好内容。
多路召回的知识库准备:
1 数据准备
a 数据源
b 数据获取、解析、清洗
c 文本分块:切片
d 数据入库:关系型数据库
2 建立全文检索引擎(比如基于 BM25 算法)
3 建立向量检索引擎(比如使用 FAISS)
基于多路召回的问答流程(串行多路召回):
1 用户提问
2 召回
a 初筛:全文检索(关键词检索)
b 精排:向量检索
c 融合:将多个通道召回的结果融合。使用简单的算法或重排序模型实现。
3 生成提示词:结合用户提问和召回片段构造提示词
4 调用大模型,获取回答
多路召回的知识库准备:
1 数据准备
a 数据源
b 数据获取、解析、清洗
c 文本分块:切片
d 数据入库:关系型数据库
2 建立全文检索引擎(比如基于 BM25 算法)
3 建立向量检索引擎(比如使用 FAISS)
基于多路召回的问答流程(串行多路召回):
1 用户提问
2 召回
a 初筛:全文检索(关键词检索)
b 精排:向量检索
c 融合:将多个通道召回的结果融合。使用简单的算法或重排序模型实现。
3 生成提示词:结合用户提问和召回片段构造提示词
4 调用大模型,获取回答
展开
评论
1
GPT-4o mini 只有 80 亿参数,GPT-3.5 有 1750 亿参数,但是 4o mini 的质量明显优于 3.5. 原因:
1. 训练方法:采用MoE架构动态激活专家模块,结合知识蒸馏和指令层次训练,提升参数效率与任务精准度。
2. 数据层面:精选多语言及专业领域高质量数据,强化专项能力,减少冗余信息干扰。
1. 训练方法:采用MoE架构动态激活专家模块,结合知识蒸馏和指令层次训练,提升参数效率与任务精准度。
2. 数据层面:精选多语言及专业领域高质量数据,强化专项能力,减少冗余信息干扰。
展开
评论
点赞
评论
点赞
赞了这篇文章
AI 的一个能力是处理解析加工文本数据,对于这类任务,AI 的特点是能更简单的处理很多之前处理不了或很难处理(需要写很多代码)的任务,比如:
- 需要自定义规范和风格的翻译任务
- 识别文本中的一个或多个人物名称
- 自定义排版
- 提炼总结、改写优化
- 需要自定义规范和风格的翻译任务
- 识别文本中的一个或多个人物名称
- 自定义排版
- 提炼总结、改写优化
评论
1
国外三大模型厂商纷纷开源了自家的 CLI Code Agent
- Google(Gemeni):
github.com
- OpenAI(CodeX):
github.com
- Anthropics (Claude Code):
github.com
- Google(Gemeni):
- OpenAI(CodeX):
- Anthropics (Claude Code):
展开
评论
点赞
AI Agent 的 3 个核心模块:
1. 大脑:大语言模型,提供智能。负责推理、规划、语言生成等。
2. 记忆:也就是上下文 context. 包括环境信息和任务过程中的信息。
3. 工具:调用外部工具,比如搜索,发信息,运行代码,或调用其他的 Agent
1. 大脑:大语言模型,提供智能。负责推理、规划、语言生成等。
2. 记忆:也就是上下文 context. 包括环境信息和任务过程中的信息。
3. 工具:调用外部工具,比如搜索,发信息,运行代码,或调用其他的 Agent
展开
3
5