首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
风雨中的小七
掘友等级
NLP算法工程师
想做健身博主的NLPer
获得徽章 16
动态
文章
专栏
沸点
收藏集
关注
作品
赞
43
文章 43
沸点 0
赞
43
返回
|
搜索文章
最新
热门
ES索引迁移优化:3倍速ReIndex + 零感知切换
在大模型驱动的时代,向量模型、索引抽取模型、文本切分模型(chunking)的迭代速度令人目不暇接,几乎每几个月就要升级一次。随之而来的,是Elasticsearch索引结构的频繁变更需求。然而,ES
解密prompt系列55.Agent Memory的工程实现 - Mem0 & LlamaIndex
上期我们探讨了模型方案实现长记忆存储,本期将聚焦工程实现层面。 * What:记忆内容(手动管理 vs 自动识别) * How:记忆处理(压缩/抽取 vs 直接存储) * Where:存
解密prompt系列54.Context Cache代码示例和原理分析
Context Cache的使用几乎已经是行业共识,目标是优化大模型首Token的推理延时,在多轮对话,超长System Prompt,超长结构化JSON和Few-shot等应用场景,是不可或缺的
ES查询优化随记1: 多路向量查询 & KNN IO排查 & 高效Filter使用
本章主要覆盖以下ES相关内容 * 多Query向量查询的各种方案:Script,Knn(mesearch) * KNN查询IOUtil过高问题排查 * 如何使用Filter查询更高效
解密prompt系列53. 再谈大模型Memory
上一章畅想里面我们重点提及了大模型的记忆模块,包括模型能否持续更新记忆模块,模型能否把持续对记忆模块进行压缩更新在有限的参数中存储更高密度的知识信息,从而解决有限context和无限知识之间的矛盾。
解密prompt系列52. 闲聊大模型还有什么值得探索的领域
在DeepSeek-R1的开源狂欢之后,感觉不少朋友都陷入了技术舒适区,但其实当前的大模型技术只是跨进了应用阶段,可以探索的领域还有不少,所以这一章咱不聊论文了,偶尔不脚踏实地,单纯仰望天空,聊聊还有
解密prompt系列51. R1实验的一些细节讨论
DeepSeek R1出来后业界都在争相复现R1的效果,这一章我们介绍两个复现项目SimpleRL和LogicRL,还有研究模型推理能力的Cognitive Behaviour
解密prompt系列50. RL用于优化Agent行为路径的一些思路
OpenAI新推出的Deep Research功能,属实有些惊艳,也验证了去年的一些观点,之后的大模型工作流会呈现一些截然不同的形态,有敏捷型的例如语音端到端的及时对话,也会有异步长流程的复杂任务,去
解密prompt系列49. 回顾R1之前的思维链发展路线
我先按照自己的思路来梳理下R1之前整个模型思维链的发展过程,可以分成3个阶段:大模型能思考,外生慢思考,内生慢思考
解密prompt系列48. DeepSeek R1 & Kimi 1.5长思维链 - RL Scaling
之前大家推测的O1的实现路径,多数都集中在MCTS推理优化,以及STaR等样本自优化方案等等,结果DeepSeek和Kiim直接出手揭示了reason也可以从RL激发出来
下一页
个人成就
2023年度人气作者No.104
文章被点赞
200
文章被阅读
100,542
掘力值
3,832
关注了
17
关注者
296
收藏集
3
关注标签
12
加入于
2020-08-30