首页
首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
风雨中的小七
掘友等级
NLP算法工程师
想做健身博主的NLPer
获得徽章 16
动态
文章
专栏
沸点
收藏集
关注
作品
赞
43
文章 43
沸点 0
赞
43
返回
|
搜索文章
最新
热门
ES查询优化随记1: 多路向量查询 & KNN IO排查 & 高效Filter使用
本章主要覆盖以下ES相关内容 * 多Query向量查询的各种方案:Script,Knn(mesearch) * KNN查询IOUtil过高问题排查 * 如何使用Filter查询更高效
解密prompt系列53. 再谈大模型Memory
上一章畅想里面我们重点提及了大模型的记忆模块,包括模型能否持续更新记忆模块,模型能否把持续对记忆模块进行压缩更新在有限的参数中存储更高密度的知识信息,从而解决有限context和无限知识之间的矛盾。
解密prompt系列52. 闲聊大模型还有什么值得探索的领域
在DeepSeek-R1的开源狂欢之后,感觉不少朋友都陷入了技术舒适区,但其实当前的大模型技术只是跨进了应用阶段,可以探索的领域还有不少,所以这一章咱不聊论文了,偶尔不脚踏实地,单纯仰望天空,聊聊还有
解密prompt系列51. R1实验的一些细节讨论
DeepSeek R1出来后业界都在争相复现R1的效果,这一章我们介绍两个复现项目SimpleRL和LogicRL,还有研究模型推理能力的Cognitive Behaviour
解密prompt系列50. RL用于优化Agent行为路径的一些思路
OpenAI新推出的Deep Research功能,属实有些惊艳,也验证了去年的一些观点,之后的大模型工作流会呈现一些截然不同的形态,有敏捷型的例如语音端到端的及时对话,也会有异步长流程的复杂任务,去
解密prompt系列49. 回顾R1之前的思维链发展路线
我先按照自己的思路来梳理下R1之前整个模型思维链的发展过程,可以分成3个阶段:大模型能思考,外生慢思考,内生慢思考
解密prompt系列48. DeepSeek R1 & Kimi 1.5长思维链 - RL Scaling
之前大家推测的O1的实现路径,多数都集中在MCTS推理优化,以及STaR等样本自优化方案等等,结果DeepSeek和Kiim直接出手揭示了reason也可以从RL激发出来
解密prompt系列47. O1 Long Thought的一些特征分析
O1之后,思维链的一个简单但之前都没进入视野的特征引起了大家的注意,那就是思考的长度对推理效果的影响,更准确来说是通过哪些思考步骤来有效延长思维长度对推理的影响。这一章我们着重讨论思考长度
解密prompt系列46. LLM结构化输出代码示例和原理分析
这一章我们先结合demo看下开源和闭源对结构化输出的支持,随后会介绍Constrained Decoding和Format Restricting Instructions 两种结构化输出约束方案
解密Prompt45. 再探LLM Scalable Oversight -辩论、博弈哪家强
之前分别从Verifier和Generator两个方去尝试解决Scalable Oversight的问题,本章聊聊通过Verifier和Generator相互博弈来同时提升双方实力。
下一页
个人成就
2023年度人气作者No.104
文章被点赞
199
文章被阅读
97,712
掘力值
3,746
关注了
17
关注者
291
收藏集
3
关注标签
12
加入于
2020-08-30