首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
风雨中的小七
掘友等级
NLP算法工程师
想做健身博主的NLPer
获得徽章 16
动态
文章
专栏
沸点
收藏集
关注
作品
赞
45
文章 45
沸点 0
赞
45
返回
|
搜索文章
风雨中的小七
NLP算法工程师
·
11月前
关注
解密prompt系列49. 回顾R1之前的思维链发展路线
我先按照自己的思路来梳理下R1之前整个模型思维链的发展过程,可以分成3个阶段:大模型能思考,外生慢思考,内生慢思考...
1
评论
分享
风雨中的小七
NLP算法工程师
·
11月前
关注
解密prompt系列48. DeepSeek R1 & Kimi 1.5长思维链 - RL Scaling
之前大家推测的O1的实现路径,多数都集中在MCTS推理优化,以及STaR等样本自优化方案等等,结果DeepSeek和Kiim直接出手揭示了reason也可以从RL激发出来...
0
评论
分享
风雨中的小七
NLP算法工程师
·
1年前
关注
解密prompt系列47. O1 Long Thought的一些特征分析
O1之后,思维链的一个简单但之前都没进入视野的特征引起了大家的注意,那就是思考的长度对推理效果的影响,更准确来说是通过哪些思考步骤来有效延长思维长度对推理的影响。这一章我们...
1
评论
分享
风雨中的小七
NLP算法工程师
·
1年前
关注
解密prompt系列46. LLM结构化输出代码示例和原理分析
这一章我们先结合demo看下开源和闭源对结构化输出的支持,随后会介绍Constrained Decoding和Format Restricting Instructions...
0
评论
分享
风雨中的小七
NLP算法工程师
·
1年前
关注
解密Prompt45. 再探LLM Scalable Oversight -辩论、博弈哪家强
之前分别从Verifier和Generator两个方去尝试解决Scalable Oversight的问题,本章聊聊通过Verifier和Generator相互博弈来同时提升...
0
评论
分享
风雨中的小七
NLP算法工程师
·
1年前
关注
解密prompt系列44. RAG探索模式?深度思考模式?
前一阵多步RAG的风吹入了工业界,kimi推出了探索版本,各应用都推出了深度搜索,You.COM更是早就有了Genius的多步模式。其实都是类似multi-hop RAG的...
0
评论
分享
风雨中的小七
NLP算法工程师
·
1年前
关注
解密prompt系列43. LLM Self Critics
在模型持续提升的道路上,只提升Generator能力是不够的,需要同步提升Supervisor、Verifier的能力,才能提供有效的监督优化信号。人类提供的监督信号有几类...
0
评论
分享
风雨中的小七
NLP算法工程师
·
1年前
关注
解密prompt系列42. LLM通往动态复杂思维链之路
想要更优的Inference Scaling,前提是模型本身已经拥有足够的生成合理推理过程的能力,同时还拥有很强的Verifier模型来对推理节点进行打分,并且二者可以在少...
0
评论
分享
风雨中的小七
NLP算法工程师
·
1年前
关注
解密prompt系列41. GraphRAG真的是Silver Bullet?
Graph RAG虽好但并非Silver Bullet,它有特定适合的问题和场景,更适合作为RAG中的一路召回,用来解决实体密集,依赖全局关系的信息召回。我们来聊聊Grap...
0
评论
分享
风雨中的小七
赞了这篇文章
居然JuRan
给我一个酸菜的缸,腌透悲伤 @无用组织协会会长
·
1年前
关注
《爬虫+大模型》到底有没有搞头?
最近在学习大模型,之前我是干过一段时间爬虫,在学习大模型的过程中,突发奇想能不能把大模型的能力结合爬虫,搞个AI爬虫玩一玩。 说干就干,先测试一下大模型的数据提取能力 我们...
21
5
分享
风雨中的小七
NLP算法工程师
·
1年前
关注
解密prompt系列40. LLM推理scaling Law
OpenAI的O-1出现前,其实就有大佬开始分析后面OpenAI的技术路线,其中一个方向就是从Pretrain-scaling,Post-Train-scaling向Inf...
0
评论
分享
风雨中的小七
NLP算法工程师
·
1年前
关注
解密prompt系列39. RAG之借助LLM优化精排环节
RAG这一章我们集中看下精排的部分。粗排和精排的主要差异其实在于效率和效果的balance。粗排和精排的主要差异其实在于效率和效果的balance。粗排模型复杂度更低,需要...
1
评论
分享
风雨中的小七
NLP算法工程师
·
1年前
关注
解密Prompt系列38. 多Agent路由策略
常见的多智能体框架有协作模式,路由模式,复杂交互模式等等,这一章我们围绕智能体路由,也就是如何选择解决当前任务最合适的智能体展开,介绍基于领域,问题复杂度,和用户偏好进行智...
1
评论
分享
风雨中的小七
NLP算法工程师
·
1年前
关注
解密Prompt系列37.RAG之前置决策何时联网的多种策略
前置判断模型回答是否需要联网,之前介绍了自我矛盾和自我拒绝者两个方案。这一章我们再补充几种基于微调,模型回答置信度和小模型代理回答的方案。...
0
评论
分享
风雨中的小七
NLP算法工程师
·
1年前
关注
解密Prompt系列36. Prompt结构化编写和最优化算法UNIPROMPT
DSPy在纯任务描述型指令上的优化效果有限。这一章我们就重点关注描述性指令优化。我们先简单介绍下结构化Prompt编写,再聊聊从结构化多角度进行Prompt最优化迭代的算法...
1
评论
分享
风雨中的小七
NLP算法工程师
·
1年前
关注
解密prompt系列35. 标准化Prompt进行时! DSPy论文串烧和代码示例
这一章我们会先梳理DSPy相关的几篇核心论文了解下框架背后的设计思想和原理,然后以FinEval的单选题作为任务,从简单指令,COT指令,到采样Few-shot和优化指令给...
3
评论
分享
风雨中的小七
NLP算法工程师
·
1年前
关注
解密prompt系列34. RLHF之训练另辟蹊径:循序渐进 & 青出于蓝
前几章我们讨论了RLHF的样本构建优化和训练策略优化,这一章我们讨论两种不同的RL训练方案,分别是基于过程训练,和使用弱Teacher来监督强Student 循序渐进:PR...
2
评论
分享
风雨中的小七
NLP算法工程师
·
1年前
关注
解密Prompt系列33. LLM之图表理解任务-多模态篇
这一章我们聚焦多模态图表数据。先讨论下单纯使用prompt的情况下,图片和文字模态哪种表格模型理解的效果更好更好,再说下和表格相关的图表理解任务的微调方案。...
1
评论
分享
风雨中的小七
NLP算法工程师
·
1年前
关注
解密Prompt系列32. LLM之表格理解任务-文本模态
这一章我们聊聊大模型表格理解任务,在大模型时代主要出现在包含表格的RAG任务,以及表格操作数据抽取文本对比等任务中。这一章先聊单一的文本模态,我们分别介绍微调和基于Prom...
0
评论
分享
风雨中的小七
NLP算法工程师
·
1年前
关注
解密Prompt系列31. LLM Agent之从经验中不断学习的智能体
模型想要完成自主能力进化和自主能力获得,需要通过Self-Reflection from Past Experience来实现。那如何获得经历,把经历转化成经验,并在推理中...
1
评论
分享
下一页
个人成就
2023年度人气作者No.104
文章被点赞
215
文章被阅读
116,044
掘力值
4,196
关注了
17
关注者
306
收藏集
3
关注标签
12
加入于
2020-08-30