首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
TestCopilot
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
最新
热门
论文解读:迄今为止最好的 RAG 技术栈
这篇文章系统拆解了构建高效RAG系统的十大关键环节,并为每个环节给出了经过实验验证的最佳实践,整体为生产级RAG落地提供了清晰的实操指引。
百万字PRD秒读、7×24小时探伤:TestCopilot接入DeepSeek V4,重新定义测试效率
TestCopilot平台已正式接入DeepSeek V4系列模型,意味着我们用例生成、AI自动评审、AI执行测试用例的功能会迈入旗舰水平。
手把手数学推导GRPO算法(含代码实现)
GRPO 算法全称是Group Relative Policy Optimization ,是一种针对无需奖励的强化学习人类反馈(RLHF)任务的算法。 其核心思想是通过分组相对策略优化来改进模型的表
个人成就
文章被阅读
10
掘力值
10
关注了
0
关注者
0
收藏集
0
关注标签
2
加入于
2026-04-22