首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
AIFrontiers
掘友等级
公众号: AI-Frontiers
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
AIFrontiers
7小时前
关注
收藏!LLM-RL训练框架:3大流派+6大框架,一文搞定
本报告将深度解构分析TRL、OpenRLHF、verl、LLaMA Factory四大主流开源LLM-RL训练框架,及 DeepSpeed等重要生态组件,围绕架构设计、关键...
0
评论
分享
AIFrontiers
11天前
关注
小白也能看懂的LLM-RL算法:PPO/DPO/GRPO/GSPO
先解释一些基本概念,涵盖强化学习理解、价值函数、NLP中的强化学习。 随后,介绍RLHF的起源、设计思路、如何与大模型RLHF算法关联的。再对LLM-RL主流的(PPO、D...
0
评论
分享
AIFrontiers
20天前
关注
250个LLM 评估基准大盘点!从推理到多模态,一文看懂LLM考试大纲
原文:https://mp.weixin.qq.com/s/ihKJVqs3TWXVQcqnsjZ9Og 选不对 LLM,业务落地全是坑!面对五花八门的大模型,你是否还在纠...
0
评论
分享
AIFrontiers
28天前
关注
RAG效果差?7个指标让你的准确率大幅提升
原文: https://mp.weixin.qq.com/s/VV29xpdOMEkbz4iXmD_szg 在上一篇 RAG评测完整指南:指标、测试和最佳实践 中,我们对R...
0
评论
分享
AIFrontiers
1月前
关注
小白也能看懂的RLHF-PPO:原理篇
原文: https://mp.weixin.qq.com/s/8O7W8--x14-b1d3M9IS_3w LLM-RL往期文章推荐 小白也能看懂的RL-PPO 收藏!强化...
0
评论
分享
AIFrontiers
1月前
关注
RAG评测完整指南:指标、测试和最佳实践
RAG框架是一个复杂的工作流,包括分块、搜索、上下文拼接和内容生成等步骤,一旦系统最终响应的内容不符合预期,对于问题的定位会非常复杂,是模型出现了幻觉?还是从一开始就没有获...
0
评论
分享
AIFrontiers
1月前
关注
Huggingface 214页训练手册:揭秘构建世界级大语言模型的秘密
The Smol Training Playbook: The Secrets to Building World-Class LLMs 由 Hugging Face 团队...
0
评论
分享
AIFrontiers
1月前
关注
谷歌重磅出品!揭秘21种Agentic设计模式,AI从业者必备
原文: https://mp.weixin.qq.com/s/TQQBL1dUdxO7A9AzbmwS-A 谷歌重磅出品!揭秘21种Agentic设计模式,AI从业者必备 ...
0
评论
分享
AIFrontiers
1月前
关注
Huggingface 214页训练手册:揭秘构建世界级大语言模型的秘密
原文: https://mp.weixin.qq.com/s/vYf4ch4RY7milQAO1ohXMw 《The Smol Training Playbook: The...
0
评论
分享
AIFrontiers
2月前
关注
小白也能看懂的RLHF:基础篇
原文: https://mp.weixin.qq.com/s/4_6CBXMJhqmiYKSzsAXncg 人类反馈强化学习(Reinforcement Learning ...
0
评论
分享
个人成就
文章被阅读
502
掘力值
105
关注了
0
关注者
0
收藏集
0
关注标签
8
加入于
2025-11-20