首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
非英杰不图
掘友等级
算法工程师
|
bytedance
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
最新
热门
DeepSeek-R1 模型及GRPO算法学习
总结DeepSeek-R1 模型算法,并对其中的GRPO算法做一些补充学习补充。 DeepSeek-R1 论文总结 提出了通过强化学习提升大语言模型推理能力的方法,开发出 DeepSeek-R1
转录CRM会话分割与打标论文阅读:GPT-Calls
数据与任务描述 数据为客服与销售的通话之后的转录会话数据。 任务是预先设好的会话类别,对转录的会话数据进行内容分割,并对分割的结果做打标。 论文研究(GPT-Calls) 论文题目:GPT-Calls
RLHF中的PPO算法过程微观拆解
PPO 算法宏观描述 PPO(Proximal Policy Optimization, 近端策略优化) 是一种用于训练强化学习模型的算法。它可以用于调整语言模型,使得模型生成的结果更符合人类的偏好。
工作赚钱的十项基本原则
分享赚钱模式个人的思想和经验。 赚钱是一个很枯燥的事,但是结果大家都喜欢。大的逻辑是一个钱进钱出的圈。 小的细节很多,在各行各业,不同时刻,都有很多小的问题。在实施的过程中,都有很多临时蹦出来的问题需
个人成就
文章被点赞
1
文章被阅读
4,118
掘力值
76
关注了
0
关注者
1
收藏集
0
关注标签
13
加入于
2022-11-17