稀土掘金 稀土掘金
    • 首页
    • 沸点
    • 课程
    • AI Coding
    • 数据标注
    • 更多
      • 直播
      • 活动
      • APP
      • 插件
    • 直播
    • 活动
    • APP
    • 插件
      • 搜索历史 清空
        • 写文章
        • 发沸点
        • 写笔记
        • 写代码
        • 草稿箱
        创作灵感 查看更多
走去喝酒吧的个人资料头像

走去喝酒吧

创作等级LV.1
掘友等级
掘友4级:进阶掘友
agent
agent everything
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
22
文章 22 沸点 0
赞
22
返回
|
搜索文章
走去喝酒吧的头像
走去喝酒吧
agent
·
29天前
  • 举报
为什么我的文章审核不通过,原因也不告知,直接审核不通过
反馈 & 建议
分享
1
点赞
走去喝酒吧的头像
走去喝酒吧
agent
·
29天前

GRPO算法

基于PPO改良的强化学习算法,由DeepSeek团队提出,特别适用于推理模型的微调,它通过组内相对奖励信号来优化策略,避免了传统PPO中需要单独价值函数估计的问题...
image
0
2
分享
走去喝酒吧的头像
走去喝酒吧
关注了标签 投资 投资
agent
走去喝酒吧
赞了这篇文章
三金得鑫的头像
三金得鑫
前端开发工程师
·
1年前

CO-STAR,新加坡首届 GPT-4 提示工程大赛冠军的夺冠宝典

上次介绍了 FlowGPT 这个提示词相关的网站,这次来说一下如何写好提示词。 在吴恩达教授的《Prompt Engineering》提示工程师课程中,有提到两个编写提示词...
image
2
评论
分享
个人成就
文章被阅读 125
掘力值 11
关注了
0
关注者
2
收藏集
0
关注标签
12
加入于
2017-07-19