首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
巴糖
掘友等级
全栈了
|
无
到底是天堂还是地狱...
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
20
文章 18
沸点 2
赞
20
返回
|
搜索文章
最新
热门
AI大模型:语言模型训练范式-03奖励模型(Reward Model)
🎯 Reward Model(奖励模型) 一、什么是 Reward Model? Reward Model(奖励模型) 是一个独立的神经网络,它的任务是:给任意一个(Prompt, Response)
AI大模型:语言模型训练范式——02有监督微调(SFT)
🎓 SFT(有监督微调) 一、什么是 SFT? SFT(Supervised Fine-Tuning,有监督微调) 是在预训练模型的基础上,使用人工标注的(输入,输出)对进一步训练模型的过程。 输入:
AI大模型:探索神经网络的奥秘:从模型到深度学习
探索神经网络的奥秘:从模型到深度学习 摘要 神经网络是一种通过参数化数学公式实现通用函数逼近的模型。本文从“模型即数学公式”出发,系统阐述神经网络的基本原理、训练机制(梯度下降与反向传播)以及以 MN
AI大模型:语言模型训练范式——预训练(Pretrain)
什么是预训练(Pretrain)? 预训练是大语言模型训练流程的第一步,也是最昂贵、最核心的一步。 简单说:在海量的、没有人工标注的文本上,让模型自己去“读书”
UIDocumentPickerViewController 部分机型文件选择器的滚动视图与顶部导航栏重叠
UIDocumentPickerViewController 部分机型文件选择器的滚动视图与顶部导航栏重叠
个人成就
文章被点赞
2
文章被阅读
215
掘力值
69
关注了
44
关注者
2
收藏集
0
关注标签
53
加入于
2017-08-01