首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
陈道一
掘友等级
AI算法工程师
Passion is doing stupid useless things.
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
7
文章 7
沸点 0
赞
7
返回
|
搜索文章
赞
文章( 7 )
沸点( 0 )
一枚程序猿的MacBook M1 Windows虚拟机体验
大家好,我是 刚进入春天还没来得及踏青又开始从早忙到晚的 蛮三刀。去年给大家带来了一篇比较详尽的MacBook M1评测。 然后,今年春节一过,公司决定给大家一人一台MacBook M1,而且还同样是16G版本的,大家领电脑的那天,我的内心五味杂陈。 本篇文章算是一次M1评测番…
MoE(Mixture of Experts)的相关问题
MoE的主要作用是 **保持相同训练和推理资源的同时,通过增加模型的体积代价来提升模型学习效果**。
PPO经验碎片
PPO的过程就像所有的强化学习一样,从原始的采样分布出发,不断循环3个步骤:采样、奖励、优化(policy gradient)。结合提前训练好的人类偏好模型得到奖励信号,从而实现与人类偏好对齐的目的。
DeepSpeed原理(手写笔记)
前言 介绍了一下DeepSpeed的架构,以及部分重点内容的原理。 其实是看DeepSpeed源码时候随便写的一段笔记,没时间整理并且写的很潦草,所以不太想发,但是框架的代码读起来不容易,里面知识点确
ChatGPT Plugins原理介绍和讨论
其中ChatGPT plugin可以认为是对行业应用最有影响力的一个技术,也是继ChatGPT发布以来OpenAI发布的最重要的更新,可以简单的理解为OpenAI发布了对应ChatGPT的应用商店。对
旋转位置编码RoPE的直观理解
数学一定要有直观的意义吗,我认为是的。虽然并不是所有的数学发现都是从实际出发而得来的,但是最终它们一定会用来解决实际的问题。如果没有了这种直观的想象力,那么仅仅从公式推理去做研究,就如同水木失去本源难
混合精度Mixed Precision Training
神经网络的参数是用浮点精度表示的, 浮点精度的标准是IEEE 754 - Wikipedia,以下是一个FP16数值在内存中存储格式。 随着神经网络模型规模越来越大,如何减少模型占用的内存并且缩短训练
个人成就
文章被点赞
8
文章被阅读
14,957
掘力值
349
关注了
3
关注者
6
收藏集
0
关注标签
0
加入于
2023-08-08