陈道一

AI算法工程师

Passion is doing stupid useless things.

赞

7

|

搜索文章

赞

文章( 7 ) 沸点( 0 )

一枚程序猿的MacBook M1 Windows虚拟机体验

大家好，我是刚进入春天还没来得及踏青又开始从早忙到晚的蛮三刀。去年给大家带来了一篇比较详尽的MacBook M1评测。然后，今年春节一过，公司决定给大家一人一台MacBook M1，而且还同样是16G版本的，大家领电脑的那天，我的内心五味杂陈。本篇文章算是一次M1评测番…

蛮三刀酱
5年前
2.7k
7
2

一枚程序猿的MacBook M1 Windows虚拟机体验

MoE(Mixture of Experts)的相关问题

MoE的主要作用是 **保持相同训练和推理资源的同时，通过增加模型的体积代价来提升模型学习效果**。

陈道一
2年前
2.5k
2
评论

PPO经验碎片

PPO的过程就像所有的强化学习一样，从原始的采样分布出发，不断循环3个步骤：采样、奖励、优化（policy gradient）。结合提前训练好的人类偏好模型得到奖励信号，从而实现与人类偏好对齐的目的。

陈道一
2年前
1.5k
2
评论

DeepSpeed原理（手写笔记）

前言介绍了一下DeepSpeed的架构，以及部分重点内容的原理。其实是看DeepSpeed源码时候随便写的一段笔记，没时间整理并且写的很潦草，所以不太想发，但是框架的代码读起来不容易，里面知识点确

陈道一
2年前
1.1k
1
1

ChatGPT Plugins原理介绍和讨论

其中ChatGPT plugin可以认为是对行业应用最有影响力的一个技术，也是继ChatGPT发布以来OpenAI发布的最重要的更新，可以简单的理解为OpenAI发布了对应ChatGPT的应用商店。对

陈道一
2年前
948
1
评论

旋转位置编码RoPE的直观理解

数学一定要有直观的意义吗，我认为是的。虽然并不是所有的数学发现都是从实际出发而得来的，但是最终它们一定会用来解决实际的问题。如果没有了这种直观的想象力，那么仅仅从公式推理去做研究，就如同水木失去本源难

陈道一
2年前
2.1k
1
评论

旋转位置编码RoPE的直观理解

混合精度Mixed Precision Training

神经网络的参数是用浮点精度表示的，浮点精度的标准是IEEE 754 - Wikipedia，以下是一个FP16数值在内存中存储格式。随着神经网络模型规模越来越大，如何减少模型占用的内存并且缩短训练

陈道一
2年前
1.2k
1
评论

个人成就

文章被点赞 8

文章被阅读 18,024

加入于

2023-08-08