首页
首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
阿姆姆姆姆姆姆姆
掘友等级
算法工程师
庾信平生无萧瑟,暮年诗赋动江关。
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
45
文章 26
沸点 19
赞
45
返回
|
搜索文章
赞
文章( 26 )
沸点( 19 )
计算机基础系列 —— 虚拟机代码翻译器(2)
文中提到的所有实现都可以参考:nand2tetris_sol,但是最好还是自己学习课程实现一遍,理解更深刻。 这篇文章我们来看 VM code 里的分支和函数调用。 分支 vmcode 里的分支靠 l
计算机基础系列 —— 虚拟机代码翻译器(1)
文中提到的所有实现都可以参考:nand2tetris_sol,但是最好还是自己学习课程实现一遍,理解更深刻。 课程的 Part I: 被抽象成一块 Hack 器件,Part II 的重点在软件部分,包
计算机基础系列 —— 汇编器
文中提到的所有实现都可以参考:nand2tetris_sol,但是最好还是自己学习课程实现一遍,理解更深刻。 之前的文章介绍了 Hacker 和汇编语言,如果要让汇编语言运行在 Hacker 上,我们
计算机基础系列 —— CPU
文中提到的所有实现都可以参考:nand2tetris_sol,但是最好还是自己学习课程实现一遍,理解更深刻。 之前的文章里我们介绍了 Register、PC、RAM 和 ALU,这节课我们来介绍如何把
计算机基础系列 —— 汇编语言
文中提到的所有实现都可以参考:nand2tetris_sol,但是最好还是自己学习课程实现一遍,理解更深刻。 我们在之前的文章里,构建了 Register、RAM 和 ALU,使得我们有了存储和计算的
计算机基础系列 —— 从 Nand 门、DFF 到 RAM
文中提到的所有实现都可以参考:nand2tetris_sol,但是最好还是自己学习课程实现一遍,理解更深刻。 之前的文章里实现了组合逻辑单元和 ALU,我们有了计算的能力。 但是我们不能存储信息,只能
计算机基础系列 —— 从 Nand 门到 ALU(2)
文中提到的所有实现都可以参考:nand2tetris_sol,但是最好还是自己学习课程实现一遍,理解更深刻。 冯诺依曼架构 I(键盘)/O(屏幕) 负责指令的输入和结果的展示,Memory(RAM 和
计算机基础系列 —— 从 Nand 门到 ALU(1)
文中提到的所有实现都可以参考:nand2tetris_sol,但是最好还是自己学习课程实现一遍,理解更深刻。 基础逻辑门 基础逻辑门满足一些定律,都可以用真值表证明。
RLAIF(0)—— DPO(Direct Preference Optimization) 原理与代码解读
之前的系列文章:介绍了 RLHF 里用到 Reward Model、PPO 算法。 但是这种传统的 RLHF 算法存在以下问题:流程复杂,需要多个中间模型对超参数很敏感,导致模型训练的结果不稳定。
DeepSpeed-Chat RLHF 阶段代码解读(2) —— PPO 阶段
数据处理 这里和 DeepSpeed-Chat RLHF 阶段代码解读(1) —— 奖励函数阶段 - 掘金 (juejin.cn) 处理基本一致,唯一的区别是输入不是 prompt + respons
下一页
个人成就
文章被点赞
29
文章被阅读
8,513
掘力值
532
关注了
2
关注者
0
收藏集
0
关注标签
72
加入于
2016-09-12