首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
用户6334423020532
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
260
文章 259
沸点 1
赞
260
返回
|
搜索文章
赞
文章( 259 )
沸点( 1 )
交叉熵损失函数介绍
在训练网络的时候常用nn.CrossEntropyLoss定义一个交叉熵损失函数实例,并将其存储在变量中。
网络训练中使用上下文管理器 ctx 控制计算精度
本文介绍如何在网络训练中使用上下文管理器 ctx 控制计算精度,以及残差的计算和处理方式。由于这段代码较为固定,因此可以复用到其他网络的训练过程中去。
缩放器和优化器的定义
本文介绍两个在深度学习训练中非常重要的组件:GradScaler 和 优化器。它们分别用于处理混合精度训练和参数更新,是现代深度学习训练流程中不可或缺的部分。
归零模型梯度
在 PyTorch 中,optimizer.zero_grad() 是一个非常重要的方法,用于在每次反向传播之前清空(归零)模型的梯度。这行代码的作用是确保在每次更新模型参数之前,梯度不会被累加。
保存模型检查点
在训练深度学习模型的过程中,保存模型检查点是一个非常重要的步骤。它不仅可以防止训练过程中出现意外中断导致的损失,还能方便我们后续对模型进行评估和测试。
模型初始化:加载分词器和模型
在模型训练中,一般会定义一个函数 init_model,用于初始化模型和分词器。它加载了一个预训练的分词器,初始化了一个自定义的 MiniMindLM 模型,并将其移动到指定的设备上(GPU 等)
设置训练过程中的随机数种子
通过设置随机数种子,可以确保每次运行代码时,模型的初始化和训练过程都基于相同的随机数序列,从而得到一致的结果。
分布式数据加载
初始化训练数据集和数据加载器,是深度学习模型训练中的关键步骤。本文介绍与此过程息息相关的几个步骤及对应的对象和方法。
租用 GPU 训练 minimind 模型
训练 minimind 1. 选择 conda 版本的云服务器,具体配置为 2. 创建一个新的 python 环境,然后安装合适的版本 3. 将 minimind 的 requirements.txt
机器人仿真环境安装
安装环境 ubuntu=Ubuntu 20.04.6 LTS(GNU/Linux 5.15.0-107 - generic x86_64) python3=3.8.10 pip=20.0.2
下一页
关注了
2
关注者
0
收藏集
1
关注标签
23
加入于
2023-08-11