首页
首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
慕仲卿
掘友等级
前端开发工程师
|
浙江某民营企业
三年前端开发,正在快速成长中,喜欢技术和交流,欢迎共同爱好的朋友一起进步~
获得徽章 7
动态
文章
专栏
沸点
收藏集
关注
作品
赞
2.2K
文章 1.3K
沸点 898
赞
2.2K
返回
|
搜索文章
慕仲卿
前端开发工程师 @浙江某民营企业
·
12天前
关注
租用 GPU 训练 minimind 模型
训练 minimind 1. 选择 conda 版本的云服务器,具体配置为 2. 创建一个新的 python 环境,然后安装合适的版本 3. 将 minimind 的 re...
0
评论
分享
慕仲卿
前端开发工程师 @浙江某民营企业
·
1月前
关注
分布式数据加载
初始化训练数据集和数据加载器,是深度学习模型训练中的关键步骤。本文介绍与此过程息息相关的几个步骤及对应的对象和方法。...
2
评论
分享
慕仲卿
前端开发工程师 @浙江某民营企业
·
1月前
关注
设置训练过程中的随机数种子
通过设置随机数种子,可以确保每次运行代码时,模型的初始化和训练过程都基于相同的随机数序列,从而得到一致的结果。...
0
评论
分享
慕仲卿
前端开发工程师 @浙江某民营企业
·
1月前
关注
模型初始化:加载分词器和模型
在模型训练中,一般会定义一个函数 init_model,用于初始化模型和分词器。它加载了一个预训练的分词器,初始化了一个自定义的 MiniMindLM 模型,并将其移动到指...
1
评论
分享
慕仲卿
前端开发工程师 @浙江某民营企业
·
1月前
关注
保存模型检查点
在训练深度学习模型的过程中,保存模型检查点是一个非常重要的步骤。它不仅可以防止训练过程中出现意外中断导致的损失,还能方便我们后续对模型进行评估和测试。...
1
评论
分享
慕仲卿
前端开发工程师 @浙江某民营企业
·
1月前
关注
归零模型梯度
在 PyTorch 中,optimizer.zero_grad() 是一个非常重要的方法,用于在每次反向传播之前清空(归零)模型的梯度。这行代码的作用是确保在每次更新模型参...
0
评论
分享
慕仲卿
前端开发工程师 @浙江某民营企业
·
1月前
关注
缩放器和优化器的定义
本文介绍两个在深度学习训练中非常重要的组件:GradScaler 和 优化器。它们分别用于处理混合精度训练和参数更新,是现代深度学习训练流程中不可或缺的部分。...
0
评论
分享
慕仲卿
前端开发工程师 @浙江某民营企业
·
1月前
关注
网络训练中使用上下文管理器 ctx 控制计算精度
本文介绍如何在网络训练中使用上下文管理器 ctx 控制计算精度,以及残差的计算和处理方式。由于这段代码较为固定,因此可以复用到其他网络的训练过程中去。...
0
评论
分享
慕仲卿
前端开发工程师 @浙江某民营企业
·
1月前
关注
交叉熵损失函数介绍
在训练网络的时候常用nn.CrossEntropyLoss定义一个交叉熵损失函数实例,并将其存储在变量中。...
0
评论
分享
慕仲卿
前端开发工程师 @浙江某民营企业
·
1月前
关注
Torch 分布式训练关键参数
分布式训练框架(如 PyTorch 的 DDP)在启动时会设置一些特定的环境变量,而 "RANK" 是其中一个关键的环境变量。本文介绍与此相关的知识。...
0
评论
分享
慕仲卿
前端开发工程师 @浙江某民营企业
·
1月前
关注
从零开始训练视觉多模态模型:10 步骤详解
在人工智能快速发展的今天,视觉多模态模型成为了研究与应用的热点。为了帮助大家更好地理解和运用这一技术,我将详细介绍如何从零开始训练一个视觉多模态模型。以下是完整的 10 个...
0
评论
分享
慕仲卿
前端开发工程师 @浙江某民营企业
·
1月前
关注
Conda 使用笔记
Conda 是一种包管理工具,具体分成 Anaconda 和 Mini-Conda 两种。前者较大约 3GB 内置了一些库,适合初学者,开箱即用。后者约 50MB,自主性...
0
评论
分享
慕仲卿
前端开发工程师 @浙江某民营企业
·
3月前
关注
WPF 值转换器实现
值转换器是 WPF 项目中具有特色的组成部分。本文带你实现一个标准的值转换器,首先实现一个抽象基类,然后在设法实现之。...
1
评论
分享
慕仲卿
前端开发工程师 @浙江某民营企业
·
3月前
关注
C# 中使用 EFCore 和 Sqlite 的全过程
本文介绍 WPF + EFCore + Sqlite 实现复杂 C# 项目的全过程,设计数据库连接,依赖注入,网络通信及 WebApi 应用的创建等内容。...
1
评论
分享
慕仲卿
前端开发工程师 @浙江某民营企业
·
3月前
关注
WPF 全栈项目学习(操作物理机)
本文是对操作物理机的 WPF 项目的代码学习笔记,涉及的内容包括 C# PLC 通讯等内容。但都是一些比较基础的内容。...
3
评论
分享
慕仲卿
前端开发工程师 @浙江某民营企业
·
3月前
关注
WPF 练手小案例 2
本文通过 11 个小案例强化 WPF 开发入门的基础。这 11 个案例是我从实际项目中抽象出来的,具有较强的实践意义,同时也能在很大程度上反映出 WPF 项目开发的一些基本...
2
评论
分享
慕仲卿
前端开发工程师 @浙江某民营企业
·
3月前
关注
WPF 练手小案例
本文通过 10 个小案例强化 WPF 开发入门的基础。这 10 个案例是我从实际项目中抽象出来的,具有较强的实践意义,同时也能在很大程度上反映出 WPF 项目开发的一些基本...
0
评论
分享
慕仲卿
前端开发工程师 @浙江某民营企业
·
3月前
关注
C# 解释器 3
本文记录了笔者在阅读 WPF 程序过程中不懂的知识点和一些心得、理解,同时也是一种高效的学习方式的探索。...
0
评论
分享
慕仲卿
前端开发工程师 @浙江某民营企业
·
3月前
关注
c# 解释器 2
本文记录了笔者在阅读 WPF 程序过程中不懂的知识点和一些心得、理解,同时也是一种高效的学习方式的探索。...
0
评论
分享
慕仲卿
前端开发工程师 @浙江某民营企业
·
3月前
关注
c# 解释器
本文记录了笔者在阅读 WPF 程序过程中不懂的知识点和一些心得、理解,同时也是一种高效的学习方式的探索。...
0
评论
分享
下一页
个人成就
优秀创作者
文章被点赞
5,243
文章被阅读
818,553
掘力值
34,114
关注了
452
关注者
1,663
收藏集
61
关注标签
13
加入于
2023-02-28