首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
ViperEk
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
10
文章 10
沸点 0
赞
10
返回
|
搜索文章
最新
热门
自动微分机制(c++ 实现)
自动微分基于链式法则,将复杂函数分解为基本的微分操作。它主要用于求解复杂函数的导数,尤其是对于高维、高阶导数的计算非常有用。在深度学习领域有着十分广泛的用途,减去了手动计算导数的痛苦工作
FFT实现带步长的卷积
FFT实现卷积的流程 对于不带步长的卷积操作,其实相对也算简单 对卷积核和卷积输入进行填充, 填充到2的次幂 对卷积核和卷积数据进FFT 将卷积核和卷积数据相乘 对乘法的结果进行IFFT
多头注意力机制简介
多头注意力机制(Multi-Head Attention)是深度学习中用于处理序列数据的一种注意力机制扩展形式。它最初被引入到 Transformer 模型中,并成为其核心组成部分之
C++ 实现FFT算法
FFT(Fast Fourier Transform,快速傅里叶变换)是一种用于计算离散傅里叶变换(DFT)及其逆变换的高效算法。傅里叶变换是一种数学变换,它将一个信号从时域转换到频域...
基于LSTM的文本生成器
基于LSTM的文本生成器 基本介绍 LSTM是一种被人们熟知的时序预测模型,而语言, 音频都是与时间有关的,由此我们可以通过时序的上一个状态预测下一个状态, 这种问题我们可以尝试使用时序模型
chatglm2-6b-int4 本地部署
1.下载文件 首先要求有至少6gb显存 从huggingface下载 https://huggingface.co/THUDM/chatglm2-6b-int4 在下载完之后把所有文件装在一起,命名
使用torch将单词映射为词向量(word2vec)
Skip-Gram 是给定中心词预测上下文, CBOW 是给定上下文预测中心词(预测center 还是 context的区别)
torch.nn.RNN参数解释
结构类似下图,是循环展开的一种结构, 通过隐藏层传递不同时序之间的信息,使得这种网络结构可以适应不同序列长度的结构
kaggle猫狗识别
model = nn.Sequential( nn.BatchNorm2d(num_features=channel_size), nn.Conv2d(channel_size, 32
AdaGrad, RMSProp, Adam的数学原理
简单的AdaGrad, RMSProp, Adam的数学原理,介绍算法的震荡问题和自适应学习率算法学习率过早趋近于0的问题
下一页
个人成就
文章被点赞
42
文章被阅读
4,155
掘力值
361
关注了
4
关注者
10
收藏集
0
关注标签
0
加入于
2023-10-20