dl - John133766074的收藏集 - 掘金

dl

John133766074 创作等级LV.2

更多收藏集

13篇文章 · 0订阅

LoRA：语言模型微调的计算资源优化策略

随着数据量和计算能力的增加，大模型的参数量也在不断增加，同时进行大模型微调的成本也变得越来越高。全参数微调需要大量的计算资源和时间，且在进行切换下游任务时代价高昂。本文作者介绍了一种新方法 LoR

Baihai_IDP
2年前
2.0k
5
评论

【AI】浅谈梯度下降算法（实战篇）

在求解机器学习算法的模型参数，即无约束优化问题时，梯度下降（Gradient Descent）是最常采用的方法之一，另一种常用的方法是最小二乘法。目前正在学习这方面相关的内容，因此简单谈谈。

sidiot
3年前
7.6k
49
7

【AI】浅谈梯度下降算法（理论篇）

在求解机器学习算法的模型参数，即无约束优化问题时，梯度下降（Gradient Descent）是最常采用的方法之一，另一种常用的方法是最小二乘法。目前正在学习这方面相关的内容，因此简单谈谈。

sidiot
3年前
8.9k
55
10

实际应用效果不佳？来看看提升深度神经网络泛化能力的核心技术（附代码） ⛵

神经网络在学习能力与性能方面，远超传统机器学习算法，也容易陷入了『过拟合』问题。本篇梳理4类缓解过拟合的方法：数据增强、Dropout随机失活、L1和L2正则化、Early Stopping/早停止。

ShowMeAI
3年前
4.0k
7
2

实际应用效果不佳？来看看提升深度神经网络泛化能力的核心技术（附代码） ⛵

Keras深度学习——可视化神经网络中间层输出

在本节中，我们将学习如何提取模型中各种卷积核学习到的内容特征。此外，我们将对比开始几个卷积层中的卷积核学习到的内容与最后几个卷积层中的卷积核学习到的内容。

盼小辉丶
3年前
2.0k
4
评论

Keras深度学习——可视化神经网络中间层输出

机器学习怎么入门？这有一套完整的入门到精通路线图

该路线图几乎涵盖了 AI 领域所有的知识点，并且每个知识点都有详细的文档。有了这个路线图的指导，或许能帮助你快速入门乃至成为 AI 领域的佼佼者。该项目上线短短几天，已经收获了 2.1k 星。就这份 AI 专家路线图而言，开发者列出了任何学习路径所必不可少的一些要素，如论文和…

机器学习与统计学
5年前
2.0k
8
评论

推荐系统中CTR排序模型汇总(LR,GBDT,FM,FFM,MLR,Deep and wide,Deep and cross,deepFM,XDeepFM,PN

1. CTR概念 CTR, click through rate，指广告被点击次数 / 广告显示次数。 CTR预估模型公式：$y = f(x)$, $y \in [0, 1]$, 表示广告被点击的概率。以下将介绍 LR, GBDT, FM, FFM, MLR, Deep an…

RoseDeli
5年前
5.4k
6
1

几种常见损失函数Loss function介绍及Pytorch实现

损失函数，又叫目标函数，用于计算真实值和预测值之间差异的函数，和优化器是编译一个神经网络模型的重要要素。损失Loss必须是标量，因为向量无法比较大小（向量本身需要通过范数等标量来比较）。损失函数一般分为4种，HingeLoss 0-1 损失函数，绝对值损失函数，平方损失函数…

RoseDeli
5年前
7.5k
8
评论

AABO：自适应Anchor设置优化，性能榨取的最后一步 | ECCV 2020 Spotlight

目前，主流的目标检测算法使用多种形状的anchor box作为初始预测，然后对anchor box进行回归调整，anchor box的配置是检测算法中十分重要的超参数。一般而言，anchor box的配置都是简单地通过人为指定，比如Faster R-CNN经典的的9种形状，也可…

晓飞的算法工程笔记
5年前
2.3k
2
评论