网络 - 徐无鱼的收藏集 - 掘金

网络

更多收藏集

14篇文章 · 0订阅

AI产品经理必看的大模型微调劝退指南丨实战笔记

为什么没事儿不要想着微调？先来看这个金融模型case的微调用了多少数据，看完劝退啊哈哈哈。这只是量级上的吓人，况且微调对数据的要求比rag要严格式上也不能放松。

阿星AI工作室
24天前
264
4
评论

AI产品经理必看的大模型微调劝退指南丨实战笔记

作为普通程序员，我们该如何学习大模型（LLM），学习路线和知识体系

人在不断的驱赶下依然还有新的立足之地，这些新领地恰恰是技术延展出来的百年前的纺织工人的后代并不会接着做纺织，他可能是一名铁路工人。

代码邮递员
1年前
15k
157
21

作为普通程序员，我们该如何学习大模型（LLM），学习路线和知识体系

深入理解Transformer技术原理｜得物技术

谷歌在2017年发布Transformer架构的论文时，论文的标题是：Attention Is All You Need。重点说明了这个架构是基于注意力机制的。

得物技术
1年前
6.4k
50
2

深入理解Transformer技术原理｜得物技术

LLM中的强化学习：PPO、DPO、KTO等

LLM中的强化学习：PPO、DPO、KTO等。为什么要用强化学习训练、强化学习算法发展脉络、常见的强化学习算法：PPO、DPO、KTO等等

LLM中的强化学习：PPO、DPO、KTO等

机器学习|从0开始大模型之模型DPO训练

上一篇如何使用LoRA训练大模型，但是模型的效果不是很好，可以看如下对话： ... 对话的偏好不是我们想要的答案，所以需要继续微调训练，这篇文章就介绍DPO。

周末程序猿
8月前
478
2
评论

CV大模型系列之：打败VIT？Swin Transformer是怎么做到的

一文详细图解Swin Transformer架构，探索移动窗口attention、patch merging、patch partition等技术细节

猛猿
1年前
3.4k
6
评论

CV大模型系列之：打败VIT？Swin Transformer是怎么做到的

不会 Git？Oh My Git让你边玩游戏边学会！

Oh My Git是一款开源的Git 学习游戏，用可视化方式教你搞懂 Git 的工作原理！它不是一堆文档，不是看教程视频，而是一边操作 Git，一边看到结果发生变化，边玩边学，根本停不下来。

趣丸技术
2月前
358
1
评论

不会 Git？Oh My Git让你边玩游戏边学会！

Latent Diffusion Model是怎么完成图像快速生成的？

潜在扩散模型（Latent Diffusion Model, LDM）是一种基于深度学习的生成模型，它是在传统的扩散模型的基础上进行了改进和扩展。

指尖_流年
11月前
871
1
评论

Latent Diffusion Model是怎么完成图像快速生成的？

对抗生成网络GAN系列——Spectral Normalization原理详解及源码解析

本文介绍了一种实现Lipschitz 连续条件的新方法——SpectralNormalization，以实现更稳定的GAN，快来看看叭🌱🌱🌱

秃头小苏
2年前
4.2k
16
7

对抗生成网络GAN系列——Spectral Normalization原理详解及源码解析

pip命令全局设置镜像源、临时用代理上网

使用pip命令全局配置pip阿里云镜像源不用找pip配置文件路径，pip会根据当前系统的环境变量自动完成配置器通过代理临时上网：执行命令行：取消代理：

lcb8816
5年前
3.8k
点赞
评论