旭伦

算法工程师

赞

0

|

搜索文章

2023年的深度学习入门指南(23) - ChatGLM2

本节我们借着讲ChatGLM2功能的机会，顺便把从CUDA一直到多GPU并行时要用到的量化方法完整地介绍了一遍。如果你有哪些功能可以用CUDA设备代码进行加速的，那就毫不犹豫地去实现它吧！

2年前
1.1k
1
评论

2023年的深度学习入门指南(23) - ChatGLM2

2023年的深度学习入门指南(24) - 处理音频的大模型 OpenAI Whisper

在这一讲之前，我们所用的大模型都是针对文本的。这一讲我们增加一个新的领域，即音频。我们将介绍OpenAI的Whipser模型。

2年前
1.6k
1
评论

2023年的深度学习入门指南(24) - 处理音频的大模型 OpenAI Whisper

2023年的深度学习入门指南(22) - 百川大模型13B的运行及量化

这一节我们会讲解如何在命令行和web服务中运行百川13b大模型以及如何通过量化的方法在更小的显存设备上运行

2年前
2.4k
点赞
评论

2023年的深度学习入门指南(22) - 百川大模型13B的运行及量化

2023年的深度学习入门指南(21) - 百川大模型

2023年的深度学习入门指南(21) - 百川大模型前面我们用了三节的篇幅介绍了目前最强大的开源模型LLaMA2。这一节我们说一说国产大模型的一个代表，百川大模型。

2年前
2.2k
点赞
评论

2023年的深度学习入门指南(21) - 百川大模型

2023年的深度学习入门指南(20) - LLaMA 2模型解析

上一节我们把LLaMA 2的生成过程以及封装的过程的代码简单介绍了下。还差LLaMA 2的模型部分没有介绍。这一节我们就来介绍下LLaMA的Transformer结构

2年前
2.2k
1
1

2023年的深度学习入门指南(20) - LLaMA 2模型解析

2023年的深度学习入门指南(19) - LLaMA 2源码解析

上一节我们学习了LLaMA 2的补全和聊天两种API的使用方法。本节我们来看看LLaMA 2的源码。

2年前
3.8k
1
评论

2023年的深度学习入门指南(19) - LLaMA 2源码解析

2023年的深度学习入门指南(18) - 将LLaMA 2运行起来

LLaMA 2是meta上周刚刚推出的最新开源大模型，最小只有7b的大小，编程接口跟openai的api很像，我们快将其跑起来吧。

2年前
6.3k
5
3

2023年的深度学习入门指南(18) - 将LLaMA 2运行起来

2023年的深度学习入门指南(17) - 深度学习的硬件加速技术

就是因为神经网络的宽容性，给各种硬件优化带来了不小的空间。虽然目前大模型的训练基本只能使用NVidia GPU，但是未来的训练和推理一定还有很多可以优化的空间。

2年前
1.0k
1
评论

2023年的深度学习入门指南(17) - 深度学习的硬件加速技术

2023年的深度学习入门指南(16) - JAX和TPU加速

我们选取了一些线性代数，高等数学和概率论的知识点，来唤醒大家的记忆。同时，我们也介绍了它们在JAX上的实现和加速。虽然我们的例子都不起眼，但它们是确确实实在TPU上跑起来的。

2年前
1.1k
点赞
评论

2023年的深度学习入门指南(16) - JAX和TPU加速

2023年的深度学习入门指南(15) - 大模型的幻觉

大模型的能力最另人惊讶的，一个是强大的能力，另一个就是时不时一本正经地胡说八道。如果你用的是小一点的模型，可能还见过输出循环内容之类的情况。我们将这种生成不良内容的现象称为幻觉

2年前
2.5k
1
1

2023年的深度学习入门指南(15) - 大模型的幻觉

个人成就

文章被点赞 40

文章被阅读 58,864

掘力值 1,407

加入于

2021-03-10