首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
旭伦
掘友等级
算法工程师
获得徽章 8
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
最新
热门
2023年的深度学习入门指南(23) - ChatGLM2
本节我们借着讲ChatGLM2功能的机会,顺便把从CUDA一直到多GPU并行时要用到的量化方法完整地介绍了一遍。 如果你有哪些功能可以用CUDA设备代码进行加速的,那就毫不犹豫地去实现它吧!
2023年的深度学习入门指南(24) - 处理音频的大模型 OpenAI Whisper
在这一讲之前,我们所用的大模型都是针对文本的。这一讲我们增加一个新的领域,即音频。我们将介绍OpenAI的Whipser模型。
2023年的深度学习入门指南(22) - 百川大模型13B的运行及量化
这一节我们会讲解如何在命令行和web服务中运行百川13b大模型以及如何通过量化的方法在更小的显存设备上运行
2023年的深度学习入门指南(21) - 百川大模型
2023年的深度学习入门指南(21) - 百川大模型 前面我们用了三节的篇幅介绍了目前最强大的开源模型LLaMA2。这一节我们说一说国产大模型的一个代表,百川大模型。
2023年的深度学习入门指南(20) - LLaMA 2模型解析
上一节我们把LLaMA 2的生成过程以及封装的过程的代码简单介绍了下。还差LLaMA 2的模型部分没有介绍。这一节我们就来介绍下LLaMA的Transformer结构
2023年的深度学习入门指南(19) - LLaMA 2源码解析
上一节我们学习了LLaMA 2的补全和聊天两种API的使用方法。本节我们来看看LLaMA 2的源码。
2023年的深度学习入门指南(18) - 将LLaMA 2运行起来
LLaMA 2是meta上周刚刚推出的最新开源大模型,最小只有7b的大小,编程接口跟openai的api很像,我们快将其跑起来吧。
2023年的深度学习入门指南(17) - 深度学习的硬件加速技术
就是因为神经网络的宽容性,给各种硬件优化带来了不小的空间。虽然目前大模型的训练基本只能使用NVidia GPU,但是未来的训练和推理一定还有很多可以优化的空间。
2023年的深度学习入门指南(16) - JAX和TPU加速
我们选取了一些线性代数,高等数学和概率论的知识点,来唤醒大家的记忆。同时,我们也介绍了它们在JAX上的实现和加速。 虽然我们的例子都不起眼,但它们是确确实实在TPU上跑起来的。
2023年的深度学习入门指南(15) - 大模型的幻觉
大模型的能力最另人惊讶的,一个是强大的能力,另一个就是时不时一本正经地胡说八道。如果你用的是小一点的模型,可能还见过输出循环内容之类的情况。我们将这种生成不良内容的现象称为幻觉
下一页
个人成就
文章被点赞
40
文章被阅读
53,811
掘力值
1,397
关注了
14
关注者
90
收藏集
0
关注标签
10
加入于
2021-03-10