人工智能 - 用户005199602153的收藏集 - 掘金

人工智能

用户005199602153

更多收藏集

4篇文章 · 0订阅

大模型分布式训练并行技术（八）-MOE并行

近年来，随着Transformer、MOE架构的提出，使得深度学习模型轻松突破上万亿规模参数，传统的单机单卡模式已经无法满足超大模型进行训练的要求。因此，我们需要基于单机多卡、甚至是多机多卡进行分布式

吃果冻不吐果冻皮
1年前
4.8k
3
评论

一张照片，TikTok小姐姐就都能跳舞了

前几日，阿里研究团队构建了一种名为 Animate Anyone 的方法，只需要一张人物照片，再配合骨骼动画引导，就能生成自然的动画视频。不过，这项研究的源代码还没有发布。

机器之心
1年前
34k
202
86

一张照片，TikTok小姐姐就都能跳舞了

2023年的深度学习入门指南(12) - PEFT与LoRA

LoRA的思想是将原始的权重矩阵分解为两个低秩矩阵的乘积，这样就可以大大减少参数量。其本质思想还是将复杂的问题拆解为简单的问题的组合。

旭伦
2年前
4.3k
1
评论

2023年的深度学习入门指南(12) - PEFT与LoRA

手把手教你从零搭建自己的知识库

从零开始实现了大模型外接知识库的流程：中文数据集处理词向量模型训练文档向量化向量数据库存储知识库本地ChatGLM2-6B大模型部署简单的知识库应用

OceanPresent
1年前
15k
146
8

手把手教你从零搭建自己的知识库