大模型训练 - user5114080601206的收藏集 - 掘金

大模型训练

user5114080601206

更多收藏集

10篇文章 · 0订阅

《深入浅出多模态》之多模态技术知识总结（上）

本作者推出全新系列《深入浅出多模态》专栏，具体章节如导图所示（导图后续更新），将分别从各个多模态模型的概念、经典模型、创新点、论文综述、发展方向、数据集等各种角度展开详细介绍，欢迎大家关注。

GoAI
1年前
2.0k
5
1

《深入浅出多模态》之多模态技术知识总结（上）

大模型分布式训练并行技术（八）-MOE并行

近年来，随着Transformer、MOE架构的提出，使得深度学习模型轻松突破上万亿规模参数，传统的单机单卡模式已经无法满足超大模型进行训练的要求。因此，我们需要基于单机多卡、甚至是多机多卡进行分布式

吃果冻不吐果冻皮
2年前
5.2k
3
评论

大模型推理框架概述

从 ChatGPT 面世以来，引领了大模型时代的变革，除了大模型遍地开花以外，承载大模型进行推理的框架也是层出不穷，大有百家争鸣的态势。本文主要针对业界知名度较高的一些大模型推理框架进行相应的概述。

吃果冻不吐果冻皮
2年前
6.7k
3
评论

港中文 & 苏大发布中文语法纠错大模型GrammarGPT | 仅用1K数据进行指令微调即可达到SOTA性能！

在本文中，我们介绍了GrammarGPT，这是一个专门用于母语中文语法错误纠正的开源大语言模型（LLM）。

CVHub
2年前
1.6k
点赞
1

一键式文本纠错工具，整合了BERT、MacBERT、ELECTRA、ERNIE等多种模型，让您立即享受纠错的便利和效果

pycorrector一键式文本纠错工具，整合了BERT、MacBERT、ELECTRA、ERNIE等多种模型，让您立即享受纠错的便利和效果 pycorrector: 中文文本纠错工具。支持中文音似、

汀丶人工智能
2年前
2.1k
7
评论

一键式文本纠错工具，整合了BERT、MacBERT、ELECTRA、ERNIE等多种模型，让您立即享受纠错的便利和效果

大模型国产化适配4-基于昇腾910使用LLaMA-13B进行多机多卡训练

随着 ChatGPT 的现象级走红，引领了 AI 大模型时代的变革，从而导致 AI 算力日益紧缺。与此同时，

吃果冻不吐果冻皮
2年前
6.0k
9
评论

大模型国产化适配4-基于昇腾910使用LLaMA-13B进行多机多卡训练

解码Transformer：自注意力机制与编解码器机制详述与代码实现

> 本文全面探讨了Transformer及其衍生模型，深入分析了自注意力机制、编码器和解码器结构，并列举了其编码实现加深理解，最后列出基于Transformer的各类模型如BERT、GPT等。文章旨

techlead_krischang
2年前
2.5k
7
评论

我问了鹅厂程序员：你们工作中怎么用ChatGPT？如何高效Prompt？

当你还在错误使用对话 AI 工具如 GPT，可能会觉得其作用不过是知识平移总结或简单问答。实际上，当了解先进的用法、知悉如何做到 better prompt，你会发现：AI 不是来替代你

腾讯云开发者
2年前
52k
515
92

狂追ChatGPT：开源社区的“平替”热潮

目前，不少优质的类ChatGPT模型都只能通过API接入，而一些开源LLM的效果与ChatGPT相比差距不小。不过，近期开源社区开始密集发力了。

OneFlow一流科技
2年前
1.9k
2
评论