大模型

大模型

大模型

大模型相关技术

等 29 人订阅共60篇文章创建于2023-10-17

深入探究大语言模型的自回归推理机制

本文将带你走进 LLM 的自回归解码世界，揭示其推理过程中的两个关键阶段：预填和解码。让我们一同揭开这层神秘的面纱，探索智能生成的奥秘。

1年前
2.2k
点赞
评论

RLAIF：从 AI 反馈中的强化学习

本文将探索如何通过自动化人类反馈，利用AI自身的进化来指导和优化学习过程，开启一种全新的可能性，这不仅有望突破现有限制，更可能重塑我们对未来智能的理解。

1年前
624
点赞
1

激发大语言模型潜能的性能优化策略

大语言模型（LLM）革新了从市场营销到客户支持的各个行业。LLM 理解和处理人类语言的卓越能力使它们能够制定回应并加速各个领域的工作。本文将深入探讨优化 LLM 性能的必要性以及有效实现此目标的方法。

2年前
521
点赞
评论

上下文Context在大语言模型中的重要性

AI 的局限性，尤其是在学习能力上，提醒我们它们与人类智能的本质差异。本文将深入探讨这一主题，揭示 AI 在固定学习与推理能力上的局限，以及它们如何通过上下文学习实现自我超越。

2年前
532
点赞
评论

DeepSpeed：推动深度学习优化与创新

DeepSpeed的诞生优化了深度学习模型的训练和推理过程，更以创新的四大支柱技术，为AI的未来铺平了道路。本文深入探讨DeepSpeed如何重新定义深度学习的可能性，以及它对整个AI行业的深远影响。

2年前
865
1
评论

大语言模型超参数入门调参手册

本文将带你深入探索 LLM 超参数的世界，揭示它们如何影响模型的表现，并指导你如何通过精细调整，让模型的输出更加符合你的期望。让我们一起启程，揭开超参数调优的神秘面纱，解锁 AI 模型的无限潜能。

2年前
2.4k
20
5

全方位了解 Meta Llama 3

Llama 3以其卓越的语言理解和生成能力，为开发者和普通用户带来了前所未有的体验。本文将为您提供Llama 3的全面概览，从其架构、性能到未来的发展方向，让您一文了解这一革命性大语言模型的所有要点。

2年前
704
点赞
评论

GPU：大语言模型的心脏

由于 GPU 能够加速并行计算，在人工智能领域独领风骚。本文将介绍大语言模型工程化过程的 GPU 选型、相关计算指标、分布式训练最佳实践，揭示 GPU 的核心作用。

2年前
959
点赞
3

走进混合专家 (MoEs) 模型技术

混合专家 (MoEs) 是人工智能中的一种技术，提供了独特的方法，可以在有效地扩展模型的同时保持甚至提高其性能。本文将解释专家混合模型是什么，以及相关应用。

2年前
938
1
评论

Grok-1 ：目前参数最大的开源大模型

Grok-1 是一个拥有3140亿参数的专家混合模型，本文深入探讨 Grok-1 的技术复杂性、训练方法、安装部署、未来工作等内容，揭示了它在大模型革命中的地位。

2年前
987
点赞
评论

解读大语言模型量化

如何在有限的计算资源和能源消耗下实现复杂模型的高效运行？量化技术是解决这一挑战的关键技术之一，本文带您深入了解模型量化技术，分析各种模型量化方法。

2年前
1.9k
点赞
评论

Prefix-Tuning：自动化构造 Prompts 的高效微调

为满足相关需求的同时降低计算门槛和减少能源消耗，微调技术由此诞生，进而产生许多高效微调方法。本文介绍 Prefix Tuning 方法，从架构、原理、优势等方面阐述，带您迅速领悟其中奥义。

2年前
1.3k
1
评论

重温 Transformers 解码器

Transformer架构相对于早期的 RNN 显著提高了自然语言任务的性能，以其独特的注意机制和并行处理能力而闻名。本文回顾 Transformer 经典架构的解码器原理与应用，温故知新。

2年前
798
1
评论

重温 Transformers 编码器

Transformer架构相对于早期的 RNN 显著提高了自然语言任务的性能，以其独特的注意机制和并行处理能力而闻名。本文回顾 Transformer 经典架构的编码器原理与应用，温故知新。

2年前
658
点赞
评论

LoRA：重塑自然语言处理的未来

LoRA 可以在不牺牲性能的情况下更快、更高效地自适应 LLM。在这篇深入的文章中，我们将探讨 LoRA 的实现原理、性能优势和应用场景，以及它如何重塑自然语言处理的格局。

2年前
984
1
评论

带您了解轰动 AI 界的明星 Sora

OpenAI 推出了其最新视频模型 Sora，其展现出令人难以置信的自然、逻辑和微妙的情感，能够无缝融入周围环境。本文结合当前披露出的有效信息，带您全面了解 Sora 模型。

2年前
536
点赞
评论

RAG 与微调在大模型应用中如何抉择

随着大型语言模型热度的不断升温，越来越多的开发者和企业投身于基于这些大模型的应用程序开发中。本文将探讨 RAG 和微调在各个维度之间的微妙差别，发掘它们的适用场景。

2年前
3.2k
5
3

向量数据库：RAG应用的推进器（下）

向量数据库的出现，无疑将引领数据处理的变革，为我们带来前所未有的可能性。本文将围绕向量数据库，详细介绍向量存储的高级分类，并尝试从在企业规模上构建生成式人工智能应用程序的角度来审视这个新市场。

2年前
2.3k
1
评论

向量数据库：RAG应用的推进器（上）

向量数据库的出现，无疑将引领数据处理的变革，为我们带来前所未有的可能性。本文将围绕向量数据库，详细介绍向量存储的高级分类，并尝试从在企业规模上构建生成式人工智能应用程序的角度来审视这个新市场。

2年前
1.5k
3
1

基于RAG的私人知识库聊天机器人

在这篇文章中，将探讨如何利用 Retrieval-Augmented Generation（RAG）技术，结合 MongoDB 数据库和 LangChain 框架，来构建一个先进的私人知识聊天机器人。

2年前
1.9k
15
3