ChatGPT与大模型研究

ChatGPT与大模型研究

ChatGPT与大模型研究

生成式AI探索和研究，场景落地。

等 112 人订阅共280篇文章创建于2023-05-22

使用Python和PyTorch的生成式AI——提示工程

提示工程，尽管是新兴领域，但它继承了让复杂系统更易于访问的悠久历史。20世纪60年代，COBOL（Common Business-Oriented Language，通用商业语言）被开发出来，旨在使非

1月前
69
1
评论

使用Python和PyTorch的生成式AI——提示工程

使用Python和PyTorch的生成式AI——LLM工具箱

到目前为止，我们已经探讨了一些LLM的基础知识——如Transformer、提示工程和一些流行的开源模型。在本章中，我们将深入探讨一些工具，这些工具允许你使用这些模型构建完整的系统——这将使我们能够超

1月前
44
点赞
评论

使用Python和PyTorch的生成式AI——LLM工具箱

使用Python和PyTorch的生成式AI——开源大语言模型（LLMs）

在前几章中，我们已经看到大语言模型（LLMs）是极其复杂的，可能拥有数万亿个参数，并且其准确性很难量化。然而，使用这些系统的另一个固有挑战是它们的缺乏透明度。许多模型是专有的——例如，GPT-4的白皮

1月前
77
点赞
评论

使用Python和PyTorch的生成式AI——开源大语言模型（LLMs）

使用Python和PyTorch的生成式AI——LLM基础

尽管大型语言模型（LLMs）似乎已经在人工智能领域占据了主导地位，但实际上，这一现象只持续了几年。人工智能的真正热潮始于2022年11月OpenAI发布ChatGPT，仅用一周时间就达到了百万用户。这

1月前
87
点赞
评论

使用Python和PyTorch的生成式AI——LLM基础

使用Python和PyTorch的生成式AI——NLP 2.0：使用变换器（Transformers）生成文本

上一章帮助我们建立了对NLP概念的基础理解，如文本表示和语言建模，以及基于RNN的架构来执行生成任务。在本章中，我们将建立在这些概念的基础上，并介绍一些增强功能，这些功能促成了当前最先进的变换器架构的

1月前
19
点赞
评论

使用Python和PyTorch的生成式AI——NLP 2.0：使用变换器（Transformers）生成文本

使用Python和PyTorch的生成式AI——深度神经网络的构建块

本书中我们将实现的各种生成性AI模型，都是建立在过去15年深度学习和神经网络领域的进展基础上的。虽然在实践中，我们可以在不参考历史发展情况的前提下实现这些项目，但回溯其基本组件能帮助你更深入理解这些模

1月前
19
点赞
评论

使用Python和PyTorch的生成式AI——深度神经网络的构建块

使用Python和PyTorch的生成式AI——生成性AI概述：从模型中提取数据

在2022年科罗拉多州博览会中，获奖作品是一幅由视频游戏设计师杰森·艾伦创作的奇幻科幻风景，名为《Théâtre D’opéra Spatial》（图1.1）。这幅一等奖艺术作品因其戏剧性的主题和这幅

1月前
18
点赞
评论

使用Python和PyTorch的生成式AI——生成性AI概述：从模型中提取数据

LangChain——充分利用LLM的模式

如今，LLM存在一些主要的局限性，但这并不意味着你梦想中的LLM应用无法构建。你为用户设计的应用体验需要绕过这些局限性，理想情况下还要与这些局限性协同工作。第五章提到了构建LLM应用时我们面临的关键

2月前
114
点赞
评论

LangChain——RAG 第二部分：与你的数据对话

在上一章中，您学习了如何处理数据并在向量存储中创建和存储嵌入。在本章中，您将学习如何根据用户的查询高效地检索最相关的嵌入和文档块。这使您能够构建一个包含相关文档作为上下文的提示，从而提高 LLM 最终

2月前
63
点赞
评论

LangChain——RAG 第一部分：索引你的数据

在上一章中，你了解了使用LangChain创建LLM应用程序的关键构建块。你还构建了一个简单的AI聊天机器人，该机器人由发送到模型的提示和模型生成的输出组成。但这个简单的聊天机器人有一些重大限制。如

2月前
55
点赞
评论

LangChain——代理 II

第六章介绍了代理架构，这是我们迄今为止见过的最强大的 LLM 架构。将链式思维提示、工具使用和循环结合起来的潜力难以夸大。本章讨论了两种对代理架构的扩展，它们能在某些用例中提高性能：反思这是借鉴

2月前
26
点赞
评论

LangChain——代理架构

在第五章描述的架构基础上，本章将介绍当前所有 LLM 架构中或许最重要的——代理架构。首先，我们介绍使 LLM 代理独特的特点，然后展示如何构建这些代理，以及如何将它们扩展以适应常见的使用案例。在人

2月前
24
点赞
评论

LangChain——使用 LangGraph 的认知架构

到目前为止，我们已经讨论了 LLM 应用的最常见特性：引导技术（在前言和第一章中） RAG（在第二章和第三章中）内存（在第四章中）接下来的问题应该是：我们如何将这些部分组装成一个连贯的应用，以实

2月前
124
点赞
评论

LangChain——使用LangGraph为你的聊天机器人添加记忆

在第3章中，你学习了如何为你的AI聊天机器人应用提供最新且相关的上下文。这使得你的聊天机器人能够基于用户的输入生成准确的回答。但仅此不足以构建一个生产级应用。如何才能让你的应用真正地与用户进行“来回对

2月前
196
点赞
评论

深度学习架构师手册——在动态环境中有效管理漂移效应

漂移是部署的深度学习模型在一段时间内性能恶化的一个重要因素，涵盖了概念漂移、数据漂移和模型漂移。让我们通过一个基于烹饪的类比来理解部署模型的漂移。想象一个部署的深度学习模型就像一位技术精湛的厨师，目标

2月前
33
点赞
评论

深度学习架构师手册——大语言模型解决方案架构

大语言模型（LLMs）已经彻底改变了自然语言处理（NLP）和人工智能（AI）领域，在处理各种任务时展现出卓越的多功能性。然而，要充分发挥它们的潜力，需要解决一些挑战并开发有效的LLM解决方案。在本章中

2月前
45
点赞
评论

图神经网络——考虑事项：GNN 项目

本章内容包括：从非图数据创建图数据模型从原始数据源进行提取、转换、加载和预处理使用 PyTorch Geometric 创建数据集和数据加载器在本章中，我们将描述与图数据相关的实际操作，以及如

2月前
64
点赞
评论

图神经网络实战——大规模的学习与推理

本章内容包括：处理小型系统中数据过载的策略识别需要扩展资源的图神经网络问题缓解大数据带来的问题的七种稳健技术使用PyTorch Geometric扩展图神经网络并应对可扩展性挑战在我们对图神

2月前
70
点赞
评论

图神经网络实战——动态图：时空图神经网络（Spatiotemporal GNNs）

本章内容在深度学习模型中引入记忆理解使用图神经网络建模时间关系的不同方式实现动态图神经网络评估时序图神经网络模型到目前为止，我们的所有模型和数据都只是时间中的单一快照。实际上，世界是动态的，

2月前
467
点赞
评论

图神经网络实战——图注意力网络

本章内容包括：理解注意力机制以及它是如何应用于图注意力网络（GAT）的了解何时在PyTorch Geometric中使用GAT和GATv2层通过NeighborLoader类使用小批量处理在垃

2月前
332
2
评论