ChatGPT与大模型研究

ChatGPT与大模型研究

ChatGPT与大模型研究

生成式AI探索和研究，场景落地。

等 151 人订阅共890篇文章创建于2023-05-22

精通 Hugging Face 自然语言处理——面向 NLP 任务的迁移学习

引言迁移学习（Transfer Learning）通过使在大规模数据集上训练好的模型能够高效适配到特定任务中，极大地推动了自然语言处理（NLP）的发展。本章将探讨迁移学习在 Hugging Face

2月前
76
点赞
评论

精通 Hugging Face 自然语言处理——面向 NLP 任务的迁移学习

精通 Hugging Face 自然语言处理——使用 Hugging Face Diffusers 进行序列标注

引言序列标注（Sequence Labeling）是自然语言处理（NLP）中的一项核心任务，其目标是为序列中的每个单独 token 赋予标签，例如为句子中的每个单词分配标签。两类重要的序列标注应用包

2月前
86
点赞
评论

精通 Hugging Face 自然语言处理——使用 Hugging Face Diffusers 进行序列标注

精通 Hugging Face 自然语言处理——使用 Hugging Face Diffusers 实现高级生成任务

引言在本章中，我们将探讨 Hugging Face Diffusers 库的高级生成能力。这些能力正在改变文本、图像和视频的内容创作方式，带来实用的应用场景与创新机会。本章将清晰说明如何利用 GPT

2月前
73
点赞
评论

精通 Hugging Face 自然语言处理——使用 Hugging Face Diffusers 实现高级生成任务

精通 Hugging Face 自然语言处理——使用 Hugging Face Diffusers 进行文本分类

引言文本分类是自然语言处理（NLP）中最基础、也是最核心的应用之一，它使我们能够对海量非结构化文本进行组织、分析与理解。无论你处理的是情感分析、主题分类，还是垃圾邮件检测，文本分类对于从数据中提取可

2月前
94
点赞
评论

精通 Hugging Face 自然语言处理——使用 Hugging Face Diffusers 进行文本分类

精通 Hugging Face 自然语言处理——Hugging Face Diffusers 库导论

引言 Hugging Face Diffusers 库已经成为自然语言处理（NLP）领域中的一种变革性工具，使用户能够在广泛的应用场景中利用基于 Transformer 的模型能力。此外，在本书中，“

2月前
201
点赞
评论

精通 Hugging Face 自然语言处理——Hugging Face Diffusers 库导论

基于 Python 的 RAG 开发手册——带动态检索的 Agentic RAG

引言 “带动态检索的 Agentic RAG”这一章介绍了检索增强生成（Retrieval-Augmented Generation, RAG）的下一阶段演进：在这一阶段中，静态流水线被具备自适应能力

2月前
130
点赞
评论

基于 Python 的 RAG 开发手册——带动态检索的 Agentic RAG

基于 Python 的 RAG 开发手册——使用 Chains 实现 RAG

引言当我们不再满足于简单的“检索 + 响应”流水线，而是开始通过 Chains（链）来编排多个步骤时，RAG 的真正威力才会显现出来。链提供了一种结构化方式，用来连接检索、推理与生成，从而构建出更

2月前
48
点赞
评论

基于 Python 的 RAG 开发手册——使用 Chains 实现 RAG

基于 Python 的 RAG 开发手册——RAG 系统的高效检索

引言检索是任何 RAG 系统的骨架，因为它决定了模型能够使用哪些信息来为其响应提供事实支撑。没有有效的搜索，再先进的语言模型也有可能生成不完整、不相关，甚至产生幻觉的答案。本章将探讨那些能够让检索既

2月前
51
点赞
评论

基于 Python 的 RAG 开发手册——RAG 系统的高效检索

基于 Python 的 RAG 开发手册——RAG 系统的提示工程

引言提示工程（Prompt Engineering）是高效 RAG 系统的核心，它决定了大语言模型如何理解用户查询、如何与检索到的内容交互，以及如何生成有依据的回答。检索负责获取相关文档，生成负责产

2月前
84
点赞
评论

基于 Python 的 RAG 开发手册——RAG 系统的提示工程

基于 Python 的 RAG 开发手册——RAG 系统中基于大语言模型的响应生成

引言在 RAG 系统中，检索的真正价值会在响应生成阶段得到体现：在这一阶段，LLM 会将检索到的知识转化为有意义的答案。这个阶段至关重要，因为它直接塑造了用户对整个系统的感知。无论检索本身多么有效，

2月前
47
点赞
评论

基于 Python 的 RAG 开发手册——RAG 系统中基于大语言模型的响应生成

软件工程将分化为三个层次——AI 辅助编程正在改写企业的软件开发规则：瓶颈正从编码转向判断，并进一步影响软件构建方式与角色分工

几周前，我写过一篇关于 human in the loop（人类在环）的文章，讨论为什么如今在软件开发中，审查（review）正在成为新的瓶颈。随后，我又写了一篇，探讨这对职业发展，以及对那些正准

2月前
86
点赞
评论

软件工程将分化为三个层次——AI 辅助编程正在改写企业的软件开发规则：瓶颈正从编码转向判断，并进一步影响软件构建方式与角色分工

基于 Python 的 RAG 开发手册——从向量存储中进行高效检索

引言随着数据集在规模和复杂度上不断增长，RAG 系统的效果不仅取决于嵌入和向量存储的质量，也取决于检索效率。一个结构良好的向量数据库可以容纳数百万个高维向量，但若想在毫秒级返回相关结果，就必须依赖专

2月前
76
点赞
评论

基于 Python 的 RAG 开发手册——从向量存储中进行高效检索

基于 Python 的 RAG 开发手册——用于语义检索的向量存储

引言随着数字信息量以前所未有的速度增长，如何快速找到正确的知识片段，已经成为现代应用中最大的挑战之一。传统基于关键词的搜索引擎依赖词法匹配，而当查询的表述方式与目标文本不一致时，这类方法往往会表现不

2月前
92
点赞
评论

基于 Python 的 RAG 开发手册——用于语义检索的向量存储

基于 Python 的 RAG 开发手册——面向向量检索的嵌入策略

引言在 RAG 中，结果质量取决于嵌入（embeddings）。嵌入是内容的数学表示，它能够在高维向量空间中捕捉语义、上下文以及关系。当文档被转换为嵌入之后，它们就不再只是字符串，而是变成了空间中

2月前
111
点赞
评论

基于 Python 的 RAG 开发手册——面向向量检索的嵌入策略

基于 Python 的 RAG 开发手册——文档切分技术

引言在 RAG 系统中，要想有效检索信息，首先必须将大型文档拆分为更小、更易管理的单元，以便进行索引、嵌入和搜索。这个过程被称为文档切分（document splitting），它至关重要，因为语言

2月前
60
点赞
评论

基于 Python 的 RAG 开发手册——文档切分技术

基于 Python 的 RAG 开发手册——RAG 流水线中的文档加载器

引言在 RAG 流水线中，知识之旅始于文档。原始数据以多种形式存在，例如 PDF 报告、研究论文、电子表格、幻灯片、网站，甚至实时 API。如果没有一种结构化的方法将这些数据引入系统，检索过程就会变

2月前
65
点赞
评论

基于 Python 的 RAG 开发手册——RAG 流水线中的文档加载器

基于 Python 的 RAG 开发手册——检索增强生成（RAG）原理基础

引言本章介绍检索增强生成（Retrieval-Augmented Generation，RAG）的核心原理。RAG 通过为大语言模型（LLM）提供访问外部知识源的能力，增强了其能力表现。本章涵盖

2月前
49
点赞
评论

基于 Python 的 RAG 开发手册——检索增强生成（RAG）原理基础

Harness Engineering 深度解读：AI Agent 时代的工程范式革命

一、什么是 Harness Engineering？ Harness Engineering 是 2025-2026 年 AI 工程领域最重要的新概念之一。它不是一个工具，不是一个框架，而是一套围绕

2月前
3.1k
7
1

Harness Engineering 深度解读：AI Agent 时代的工程范式革命

6 个月成为 AI 工程师：一条真正能落地的学习路线图

过去一年，AI 工程几乎成了技术圈最热门的能力标签之一。但一个很现实的问题是：大多数初学者，并不知道自己到底该学什么。有人从机器学习理论开始，结果学了很久，依旧不会做产品；有人沉迷教程视频，看

2月前
337
1
评论

6 个月成为 AI 工程师：一条真正能落地的学习路线图

Agent 是 OS，Skill 的天花板是卖 Copy：真正的壁垒是 Agent-native Application

过去一年，围绕 Agent 的讨论里，最常见的两个创业方向是：做一个垂类 Agent 做一组给 Agent 用的 Skill 这两个方向看起来都很合理，但如果把问题放到更底层的系统结构里看，会发现它

2月前
88
点赞
评论

Agent 是 OS，Skill 的天花板是卖 Copy：真正的壁垒是 Agent-native Application