首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
ChatGPT与大模型研究
数据智能老司机
创建于2023-05-22
订阅专栏
生成式AI探索和研究,场景落地。
等 151 人订阅
共890篇文章
创建于2023-05-22
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
精通 Hugging Face 自然语言处理——面向 NLP 任务的迁移学习
引言 迁移学习(Transfer Learning)通过使在大规模数据集上训练好的模型能够高效适配到特定任务中,极大地推动了自然语言处理(NLP)的发展。本章将探讨迁移学习在 Hugging Face
精通 Hugging Face 自然语言处理——使用 Hugging Face Diffusers 进行序列标注
引言 序列标注(Sequence Labeling)是自然语言处理(NLP)中的一项核心任务,其目标是为序列中的每个单独 token 赋予标签,例如为句子中的每个单词分配标签。两类重要的序列标注应用包
精通 Hugging Face 自然语言处理——使用 Hugging Face Diffusers 实现高级生成任务
引言 在本章中,我们将探讨 Hugging Face Diffusers 库的高级生成能力。这些能力正在改变文本、图像和视频的内容创作方式,带来实用的应用场景与创新机会。本章将清晰说明如何利用 GPT
精通 Hugging Face 自然语言处理——使用 Hugging Face Diffusers 进行文本分类
引言 文本分类是自然语言处理(NLP)中最基础、也是最核心的应用之一,它使我们能够对海量非结构化文本进行组织、分析与理解。无论你处理的是情感分析、主题分类,还是垃圾邮件检测,文本分类对于从数据中提取可
精通 Hugging Face 自然语言处理——Hugging Face Diffusers 库导论
引言 Hugging Face Diffusers 库已经成为自然语言处理(NLP)领域中的一种变革性工具,使用户能够在广泛的应用场景中利用基于 Transformer 的模型能力。此外,在本书中,“
基于 Python 的 RAG 开发手册——带动态检索的 Agentic RAG
引言 “带动态检索的 Agentic RAG”这一章介绍了检索增强生成(Retrieval-Augmented Generation, RAG)的下一阶段演进:在这一阶段中,静态流水线被具备自适应能力
基于 Python 的 RAG 开发手册——使用 Chains 实现 RAG
引言 当我们不再满足于简单的“检索 + 响应”流水线,而是开始通过 Chains(链) 来编排多个步骤时,RAG 的真正威力才会显现出来。链提供了一种结构化方式,用来连接检索、推理与生成,从而构建出更
基于 Python 的 RAG 开发手册——RAG 系统的高效检索
引言 检索是任何 RAG 系统的骨架,因为它决定了模型能够使用哪些信息来为其响应提供事实支撑。没有有效的搜索,再先进的语言模型也有可能生成不完整、不相关,甚至产生幻觉的答案。本章将探讨那些能够让检索既
基于 Python 的 RAG 开发手册——RAG 系统的提示工程
引言 提示工程(Prompt Engineering)是高效 RAG 系统的核心,它决定了大语言模型如何理解用户查询、如何与检索到的内容交互,以及如何生成有依据的回答。检索负责获取相关文档,生成负责产
基于 Python 的 RAG 开发手册——RAG 系统中基于大语言模型的响应生成
引言 在 RAG 系统中,检索的真正价值会在响应生成阶段得到体现:在这一阶段,LLM 会将检索到的知识转化为有意义的答案。这个阶段至关重要,因为它直接塑造了用户对整个系统的感知。无论检索本身多么有效,
软件工程将分化为三个层次——AI 辅助编程正在改写企业的软件开发规则:瓶颈正从编码转向判断,并进一步影响软件构建方式与角色分工
几周前,我写过一篇关于 human in the loop(人类在环) 的文章,讨论为什么如今在软件开发中,审查(review) 正在成为新的瓶颈。随后,我又写了一篇,探讨这对职业发展,以及对那些正准
基于 Python 的 RAG 开发手册——从向量存储中进行高效检索
引言 随着数据集在规模和复杂度上不断增长,RAG 系统的效果不仅取决于嵌入和向量存储的质量,也取决于检索效率。一个结构良好的向量数据库可以容纳数百万个高维向量,但若想在毫秒级返回相关结果,就必须依赖专
基于 Python 的 RAG 开发手册——用于语义检索的向量存储
引言 随着数字信息量以前所未有的速度增长,如何快速找到正确的知识片段,已经成为现代应用中最大的挑战之一。传统基于关键词的搜索引擎依赖词法匹配,而当查询的表述方式与目标文本不一致时,这类方法往往会表现不
基于 Python 的 RAG 开发手册——面向向量检索的嵌入策略
引言 在 RAG 中,结果质量取决于嵌入(embeddings) 。嵌入是内容的数学表示,它能够在高维向量空间中捕捉语义、上下文以及关系。当文档被转换为嵌入之后,它们就不再只是字符串,而是变成了空间中
基于 Python 的 RAG 开发手册——文档切分技术
引言 在 RAG 系统中,要想有效检索信息,首先必须将大型文档拆分为更小、更易管理的单元,以便进行索引、嵌入和搜索。这个过程被称为文档切分(document splitting),它至关重要,因为语言
基于 Python 的 RAG 开发手册——RAG 流水线中的文档加载器
引言 在 RAG 流水线中,知识之旅始于文档。原始数据以多种形式存在,例如 PDF 报告、研究论文、电子表格、幻灯片、网站,甚至实时 API。如果没有一种结构化的方法将这些数据引入系统,检索过程就会变
基于 Python 的 RAG 开发手册——检索增强生成(RAG)原理基础
引言 本章介绍检索增强生成(Retrieval-Augmented Generation,RAG)的核心原理。RAG 通过为大语言模型(LLM)提供访问外部知识源的能力,增强了其能力表现。 本章涵盖
Harness Engineering 深度解读:AI Agent 时代的工程范式革命
一、什么是 Harness Engineering? Harness Engineering 是 2025-2026 年 AI 工程领域最重要的新概念之一。它不是一个工具,不是一个框架,而是一套围绕
6 个月成为 AI 工程师:一条真正能落地的学习路线图
过去一年,AI 工程几乎成了技术圈最热门的能力标签之一。 但一个很现实的问题是: 大多数初学者,并不知道自己到底该学什么。 有人从机器学习理论开始,结果学了很久,依旧不会做产品; 有人沉迷教程视频,看
Agent 是 OS,Skill 的天花板是卖 Copy:真正的壁垒是 Agent-native Application
过去一年,围绕 Agent 的讨论里,最常见的两个创业方向是: 做一个垂类 Agent 做一组给 Agent 用的 Skill 这两个方向看起来都很合理,但如果把问题放到更底层的系统结构里看,会发现它
下一页