首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
ChatGPT与大模型研究
数据智能老司机
创建于2023-05-22
订阅专栏
生成式AI探索和研究,场景落地。
等 130 人订阅
共460篇文章
创建于2023-05-22
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
LLM工程师手册——评估大语言模型
LLM 评估是评估大型语言模型性能和能力的关键过程。评估可以采取多种形式,例如选择题回答、开放式指令以及来自真实用户的反馈。目前,还没有统一的方法来衡量模型的表现,但我们可以根据特定的使用场景来调整已
基于 RAG 的生成式 AI——提升 RAG 性能:借助专家人类反馈
人类反馈(HF)不仅对生成式 AI 有用,而且是必不可少的,特别是在涉及 RAG 的模型时。生成式 AI 模型在训练期间使用来自各种文档的数据集中的信息。训练 AI 模型的数据固定在模型的参数中;除非
基于 RAG 的生成式 AI——用于无人机技术的多模态模块化RAG
我们将在本章中通过模块化RAG将生成式AI提升到一个新的水平。我们将构建一个系统,通过不同的组件或模块来处理不同类型的数据和任务。例如,一个模块处理使用LLMs的文本信息,这也是我们在前几章中一直在做
基于 RAG 的生成式 AI——使用 LlamaIndex、Deep Lake 和 OpenAI 构建基于索引的 RAG
索引不仅提高了精度和速度,还提供了更多优势。索引通过增加透明度的层次,彻底改变了基于检索增强生成的 AI。使用索引,RAG 模型生成的响应来源完全可追溯,使我们能够清楚地看到所用数据的具体位置和详细内
基于 RAG 的生成式 AI——使用 Deep Lake 和 OpenAI 实现 RAG 嵌入向量存储
在实施 RAG 驱动的生成式 AI 时,项目执行过程中会不可避免地遇到复杂性。嵌入将庞大的结构化或非结构化文本转化为紧凑的高维向量,以捕捉其语义精髓,从而实现更快速、更高效的信息检索。然而,随着处理越
基于 RAG 的生成式 AI——为何选择 RAG 技术
即使是最先进的生成式 AI 模型,也只能基于它们已训练的数据生成响应。它们无法准确回答超出训练数据范围的问题。生成式 AI 模型“并不知道它们不知道的内容”!这会导致不准确或不恰当的输出,有时被称为幻
Rust中的异步编程——Coroutines 和 async/await
现在你已经对Rust的异步模型有了一个简要的了解,是时候来看看它如何融入到本书迄今为止涉及的内容中。 Rust的futures是基于无栈协程(stackless coroutines)的异步模型的一个
机器学习生产系统——可解释性
模型的可解释性有助于你更深入地理解模型的工作原理。 可解释性本身并没有一个数学定义。Biran 和 Cotton 提出了一个关于可解释性的良好定义。他们写道,系统,或者在本例中是模型,“如果其操作可以
机器学习生产系统——高性能建模
在生产场景中,从模型中获得最佳性能对于提供快速响应时间、低成本以及低资源需求至关重要。当计算资源需求较大时,尤其是处理大型模型和/或数据集时,或者当推理延迟和/或成本要求具有挑战性时,高性能建模变得尤
机器学习生产系统——模型资源管理技术
模型所需的计算、存储和输入/输出系统将决定将模型投入生产并在整个生命周期内维护它的成本。在本章中,我们将介绍一些重要的技术,这些技术可以帮助我们管理模型的资源需求。我们将重点关注三个关键领域,这些领域
机器学习生产系统——高级标签、增强和数据预处理
本章中的主题对于塑造你的数据,以便从中获得最大价值,尤其是在监督学习环境中,对于模型来说是非常重要的。特别是标签化,通常是机器学习应用创建、维护和演化过程中最昂贵且最耗时的活动之一。充分理解可用的选项
机器学习生产系统——数据旅程和数据存储
本章讨论生产管道生命周期中数据的演变。我们还将介绍一些可用于帮助管理该过程的工具。 正如前几章所述,数据是机器学习生命周期中的关键部分。随着机器学习生命周期中数据和模型的变化,能够识别、追踪和重现数据
机器学习生产系统——特征工程与特征选择
特征工程和特征选择是机器学习数据预处理的核心,尤其是在模型训练过程中。进行推理时同样需要特征工程,且推理阶段的预处理必须与训练阶段的预处理相匹配,这一点至关重要。 如果你曾在学术或研究环境等非生产场景
机器学习生产系统——数据收集、标注与验证
在生产环境中,你会发现数据的重要性令人深思。我们采访了Uber和Gojek的机器学习从业者——在这两个数据和机器学习至关重要的企业中,他们对此有以下看法: “数据是机器学习中最难的部分,也是最重要的一
机器学习生产系统——简介
机器学习工程领域非常广泛,以至于在将模型从实验阶段转移到生产部署过程中,容易迷失在各个必要步骤中。近年来,机器学习、新兴的机器学习概念(如注意力机制),以及最近的大型语言模型(LLMs)几乎每天都出现
LLM工程师手册——监督微调
监督微调(SFT) 是为大型语言模型(LLM)准备实际应用的关键步骤。在初始预训练阶段,LLM 学习如何预测序列中的下一个标记,而通过 SFT 微调则可以利用精心编排的指令和对应的答案对,进一步优化模
LLM工程师手册——RAG 特性管道
检索增强生成 (RAG) 是大多数生成式 AI 应用中的基础技术。RAG 的核心职责是将自定义数据注入大型语言模型 (LLM),使其能够执行特定操作(如总结、重述或提取注入的数据)。在使用 LLM 时
LLM工程师手册——数据工程
本章将深入探讨LLM双生子项目。我们将学习如何设计和实现数据收集管道,以收集所有LLM用例(如微调或推理)所需的原始数据。由于本书并非关于数据工程的专著,因此我们将保持简洁,仅关注收集所需原始数据的必
LLM工程师手册——工具与安装
本章介绍将在全书中使用的所有必要工具,特别是在实现和部署LLM双生子项目中。在本书的这一部分,我们不打算深入讲解LLM、RAG、MLOps或LLMOps概念,而是快速带你浏览我们的技术栈和前置条件,以
LLM工程师手册——理解LLM双生子概念与架构
到本书结束时,我们将引导你完成构建端到端大型语言模型(LLM)产品的旅程。我们坚信,学习LLM和生产级机器学习(ML)的最佳方式是亲自动手,构建实际系统。本书将教你如何构建一个“LLM双生子”——一个
下一页