首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
ChatGPT与大模型研究
数据智能老司机
创建于2023-05-22
订阅专栏
生成式AI探索和研究,场景落地。
等 151 人订阅
共876篇文章
创建于2023-05-22
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
Kubernetes 上的生成式 AI——AI 驱动的应用
在前面的章节中,我们已经演示了如何在 Kubernetes 上部署像 vLLM 这样的模型服务、如何打包模型数据,以及如何在生产规模上运行推理。在这一基础之上,我们现在将把视角从“服务单个模型”转向“
Kubernetes 上的生成式 AI——作业调度优化
虽然模型训练涵盖了 LLM 的整个生命周期——从预训练(pre-training) ,到对齐(alignment) ,再到定制化(customization) ——但上一章聚焦的是模型定制化,因为这是
Kubernetes 上的生成式 AI——模型定制化
从零开始训练一个 LLM,需要大量计算资源和专业能力,而这是大多数组织都不具备的。本章不会讨论如何从头创建模型,而是聚焦于:如何针对你的具体用例,对一个已有的 LLM 进行定制化。我们将介绍几种常见的
Kubernetes 上的生成式 AI——模型可观测性
在第 1 章中,我们学习了如何从零开始,通过一个简单的编码示例,把 LLM 部署到 Kubernetes 上。整套技术栈包括:一个模型服务端 vLLM,用于优化模型执行;以及一个 Model Serv
Kubernetes 上的生成式 AI——在生产环境中运行
到目前为止,你很可能已经把自己的第一个 LLM 部署到 Kubernetes 上运行了。 它能够响应请求,延迟表现甚至可能还不错。 但所谓生产环境,并不是“能跑一次”就够了,而是要能够稳定地跑、在规模
Kubernetes 上的生成式 AI——Kubernetes 和 GPUs
从根本上说,生成式 AI 涉及高强度的数学计算,尤其是张量乘法等线性代数运算。这些运算需要巨大的算力和内存容量,才能处理大规模数据集以及参数规模从数百亿到上千亿不等的模型。幸运的是,一类被称为图形处理
Kubernetes 上的生成式 AI——模型数据
在 Kubernetes 上运行 LLM 时,最根本的挑战之一,就是如何管理体量巨大的模型数据。LLM 的大小从几 GB 到接近 1 TB 不等,而要高效地把这些数据引入集群、并让运行时能够访问它们,
Kubernetes 上的生成式 AI——部署模型
当真实数据由于隐私法律或合规要求而不能离开你自己的集群,或者你需要对模型部署与性能拥有更强控制力时,就有必要在自己的集群内运行模型。 当前市面上的模型种类很多,其中不少是开源的,并且可免费用于商业用途
AI 智能体与应用——将 AI 智能体推进到生产落地:记忆、护栏,以及更多能力
本章涵盖: 使用 LangGraph checkpoint 添加短期记忆 在工作流的多个阶段实现 guardrails(护栏机制) 面向生产部署的其他注意事项 要构建能够在真实世界环境中稳定运行的 A
AI 智能体与应用——构建与使用 MCP 服务器
本章涵盖以下内容: 理解模型上下文协议(Model Context Protocol,MCP)的用途与底层架构 构建并对外暴露你自己的 MCP 服务器,并以一个实用的天气工具为例进行说明 在应用中测试
AI 智能体与应用——多智能体系统
本章涵盖以下内容: 将工具连接到数据源 使用路由器(router)和监督者(supervisor)模式组合多智能体系统 调试、测试与追踪多智能体交互 在第 11 章中,我们通过构建一个旅行信息智能体,
如何对 AI Web 智能体进行身份认证
AI Web 智能体可以浏览网页、点击按钮、填写表单、提取数据。它们几乎能完成一个人类在网上能做的任何事情……唯独不能登录。 身份认证并不只是一个小麻烦;它会直接阻止智能体完成那些对你真正有价值的任务
AI 智能体与应用——使用 LangGraph 构建基于工具的智能体
本章涵盖 使用 LangGraph 构建由大语言模型驱动的智能体 注册并使用工具,以支持智能体的动态执行 调试智能体执行过程与工具调用 使用 LangGraph 预构建组件简化智能体开发 使用 Lan
AI 智能体与应用——查询生成、路由与检索后处理
本章涵盖以下内容: 直接从用户问题中生成元数据查询 将用户问题转换成特定数据库的查询语句(例如 SQL、SPARQL) 基于意图将问题路由到合适的处理器 使用 Reciprocal Rank Fusi
AI 智能体与应用——问题转换
本章涵盖以下内容: 使用 Rewrite-Retrieve-Read 重写用户问题,以获得更好的 embedding 对齐效果 使用 step-back query 检索更高层次的上下文 生成假设性文
AI 智能体与应用——高级索引
本章涵盖以下内容: 使用高级 RAG 技术 选择最优的文本分块策略 使用多重 embedding 提升对粗粒度文本块的召回效果 在检索时扩展细粒度文本块以补充上下文 面向半结构化和多模态内容的索引策略
AI 智能体与应用——使用 LangChain 和 LangSmith 构建 Q&A 聊天机器人
本章涵盖以下内容: 使用 LangChain 实现 RAG 跨多份文档进行 Q&A 使用 LangSmith 跟踪 RAG 链的执行过程 使用 LangChain 专用 Q&A 功能的替代实现方式 既
Prompt 缓存详解
Claude 如何实现 92% 缓存命中率:一个案例研究 每当一个 AI 智能体执行一步操作时,它都要交一笔“税”。 它会把所有内容从头重新读一遍。 系统指令。工具定义。三轮之前就已经加载过的项目上下
AI 智能体与应用——使用 ChromaDB 掌握 RAG 基础
本章涵盖以下内容: 使用 RAG 架构实现语义搜索 理解向量存储及其工作机制 使用 ChromaDB 和 OpenAI 实现 RAG 在本章中,我们将探讨两个关键概念:语义搜索(semantic se
AI 智能体与应用——使用 LangGraph 构建智能体工作流
本章涵盖以下内容: 智能体工作流与智能体概览 LangGraph 基础与状态管理 从 LangChain 链迁移到智能体式工作流 大语言模型(LLM)正在推动新一代应用的发展,而这类应用所需要的,早已
下一页