首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
ChatGPT与大模型研究
数据智能老司机
创建于2023-05-22
订阅专栏
生成式AI探索和研究,场景落地。
等 151 人订阅
共890篇文章
创建于2023-05-22
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
Kubernetes 上的生成式 AI——Kubernetes 和 GPUs
从根本上说,生成式 AI 涉及高强度的数学计算,尤其是张量乘法等线性代数运算。这些运算需要巨大的算力和内存容量,才能处理大规模数据集以及参数规模从数百亿到上千亿不等的模型。幸运的是,一类被称为图形处理
Kubernetes 上的生成式 AI——模型数据
在 Kubernetes 上运行 LLM 时,最根本的挑战之一,就是如何管理体量巨大的模型数据。LLM 的大小从几 GB 到接近 1 TB 不等,而要高效地把这些数据引入集群、并让运行时能够访问它们,
Kubernetes 上的生成式 AI——部署模型
当真实数据由于隐私法律或合规要求而不能离开你自己的集群,或者你需要对模型部署与性能拥有更强控制力时,就有必要在自己的集群内运行模型。 当前市面上的模型种类很多,其中不少是开源的,并且可免费用于商业用途
AI 智能体与应用——将 AI 智能体推进到生产落地:记忆、护栏,以及更多能力
本章涵盖: 使用 LangGraph checkpoint 添加短期记忆 在工作流的多个阶段实现 guardrails(护栏机制) 面向生产部署的其他注意事项 要构建能够在真实世界环境中稳定运行的 A
AI 智能体与应用——构建与使用 MCP 服务器
本章涵盖以下内容: 理解模型上下文协议(Model Context Protocol,MCP)的用途与底层架构 构建并对外暴露你自己的 MCP 服务器,并以一个实用的天气工具为例进行说明 在应用中测试
AI 智能体与应用——多智能体系统
本章涵盖以下内容: 将工具连接到数据源 使用路由器(router)和监督者(supervisor)模式组合多智能体系统 调试、测试与追踪多智能体交互 在第 11 章中,我们通过构建一个旅行信息智能体,
如何对 AI Web 智能体进行身份认证
AI Web 智能体可以浏览网页、点击按钮、填写表单、提取数据。它们几乎能完成一个人类在网上能做的任何事情……唯独不能登录。 身份认证并不只是一个小麻烦;它会直接阻止智能体完成那些对你真正有价值的任务
AI 智能体与应用——使用 LangGraph 构建基于工具的智能体
本章涵盖 使用 LangGraph 构建由大语言模型驱动的智能体 注册并使用工具,以支持智能体的动态执行 调试智能体执行过程与工具调用 使用 LangGraph 预构建组件简化智能体开发 使用 Lan
AI 智能体与应用——查询生成、路由与检索后处理
本章涵盖以下内容: 直接从用户问题中生成元数据查询 将用户问题转换成特定数据库的查询语句(例如 SQL、SPARQL) 基于意图将问题路由到合适的处理器 使用 Reciprocal Rank Fusi
AI 智能体与应用——问题转换
本章涵盖以下内容: 使用 Rewrite-Retrieve-Read 重写用户问题,以获得更好的 embedding 对齐效果 使用 step-back query 检索更高层次的上下文 生成假设性文
AI 智能体与应用——高级索引
本章涵盖以下内容: 使用高级 RAG 技术 选择最优的文本分块策略 使用多重 embedding 提升对粗粒度文本块的召回效果 在检索时扩展细粒度文本块以补充上下文 面向半结构化和多模态内容的索引策略
AI 智能体与应用——使用 LangChain 和 LangSmith 构建 Q&A 聊天机器人
本章涵盖以下内容: 使用 LangChain 实现 RAG 跨多份文档进行 Q&A 使用 LangSmith 跟踪 RAG 链的执行过程 使用 LangChain 专用 Q&A 功能的替代实现方式 既
Prompt 缓存详解
Claude 如何实现 92% 缓存命中率:一个案例研究 每当一个 AI 智能体执行一步操作时,它都要交一笔“税”。 它会把所有内容从头重新读一遍。 系统指令。工具定义。三轮之前就已经加载过的项目上下
AI 智能体与应用——使用 ChromaDB 掌握 RAG 基础
本章涵盖以下内容: 使用 RAG 架构实现语义搜索 理解向量存储及其工作机制 使用 ChromaDB 和 OpenAI 实现 RAG 在本章中,我们将探讨两个关键概念:语义搜索(semantic se
AI 智能体与应用——使用 LangGraph 构建智能体工作流
本章涵盖以下内容: 智能体工作流与智能体概览 LangGraph 基础与状态管理 从 LangChain 链迁移到智能体式工作流 大语言模型(LLM)正在推动新一代应用的发展,而这类应用所需要的,早已
AI 智能体与应用——构建研究摘要引擎
本章涵盖以下内容: 理解研究摘要引擎 使用提示工程生成 Web 搜索并汇总结果 将整个流程组织为独立的 LangChain 链 将子链集成到主链中 使用高级 LCEL 进行并行处理 在第 3 章内容摘
AI 智能体与应用——使用 LangChain 进行文本摘要
本章涵盖以下内容: 对超过 LLM 上下文窗口的大型文档进行摘要 跨多份文档进行摘要 在第 1 章中,我们探讨了三类主要的 LLM 应用:摘要引擎、聊天机器人和 AI 智能体。在本章中,你将开始使用
AI 智能体与应用——通过编程方式执行提示
本章涵盖以下内容: 提示与提示工程 不同类型的提示及其组织结构 如何利用单样本、双样本或少样本学习来增强提示响应 在 ChatGPT 和 OpenAI API 中使用提示的示例 AI 应用与大语言模型
精通自然语言处理:从基础到智能体——自然语言处理领域导论
本书第一章旨在通过介绍自然语言处理(NLP)的关键概念、机器处理语言的早期策略,以及它与机器学习(ML)之间的协同关系,帮助专业人士建立自然语言处理的基础。我们还会强调数学基础的重要性,例如线性代数、
PyTorch 深度学习——部署到生产环境
本章涵盖以下内容: 部署 PyTorch 模型的多种选项 通过 Web 框架和 API 部署模型 优化推理性能 将模型导出到不同部署目标所需的格式 从 C++ 中运行导出的模型以及原生实现的模型 在本
下一页