首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
ChatGPT与大模型研究
数据智能老司机
创建于2023-05-22
订阅专栏
生成式AI探索和研究,场景落地。
等 151 人订阅
共890篇文章
创建于2023-05-22
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
AI 原生时代的可观测性——可观测性的民主化:自助式平台入门
许多组织正在实施内部开发平台(Internal Development Platform,IDP),将其作为一个集中式自助门户,让工程师能够完成日常任务,而不必依赖那些需要按请求履行任务的中心化专业团
AI 原生时代的可观测性——ACME 金融服务:AIOps 实施实践
既然我们已经讲过了一些基础内容,接下来我们将通过一家虚构公司的实际运作,来看看如何应用其中的一些概念。这家公司在完成云迁移之后,当前的可观测性实践开始暴露出问题。它是一家大型组织,业务覆盖多个市场,其
AI 原生时代的可观测性——从可观测性到 AIOps:以及它当下所解决的使用场景
“我们该如何为关键的 Tier 1 API 端点配置 10,000 条自定义服务级目标(SLO)告警?我又该如何为排名前 100 的应用创建仪表板?”这是我们经常从工程师和应用负责人那里听到的问题。这
AI 原生时代的可观测性——房间里的大象:人工智能
既然我们已经讲完了可观测性,接下来就需要看看 AI,以及为了将可观测性与 AI 集成起来以实现 AIOps 所需的各个组成部分。虽然我们预期你已经对 AI 有一定了解,但我们仍然加入这一章,既作为总结
AI 原生时代的可观测性——可观测性:将数据转化为洞察的艺术
如何证明可观测性的价值?关键不在于采集更多数据,而在于把这些数据转化为信息,使你的组织能够基于更充分的信息做出决策,以更高效地运营业务! 在第一章中,我们将为你概览我们认为关于可观测性你所需要了解的一
AI生成豪华PPT的几种方案和使用途径
先看我用AI生成的PPT效果,3张图分别截取自3个技术方案,后面会放出每个方案的完整PPT。 1、使用Nano Banana Pro生成 2、使用Claude Cowork编辑已有的PPT模板生成 3
Embedding相似度虚高,如何用langchain+Milvus搭建CRAG解决?
最近后台经常会收到一个提问,就是我的RAG经常打捞上来一个相似性分数极高,但是完全不可用的内容,到底要怎么办? 这背后,其实是个传统 RAG在设计最底层的想当然:相似度高 = 结果好。但这套逻辑在生产
多智能体系统的上下文工程——面向生产就绪型 AI 的蓝图
你已经走到了构建智能系统这段旅程中的一个关键节点:制高点(the vantage point) 。此刻,你已经能够看清:要构建一台 Context Engine,究竟需要怎样的架构能力;你也已经理解了
多智能体系统的上下文工程——面向品牌与敏捷进行架构设计:战略营销引擎
在前面的章节中,我们已经成功把 Context Engine 锻造成一套强大的多智能体系统。我们对其组件进行了生产级强化,为其设计了可验证研究能力,并为它配备了内容审核与策略驱动控制等关键防护机制。如
多智能体系统的上下文工程——面向现实进行架构设计:审核、延迟与策略驱动型 AI
在过去几章中,我们已经构建出一套完整的 Context Engine:它是一个模块化、透明、且可验证的架构,能够推理、规划,并解释自身的决策。它可以智能摘要信息,带着引用去检索事实,并抵御数据投毒。简
多智能体系统的上下文工程——高保真 RAG 与防护:受 NASA 启发的研究助手
在前面的章节中,我们已经成功构建出一套稳健且高效的 Context Engine。我们打造了一套能够进行推理、规划复杂工作流,并管理自身运行成本的系统。现在,我们要迈向把这套系统真正提升为企业级资产的
多智能体系统的上下文工程——为上下文压缩构建 Summarizer 智能体
本章标志着一次重要转向:我们将直面企业级 AI 中最核心的业务挑战之一——如何管理大规模上下文所带来的财务成本与技术成本。我们将通过引入一种新的能力——上下文缩减(context reduction)
多智能体系统的上下文工程——强化上下文引擎
在第 4 章中,我们构建了一个可运行的 Context Engine 原型——这是一个由一组专用智能体驱动、并由 LLM 驱动的 Planner 进行引导和调度的智能编排系统。由此产生的 notebo
多智能体系统的上下文工程——构建上下文引擎
在前面的章节中,我们学习了如何自下而上地进行上下文工程,并构建智能体系统。但随着这些系统不断扩展,拥有更多智能体、更多职责、更多活动部件,它们会变得越来越难以管理。这正是 Context Engine
Kubernetes 上的生成式 AI——在生产环境中运行 Agentic 应用
在第 8 章中,我们探讨了 AI 驱动型应用的架构模式,并在概念层面介绍了 agentic workflow。现在,我们将从“架构”转向“这些系统在生产环境中运行时的实际挑战”。由于 2026 年的
Kubernetes 上的生成式 AI——AI 驱动的应用
在前面的章节中,我们已经演示了如何在 Kubernetes 上部署像 vLLM 这样的模型服务、如何打包模型数据,以及如何在生产规模上运行推理。在这一基础之上,我们现在将把视角从“服务单个模型”转向“
Kubernetes 上的生成式 AI——作业调度优化
虽然模型训练涵盖了 LLM 的整个生命周期——从预训练(pre-training) ,到对齐(alignment) ,再到定制化(customization) ——但上一章聚焦的是模型定制化,因为这是
Kubernetes 上的生成式 AI——模型定制化
从零开始训练一个 LLM,需要大量计算资源和专业能力,而这是大多数组织都不具备的。本章不会讨论如何从头创建模型,而是聚焦于:如何针对你的具体用例,对一个已有的 LLM 进行定制化。我们将介绍几种常见的
Kubernetes 上的生成式 AI——模型可观测性
在第 1 章中,我们学习了如何从零开始,通过一个简单的编码示例,把 LLM 部署到 Kubernetes 上。整套技术栈包括:一个模型服务端 vLLM,用于优化模型执行;以及一个 Model Serv
Kubernetes 上的生成式 AI——在生产环境中运行
到目前为止,你很可能已经把自己的第一个 LLM 部署到 Kubernetes 上运行了。 它能够响应请求,延迟表现甚至可能还不错。 但所谓生产环境,并不是“能跑一次”就够了,而是要能够稳定地跑、在规模
下一页