首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
ChatGPT与大模型研究
数据智能老司机
创建于2023-05-22
订阅专栏
生成式AI探索和研究,场景落地。
等 151 人订阅
共876篇文章
创建于2023-05-22
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
基于 Python 的 RAG 开发手册——RAG 流水线中的文档加载器
引言 在 RAG 流水线中,知识之旅始于文档。原始数据以多种形式存在,例如 PDF 报告、研究论文、电子表格、幻灯片、网站,甚至实时 API。如果没有一种结构化的方法将这些数据引入系统,检索过程就会变
基于 Python 的 RAG 开发手册——检索增强生成(RAG)原理基础
引言 本章介绍检索增强生成(Retrieval-Augmented Generation,RAG)的核心原理。RAG 通过为大语言模型(LLM)提供访问外部知识源的能力,增强了其能力表现。 本章涵盖
Harness Engineering 深度解读:AI Agent 时代的工程范式革命
一、什么是 Harness Engineering? Harness Engineering 是 2025-2026 年 AI 工程领域最重要的新概念之一。它不是一个工具,不是一个框架,而是一套围绕
6 个月成为 AI 工程师:一条真正能落地的学习路线图
过去一年,AI 工程几乎成了技术圈最热门的能力标签之一。 但一个很现实的问题是: 大多数初学者,并不知道自己到底该学什么。 有人从机器学习理论开始,结果学了很久,依旧不会做产品; 有人沉迷教程视频,看
Agent 是 OS,Skill 的天花板是卖 Copy:真正的壁垒是 Agent-native Application
过去一年,围绕 Agent 的讨论里,最常见的两个创业方向是: 做一个垂类 Agent 做一组给 Agent 用的 Skill 这两个方向看起来都很合理,但如果把问题放到更底层的系统结构里看,会发现它
AI 原生时代的可观测性——可观测性的民主化:自助式平台入门
许多组织正在实施内部开发平台(Internal Development Platform,IDP),将其作为一个集中式自助门户,让工程师能够完成日常任务,而不必依赖那些需要按请求履行任务的中心化专业团
AI 原生时代的可观测性——ACME 金融服务:AIOps 实施实践
既然我们已经讲过了一些基础内容,接下来我们将通过一家虚构公司的实际运作,来看看如何应用其中的一些概念。这家公司在完成云迁移之后,当前的可观测性实践开始暴露出问题。它是一家大型组织,业务覆盖多个市场,其
AI 原生时代的可观测性——从可观测性到 AIOps:以及它当下所解决的使用场景
“我们该如何为关键的 Tier 1 API 端点配置 10,000 条自定义服务级目标(SLO)告警?我又该如何为排名前 100 的应用创建仪表板?”这是我们经常从工程师和应用负责人那里听到的问题。这
AI 原生时代的可观测性——房间里的大象:人工智能
既然我们已经讲完了可观测性,接下来就需要看看 AI,以及为了将可观测性与 AI 集成起来以实现 AIOps 所需的各个组成部分。虽然我们预期你已经对 AI 有一定了解,但我们仍然加入这一章,既作为总结
AI 原生时代的可观测性——可观测性:将数据转化为洞察的艺术
如何证明可观测性的价值?关键不在于采集更多数据,而在于把这些数据转化为信息,使你的组织能够基于更充分的信息做出决策,以更高效地运营业务! 在第一章中,我们将为你概览我们认为关于可观测性你所需要了解的一
AI生成豪华PPT的几种方案和使用途径
先看我用AI生成的PPT效果,3张图分别截取自3个技术方案,后面会放出每个方案的完整PPT。 1、使用Nano Banana Pro生成 2、使用Claude Cowork编辑已有的PPT模板生成 3
Embedding相似度虚高,如何用langchain+Milvus搭建CRAG解决?
最近后台经常会收到一个提问,就是我的RAG经常打捞上来一个相似性分数极高,但是完全不可用的内容,到底要怎么办? 这背后,其实是个传统 RAG在设计最底层的想当然:相似度高 = 结果好。但这套逻辑在生产
多智能体系统的上下文工程——面向生产就绪型 AI 的蓝图
你已经走到了构建智能系统这段旅程中的一个关键节点:制高点(the vantage point) 。此刻,你已经能够看清:要构建一台 Context Engine,究竟需要怎样的架构能力;你也已经理解了
多智能体系统的上下文工程——面向品牌与敏捷进行架构设计:战略营销引擎
在前面的章节中,我们已经成功把 Context Engine 锻造成一套强大的多智能体系统。我们对其组件进行了生产级强化,为其设计了可验证研究能力,并为它配备了内容审核与策略驱动控制等关键防护机制。如
多智能体系统的上下文工程——面向现实进行架构设计:审核、延迟与策略驱动型 AI
在过去几章中,我们已经构建出一套完整的 Context Engine:它是一个模块化、透明、且可验证的架构,能够推理、规划,并解释自身的决策。它可以智能摘要信息,带着引用去检索事实,并抵御数据投毒。简
多智能体系统的上下文工程——高保真 RAG 与防护:受 NASA 启发的研究助手
在前面的章节中,我们已经成功构建出一套稳健且高效的 Context Engine。我们打造了一套能够进行推理、规划复杂工作流,并管理自身运行成本的系统。现在,我们要迈向把这套系统真正提升为企业级资产的
多智能体系统的上下文工程——为上下文压缩构建 Summarizer 智能体
本章标志着一次重要转向:我们将直面企业级 AI 中最核心的业务挑战之一——如何管理大规模上下文所带来的财务成本与技术成本。我们将通过引入一种新的能力——上下文缩减(context reduction)
多智能体系统的上下文工程——强化上下文引擎
在第 4 章中,我们构建了一个可运行的 Context Engine 原型——这是一个由一组专用智能体驱动、并由 LLM 驱动的 Planner 进行引导和调度的智能编排系统。由此产生的 notebo
多智能体系统的上下文工程——构建上下文引擎
在前面的章节中,我们学习了如何自下而上地进行上下文工程,并构建智能体系统。但随着这些系统不断扩展,拥有更多智能体、更多职责、更多活动部件,它们会变得越来越难以管理。这正是 Context Engine
Kubernetes 上的生成式 AI——在生产环境中运行 Agentic 应用
在第 8 章中,我们探讨了 AI 驱动型应用的架构模式,并在概念层面介绍了 agentic workflow。现在,我们将从“架构”转向“这些系统在生产环境中运行时的实际挑战”。由于 2026 年的
下一页