首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
后端
前端
Android
iOS
人工智能
开发工具
代码人生
阅读
【大模型基础设施工程】18:向量库与图 RAG
上一篇讲了 RAG 的端到端工程。这一篇把视角下沉到存储与检索层:向量索引算法怎么选、量化怎么压、产品生态怎么看,以及 2024—2026 年工业界最热的**图增强 RAG(GraphRAG)**怎么
飞书官方出了 CLI,Agent 操作飞书终于有正经工具了
飞书官方出了 CLI,Agent 操作飞书终于有正经工具了 之前用 OpenClaw 对接飞书,消息、文件这块一直支持得不太好。飞书插件能力有限,文档读写、多维表格勉强够用,但日历、邮件、任务、表格
拆解 Superpowers:给 Claude Code 装上一套
Superpowers 是一套 Claude Code 的技能框架,干的事情说白了就是给 AI 立规矩。 加的功能不多,核心就是一套 SOP(标准作业程序)。 这篇文章拆解它的底层逻辑:一组 Sk
"【大模型基础设施工程】17:RAG 工程全景
一、为什么需要 RAG 大语言模型(Large Language Model,LLM)本身存在几个结构性缺陷,这些缺陷不是"再训一版基座"就能彻底解决的: 幻觉(Hallucination):模型以概
我用 OpenClaw + 多个 qodercli,15 分钟搭了一个 Web 应用
我用 OpenClaw + 多个 qodercli,15 分钟搭了一个 Web 应用 之前看了 Elvis 在 X 上发的一条帖子,讲的是用 OpenClaw + Codex 这类 CLI 工具完成
【大模型基础设施工程】16:长上下文工程
引言 2022 年 GPT-3.5 上下文 4K token,2024 年 Claude 3 做到 200K,Gemini 1.5 Pro 冲到 1M、实验版本 2M;2025 年 GPT-4.1、K
# 基于 gpt-image 2 的智能前端代码生成器实现原理:从“会写代码”到“可交付的工程能力”
基于 gpt-image 2 的智能前端代码生成器实现原理:从“会写代码”到“可交付的工程能力” 在 2026 年,前端代码生成器早已不止追求“生成出来能跑”。真正有价值的是:生成结果可控、可修复、可
Node模块相关梳理
本文主要梳理一下Node中关于模块化的一些字段。 Node.js 运行时如何加载模块,TypeScript / 构建工具如何解析模块
Milvus 向量数据库架构手册——探索 Milvus 的向量引擎
本章将深入 Milvus 的核心组件之一,也就是向量引擎 Knowhere。Knowhere 是一个专为向量数据库设计的高性能向量搜索引擎,负责处理向量数据的索引构建和搜索等关键任务。通过本章,你将理
【大模型基础设施工程】15:推测解码与 MTP
一、为什么需要推测解码 1.1 Decode 阶段的根本瓶颈 在 第 11 篇 与 第 12 篇 里我们反复强调:大模型推理的 Decode 阶段是**显存带宽受限(memory-bound)**的。
# gpt-image 2 提示词工程:程序员必备的精准控制技巧(从可复现到可调参)
gpt-image 2 提示词工程:程序员必备的精准控制技巧(从可复现到可调参) 很多程序员第一次接触 gpt-image 2,会觉得“提示词写得像人话就行”。但做过几次之后就会发现:同一段描述换个时
Milvus 向量数据库架构手册——压缩与垃圾回收
在前几章中,我们探索了如何在 Milvus 中写入和读取数据。虽然这些流程对于实时操作非常高效,但它们也会引入底层挑战,例如 segment fragmentation,以及过时文件的积累。 本章将探
“树与二叉树”学习提纲
前言 “树与二叉树”学习提纲。 树的基本概念 树的关键概念 结点的度:分支数 树的度:各结点度的最大值 结点的层次:根结点为第1层,根结点的孩子结点为第2层,依次类推
API网关设计与实现:从原理到生产级实践
本文从原理到实战,详解API网关核心职责、架构模式,用Node.js+Express实现JWT认证、限流熔断、灰度发布等生产级能力,帮你构建可靠的服务统一入口。
# Docker 环境下快速部署 gpt-image 2 微服务:从“一键起服”到可观测可扩展
Docker 环境下快速部署 gpt-image 2 微服务:从“一键起服”到可观测可扩展 在 2026 年,把 gpt-image 2 做成“可交付的能力”,往往不是写个接口就结束了,而是要做到:一
Milvus 向量数据库架构手册——Milvus 中的数据读取
在第 6 章中,我们详细介绍了数据写入 Milvus 的过程。本章将把关注点转向等式的另一边:如何高效地检索这些数据。 要理解读路径,我们必须回到第 5 章中的核心设计原则:读写分离。这种分离非常关键
# 用 Node.js 搭建 gpt-image 2 实时协作绘画平台:从架构到工程落地
用 Node.js 搭建 gpt-image 2 实时协作绘画平台:从架构到工程落地 在 2026 年,“AI 画画”不再是单人独写的灵感工具,而越来越像一套可多人协作的创作系统: 一边聊天构思,一边
Array数组常见方法
JavaScript 的 Array 对象提供了非常丰富的方法,用于操作、遍历、转换和查询数组。以下是 常用 Array 方法的分类整理,包括作用、是否改变原数组、典型用途等
在企业搭建一套完整的AI Agent系统
在企业搭建一套完整的AI Agent系统,主要涉及三个核心部分的协同:知识库(是AI的大脑,负责提供业务知识)、Agent(是执行者,负责理解、规划和调用工具)和Skill(是AI的手脚,封装具体操作
# gpt-image 2 低显存推理优化实战:如何在内存受限设备上稳定运行
gpt-image 2 低显存推理优化实战:如何在内存受限设备上稳定运行 在 2026 年,AI 图像生成已经不再只是“云端大模型”的专属能力。 越来越多团队开始尝试把图像推理能力下沉到更接近用户的设
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30