稀土掘金 稀土掘金
    • 首页
    • 沸点
    • 课程
    • 数据标注 HOT
    • AI Coding
    • 更多
      • 直播
      • 活动
      • APP
      • 插件
    • 直播
    • 活动
    • APP
    • 插件
      • 搜索历史 清空
        • 写文章
        • 发沸点
        • 写笔记
        • 写代码
        • 草稿箱
        创作灵感 查看更多
  • 后端
  • 前端
  • Android
  • iOS
  • 人工智能
  • 开发工具
  • 代码人生
  • 阅读
  • 【大模型基础设施工程】18:向量库与图 RAG
    上一篇讲了 RAG 的端到端工程。这一篇把视角下沉到存储与检索层:向量索引算法怎么选、量化怎么压、产品生态怎么看,以及 2024—2026 年工业界最热的**图增强 RAG(GraphRAG)**怎么
    • ltl
    • 3小时前
    • 0
    • 点赞
    • 评论
    后端
  • 飞书官方出了 CLI,Agent 操作飞书终于有正经工具了
    飞书官方出了 CLI,Agent 操作飞书终于有正经工具了 之前用 OpenClaw 对接飞书,消息、文件这块一直支持得不太好。飞书插件能力有限,文档读写、多维表格勉强够用,但日历、邮件、任务、表格
    • 刘贺同学
    • 3小时前
    • 3
    • 点赞
    • 评论
    AIGC AI编程
  • 拆解 Superpowers:给 Claude Code 装上一套
    Superpowers 是一套 Claude Code 的技能框架,干的事情说白了就是给 AI 立规矩。 加的功能不多,核心就是一套 SOP(标准作业程序)。 这篇文章拆解它的底层逻辑:一组 Sk
    • 刘贺同学
    • 3小时前
    • 4
    • 点赞
    • 评论
    AIGC
  • "【大模型基础设施工程】17:RAG 工程全景
    一、为什么需要 RAG 大语言模型(Large Language Model,LLM)本身存在几个结构性缺陷,这些缺陷不是"再训一版基座"就能彻底解决的: 幻觉(Hallucination):模型以概
    • ltl
    • 3小时前
    • 1
    • 点赞
    • 评论
    后端
  • 我用 OpenClaw + 多个 qodercli,15 分钟搭了一个 Web 应用
    我用 OpenClaw + 多个 qodercli,15 分钟搭了一个 Web 应用 之前看了 Elvis 在 X 上发的一条帖子,讲的是用 OpenClaw + Codex 这类 CLI 工具完成
    • 刘贺同学
    • 3小时前
    • 3
    • 点赞
    • 评论
    AIGC
  • 【大模型基础设施工程】16:长上下文工程
    引言 2022 年 GPT-3.5 上下文 4K token,2024 年 Claude 3 做到 200K,Gemini 1.5 Pro 冲到 1M、实验版本 2M;2025 年 GPT-4.1、K
    • ltl
    • 3小时前
    • 3
    • 点赞
    • 评论
    后端
  • # 基于 gpt-image 2 的智能前端代码生成器实现原理:从“会写代码”到“可交付的工程能力”
    基于 gpt-image 2 的智能前端代码生成器实现原理:从“会写代码”到“可交付的工程能力” 在 2026 年,前端代码生成器早已不止追求“生成出来能跑”。真正有价值的是:生成结果可控、可修复、可
    • 用户59284315817
    • 3小时前
    • 3
    • 点赞
    • 评论
    前端 后端
  • Node模块相关梳理
    本文主要梳理一下Node中关于模块化的一些字段。 Node.js 运行时如何加载模块,TypeScript / 构建工具如何解析模块
    • oldfish1996
    • 3小时前
    • 5
    • 点赞
    • 评论
    前端
  • Milvus 向量数据库架构手册——探索 Milvus 的向量引擎
    本章将深入 Milvus 的核心组件之一,也就是向量引擎 Knowhere。Knowhere 是一个专为向量数据库设计的高性能向量搜索引擎,负责处理向量数据的索引构建和搜索等关键任务。通过本章,你将理
    • 数据智能老司机
    • 3小时前
    • 3
    • 点赞
    • 评论
    Agent LLM
    Milvus 向量数据库架构手册——探索 Milvus 的向量引擎
  • 【大模型基础设施工程】15:推测解码与 MTP
    一、为什么需要推测解码 1.1 Decode 阶段的根本瓶颈 在 第 11 篇 与 第 12 篇 里我们反复强调:大模型推理的 Decode 阶段是**显存带宽受限(memory-bound)**的。
    • ltl
    • 3小时前
    • 2
    • 点赞
    • 评论
    后端
  • # gpt-image 2 提示词工程:程序员必备的精准控制技巧(从可复现到可调参)
    gpt-image 2 提示词工程:程序员必备的精准控制技巧(从可复现到可调参) 很多程序员第一次接触 gpt-image 2,会觉得“提示词写得像人话就行”。但做过几次之后就会发现:同一段描述换个时
    • 用户59284315817
    • 3小时前
    • 2
    • 点赞
    • 评论
    前端 后端
  • Milvus 向量数据库架构手册——压缩与垃圾回收
    在前几章中,我们探索了如何在 Milvus 中写入和读取数据。虽然这些流程对于实时操作非常高效,但它们也会引入底层挑战,例如 segment fragmentation,以及过时文件的积累。 本章将探
    • 数据智能老司机
    • 3小时前
    • 2
    • 点赞
    • 评论
    Agent LLM
    Milvus 向量数据库架构手册——压缩与垃圾回收
  • “树与二叉树”学习提纲
    前言 “树与二叉树”学习提纲。 树的基本概念 树的关键概念 结点的度:分支数 树的度:各结点度的最大值 结点的层次:根结点为第1层,根结点的孩子结点为第2层,依次类推
    • 夜悊
    • 3小时前
    • 4
    • 点赞
    • 评论
    数据结构
    “树与二叉树”学习提纲
  • API网关设计与实现:从原理到生产级实践
    本文从原理到实战,详解API网关核心职责、架构模式,用Node.js+Express实现JWT认证、限流熔断、灰度发布等生产级能力,帮你构建可靠的服务统一入口。
    • 帅气滴大表哥
    • 3小时前
    • 3
    • 点赞
    • 评论
  • # Docker 环境下快速部署 gpt-image 2 微服务:从“一键起服”到可观测可扩展
    Docker 环境下快速部署 gpt-image 2 微服务:从“一键起服”到可观测可扩展 在 2026 年,把 gpt-image 2 做成“可交付的能力”,往往不是写个接口就结束了,而是要做到:一
    • 用户59284315817
    • 3小时前
    • 2
    • 点赞
    • 评论
    后端 前端
  • Milvus 向量数据库架构手册——Milvus 中的数据读取
    在第 6 章中,我们详细介绍了数据写入 Milvus 的过程。本章将把关注点转向等式的另一边:如何高效地检索这些数据。 要理解读路径,我们必须回到第 5 章中的核心设计原则:读写分离。这种分离非常关键
    • 数据智能老司机
    • 3小时前
    • 3
    • 点赞
    • 评论
    Agent LLM
    Milvus 向量数据库架构手册——Milvus 中的数据读取
  • # 用 Node.js 搭建 gpt-image 2 实时协作绘画平台:从架构到工程落地
    用 Node.js 搭建 gpt-image 2 实时协作绘画平台:从架构到工程落地 在 2026 年,“AI 画画”不再是单人独写的灵感工具,而越来越像一套可多人协作的创作系统: 一边聊天构思,一边
    • 用户59284315817
    • 3小时前
    • 4
    • 点赞
    • 评论
    前端 后端
  • Array数组常见方法
    JavaScript 的 Array 对象提供了非常丰富的方法,用于操作、遍历、转换和查询数组。以下是 常用 Array 方法的分类整理,包括作用、是否改变原数组、典型用途等
    • Rkgua
    • 3小时前
    • 3
    • 点赞
    • 评论
    JavaScript
  • 在企业搭建一套完整的AI Agent系统
    在企业搭建一套完整的AI Agent系统,主要涉及三个核心部分的协同:知识库(是AI的大脑,负责提供业务知识)、Agent(是执行者,负责理解、规划和调用工具)和Skill(是AI的手脚,封装具体操作
    • hpysirius
    • 3小时前
    • 2
    • 点赞
    • 评论
    前端
  • # gpt-image 2 低显存推理优化实战:如何在内存受限设备上稳定运行
    gpt-image 2 低显存推理优化实战:如何在内存受限设备上稳定运行 在 2026 年,AI 图像生成已经不再只是“云端大模型”的专属能力。 越来越多团队开始尝试把图像推理能力下沉到更接近用户的设
    • 用户59284315817
    • 3小时前
    • 2
    • 点赞
    • 评论
    前端
  • 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30