人工智能 - 掘金

1-凸包简介凸包 (Convex Hull) ：能包裹一组点集的最小的凸向包围体。以二维点集为例，其凸包可以想象为在所有点外侧拉紧橡皮筋形成的轮廓。常见的凸包算法：算法时间复杂度特点适用

Claude Code 源码分析（三）：一次模型回答如何流进 Agent

上一篇读到 queryLoop() 时，停在了这段代码：当时只需要知道 callModel() 会不断返回消息，没有继续追消息是怎样产生的。现在沿着 callModel() 往下走。前半篇使用 G

windliang
38
点赞

实习·操作一些神秘的服务器和训练

2026-07-30 训练日志 — SeaShips + RF-DETR 1. Q：GitLab 克隆数据集到服务器两个 IP 在 192.168.1.0/24 同一子网，网络通。 GitLab 禁

勾勾圈圈蛋蛋
25
点赞

【Agentic RL / 强化学习 / OPD】OpenClaw-RL 源码阅读笔记 --- (14)--- Teacher

【Agentic RL / 强化学习 / OPD】OpenClaw-RL 源码阅读笔记 --- (14)--- Teacher 0x00 概要 0x01 基础背景 1.1 完整数据流 1.2 关键点

罗西的思考
36
点赞

【Agentic RL / 强化学习 / OPD】OpenClaw-RL 源码阅读笔记 --- (13)--- OPD实现

【Agentic RL / 强化学习 / OPD】OpenClaw-RL 源码阅读笔记 --- (13)--- OPD实现 0x00 概要 0x01 基础背景 1.1 通俗讲解 1.2 数学形式 1.

推荐系统体验的数字化突破：得物自动化评测平台的技术实践｜AICon 文章整理

「得物推荐 AI Harness 工程化实践系列」的末篇内容，本系列共三篇连载。本篇（末篇）详解得物推荐评测平台的完整技术体系：从主观体验量化到大模型自动化评测流水线，涵盖多维度指标设计、人机协作提示

得物技术
93
点赞

推荐系统体验的数字化突破：得物自动化评测平台的技术实践｜AICon 文章整理

RAG 核心概念与原理：Chunking、Embedding、相似度、HNSW 与多路召回｜得物技术

决定 RAG 效果的关键不在大模型，而是文本切块、查询改写、多路召回与精排。合理切块存好知识库内容，向量匹配抓语义、BM25 匹配关键词互补。先优化用户提问，快速召回一批相关文档，再用精排模型精细筛选

得物技术
387
8

RAG 核心概念与原理：Chunking、Embedding、相似度、HNSW 与多路召回｜得物技术

vLLM-05｜MLA、Compressor、Indexer 与 SWA：Flash 注意力栈在 vLLM 里怎么落地

协议层把 prompt 编成 token ids 之后，计算进入 DeepseekV4ForCausalLM.forward。Flash 的注意力实现不是标准多头注意力（MHA）单路径：在 DeepS

【Agentic RL / 强化学习 / OPD】OpenClaw-RL 源码阅读笔记 --- (12)--- GRPO

【Agentic RL / 强化学习 / OPD】OpenClaw-RL 源码阅读笔记 --- (12)--- GRPO 0x00 概要 0x01 GRPO基础 1.1 GRPO 解读 1.2 Dee

开发者必须掌握的十大核心算法

这篇文章将为你详细梳理开发者最常用的十大算法，每项都结合了生活/工业例子以及Python代码示例。 1. 快速排序 (Quick Sort) —— “分而治之的排队” 生活例子：体育老师给学生排队。先

元Y亨H
89
点赞

说说 LLMRouter，Agent 执行过程中怎么动态的选择 LLM

Cursor 在执行的过程中，是能够自己动态的选择合适的 LLLM 的。我们在实际项目中，尤其是当使用量很大，并发很高的时候，也是面临一样的问题，如何动态的选择合适的 LLM，降低成本和延迟，保障效

从"机械应答"到"服务伙伴"：得物高可控智能客服的 Agent 工程实践｜AICon 演讲整理

本次分享围绕以下核心技术展开：客服 Agent 挑战与架构设计（Single-Agent→Multi-Agent→Harness）；高可控性数据飞轮（PE 自动化 + DPO 训练）；RL 策略训练和

得物技术
667
3

从"机械应答"到"服务伙伴"：得物高可控智能客服的 Agent 工程实践｜AICon 演讲整理

深入理解大模型采样：Temperature、Top-K、Top-P 的原理与实战

深入理解大模型采样：Temperature、Top-K、Top-P 的原理与实战参数一句话调小调大 Temperature 控制概率分布的锐利程度输出更确定、更保守输出更随机、更有创意 T

ReBound
149
11

深入理解大模型采样：Temperature、Top-K、Top-P 的原理与实战

PyTRIO快速入门（二）：Datum构建

本节我们将了解 PyTRIO 的数据类型Datum，以及提供的三种内置损失函数。一、了解Datum 我们已经知道，PyTRIO执行训练依靠的是在循环中将数据一轮轮传递给forward_backwar

林泽毅
48
点赞

PyTRIO快速入门（二）：Datum构建

Tushare接口文档：期货交易日历（fut_trade_cal）

本接口用于查询各大期货交易所交易日历的工具。它提供了指定交易所每个日历日是否为交易日的明确标识，是进行期货数据清洗、确保策略在正确日期运行以及计算时间序列指标的基础。

晓子文集
50
点赞

Tushare接口文档：期货交易日历（fut_trade_cal）

传统Agent工具两大痛点！300行代码落地MCP跨语言工具，彻底解耦LLM与工具

😵做AI Agent时，我被内置工具坑到怀疑人生写LangChain Agent原生工具一段时间，踩了两个无法解决的硬伤：工具强绑定项目：工具代码和Agent耦合，换项目就要复制重构，无法复用语

GuWenyue
102
11

传统Agent工具两大痛点！300行代码落地MCP跨语言工具，彻底解耦LLM与工具

OpenClaw：从“19万星标”到“行业封杀”，这只“赛博龙虾”究竟触动了谁的神经？

最近科技圈最躁动的名字，非 OpenClaw 莫属。一方面，它在GitHub上狂揽19万星标，被无数极客奉为“自ChatGPT以来最让人兴奋的项目”，仿佛预示着AI权力的下放。另一方面，它接连遭到M

CoovallyAIHub
11k
33

OpenClaw：从“19万星标”到“行业封杀”，这只“赛博龙虾”究竟触动了谁的神经？

得物推荐系统诊断 Agent：从 “调接口” 到 “会思考”｜AICon 演讲整理

本文是得物技术专家在 AICon 上海演讲整理的技术实录。「得物推荐 AI Harness 工程化实践系列」的中篇内容，本系列共三篇连载。本篇（中篇）进一步详解得物推荐复杂业务场景下，AI代码从生成

得物技术
470
1

得物推荐系统诊断 Agent：从 “调接口” 到 “会思考”｜AICon 演讲整理

从狂野代码到按目标生产：得物推荐 AI Harness 的工程化实践｜AICon 演讲整理

本文是得物技术专家在 AICon 上海演讲整理的技术实录。「得物推荐 AI Harness 工程化实践系列」的开篇内容，本系列共三篇连载。将系统拆解得物推荐复杂业务场景下，AI代码从生成、防护校验到

得物技术
925
9

从狂野代码到按目标生产：得物推荐 AI Harness 的工程化实践｜AICon 演讲整理

【Agentic RL / 强化学习 / OPD】OpenClaw-RL 源码阅读笔记 --- (11)--- 算法总体实现

【Agentic RL / 强化学习 / OPD】OpenClaw-RL 源码阅读笔记 --- (11)--- 算法总体实现 0x00 概要 0x01 基础背景 1.1 架构 1.2 算法 0x02

罗西的思考
62
点赞