阅读 - 掘金

靠更换嵌入模型，该产品将 RAG 延迟降低了50%

作者 | MyClone Engineering Team 编译 | 岳扬在 MyClone.is，我们的使命是打造真正个性化的数字人格。我们通过检索增强生成（RAG）技术，为每位用户构建一个内容丰

Baihai_IDP
33
点赞

靠更换嵌入模型，该产品将 RAG 延迟降低了50%

你说的 CUDA 到底是哪个 CUDA？一文理清那些让人混淆的术语和版本号

作者 | James Akl 编译 | 岳扬 CUDA 的术语存在严重的多重含义问题：“CUDA” 一词本身至少指代五种不同的概念，“driver” 在不同上下文中含义也不同，而各种工具报告的版本号

Baihai_IDP
70
点赞

你说的 CUDA 到底是哪个 CUDA？一文理清那些让人混淆的术语和版本号

对长上下文能力有不同要求，怎么选择合适的模型？

作者 | Phuoc Nguyen 编译 | 岳扬在过去三年中，大语言模型（LLMs）的上下文窗口已从几千个 token 扩展至数十万量级 —— 在某些系统中甚至达到数百万。Gemini 2.5、C

Baihai_IDP
63
点赞

对长上下文能力有不同要求，怎么选择合适的模型？

压缩而不失智：LLM 量化技术深度解析

作者 | Bhavishya Pandit 编译 | 岳扬像我们这样的大语言模型，多少有点“养尊处优”。我们钟爱庞大的参数规模、海量的内存和强悍的 GPU。但当有人试图在手机或配备低性能 GPU 的

Baihai_IDP
90
3

压缩而不失智：LLM 量化技术深度解析

为什么语言模型偏爱使用破折号？反驳多种主流解释，并提出猜想

作者 | Sean Goedecke 编译 | 岳扬如果你让大多数人说出 AI 生成文本的一个标志性特征，他们很可能会说破折号 —— 就像这样。语言模型对破折号的使用已频繁到让真正喜爱破折号的真人使

Baihai_IDP
43
点赞

为什么语言模型偏爱使用破折号？反驳多种主流解释，并提出猜想

上下文管理策略综述

作者 | Drew Breunig 编译 | 岳扬 01 缓解与避免上下文失效问题早前发布我们发布过《How Long Contexts Fail》[1]，本文我们再来系统探讨能够减轻或完全避免这些

Baihai_IDP
67
点赞

如何提升 LLMs 处理表格的准确率？一项针对 11 种格式的基准测试

作者 | Improving Agents 编译 | 岳扬在讨论基于 AI 的系统的可靠性时，有一个简单却常被忽视的问题：究竟用什么格式向大语言模型传递表格数据最合适？应该用 Markdown t

Baihai_IDP
67
点赞

如何提升 LLMs 处理表格的准确率？一项针对 11 种格式的基准测试

RAG实操教程: langchain+Milvus向量数据库创建你的本地知识库

RAG实操教程: langchain+Milvus向量数据库创建你的本地知识库本篇文章是 Milvus 向量数据库学习的总结篇，打造自己的知识库系统。 RAG是什么 RAG 是retrieval-a

demo007x
6.1k
32

RAG实操教程: langchain+Milvus向量数据库创建你的本地知识库

怎样为你的 RAG 应用选择合适的嵌入模型？

作者 | Vivedha Elango 编译 | 岳扬检索增强生成（RAG）是当前构建生成式 AI 应用最热门的框架。企业机构青睐它，因为它能利用专有数据来回答用户问题，使大语言模型能够为用户提供精

Baihai_IDP
93
1

怎样为你的 RAG 应用选择合适的嵌入模型？

探讨超长上下文推理的潜力

作者 | JS Denain and Anson Ho 编译 | 岳扬从理论上讲，现代大语言模型能够一次性处理相当于多本书籍的文本量。以 Gemini 2.5 Pro 为例，其上下文窗口达到 100

Baihai_IDP
85
1

The Life Reset Map Prompt

Dan Koe 的 “A Prompt To Reset Your Life In 30 Days” ，常被简称为 “The Life Reset Map Prompt”。它帮助用户通过系统访谈、反

是魔丸啊
234
1

一篇文章带你学会向量数据库Milvus（二）

一篇文章带你学会向量数据库Milvus（二）上一篇文章一篇文章带你学会向量数据库Milvus（一）我们我们学习了 Milvus 向量数据库的数据库管理，集合管理，schema 管理。这一篇文章我们

demo007x
5.2k
5

一篇文章带你学会向量数据库Milvus（二）

应该使用哪个向量数据库？选择最适合您需求的一款

应该使用哪个向量数据库？选择最适合您需求的一款介绍向量数据库已成为存储和索引非结构化和结构化数据表示的首选位置。这些表示称为向量嵌入，是由嵌入模型生成的。向量存储在利用深度学习模型（尤其是大型语言

demo007x
4.5k
7

应该使用哪个向量数据库？选择最适合您需求的一款

使用coze扣子搭建智能bot「程序员的工具箱」的思考和总结

使用coze扣子搭建智能bot「程序员的工具箱」的思考和总结：大模型已经火了快 2 年的时间了，从简单的文字处理的单一场景到到现在的企业迫切需要 LLM 在更多的场景赋能的时代。大众也从简单问答

demo007x
4.2k
27

使用coze扣子搭建智能bot「程序员的工具箱」的思考和总结

当 AI SaaS 的边际成本不再为零，Cursor 是如何设计定价策略的？

作者 | Finn 编译 | 岳扬 Cursor 大概是过去几年里最令人印象深刻的初创公司： 12 个月内年度经常性收入（ARR）突破 1 亿美元，据报道不久后便突破了 2 亿美元，紧接着 Tec

Baihai_IDP
316
1

🔥使用谷歌 Gemini API 构建自己的 ChatGPT（一）🚀

使用谷歌 Gemini API 构建自己的 ChatGPT（一） AI领域一直由OpenAI和微软等公司主导，而Gemini则崭露头角，以更大的规模和多样性脱颖而出。它被设计用于无缝处理文本、图像、音

demo007x
3.7k
3

🔥使用谷歌 Gemini API 构建自己的 ChatGPT（一）🚀

告别提示词工程，「上下文工程」才是 AI Agent 的核心竞争力

作者 | Philipp Schmid 编译 | 岳扬上下文工程（Context Engineering）是一个在人工智能领域逐渐走红的新术语。行业内讨论的焦点正从“提示词工程”（prompt en

Baihai_IDP
452
7

AI 推理服务是否真的无利可图？从第一性原理看 AI 推理成本

作者 | Martin Alderson 编译 | 岳扬我总听人说 AI（尤其是推理环节）是台烧钱机器[1-3]。表面上看这种说法似乎有道理，但我一直对这类论断持保留态度，因此决定深入探究一番。目

Baihai_IDP
84
点赞

AI 推理服务是否真的无利可图？从第一性原理看 AI 推理成本

AI Agents 能自己开发工具自己使用吗？一项智能体自迭代能力研究

作者 | Alessio Fanelli 编译 | 岳扬在 AI 安全领域，“自我改进（Self-Improving）”是个令人不安的术语，它暗含着“机器将以人类无法理解的方式超越人类智慧”的意思。

Baihai_IDP
181
点赞

MCP 是为开发者设计的工具，而非为 LLM 而设

作者 | Roy Derks 编译 | 岳扬 Model Context Protocol (MCP) 已成为构建智能体时使用工具调用（tool calling）的标准，但恰恰相反，你的 LLM 并不

Baihai_IDP
155
1

MCP 是为开发者设计的工具，而非为 LLM 而设