首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
关注
综合
后端
前端
Android
iOS
人工智能
开发工具
代码人生
阅读
排行榜
综合
后端
排行榜
前端
Android
iOS
人工智能
开发工具
代码人生
阅读
全部
程序员
后端
面试
前端
人工智能
Linux
数据库
C++
资讯
展开
全部
程序员
后端
面试
前端
人工智能
Linux
数据库
C++
资讯
LLM
产品
编程语言
Java
JavaScript
架构
暂无数据
推荐
最新
智能体的构建依然是个“脏活累活”...
作者 | Armin Ronacher 编译 | 岳扬 我觉得现在可能是时候写一写最近学到的一些新东西了。其中大部分内容会围绕构建智能体(agents)展开,也会稍微分享一点关于使用具有智能体特性的编
如何减少单智能体输出结果的不确定性?利用并行智能体的“集体智慧”
作者 | Ben Redmond 编译 | 岳扬 智能体编码(Agentic coding)存在一个问题 —— 输出结果的不稳定性(variance)。如果单智能体的运行机制本身就在设计上限制了性能上
靠更换嵌入模型,该产品将 RAG 延迟降低了50%
作者 | MyClone Engineering Team 编译 | 岳扬 在 MyClone.is,我们的使命是打造真正个性化的数字人格。我们通过检索增强生成(RAG)技术,为每位用户构建一个内容丰
你说的 CUDA 到底是哪个 CUDA?一文理清那些让人混淆的术语和版本号
作者 | James Akl 编译 | 岳 扬 CUDA 的术语存在严重的多重含义问题:“CUDA” 一词本身至少指代五种不同的概念,“driver” 在不同上下文中含义也不同,而各种工具报告的版本号
对长上下文能力有不同要求,怎么选择合适的模型?
作者 | Phuoc Nguyen 编译 | 岳扬 在过去三年中,大语言模型(LLMs)的上下文窗口已从几千个 token 扩展至数十万量级 —— 在某些系统中甚至达到数百万。Gemini 2.5、C
RAG实操教程: langchain+Milvus向量数据库创建你的本地知识库
RAG实操教程: langchain+Milvus向量数据库创建你的本地知识库 本篇文章是 Milvus 向量数据库学习的总结篇,打造自己的知识库系统。 RAG是什么 RAG 是retrieval-a
为什么语言模型偏爱使用破折号?反驳多种主流解释,并提出猜想
作者 | Sean Goedecke 编译 | 岳扬 如果你让大多数人说出 AI 生成文本的一个标志性特征,他们很可能会说破折号 —— 就像这样。语言模型对破折号的使用已频繁到让真正喜爱破折号的真人使
压缩而不失智:LLM 量化技术深度解析
作者 | Bhavishya Pandit 编译 | 岳扬 像我们这样的大语言模型,多少有点“养尊处优”。我们钟爱庞大的参数规模、海量的内存和强悍的 GPU。但当有人试图在手机或配备低性能 GPU 的
上下文管理策略综述
作者 | Drew Breunig 编译 | 岳扬 01 缓解与避免上下文失效问题 早前发布我们发布过《How Long Contexts Fail》[1],本文我们再来系统探讨能够减轻或完全避免这些
Andrej Karpathy:2025 年 LLM 领域的六项范式转变
作者 | Andrej Karpathy 编译 | 岳扬 2025 年是大语言模型(LLM)发展势头强劲、进步显著的一年。以下是我个人认为值得关注且略感意外的几项“范式转变”,这些改变技术格局的概念性
一篇文章带你学会向量数据库Milvus(二)
一篇文章带你学会向量数据库Milvus(二) 上一篇文章 一篇文章带你学会向量数据库Milvus(一)我们我们学习了 Milvus 向量数据库的数据库管理,集合管理,schema 管理。这一篇文章我们
The Life Reset Map Prompt
Dan Koe 的 “A Prompt To Reset Your Life In 30 Days” ,常被简称为 “The Life Reset Map Prompt”。 它帮助用户通过系统访谈、反
怎样为你的 RAG 应用选择合适的嵌入模型?
作者 | Vivedha Elango 编译 | 岳扬 检索增强生成(RAG)是当前构建生成式 AI 应用最热门的框架。企业机构青睐它,因为它能利用专有数据来回答用户问题,使大语言模型能够为用户提供精
应该使用哪个向量数据库?选择最适合您需求的一款
应该使用哪个向量数据库?选择最适合您需求的一款 介绍 向量数据库已成为存储和索引非结构化和结构化数据表示的首选位置。这些表示称为向量嵌入,是由嵌入模型生成的。向量存储在利用深度学习模型(尤其是大型语言
如何提升 LLMs 处理表格的准确率?一项针对 11 种格式的基准测试
作者 | Improving Agents 编译 | 岳扬 在讨论基于 AI 的系统的可靠性时,有一个简单却常被忽视的问题:究竟用什么格式向大语言模型传递表格数据最合适? 应该用 Markdown t
使用coze扣子搭建智能bot「程序员的工具箱」的思考和总结
使用coze扣子搭建智能bot「程序员的工具箱」的思考和总结: 大模型已经火了快 2 年的时间了,从简单的文字处理的单一场景到到现在的企业迫切需要 LLM 在更多的场景赋能的时代。大众也从简单问答
探讨超长上下文推理的潜力
作者 | JS Denain and Anson Ho 编译 | 岳扬 从理论上讲,现代大语言模型能够一次性处理相当于多本书籍的文本量。以 Gemini 2.5 Pro 为例,其上下文窗口达到 100
🔥使用谷歌 Gemini API 构建自己的 ChatGPT(一)🚀
使用谷歌 Gemini API 构建自己的 ChatGPT(一) AI领域一直由OpenAI和微软等公司主导,而Gemini则崭露头角,以更大的规模和多样性脱颖而出。它被设计用于无缝处理文本、图像、音
当 AI SaaS 的边际成本不再为零,Cursor 是如何设计定价策略的?
作者 | Finn 编译 | 岳扬 Cursor 大概是过去几年里最令人印象深刻的初创公司: 12 个月内年度经常性收入(ARR)突破 1 亿美元, 据报道不久后便突破了 2 亿美元, 紧接着 Tec
告别提示词工程,「上下文工程」才是 AI Agent 的核心竞争力
作者 | Philipp Schmid 编译 | 岳扬 上下文工程(Context Engineering)是一个在人工智能领域逐渐走红的新术语。行业内讨论的焦点正从“提示词工程”(prompt en