首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
关注
综合
后端
前端
Android
iOS
人工智能
开发工具
代码人生
阅读
排行榜
综合
后端
排行榜
前端
Android
iOS
人工智能
开发工具
代码人生
阅读
全部
程序员
后端
人工智能
前端
面试
C++
JavaScript
数据库
编程语言
展开
全部
程序员
后端
人工智能
前端
面试
C++
JavaScript
数据库
编程语言
LLM
Python
产品
Linux
架构
Agent
暂无数据
推荐
最新
靠更换嵌入模型,该产品将 RAG 延迟降低了50%
作者 | MyClone Engineering Team 编译 | 岳扬 在 MyClone.is,我们的使命是打造真正个性化的数字人格。我们通过检索增强生成(RAG)技术,为每位用户构建一个内容丰
你说的 CUDA 到底是哪个 CUDA?一文理清那些让人混淆的术语和版本号
作者 | James Akl 编译 | 岳 扬 CUDA 的术语存在严重的多重含义问题:“CUDA” 一词本身至少指代五种不同的概念,“driver” 在不同上下文中含义也不同,而各种工具报告的版本号
对长上下文能力有不同要求,怎么选择合适的模型?
作者 | Phuoc Nguyen 编译 | 岳扬 在过去三年中,大语言模型(LLMs)的上下文窗口已从几千个 token 扩展至数十万量级 —— 在某些系统中甚至达到数百万。Gemini 2.5、C
压缩而不失智:LLM 量化技术深度解析
作者 | Bhavishya Pandit 编译 | 岳扬 像我们这样的大语言模型,多少有点“养尊处优”。我们钟爱庞大的参数规模、海量的内存和强悍的 GPU。但当有人试图在手机或配备低性能 GPU 的
为什么语言模型偏爱使用破折号?反驳多种主流解释,并提出猜想
作者 | Sean Goedecke 编译 | 岳扬 如果你让大多数人说出 AI 生成文本的一个标志性特征,他们很可能会说破折号 —— 就像这样。语言模型对破折号的使用已频繁到让真正喜爱破折号的真人使
上下文管理策略综述
作者 | Drew Breunig 编译 | 岳扬 01 缓解与避免上下文失效问题 早前发布我们发布过《How Long Contexts Fail》[1],本文我们再来系统探讨能够减轻或完全避免这些
如何提升 LLMs 处理表格的准确率?一项针对 11 种格式的基准测试
作者 | Improving Agents 编译 | 岳扬 在讨论基于 AI 的系统的可靠性时,有一个简单却常被忽视的问题:究竟用什么格式向大语言模型传递表格数据最合适? 应该用 Markdown t
RAG实操教程: langchain+Milvus向量数据库创建你的本地知识库
RAG实操教程: langchain+Milvus向量数据库创建你的本地知识库 本篇文章是 Milvus 向量数据库学习的总结篇,打造自己的知识库系统。 RAG是什么 RAG 是retrieval-a
怎样为你的 RAG 应用选择合适的嵌入模型?
作者 | Vivedha Elango 编译 | 岳扬 检索增强生成(RAG)是当前构建生成式 AI 应用最热门的框架。企业机构青睐它,因为它能利用专有数据来回答用户问题,使大语言模型能够为用户提供精
探讨超长上下文推理的潜力
作者 | JS Denain and Anson Ho 编译 | 岳扬 从理论上讲,现代大语言模型能够一次性处理相当于多本书籍的文本量。以 Gemini 2.5 Pro 为例,其上下文窗口达到 100
The Life Reset Map Prompt
Dan Koe 的 “A Prompt To Reset Your Life In 30 Days” ,常被简称为 “The Life Reset Map Prompt”。 它帮助用户通过系统访谈、反
一篇文章带你学会向量数据库Milvus(二)
一篇文章带你学会向量数据库Milvus(二) 上一篇文章 一篇文章带你学会向量数据库Milvus(一)我们我们学习了 Milvus 向量数据库的数据库管理,集合管理,schema 管理。这一篇文章我们
应该使用哪个向量数据库?选择最适合您需求的一款
应该使用哪个向量数据库?选择最适合您需求的一款 介绍 向量数据库已成为存储和索引非结构化和结构化数据表示的首选位置。这些表示称为向量嵌入,是由嵌入模型生成的。向量存储在利用深度学习模型(尤其是大型语言
使用coze扣子搭建智能bot「程序员的工具箱」的思考和总结
使用coze扣子搭建智能bot「程序员的工具箱」的思考和总结: 大模型已经火了快 2 年的时间了,从简单的文字处理的单一场景到到现在的企业迫切需要 LLM 在更多的场景赋能的时代。大众也从简单问答
当 AI SaaS 的边际成本不再为零,Cursor 是如何设计定价策略的?
作者 | Finn 编译 | 岳扬 Cursor 大概是过去几年里最令人印象深刻的初创公司: 12 个月内年度经常性收入(ARR)突破 1 亿美元, 据报道不久后便突破了 2 亿美元, 紧接着 Tec
🔥使用谷歌 Gemini API 构建自己的 ChatGPT(一)🚀
使用谷歌 Gemini API 构建自己的 ChatGPT(一) AI领域一直由OpenAI和微软等公司主导,而Gemini则崭露头角,以更大的规模和多样性脱颖而出。它被设计用于无缝处理文本、图像、音
告别提示词工程,「上下文工程」才是 AI Agent 的核心竞争力
作者 | Philipp Schmid 编译 | 岳扬 上下文工程(Context Engineering)是一个在人工智能领域逐渐走红的新术语。行业内讨论的焦点正从“提示词工程”(prompt en
AI 推理服务是否真的无利可图?从第一性原理看 AI 推理成本
作者 | Martin Alderson 编译 | 岳扬 我总听人说 AI(尤其是推理环节)是台烧钱机器[1-3]。表面上看这种说法似乎有道理,但我一直对这类论断持保留态度,因此决定深入探究一番。 目
AI Agents 能自己开发工具自己使用吗?一项智能体自迭代能力研究
作者 | Alessio Fanelli 编译 | 岳扬 在 AI 安全领域,“自我改进(Self-Improving)”是个令人不安的术语,它暗含着“机器将以人类无法理解的方式超越人类智慧”的意思。
MCP 是为开发者设计的工具,而非为 LLM 而设
作者 | Roy Derks 编译 | 岳扬 Model Context Protocol (MCP) 已成为构建智能体时使用工具调用(tool calling)的标准,但恰恰相反,你的 LLM 并不