首页
AI Coding
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
关注
综合
后端
前端
Android
iOS
人工智能
开发工具
代码人生
阅读
排行榜
综合
后端
排行榜
前端
Android
iOS
人工智能
开发工具
代码人生
阅读
全部
程序员
后端
前端
人工智能
JavaScript
数据库
编程语言
Python
LLM
展开
全部
程序员
后端
前端
人工智能
JavaScript
数据库
编程语言
Python
LLM
面试
算法
产品
架构
C
C++
暂无数据
推荐
最新
为什么语言模型偏爱使用破折号?反驳多种主流解释,并提出猜想
作者 | Sean Goedecke 编译 | 岳扬 如果你让大多数人说出 AI 生成文本的一个标志性特征,他们很可能会说破折号 —— 就像这样。语言模型对破折号的使用已频繁到让真正喜爱破折号的真人使
上下文管理策略综述
作者 | Drew Breunig 编译 | 岳扬 01 缓解与避免上下文失效问题 早前发布我们发布过《How Long Contexts Fail》[1],本文我们再来系统探讨能够减轻或完全避免这些
如何提升 LLMs 处理表格的准确率?一项针对 11 种格式的基准测试
作者 | Improving Agents 编译 | 岳扬 在讨论基于 AI 的系统的可靠性时,有一个简单却常被忽视的问题:究竟用什么格式向大语言模型传递表格数据最合适? 应该用 Markdown t
怎样为你的 RAG 应用选择合适的嵌入模型?
作者 | Vivedha Elango 编译 | 岳扬 检索增强生成(RAG)是当前构建生成式 AI 应用最热门的框架。企业机构青睐它,因为它能利用专有数据来回答用户问题,使大语言模型能够为用户提供精
探讨超长上下文推理的潜力
作者 | JS Denain and Anson Ho 编译 | 岳扬 从理论上讲,现代大语言模型能够一次性处理相当于多本书籍的文本量。以 Gemini 2.5 Pro 为例,其上下文窗口达到 100
The Life Reset Map Prompt
Dan Koe 的 “A Prompt To Reset Your Life In 30 Days” ,常被简称为 “The Life Reset Map Prompt”。 它帮助用户通过系统访谈、反
RAG实操教程: langchain+Milvus向量数据库创建你的本地知识库
RAG实操教程: langchain+Milvus向量数据库创建你的本地知识库 本篇文章是 Milvus 向量数据库学习的总结篇,打造自己的知识库系统。 RAG是什么 RAG 是retrieval-a
一篇文章带你学会向量数据库Milvus(二)
一篇文章带你学会向量数据库Milvus(二) 上一篇文章 一篇文章带你学会向量数据库Milvus(一)我们我们学习了 Milvus 向量数据库的数据库管理,集合管理,schema 管理。这一篇文章我们
AI 推理服务是否真的无利可图?从第一性原理看 AI 推理成本
作者 | Martin Alderson 编译 | 岳扬 我总听人说 AI(尤其是推理环节)是台烧钱机器[1-3]。表面上看这种说法似乎有道理,但我一直对这类论断持保留态度,因此决定深入探究一番。 目
应该使用哪个向量数据库?选择最适合您需求的一款
应该使用哪个向量数据库?选择最适合您需求的一款 介绍 向量数据库已成为存储和索引非结构化和结构化数据表示的首选位置。这些表示称为向量嵌入,是由嵌入模型生成的。向量存储在利用深度学习模型(尤其是大型语言
当 AI SaaS 的边际成本不再为零,Cursor 是如何设计定价策略的?
作者 | Finn 编译 | 岳扬 Cursor 大概是过去几年里最令人印象深刻的初创公司: 12 个月内年度经常性收入(ARR)突破 1 亿美元, 据报道不久后便突破了 2 亿美元, 紧接着 Tec
使用coze扣子搭建智能bot「程序员的工具箱」的思考和总结
使用coze扣子搭建智能bot「程序员的工具箱」的思考和总结: 大模型已经火了快 2 年的时间了,从简单的文字处理的单一场景到到现在的企业迫切需要 LLM 在更多的场景赋能的时代。大众也从简单问答
告别提示词工程,「上下文工程」才是 AI Agent 的核心竞争力
作者 | Philipp Schmid 编译 | 岳扬 上下文工程(Context Engineering)是一个在人工智能领域逐渐走红的新术语。行业内讨论的焦点正从“提示词工程”(prompt en
AI Agents 能自己开发工具自己使用吗?一项智能体自迭代能力研究
作者 | Alessio Fanelli 编译 | 岳扬 在 AI 安全领域,“自我改进(Self-Improving)”是个令人不安的术语,它暗含着“机器将以人类无法理解的方式超越人类智慧”的意思。
🔥使用谷歌 Gemini API 构建自己的 ChatGPT(一)🚀
使用谷歌 Gemini API 构建自己的 ChatGPT(一) AI领域一直由OpenAI和微软等公司主导,而Gemini则崭露头角,以更大的规模和多样性脱颖而出。它被设计用于无缝处理文本、图像、音
MCP 是为开发者设计的工具,而非为 LLM 而设
作者 | Roy Derks 编译 | 岳扬 Model Context Protocol (MCP) 已成为构建智能体时使用工具调用(tool calling)的标准,但恰恰相反,你的 LLM 并不
GPU 网络通信基础,Part 1(横向与纵向扩展;训练中的通信环节...)
作者 | Austin Lyons 编译 | 岳扬 本系列文章将用轻松的方式聊聊网络与 GPU。这个话题很重要,但可能显得有些枯燥或深奥。请耐心听我道来! 01 训练动机 训练大语言模型需要海量的浮点
AI 系统架构的演进:LLM → RAG → AI Workflow → AI Agent
作者 | codelink 编译 | 岳 扬 AI Agent 是当前的一个热门话题,但并非所有 AI 系统都需要采用这种架构。 虽然 Agent 具有自主决策能力,但更简单、更具成本效益的解决方案往
RAG 文档解析工具选型指南
作者 | Florian June 编译 | 岳扬 对于 RAG 系统而言,从文档中提取信息是一个不可避免的情况。最终系统输出的质量很大程度上取决于从源内容中提取信息的效果。 过去,我曾从不同角度探讨
LLM 学习之「向量数据库」
LLM 学习之「向量数据库」 什么是向量数据库? 向量数据库是一种以向量或数据点的数学表示形式存储数据的数据库。 人工智能和机器学习使非结构化数据能够转换为捕获意义和上下文的数字表示(向量),这得益于