稀土掘金 稀土掘金
    • 首页
    • AI Coding
    • 数据标注 NEW
    • 沸点
    • 课程
    • 直播
    • 活动
    • APP
      插件
      • 搜索历史 清空
        • 写文章
        • 发沸点
        • 写笔记
        • 写代码
        • 草稿箱
        创作灵感 查看更多
关注
综合
后端
前端
Android
iOS
人工智能
开发工具
代码人生
阅读
排行榜
综合
后端
排行榜
前端
Android
iOS
人工智能
开发工具
代码人生
阅读
  • 全部
  • 程序员
  • 后端
  • 人工智能
  • 前端
  • 面试
  • C++
  • JavaScript
  • 数据库
  • 编程语言
  • 展开
  • 全部
  • 程序员
  • 后端
  • 人工智能
  • 前端
  • 面试
  • C++
  • JavaScript
  • 数据库
  • 编程语言
  • LLM
  • Python
  • 产品
  • Linux
  • 架构
  • Agent
  • 暂无数据
    • 推荐
    • 最新
  • 靠更换嵌入模型,该产品将 RAG 延迟降低了50%
    作者 | MyClone Engineering Team 编译 | 岳扬 在 MyClone.is,我们的使命是打造真正个性化的数字人格。我们通过检索增强生成(RAG)技术,为每位用户构建一个内容丰
    • Baihai_IDP
    • 33
    • 点赞
    人工智能 LLM 面试
    靠更换嵌入模型,该产品将 RAG 延迟降低了50%
  • 你说的 CUDA 到底是哪个 CUDA?一文理清那些让人混淆的术语和版本号
    作者 | James Akl 编译 | 岳 扬 CUDA 的术语存在严重的多重含义问题:“CUDA” 一词本身至少指代五种不同的概念,“driver” 在不同上下文中含义也不同,而各种工具报告的版本号
    • Baihai_IDP
    • 70
    • 点赞
    人工智能 LLM 面试
    你说的 CUDA 到底是哪个 CUDA?一文理清那些让人混淆的术语和版本号
  • 对长上下文能力有不同要求,怎么选择合适的模型?
    作者 | Phuoc Nguyen 编译 | 岳扬 在过去三年中,大语言模型(LLMs)的上下文窗口已从几千个 token 扩展至数十万量级 —— 在某些系统中甚至达到数百万。Gemini 2.5、C
    • Baihai_IDP
    • 63
    • 点赞
    LLM 人工智能 面试
    对长上下文能力有不同要求,怎么选择合适的模型?
  • 压缩而不失智:LLM 量化技术深度解析
    作者 | Bhavishya Pandit 编译 | 岳扬 像我们这样的大语言模型,多少有点“养尊处优”。我们钟爱庞大的参数规模、海量的内存和强悍的 GPU。但当有人试图在手机或配备低性能 GPU 的
    • Baihai_IDP
    • 90
    • 3
    LLM 人工智能 面试
    压缩而不失智:LLM 量化技术深度解析
  • 为什么语言模型偏爱使用破折号?反驳多种主流解释,并提出猜想
    作者 | Sean Goedecke 编译 | 岳扬 如果你让大多数人说出 AI 生成文本的一个标志性特征,他们很可能会说破折号 —— 就像这样。语言模型对破折号的使用已频繁到让真正喜爱破折号的真人使
    • Baihai_IDP
    • 43
    • 点赞
    人工智能 LLM 面试
    为什么语言模型偏爱使用破折号?反驳多种主流解释,并提出猜想
  • 上下文管理策略综述
    作者 | Drew Breunig 编译 | 岳扬 01 缓解与避免上下文失效问题 早前发布我们发布过《How Long Contexts Fail》[1],本文我们再来系统探讨能够减轻或完全避免这些
    • Baihai_IDP
    • 67
    • 点赞
    人工智能 LLM
    上下文管理策略综述
  • 如何提升 LLMs 处理表格的准确率?一项针对 11 种格式的基准测试
    作者 | Improving Agents 编译 | 岳扬 在讨论基于 AI 的系统的可靠性时,有一个简单却常被忽视的问题:究竟用什么格式向大语言模型传递表格数据最合适? 应该用 Markdown t
    • Baihai_IDP
    • 67
    • 点赞
    人工智能 LLM 面试
    如何提升 LLMs 处理表格的准确率?一项针对 11 种格式的基准测试
  • RAG实操教程: langchain+Milvus向量数据库创建你的本地知识库
    RAG实操教程: langchain+Milvus向量数据库创建你的本地知识库 本篇文章是 Milvus 向量数据库学习的总结篇,打造自己的知识库系统。 RAG是什么 RAG 是retrieval-a
    • demo007x
    • 6.1k
    • 32
    LLM 程序员 人工智能
    RAG实操教程: langchain+Milvus向量数据库创建你的本地知识库
  • 怎样为你的 RAG 应用选择合适的嵌入模型?
    作者 | Vivedha Elango 编译 | 岳扬 检索增强生成(RAG)是当前构建生成式 AI 应用最热门的框架。企业机构青睐它,因为它能利用专有数据来回答用户问题,使大语言模型能够为用户提供精
    • Baihai_IDP
    • 93
    • 1
    人工智能 LLM AIGC
    怎样为你的 RAG 应用选择合适的嵌入模型?
  • 探讨超长上下文推理的潜力
    作者 | JS Denain and Anson Ho 编译 | 岳扬 从理论上讲,现代大语言模型能够一次性处理相当于多本书籍的文本量。以 Gemini 2.5 Pro 为例,其上下文窗口达到 100
    • Baihai_IDP
    • 85
    • 1
    人工智能 LLM 面试
    探讨超长上下文推理的潜力
  • The Life Reset Map Prompt
    Dan Koe 的 “A Prompt To Reset Your Life In 30 Days” ,常被简称为 “The Life Reset Map Prompt”。 它帮助用户通过系统访谈、反
    • 是魔丸啊
    • 234
    • 1
    LLM
  • 一篇文章带你学会向量数据库Milvus(二)
    一篇文章带你学会向量数据库Milvus(二) 上一篇文章 一篇文章带你学会向量数据库Milvus(一)我们我们学习了 Milvus 向量数据库的数据库管理,集合管理,schema 管理。这一篇文章我们
    • demo007x
    • 5.2k
    • 5
    后端 LLM 程序员
    一篇文章带你学会向量数据库Milvus(二)
  • 应该使用哪个向量数据库?选择最适合您需求的一款
    应该使用哪个向量数据库?选择最适合您需求的一款 介绍 向量数据库已成为存储和索引非结构化和结构化数据表示的首选位置。这些表示称为向量嵌入,是由嵌入模型生成的。向量存储在利用深度学习模型(尤其是大型语言
    • demo007x
    • 4.5k
    • 7
    LLM 人工智能 程序员
    应该使用哪个向量数据库?选择最适合您需求的一款
  • 使用coze扣子搭建智能bot「程序员的工具箱」的思考和总结
    使用coze扣子搭建智能bot「程序员的工具箱」的思考和总结: 大模型已经火了快 2 年的时间了,从简单的文字处理的单一场景到到现在的企业迫切需要 LLM 在更多的场景赋能的时代。大众也从简单问答
    • demo007x
    • 4.2k
    • 27
    LLM 程序员 人工智能
    使用coze扣子搭建智能bot「程序员的工具箱」的思考和总结
  • 当 AI SaaS 的边际成本不再为零,Cursor 是如何设计定价策略的?
    作者 | Finn 编译 | 岳扬 Cursor 大概是过去几年里最令人印象深刻的初创公司: 12 个月内年度经常性收入(ARR)突破 1 亿美元, 据报道不久后便突破了 2 亿美元, 紧接着 Tec
    • Baihai_IDP
    • 316
    • 1
    人工智能 LLM AI编程
  • 🔥使用谷歌 Gemini API 构建自己的 ChatGPT(一)🚀
    使用谷歌 Gemini API 构建自己的 ChatGPT(一) AI领域一直由OpenAI和微软等公司主导,而Gemini则崭露头角,以更大的规模和多样性脱颖而出。它被设计用于无缝处理文本、图像、音
    • demo007x
    • 3.7k
    • 3
    LLM 程序员 Python
    🔥使用谷歌 Gemini API 构建自己的 ChatGPT(一)🚀
  • 告别提示词工程,「上下文工程」才是 AI Agent 的核心竞争力
    作者 | Philipp Schmid 编译 | 岳扬 上下文工程(Context Engineering)是一个在人工智能领域逐渐走红的新术语。行业内讨论的焦点正从“提示词工程”(prompt en
    • Baihai_IDP
    • 452
    • 7
    LLM 人工智能 面试
  • AI 推理服务是否真的无利可图?从第一性原理看 AI 推理成本
    作者 | Martin Alderson 编译 | 岳扬 我总听人说 AI(尤其是推理环节)是台烧钱机器[1-3]。表面上看这种说法似乎有道理,但我一直对这类论断持保留态度,因此决定深入探究一番。 目
    • Baihai_IDP
    • 84
    • 点赞
    人工智能 LLM AIGC
    AI 推理服务是否真的无利可图?从第一性原理看 AI 推理成本
  • AI Agents 能自己开发工具自己使用吗?一项智能体自迭代能力研究
    作者 | Alessio Fanelli 编译 | 岳扬 在 AI 安全领域,“自我改进(Self-Improving)”是个令人不安的术语,它暗含着“机器将以人类无法理解的方式超越人类智慧”的意思。
    • Baihai_IDP
    • 181
    • 点赞
    人工智能 LLM 面试
  • MCP 是为开发者设计的工具,而非为 LLM 而设
    作者 | Roy Derks 编译 | 岳扬 Model Context Protocol (MCP) 已成为构建智能体时使用工具调用(tool calling)的标准,但恰恰相反,你的 LLM 并不
    • Baihai_IDP
    • 155
    • 1
    人工智能 LLM 面试
    MCP 是为开发者设计的工具,而非为 LLM 而设
  • 晚上好!
    点亮在社区的每一天

    推荐话题 换一换

    #挑战每日一条沸点#
    #挑战每日一条沸点#

    21.9m

    #2025 AI/Vibe Coding 对我的影响#
    #2025 AI/Vibe Coding 对我的影响#

    13k

    #TRAELAND#
    #TRAELAND#

    58k

    #每日快讯#

    9.6m

    #每日精选文章#

    2.8m

    #日新计划#

    10.5m

    #每天一个知识点#

    46.0m

    #工作中做得最正确的一件事#
    #工作中做得最正确的一件事#

    401k

    #掘金一周#

    1.3m

    #新人报道#

    37.7m

    查看更多
    • 用户协议
    • 营业执照
    • 隐私政策
    • 关于我们
    • 使用指南
    • 友情链接
    • 更多阅读文章
    • 举报邮箱: feedback@xitu.io
    • 座机电话: 010-83434395
    • 京ICP备:18012699号-3
    • 京ICP证:京B2-20191272
    • police 京公网安备11010802026719号
    • ©2025 稀土掘金