稀土掘金 稀土掘金
    • 首页
    • 沸点
    • 课程
    • 数据标注 HOT
    • AI Coding
    • 更多
      • 直播
      • 活动
      • APP
      • 插件
    • 直播
    • 活动
    • APP
    • 插件
      • 搜索历史 清空
        • 写文章
        • 发沸点
        • 写笔记
        • 写代码
        • 草稿箱
        创作灵感 查看更多
关注
综合
后端
前端
Android
iOS
人工智能
开发工具
代码人生
阅读
排行榜
综合
后端
排行榜
前端
Android
iOS
人工智能
开发工具
代码人生
阅读
  • 全部
  • 前端
  • 后端
  • 程序员
  • JavaScript
  • 面试
  • Linux
  • 网络协议
  • C++
  • Python
  • 展开
  • 全部
  • 前端
  • 后端
  • 程序员
  • JavaScript
  • 面试
  • Linux
  • 网络协议
  • C++
  • Python
  • AI编程
  • 人工智能
  • 安全
  • 算法
  • LLM
  • 暂无数据
    • 推荐
    • 最新
  • Tool Use 底层原理:当"缸中大脑"遇上物理世界——LLM 工具调用的认知哲学与技术实现
    Tool Use 底层原理:当"缸中大脑"遇上物理世界——LLM 工具调用的认知哲学与技术实现 前言 那个在显卡里疯狂跑的 LLM,本质上还是词语接龙的游戏。它是被困在服务器里的缸中大脑——看不见屏幕
    • Darling噜啦啦
    • 18
    • 2
    LLM Agent
  • LLM 分词与向量化:大模型是如何"读懂"文字的?——Tokenization × Embedding 原理与实战
    LLM 分词与向量化:大模型是如何"读懂"文字的?——Tokenization × Embedding 原理与实战 前言 我们每天都在和 LLM 对话,但有没有想过这样一个问题: 答案藏在两个关键步骤
    • Darling噜啦啦
    • 16
    • 2
    LLM
  • LLM 编排 vs 多 Agent 编排:拆解 Sakana Fugu
    拆解 Sakana Fugu 的原理(Trinity / Conductor / AB-MCTS),厘清多 LLM 编排和多 Agent 编排的边界,以及它能替一套多 agent 系统简化什么。
    • ZzT
    • 35
    • 点赞
    AI编程 LLM
    LLM 编排 vs 多 Agent 编排:拆解 Sakana Fugu
  • LLM 无状态本质与上下文工程:从 Prompt 到 Context 的进化——为什么 AI 总是"失忆"?
    LLM 无状态本质与上下文工程:从 Prompt 到 Context 的进化——为什么 AI 总是"失忆"? 前言 你有没有遇到过这样的困惑: 这不是 AI 笨,而是 LLM 的本质是无状态的。每次调
    • Darling噜啦啦
    • 38
    • 7
    LLM
  • DeepSeek V4 Pro + Flash 分工编程:成本骤降 60%+ 的混合模型工作流
    DeepSeek V4 Pro + Flash 分工编程:成本骤降 60%+ 的混合模型工作流 Pro 和 Flash 到底怎么选?全用 Pro 太贵,全用 Flash 怕质量不行。这篇就来聊聊如何用
    • 叫我少年
    • 103
    • 点赞
    LLM
  • 为什么 AI Agent 重新爱上了文件系统(Filesystems)
    作者 | Daniel Phiri 编译 | 岳扬 🌱 - 本文是一些萌芽中的想法集合。 我曾经在一家向量数据库公司工作。我的全部工作就是帮助人们理解为什么他们需要专为 AI 打造的数据库 —— 嵌入
    • Baihai_IDP
    • 107
    • 点赞
    LLM Agent 人工智能
    为什么 AI Agent 重新爱上了文件系统(Filesystems)
  • OpenClaw 架构详解 · 第一部分:控制平面、会话管理与事件循环
    作者 | Vinoth Govindarajan 编译 | 岳扬 大多数 AI 智能体的演示看起来神奇无比,就像魔法一样。 而 OpenClaw 给人的感觉是真正的“自主运行”。 但在技术底层,它并非
    • Baihai_IDP
    • 341
    • 点赞
    人工智能 LLM 面试
    OpenClaw 架构详解 · 第一部分:控制平面、会话管理与事件循环
  • RAG实操教程: langchain+Milvus向量数据库创建你的本地知识库
    RAG实操教程: langchain+Milvus向量数据库创建你的本地知识库 本篇文章是 Milvus 向量数据库学习的总结篇,打造自己的知识库系统。 RAG是什么 RAG 是retrieval-a
    • demo007x
    • 6.9k
    • 32
    LLM 程序员 人工智能
    RAG实操教程: langchain+Milvus向量数据库创建你的本地知识库
  • 为什么 AI 巨头们放弃私有壁垒,争相拥抱 Agent Skills
    作者 | Han HELOIR YAN, Ph.D. 编译 | 岳扬 2025 年 12 月 18 日,AI 行业发生了一件不同寻常的事:OpenAI 宣布将采用由其主要竞争对手 Anthropic
    • Baihai_IDP
    • 323
    • 1
    人工智能 LLM 面试
    为什么 AI 巨头们放弃私有壁垒,争相拥抱 Agent Skills
  • 以 Nano-vLLM 为例,深入理解 LLM 推理引擎(Part 1)
    作者 | Neutree AI 编译 | 岳扬 01 整体架构设计、调度策略以及从提示词到词元的完整路径 在生产环境中部署大语言模型时,推理引擎是一种关键的基础设施组件。你所使用的每一个 LLM AP
    • Baihai_IDP
    • 139
    • 点赞
    人工智能 LLM 面试
    以 Nano-vLLM 为例,深入理解 LLM 推理引擎(Part 1)
  • 一篇文章带你学会向量数据库Milvus(二)
    一篇文章带你学会向量数据库Milvus(二) 上一篇文章 一篇文章带你学会向量数据库Milvus(一)我们我们学习了 Milvus 向量数据库的数据库管理,集合管理,schema 管理。这一篇文章我们
    • demo007x
    • 5.7k
    • 5
    后端 LLM 程序员
    一篇文章带你学会向量数据库Milvus(二)
  • 应该使用哪个向量数据库?选择最适合您需求的一款
    应该使用哪个向量数据库?选择最适合您需求的一款 介绍 向量数据库已成为存储和索引非结构化和结构化数据表示的首选位置。这些表示称为向量嵌入,是由嵌入模型生成的。向量存储在利用深度学习模型(尤其是大型语言
    • demo007x
    • 4.9k
    • 7
    LLM 人工智能 程序员
    应该使用哪个向量数据库?选择最适合您需求的一款
  • 使用coze扣子搭建智能bot「程序员的工具箱」的思考和总结
    使用coze扣子搭建智能bot「程序员的工具箱」的思考和总结: 大模型已经火了快 2 年的时间了,从简单的文字处理的单一场景到到现在的企业迫切需要 LLM 在更多的场景赋能的时代。大众也从简单问答
    • demo007x
    • 4.4k
    • 26
    LLM 程序员 人工智能
    使用coze扣子搭建智能bot「程序员的工具箱」的思考和总结
  • OpenClaw 架构详解 · 第二部分:并发、隔离以及确保智能体正常运行的不变量(Invariants)
    作者 | Vinoth Govindarajan 编译 | 岳扬 在第一部分,有一个令人背脊发凉的“凌晨 3 点的电话”之问: 为什么我的 AI 助手会在我睡觉时做某些事? 第二部分则是更可怕的后续问
    • Baihai_IDP
    • 167
    • 点赞
    人工智能 LLM 面试
    OpenClaw 架构详解 · 第二部分:并发、隔离以及确保智能体正常运行的不变量(Invariants)
  • 解构 MCP 的伪需求与 CLI 的真价值
    作者 | Eric Holmes 编译 | 岳扬 我想下一个大胆的断言:MCP 已是大势已去。 或许我们可能还没有完全意识到,但种种迹象早已显露端倪。OpenClaw 不支持它,Pi 也不支持它。而这
    • Baihai_IDP
    • 118
    • 点赞
    LLM Agent 人工智能
    解构 MCP 的伪需求与 CLI 的真价值
  • GPU 应该怎么选择?写给 AI 工程师的 GPU 选型指南
    作者 | Alex Razvant 编译 | 岳扬 大多数 AI 工程师都将 NVIDIA GPU 作为其 AI 工作负载的计算平台。不过,很多人只知道 GPU 叫什么名字,却不知道要让一个 AI 系
    • Baihai_IDP
    • 305
    • 点赞
    LLM 人工智能 面试
    GPU 应该怎么选择?写给 AI 工程师的 GPU 选型指南
  • LLM 存在的一些问题,人类就不存在吗?
    作者 | Jakob Kastelic 编译 | 岳扬 当一些人还在争论计算机为何永远无法通过图灵测试**时,我却反复被另一种观点所困扰:随着模型不断进化而人类停滞不前,基准测试的门槛终将被抬高到连人
    • Baihai_IDP
    • 100
    • 点赞
    人工智能 LLM
    LLM 存在的一些问题,人类就不存在吗?
  • 🔥使用谷歌 Gemini API 构建自己的 ChatGPT(一)🚀
    使用谷歌 Gemini API 构建自己的 ChatGPT(一) AI领域一直由OpenAI和微软等公司主导,而Gemini则崭露头角,以更大的规模和多样性脱颖而出。它被设计用于无缝处理文本、图像、音
    • demo007x
    • 4.0k
    • 3
    LLM 程序员 Python
    🔥使用谷歌 Gemini API 构建自己的 ChatGPT(一)🚀
  • 【LLM】低秩矩阵LoRA的使用指南
    为什么LoRA中低秩矩阵是一个优势? 前一篇文章我们在讨论 Attention 矩阵时说“满秩好,低秩意味着能力坍塌”,但到了 LoRA(Low-Rank Adaptation)这里,怎么“低秩”反而
    • xincheng_q
    • 281
    • 1
    LLM
    【LLM】低秩矩阵LoRA的使用指南
  • 微调后的Qwen3-4B在多项基准测试上战平或胜过GPT-OSS-120B
    作者 | Distil Labs 编译 | 岳扬 01 TL;DR 经过微调的小型语言模型(SLM)可以胜过规模大得多的模型:微调后的 Qwen3-4B 在 8 项基准测试中的 7 项上表现能够超越或
    • Baihai_IDP
    • 271
    • 1
    人工智能 LLM 开源
    微调后的Qwen3-4B在多项基准测试上战平或胜过GPT-OSS-120B
  • 早上好!
    点亮在社区的每一天

    推荐话题 换一换

    #端午假期「理想 vs 现实」#
    #端午假期「理想 vs 现实」#

    106k

    #奇葩需求大赏#

    139k

    #大厂被裁程序员,到底裁的是谁?#
    #大厂被裁程序员,到底裁的是谁?#

    328k

    #每日快讯#

    10.7m

    #每日精选文章#

    7.9m

    #日新计划#

    11.8m

    #每天一个知识点#

    57.6m

    #沸点周刊#

    2.2m

    #五一计划抢先晒#

    436k

    #国产龙虾谁能打过OpenClaw#
    #国产龙虾谁能打过OpenClaw#

    206k

    查看更多
    • 用户协议
    • 营业执照
    • 隐私政策
    • 关于我们
    • 使用指南
    • 友情链接
    • 更多阅读文章
    • 举报邮箱: feedback@xitu.io
    • 座机电话: 010-83434395
    • 京ICP备:18012699号-3
    • 京ICP证:京B2-20191272
    • police 京公网安备11010802026719号
    • ©2026 稀土掘金