稀土掘金 稀土掘金
    • 首页
    • 沸点
    • 课程
    • 数据标注 HOT
    • AI Coding
    • 更多
      • 直播
      • 活动
      • APP
      • 插件
    • 直播
    • 活动
    • APP
    • 插件
      • 搜索历史 清空
        • 写文章
        • 发沸点
        • 写笔记
        • 写代码
        • 草稿箱
        创作灵感 查看更多
  • 后端
  • 前端
  • Android
  • iOS
  • 人工智能
  • 开发工具
  • 代码人生
  • 阅读
  • 向量数据库生产调优:Qdrant性能优化与规模化部署完全指南
    ## 从原型到生产的鸿沟 把一个RAG系统从原型推到生产,向量数据库往往是最先遇到瓶颈的组件。常见的痛点: - **查询延迟高**:随着数据量增长,相似性搜索越来越慢 - **内存爆炸**:默认配
    • 少林码僧
    • 8小时前
    • 4
    • 点赞
    • 评论
    人工智能 LLM Python
  • AI Agent的规划能力升级:从Chain-of-Thought到Tree-of-Thought工程实践
    ## 规划能力:AI Agent的核心瓶颈 2026年,AI Agent的工具调用能力已经相当成熟,但规划能力仍然是最大的短板。许多Agent在面对复杂任务时的失败,不是因为"不知道怎么做",而是因
    • 少林码僧
    • 8小时前
    • 4
    • 点赞
    • 评论
    人工智能 LLM Python
  • Retrieval-Augmented Generation高级技巧:超越基础RAG的工程实践
    ## 基础RAG的局限 "把文档分块,向量化存储,检索相似块,喂给LLM"——这个基础RAG流程在原型阶段表现不错,但在生产环境中往往暴露出一系列问题: - **检索精度不足**:语义相似不等于内
    • 少林码僧
    • 8小时前
    • 3
    • 点赞
    • 评论
    人工智能 LLM Python
  • AI内容安全工程:构建企业级LLM应用的防护体系
    ## 为什么内容安全是LLM应用的必答题? 2025年,全球已有多起因LLM应用内容安全缺失导致的重大事故:客服机器人被诱导发表种族歧视言论、AI助手泄露用户隐私数据、教育应用输出不适合未成年人的内
    • 少林码僧
    • 8小时前
    • 1
    • 点赞
    • 评论
    人工智能 LLM Python
  • LangChain LCEL深度解析:声明式AI应用构建的工程实践
    ## 为什么需要LCEL? LangChain的早期版本饱受诟病:过度封装、调试困难、灵活性差。2023年底,LangChain推出了 **LCEL(LangChain Expression Lan
    • 少林码僧
    • 9小时前
    • 2
    • 点赞
    • 评论
    人工智能 LLM Python
  • INFINI Agent v1.31.0 发布,全新 Easysearch 向导:一站式集群拉起与精细化管理
    INFINI Agent v1.31.0 新增 Easysearch 向导,支持图形化一键创建/加入集群,具备环境预检、多重校验、自动证书生成与智能内存推荐等功能,实现全生命周期管理,让集群运维更简单
    • 极限实验室
    • 9小时前
    • 3
    • 点赞
    • 评论
    产品
    INFINI Agent v1.31.0 发布,全新 Easysearch 向导:一站式集群拉起与精细化管理
  • LLM评估体系工程实践:如何科学衡量AI应用的真实质量
    ## 评估的本质困境 AI应用开发中最棘手的问题之一就是:**你怎么知道你的模型回答得好不好?** 传统软件有明确的对错标准,但LLM的输出往往是"模糊正确"的。一个问题可以有十种不同的好答案,也
    • 少林码僧
    • 9小时前
    • 1
    • 点赞
    • 评论
    人工智能 LLM Python
  • AI驱动的测试自动化:用LLM实现端到端测试用例生成与维护
    ## 测试困境:自动化的最后一公里 软件测试是开发流程中最耗时、最容易被忽视的环节之一。据统计,测试代码的编写和维护占据了开发团队**30-40%**的工作时间,而测试覆盖率往往依然不尽如人意。传统
    • 少林码僧
    • 9小时前
    • 1
    • 点赞
    • 评论
    人工智能 LLM Python
  • Prompt缓存技术深度解析:让LLM调用成本降低90%的工程实践
    ## 为什么Prompt缓存是2026年的必备技能? 一个不算秘密的事实:在大规模AI应用中,**60-80%的LLM调用成本来自重复的系统提示词**。每次调用API时,你都在为相同的系统提示词反复
    • 少林码僧
    • 9小时前
    • 1
    • 点赞
    • 评论
    人工智能 LLM Python
  • AutoGen框架深度解析:微软多智能体对话系统的工程实践
    ## 引言:为什么多智能体需要一个框架? 当你尝试用单个LLM解决复杂的工程问题时,往往会遇到一个共同的瓶颈:**上下文窗口不够用、任务太复杂、错误无法自我纠正**。微软研究院给出的答案是 Auto
    • 少林码僧
    • 9小时前
    • 1
    • 点赞
    • 评论
    人工智能 LLM Python
  • DeepSeek V4 Pro 与GPT-5.3 Codex high同台PK,代码能力差距有多大?「一手测试」
    小测了一下DeepSeek V4 pro 的真实写代码能力和Agent能力,对比的是 GPT-5.3 codex high。整体结果:GPT-5.3 codex high > DeepSeek V4
    • javaTodo
    • 9小时前
    • 2
    • 点赞
    • 评论
    Claude
  • DeepSeek V4 Pro 与GPT-5.3 Codex high同台PK,代码能力差距有多大?「一手测试」
    小测了一下DeepSeek V4 pro 的真实写代码能力和Agent能力,对比的是 GPT-5.3 codex high。整体结果:GPT-5.3 codex high > DeepSeek V4
    • AICoding之心
    • 9小时前
    • 2
    • 点赞
    • 评论
    Claude
  • Twitter Tweet 信息 API 集成指南
    在本文中,我们将介绍如何集成 Twitter Tweet 信息 API。通过该 API,您可以获取特定 Twitter 用户的所有推文信息。只需输入用户的 Twitter 用户 ID,即可输出该用户
    • 用户00045392116
    • 9小时前
    • 2
    • 点赞
    • 评论
    MCP
  • 从字符串到时间线:实现一个 Cron 表达式解析器
    最近在做一个定时任务管理后台,需要让用户配置执行时间。一开始想直接让用户输入 Cron 表达式,结果被产品经理怼回来了:“你让运营同事填 0 0 9 * * 1-5?他们只会填’工作日早上 9 点’。
    • 用户236782980168
    • 9小时前
    • 3
    • 点赞
    • 评论
    React.js
  • 基于NeMo的电信推理模型与自治网络构建
    本文介绍了使用某机构NeMo工具包,通过合成故障数据、专家流程与结构化推理轨迹微调大语言模型,构建用于电信网络运维中心的自治智能体。内容涵盖数据生成、多轮工具调用、课程学习训练与评估方法,能显著提升故
    • 用户576110558132
    • 9小时前
    • 4
    • 点赞
    • 评论
    人工智能 AIGC
  • 教 Agent 用 Gemini 生成自己的头像
    让 Agent 打开浏览器连 Gemini 生成头像再自动换群头像。听着简单,实际花了好几天。Agent 不是一次写出来的,是一点点教出来的。
    • mayf3
    • 9小时前
    • 3
    • 点赞
    • 评论
    GitHub
  • 为什么有些公司禁止使用@Transactional声明式事务?
    在Java后端开发中,事务管理是保证数据一致性的核心手段,Spring提供的@Transactional注解(声明式事务),以“一行注解完成事务配置”的便捷性,成为很多开发者的首选。但在实际工程落地中
    • PeterMap
    • 9小时前
    • 5
    • 点赞
    • 评论
    后端 Java Spring Boot
  • React Diff算法:3个“神级假设”让虚拟DOM快得像闪电
    你有没有想过:React每次更新,都要对比两棵虚拟DOM树,如果老老实实 O(n³) 地比,你的页面早就卡成化石了。但React只用 O(n) 就搞定了,怎么做到的?
    • kyriewen
    • 9小时前
    • 3
    • 点赞
    • 评论
    前端 React.js 面试
    React Diff算法:3个“神级假设”让虚拟DOM快得像闪电
  • 2026年项目管理工具TOP10:Gitee引领技术驱动新浪潮
    1.Gitee(码云):代码与管理的双核引擎 作为中国最大的代码托管平台,Gitee在2026年全面升级项目管理模块,成为技术团队的首选工具。其核心优势在于 开发与协作无缝衔接:代码提交直接关联任务看
    • 用户581770977023
    • 9小时前
    • 3
    • 点赞
    • 评论
    GitHub
  • VUE入门1
    VUE2写法 (为何写VUE2?后面会写VUE3【水一水】,赛博上坟。2023年停止维护,不禁感慨知识迭代【贬值】速度之快,缅怀,哀悼。) 在VS code中创建heoolworld.html,然后编
    • 用户668859984766
    • 9小时前
    • 8
    • 点赞
    • 评论
    Vue.js
  • 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30