稀土掘金 稀土掘金
    • 首页
    • 沸点
    • 课程
    • 数据标注 HOT
    • AI Coding
    • 更多
      • 直播
      • 活动
      • APP
      • 插件
    • 直播
    • 活动
    • APP
    • 插件
      • 搜索历史 清空
        • 写文章
        • 发沸点
        • 写笔记
        • 写代码
        • 草稿箱
        创作灵感 查看更多
关注
综合
后端
前端
Android
iOS
人工智能
开发工具
代码人生
阅读
排行榜
综合
后端
排行榜
前端
Android
iOS
人工智能
开发工具
代码人生
阅读
  • 全部
  • 人工智能
  • AI编程
  • Agent
  • 后端
  • 前端
  • AIGC
  • Claude
  • LLM
  • OpenAI
  • 展开
  • 全部
  • 人工智能
  • AI编程
  • Agent
  • 后端
  • 前端
  • AIGC
  • Claude
  • LLM
  • OpenAI
  • 算法
  • 架构
  • LangChain
  • 开源
  • Python
  • GitHub
  • 暂无数据
    • 推荐
    • 最新
  • 数据集划分不是随便切:手把手切分大众点评情感数据集
    昨天跑中文情感分类 baseline,一上来就栽在数据集上了。本来想着从魔搭拖个现成的大众点评数据集,加载完直接喂模型,结果 MsDataset.load 下来一看,整份数据全塞在 train 里,连
    • To_OC
    • 51
    • 6
    人工智能 LLM Agent
    数据集划分不是随便切:手把手切分大众点评情感数据集
  • 深入理解AI Agent工具调用:从原理到代码实现
    LLM只输出tool_calls文本,你的代码解析后执行真实函数。两次调用:先决策,后回答。messages顺序不能错。
    • 想要成为糕糕手
    • 51
    • 2
    Agent LLM
    深入理解AI Agent工具调用:从原理到代码实现
  • 工具调用:当LLM学会使用"武器",AI Agent的底层逻辑拆解
    前言:一场精心设计的"错觉" 你有没有想过一个问题:大模型本质上是个"词语接龙"游戏。 它被困在服务器里,看不见屏幕,摸不着键盘,唯一的技能就是根据上文预测下一个词的概率。那它怎么就能突然会调用天气A
    • HjhIron
    • 22
    • 3
    Agent LLM
  • Claude Code 如何配置本地Ollama模型或别的模型(Deepseek等)
    个人使用场景 `claude` 模型实在是太贵了,想使用 `Claude Code` 默认只支持 `Anthropic` 的接口格式,所以本文记录了如何把本地模型或者其他模型接入
    • 前端君
    • 51
    • 1
    Agent Claude LLM
  • 我用 30 行代码,搞懂了大模型是怎么"读"中文的
    我用 30 行代码,搞懂了大模型是怎么"读"中文的 写在前面 前两天有个朋友问我:"为什么我让 AI 帮我翻译一篇文章,明明没几个字,API 调用花了好几块钱?" 我当时就想,这哥们肯定不知道 Tok
    • Ricado
    • 53
    • 7
    LLM 人工智能 JavaScript
  • Few-shot、Chain-of-Thought、ReAct模式是什么
    一、前置基础:三种范式的演进背景 在讲解具体方法前,先明确两个基础认知,理解这三类技术的诞生逻辑: 零样本(Zero-shot):大模型的原生提问方式直接向模型提出任务要求、不提供任何示例,就是零样本
    • Worlds
    • 56
    • 1
    LLM AI编程
  • 调查研究-194 Qwen3 MoE vs Dense 怎么选?2026 工程部署视角完整指南
    Qwen3 MoE vs Dense 怎么选?2026 工程部署视角完整指南 TL;DR 场景:本地模型部署、AI Agent、实时语音对话、模型路由、Qwen3 系列选型 结论:Dense 适合实时
    • 武子康
    • 31
    • 1
    人工智能 Agent LLM
    调查研究-194 Qwen3 MoE vs Dense 怎么选?2026 工程部署视角完整指南
  • 我把四个大模型扔到荒岛上,让它们抢着逃生,结果它们学会了结盟、坐地起价、在我快赢的时候联手坑我
    四个大模型困在荒岛上跟你抢着逃生,它们自己学会了结盟、坐地起价、在你快赢时联手坑你——而我从没写过这条规则。聊聊怎么让 LLM 演得活、又不让它把游戏规则玩崩。
    • 何宇峰
    • 58
    • 2
    人工智能 LLM 游戏开发
    我把四个大模型扔到荒岛上,让它们抢着逃生,结果它们学会了结盟、坐地起价、在我快赢的时候联手坑我
  • 从"无状态"到"懂你":深入理解 LLM 对话的本质,以及 Prompt/Context/Loop 三层工程进化之路
    一、引言:一次"失忆"实验 先来看一段简单的代码: 如果第二次请求我们只发 [{ role: 'user', content: '请问我的名字是什么?' }],不带上历史消息——模型会怎么回答? 它会
    • JieE212
    • 56
    • 18
    AI编程 人工智能 LLM
    从"无状态"到"懂你":深入理解 LLM 对话的本质,以及 Prompt/Context/Loop 三层工程进化之路
  • Skill 系列(04):Skill 指标体系——L1/L2/L3 三层监控,让质量下降有据可查
    对 skill 跑 6 次调用,采集真实 L3 数据(时延、Token),L2 格式检查 + LLM-as-Judge 质量评分,加入模拟 L1 用户反馈,输出完整健康看板
    • 冬奇Lab
    • 87
    • 点赞
    人工智能 LLM 开源
    Skill 系列(04):Skill 指标体系——L1/L2/L3 三层监控,让质量下降有据可查
  • token是什么?为什么大模型会有上下文长度的限制
    一、Token的定义 Token 是大语言模型(LLM)处理文本时的最小单位。 模型不会直接识别汉字、英文字母,它处理文本有自己的最小颗粒度,这个颗粒就叫 Token。所有的语义理解、内容生成都建立在
    • Worlds
    • 227
    • 3
    程序员 LLM AI编程
    token是什么?为什么大模型会有上下文长度的限制
  • 8.OpenClaw源码解析——三层洋葱重试
    上节课我们学习了可靠消息投递,当大模型回复完消息之后,会将消息进行chunk切分(这里主要还是防止消息过长)并写入tmp.json, 之后后台会启一个线程,并扫描特定文件夹下的*.json文件,再发送
    • 把你拉进白名单
    • 24
    • 点赞
    Agent LLM 人工智能
    8.OpenClaw源码解析——三层洋葱重试
  • Temperature 与 Top-p:控制模型输出的两个参数
    一、前置基础:大模型生成文本的核心逻辑 在理解两个参数前,先要搞懂大语言模型的生成本质,这是所有采样参数的底层前提: 自回归生成机制大语言模型生成文本是逐 token 生成的:输入上文内容后,模型会预
    • Worlds
    • 56
    • 1
    LLM AI编程
    Temperature 与 Top-p:控制模型输出的两个参数
  • 什么是结构化 Prompt 设计
    一、前置基础:理解角色分离的底层前提 在讲解具体角色前,先明确两个核心认知,这是理解结构化 Prompt 设计的基础: 大模型的上下文运行机制大语言模型本身没有内置的固定身份、规则或记忆,所有行为约束
    • Worlds
    • 128
    • 1
    AI编程 LLM
    什么是结构化 Prompt 设计
  • Agent 系列(23):Web Agent——让 Agent 真正浏览网页
    从零搭建一个能真正浏览网页的 Web Agent:DuckDuckGo 搜索 + 页面抓取 + LangGraph 执行图。重点讲三个工程 Guard
    • 冬奇Lab
    • 325
    • 2
    人工智能 Agent LLM
    Agent 系列(23):Web Agent——让 Agent 真正浏览网页
  • 从埋点需求到规则资产:Hermes Agent 重构得物数仓工作流
    埋点和指标需求中,消耗数据承接方的不是生成答案,而是补齐证据链、对齐历史口径、识别下游影响,并在生产写入前留下可追溯的确认记录。本文数据承接方指承接业务需求的数据同学或业务合作伙伴;后文讨论内部研发、
    • 得物技术
    • 430
    • 3
    AI编程 LLM 大数据
    从埋点需求到规则资产:Hermes Agent 重构得物数仓工作流
  • Hermes Agent 连环 400 真凶找到了:一个 call_id 让人炸毛
    文章摘要 本文记录了Hermes系统因消息历史中的非标准字段导致400错误的排查过程。问题根源在于Hermes内部维护的消息历史携带了Codex Responses API专用字段(如call_id、
    • 吴佳浩Alben
    • 63
    • 1
    人工智能 Agent LLM
    Hermes Agent 连环 400 真凶找到了:一个 call_id 让人炸毛
  • DeepSeek 和小米都在降价,为什么公司反而快烧不起 Token 了?
    模型 API 单价正在快速下探,但 AI Coding 和 Agent 场景的总账单却越来越吓人。。。
    • 王若风
    • 2.6k
    • 14
    LLM DeepSeek
    DeepSeek 和小米都在降价,为什么公司反而快烧不起 Token 了?
  • OpenClaw Windows 完整安装与本地模型配置教程(实战版)
    OpenClaw Windows 完整安装与本地模型配置教程(实战版) 说实话这玩意火了有一段时间了但是虽然作为从业者,我至今还没用过,今天就边安装边记录出一篇记录文档吧吗,这里仅仅只会记录我安装的出
    • 吴佳浩Alben
    • 17k
    • 19
    LLM OpenAI
    OpenClaw Windows 完整安装与本地模型配置教程(实战版)
  • Function Calling 原理深度拆解:让 LLM 调用外部工具的机制与工具设计原则
    为什么 LLM 需要 Function Calling? 大语言模型再强大,也有三块硬伤: 知识有时效性 —— 训练数据截止之后的事,它一无所知 无法访问实时数据 —— 股价、天气、航班状态
    • Lkstar
    • 23
    • 点赞
    LLM 人工智能
  • 晚上好!
    点亮在社区的每一天

    推荐话题 换一换

    #大厂被裁程序员,到底裁的是谁?#
    #大厂被裁程序员,到底裁的是谁?#

    330k

    #每日快讯#

    10.7m

    #每日精选文章#

    8.0m

    #日新计划#

    11.9m

    #每天一个知识点#

    57.7m

    #沸点周刊#

    2.2m

    #五一计划抢先晒#

    436k

    #新人报道#

    43.2m

    #国产龙虾谁能打过OpenClaw#
    #国产龙虾谁能打过OpenClaw#

    207k

    #JUEJIN FRIENDS 好好生活计划#
    #JUEJIN FRIENDS 好好生活计划#

    4.2m

    查看更多
    • 用户协议
    • 营业执照
    • 隐私政策
    • 关于我们
    • 使用指南
    • 友情链接
    • 更多人工智能文章
    • 举报邮箱: feedback@xitu.io
    • 座机电话: 010-83434395
    • 京ICP备:18012699号-3
    • 京ICP证:京B2-20191272
    • police 京公网安备11010802026719号
    • ©2026 稀土掘金