首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
关注
综合
后端
前端
Android
iOS
人工智能
开发工具
代码人生
阅读
排行榜
综合
后端
排行榜
前端
Android
iOS
人工智能
开发工具
代码人生
阅读
全部
人工智能
AI编程
Agent
后端
前端
AIGC
Claude
LLM
OpenAI
展开
全部
人工智能
AI编程
Agent
后端
前端
AIGC
Claude
LLM
OpenAI
算法
架构
LangChain
开源
Python
GitHub
暂无数据
推荐
最新
数据集划分不是随便切:手把手切分大众点评情感数据集
昨天跑中文情感分类 baseline,一上来就栽在数据集上了。本来想着从魔搭拖个现成的大众点评数据集,加载完直接喂模型,结果 MsDataset.load 下来一看,整份数据全塞在 train 里,连
深入理解AI Agent工具调用:从原理到代码实现
LLM只输出tool_calls文本,你的代码解析后执行真实函数。两次调用:先决策,后回答。messages顺序不能错。
工具调用:当LLM学会使用"武器",AI Agent的底层逻辑拆解
前言:一场精心设计的"错觉" 你有没有想过一个问题:大模型本质上是个"词语接龙"游戏。 它被困在服务器里,看不见屏幕,摸不着键盘,唯一的技能就是根据上文预测下一个词的概率。那它怎么就能突然会调用天气A
Claude Code 如何配置本地Ollama模型或别的模型(Deepseek等)
个人使用场景 `claude` 模型实在是太贵了,想使用 `Claude Code` 默认只支持 `Anthropic` 的接口格式,所以本文记录了如何把本地模型或者其他模型接入
我用 30 行代码,搞懂了大模型是怎么"读"中文的
我用 30 行代码,搞懂了大模型是怎么"读"中文的 写在前面 前两天有个朋友问我:"为什么我让 AI 帮我翻译一篇文章,明明没几个字,API 调用花了好几块钱?" 我当时就想,这哥们肯定不知道 Tok
Few-shot、Chain-of-Thought、ReAct模式是什么
一、前置基础:三种范式的演进背景 在讲解具体方法前,先明确两个基础认知,理解这三类技术的诞生逻辑: 零样本(Zero-shot):大模型的原生提问方式直接向模型提出任务要求、不提供任何示例,就是零样本
调查研究-194 Qwen3 MoE vs Dense 怎么选?2026 工程部署视角完整指南
Qwen3 MoE vs Dense 怎么选?2026 工程部署视角完整指南 TL;DR 场景:本地模型部署、AI Agent、实时语音对话、模型路由、Qwen3 系列选型 结论:Dense 适合实时
我把四个大模型扔到荒岛上,让它们抢着逃生,结果它们学会了结盟、坐地起价、在我快赢的时候联手坑我
四个大模型困在荒岛上跟你抢着逃生,它们自己学会了结盟、坐地起价、在你快赢时联手坑你——而我从没写过这条规则。聊聊怎么让 LLM 演得活、又不让它把游戏规则玩崩。
从"无状态"到"懂你":深入理解 LLM 对话的本质,以及 Prompt/Context/Loop 三层工程进化之路
一、引言:一次"失忆"实验 先来看一段简单的代码: 如果第二次请求我们只发 [{ role: 'user', content: '请问我的名字是什么?' }],不带上历史消息——模型会怎么回答? 它会
Skill 系列(04):Skill 指标体系——L1/L2/L3 三层监控,让质量下降有据可查
对 skill 跑 6 次调用,采集真实 L3 数据(时延、Token),L2 格式检查 + LLM-as-Judge 质量评分,加入模拟 L1 用户反馈,输出完整健康看板
token是什么?为什么大模型会有上下文长度的限制
一、Token的定义 Token 是大语言模型(LLM)处理文本时的最小单位。 模型不会直接识别汉字、英文字母,它处理文本有自己的最小颗粒度,这个颗粒就叫 Token。所有的语义理解、内容生成都建立在
8.OpenClaw源码解析——三层洋葱重试
上节课我们学习了可靠消息投递,当大模型回复完消息之后,会将消息进行chunk切分(这里主要还是防止消息过长)并写入tmp.json, 之后后台会启一个线程,并扫描特定文件夹下的*.json文件,再发送
Temperature 与 Top-p:控制模型输出的两个参数
一、前置基础:大模型生成文本的核心逻辑 在理解两个参数前,先要搞懂大语言模型的生成本质,这是所有采样参数的底层前提: 自回归生成机制大语言模型生成文本是逐 token 生成的:输入上文内容后,模型会预
什么是结构化 Prompt 设计
一、前置基础:理解角色分离的底层前提 在讲解具体角色前,先明确两个核心认知,这是理解结构化 Prompt 设计的基础: 大模型的上下文运行机制大语言模型本身没有内置的固定身份、规则或记忆,所有行为约束
Agent 系列(23):Web Agent——让 Agent 真正浏览网页
从零搭建一个能真正浏览网页的 Web Agent:DuckDuckGo 搜索 + 页面抓取 + LangGraph 执行图。重点讲三个工程 Guard
从埋点需求到规则资产:Hermes Agent 重构得物数仓工作流
埋点和指标需求中,消耗数据承接方的不是生成答案,而是补齐证据链、对齐历史口径、识别下游影响,并在生产写入前留下可追溯的确认记录。本文数据承接方指承接业务需求的数据同学或业务合作伙伴;后文讨论内部研发、
Hermes Agent 连环 400 真凶找到了:一个 call_id 让人炸毛
文章摘要 本文记录了Hermes系统因消息历史中的非标准字段导致400错误的排查过程。问题根源在于Hermes内部维护的消息历史携带了Codex Responses API专用字段(如call_id、
DeepSeek 和小米都在降价,为什么公司反而快烧不起 Token 了?
模型 API 单价正在快速下探,但 AI Coding 和 Agent 场景的总账单却越来越吓人。。。
OpenClaw Windows 完整安装与本地模型配置教程(实战版)
OpenClaw Windows 完整安装与本地模型配置教程(实战版) 说实话这玩意火了有一段时间了但是虽然作为从业者,我至今还没用过,今天就边安装边记录出一篇记录文档吧吗,这里仅仅只会记录我安装的出
Function Calling 原理深度拆解:让 LLM 调用外部工具的机制与工具设计原则
为什么 LLM 需要 Function Calling? 大语言模型再强大,也有三块硬伤: 知识有时效性 —— 训练数据截止之后的事,它一无所知 无法访问实时数据 —— 股价、天气、航班状态