首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
刘棕霆
掘友等级
小米
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
2
文章 2
沸点 0
赞
2
返回
|
搜索文章
刘棕霆
@小米
·
17小时前
关注
07—AI Skill 测评体系完整进阶指南:5 大能力缺口与填补路径
AI Skill 测评体系完整进阶指南:5 大能力缺口与填补路径 当前测评体系的能力边界 AI Skill 测评体系已经能解决自判卷偏差、随机性和负向增益三个核心问题,但在...
0
评论
分享
刘棕霆
@小米
·
17小时前
关注
06—看懂 AI Skill 测评报告:PASS / FAIL / INCONCLUSIVE 背后的发布决策逻辑
看懂 AI Skill 测评报告:PASS / FAIL / INCONCLUSIVE 背后的发布决策逻辑 报告是写给谁看的 AI Skill 测评报告服务两类读者,关注点...
0
评论
分享
刘棕霆
@小米
·
17小时前
关注
05—skill-creator 源码深度拆解:LLM Skill 触发率、防过拟合与三 Agent 评审完整指南
skill-creator 源码深度拆解:LLM Skill 触发率、防过拟合与三 Agent 评审完整指南 前言 读这篇的目的:理解 SkillSentry 四层验证体系...
0
评论
分享
刘棕霆
@小米
·
17小时前
关注
04—为什么不能让 AI 自己评审自己?AI Skill 四层验证体系完整解析
为什么不能让 AI 自己评审自己?AI Skill 四层验证体系完整解析 问题:为什么不能让模型自己评审自己 让模型自己评审自己的输出,会产生「自判卷偏差」——这是 AI ...
0
评论
分享
刘棕霆
@小米
·
17小时前
关注
03—AI Skill 测试用例设计完整指南:8 种类型 + 断言自检,覆盖率从 40% 到 90%
AI Skill 测试用例设计完整指南:8 种类型 + 断言自检,覆盖率从 40% 到 90% 为什么用例设计是测评最难的部分 AI Skill 测试用例设计之所以难,根本...
0
评论
分享
刘棕霆
@小米
·
17小时前
关注
02—通过率、增益 、IFR 怎么看?AI Skill 测评指标体系完整解读
通过率、增益 Δ、IFR 怎么看?AI Skill 测评指标体系完整解读 指标太多记不住?用「九层」来理解 AI Skill 测评指标体系由 9 层维度构成,从用户感知到工...
0
评论
分享
刘棕霆
@小米
·
17小时前
关注
01—为什么你的 AI Skill 上线即翻车?一文搞懂 AI Skill 测评的底层逻辑
为什么你的 AI Skill 上线即翻车?一文搞懂 AI Skill 测评的底层逻辑 你有没有遇到过这种情况 你花了两周时间写了一个 AI 报销助手,规则写得很详细: 日常...
1
评论
分享
刘棕霆
赞了这篇文章
两万五千个小时
@自如
·
5天前
关注
学习 Pi Coding Agent:系统提示词与工具设计深度解析
本文深度解析 Pi coding-agent 的设计哲学:核心从“限制模型”转向“引导模型”。通过符合 LLM 注意力机制的三层提示词结构精准导航。...
1
评论
分享
刘棕霆
关注了
两万五千个小时
@小米
刘棕霆
赞了这篇文章
两万五千个小时
@自如
·
2月前
关注
AI Agent 框架演进
文章梳理 Agent 六阶段,从 ReAct、Autonomous Loops、Multi-Agent,到 LangGraph 状态机、Deep Agents 的 Comp...
7
1
分享
个人成就
文章被点赞
1
文章被阅读
87
掘力值
22
关注了
1
关注者
0
收藏集
0
关注标签
8
加入于
2025-12-23