首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
刘棕霆
掘友等级
小米
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
2
文章 2
沸点 0
赞
2
返回
|
搜索文章
最新
热门
07—AI Skill 测评体系完整进阶指南:5 大能力缺口与填补路径
AI Skill 测评体系完整进阶指南:5 大能力缺口与填补路径 当前测评体系的能力边界 AI Skill 测评体系已经能解决自判卷偏差、随机性和负向增益三个核心问题,但在以下几个方向上存在明确的能力
06—看懂 AI Skill 测评报告:PASS / FAIL / INCONCLUSIVE 背后的发布决策逻辑
看懂 AI Skill 测评报告:PASS / FAIL / INCONCLUSIVE 背后的发布决策逻辑 报告是写给谁看的 AI Skill 测评报告服务两类读者,关注点完全不同——产品/研发负责人
05—skill-creator 源码深度拆解:LLM Skill 触发率、防过拟合与三 Agent 评审完整指南
skill-creator 源码深度拆解:LLM Skill 触发率、防过拟合与三 Agent 评审完整指南 前言 读这篇的目的:理解 SkillSentry 四层验证体系的技术来源——我们借鉴了 s
04—为什么不能让 AI 自己评审自己?AI Skill 四层验证体系完整解析
为什么不能让 AI 自己评审自己?AI Skill 四层验证体系完整解析 问题:为什么不能让模型自己评审自己 让模型自己评审自己的输出,会产生「自判卷偏差」——这是 AI Skill 四层验证体系要解
03—AI Skill 测试用例设计完整指南:8 种类型 + 断言自检,覆盖率从 40% 到 90%
AI Skill 测试用例设计完整指南:8 种类型 + 断言自检,覆盖率从 40% 到 90% 为什么用例设计是测评最难的部分 AI Skill 测试用例设计之所以难,根本原因在于:坏用例不会报错,只
02—通过率、增益 、IFR 怎么看?AI Skill 测评指标体系完整解读
通过率、增益 Δ、IFR 怎么看?AI Skill 测评指标体系完整解读 指标太多记不住?用「九层」来理解 AI Skill 测评指标体系由 9 层维度构成,从用户感知到工程内核,覆盖一个 LLM 应
01—为什么你的 AI Skill 上线即翻车?一文搞懂 AI Skill 测评的底层逻辑
为什么你的 AI Skill 上线即翻车?一文搞懂 AI Skill 测评的底层逻辑 你有没有遇到过这种情况 你花了两周时间写了一个 AI 报销助手,规则写得很详细: 日常报销走这个流程 差旅报销走那
个人成就
文章被点赞
1
文章被阅读
87
掘力值
22
关注了
1
关注者
0
收藏集
0
关注标签
8
加入于
2025-12-23