首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
测吧
掘友等级
霍格沃兹测试开发学社,隶属于测吧(北京)科技有限公司,是一个专注软件测试、自动化测试、人工智能测试与测试开发的技术交流社区,并参与高校测试实训、火焰杯赛事及工程化人才培养。
获得徽章 5
动态
文章
专栏
沸点
收藏集
关注
作品
赞
1
文章 1
沸点 0
赞
1
返回
|
搜索文章
最新
热门
Claude Code:把 AI 从“聊天工具”推进到可执行 Agent 系统
1. Claude Code 是什么:从聊天模型到可执行代理 Claude Code 是 Anthropic 在 2025 年推出的一种新形态 AI 产品。 它并不是网页版 Claude 的增强版本,
Django 精准路由匹配:从 path 到 re_path 的正则进阶
当你开始对 URL 的“精度”提出要求时,普通的 path() 就不够用了。 如果只是匹配整数、字符串,转换器已经足够。但当需求变成: 只能匹配一到两位数 必须严格区分日期顺序 必须精确控制匹配边界
新晋测试负责人遇考核难题,私教老师如何巧妙破局
深夜,一位刚入职不久的测试工程师对着电脑屏幕眉头紧锁。眼前的绩效考核表,看似条理清晰,却让他隐隐感到不安——团队氛围微妙,推诿甩锅渐成风气,而这一切,似乎都与这套考核方式有着千丝万缕的联系。 更让他压
OpenAI 官宣弃用 SWE-bench Verified:代码能力“金标准”为何被撤?测试工程师该关注什么
最近模型圈出现一条重要消息。 OpenAI 宣布,不再推荐使用 SWE-bench Verified 作为代码能力评估基准。 这一基准曾被视为衡量大模型“真实工程修复能力”的重要指标,如今被官方主动弃
Claude Skill 官方指南发布:能力模块化正在改变大模型工程结构
最近,Anthropic 发布了一份 30 多页的 Skill 创建指南,系统讲解如何为 Claude 构建自定义能力模块。 这不是简单的 API 更新说明,而是一份偏工程体系化的能力设计手册。 当模
Qwen3.5 四款中量级模型发布:当 35B 遇上 235B,模型规模还重要吗?
Qwen3.5 中量级系列正式发布。 阿里巴巴 旗下 Qwen 团队一次性推出四款模型,其中最引发讨论的是: 35B 参数模型,在多项能力上超过上一代 235B 模型。 这不是小幅优化,而是“体量更小
手把手教你在预训练权重中嵌入多 Token 预测加速
在自然语言处理(NLP)领域,预训练语言模型已经成为主流,它们在各种任务中都取得了显著的成就。然而,这些模型在生成长序列时,通常采用自回归的方式,即一个接一个地预测 Token。这种方式效率较低,尤其
代理编程全球第一之后:GLM-5 会不会改变自动化与 Agent 测试范式?
春节期间,国产大模型迎来密集更新。智谱发布的 GLM-5 参数规模达到 7440 亿,同时在代理编程能力测试中位列全球第一。 如果只把它当成一次“模型升级”,意义其实有限。 真正值得关注的是:当模型开
我用AI写自动化测试脚本一周后,同事以为我偷偷请了个外援
上周五的站会,我汇报完工作进度,旁边的老张凑过来压低声音问:“老实交代,是不是偷偷请了外包?或者……挖了个字节的测开大神在家远程帮你写脚本?” 我愣了一下,然后笑了。 这一周,我所在的团队正好遇上版本
别手写断言了!Copilot for Testing 让我提前两小时下班
上周三下午四点半,我正在收拾包准备去接孩子,隔壁工位的老王探过头来:“你今天咋跑这么早?版本不是明天封板吗?” 我指了指屏幕上的测试报告:“跑完了,全过,断言也写完了。” 老王愣了一下:“断言写完了?
下一页
个人成就
优秀创作者
文章被点赞
13
文章被阅读
244,762
掘力值
11,158
关注了
1
关注者
36
收藏集
0
关注标签
2
加入于
2022-09-08