首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
AI 思考录
恋猫de小郭
创建于2026-02-02
订阅专栏
AI 文章的解读和思考
等 36 人订阅
共38篇文章
创建于2026-02-02
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
AI 的公开测评得分都在作弊,就像泡面的封面,一切以实物为准
应该都经常看到,*「`***`」 说我们这次模型的分有多高*、*「`###`」 模型已经追上或者超越了 Claude* ,但是实际体验下来却总发
你的代理归我了:AI 大模型恶意中间人攻击,钱包都被转走了
前几天大家看到这个新闻还在玩梗,而现在就有人发了一篇论文告诉你,你用的中转站的 Token 真的可能是「带毒」的,比如这次要聊的,论文作者就出现了带毒 Token 导致以太坊私钥泄漏后,钱包里的 ET
手机直接运行 Codex/OpenCode/Claude Code ,实时管理你的 AI Coding
最近发现一个有趣的开源项目 lunel ,用户可以通过手机连接上电脑,然后直接运行 Codex、OpenCode、Claude Code ,重要的是免费和公网可用。 它的核心技术原理其实是「手机作为纯
Google 开源大模型 Gemma4 怎么选,本地跑的话需要什么条件?
我觉得这 Gemma 4 并没有表现得特别优秀,但它大概率是这个系列到目前为止,发布最全面和友好的一次了,虽然也是很快就被安全破解的一次。 因为 Gemma 4 这次发布的 E2B、E4B、26B A
你的 AI 不好用,可能只是它在演你,或者在闹情绪
你在用 AI 开发的时候,有没有经常遇到:明明我已经提供了图片或者附件说明,AI 也一本正经地表示我看到了,甚至描绘得有声有色,然后最终给了你一坨“大辩”的经历? 如果有,不要怀疑是自己使用的方式有什
Claude Code 源码里有意思设定:伪造、投毒、卧底、封号
Anthropic 这次不小心泄露的源码,直接暴漏了之前 Claude Code 里不少有意思的设定,包括针对蒸馏情况注入假工具、 隐藏 AI 的版本、通过正则表达式检测挫折感、可能存在的封号策略等。
为什么中转渠道的顶级模型会不好用?这是一个技术问题
同样是 Claude opus 4.6,但是你的 4.6 和别人4.6 可能根本不是一个智商,抛开对方卖假模型不谈,为什么你用的很多中转渠道的 Claude / Gemini 体验不好?其实这里面是有
让你的 OpenClaw 带你学习,清华开源 AI 私人导师 OpenMAIC
近日,清华开源了一个叫 OpenMAIC 的 AI 互动课堂平台,它的作用是:能够将任何主题或文档转化为丰富的互动学习场景。 也就是,你给它一个话题或者丢给它任何学习材料,它就能自动生成一堂完整的 A
AI 时代的工程师需要具备什么能力?Augment Code 给出了他们的招聘标准
如果 agents 已经能写 99% 的代码,那该怎么招工程师?这就是今天讨论的话题,实际上大家普遍不觉得 AI 时代就不需要人了,AI 只是开始接管写代码这个事情,但是代码也只是软件工程的其中一环,
OpenAI 亲自教你如何构建可靠 AI 代码,从古法编程转向 Agnet 编程,或者 PUA 你的 AI
其实在不少 AI Coding 的内容下,一直有不少人说,AI 写的代码不够好用,甚至感觉很傻,是不是自己的大模型能力不行?为什么感觉我的 AI 和别人的 AI 好像不是一个东西?这个效果怎么可以上生
你还用 IDE 吗? AI 狂欢时代下 Cursor 慌了, JetBrains 等 IDE 的未来是什么?
聊之前我们先说点前言,之所以会有这个思考,其实也是来自近日的「云鲸 Cursor Team 邀请泄漏」事件,云鲸在企业内部应该是有 Cursor 的大规模使用,然后某个 Seat 邀请链接泄漏,导致几
你用的 Claude 可能是虚假 Claude ,论文数据告诉你,Shadow API 中的欺骗性模型声明
最近刚好看到了一篇名为 《Real Money, Fake Models: Deceptive Model Claims in Shadow APIs》 的论文,翻译过来就是《真金白银,假货模型:Sh
Apple 的 ANE 被挖掘,AI 硬件公开,宣传的 38 TOPS 居然是"数字游戏"?
近日,有个大佬通过挖掘 Apple Neural Engine (ANE) ,针对苹果芯片底层 AI 逻辑做了一次细节公开,因为苹果 ANE(M4 芯片上为 16 核运算单元)长期以来是一个纯粹的“黑
移动端开发稳了?AI 目前还无法取代客户端开发,小红书的论文告诉你数据
近期,由小红书联合多伦多大学等高校的研究人员发布了 《SWE-Bench Mobile》(2602.09540) 论文,内容主要是评估 LLM 智能体在处理真实生产级移动端应用开发任务时的能力,并提出
AI 正在造就你的「认知卸载」,但是时代如此
AI 确实是时代浪潮,是必备技能,但是现在也慢慢成为一种“认知卸载”,没有“摩擦”过的技能经验,有的只是流水线的review过程,甚至连 review 都不存在了,有的只是麻木的支付 token 账单
AI 可以让 WIFI 实现监控室内人体位置和姿态,无需摄像头?
最近一个叫 wifi-densepose 的项目登上了趋势榜,这个项目看起来就很反直觉,它主要是通过分析室内已有的 WiFi 信号来感知人的位置和姿态,从而实现“无摄像头”的监控。 简单来说,就是通过
AGENTS.md 真的对 AI Coding 有用吗?或许在此之前你没用对?
AGENTS.md 相信大家应该不陌生,它们一般都是被放在根目录的典型 Context Files ,这些文件被默认作为 Coding Agnet 的 「README」,一般是用来提供仓库概览、工具链
iOS + AI ,国外一个叫 Rork Max 的项目打算替换掉 Xcode
最近看到一个很有意思的项目,它是一个由国外 Rork 团队推出的 AI 移动应用开发平台,宣称是“全球首个在浏览器中构建原生 Swift 应用的 AI 工具”,也就是,你可以不需要 Mac 和 Xco
你知道不,你现在给 AI 用的 Agent Skills 可能毫无作用,甚至还拖后腿?
最近,一篇名为 《SkillsBench: Benchmarking How Well Agent Skills Work Across Diverse Tasks》 的论文提出了一个很有意思的观点:
Claude Code 已经 100% 自己写代码,为什么 Anthropic 还有上百个工程职位空缺?
这是一个非常有意思的话题,近日有人对 Anthropic 发出了灵魂质问,既然 Claude Code 已经能 100% 自己给自己写代码,那么为什么 Anthropic 还有上百个工程师的岗位空缺:
下一页