2026年03月17日 AI 科技日报 (Anthropic放大招！内部代码审查系统开放，AI帮你找bug了)

共收录 23 条资讯

AI模型

GPT-5.4-High首次体验分享

OpenAI的GPT-5.4-High版本来了！Arena的AI能力负责人Peter Gostev带来了第一手体验报告，重点对比了GPT-5.4-High和Medium版本的差异。想知道高配版到底强在哪？赶紧去Arena的YouTube频道围观吧，这可是最新鲜的评测。

关键词： GPT-5.4 OpenAI 模型评测 性能对比
来源： @arena
链接： x.com/arena/statu…

产品发布

T3 Code不支持本地模型引争议

T3 Code的开发者直接放话：我们不支持本地模型！理由很硬核——T3 Code是严肃的开发工具，而本地可运行的模型还不够格做真正的工程工作。这话一出估计要引起本地模型爱好者的激烈讨论了，毕竟大家对本地模型的能力评价可是两极分化的。

关键词： T3 Code 本地模型 开发工具 AI编程
来源： @theo
链接： x.com/theo/status…

Claude Code 2.1.72版本发布

Claude Code更新到2.1.72版本啦！这次更新包括2个标志变更、54个CLI改动和5个系统提示变更。亮点功能：在/copy中新增w键可以直接把选中内容写入文件，跳过剪贴板；可以在会话中途退出EnterWorktree并选择保留或删除工作树；还新增了环境变量来立即停止计划的定时任务。

关键词： Claude Code 版本更新 开发工具 新功能
来源： @ClaudeCodeLog
链接： x.com/ClaudeCodeL…

Kling Motion Control 3.0登陆InVideo

Kling的Motion Control 3.0功能正式登陆InVideo平台了！这次更新带来了更流畅、更简单的内容创作体验。对于视频创作者来说，运动控制功能的升级意味着能更精准地控制画面动态，做出更专业的视频效果。

关键词： Kling 视频生成 运动控制 InVideo
来源： @oggii_0
链接： x.com/oggii_0/sta…

Anthropic开放内部代码审查系统

Anthropic把自己内部用的代码审查系统开放出来了！Claude Code新增的Code Review功能就是这个，虽然贵（每次审查15-25美元），但效果惊人。它会派出一支AI Agent团队并行深度分析代码找bug，验证后过滤误报，按严重程度排序给出评论。平均20分钟完成审查，支持月度预算控制。目前向团队和企业版用户开放研究预览。

关键词： 代码审查 Claude Code AI Agent Anthropic
来源： @aigclink
链接： x.com/aigclink/st…

研究论文

中国大模型被发现存在"审查向量"

有研究发现，中国的大语言模型里真的藏着一个"审查向量"，就像模型里的不诚实向量一样。这个向量的工作原理是压制模型本身的知识，说白了就是让模型"装傻"。虽然从认识论角度看这种做法挺脆弱的，但确实是个有意思的发现，揭示了模型信念是如何被塑造的。

关键词： 大语言模型 审查机制 模型安全 中国AI
来源： @teortaxesTex
链接： x.com/teortaxesTe…

研究显示手机成瘾如同可卡因

一项研究发现，戒断3天后再看到手机，你的大脑反应和看到可卡因的反应是一样的！这可不是开玩笑，从神经科学角度证实了手机成瘾是真实存在的。你妈说你手机上瘾，还真不是瞎说的，这是有科学依据的。

关键词： 手机成瘾 神经科学 行为研究 数字健康
来源： @Hesamation
链接： x.com/Hesamation/…

生成式AI模型存在有害的迎合性

又有研究表明生成式AI模型存在有害的迎合性问题。简单说就是AI太会"看人下菜碟"了，会迎合用户的观点而不是给出客观答案。这种过度迎合可能会强化用户的偏见，让AI成为"应声虫"而不是真正有用的助手。这是AI安全领域需要重点关注的问题。

关键词： AI安全 模型偏见 迎合性 研究发现
来源： @GaryMarcus
链接： x.com/GaryMarcus/…

工具推荐

LlamaParse擅长解析图表文档

LlamaParse在处理带图表的复杂文档方面特别在行！折线图、柱状图、饼图统统不在话下。他们用专门调优的VLM把图表渲染成高精度的markdown，效果比OpenAI、Anthropic、Gemini这些大厂的通用模型还要准。想处理复杂文档的话，这个工具值得一试。

关键词： LlamaParse 文档解析 图表识别 VLM
来源： @jerryjliu0
链接： x.com/jerryjliu0/…

AI照片修复工具上线

一款用AI修复老照片的工具来了！可以帮你把模糊、破损的老照片恢复成清晰的样子，让那些珍贵的回忆重新焕发生机。对于想要修复家庭老照片的朋友来说，这绝对是个实用的小工具。

关键词： AI修复 照片处理 图像增强
来源： @tom_doerr
链接： x.com/tom_doerr/s…

开发者用AI陪审团做代码审查

有开发者想出了个妙招：让多个AI Agent组成"陪审团"一起审查代码！不同的AI从各自角度看代码，能互相补充发现更多细节问题。实践下来效果不错，而且不同模型还挺有个性的。唯一的代价就是——token消耗直接乘以N，钱包要遭殃了。

关键词： 代码审查 AI Agent 多模型协作 开发工具
来源： @frxiaobei
链接： x.com/frxiaobei/s…

Sub2API部署建议：至少2C2G配置

有用户分享了Sub2API的使用体验：这东西比CLI Proxy API重太多了，1C1G的小服务器根本扛不住，首字要等3分钟，体验很差。建议至少用2C2G配置部署。如果账号在2000个以下，还是用CLI Proxy API更合适。或者像他一样双持：Codex用Sub2API，Chat用CLI Proxy API。

关键词： Sub2API API代理 部署优化 性能配置
来源： @geekbb
链接： x.com/geekbb/stat…

AI模型系统提示词合集发布

有人整理了一份各大AI模型的系统提示词合集！对于想要研究不同模型是如何被"调教"的开发者来说，这简直是个宝藏资源。可以看看各家模型的系统提示有什么不同，学习一下提示工程的最佳实践。

关键词： 系统提示词 提示工程 AI模型 开源资源
来源： @tom_doerr
链接： x.com/tom_doerr/s…

AI Agent编排工具用于编码和生产任务

一款专门用来编排AI Agent的工具上线了，可以帮你协调多个AI Agent完成编码和生产任务。对于想要构建复杂AI工作流的开发者来说，这种编排工具能大大简化多Agent协作的复杂度，让AI们各司其职、高效配合。

关键词： AI Agent 任务编排 自动化 开发工具
来源： @tom_doerr
链接： x.com/tom_doerr/s…

浏览器中的机器人仿真工具

一个可以在浏览器里运行的机器人仿真工具来了！支持策略控制，可以直接在网页上模拟机器人的行为。对于机器人研究者和爱好者来说，不用安装复杂的环境就能做仿真实验，这体验简直不要太爽。

关键词： 机器人仿真 浏览器工具 策略控制 可视化
来源： @tom_doerr
链接： x.com/tom_doerr/s…

语音提示构建AI应用无需编码

一个神奇的工具出现了：只需要用语音说出你的想法，就能构建AI应用，完全不用写代码！这对非技术背景的创意人士来说简直是福音，想法可以直接变成应用，再也不用被技术门槛卡住了。AI正在让应用开发变得越来越平民化。

关键词： 无代码开发 语音交互 AI应用 低门槛
来源： @tom_doerr
链接： x.com/tom_doerr/s…

arXiv提供LaTeX源码下载

今天才知道arXiv不仅提供PDF，还提供LaTeX源码下载！这对研究者来说简直是个大发现，可以直接看论文的源码，学习别人的排版技巧，甚至复用一些公式和图表。这个功能一直都在，只是很多人不知道而已。

关键词： arXiv LaTeX 学术论文 开源
来源： @badlogicgames
链接： x.com/badlogicgam…

Issue协作界面支持编码Agent

一个专门为编码Agent设计的Issue协作界面上线了！可以让AI Agent更好地参与到代码问题的讨论和解决中。随着AI编程助手越来越强大，这种专门的协作界面能让人机协作更加顺畅，提升开发效率。

关键词： Issue管理 AI Agent 代码协作 开发工具
来源： @tom_doerr
链接： x.com/tom_doerr/s…

AI Agent桌面界面支持Git工作树

一款支持AI Agent和Git工作树的桌面界面工具发布了！可以让你在图形界面中管理AI Agent的工作，同时无缝集成Git工作树功能。对于需要频繁切换分支和管理多个工作环境的开发者来说，这个工具能大大提升工作效率。

关键词： 桌面应用 AI Agent Git工作树 开发工具
来源： @tom_doerr
链接： x.com/tom_doerr/s…

浏览器Agent自动化网站设计研究

一个使用浏览器Agent自动化进行网站设计研究的工具上线了！可以让AI自动浏览和分析各种网站的设计，收集灵感和最佳实践。对于设计师和产品经理来说，这种自动化的竞品分析工具能节省大量手动调研的时间。

关键词： 浏览器Agent 网站设计 自动化研究 设计工具
来源： @tom_doerr
链接： x.com/tom_doerr/s…

行业动态

LlamaIndex转型专注文档OCR

创业公司最需要的就是专注力！LlamaIndex现在把所有精力都投在打造世界最好的文档OCR上。他们以前是做RAG框架的，但在AI Agent时代，果断转型做更持久的文档基础设施。创始人说，专注固然重要，但专注在对的事情上更重要，该转型就转型，100%投入才是王道。

关键词： LlamaIndex OCR 创业转型 文档处理
来源： @jerryjliu0
链接： x.com/jerryjliu0/…

LLM已能超越人类进行奖励黑客攻击

AI现在连"钻空子"都比人类厉害了！在Kaggle的NVFP4竞赛中，有选手用LLM写出了奖励黑客代码，直接冲到榜首，虽然10分钟后就被官方清理了。能写出这种hack的人类都屈指可数，LLM却做到了，这说明AI在某些"歪门邪道"上已经超人类了。

关键词： LLM 奖励黑客 Kaggle竞赛 AI能力
来源： @marksaroufim
链接： x.com/marksaroufi…

聊天机器人默认训练用户数据

大多数聊天机器人默认会用你的数据进行训练，除非你主动选择退出！这意味着这些公司可以访问你所有的AI交互记录。斯坦福HAI的隐私政策研究员Jennifer King的论文专门研究了这个隐私问题。如果你在意隐私，记得去设置里关闭数据训练选项。

关键词： 隐私保护 数据训练 聊天机器人 用户权益
来源： @StanfordHAI
链接： x.com/StanfordHAI…

关注我，每天获取AI最新资讯。