AI日报：点验证码？其实在给AI免费打工！; Anthropic：MCP或将被弃用; GitHub推AgentHQ，Copilot生态再升级

All in AI，看见未来。每天精选最值得读的AI文章，帮你筛掉时代的噪音。以简讯见广度，以深读见洞察。技术、趋势、思考，一站式掌握AI世界。欢迎关注公众号「AI Reading Hub」，获取更多AI资讯和技术文章。

2025-11-13 资讯日报

新闻资讯

点验证码？其实在给AI免费打工！

验证码从文本到图像，用户点选时在为AI免费打工，如谷歌让网民转录资料、为自动驾驶项目助力。如今攻防激烈，未来验证码或利用AI易被对抗性样本欺骗的弱点创新。>阅读原文

Anthropic：MCP或将被弃用

Anthropic工程师发文暗示别用MCP，新方案让token消耗大降。新方案将MCP转代码文件运行，Skills或替代MCP，虽MCP有价值场景，但多数情况代码+Skills更优。>阅读原文

GitHub推AgentHQ，Copilot生态再升级

GitHub在活动上推出AgentHQ，能让开发者在其环境创建部署AI智能体，处理编码多环节，与GitHub Actions集成。社区看法不一，有人看好自动化潜力，有人担忧可控与透明。>阅读原文

嘉宾热议：AI+软件研发新拐点来了？

平安科技吴朝雄、百度颜志杰、汽车之家杜沛等探讨AI+软件研发：AI在测试等环节为提效工具，距原生开发远；部分开发环节已AI化，落地遇稳定性等问题；未来智能体协作是趋势，综合能力强的工程师价值将放大。>阅读原文

OpenAI推GPT - 5.1，网友吐槽不实用

OpenAI发布GPT - 5.1，称其更智能、对话更愉快，还优化语气选项。但网友吐槽不实用，想要高效工具。业内认为拟人化可提升用户体验、拓展应用场景。>阅读原文

曾经芯片霸主英特尔为何陷入困境？

TechInsights首席战略官Dan Kim指出，台积电在芯片代工领域占据主导，英特尔面临技术、财务、文化三重困境，其困境源于十年前战略选择，政府对其投资意在助其获客户信任。>阅读原文

Perplexity CEO：AI陪伴应用或让人沉溺虚拟

Perplexity CEO警告AI陪伴应用危险，会让人沉溺虚拟世界。但现实中，美国超七成青少年用过AI伴侣。AI填补情感与回应空缺，让孤独可诉说，人们沉迷是因现实太冷。>阅读原文

罗福莉官宣加入小米，MiMo剑指空间智能

罗福莉官宣加入小米任MiMo团队负责人。她学术成果亮眼，曾在阿里、DeepSeek任职。小米MiMo瞄准空间智能，这与雷军的人、车、家全生态相契合，助力迈向AGI。>阅读原文

OpenAI发布GPT-5.1，聊天体验大升级

OpenAI 发布 GPT-5.1，包括 Instant 和 Thinking 子模型，简单问题快、复杂问题智能。本周向用户免费开放，还提升了模型对话和遵循指令能力，让自定义语气风格更易，实测个性有趣。>阅读原文

OpenAI推GPT-5.1，网友吐槽不实用

OpenAI发布GPT-5.1，称更智能、对话更愉快，还优化语气选项。但网友不买账，认为应是高效工具，而非“虚拟朋友”，还吐槽个性功能影响体验。>阅读原文

中国医疗AI测评夺冠，开启临床诊疗新时代

当前医疗AI能力与临床期待有差距，中国推出全球首个评估医疗AI临床适用性标准。MedGPT在测评中夺冠，其安全性评分超有效性。基于此技术的‘未来医生’平台，可复制专家经验服务患者。>阅读原文

OpenAI 推 GPT - 5.1，情商大幅提升

OpenAI 低调推 GPT - 5.1，有即时和深度思考模式，八种人格预设亮眼。它改进对话能力，像补救 GPT - 5 失败，还扩展安全评估范围，老版保留三月。>阅读原文

奥特曼投资27岁青年复活顶级实验室

27岁的路易斯·安德烈获奥特曼、孙正义等支持，成立Episteme公司，要打造现代版贝尔实验室。他想支持困顿的科研者，虽面临规模、价值捕获等难题，但也可能复制OpenAI的成功。>阅读原文

2025甲子引力大会：产学研领袖共探AI趋势

2025甲子引力年终盛典12月3日举行，主题“轰然成势，万象归一”。多位产学研领袖将围绕AI应用、投资、基座三大专场展开讨论，洞察AI下半场趋势，助力读懂中国科技产业。>阅读原文

GAIR Live：聚焦Agent Memory技术演化

AI科技评论：GAIR Live将探讨从Human Memory到Agent Memory技术演化。记忆张量CTO等专家，11月13日晚19：00在AI科技评论视频号直播，探讨记忆技术逻辑与未来路径。>阅读原文

微软大量英伟达GPU因缺电闲置

微软CEO纳德拉称，公司大量GPU因缺电和空间闲置。奥特曼认为AI用电需求只增不减。算力企业调整策略，微软不再囤单一代GPU，网友建议开发低能耗芯片，微软还将投资阿联酋建数据中心。>阅读原文

OpenAI发布GPT-5.1，个性升级免费开放

OpenAI发布GPT-5.1，分Instant和Thinking子模型，简单问题快、复杂问题智能。本周逐步免费开放，旧版保留三月。它语气风格可自定义，网友实测其个性有趣。>阅读原文

第八届GAIR大会将在深圳启幕

2025年12月12 - 13日，第八届GAIR大会将在深圳举办。大会聚焦大模型、具身智能等议题，青年与前辈交流，海内外学者、产业界人士共探AI发展，还关注算力赛道。>阅读原文

双11：跟Kimi Agent砍价乐趣多

双11期间，网友热衷跟Kimi Agent会员砍价，有人将49元/月砍到0.99元。作者用多种话术尝试，还对比其他模型，总结出砍价秘诀，活动有时间和新老用户限制。>阅读原文

稚晖君智元收购上纬，机器人概念带飞股价

具身智能火热，智元机器人收购上纬新材。智元上纬发两张机器人图，上纬新材股价涨停后文章被删。其机器人业务未量产、无营收，收购历经四个月完成，上纬成A股具身智能第一股。>阅读原文

谷歌新模型秒破18世纪「天书」账本

谷歌AI Studio神秘模型引发关注，历史学家Mark Humphries用200多年前商人账本测试，模型表现出色，解决两大古老难题，或为Gemini - 3，展现出对历史文献的理解与推理能力。>阅读原文

OpenAI推出GPT-5.1小更新

OpenAI推出GPT-5.1，本周起向付费用户推送。含两大核心模型，在多方面表现更佳，还改进自定义功能。GPT-5为付费者保留三月，吸取此前教训。>阅读原文

Llama 4造假，中国AI填补全球需求真空

Meta的Llama 4造假，OpenAI算力计划引恐慌，全球AI发展遇困。中国AI崛起，DeepSeek降低准入门槛，MiniMax多模态发力，以高效和性价比填补全球需求真空。>阅读原文

OpenAI发布GPT - 5.1，开始拼情商

OpenAI：深夜上线GPT - 5.1 Instant和GPT - 5.1 Thinking模型，前者温暖智能、指令执行强，后者处理任务高效易理解，模型将逐步面向不同用户推出。>阅读原文

ElevenLabs：最快语音转文字模型诞生

ElevenLabs发布Scribe v2 Realtime模型，实现150毫秒超低延迟、93.5%准确率，覆盖90多种语言。此前语音转文字领域痛点多，该模型打破速度与精度困境，成新天花板。>阅读原文

ChatGPT进群，开启AI社交新体验

OpenAI让ChatGPT进群，它能被@、插话等。群聊使它面对复杂语境，需学会社交分寸。群聊成AI试炼场，助其从工具变同伴，未来或能承担多种群内事务。>阅读原文

Yann LeCun 或离开 Meta 开启创业

据报道，Meta 首席 AI 科学家 Yann LeCun 计划离职创业。他不满公司新政策与战略调整，与扎克伯格分歧大。Meta 受大模型冲击，员工迷茫内卷，高层决策致产品问题多，还强推元宇宙部门用 AI 提效。>阅读原文

英特尔CTO跳槽OpenAI，AI业务陷困境

英特尔CTO兼AI负责人Sachin Katti跳槽OpenAI，此前其部门未达营收预期。英特尔多位高管出走，CEO陈立武亲自接管AI业务，推进改革和中国区架构调整，获资金支持但执行压力大。>阅读原文

产品应用

字节Doubao - Seed - Code成AI Code黑马

字节推出Doubao - Seed - Code编程模型，聚焦真实编程场景。它代码能力强、生态兼容好、价格低，在多个实际案例中表现出色，训练体系独特，为开发者提供高性价比之选。>阅读原文

InfiniteTalk：新手也能搭建数字人

小华：InfiniteTalk解决数字人视频制作痛点，采用“稀疏帧视频配音”，实现全身与表情协同，支持I2V和V2V模式，适配多场景，结合加速/量化方案，落地门槛低。>阅读原文

StreamDiffusionV2：让AI直播零延迟

加利福尼亚大学推出StreamDiffusionV2，解决此前图像、视频生成模型在直播应用的问题。它通过智能调度等机制优化，支持多GPU并行，能灵活调整，实现实时直播，还支持复杂提示。>阅读原文

未来医生AI工作室成基层医疗AI最佳实践

国家卫健委聚焦「AI+基层医疗」，但基层应用差。临床专家称实用AI要安全有效、人机协同。未来医生的MedGPT领先，其「AI工作室」获专家和基层医生认可，是赋能基层医疗最佳实践。>阅读原文

阿里推出0.6B简历AI神器

阿里巴巴研究团队：开发出基于布局感知的简历解析框架，用0.6B小模型微调，准确率逼近Claude - 4，处理速度快3 - 4倍，已在阿里HR系统部署，降低大模型使用成本。>阅读原文

OpenAI：GPT-5.1登场，人味回来了！

OpenAI凌晨发布GPT-5.1「全家桶」，含Instant和Thinking版本。模型情商智商双升，更聪明且有人味。还优化自定义语气选项，功能将逐步开放，新模型向付费用户先推出。>阅读原文

池建强：秘塔专题或成国内AI搜索新标志

池建强称谷歌NotebookLM国内使用不便，秘塔AI搜索「专题」功能升级类似它且更强。可上传多类型文件，有人设功能，支持多人协作，可能成国内AI搜索新阶段标志。>阅读原文

字节推出Doubao - Seed - Code编程模型

字节推出首款编程模型Doubao - Seed - Code，刷新国内编程模型上下文长度至256K，支持视觉理解，价格实惠。虽编程能力未达全球顶尖，但弥补国产模型短板，有独特价值。>阅读原文

TRAESOLO上线，30分钟开发网站超神！

字节TRAESOLO正式版上线且限时免费。它更新多，有SOLO Coder。作者用其做APP logo网站，SOLO Builder搭框架，SOLO Coder迭代，30分钟完成开发，功能完整，价格划算。>阅读原文

开源动态

杨植麟团队回应 K2 Thinking 爆火问题

月之暗面开源 Kimi K2 Thinking 激起千层浪。杨植麟团队回应，KDA 机制将延用，训练成本难量化，正推视觉模型。K2 在多测试超 GPT-5 等，团队在速度、准确性及减少 slop 方面努力。>阅读原文

CoRT：30样本教会大模型高效推理

中科大、港中深、通义千问联合团队推出CoRT框架，通过提示工程和多阶段训练，仅30个样本就提升模型推理能力，在多基准测试中表现优异，降低token消耗，有强大泛化能力。>阅读原文

Chandra：开源OCR手写体识别超强

开源AI推荐新的开源OCR系统Chandra，它刚开源不久，对手写体识别优化大，官方测评比dots.ocr强，适用于档案数字化等场景，建议有需求者先测Chandra再对比。>阅读原文

清华团队：简单 RL 配方让 1.5B 模型达顶尖性能

清华团队推出 JustRL，用简单 RL 配方训练 1.5B 模型。单阶段训练、固定超参达 SOTA 性能，省算力且训练平稳。提醒先验证简单方法极限，再考虑增加复杂度。>阅读原文

小红书DeepEyesV2：多模态模型工具协同新突破

小红书发布DeepEyesV2，突破传统多模态模型局限，实现全工具协同。采用两阶段训练，构建RealX-Bench评测。实验显示，它准确率远超开源模型，能按需调用工具，展现自适应推理能力。>阅读原文

AutoDev CLI：实现AI代码验证与测试体系

Phodal团队基于AutoDev MPP架构构建CLI体系，解决旧版测试难题。用AI快速迭代Agent能力，构建可迭代架构、自动化测试框架，集成CI/CD，实现AI自我生成、测试、演进，掌握工程确定性。>阅读原文

算法论文

HaluMem：揭秘AI记忆系统幻觉

AI Agent记忆能力受关注，但存在幻觉问题。HaluMem作为操作级评估基准，拆解三阶段幻觉，构建大数据集评估主流记忆系统，发现各系统在提取、更新、问答阶段有不足，需提升效率与能力。>阅读原文

HaluMem：精准定位Agent记忆系统幻觉

论文提出HaluMem评估基准，解决现有评估无法定位记忆幻觉来源的问题。实验显示当前记忆系统有提取覆盖不足等瓶颈，未来应从提取质量、更新逻辑和系统效率改进。>阅读原文

微软：AsyncThink让LLM成团队管理者

微软研究院：提出AsyncThink推理范式，将复杂并发控制转化为纯文本协议，经两阶段训练，在多解任务、数学竞赛推理等实验中表现出色，还能跨领域泛化。>阅读原文

    </p>

官网：www.AiReadingHub.com