AI日报:点验证码?其实在给AI免费打工!; Anthropic:MCP或将被弃用; GitHub推AgentHQ,Copilot生态再升级

77 阅读4分钟

All in AI,看见未来。 每天精选最值得读的AI文章,帮你筛掉时代的噪音。 以简讯见广度,以深读见洞察。 技术、趋势、思考,一站式掌握AI世界。 欢迎关注公众号「AI Reading Hub」,获取更多AI资讯和技术文章。

2025-11-13 资讯日报

新闻资讯

点验证码?其实在给AI免费打工!

验证码从文本到图像,用户点选时在为AI免费打工,如谷歌让网民转录资料、为自动驾驶项目助力。如今攻防激烈,未来验证码或利用AI易被对抗性样本欺骗的弱点创新。>阅读原文

Anthropic:MCP或将被弃用

Anthropic工程师发文暗示别用MCP,新方案让token消耗大降。新方案将MCP转代码文件运行,Skills或替代MCP,虽MCP有价值场景,但多数情况代码+Skills更优。>阅读原文

GitHub推AgentHQ,Copilot生态再升级

GitHub在活动上推出AgentHQ,能让开发者在其环境创建部署AI智能体,处理编码多环节,与GitHub Actions集成。社区看法不一,有人看好自动化潜力,有人担忧可控与透明。>阅读原文

嘉宾热议:AI+软件研发新拐点来了?

平安科技吴朝雄、百度颜志杰、汽车之家杜沛等探讨AI+软件研发:AI在测试等环节为提效工具,距原生开发远;部分开发环节已AI化,落地遇稳定性等问题;未来智能体协作是趋势,综合能力强的工程师价值将放大。>阅读原文

OpenAI推GPT - 5.1,网友吐槽不实用

OpenAI发布GPT - 5.1,称其更智能、对话更愉快,还优化语气选项。但网友吐槽不实用,想要高效工具。业内认为拟人化可提升用户体验、拓展应用场景。>阅读原文

曾经芯片霸主英特尔为何陷入困境?

TechInsights首席战略官Dan Kim指出,台积电在芯片代工领域占据主导,英特尔面临技术、财务、文化三重困境,其困境源于十年前战略选择,政府对其投资意在助其获客户信任。>阅读原文

Perplexity CEO:AI陪伴应用或让人沉溺虚拟

Perplexity CEO警告AI陪伴应用危险,会让人沉溺虚拟世界。但现实中,美国超七成青少年用过AI伴侣。AI填补情感与回应空缺,让孤独可诉说,人们沉迷是因现实太冷。>阅读原文

罗福莉官宣加入小米,MiMo剑指空间智能

罗福莉官宣加入小米任MiMo团队负责人。她学术成果亮眼,曾在阿里、DeepSeek任职。小米MiMo瞄准空间智能,这与雷军的人、车、家全生态相契合,助力迈向AGI。>阅读原文

OpenAI发布GPT-5.1,聊天体验大升级

OpenAI 发布 GPT-5.1,包括 Instant 和 Thinking 子模型,简单问题快、复杂问题智能。本周向用户免费开放,还提升了模型对话和遵循指令能力,让自定义语气风格更易,实测个性有趣。>阅读原文

OpenAI推GPT-5.1,网友吐槽不实用

OpenAI发布GPT-5.1,称更智能、对话更愉快,还优化语气选项。但网友不买账,认为应是高效工具,而非“虚拟朋友”,还吐槽个性功能影响体验。>阅读原文

中国医疗AI测评夺冠,开启临床诊疗新时代

当前医疗AI能力与临床期待有差距,中国推出全球首个评估医疗AI临床适用性标准。MedGPT在测评中夺冠,其安全性评分超有效性。基于此技术的‘未来医生’平台,可复制专家经验服务患者。>阅读原文

OpenAI 推 GPT - 5.1,情商大幅提升

OpenAI 低调推 GPT - 5.1,有即时和深度思考模式,八种人格预设亮眼。它改进对话能力,像补救 GPT - 5 失败,还扩展安全评估范围,老版保留三月。>阅读原文

奥特曼投资27岁青年复活顶级实验室

27岁的路易斯·安德烈获奥特曼、孙正义等支持,成立Episteme公司,要打造现代版贝尔实验室。他想支持困顿的科研者,虽面临规模、价值捕获等难题,但也可能复制OpenAI的成功。>阅读原文

2025甲子引力大会:产学研领袖共探AI趋势

2025甲子引力年终盛典12月3日举行,主题“轰然成势,万象归一”。多位产学研领袖将围绕AI应用、投资、基座三大专场展开讨论,洞察AI下半场趋势,助力读懂中国科技产业。>阅读原文

GAIR Live:聚焦Agent Memory技术演化

AI科技评论:GAIR Live将探讨从Human Memory到Agent Memory技术演化。记忆张量CTO等专家,11月13日晚19:00在AI科技评论视频号直播,探讨记忆技术逻辑与未来路径。>阅读原文

微软大量英伟达GPU因缺电闲置

微软CEO纳德拉称,公司大量GPU因缺电和空间闲置。奥特曼认为AI用电需求只增不减。算力企业调整策略,微软不再囤单一代GPU,网友建议开发低能耗芯片,微软还将投资阿联酋建数据中心。>阅读原文

OpenAI发布GPT-5.1,个性升级免费开放

OpenAI发布GPT-5.1,分Instant和Thinking子模型,简单问题快、复杂问题智能。本周逐步免费开放,旧版保留三月。它语气风格可自定义,网友实测其个性有趣。>阅读原文

第八届GAIR大会将在深圳启幕

2025年12月12 - 13日,第八届GAIR大会将在深圳举办。大会聚焦大模型、具身智能等议题,青年与前辈交流,海内外学者、产业界人士共探AI发展,还关注算力赛道。>阅读原文

双11:跟Kimi Agent砍价乐趣多

双11期间,网友热衷跟Kimi Agent会员砍价,有人将49元/月砍到0.99元。作者用多种话术尝试,还对比其他模型,总结出砍价秘诀,活动有时间和新老用户限制。>阅读原文

稚晖君智元收购上纬,机器人概念带飞股价

具身智能火热,智元机器人收购上纬新材。智元上纬发两张机器人图,上纬新材股价涨停后文章被删。其机器人业务未量产、无营收,收购历经四个月完成,上纬成A股具身智能第一股。>阅读原文

谷歌新模型秒破18世纪「天书」账本

谷歌AI Studio神秘模型引发关注,历史学家Mark Humphries用200多年前商人账本测试,模型表现出色,解决两大古老难题,或为Gemini - 3,展现出对历史文献的理解与推理能力。>阅读原文

OpenAI推出GPT-5.1小更新

OpenAI推出GPT-5.1,本周起向付费用户推送。含两大核心模型,在多方面表现更佳,还改进自定义功能。GPT-5为付费者保留三月,吸取此前教训。>阅读原文

Llama 4造假,中国AI填补全球需求真空

Meta的Llama 4造假,OpenAI算力计划引恐慌,全球AI发展遇困。中国AI崛起,DeepSeek降低准入门槛,MiniMax多模态发力,以高效和性价比填补全球需求真空。>阅读原文

OpenAI发布GPT - 5.1,开始拼情商

OpenAI:深夜上线GPT - 5.1 Instant和GPT - 5.1 Thinking模型,前者温暖智能、指令执行强,后者处理任务高效易理解,模型将逐步面向不同用户推出。>阅读原文

ElevenLabs:最快语音转文字模型诞生

ElevenLabs发布Scribe v2 Realtime模型,实现150毫秒超低延迟、93.5%准确率,覆盖90多种语言。此前语音转文字领域痛点多,该模型打破速度与精度困境,成新天花板。>阅读原文

ChatGPT进群,开启AI社交新体验

OpenAI让ChatGPT进群,它能被@、插话等。群聊使它面对复杂语境,需学会社交分寸。群聊成AI试炼场,助其从工具变同伴,未来或能承担多种群内事务。>阅读原文

Yann LeCun 或离开 Meta 开启创业

据报道,Meta 首席 AI 科学家 Yann LeCun 计划离职创业。他不满公司新政策与战略调整,与扎克伯格分歧大。Meta 受大模型冲击,员工迷茫内卷,高层决策致产品问题多,还强推元宇宙部门用 AI 提效。>阅读原文

英特尔CTO跳槽OpenAI,AI业务陷困境

英特尔CTO兼AI负责人Sachin Katti跳槽OpenAI,此前其部门未达营收预期。英特尔多位高管出走,CEO陈立武亲自接管AI业务,推进改革和中国区架构调整,获资金支持但执行压力大。>阅读原文

产品应用

字节Doubao - Seed - Code成AI Code黑马

字节推出Doubao - Seed - Code编程模型,聚焦真实编程场景。它代码能力强、生态兼容好、价格低,在多个实际案例中表现出色,训练体系独特,为开发者提供高性价比之选。>阅读原文

InfiniteTalk:新手也能搭建数字人

小华:InfiniteTalk解决数字人视频制作痛点,采用“稀疏帧视频配音”,实现全身与表情协同,支持I2V和V2V模式,适配多场景,结合加速/量化方案,落地门槛低。>阅读原文

StreamDiffusionV2:让AI直播零延迟

加利福尼亚大学推出StreamDiffusionV2,解决此前图像、视频生成模型在直播应用的问题。它通过智能调度等机制优化,支持多GPU并行,能灵活调整,实现实时直播,还支持复杂提示。>阅读原文

未来医生AI工作室成基层医疗AI最佳实践

国家卫健委聚焦「AI+基层医疗」,但基层应用差。临床专家称实用AI要安全有效、人机协同。未来医生的MedGPT领先,其「AI工作室」获专家和基层医生认可,是赋能基层医疗最佳实践。>阅读原文

阿里推出0.6B简历AI神器

阿里巴巴研究团队:开发出基于布局感知的简历解析框架,用0.6B小模型微调,准确率逼近Claude - 4,处理速度快3 - 4倍,已在阿里HR系统部署,降低大模型使用成本。>阅读原文

OpenAI:GPT-5.1登场,人味回来了!

OpenAI凌晨发布GPT-5.1「全家桶」,含Instant和Thinking版本。模型情商智商双升,更聪明且有人味。还优化自定义语气选项,功能将逐步开放,新模型向付费用户先推出。>阅读原文

池建强:秘塔专题或成国内AI搜索新标志

池建强称谷歌NotebookLM国内使用不便,秘塔AI搜索「专题」功能升级类似它且更强。可上传多类型文件,有人设功能,支持多人协作,可能成国内AI搜索新阶段标志。>阅读原文

字节推出Doubao - Seed - Code编程模型

字节推出首款编程模型Doubao - Seed - Code,刷新国内编程模型上下文长度至256K,支持视觉理解,价格实惠。虽编程能力未达全球顶尖,但弥补国产模型短板,有独特价值。>阅读原文

TRAESOLO上线,30分钟开发网站超神!

字节TRAESOLO正式版上线且限时免费。它更新多,有SOLO Coder。作者用其做APP logo网站,SOLO Builder搭框架,SOLO Coder迭代,30分钟完成开发,功能完整,价格划算。>阅读原文

推荐文章

曹宇:探讨强化学习AI系统发展方向

阿里巴巴曹宇分享强化学习在大语言模型中的应用。介绍 RLxF 理论到工程化,核心算法探索及突破,超大规模 RL 系统面临挑战。指出推理、评估、训练环节待提升,呼吁共建开源系统。>阅读原文

GreenBitAI:撬开本地AI万亿市场

当下大模型训练成本高、能力增长遇瓶颈,AI产业从‘参数竞赛’向‘效率革命’转变。GreenBitAI坚守低比特模型十年,推出Libra,可本地运行,适配多场景,其规划三步商业化路径,有望开拓万亿增量市场。>阅读原文

Ciceri:AI无法取代架构师决策

InfoQ采访软件架构专家Christian Ciceri,他指出软件架构师处于转型期,AI可辅助但无法取代人类决策。架构治理要关注软件全属性,指标使用应结合团队痛点,优秀架构师需有好奇心。>阅读原文

剑洁:Python 协程二十年进化史

剑洁:Python 协程从 2001 年yield出现开始进化,历经嵌套难题、社区补丁@wrappertask、语法标准化yield from、原生协程async/await,最终形成asyncio生态,演进遵循升维路径。>阅读原文

开源动态

杨植麟团队回应 K2 Thinking 爆火问题

月之暗面开源 Kimi K2 Thinking 激起千层浪。杨植麟团队回应,KDA 机制将延用,训练成本难量化,正推视觉模型。K2 在多测试超 GPT-5 等,团队在速度、准确性及减少 slop 方面努力。>阅读原文

CoRT:30样本教会大模型高效推理

中科大、港中深、通义千问联合团队推出CoRT框架,通过提示工程和多阶段训练,仅30个样本就提升模型推理能力,在多基准测试中表现优异,降低token消耗,有强大泛化能力。>阅读原文

Chandra:开源OCR手写体识别超强

开源AI推荐新的开源OCR系统Chandra,它刚开源不久,对手写体识别优化大,官方测评比dots.ocr强,适用于档案数字化等场景,建议有需求者先测Chandra再对比。>阅读原文

清华团队:简单 RL 配方让 1.5B 模型达顶尖性能

清华团队推出 JustRL,用简单 RL 配方训练 1.5B 模型。单阶段训练、固定超参达 SOTA 性能,省算力且训练平稳。提醒先验证简单方法极限,再考虑增加复杂度。>阅读原文

小红书DeepEyesV2:多模态模型工具协同新突破

小红书发布DeepEyesV2,突破传统多模态模型局限,实现全工具协同。采用两阶段训练,构建RealX-Bench评测。实验显示,它准确率远超开源模型,能按需调用工具,展现自适应推理能力。>阅读原文

AutoDev CLI:实现AI代码验证与测试体系

Phodal团队基于AutoDev MPP架构构建CLI体系,解决旧版测试难题。用AI快速迭代Agent能力,构建可迭代架构、自动化测试框架,集成CI/CD,实现AI自我生成、测试、演进,掌握工程确定性。>阅读原文

算法论文

HaluMem:揭秘AI记忆系统幻觉

AI Agent记忆能力受关注,但存在幻觉问题。HaluMem作为操作级评估基准,拆解三阶段幻觉,构建大数据集评估主流记忆系统,发现各系统在提取、更新、问答阶段有不足,需提升效率与能力。>阅读原文

HaluMem:精准定位Agent记忆系统幻觉

论文提出HaluMem评估基准,解决现有评估无法定位记忆幻觉来源的问题。实验显示当前记忆系统有提取覆盖不足等瓶颈,未来应从提取质量、更新逻辑和系统效率改进。>阅读原文

微软:AsyncThink让LLM成团队管理者

微软研究院:提出AsyncThink推理范式,将复杂并发控制转化为纯文本协议,经两阶段训练,在多解任务、数学竞赛推理等实验中表现出色,还能跨领域泛化。>阅读原文

    </p>
    

官网:www.AiReadingHub.com