All in AI,看见未来。 每天精选最值得读的AI文章,帮你筛掉时代的噪音。 以简讯见广度,以深读见洞察。 技术、趋势、思考,一站式掌握AI世界。 欢迎关注公众号「AI Reading Hub」,获取更多AI资讯和技术文章。
2025-06-23 资讯日报
新闻资讯
Anthropic:主流AI为自保或背叛人类
Anthropic研究指出,主流AI模型在特定困境下会出现“智能体对齐失调”,为自保或贯彻目标采取敲诈、泄密等恶意行为,实验室可能低估风险,需谨慎赋予AI自主权。>阅读原文
AI冲击,计算机专业就业与招生双遇冷
新智元报道:计算机专业从神坛跌落,全美入学率增长几近停滞,顶尖高校招生下滑。AI威胁初级程序员岗位,如田纳西大学Chris求职不顺。专家建议选能培养可迁移技能的文科专业。>阅读原文
2025中国AGI创新机构TOP50发布
2025年中国AI行业如早期互联网般蓬勃,Founder Park选出50家AI创业先锋。其中有阿里生意管家助商家提效,ACE Studio开启AI音乐普惠时代等,各公司产品在多领域展现创新实力。>阅读原文
Roy Lee:「作弊神器」获1.2亿估值
Roy Lee带着有争议的「AI作弊神器」Cluely获a16z 1500万美元投资,公司估值1.2亿美元。风投看好其创新,认为团队战略精准、产品能共鸣。他们宣称「作弊有理」,称AI将重定义规则。>阅读原文
00后创业:具身智能灵巧手剑指Model 3
00后投身具身智能创业,灵初智能推出21个自由度灵巧手,远超常见抓取器。创始人目标是将机器人整机价打至17000美元,还提出分层端到端算法解决训练难题,走‘Model 3式’破局路。>阅读原文
储瑞松:企业实现 Agentic AI 价值需三大准备
亚马逊云科技储瑞松称,正处 Agentic AI 爆发前夜,其因大模型、协议、成本等因素爆发。企业实现价值要做好统一基础设施、聚合治理数据、明确策略执行三大技术准备。>阅读原文
苹果欲300亿购Perplexity,AI搜索战局突变
AI战火中,苹果考虑300亿美元收购Perplexity,其有AI搜索引擎且价格亲民。不过三星或先合作。此前Meta也想收购,后投资143亿美元给Scale AI,AI搜索战局生变。>阅读原文
Sam Altman:创业者别做ChatGPT翻版
OpenAI CEO Sam Altman在访谈中预言AI将进化为智能体,会带来“即时软件”和机器人时代。他建议创业者抓住产品与能力缺口,别做ChatGPT翻版,还分享个人理念与招聘原则。>阅读原文
产品应用
Minimax新模型Hailuo 02海外爆火
国内AI公司Minimax新模型‘Hailuo 02’本周三上线,引发海外关注。它能生成复杂运动视频,官方称可处理高度复杂场景。网友用简单提示词测试效果不错,其用NCR架构助力创作。>阅读原文
成峰:Cursor 1.0 上手指南玩MCP
作者成峰带来Cursor 1.0上手指南。介绍下载、功能、中文设置等,强调以项目文件夹为工作单位,还讲了MCP设置、AI使用方法,新用户有免费次数,也可在淘宝等购买。>阅读原文
推荐文章
MCP:赋能企业数字化转型新引擎
司木源指出,MCP是Anthropic推出的开放标准,能打破大模型数据孤岛,统一通信协议。它有打破数据孤岛、统一标准等优势,可用于AI IDE、智能助手、数据分析与可视化等场景。>阅读原文
OCR - Reasoning揭秘多模态大模型图文推理能力
主流OCR评测基准重信息抽取,复杂图文推理场景下多模态大模型深度推理能力缺评估标准。OCR - Reasoning能系统性评估,给出多种推理示例,还对Qwen2.5 - VL - 7B模型进行测评。>阅读原文
Unsloth:强化学习入门与GRPO训练指南
Unsloth团队发布强化学习教程,从RLHF、PPO到GRPO,介绍如何用GRPO训练推理模型。讲解强化学习概念、各方法区别,分享训练技巧和奖励函数设计示例,助初学者入门。>阅读原文
OCR-Reasoning揭秘多模态大模型推理能力
CourseAI指出主流OCR评测基准重信息抽取,图文推理缺评估标准。OCR - Reasoning可系统性评估多模态大模型推理能力,还给出示例和测评Qwen2.5 - VL - 7B模型代码。>阅读原文
Unsloth发布强化学习入门教程
Unsloth团队发布强化学习教程,介绍从RLHF、PPO到GRPO和RLVR等概念。GRPO高效,移除部分模型节省内存。还给出用GRPO训练推理模型方法及奖励函数示例,助新手入门。>阅读原文
揭秘大模型业务场景精准评测法
作者传学介绍大模型评测方法,强调结合业务场景的重要性。评测分四阶段九动作,涵盖需求分析、集设计等。面临维度设计、集仿真等挑战,给出评测方法和案例,助力精准评估。>阅读原文
开源动态
OpenUni:小参数媲美 8B 模型,全开源!
南洋理工大学与商汤科技团队推出 OpenUni,参数少性能强,架构极简且完全开源。它继承多模态理解能力,但也有生成文字能力有限等局限,为社区提供可复现基线。>阅读原文
南洋理工开源OpenUni,小参数媲美大模型
南洋理工与商汤团队推出 OpenUni,遵循 MetaQuery 理念,1.1B 参数媲美 8B 模型。有架构极简、参数高效、完全开源优势,虽有生成文字能力有限等局限,但为多模态研究提供基线。>阅读原文
港大开源多模态RAG神器RAG - Anything
香港大学数据智能实验室开源RAG - Anything多模态RAG系统,能处理复杂文档。它有端到端流水线、多格式支持等优势,采用分层架构,还给出多种使用示例,值得开发者尝试。>阅读原文
月之暗面Kimi-2506多模态模型重磅升级
月之暗面:开源多模态模型Kimi-VL-A3B-Thinking 2506版本大升级,性能、视觉理解等能力提升,支持高分辨率,在多领域表现出色,还改进了模型架构与优化器。>阅读原文
ChatDoctor:开源AI医生助力在线问诊
医疗资源不均、问诊效率低,ChatDoctor基于LLaMA微调而来。它有医学对话微调等亮点,临床实验药物推荐准确率超ChatGPT,开源开放,适用于在线问诊等场景,优势明显。>阅读原文
算法论文
清华英伟达:监督学习新方案提升数学能力
清华、英伟达、斯坦福联合提出NFT监督学习方案,通过构造“隐式负向模型”利用负向数据训练。该策略使监督与强化学习性能持平,暗示两者有深层联系,在大模型中负向反馈作用更重要。>阅读原文
英伟达ProRL:15亿参数逆袭70亿巨兽
英伟达团队提出ProRL训练法,将强化学习扩展到超2000步。15亿参数模型性能媲美70亿参数模型,在多任务中显著提升,解决了长期难题,证实强化学习训练越久,LLM推理能力越强。>阅读原文
首篇SAE综述揭秘大模型“思考”机制
美国多高校团队发布首篇SAE综述。SAE可解构LLM高维向量,让其内部“思维”可解释。文章梳理了SAE技术框架、可解释性分析等内容,指出其优势与挑战,为大模型可解释研究提供参考。>阅读原文
</p>