All in AI,看见未来。 每天精选最值得读的AI文章,帮你筛掉时代的噪音。 以简讯见广度,以深读见洞察。 技术、趋势、思考,一站式掌握AI世界。 欢迎关注公众号「AI Reading Hub」,获取更多AI资讯和技术文章。
2025-06-19 资讯日报
新闻资讯
AICon大会:大厂分享研发提效经验
6月27 - 28日AICon北京站上,大厂技术大牛将分享“AI赋能研发提效”经验。丁宇讲AI编程范式革新,张乐分享腾讯代码智能化实践,同程、百度、网易游戏人员也将分享研发提效做法。>阅读原文
AI算力租赁市场:乱象与回轨之路
雷峰网刘伊伦指出,算力租赁市场问题多,上市公司‘炒概念’,消纳方套壳毁约,租赁方陷入‘囚徒困境’。但市场会淘汰弱企业,国家也有调控,行业有望良性发展。>阅读原文
咔皮记账负责人揭秘初创AI APP突围秘诀
量子位智库AI产品Time访谈节目,6月19日20:00 - 21:00邀请咔皮记账产品负责人张洋。该APP6个月用户破百万,将解析其在小众赛道突围、获活跃高粘性用户的经验。>阅读原文
Meta砸钱挖角OpenAI,发力AI野心大
CNBC消息,Meta为发展AI,以高额条件挖OpenAI员工未成功。此前其旗舰模型发布推迟,近期收购Scale AI部分股份,还从谷歌等挖来顶尖人才,扎克伯格亲自参与招聘。>阅读原文
港科广等发布首个医学世界模型
港科广等团队发布医学世界模型MeWM,能模拟肿瘤演化、规划治疗方案。有肿瘤演变模拟等三核心贡献,实验显示其术后肿瘤生成、生存风险评估、治疗方案筛选能力强,推动精准医疗发展。>阅读原文
AI for Science颠覆药物研发模式
文章认为AI for Science将生命科学与数字互联网结合,加速科研。Foundation Model和AI Agent改变药物研发流程,还以四象限梳理玩家,如深挖单点的生物模型、编排实验的AI Scientist等,展示AI重塑科研的潜力。>阅读原文
Sam Altman:GPT - 5今夏或登场
OpenAI的Sam Altman在专访中表示,GPT - 5可能今夏发布,也可能继续迭代GPT - 4.5;认为每年更多人觉得接近AGI;坚决反对纽约时报保留用户记录要求;还提到星际之门项目等规划。>阅读原文
扎克伯格挖角,奥特曼批 Meta 不懂创新
Meta 扎克伯格为新团队招募 AI 人才,向 OpenAI 等员工提供巨额奖金。奥特曼证实此事,称招聘未成功,批 Meta 不懂创新,还透露 OpenAI 未来将推“AI 伴侣”,整合万事万物。>阅读原文
Mary Meeker:发布 AI 市场最新报告
知名投资分析师 Mary Meeker 发布 AI 市场报告,指出 AI 变革速度快,经济图景复杂,性能持续攀升,新兴能力不断涌现,还将影响劳动力,当下是开发软件应用的黄金时期。>阅读原文
618对话京东三位技术博士,TGT计划引关注
作者618与京东三位技术博士交流。长林优化同品判别系统,采用务实路线;星衍推进物流机械臂项目,打透单一场景;初雪提升语音识别准确率,探索创新方向。京东推TGT计划吸引技术人才。>阅读原文
卢宗青:现阶段世界模型和 VLA 不触及本质
北大卢宗青表示现阶段世界模型和 VLA 不触及本质,认为互联网视频数据是唯一可规模化道路。他创立的 BeingBeyond 标注互联网视频中人类关节动作训练模型,追求通用具身智能的本质解法。>阅读原文
马斯克300亿融资,xAI豪赌AGI
xAI每月烧10亿美元,为应对算力战争,进行巨额融资。马斯克手握自身影响力、X平台数据和自建基础设施三张王牌,xAI预计2027年盈利,目标是创造AGI。>阅读原文
罗永浩数字人直播618战绩超真人
今年618,百度电商的罗永浩数字人直播表现出色,带货单量超真人首秀。它由慧播星打造,有四大突破,靠多模协同技术。数字人技术门槛降低,助中小商家订单量增长,百度还发布计划扶持。>阅读原文
Andrej Karpathy:软件3.0时代来临
Andrej Karpathy称身处智能体十年时代,软件3.0正取代1.0和2.0,大量软件将重写。LLMs有高智能与“认知缺陷”,半自主工具优势多。此外,Sam Altman等嘉宾也分享了AI创业、技术发展等观点。>阅读原文
亚马逊信证实:硅谷AI裁员潮来袭!
亚马逊CEO称AI提效将使公司员工减少。此前Anthropic CEO预警AI将吞噬半数入门级白领工作。如今硅谷AI裁员潮已至,谷歌鼓励员工「买断」,2025届大学生就业也大受影响。>阅读原文
AI模型猜数竟偏好42、73等数字!
技术作家发现GPT - 4o等AI模型猜数偏好42、73等,Andrej Karpathy测试中多选27。网友猜测与数据集、人类偏见有关,AI自己分析也提及心理偏差等,有论文分析此现象。>阅读原文
Sam Altman:GPT-5今夏登场,多领域布局AI
Sam Altman:GPT-5今夏或推出,命名方式或调整;“星际之门”项目解决算力瓶颈;重视超级智能,与Jony Ive合作开发AI硬件;捍卫用户隐私,对广告谨慎,建议年轻人学用AI并培养软技能。>阅读原文
谢赛宁团队新基准,大模型编程测试全军覆没
谢赛宁团队推出LiveCodeBench Pro基准测试,参赛大模型全得0分。表现最佳模型难题通过率为0,依赖工具增强。团队超半数是华人,每季度发新评估集。>阅读原文
Sedai获2000万美元融资,发力云优化
AI Agent平台Sedai获2000万美元B轮融资。它聚焦云优化,节省成本效果显著,2024年收入增长7倍。计划扩大平台、引入新功能,还会在新任首席收入官领导下扩大市场团队。>阅读原文
产品应用
iMeanAI:后训练技术跑通AI Agent困境
弘睿认为当前通用Agent难落地解决复杂问题,iMeanAI用后训练技术跑通‘最后一公里’。经测试其表现出色,技术架构和进化引擎有效,让用户从繁琐规划中解放,1.0版已公测。>阅读原文
蚂蚁Ming - Omni:多模态AI新突破
蚂蚁推出多模态统一框架Ming - Omni,解决多模态训练难题,采用分阶段预训练提升性能,可用于图像、音频生成和多模态交互,推动多模态AI发展。>阅读原文
MiniMax Agent:AI Agent 时代的弯道超车者
2025 年 AI Agent 开始解决真实问题。MiniMax Agent 在 PPT 制作、网页生成、复杂任务处理上表现优异,得益于多模态技术、长上下文窗口及智能体协作等优势,已弯道超车。>阅读原文
字节押注AI Coding,TRAE改写开发者生态
字节跳动在原动力大会主推AI编程产品TRAE,月活超百万。AI Coding可提升大模型能力,助字节实现AGI。TRAE更新功能,未来或独立开发软件,降低开发门槛,促进行业生态多元化。>阅读原文
地瓜机器人:智驾经验解机器人新难题
2024年具身智能成热点,地瓜机器人将智驾经验用于机器人。胡春旭称当下分层架构落地更快,其推出RDK S100套件,适配多场景,还搭建具身智能底座应对数据与应用难题。>阅读原文
让Claude Code成团队“正式员工”的秘诀
作者分享让Claude Code融入团队的方法,包括基础设置、使用技巧、审查代码等。提醒避免“兔子洞问题”,不用它做UI等工作,虽还在摸索,但已开始信任它。>阅读原文
国产AI复刻吉卜力风游戏视频,AI改写游戏业
Reddit热榜吉卜力风格游戏视频引关注。文章用即梦3.0等国产AI复刻,还给出提示词。AI进化为游戏产业带来颠覆可能,改变开发流程和玩家体验,但也面临算力、版权等挑战。>阅读原文
同程 DeepTrip:重塑旅行决策的 Agent
同程旅行推出 DeepTrip 垂类旅行 Agent,它能解决旅行决策难题,构建服务生态。团队综合考量选 Agent 架构,在 Agent Loop、Tool Using、模型训练等方面有实践,未来将多维度拓展。>阅读原文
MiniMax Hailuo 02:攻克体操难题的AI视频模型
MiniMax发布Hailuo 02视频模型,它能生成复杂肢体动作,解决体操难题,在同类模型测评中表现出色,还支持1080P且价格实惠,有望打破AI视觉难题。>阅读原文
推荐文章
自变量机器人:统一架构解锁具身多模态推理
自变量机器人指出,现有机器人具身智能有局限,传统多模态系统割裂。其提出统一架构,通过统一表示学习和多任务生成,实现具身多模态推理,让机器人像人类般与世界交互。>阅读原文
图解vllm v1:KVCacheManager与Prefix Caching
文章围绕vllm v1,指出其调度不再区分prefill和decode,从token粒度处理请求。详细介绍Prefix Caching节省显存原理,以及KVCacheManager管理机制,还说明了block分配释放策略与流程。>阅读原文
手把手教你用AI制作爆款视频
歸藏教你做AI视频,先以NotebookLM分析爆款,再用Gemini拓展创意,给出提示词模板。借助Veo3降低成本,可在Gemini或FLOW生成视频,最后用剪映合并处理,未来视频类Agent或助力生产。>阅读原文
一文讲清统计学与机器学习的区别
文章指出统计学和机器学习目的有别,统计模型重推断变量关系,机器学习重预测。线性回归中二者表现不同,且机器学习基于统计学但涉及多领域,选方法要依目标而定。>阅读原文
MCP:为 LLM 赋能的低成本协议
灰宇介绍 MCP,它是连接 LLM 与外部能力的协议,能突破 LLM 能力边界。和 Function Calling 比,MCP 成本低,让业务团队可参与构建智能体,虽有问题待解决,但值得关注。>阅读原文
袋鼠帝精选10个神级AI工作流模板
袋鼠帝从n8n的2598个模板中精选10个实用工作流,涵盖WhatsApp聊天机器人、网站安全检查等场景。这些模板免费且今年新开发,能提升效率,还可提升AI生成工作流质量,文末可自取文件。>阅读原文
vivo 分享千卡 GPU 训练多模态大模型经验
vivo AI 架构师王兆雄分享多模态大模型训练经验。指出理解与生成类模型训练差异,介绍 Al Infra 四大优化方向。通过对 LLaVA 和 DiT 模型优化,实现性能显著提升,还展望 AI Infra 未来发展。>阅读原文
白杨SEO:AI时代内容创作做流量仍重要
白杨SEO认为,创作者是否困于平台算法取决于自身获取信息方式。AI时代,创作者做流量仍重要,因AI有局限。破局需理解搜索流量价值、找到用户需求、结合搜索与推荐。>阅读原文
开源动态
清华SageAttention3:FP4量化5倍加速且支持8比特训练
清华陈键飞团队推出SageAttention3,针对BlackWell架构,FP4量化推理加速5倍,首次支持8比特训练。在多模型上精度佳,能加速长序列模型,不过8比特训练在预训练任务有差距待研究。>阅读原文
港城大、华为:低成本训练一流视频模型
港城大与华为合作推出 Pusa 项目,基于 FVDM 理论,仅 500 美金训练成本就能微调预训练视频模型,效果超官方,成本降超 200 倍、数据减超 2500 倍,代码已开源。>阅读原文
TaskingAI:开发者认可的AI Agent平台
TaskingAI是被开发者认可的AI Agent平台,整合多模块提供一站式BaaS体验。它支持多模型,功能丰富,架构有优势,适用于客服、销售等场景,与同类相比模块丰富、易组装,降低开发门槛。>阅读原文
算法论文
英伟达港大GSPN:图像计算加速84倍
英伟达、港大等团队提出GSPN新型视觉注意力机制,用线性扫描和稳定性 - 上下文条件处理图像,降低复杂度至√N,在多视觉任务性能先进,生成16K图像加速超84倍。>阅读原文
OpenAI找到控制AI善恶的开关
OpenAI:训练模型在一个领域答错题,会使它在其他领域“学坏”,此为涌现式失调。找到毒性人格特征这个“开关”,还给出检测、纠正办法,提出早期预警系统构想。>阅读原文
弗吉尼亚理工LensLLM入选ICML 2025
弗吉尼亚理工大学:推出选型框架LensLLM,基于新泛化界限推导,能预测微调性能、解释“玄学现象”,降低近90%成本,还可用于边缘部署等场景。>阅读原文
LiveCodeBench Pro:戳破AI编程神话泡沫
国际奥赛金牌团队测试20个顶级大模型,在新编程赛题中高难度题AI通过率0%。旧评测有数据污染等问题,新评测发现AI在多方面有缺陷,需加强多步推理等训练。>阅读原文
字节Seed:SeqPO - SiMT突破同传权衡难题
香港中文大学、字节跳动Seed和斯坦福大学团队:提出SeqPO - SiMT框架解决同传“质量 - 延迟”权衡问题,在70亿参数规模达SOTA,译文质量媲美Qwen - 2.5 - 7B离线翻译。>阅读原文
RAG+:教会AI用知识,推理能力大跃升
传统RAG技术在复杂推理领域易翻车,RAG+新增应用案例库与知识库构成双料库。实验显示,其在数学、法律、医疗场景表现优异,未来还将有动态应用库等方向。>阅读原文
谷歌Gemini 2.5 Pro玩宝可梦,找出30年代码Bug
谷歌在Gemini 2.5系列技术报告中介绍Gemini 2.5 Pro玩《宝可梦蓝》,它通关游戏,展现出创造力和长期规划能力,还发现30年前代码Bug,但也存在混淆版本、思维定势等问题,Claude 4已加入比赛。>阅读原文
华为CloudMatrix384跑DeepSeek效率超英伟达
华为团队论文公开,在CloudMatrix 384超节点部署DeepSeek大模型,性能指标超英伟达体系。架构有三重通信平面,软件栈适配,还提出推理优化方案,为大模型部署提供新路径。>阅读原文
新单应矩阵分解:计算量减95%,加速数十倍
东华大学等团队提出SKS和ACA单应矩阵分解,相比通用方法计算量减超95%,可用于二维码扫描等应用。实验显示,ACA分解四点单应计算平均仅17纳秒,SKS和ACA分别实现29倍和43倍加速。>阅读原文
美7000万人职场或被AI智能体颠覆
斯坦福团队研究美国劳动力,发现职场AI存在需求与能力错配,约46.1%任务工人愿AI接手,工人更倾向人机平等协作,未来人际沟通等技能将更重要。>阅读原文
HOIDiNi:一句话驱动虚拟人高精度操作物体
特拉维夫大学:HOIDiNi是文本驱动扩散框架,引入DNO优化,分两阶段生成人体 - 物体交互动作,能兼顾真实与物理正确,但泛化和速度待提升。>阅读原文
普林斯顿&Meta:单GPU搞定高清长视频生成
普林斯顿与Meta推出LinGen框架,用线性复杂度MATE模块替换DiT自注意力模块。实验显示其视频质量优、效率高,在预训练阶段对DiT优势明显,能在单卡实现分钟级视频生成。>阅读原文
谢赛宁团队新基准:大模型竞赛编程能力欠佳
纽约大学等机构研究者提出LiveCodeBench Pro,评估前沿大模型。发现当前模型在无外部工具时表现差,处理复杂推理欠佳,多次尝试能提升性能但高难度仍失败,推理能力在不同类别提升有差异。>阅读原文
</p>