AI Daily | AI日报：AICon大会：大厂分享研发提效经验; AI算力租赁市场：乱象与回轨之路; 咔皮记账负责人揭秘初创AI APP突围秘诀

All in AI，看见未来。每天精选最值得读的AI文章，帮你筛掉时代的噪音。以简讯见广度，以深读见洞察。技术、趋势、思考，一站式掌握AI世界。欢迎关注公众号「AI Reading Hub」，获取更多AI资讯和技术文章。

2025-06-19 资讯日报

新闻资讯

AICon大会：大厂分享研发提效经验

6月27 - 28日AICon北京站上，大厂技术大牛将分享“AI赋能研发提效”经验。丁宇讲AI编程范式革新，张乐分享腾讯代码智能化实践，同程、百度、网易游戏人员也将分享研发提效做法。>阅读原文

AI算力租赁市场：乱象与回轨之路

雷峰网刘伊伦指出，算力租赁市场问题多，上市公司‘炒概念’，消纳方套壳毁约，租赁方陷入‘囚徒困境’。但市场会淘汰弱企业，国家也有调控，行业有望良性发展。>阅读原文

咔皮记账负责人揭秘初创AI APP突围秘诀

量子位智库AI产品Time访谈节目，6月19日20:00 - 21:00邀请咔皮记账产品负责人张洋。该APP6个月用户破百万，将解析其在小众赛道突围、获活跃高粘性用户的经验。>阅读原文

Meta砸钱挖角OpenAI，发力AI野心大

CNBC消息，Meta为发展AI，以高额条件挖OpenAI员工未成功。此前其旗舰模型发布推迟，近期收购Scale AI部分股份，还从谷歌等挖来顶尖人才，扎克伯格亲自参与招聘。>阅读原文

港科广等发布首个医学世界模型

港科广等团队发布医学世界模型MeWM，能模拟肿瘤演化、规划治疗方案。有肿瘤演变模拟等三核心贡献，实验显示其术后肿瘤生成、生存风险评估、治疗方案筛选能力强，推动精准医疗发展。>阅读原文

AI for Science颠覆药物研发模式

文章认为AI for Science将生命科学与数字互联网结合，加速科研。Foundation Model和AI Agent改变药物研发流程，还以四象限梳理玩家，如深挖单点的生物模型、编排实验的AI Scientist等，展示AI重塑科研的潜力。>阅读原文

Sam Altman：GPT - 5今夏或登场

OpenAI的Sam Altman在专访中表示，GPT - 5可能今夏发布，也可能继续迭代GPT - 4.5；认为每年更多人觉得接近AGI；坚决反对纽约时报保留用户记录要求；还提到星际之门项目等规划。>阅读原文

扎克伯格挖角，奥特曼批 Meta 不懂创新

Meta 扎克伯格为新团队招募 AI 人才，向 OpenAI 等员工提供巨额奖金。奥特曼证实此事，称招聘未成功，批 Meta 不懂创新，还透露 OpenAI 未来将推“AI 伴侣”，整合万事万物。>阅读原文

Mary Meeker：发布 AI 市场最新报告

知名投资分析师 Mary Meeker 发布 AI 市场报告，指出 AI 变革速度快，经济图景复杂，性能持续攀升，新兴能力不断涌现，还将影响劳动力，当下是开发软件应用的黄金时期。>阅读原文

618对话京东三位技术博士，TGT计划引关注

作者618与京东三位技术博士交流。长林优化同品判别系统，采用务实路线；星衍推进物流机械臂项目，打透单一场景；初雪提升语音识别准确率，探索创新方向。京东推TGT计划吸引技术人才。>阅读原文

卢宗青：现阶段世界模型和 VLA 不触及本质

北大卢宗青表示现阶段世界模型和 VLA 不触及本质，认为互联网视频数据是唯一可规模化道路。他创立的 BeingBeyond 标注互联网视频中人类关节动作训练模型，追求通用具身智能的本质解法。>阅读原文

马斯克300亿融资，xAI豪赌AGI

xAI每月烧10亿美元，为应对算力战争，进行巨额融资。马斯克手握自身影响力、X平台数据和自建基础设施三张王牌，xAI预计2027年盈利，目标是创造AGI。>阅读原文

罗永浩数字人直播618战绩超真人

今年618，百度电商的罗永浩数字人直播表现出色，带货单量超真人首秀。它由慧播星打造，有四大突破，靠多模协同技术。数字人技术门槛降低，助中小商家订单量增长，百度还发布计划扶持。>阅读原文

Andrej Karpathy：软件3.0时代来临

Andrej Karpathy称身处智能体十年时代，软件3.0正取代1.0和2.0，大量软件将重写。LLMs有高智能与“认知缺陷”，半自主工具优势多。此外，Sam Altman等嘉宾也分享了AI创业、技术发展等观点。>阅读原文

亚马逊信证实：硅谷AI裁员潮来袭！

亚马逊CEO称AI提效将使公司员工减少。此前Anthropic CEO预警AI将吞噬半数入门级白领工作。如今硅谷AI裁员潮已至，谷歌鼓励员工「买断」，2025届大学生就业也大受影响。>阅读原文

AI模型猜数竟偏好42、73等数字！

技术作家发现GPT - 4o等AI模型猜数偏好42、73等，Andrej Karpathy测试中多选27。网友猜测与数据集、人类偏见有关，AI自己分析也提及心理偏差等，有论文分析此现象。>阅读原文

Sam Altman：GPT-5今夏登场，多领域布局AI

Sam Altman：GPT-5今夏或推出，命名方式或调整；“星际之门”项目解决算力瓶颈；重视超级智能，与Jony Ive合作开发AI硬件；捍卫用户隐私，对广告谨慎，建议年轻人学用AI并培养软技能。>阅读原文

谢赛宁团队新基准，大模型编程测试全军覆没

谢赛宁团队推出LiveCodeBench Pro基准测试，参赛大模型全得0分。表现最佳模型难题通过率为0，依赖工具增强。团队超半数是华人，每季度发新评估集。>阅读原文

Sedai获2000万美元融资，发力云优化

AI Agent平台Sedai获2000万美元B轮融资。它聚焦云优化，节省成本效果显著，2024年收入增长7倍。计划扩大平台、引入新功能，还会在新任首席收入官领导下扩大市场团队。>阅读原文

产品应用

iMeanAI：后训练技术跑通AI Agent困境

弘睿认为当前通用Agent难落地解决复杂问题，iMeanAI用后训练技术跑通‘最后一公里’。经测试其表现出色，技术架构和进化引擎有效，让用户从繁琐规划中解放，1.0版已公测。>阅读原文

蚂蚁Ming - Omni：多模态AI新突破

蚂蚁推出多模态统一框架Ming - Omni，解决多模态训练难题，采用分阶段预训练提升性能，可用于图像、音频生成和多模态交互，推动多模态AI发展。>阅读原文

MiniMax Agent：AI Agent 时代的弯道超车者

2025 年 AI Agent 开始解决真实问题。MiniMax Agent 在 PPT 制作、网页生成、复杂任务处理上表现优异，得益于多模态技术、长上下文窗口及智能体协作等优势，已弯道超车。>阅读原文

字节押注AI Coding，TRAE改写开发者生态

字节跳动在原动力大会主推AI编程产品TRAE，月活超百万。AI Coding可提升大模型能力，助字节实现AGI。TRAE更新功能，未来或独立开发软件，降低开发门槛，促进行业生态多元化。>阅读原文

地瓜机器人：智驾经验解机器人新难题

2024年具身智能成热点，地瓜机器人将智驾经验用于机器人。胡春旭称当下分层架构落地更快，其推出RDK S100套件，适配多场景，还搭建具身智能底座应对数据与应用难题。>阅读原文

让Claude Code成团队“正式员工”的秘诀

作者分享让Claude Code融入团队的方法，包括基础设置、使用技巧、审查代码等。提醒避免“兔子洞问题”，不用它做UI等工作，虽还在摸索，但已开始信任它。>阅读原文

国产AI复刻吉卜力风游戏视频，AI改写游戏业

Reddit热榜吉卜力风格游戏视频引关注。文章用即梦3.0等国产AI复刻，还给出提示词。AI进化为游戏产业带来颠覆可能，改变开发流程和玩家体验，但也面临算力、版权等挑战。>阅读原文

同程 DeepTrip：重塑旅行决策的 Agent

同程旅行推出 DeepTrip 垂类旅行 Agent，它能解决旅行决策难题，构建服务生态。团队综合考量选 Agent 架构，在 Agent Loop、Tool Using、模型训练等方面有实践，未来将多维度拓展。>阅读原文

MiniMax Hailuo 02：攻克体操难题的AI视频模型

MiniMax发布Hailuo 02视频模型，它能生成复杂肢体动作，解决体操难题，在同类模型测评中表现出色，还支持1080P且价格实惠，有望打破AI视觉难题。>阅读原文

开源动态

清华SageAttention3：FP4量化5倍加速且支持8比特训练

清华陈键飞团队推出SageAttention3，针对BlackWell架构，FP4量化推理加速5倍，首次支持8比特训练。在多模型上精度佳，能加速长序列模型，不过8比特训练在预训练任务有差距待研究。>阅读原文

港城大、华为：低成本训练一流视频模型

港城大与华为合作推出 Pusa 项目，基于 FVDM 理论，仅 500 美金训练成本就能微调预训练视频模型，效果超官方，成本降超 200 倍、数据减超 2500 倍，代码已开源。>阅读原文

TaskingAI：开发者认可的AI Agent平台

TaskingAI是被开发者认可的AI Agent平台，整合多模块提供一站式BaaS体验。它支持多模型，功能丰富，架构有优势，适用于客服、销售等场景，与同类相比模块丰富、易组装，降低开发门槛。>阅读原文

算法论文

英伟达港大GSPN：图像计算加速84倍

英伟达、港大等团队提出GSPN新型视觉注意力机制，用线性扫描和稳定性 - 上下文条件处理图像，降低复杂度至√N，在多视觉任务性能先进，生成16K图像加速超84倍。>阅读原文

OpenAI找到控制AI善恶的开关

OpenAI：训练模型在一个领域答错题，会使它在其他领域“学坏”，此为涌现式失调。找到毒性人格特征这个“开关”，还给出检测、纠正办法，提出早期预警系统构想。>阅读原文

弗吉尼亚理工LensLLM入选ICML 2025

弗吉尼亚理工大学：推出选型框架LensLLM，基于新泛化界限推导，能预测微调性能、解释“玄学现象”，降低近90%成本，还可用于边缘部署等场景。>阅读原文

LiveCodeBench Pro：戳破AI编程神话泡沫

国际奥赛金牌团队测试20个顶级大模型，在新编程赛题中高难度题AI通过率0%。旧评测有数据污染等问题，新评测发现AI在多方面有缺陷，需加强多步推理等训练。>阅读原文

字节Seed：SeqPO - SiMT突破同传权衡难题

香港中文大学、字节跳动Seed和斯坦福大学团队：提出SeqPO - SiMT框架解决同传“质量 - 延迟”权衡问题，在70亿参数规模达SOTA，译文质量媲美Qwen - 2.5 - 7B离线翻译。>阅读原文

RAG+：教会AI用知识，推理能力大跃升

传统RAG技术在复杂推理领域易翻车，RAG+新增应用案例库与知识库构成双料库。实验显示，其在数学、法律、医疗场景表现优异，未来还将有动态应用库等方向。>阅读原文

谷歌Gemini 2.5 Pro玩宝可梦，找出30年代码Bug

谷歌在Gemini 2.5系列技术报告中介绍Gemini 2.5 Pro玩《宝可梦蓝》，它通关游戏，展现出创造力和长期规划能力，还发现30年前代码Bug，但也存在混淆版本、思维定势等问题，Claude 4已加入比赛。>阅读原文

华为CloudMatrix384跑DeepSeek效率超英伟达

华为团队论文公开，在CloudMatrix 384超节点部署DeepSeek大模型，性能指标超英伟达体系。架构有三重通信平面，软件栈适配，还提出推理优化方案，为大模型部署提供新路径。>阅读原文

新单应矩阵分解：计算量减95%，加速数十倍

东华大学等团队提出SKS和ACA单应矩阵分解，相比通用方法计算量减超95%，可用于二维码扫描等应用。实验显示，ACA分解四点单应计算平均仅17纳秒，SKS和ACA分别实现29倍和43倍加速。>阅读原文

美7000万人职场或被AI智能体颠覆

斯坦福团队研究美国劳动力，发现职场AI存在需求与能力错配，约46.1%任务工人愿AI接手，工人更倾向人机平等协作，未来人际沟通等技能将更重要。>阅读原文

HOIDiNi：一句话驱动虚拟人高精度操作物体

特拉维夫大学：HOIDiNi是文本驱动扩散框架，引入DNO优化，分两阶段生成人体 - 物体交互动作，能兼顾真实与物理正确，但泛化和速度待提升。>阅读原文

普林斯顿&Meta：单GPU搞定高清长视频生成

普林斯顿与Meta推出LinGen框架，用线性复杂度MATE模块替换DiT自注意力模块。实验显示其视频质量优、效率高，在预训练阶段对DiT优势明显，能在单卡实现分钟级视频生成。>阅读原文

谢赛宁团队新基准：大模型竞赛编程能力欠佳

纽约大学等机构研究者提出LiveCodeBench Pro，评估前沿大模型。发现当前模型在无外部工具时表现差，处理复杂推理欠佳，多次尝试能提升性能但高难度仍失败，推理能力在不同类别提升有差异。>阅读原文

    </p>

官网：www.AiReadingHub.com