All in AI,看见未来。 每天精选最值得读的AI文章,帮你筛掉时代的噪音。 以简讯见广度,以深读见洞察。 技术、趋势、思考,一站式掌握AI世界。 欢迎关注公众号「AI Reading Hub」,获取更多AI资讯和技术文章。
2025-07-04 资讯日报
新闻资讯
LinkedIn:90% 应用迁移,弃 Kafka 用 Northguard
领英工程师称,Kafka 在其规模下难管理,宣布用 Northguard 取代它,还有 Xinfra 辅助迁移。超 90% 应用已完成迁移,领英还会探索开源 Northguard 和 Xinfra 的可能性。>阅读原文
谷歌发布免费AI教育功能,重塑课堂!
谷歌发布超50项免费AI教育功能,以Gemini为核心集成到课堂。有生成教案、推荐资源等功能,通过教师主导解决安全问题,还上线数据分析工具,让AI赋能教师。>阅读原文
小扎143亿请新贵,Meta员工冰火两重天
小扎花143亿为Meta引入Alexandr Wang任首席AI官,或让LeCun向其汇报。Meta老员工因GPU受限研究难推进,科技圈有人年薪上亿,有人被裁,AI圈差异明显。>阅读原文
AI滥用符号,正绞杀语文表达
作者指出,社交媒体上AI生成内容滥用破折号和双引号,人类为区分AI,可能放弃这些符号。这形成闭环,导致语言丰富性、精确性受损,AI正绞杀语文。>阅读原文
Meta挖角致Ilya被迫当SSI CEO
Meta挖走SSI联创Daniel,Ilya被迫当CEO。Ilya拒收购,与Daniel分歧显现。Ilya坚守构建安全超智能目标,SSI估值320亿美元,融资数十亿。>阅读原文
美国EDA三巨头解禁,国产芯片设计迎转机
美商务部:取消全球EDA三巨头向中国销售产品许可证要求。此前限制阻碍中国芯片设计,虽此次放宽让产业获喘息,但国产EDA面临技术、资金难题,未来仍有不确定性。>阅读原文
Jason Wei:AI自我训练有三大瓶颈
OpenAI研究员Jason Wei:AI自我完善是未来,但不会‘瞬间爆发’。自我完善需大量试错,不同领域难度有别,且科学进步受真实世界实验限制,发展难‘快速起飞’。>阅读原文
腾讯香农实验室获CVPR 2025视频增强赛冠军
腾讯TEG香农实验室在CVPR 2025 UGC Video Enhancement夺冠,其自研算法解决UGC视频退化问题。还参加实时赛道获佳绩,做硬件推理优化,未来将探索扩散模型在视频处理的应用。>阅读原文
Gemini负责人揭秘多模态技术亮点
Gemini模型行为产品负责人Ani Baddepudi爆料,Gemini因构建AGI需多模态能力,设计为原生多模态。Gemini 2.5解决视频理解鲁棒性问题,有正向迁移和能力整合,团队还关注产品自然交互性。>阅读原文
台积电:CoPoS将取代CoWoS成封装主流
台积电:CoPoS将成CoWoS接班人,用面板基板换硅中介层,突破封装瓶颈。已启动试点线,预计2027年小量产。大陆也有SDSoW技术破局。>阅读原文
Linux基金会:开源推动AI创新与经济增长
Linux基金会首席经济学家Frank Nagle:AI加入让开源价值评估改变,计算开源AI价值复杂。参与开源项目可增加经济价值,回馈社区的企业使用开源软件生产力更高。>阅读原文
印度老哥假简历领5份硅谷AI工资
印度老哥Soham Parekh用假简历远程兼5份硅谷AI工作被曝光,老板们控诉,网友造梗。同时发现r/overemployed社区有不少OE情况,OE利弊值得思考。>阅读原文
国产GPU企业排队IPO,谁能成“中国英伟达”?
国产GPU企业迎上市潮,摩尔线程、沐曦等递交申请。政策松动、美出口管制带来机遇,但竞争激烈。目前营收与亏损齐飞,未来需解决产能问题,构建生态,错位竞争或带来差异化机会。>阅读原文
Ilya 10年前预言深度学习前景
Ilya在2015年就对深度学习有深刻见解。他认为机器学习违反数学直觉,监督学习是成功领域,神经网络目标函数复杂,深度学习追求‘够好’,初始化尺度影响模型可训性。>阅读原文
Ilya Sutskever 自任 SSI CEO,联创被 Meta 挖走
Ilya Sutskever:自 6 月 29 日起,Daniel Gross 退出 SSI,我任 CEO,将继续构建安全的超级智能。Daniel Gross:期待 SSI 未来创造奇迹。Meta 或挖走 Gross 负责人工智能产品。>阅读原文
Ilya出任SSI CEO,拒320亿收购逐联创
Ilya官宣任SSI CEO,赶走跳槽Meta的联创。他拒绝Meta 320亿美元收购,称有算力团队,要构建安全超级智能。SSI使命与OpenAI商业化方向不同,Ilya是超级智能的引领者。>阅读原文
上下文工程成AI新热点!
机器之心报道:「上下文工程」成新热点,它与「提示词工程」不同,核心是构建自动化系统为模型提供输入。还介绍了核心要素和实践方法论,可参考 Langchain 博客和视频。>阅读原文
Cloudflare:AI爬虫爬网页先交钱!
Cloudflare推出“按爬取付费”实验,新注册网站默认拒AI爬虫,爬虫付费才能访问。这或让创作者获利,却增加AI成本,还可能引发竞争、分化等连锁反应,结局有共赢、分裂、对抗三种可能。>阅读原文
Ilya掌舵SSI,与Gross理念分歧分道扬镳
Ilya发内部信,称Daniel Gross离开SSI,自己任CEO。有公司欲收购,Gross或因想快速变现与Ilya打造安全超级智能的理念不合而离开,SSI坚持初心专注安全。>阅读原文
生物学家:肝脏或有独立意识
生物学家Michael Levin称体内器官如肝脏可能有独立意识,团队正用AI构建翻译器与之交流。意识是连续光谱,研究将改变我们与身体关系及对生命的理解。>阅读原文
神秘模型steve现身,DeepSeek-R2再度延期
大模型竞技场现神秘模型steve,自称来自DeepSeek,网友猜测其身份。与此同时,DeepSeek的R2因CEO不满和可能缺芯片再度延期,此前人们早有R2上线的期待。>阅读原文
AGICamp发布第001周AI应用榜
AGICamp创始人霍太稳:6月27日发布第001周AI应用榜,上线14个应用。暂不推日榜,周二发周榜,评论权重高于点赞。邀开发者参与,修复Bug并同步进展。>阅读原文
00 后 AI 创业者 2 个月实现 600 万美金 ARR
00 后创业者 Roy Lee 创办的 Cluely 前身是作弊插件,后成 AI 助手平台。靠病毒营销、用户数据迭代等,2 个月实现 600 万美金 ARR,虽有争议,但展现了 AI 与 GenZ 传播融合的潜力。>阅读原文
产品应用
百度搜索大改版,MCP 引领新变革
百度搜索大改版,搜索框升级为智能框,支持多模态输入。还推出百看、智能创作等功能,接入超 1.8 万 + 优质 MCP,推动产品能力转变,探索多元盈利模式,MCP 或带来新商机。>阅读原文
阿里云:Agent 助力客服业务提效
阿里云算法专家姜剑分享客服 Agent 提效实践。介绍 Agent 技术本质、模式,指出其能变革研发范式等。分析阿里云客服痛点,给出解决设计问题的办法,展示平台成果,强调 Agent 选型依场景而定。>阅读原文
DeepSeek助力,AI医疗兴起破鼻炎难题
作者患20年鼻炎,以往治疗效果差,用DeepSeek获推荐喷剂后症状改善。AI造影能辅助医疗,国外巨头推出AI医生,诊断正确率达85%,AI医疗正兴起,提高诊疗效率与准确度。>阅读原文
夸克:高考志愿垂类场景深度研究实践
夸克在高考志愿填报场景应用“深度研究”能力,推出“志愿报告”功能,已生成超1000万份报告。其通过构建数据库和自研模型降低幻觉率,还在医疗、教育等场景有积累,有望成实用AI助手。>阅读原文
Shortcut:Excel Agent新势力但有局限
Shortcut是首个超越人类的Excel Agent,能快速解决Excel难题、处理金融建模任务。不过它有格式化、对话等局限,实测简单任务表现好,复杂任务易‘宕机’,发展仍有长路。>阅读原文
推荐文章
AI助力Rax到React组件迁移提效
作者在M站首页重构中,用AI+Code加速Rax到React组件迁移、DX到React跨端重写。AI提效显著,模式识别等能力强,但样式把控、业务理解有局限。后续要建立流程、培养协作能力。>阅读原文
用vllm AsyncLLM做异步推理揭秘
因异步RL讨论热,文章探究用vllm做异步二次开发。单条请求处理分三阶段,并发执行可提升效率。多个请求也由event loop并发调度,构建异步推理引擎用AsyncLLM + async for
或可行。>阅读原文
用dive剖析Docker镜像臃肿问题
Chirag Agrawal指出,AI项目中未优化的Docker镜像会致开发慢、成本高、安全风险大。以朴素BERT分类器镜像为例,可用dive工具剖析,找出如依赖项、基础镜像等臃肿处,进而优化。>阅读原文
吴恩达:AI项目可缩小规模快速起步
吴恩达建议,若AI项目时间紧,可缩小规模。如他做“听众模拟器”,用编程助手在有限时间完成基础版,不仅推进项目,还获反馈,起步进展能助判断是否继续投入。>阅读原文
金现代赵鹏程:低代码与AI融合驱动企业转型
金现代赵鹏程称,复杂ToB场景中低代码与AI差异化协同,角色从‘降本增效’向‘协同中枢’演变。金现代助企业沉淀AI能力,有日照钢铁、青岛地铁等案例,未来将深耕行业、加强合作。>阅读原文
复旦博士生分享多模态大模型研究成果
复旦博士生王思尹将分享多模态大模型研究。构建数据集揭示跨模态风险盲区;提出VisuoThink框架让视觉参与推理;研究视觉驱动世界建模机制,实现高效行为规划。>阅读原文
Leonie:分享37条信息检索硬核经验
Leonie:在向量数据库公司工作两年,总结37条检索经验,从BM25到RAG,涉及各类技术细节。指出技术进步但核心是找相关信息,应选合适工具而非追新。>阅读原文
Davis Treybig:揭秘2025 AI产业现状与未来
Davis Treybig报告指出,2025年AI产业迭代快,模型成本高、折旧快,推理能力成关键。应用渗透各行业,智能体崛起,市场资本集中,公司运作向AI转型,数据服务、创意工具等领域有新机遇。>阅读原文
吴恩达:一小时搞定AI项目起步
吴恩达分享AI开发实践技巧,建议开发者缩小项目范围,用一小时完成最小组件。他以自身周末项目为例,说明此方法能推进实践、获取反馈,避免‘想多做少’。>阅读原文
万字指南:本地LLM多模型实测
新智元实测本地LLM,用Dell Precision 7960工作站测试主流模型。指出32B/70B中档模型可满足多数企业需求,给出不同卡数、模型及场景的配置与batch size建议,还对70B的FP16和FP8版本使用给出建议。>阅读原文
开源动态
OmniGen2升级!开源图像生成模型实力大增
智源研究院发布OmniGen2,增强理解、生成能力,打通多模态生态。玩法靠提示词解锁,有分离架构等创新,引入反思机制和新基准,推理效率提32%,将全面开源。>阅读原文
Skywork-Reward-V2开源,刷新七榜SOTA
新智元报道,Skywork-Reward-V2发布,用4000万样本炼出“AI读心术”。它刷新七榜SOTA,8款模型小体积有大性能。团队构建高质量数据,让奖励模型更懂人类偏好,背后是全产业链布局的昆仑万维。>阅读原文
腾讯AI Lab:VScan加速视觉语言模型推理
腾讯AI Lab联合CMU提出VScan解决视觉语言模型推理难题。它有两阶段筛选机制,能在不损性能下加速推理,实验显示其在多模型和任务中表现优异,代码已开源。>阅读原文
智源发布OmniGen2,开源解锁AI绘图新玩法
2024年9月智源推OmniGen,现升级为OmniGen2并开源。它架构简洁,有分离式架构与双编码器策略、反思机制。玩法多,还推出OmniContext基准,依托FlagScale优化部署。>阅读原文
TNG开源DeepSeek R1增强版,推理快200%
德国TNG公司:开源DeepSeek R1增强版Chimera,基于三大模型开发,用AoE架构,推理效率快200%、成本大降,在测试中表现佳。AoE利用MoE构建子模型,优化合并过程。>阅读原文
全新开源LongAnimation解决长篇动画上色难题
中国科学技术大学团队针对长篇动画上色难题,提出动态全局 - 局部范式,构建LongAnimation框架。它能动态提取全局配色特征,确保色彩和风格统一,还可生成背景,为动画自动化制作带来新可能。>阅读原文
Agent - MCP:多Agent协同的革命性框架
小G介绍 Agent - MCP 框架,它专为经验丰富的 AI 开发者打造,能解决传统 AI 开发的上下文混乱等问题,有并行开发、持久化知识图谱等亮点,提升开发效率。>阅读原文
OPPO TaskCraft:破解智能体数据稀缺难题
OPPO 研究院针对智能体训练缺数据问题提出 TaskCraft 框架。它能自动生成任务,构建开源数据集。实验显示其提升了任务生成效率和模型性能,在多指标上优于对比方式。>阅读原文
Nanobrowser:开源免费的网页自动化神器
开源君推荐Nanobrowser,它是基于Chrome扩展的AI网页自动化工具,多智能体协作,免费开源保隐私。可按自然语言指令完成任务,已获9.5K star,简单好用,懂打工人痛点。>阅读原文
算法论文
北邮:大模型长链推理反思越深错误越真
北邮团队研究发现,推理大模型长链推理时错误会滚雪球式放大,反思会加重幻觉。团队构建受控知识域研究,结果显示现有干预难除幻觉,模型应对能力不足。>阅读原文
MLA-Trust:首个 GUI 多模态大模型智能体评测框架
MLA-Trust 是首个 GUI 多模态大模型智能体可信评测框架。研究构建四维度评估体系,评估 13 个模型,揭示其可信度风险,倡导“可信自治”原则,还指出未来研究方向。>阅读原文
华为FoT破大模型数学瓶颈,准确率超97%
华为诺亚方舟实验室提出思维森林(FoT)框架破解大模型数学瓶颈。它借鉴人类认知,并行构建推理树。在GSM8K等任务中,结合FoT的模型准确率超先进模型,将在ICML 2025开源。>阅读原文
Nature子刊:脑图可测衰老速度
Nature子刊研究推出DunedinPACNI指标,通过脑MRI数据预测衰老速度。多维度实验证实其有效,能预测认知衰退、痴呆、海马体萎缩等,还可评估整体健康及疾病死亡风险。>阅读原文
LeCun团队:LLM极致压缩牺牲语义细节
斯坦福与纽约大学联合研究,LeCun团队提出信息论框架对比LLM和人类语义压缩。选30+LLMs,发现LLM语义组织有基本能力,但难处理细粒度差异,侧重统计压缩,人类重细节语境。>阅读原文
谢赛宁团队:不用提示词精准控3D画面
谢赛宁团队发布Blender Fusion框架,结合图形与扩散模型,通过分离物体、3D编辑、生成图像三步实现精准画面控制,还透露训练技巧提升效果,让AI生图玩法更自由。>阅读原文
新方法高效深度修剪大语言模型
论文提出基于滑动层合并的大模型深度修剪方法,分析层间相关性,动态融合连续层。实验表明该方法在零样本推理和再训练恢复上优于现有技术,还可与宽度修剪结合提升效果。>阅读原文
vivo GenieBlue:突破手机AI部署难题
vivo AI研究院等团队提出GenieBlue方案,攻克现有MLLM在手机端部署难题。它绕开MoE架构限制,在骁龙8 Elite手机流畅运行,保持纯语言能力,实现有竞争力的多模态表现。>阅读原文
Graph+AI Agents研究进展综述
最新综述研究:提出分类框架梳理Graph与AI Agents结合领域进展,阐述图技术在AI代理规划、执行、记忆、多代理协调等功能中的作用,还点明应用、挑战与机遇。>阅读原文
阿里达摩院:WorldVLA融合双模型表现出色
阿里巴巴达摩院提出 WorldVLA,融合世界与动作模型,统一多模态理解生成。用独立编码器处理数据,提出动作注意力掩码策略解决误差累积。在实验中,相比传统模型表现更优。>阅读原文
</p>