2026-05-30 | 共 10 条精选
今日速览
- 模型发布 | 谷歌晒出9个视频演示Gemini Omni与3.5模型
- 模型发布 | Liquid AI发布8B参数边缘MoE模型,训练数据翻三倍
- 实用工具 | Claude Code推出动态工作流,挑战复杂端到端任务
- 融资动态 | 英伟达200亿美元收购未果,AI芯片公司Groq拟融资6.5亿美元
- 研究论文 | Kog实现单请求每秒3000 token推理,直逼专用硬件
- 开源项目 | 开源项目Tiny-vLLM:C++和CUDA实现的高性能推理引擎
- 开源项目 | Rust实现的文档解析工具LiteParse登顶GitHub热榜
- 行业动态 | Mistral AI Now峰会传递信号:从模型公司转型全栈AI服务商
- 行业动态 | AI初创Shift免费为家庭打扫,只为收集机器人训练数据
- 实用工具 |
1. 谷歌晒出9个视频演示Gemini Omni与3.5模型
分类:模型发布

谷歌AI博客发布了9个演示视频,集中展示在I/O 2026大会上公布的Gemini Omni和Gemini 3.5模型的实际能力。
这些视频涵盖多模态交互、实时推理和复杂任务处理等场景,直观呈现了新版模型在理解和生成方面的提升。谷歌未在博文中披露具体技术参数或性能数据。
编者按:视频演示是技术传播的利器——谷歌用9个精心设计的案例让开发者直观感受模型能力边界,比参数表格更有说服力。
🔗 来源:Google AI Blog | 原文链接
2. Liquid AI发布8B参数边缘MoE模型,训练数据翻三倍
分类:模型发布

Liquid AI发布了LFM2.5-8B-A1B边缘模型,采用混合专家(MoE)架构,上下文窗口扩展至128K,预训练数据从12T tokens增至38T tokens,并经过大规模强化学习优化。
该模型专为消费级硬件上的快速工具调用设计,词汇量翻倍以提升非拉丁语系的token效率,声称能在入门级笔记本上流畅运行。这是继2025年10月LFM2-8B-A1B后的重要迭代。
边缘MoE赛道竞争日趋激烈,微软、谷歌等巨头也在推进小模型策略。Liquid AI主打高效工具调用和本地部署,为开发者和企业提供了私有化部署的轻量化新选择。
编者按:Liquid AI把模型做小、做快、做精的思路,对中小企业和个人开发者格外友好——不必依赖云API就能在本地跑起复杂工具链。
🔗 来源:Hacker News | 原文链接
3. Claude Code推出动态工作流,挑战复杂端到端任务
分类:实用工具

Anthropic在Claude Code中引入动态工作流功能,旨在让AI自主处理原本需要数季度规划的复杂端到端任务。该功能通过动态规划与执行,提升AI在长期项目中的自主性和可靠性。
这是Claude Code在编程助手上的一次重要升级。此前Claude Code已支持代码生成、审查等基础能力,新功能将任务拆解与执行连贯起来,试图解决AI在长周期任务中容易偏离方向的问题。
编者按:动态工作流让Claude从'写代码的助手'变成'管项目的工程师',这对软件工程团队的协作模式可能产生深远影响。
🔗 来源:Hacker News | 原文链接
4. 英伟达200亿美元收购未果,AI芯片公司Groq拟融资6.5亿美元
分类:融资动态
据Axios报道,AI芯片公司Groq计划进行6.5亿美元内部融资,将业务重心从硬件转向AI推理服务——即优化AI模型响应速度的过程。此前英伟达曾试图以约200亿美元收购Groq但未达成交易。
Groq以高性能LPU(语言处理单元)闻名,此次转型意味着其希望直接从AI推理需求爆发中获利,而非仅靠卖芯片。市场对推理专用硬件的需求正在快速增长。
编者按:Groq从卖芯片转向卖服务的路线,有点像当年AWS从硬件转向云计算的逻辑——与其卖铲子,不如开金矿。
🔗 来源:TechCrunch AI | 原文链接
5. Kog实现单请求每秒3000 token推理,直逼专用硬件
分类:研究论文

Kog AI团队展示了一项技术突破:在标准数据中心GPU上,通过架构、引擎与GPU底层代码的协同设计,单请求LLM解码速度达到每秒3000 tokens,接近专用推理硬件的性能水平。
团队指出,LLM推理速度瓶颈在于显存带宽而非算力,当前主流推理栈存在严重的软件瓶颈。他们已开放技术预览,并在playground.kog.ai提供实时测试体验。
编者按:如果Kog的方案能普及,很多企业可能不再需要采购昂贵的专用推理芯片——标准GPU的潜力被严重低估了。
🔗 来源:Hacker News | 原文链接
6. 开源项目Tiny-vLLM:C++和CUDA实现的高性能推理引擎
分类:开源项目
开源项目Tiny-vLLM在GitHub上发布,用C++和CUDA实现了vLLM的缩小版高性能LLM推理引擎,旨在帮助开发者深入理解推理系统的底层原理。
该项目代码完全开源,支持自定义修改和实验,对研究者和工程师来说是学习LLM推理优化的实用参考资源。当前已获400余颗星标。
编者按:Tiny-vLLM降低了推理引擎的学习门槛——想搞懂AI推理底层,最直接的方式是自己动手写一个。
🔗 来源:Hacker News | 原文链接
7. Rust实现的文档解析工具LiteParse登顶GitHub热榜
分类:开源项目
由LlamaIndex团队开发的开源文档解析工具LiteParse今日登上GitHub Trending,该项目用Rust编写,主打快速、易用,当日获701星。
LiteParse旨在提供传统文档解析库的更高效替代方案,在速度和准确性上进行了专门优化。对于需要处理大量PDF、Word等文档的AI应用开发者来说,这是一个值得关注的基础工具。
编者按:文档解析是RAG应用中最容易被忽视的瓶颈——一个更快的解析器能直接提升整个检索管道的质量。
🔗 来源:GitHub Trending | 原文链接
8. Mistral AI Now峰会传递信号:从模型公司转型全栈AI服务商
分类:行业动态
在巴黎举行的Mistral AI Now峰会上,公司传递出明确转型信号:不再只是一家模型公司,而是构建包含算力、模型、平台和咨询的全栈AI服务。Mistral已拥有巴黎40MW数据中心,并计划在瑞典等地扩建。
其差异化策略聚焦高效、开放和可定制的模型,支持私有化本地部署。合作方包括ASML、法国巴黎银行、亚马逊Alexa+等欧洲产业巨头。
编者按:Mistral的欧洲基因决定了它的路线——开放+本地部署,满足企业苛刻的数据主权要求,这是OpenAI做不到的。
🔗 来源:Hacker News | 原文链接
9. AI初创Shift免费为家庭打扫,只为收集机器人训练数据
分类:行业动态

AI初创公司Shift推出免费家庭清洁服务,条件是在用户家中收集数据,用于训练未来的家政机器人。用户只需允许机器人记录清洁过程中的环境和操作数据。
🔗 来源:Hacker News | 原文链接
10.
分类:实用工具

The Verge评测Adobe Firefly AI Assistant后认为,该工具更像一位多任务中间人——能操作设计软件减少琐碎工作,但最终效果平庸,缺乏惊艳感。测试者称其解释逻辑清晰,但产出成果难以令人满意。
🔗 来源:The Verge AI | 原文链接