衍辉AI速递 5.30｜谷歌发布Gemini Omni与3.5演示视频等10条AI资讯谷歌AI博客发布了9个演示视频，集

2026-05-30 | 共 10 条精选

今日速览

模型发布 | 谷歌晒出9个视频演示Gemini Omni与3.5模型
模型发布 | Liquid AI发布8B参数边缘MoE模型，训练数据翻三倍
实用工具 | Claude Code推出动态工作流，挑战复杂端到端任务
融资动态 | 英伟达200亿美元收购未果，AI芯片公司Groq拟融资6.5亿美元
研究论文 | Kog实现单请求每秒3000 token推理，直逼专用硬件
开源项目 | 开源项目Tiny-vLLM：C++和CUDA实现的高性能推理引擎
开源项目 | Rust实现的文档解析工具LiteParse登顶GitHub热榜
行业动态 | Mistral AI Now峰会传递信号：从模型公司转型全栈AI服务商
行业动态 | AI初创Shift免费为家庭打扫，只为收集机器人训练数据
实用工具 |

1. 谷歌晒出9个视频演示Gemini Omni与3.5模型

分类：模型发布

谷歌晒出9个视频演示Gemini Omni与3.5模型

谷歌AI博客发布了9个演示视频，集中展示在I/O 2026大会上公布的Gemini Omni和Gemini 3.5模型的实际能力。

这些视频涵盖多模态交互、实时推理和复杂任务处理等场景，直观呈现了新版模型在理解和生成方面的提升。谷歌未在博文中披露具体技术参数或性能数据。

编者按：视频演示是技术传播的利器——谷歌用9个精心设计的案例让开发者直观感受模型能力边界，比参数表格更有说服力。

🔗 来源：Google AI Blog | 原文链接

2. Liquid AI发布8B参数边缘MoE模型，训练数据翻三倍

分类：模型发布

Liquid AI发布8B参数边缘MoE模型，训练数据翻三倍

Liquid AI发布了LFM2.5-8B-A1B边缘模型，采用混合专家（MoE）架构，上下文窗口扩展至128K，预训练数据从12T tokens增至38T tokens，并经过大规模强化学习优化。

该模型专为消费级硬件上的快速工具调用设计，词汇量翻倍以提升非拉丁语系的token效率，声称能在入门级笔记本上流畅运行。这是继2025年10月LFM2-8B-A1B后的重要迭代。

边缘MoE赛道竞争日趋激烈，微软、谷歌等巨头也在推进小模型策略。Liquid AI主打高效工具调用和本地部署，为开发者和企业提供了私有化部署的轻量化新选择。

编者按：Liquid AI把模型做小、做快、做精的思路，对中小企业和个人开发者格外友好——不必依赖云API就能在本地跑起复杂工具链。

🔗 来源：Hacker News | 原文链接

3. Claude Code推出动态工作流，挑战复杂端到端任务

分类：实用工具

Claude Code推出动态工作流，挑战复杂端到端任务

Anthropic在Claude Code中引入动态工作流功能，旨在让AI自主处理原本需要数季度规划的复杂端到端任务。该功能通过动态规划与执行，提升AI在长期项目中的自主性和可靠性。

这是Claude Code在编程助手上的一次重要升级。此前Claude Code已支持代码生成、审查等基础能力，新功能将任务拆解与执行连贯起来，试图解决AI在长周期任务中容易偏离方向的问题。

编者按：动态工作流让Claude从'写代码的助手'变成'管项目的工程师'，这对软件工程团队的协作模式可能产生深远影响。

🔗 来源：Hacker News | 原文链接

4. 英伟达200亿美元收购未果，AI芯片公司Groq拟融资6.5亿美元

分类：融资动态

据Axios报道，AI芯片公司Groq计划进行6.5亿美元内部融资，将业务重心从硬件转向AI推理服务——即优化AI模型响应速度的过程。此前英伟达曾试图以约200亿美元收购Groq但未达成交易。

Groq以高性能LPU（语言处理单元）闻名，此次转型意味着其希望直接从AI推理需求爆发中获利，而非仅靠卖芯片。市场对推理专用硬件的需求正在快速增长。

编者按：Groq从卖芯片转向卖服务的路线，有点像当年AWS从硬件转向云计算的逻辑——与其卖铲子，不如开金矿。

🔗 来源：TechCrunch AI | 原文链接

5. Kog实现单请求每秒3000 token推理，直逼专用硬件

分类：研究论文

Kog实现单请求每秒3000 token推理，直逼专用硬件

Kog AI团队展示了一项技术突破：在标准数据中心GPU上，通过架构、引擎与GPU底层代码的协同设计，单请求LLM解码速度达到每秒3000 tokens，接近专用推理硬件的性能水平。

团队指出，LLM推理速度瓶颈在于显存带宽而非算力，当前主流推理栈存在严重的软件瓶颈。他们已开放技术预览，并在playground.kog.ai提供实时测试体验。

编者按：如果Kog的方案能普及，很多企业可能不再需要采购昂贵的专用推理芯片——标准GPU的潜力被严重低估了。

🔗 来源：Hacker News | 原文链接

6. 开源项目Tiny-vLLM：C++和CUDA实现的高性能推理引擎

分类：开源项目

开源项目Tiny-vLLM：C++和CUDA实现的高性能推理引擎

开源项目Tiny-vLLM在GitHub上发布，用C++和CUDA实现了vLLM的缩小版高性能LLM推理引擎，旨在帮助开发者深入理解推理系统的底层原理。

该项目代码完全开源，支持自定义修改和实验，对研究者和工程师来说是学习LLM推理优化的实用参考资源。当前已获400余颗星标。

编者按：Tiny-vLLM降低了推理引擎的学习门槛——想搞懂AI推理底层，最直接的方式是自己动手写一个。

🔗 来源：Hacker News | 原文链接

7. Rust实现的文档解析工具LiteParse登顶GitHub热榜

分类：开源项目

Rust实现的文档解析工具LiteParse登顶GitHub热榜

由LlamaIndex团队开发的开源文档解析工具LiteParse今日登上GitHub Trending，该项目用Rust编写，主打快速、易用，当日获701星。

LiteParse旨在提供传统文档解析库的更高效替代方案，在速度和准确性上进行了专门优化。对于需要处理大量PDF、Word等文档的AI应用开发者来说，这是一个值得关注的基础工具。

编者按：文档解析是RAG应用中最容易被忽视的瓶颈——一个更快的解析器能直接提升整个检索管道的质量。

🔗 来源：GitHub Trending | 原文链接

8. Mistral AI Now峰会传递信号：从模型公司转型全栈AI服务商

分类：行业动态

Mistral AI Now峰会传递信号：从模型公司转型全栈AI服务商

在巴黎举行的Mistral AI Now峰会上，公司传递出明确转型信号：不再只是一家模型公司，而是构建包含算力、模型、平台和咨询的全栈AI服务。Mistral已拥有巴黎40MW数据中心，并计划在瑞典等地扩建。

其差异化策略聚焦高效、开放和可定制的模型，支持私有化本地部署。合作方包括ASML、法国巴黎银行、亚马逊Alexa+等欧洲产业巨头。

编者按：Mistral的欧洲基因决定了它的路线——开放+本地部署，满足企业苛刻的数据主权要求，这是OpenAI做不到的。

🔗 来源：Hacker News | 原文链接

9. AI初创Shift免费为家庭打扫，只为收集机器人训练数据

分类：行业动态

AI初创Shift免费为家庭打扫，只为收集机器人训练数据

AI初创公司Shift推出免费家庭清洁服务，条件是在用户家中收集数据，用于训练未来的家政机器人。用户只需允许机器人记录清洁过程中的环境和操作数据。

🔗 来源：Hacker News | 原文链接

10.

分类：实用工具

The Verge评测Adobe Firefly AI Assistant后认为，该工具更像一位多任务中间人——能操作设计软件减少琐碎工作，但最终效果平庸，缺乏惊艳感。测试者称其解释逻辑清晰，但产出成果难以令人满意。

🔗 来源：The Verge AI | 原文链接