衍辉AI速递 5.28｜Cognition融资10亿美元估值250亿等12条AI资讯AI编程初创公司Cognition宣

2026-05-28 | 共 12 条精选

今日速览

融资动态 | AI编程公司Cognition获10亿美元融资，估值达250亿美元
行业动态 | Snowflake与AWS签60亿美元五年协议，锁定AI芯片产能
政策法规 | YouTube推出AI生成内容自动标签功能
模型发布 | ElevenLabs发布新音乐生成模型，支持中途切换音乐风格
产品发布 | Robinhood开放AI Agent股票交易，风险自担
开源项目 | Apache 2.0许可：MONET数据集发布，含超1亿高质量图文对
开源项目 | Anthropic开源Agent Skills项目，登上GitHub热榜
开源项目 | MOSS团队开源TTS模型族，支持实时流式语音合成
产品发布 | YouTube推出AI自定义视频订阅，支持自然语言描述生成
研究论文 | 研究警告：AI生成的CUDA内核可能静默破坏训练与推理
实用工具 | Crawl4AI：开源LLM友好型网络爬虫工具
实用工具 | Tomesphere：为arXiv论文构建更丰富的阅读层

1. AI编程公司Cognition获10亿美元融资，估值达250亿美元

分类：融资动态

AI编程初创公司Cognition宣布完成10亿美元融资，投前估值250亿美元，较八个月前翻倍。公司年化经常性收入已达4.92亿美元。

本轮融资由现有投资者与多家新机构参与，资金将用于加速产品研发与全球扩张。Cognition的核心产品Devin是一款自主AI编程助手，能够独立完成从代码编写到部署的全流程任务。

AI编程赛道竞争日趋激烈，GitHub Copilot、Cursor等同类产品也在快速迭代。Cognition的高速增长表明，企业对能够显著提升开发效率的AI工具需求旺盛，自主编程Agent正从概念走向规模化商业应用。

编者按：Cognition的估值飙升说明市场对AI编程Agent的商业化信心十足，但4.92亿美元的年化收入能否支撑250亿美元估值，仍需观察企业客户的真实续费率与ROI。

🔗 来源：TechCrunch AI | 原文链接

2. Snowflake与AWS签60亿美元五年协议，锁定AI芯片产能

分类：行业动态

Snowflake与亚马逊AWS签署一份为期五年、价值60亿美元的大单，用于采购AI芯片。该协议将确保Snowflake在AI推理与训练场景下的算力供应，主要涉及亚马逊自研的Trainium和Inferentia芯片。

此举被视为云计算厂商加速摆脱英伟达依赖的又一信号。此前，微软、谷歌等巨头已纷纷推出自研AI芯片。Snowflake的大规模订单将进一步推动AWS的芯片生态成熟，同时给英伟达在数据中心GPU市场的主导地位带来压力。

编者按：Snowflake的60亿美元订单是云计算厂商自研芯片生态的关键里程碑——当数据仓库巨头也开始选非英伟达路线，GPU市场的"去中心化"就不仅是口号了。

🔗 来源：TechCrunch AI | 原文链接

3. YouTube推出AI生成内容自动标签功能

分类：政策法规

YouTube推出AI生成内容自动标签功能

YouTube宣布将升级AI生成内容的标签系统，新增自动检测功能，并简化标签展示方式。平台将自动识别使用AI工具生成的视频内容，在视频描述与播放器界面添加明确标识。

新系统将覆盖更多AI工具，包括生成式文本、图像、视频和语音。YouTube表示，此举旨在提升透明度，帮助观众区分真实内容与AI生成内容。未来还将探索针对深度伪造等高风险内容的更严格标签策略。

编者按：YouTube的自动检测标签比依赖创作者主动申报更进了一步，但识别准确率和误报率将是考验——过度标记可能伤害正常创作者，标签太少又无法建立用户信任。

🔗 来源：Hacker News | 原文链接

4. ElevenLabs发布新音乐生成模型，支持中途切换音乐风格

分类：模型发布

ElevenLabs推出新一代音乐生成模型，核心亮点是允许用户在歌曲生成后，仅对指定段落进行风格替换，而不影响其余部分。例如，可将一段副歌从电子乐改为爵士风，保持主歌部分不变。

新模型在音质、乐器分离与风格一致性上均有显著提升，主要面向内容创作者、游戏开发者及音乐爱好者。ElevenLabs正处于AI音频领域的领先地位，其语音克隆与音效生成业务已积累大量用户。

编者按：ElevenLabs的"分段再生"功能让AI音乐创作从'一次性生成'走向'精细化编辑'，这可能会改变音乐制作人的工作流——更像用DAW而非单纯靠提示词。

🔗 来源：TechCrunch AI | 原文链接

5. Robinhood开放AI Agent股票交易，风险自担

分类：产品发布

Robinhood开放AI Agent股票交易，风险自担

Robinhood宣布允许用户创建独立的AI Agent账户，授权AI代理自主执行股票买卖操作。用户可为每个Agent指定资金限额，Agent可监控市场并自动执行交易策略，如行业轮动或资产再平衡。

Robinhood明确提示Agentic交易存在重大风险，可能导致全部投资损失。该功能面向有一定投资经验的用户，目前处于早期测试阶段。此举将AI Agent的应用场景从内容生成延伸至金融交易领域。

编者按：Robinhood把AI Agent放进股票交易，本质上是把'量化交易'平民化了——但大多数散户对AI模型的风险边界一无所知，这可能会成为新一代的韭菜收割机。

🔗 来源：The Verge AI | 原文链接

6. Apache 2.0许可：MONET数据集发布，含超1亿高质量图文对

分类：开源项目

开源社区发布名为MONET的大规模图文数据集，包含1.049亿个高质量图文对，采用Apache 2.0许可。该数据集从29亿张原始图片中筛选提炼而成，并附带有详细的元数据与标题。

项目同时提供了可视化工具、检索工具以及文本到图像训练的代码库，降低了研究人员和开发者使用门槛。MONET旨在为文本到图像生成模型提供更高质量的训练数据，弥补现有数据集在质量和多样性上的不足。

编者按：MONET的意义不仅在于数据量大，更在于其Apache 2.0许可和完整工具链——对开源T2I社区而言，这是可以直接拿来用的'弹药库'。

🔗 来源：Reddit r/MachineLearning | 原文链接

7. Anthropic开源Agent Skills项目，登上GitHub热榜

分类：开源项目

Anthropic开源Agent Skills项目，登上GitHub热榜

Anthropic在GitHub上开源了Agent Skills项目，这是一个用于构建和部署AI Agent的Python工具库，今日获得686星。该项目旨在为开发者提供标准化的Agent能力模块。

Agent Skills包含多种预设技能，如信息检索、代码执行和多工具编排，可加速Agent应用的开发。Anthropic此举延续了其推动AI Agent生态建设的策略，吸引更多开发者加入其平台。

编者按：Anthropic开源Agent Skills，本质上是在为Claude生态铺路——让开发者用他们的工具装配Agent，未来自然会更倾向于使用背后的模型。

🔗 来源：GitHub Trending | 原文链接

8. MOSS团队开源TTS模型族，支持实时流式语音合成

分类：开源项目

MOSS团队开源TTS模型族，支持实时流式语音合成

MO51.AI与OpenMOSS团队联合开源MOSS-TTS系列语音生成模型，覆盖稳定长文本朗读、多说话人对话、声音/角色设计、环境音效及实时流式TTS等场景。

模型基于Python实现，在GitHub上获得53星。该项目面向高保真、高表现力的复杂真实场景，为开发者提供了开源的全能语音解决方案。

编者按：MOSS-TTS覆盖了从长文本TTS到环境音效的全场景，是开源语音社区的重要补充，尤其适合需要定制化语音产品的开发团队。

🔗 来源：GitHub Trending | 原文链接

9. YouTube推出AI自定义视频订阅，支持自然语言描述生成

分类：产品发布

YouTube推出AI自定义视频订阅，支持自然语言描述生成

YouTube上线新AI功能，允许用户通过输入自然语言描述来生成个性化视频流。用户可描述自己感兴趣的主题、情绪或内容类型，AI将自动编排一个对应的视频列表。

该功能当前仅支持英语，面向美国地区YouTube移动应用和桌面端的登录用户。生成的订阅可固定在首页顶部，方便随时访问。这是YouTube利用AI提升内容发现体验的最新尝试。

编者按：YouTube的AI订阅本质上是把'被动推荐'变成了'主动编排'——用户从被算法决定看什么，到用语言定制频道，这是内容消费方式的一次小革命。

🔗 来源：The Verge AI | 原文链接

10. 研究警告：AI生成的CUDA内核可能静默破坏训练与推理

分类：研究论文

研究人员在Reddit上发布报告称，将AI生成的CUDA内核直接用于生产环境时，许多内核会以出人意料的方式失效。他们基于英伟达的SOL-ExecBench基准测试了多个排名靠前的AI提交代码，发现其中存在静默错误。

例如，一个用于Transformer训练的融合嵌入梯度加RMSNorm反向传播内核，在替换到真实工作负载后导致训练崩溃。研究团队呼吁社区加强对AI生成代码的测试与验证，避免因性能面子牺牲正确性。

编者按：AI写CUDA内核追求基准跑分，却忽略了对生产环境中边界情况的处理——这提醒我们，用AI优化AI基础设施时，验证环节不能跳过。

🔗 来源：Reddit r/MachineLearning | 原文链接

11. Crawl4AI：开源LLM友好型网络爬虫工具

分类：实用工具

Crawl4AI：开源LLM友好型网络爬虫工具

GitHub上出现一款名为Crawl4AI的开源网络爬虫工具，专为LLM应用设计，支持结构化数据提取。该项目今日获得210星，语言为Python。

Crawl4AI能够将网页内容转换为LLM友好的格式，方便用于RAG（检索增强生成）等场景。工具设计强调易用性与可扩展性，降低了开发者从网页获取高质量训练数据或知识库的门槛。

🔗 来源：GitHub Trending | 原文链接

12. Tomesphere：为arXiv论文构建更丰富的阅读层

分类：实用工具

开发者发布了一个名为Tomesphere的Chrome扩展及网站，为arXiv论文提供TLDR、OpenReview评审、GitHub/HuggingFace链接、引用图谱与语义邻居等深度信息。目前已索引超300万篇论文。

🔗 来源：Reddit r/MachineLearning | 原文链接