衍辉AI速递 5.28|Cognition融资10亿美元估值250亿等12条AI资讯

2 阅读10分钟

2026-05-28 | 共 12 条精选

今日速览

  1. 融资动态 | AI编程公司Cognition获10亿美元融资,估值达250亿美元
  2. 行业动态 | Snowflake与AWS签60亿美元五年协议,锁定AI芯片产能
  3. 政策法规 | YouTube推出AI生成内容自动标签功能
  4. 模型发布 | ElevenLabs发布新音乐生成模型,支持中途切换音乐风格
  5. 产品发布 | Robinhood开放AI Agent股票交易,风险自担
  6. 开源项目 | Apache 2.0许可:MONET数据集发布,含超1亿高质量图文对
  7. 开源项目 | Anthropic开源Agent Skills项目,登上GitHub热榜
  8. 开源项目 | MOSS团队开源TTS模型族,支持实时流式语音合成
  9. 产品发布 | YouTube推出AI自定义视频订阅,支持自然语言描述生成
  10. 研究论文 | 研究警告:AI生成的CUDA内核可能静默破坏训练与推理
  11. 实用工具 | Crawl4AI:开源LLM友好型网络爬虫工具
  12. 实用工具 | Tomesphere:为arXiv论文构建更丰富的阅读层

1. AI编程公司Cognition获10亿美元融资,估值达250亿美元

分类:融资动态

AI编程初创公司Cognition宣布完成10亿美元融资,投前估值250亿美元,较八个月前翻倍。公司年化经常性收入已达4.92亿美元。

本轮融资由现有投资者与多家新机构参与,资金将用于加速产品研发与全球扩张。Cognition的核心产品Devin是一款自主AI编程助手,能够独立完成从代码编写到部署的全流程任务。

AI编程赛道竞争日趋激烈,GitHub Copilot、Cursor等同类产品也在快速迭代。Cognition的高速增长表明,企业对能够显著提升开发效率的AI工具需求旺盛,自主编程Agent正从概念走向规模化商业应用。

编者按:Cognition的估值飙升说明市场对AI编程Agent的商业化信心十足,但4.92亿美元的年化收入能否支撑250亿美元估值,仍需观察企业客户的真实续费率与ROI。

🔗 来源:TechCrunch AI | 原文链接


2. Snowflake与AWS签60亿美元五年协议,锁定AI芯片产能

分类:行业动态

Snowflake与亚马逊AWS签署一份为期五年、价值60亿美元的大单,用于采购AI芯片。该协议将确保Snowflake在AI推理与训练场景下的算力供应,主要涉及亚马逊自研的Trainium和Inferentia芯片。

此举被视为云计算厂商加速摆脱英伟达依赖的又一信号。此前,微软、谷歌等巨头已纷纷推出自研AI芯片。Snowflake的大规模订单将进一步推动AWS的芯片生态成熟,同时给英伟达在数据中心GPU市场的主导地位带来压力。

编者按:Snowflake的60亿美元订单是云计算厂商自研芯片生态的关键里程碑——当数据仓库巨头也开始选非英伟达路线,GPU市场的"去中心化"就不仅是口号了。

🔗 来源:TechCrunch AI | 原文链接


3. YouTube推出AI生成内容自动标签功能

分类:政策法规

YouTube推出AI生成内容自动标签功能

YouTube宣布将升级AI生成内容的标签系统,新增自动检测功能,并简化标签展示方式。平台将自动识别使用AI工具生成的视频内容,在视频描述与播放器界面添加明确标识。

新系统将覆盖更多AI工具,包括生成式文本、图像、视频和语音。YouTube表示,此举旨在提升透明度,帮助观众区分真实内容与AI生成内容。未来还将探索针对深度伪造等高风险内容的更严格标签策略。

编者按:YouTube的自动检测标签比依赖创作者主动申报更进了一步,但识别准确率和误报率将是考验——过度标记可能伤害正常创作者,标签太少又无法建立用户信任。

🔗 来源:Hacker News | 原文链接


4. ElevenLabs发布新音乐生成模型,支持中途切换音乐风格

分类:模型发布

ElevenLabs推出新一代音乐生成模型,核心亮点是允许用户在歌曲生成后,仅对指定段落进行风格替换,而不影响其余部分。例如,可将一段副歌从电子乐改为爵士风,保持主歌部分不变。

新模型在音质、乐器分离与风格一致性上均有显著提升,主要面向内容创作者、游戏开发者及音乐爱好者。ElevenLabs正处于AI音频领域的领先地位,其语音克隆与音效生成业务已积累大量用户。

编者按:ElevenLabs的"分段再生"功能让AI音乐创作从'一次性生成'走向'精细化编辑',这可能会改变音乐制作人的工作流——更像用DAW而非单纯靠提示词。

🔗 来源:TechCrunch AI | 原文链接


5. Robinhood开放AI Agent股票交易,风险自担

分类:产品发布

Robinhood开放AI Agent股票交易,风险自担

Robinhood宣布允许用户创建独立的AI Agent账户,授权AI代理自主执行股票买卖操作。用户可为每个Agent指定资金限额,Agent可监控市场并自动执行交易策略,如行业轮动或资产再平衡。

Robinhood明确提示Agentic交易存在重大风险,可能导致全部投资损失。该功能面向有一定投资经验的用户,目前处于早期测试阶段。此举将AI Agent的应用场景从内容生成延伸至金融交易领域。

编者按:Robinhood把AI Agent放进股票交易,本质上是把'量化交易'平民化了——但大多数散户对AI模型的风险边界一无所知,这可能会成为新一代的韭菜收割机。

🔗 来源:The Verge AI | 原文链接


6. Apache 2.0许可:MONET数据集发布,含超1亿高质量图文对

分类:开源项目

开源社区发布名为MONET的大规模图文数据集,包含1.049亿个高质量图文对,采用Apache 2.0许可。该数据集从29亿张原始图片中筛选提炼而成,并附带有详细的元数据与标题。

项目同时提供了可视化工具、检索工具以及文本到图像训练的代码库,降低了研究人员和开发者使用门槛。MONET旨在为文本到图像生成模型提供更高质量的训练数据,弥补现有数据集在质量和多样性上的不足。

编者按:MONET的意义不仅在于数据量大,更在于其Apache 2.0许可和完整工具链——对开源T2I社区而言,这是可以直接拿来用的'弹药库'。

🔗 来源:Reddit r/MachineLearning | 原文链接


7. Anthropic开源Agent Skills项目,登上GitHub热榜

分类:开源项目

Anthropic开源Agent Skills项目,登上GitHub热榜

Anthropic在GitHub上开源了Agent Skills项目,这是一个用于构建和部署AI Agent的Python工具库,今日获得686星。该项目旨在为开发者提供标准化的Agent能力模块。

Agent Skills包含多种预设技能,如信息检索、代码执行和多工具编排,可加速Agent应用的开发。Anthropic此举延续了其推动AI Agent生态建设的策略,吸引更多开发者加入其平台。

编者按:Anthropic开源Agent Skills,本质上是在为Claude生态铺路——让开发者用他们的工具装配Agent,未来自然会更倾向于使用背后的模型。

🔗 来源:GitHub Trending | 原文链接


8. MOSS团队开源TTS模型族,支持实时流式语音合成

分类:开源项目

MOSS团队开源TTS模型族,支持实时流式语音合成

MO51.AI与OpenMOSS团队联合开源MOSS-TTS系列语音生成模型,覆盖稳定长文本朗读、多说话人对话、声音/角色设计、环境音效及实时流式TTS等场景。

模型基于Python实现,在GitHub上获得53星。该项目面向高保真、高表现力的复杂真实场景,为开发者提供了开源的全能语音解决方案。

编者按:MOSS-TTS覆盖了从长文本TTS到环境音效的全场景,是开源语音社区的重要补充,尤其适合需要定制化语音产品的开发团队。

🔗 来源:GitHub Trending | 原文链接


9. YouTube推出AI自定义视频订阅,支持自然语言描述生成

分类:产品发布

YouTube推出AI自定义视频订阅,支持自然语言描述生成

YouTube上线新AI功能,允许用户通过输入自然语言描述来生成个性化视频流。用户可描述自己感兴趣的主题、情绪或内容类型,AI将自动编排一个对应的视频列表。

该功能当前仅支持英语,面向美国地区YouTube移动应用和桌面端的登录用户。生成的订阅可固定在首页顶部,方便随时访问。这是YouTube利用AI提升内容发现体验的最新尝试。

编者按:YouTube的AI订阅本质上是把'被动推荐'变成了'主动编排'——用户从被算法决定看什么,到用语言定制频道,这是内容消费方式的一次小革命。

🔗 来源:The Verge AI | 原文链接


10. 研究警告:AI生成的CUDA内核可能静默破坏训练与推理

分类:研究论文

研究人员在Reddit上发布报告称,将AI生成的CUDA内核直接用于生产环境时,许多内核会以出人意料的方式失效。他们基于英伟达的SOL-ExecBench基准测试了多个排名靠前的AI提交代码,发现其中存在静默错误。

例如,一个用于Transformer训练的融合嵌入梯度加RMSNorm反向传播内核,在替换到真实工作负载后导致训练崩溃。研究团队呼吁社区加强对AI生成代码的测试与验证,避免因性能面子牺牲正确性。

编者按:AI写CUDA内核追求基准跑分,却忽略了对生产环境中边界情况的处理——这提醒我们,用AI优化AI基础设施时,验证环节不能跳过。

🔗 来源:Reddit r/MachineLearning | 原文链接


11. Crawl4AI:开源LLM友好型网络爬虫工具

分类:实用工具

Crawl4AI:开源LLM友好型网络爬虫工具

GitHub上出现一款名为Crawl4AI的开源网络爬虫工具,专为LLM应用设计,支持结构化数据提取。该项目今日获得210星,语言为Python。

Crawl4AI能够将网页内容转换为LLM友好的格式,方便用于RAG(检索增强生成)等场景。工具设计强调易用性与可扩展性,降低了开发者从网页获取高质量训练数据或知识库的门槛。

🔗 来源:GitHub Trending | 原文链接


12. Tomesphere:为arXiv论文构建更丰富的阅读层

分类:实用工具

开发者发布了一个名为Tomesphere的Chrome扩展及网站,为arXiv论文提供TLDR、OpenReview评审、GitHub/HuggingFace链接、引用图谱与语义邻居等深度信息。目前已索引超300万篇论文。

🔗 来源:Reddit r/MachineLearning | 原文链接