23-260407 AI 科技日报 (Gemma 4 模型登顶 Hugging Face 排行榜)
共收录 28 条资讯
AI模型
Gemma 4 模型登顶 Hugging Face 排行榜
谷歌的 Gemma 4 模型在 Hugging Face 综合排行榜上拿到了第一名。这意味着开源模型已经能硬刚闭源模型的性能,开源生态也正在快速蹿升。
关键词: Gemma 4 开源模型 Hugging Face
来源: @ClementDelangue
链接: x.com/ClementDela…
微软推出精准转录模型 MAI-Transcribe-1
微软甩出了新一代音频转录 AI 模型 MAI-Transcribe-1,号称全球最精准的转录方案。这货在多语言场景中表现特别亮眼,准确率绝了。
关键词: 微软 转录 音频处理
来源: ai-bot.cn
链接: www.ithome.com/0/935/617.h…
GLM-5.1 向全体编程计划用户开放
智谱发布 GLM-5.1 模型,已向全体 GLM 编程计划用户开放。这个版本在代码生成和文本理解上来了个大升级。
关键词: GLM-5.1 代码生成 智谱
来源: @stanfordnlp
链接: x.com/stanfordnlp…
产品发布
Sakana AI完成日本虚假信息对抗技术开发
Sakana AI为日本总务省搞定了虚假信息对抗这个难题,整了个端到端的情报系统,能把社交媒体上的假信息可视化出来,并自动给出应对方案。这套系统利用了他们独家的 Novelty Search 等黑科技。
关键词: 虚假信息 社交媒体 情报系统
来源: @SakanaAILabs
链接: x.com/SakanaAILab…
Hermes Agent 生态升级:知识库、本地免费运行、记忆优化、阿拉伯语支持
Nous Research 的 Hermes Agent 现在是真的猛。不仅集成了 Karpathy 的 LLM-Wiki,让你用 Obsidian 创建知识库和研究库,而且现在可以完全免费地配合 Gemma 4 和 Ollama 本地跑,无 API 费用、无限额度,还享受 256k 的超长上下文。最新的 0.7 版本修复了 Agent 容易"失忆"的问题,内存管理机制得到改进。同时还新增了 Hurmoz 工具包,包含 63 项阿拉伯语 AI 技能,是目前规模最大的。用户可以轻松通过 /update 和 /llm-wiki 命令开始使用。
关键词: Hermes Agent 知识库 本地运行 内存管理 阿拉伯语
来源: @Teknium
链接: x.com/Teknium/sta…
OpenClaw 2026.4.5 发布,视频音乐生成开箱即用
OpenClaw 更新到 2026.4.5,直接内置了视频和音乐生成功能,"dreaming"模式现在可用了,结构化任务进度管理更顺手,prompt 缓存复用也更高效。还一口气扩展了 12 种新语言支持。最新版本原生支持视频生成,已集成阿里、字节、谷歌、OpenAI、xAI 等多家厂商的视频生成服务,开发者可以灵活切换不同平台。开源社区准备好和闭源模型正面刚了。
关键词: OpenClaw 视频生成 多模态 开源
来源: @openclaw @steipete
链接: x.com/openclaw/st…
Claude Code 生产力爆表,但也"翻车"了
Anthropic 增长负责人分享的数据扎心了:Claude Code 让 5 人工程团队能干出 15 到 20 人规模团队的活儿。但问题是,PM 和设计师的生产力并没跟上,导致一个 PM 要管理远超规模的工程输出,结构性失衡很严重。Anthropic 现在在狂招 PM 和优化工作流程来救场。
另一方面,开发者也在反弹:有人报告 Claude Code 的功能突然被限制了,之前能用的现在被拒绝。Anthropic 还在限制第一方工具的使用,要求用户自带 API 额度。这波操作让开发者感到被"背刺",吐槽 Anthropic 在烧掉开发者的信任。
关键词: Claude Code 生产力 工程团队 限制 人效
来源: @lennysan @GergelyOrosz
链接: x.com/lennysan/st…
agent-browser 和 OpenCode 推出新功能
agent-browser 升级了浏览器自动化,现在支持自然语言指令,比如"打开谷歌,搜索谷歌"这样的一次性任务,也支持交互式使用。新增内置 AI 聊天、命令执行和子智能体调用能力,让浏览自动化更灵活易用。
OpenCode 服务器现已支持在 Node.js 环境下运行,不再被 Bun 特定 API 锁死。团队正在进行大规模内部重构,筹备 2.0 版本,将推出更新的插件和 SDK 接口。这扩大了 OpenCode 的部署灵活性。
关键词: agent-browser OpenCode 浏览器自动化 Node.js
来源: @ctatedev @thdxr
链接: x.com/ctatedev/st…
研究论文
Cursor 的 MoE 推理优化:速度快 1.84 倍
Cursor 在 Blackwell GPU 上重构了 MoE 模型的 token 生成方式,实现了 1.84 倍的推理加速和更准确的输出。这些优化直接用在了 Composer 模型的训练上,让 Cursor 能更频繁地甩出改进版本。妥妥地体现了硬件优化对 AI 推理性能的威力。
关键词: Cursor MoE 推理优化 Blackwell GPU
来源: @cursor_ai
链接: x.com/cursor_ai/s…
Stanford 开源 AI 课程和机器学习教材
Stanford 大学开放了 2025 秋季《AI 原理与技术》课程的完整视频,约 20 小时讲座,已在 YouTube 免费发布,覆盖 AI 基础理论和实践内容。
同时,一份 674 页的《Introduction to Machine Learning》开源教材也正式发布,系统地涵盖基础理论、算法和实践技巧,为学习者提供了完整的知识体系。这些都是学习 AI 基础的宝藏资源。
关键词: Stanford AI课程 机器学习 教材 开源资源
来源: @Hesamation @KirkDBorne
链接: x.com/Hesamation/…
工具推荐
Karpathy 推出自运行个人知识库 LLM Wiki
Andrej Karpathy 推出了 LLM Wiki 项目,这是个可自运行的个人知识库系统,支持用户构建和管理由大语言模型驱动的知识库。小而美的轻量级知识管理方案,特别适合个人和小团队。
关键词: LLM Wiki 知识库 Karpathy
来源: ai-bot.cn
链接: mp.weixin.qq.com/s/-2H3xFx_R…
行业动态
Anthropic 与谷歌、博通达成合作,部署多吉瓦 TPU 算力
Anthropic 已与谷歌和博通达成协议,将部署多吉瓦级的下一代 TPU 算力,从 2027 年开始上线。这些计算资源将用于训练和部署 Claude 最前沿的模型。这是 Anthropic 在确保长期 AI 计算基础设施上的大手笔投入,和自己火箭般的增长节奏相匹配。
关键词: Anthropic TPU Google 计算基础设施
来源: @AnthropicAI @bcherny
链接: x.com/AnthropicAI…
PyTorch 核心成员离职 Meta,专注更小团队的系统工程
PyTorch 在 Meta 的核心贡献者之一宣布离职,在 Meta 工作 5 年期间参与了这个开源深度学习框架的重大工作。该成员表示下一步仍将专注系统工程和开源,但会组建更小的精英团队,并配备大量 GPU 资源。
关键词: PyTorch Meta 开源社区 系统工程
来源: @marksaroufim
链接: x.com/marksaroufi…
Anthropic 月营收增长 11 亿,创公司增长纪录
Anthropic 的年化经常性收入(ARR)从 2 月的 19 亿美元飙升到 30 亿美元,单月增长 11 亿美元。这增速绝了,超过了 Palantir、Anduril 和 Databricks 三家公司的总 ARR。数据反映出 Claude 生产力工具在市场的疯狂需求,特别是 Claude Code 在代码生成领域的广泛应用。
关键词: Anthropic 营收增长 Claude ARR
来源: @lennysan
链接: x.com/lennysan/st…
OpenAI 启动安全研究员金项目,储备 AI 安全人才
OpenAI 宣布启动新的安全研究员金项目(Safety Fellowship),支持独立研究人员在 AI 安全和对齐方向的工作,培养新一代 AI 安全人才。这是 OpenAI 在 AI 安全研究领域的重大投入和人才储备。
关键词: OpenAI 安全研究 AI对齐 人才培养
来源: @OpenAI
链接: x.com/OpenAI/stat…
AI 商业化遇冷?订阅模式面临"超级用户"和 Agent 成本危机
业界扎心的观察:一个重度使用用户的消耗就能吃掉整个订阅计划的利润。这背后的根本原因是啥?OpenAI 和 Anthropic 采用的 20/200 美元订阅价格方案源自聊天机器人使用模式,但根本不适用于 24/7 运行的 Agent。Agent 消耗的 token 数量远超聊天用户,导致两家公司陷入定价困境:既要避免用户流失,又要应对不断上升的计算成本。最终可能被迫提高费用、限流或限制第三方应用,就像 Anthropic 最近的举动一样。
关键词: AI订阅 AI定价 Agent 成本压力 商业化
来源: @Yuchenj_UW
链接: x.com/Yuchenj_UW/…
开源 Agent 数据集共享倡议启动,打破开源生态数据瓶颈
Hugging Face CEO 和社区开发者共同倡议构建开源 frontier Agent 的训练数据集。首批参与者包括 Pi 创作者,他们开放了 agent traces 供社区使用。这一举措旨在打破开源 Agent 模型发展的数据瓶颈,通过汇聚用户与 Agent 交互产生的真实对话数据来推动开源生态,这招儿够聪明。
关键词: 开源Agent 数据集 Hugging Face
来源: @ClementDelangue
链接: x.com/ClementDela…
Claude 服务可用性问题凸显 GPU 资源紧张
用户反馈 Claude 及 Claude Code 频繁出现服务中断,被迫转用其他模型。分析认为 Anthropic 面临严重的 GPU 资源不足。这也解释了为啥他们最近限制第三方应用使用 Claude 订阅——资源紧张迫使他们优先服务直用用户,不得已的选择。
关键词: Claude 可用性 资源压力 GPU
来源: @Yuchenj_UW
链接: x.com/Yuchenj_UW/…
其他
深度学习研究的认知盲点:学习方法的多元性被忽视
Keras 创始人 Francois Chollet 指出了个有趣的现象:许多深度学习研究者缺乏多元学习方法的暴露和思维,往往只会梯度下降拟合曲线参数,根本想象不出其他学习范式的存在。这反映了当前深度学习研究有多"一根筋"。
关键词: 深度学习 学习方法 认知论
来源: @fchollet
链接: x.com/fchollet/st…
关注我,每天获取AI最新资讯。
