59-260512 AI 科技日报(Gemini 视频模型曝光、DeepSeek V4 限时免费、OpenAI 布局企业部署)

0 阅读2分钟

59-260512 AI 科技日报(Gemini 视频模型曝光、DeepSeek V4 限时免费、OpenAI 布局企业部署)

AI模型

  1. Gemini Omni 视频模型曝光 — 谷歌 Gemini 应用出现 “Omni 视频模型” 痕迹,可聊天式编辑和生成视频;全能模型也将开放 API,面向复杂 Agent 任务。 🔗
  2. DeepSeek V4 Flash 限时免费 — OpenCode 平台限时免费提供 DeepSeek V4 Flash,在 Go 编程场景中口碑不错。 🔗
  3. Qwen 3.6 Plus 限时免费 — Nous Portal 限时免费开放 Qwen 3.6 Plus,平台已聚合 300 多种模型,可以一站式体验不同模型。 🔗
  4. MiniCPM-V 4.6 开源 — OpenBMB 开源端侧多模态模型 MiniCPM-V 4.6,针对手机等边缘设备优化了运行效率和多模态能力。 🔗

产品发布

  1. Claude Code 推出 Agent 视图 — 新增 Agent 视图管理多会话,同步更新 50 余项 CLI 变化,/goal 命令支持跨轮次任务跟踪。 🔗
  2. Cursor 集成 Microsoft Teams — 在 Teams 频道内通过 @ 调用 Cursor 分配编程任务或查询代码信息。 🔗
  3. Cursor Bugbot 支持自定义审查深度 — 可对重要代码变更启用高努力模式,把更多算力分配给关键 review。 🔗
  4. 通义千问接入淘宝 — 深度整合进淘宝 App,支持对话式购物、虚拟试穿等 AI 交互。 🔗

研究论文

  1. FrontierMath 基准约三成题目有错 — GPT 5.5 检验出数学基准 FrontierMath 约三分之一题目存在错误,AI 数学能力的评估结论可能要打折。 🔗

工具推荐

  1. Karpathy:让 LLM 直接生成 HTML — 直接让 LLM 输出 HTML 在浏览器展示,利用模型对 Web 技术的熟悉度快速产出可视化结果。 🔗
  2. Hermes Agent 实现通用计算机操作 — Nous Research 推出 Hermes Agent,结合 Cua 技术,任意 LLM 都能操控鼠标键盘完成计算机任务。 🔗

行业动态

  1. OpenAI 成立 Deployment 公司 — 联合 19 家投资与咨询机构组成伙伴网络,帮企业把前沿模型部署到生产环境。 🔗
  2. 快手可灵 AI 拟独立融资 — 快手计划将可灵 AI 分拆独立,估值 200 亿美元,目标明年 IPO。 🔗
  3. OpenAI 推出 AI 网络防御工具 Daybreak — 斥资 40 亿美元成立新公司,进入网络安全领域。 🔗

关注我,每天获取AI最新资讯。