AI 科技日报 (昆仑万维推出 AI 短剧创作平台：天工短剧工作台)AI 科技日报 (昆仑万维推出 AI 短剧创作平台：

AI 科技日报 (昆仑万维推出 AI 短剧创作平台：天工短剧工作台)

共收录 43 条资讯

AI模型

Holo3 模型在图形界面导航任务中超越大型闭源模型

华公司 AI 推出 Holo3 模型，在 GUI 导航任务上的性能超越了更大的闭源和开源模型。Holo3 基于 Qwen3.5，参数量 35B，已获得 transformers 官方支持，并采用免费许可证。展示了中等规模模型在特定任务上的竞争力。

关键词： Holo3 GUI导航 开源模型
来源： @mervenoyann
链接： x.com/mervenoyann…

Liquid AI 发布 LFM2.5-350M 智能体循环模型

Liquid AI 发布 LFM2.5-350M，一个 350M 参数的轻量级模型，专门针对可靠的数据提取和工具使用进行训练，能够执行智能体循环任务。展示了小参数模型在智能体应用中的可行性。

关键词： LFM2.5-350M 轻量级模型 智能体
来源： @lateinteraction
链接： x.com/lateinterac…

产品发布

Falcon Perception 和 Falcon OCR 开源发布

TII 团队开源发布 Falcon Perception（0.6B 多模态模型）和 Falcon OCR（0.3B OCR 模型），采用早期融合架构支持开放词表的指代表达式分割任务。两个轻量化的感知模型已可在 Hugging Face 获取。

关键词： Falcon Perception OCR 多模态模型 开源
来源： @mervenoyann
链接： x.com/mervenoyann…

Google开源时间序列基础模型TimesFM

Google开源了TimesFM，一个时间序列基础模型，可在任意数据上直接预测，无需特定数据集训练。该模型在100亿个真实世界时间点上训练，支持流量、天气、需求预测等场景，开箱即用。这为时间序列预测任务提供了通用的预训练方案。

关键词： 时间序列 基础模型 零训练 开源
来源： @hasantoxr
链接： x.com/hasantoxr/s…

Multica：AI Agent团队管理平台

Multica是一个多路复用信息计算Agent平台，让AI Agent成为一级团队成员。Agent可被分配任务、汇报进度、提出阻塞并交付代码。特别适合1-5人团队，统一管理散落在各个CLI中的Agent，任务、token消耗一目了然。这重新定义了人类和AI协作的工作模式。

关键词： Agent管理 团队协作 任务分配
来源： @jiayuan_jy
链接： x.com/jiayuan_jy/…

Claude Code新增团队模式体验优化

Claude Code团队模式新增tmux集成，提供更直观的UI界面。用户可轻松调整窗口大小和位置，相比原生tmux的复杂操作，体验有明显改进。这是Claude在AI编码辅助工具方面的持续优化。

关键词： Claude Code 团队协作 编码工具
来源： @nummanali
链接： x.com/nummanali/s…

AI Agent间实时通信能力发布

OpenAgents Workspace推出AI Agent间实时通信功能，允许多个Agent在同一工作空间内实时互相沟通。这解决了Agent协作中的通信障碍，支持更复杂的多Agent工作流。

关键词： 多Agent 实时通信 协作
来源： @hasantoxr
链接： x.com/hasantoxr/s…

CodePilot宠物助力功能上线

CodePilot推出宠物助力功能，完成度超过Claude Code。这是一个可成长的Agent工作流引导系统，帮助用户构建自己的Agent工作流程。相比现有方案，功能更完善。

关键词： CodePilot Agent工作流 编码助手
来源： @op7418
链接： x.com/op7418/stat…

AI原生游戏Dead Reckoning发布

AI原生游戏《Dead Reckoning: Reborn》在Yoroll AI平台上线。融合僵尸生存、动态故事和AI原生玩法，代表了游戏行业的新方向。

关键词： AI游戏 原生玩法 动态故事
来源： @CodeByPoonam
链接： x.com/CodeByPoona…

Qwen Opus 3.5 9B新版本发布

Qwen Opus 3.5 9B推出v3版本，可在8GB内存设备上运行，性能超过原生版本。这提升了小模型的部署灵活性。

关键词： Qwen 小模型 推理优化
来源： @leftcurvedev_
链接： x.com/ClementDela…

Hugging Face 发布 TRL v1，包含 75+ 训练方法

Hugging Face 正式发布 TRL v1，新增 75+ 种方法，包括 SFT、DPO、GRPO、异步 RL 等。该库从首次提交到现在用时 6 年，已成为大多数开源模型的后训练标准工具。新版本设计为面向未来，用户可通过 pip install trl 直接安装。

关键词： TRL 模型训练 开源工具
来源： @ClementDelangue
链接： x.com/ClementDela…

Claude Code 推出自动模式，现已支持企业和 API 用户

Anthropic 为 Claude Code 发布了自动模式（Auto mode），现已面向企业计划和 API 用户开放。用户可通过更新安装版本来使用该功能。这是 Claude 代码编辑能力的进一步增强。

关键词： Claude 代码编辑 自动模式
来源： @claudeai
链接： x.com/claudeai/st…

阿里通义实验室推出 Wan2.7-Image 图像模型

通义实验室发布 Wan2.7-Image 模型，支持 AI 图像生成与编辑功能。该模型进一步完善了阿里在 AI 视觉领域的能力，为用户提供更强大的图像处理工具。

关键词： 图像生成 图像编辑 Wan2.7
来源： ai-bot.cn
链接： mp.weixin.qq.com/s/Nyow0Ht8J…

世界模型研究进展：LeWorldModel 模型和数据集发布

Yann LeCun 团队推进世界模型研究，LeWorldModel 数据集和模型检查点现已在 Hugging Face 上线。配套代码已开源，包括 dino-wm 的实现版本。世界模型是构建具身 AI 的关键技术方向。

关键词： 世界模型 JEPA Hugging Face
来源： @ylecun
链接： x.com/ylecun/stat…

谷歌发布 Veo 3.1 Lite：视频生成成本降低超 50%

谷歌 DeepMind 发布了 Veo 3.1 Lite 视频生成模型，支持 4 至 8 秒视频生成，支持多种画幅和 1080p 输出。720p 分辨率起售价为每秒 0.05 美元，相比之前降低超 50%，进一步降低了视频生成技术的使用门槛，推动商业化应用。

关键词： 视频生成 Veo 3.1 Lite 谷歌 成本优化
来源： aibase.com
链接： news.aibase.com/zh/daily/26…

美团推出语音合成模型 LongCat-AudioDiT

美团 LongCat 团队推出语音合成模型 LongCat-AudioDiT，用于语音生成和音频处理任务。该模型是美团在音频生成领域的新进展，为内容创作和语音应用提供了新的技术方案。

关键词： 语音合成 LongCat-AudioDiT 美团 音频模型
来源： ai-bot.cn
链接： mp.weixin.qq.com/s/YaU20XkTS…

PixVerse 推出快应用、团队版和 CLI 工具

视频生成工具 PixVerse 发布了三项新功能：快应用便于快速上手，团队版支持协作工作，CLI 工具满足开发者需求。这些更新降低了使用门槛，扩展了应用场景。

关键词： PixVerse 视频生成 工具更新
来源： ai-bot.cn
链接： mp.weixin.qq.com/s/rCGvSj_8n…

昆仑万维推出 AI 短剧创作平台

昆仑万维发布天工短剧工作台，这是一个 AI 驱动的短剧创作平台。平台整合 AI 技术，面向内容创作者提供短视频剧本生成、素材制作等能力，降低短剧制作门槛。

关键词： 短剧创作 天工 昆仑万维 内容生成
来源： ai-bot.cn
链接： mp.weixin.qq.com/s/5crrr_94g…

研究论文

分子向量搜索展现新应用前景

研究表明向量搜索可应用于分子相似度匹配，使用嵌入向量替代传统分子指纹能发现隐藏的分子关系，甚至在 scaffold hopping（骨架跳跃）任务上有效。说明向量检索技术超越文本应用的广阔可能性。

关键词： 向量搜索 分子匹配 嵌入模型
来源： @qdrant_engine
链接： x.com/qdrant_engi…

LLM 在游戏关卡生成中的应用研究

研究团队展示了 LLM 在生成高质量游戏关卡方面的潜力，但需要提供充分的上下文和约束条件。该研究探索了大语言模型在创意内容生成领域的实际应用。

关键词： LLM 游戏关卡生成 内容创意
来源： @togelius
链接： x.com/togelius/st…

LLM越狱防御新方法：生物启发搜索

研究论文提出使用生物启发搜索算法来寻找LLM的越狱方法。这种方法受生物进化启发，能更高效地发现模型的安全漏洞，为改进模型安全防御提供了新思路。

关键词： LLM安全 越狱防御 生物启发
来源： @tom_doerr
链接： x.com/tom_doerr/s…

Stanford 和 MIT 论文：模型框架可产生 6 倍性能差异

Stanford 和 MIT 发布新论文研究模型框架（harness）的影响。研究表明，改变围绕固定 LLM 的框架可产生高达 6 倍的性能差异，说明工程设计在 AI 应用中的重要性。这对开发者定制化部署 AI 模型有重要启示。

关键词： 模型框架 性能优化 工程设计
来源： @omarsar0
链接： x.com/omarsar0/st…

Bonsai 模型：1.7B 到 8B 参数，1 比特量化压缩

研究展示了 1 比特权重量化技术的应用效果，Bonsai 模型可在参数量 1.7B 到 8B 的范围内，相比 bf16 精度实现 14 倍压缩。这对在资源受限的设备上部署 AI 模型意义重大。

关键词： 模型量化 1-bit 模型压缩
来源： @ClementDelangue
链接： x.com/ClementDela…

工具推荐

AutoClaw 本地优先智能体框架发布

新增的 Claw 风格智能体框架 AutoClaw 提供了本地优先的智能体运行环境，承诺完整的自主能力。为开发者提供了构建智能体应用的新选择。

关键词： AutoClaw 智能体框架 本地优先
来源： @TheTuringPost
链接： x.com/TheTuringPo…

代码库知识图谱自动生成工具

一个工具可自动为代码库生成Markdown格式的知识图谱，帮助开发者快速理解复杂项目结构。这对于代码导航和项目文档化很有实用价值。

关键词： 代码分析 知识图谱 文档化
来源： @tom_doerr
链接： x.com/tom_doerr/s…

自主AI Agent六周入门教程发布

发布了一份六周内构建自主AI Agent的完整教程，包含实战案例和最佳实践。适合想快速掌握Agent开发的开发者。

关键词： Agent开发 教程 入门
来源： @tom_doerr
链接： x.com/tom_doerr/s…

自主执行任务的AI终端工具

推出一个AI驱动的终端工具，能自主理解用户意图并执行任务。支持自然语言命令，降低了命令行操作的学习成本。

关键词： AI终端 自主执行 命令行
来源： @tom_doerr
链接： x.com/tom_doerr/s…

可靠AI Agent精选列表发布

发布了经过筛选的可靠AI Agent工具和框架列表，包含性能、安全性等关键指标。对需要选择Agent方案的开发者和企业很有参考价值。

关键词： Agent工具 精选列表 评测
来源： @tom_doerr
链接： x.com/tom_doerr/s…

AI Agent研究论文合集

整理汇总了深度研究Agent相关的论文集合，涵盖Agent架构、能力提升、多Agent协作等主题。为AI Agent研究和工程实践提供了学术参考。

关键词： Agent研究 论文合集 学术资源
来源： @tom_doerr
链接： x.com/tom_doerr/s…

Obsidian中编辑AI Agent技能

推出Obsidian插件，支持在笔记编辑器中直接编辑和管理AI Agent技能。将Agent开发集成到知识管理工作流中。

关键词： Obsidian Agent技能 编辑器
来源： @tom_doerr
链接： x.com/tom_doerr/s…

实时AI Agent仪表板工具

发布了一个实时监控和可视化AI Agent运行状态的仪表板。支持多Agent管理，展示任务进度、资源消耗、错误日志等信息。

关键词： Agent监控 仪表板 可视化
来源： @tom_doerr
链接： x.com/tom_doerr/s…

GitHub Issue分类Agent技能开发

开发了一个Agent技能来自动分类GitHub Issue。使用标签状态机进行智能化分类，帮助开发者快速组织和优先级排序任务。

关键词： GitHub自动化 Issue管理 Agent技能
来源： @mattpocockuk
链接： x.com/mattpococku…

行业动态

视频生成模型差异被过度夸大

分析对比了包括 Sora、Sora 2.0 等在内的多个 AI 视频生成模型，指出这些模型在输出效果上的差异被过度营销宣传。实际上在视频质量指标上，不同模型间的差距没有宣传中那么显著。

关键词： 视频生成 模型对比 Sora
来源： @fabianstelzer
链接： x.com/fabianstelz…

Claude Opus 4.6性能变化观察

开发者反馈Claude Opus 4.6近期表现与之前有显著差异，可能是推理参数调整或权重量化导致。值得关注模型性能的变化趋势。

关键词： Claude Opus 模型更新 性能
来源： @wey_gu
链接： x.com/wey_gu/stat…

API调用自动化迁移工作流

展示了使用AI Agent处理API破坏性更新的新工作流：转发更新给AI Agent，在10分钟内自动生成完整PR。大幅提升了代码维护效率。

关键词： API自动化 代码迁移 Agent工作流
来源： @elvissun
链接： x.com/elvissun/st…

AI编码平台首次公开安全审计

KiloClaw发布了首个AI编码平台的独立十日安全审计报告。这是业界首例公开审计，增加了用户对AI编码工具的信任。

关键词： AI安全 审计 代码安全
来源： @hasantoxr
链接： x.com/hasantoxr/s…

开源模型与闭源 API 比较需要公平评估

Hugging Face CEO 指出比较开源模型和闭源 API 产品时需要考虑差异。开源模型只是引擎或原材料，而 API 产品已包含完整的工程优化和处理流程。投入足够工程工作后，开源模型往往能达到更好的性价比。

关键词： 开源模型 API 模型部署
来源： @ClementDelangue
链接： x.com/ClementDela…

定制化模型已成为必需而非可选项

行业观察认为，对于许多应用场景，使用开箱即用的通用模型已不是最优方案。定制化模型训练正在成为 AI 应用的必然趋势，企业需要根据自身场景对模型进行微调和优化。

关键词： 定制模型 微调 应用优化
来源： @svpino
链接： x.com/svpino/stat…

RAG 技术远超搜索引擎概念

业内人士纠正对 RAG（检索增强生成）的常见误解。RAG 不仅是搜索引擎，而是深度集成知识检索和生成能力的技术方案，在企业应用中具有更广泛的价值。

关键词： RAG 检索增强生成 企业应用
来源： @svpino
链接： x.com/svpino/stat…

Claude Code 团队确认数据泄露源于人为错误

Anthropic Claude Code 团队确认昨日数据泄露事件源于人为错误。泄露代码已在 GitHub 获得 70k+ fork，分别有 Python 和 Rust 版本，无法完全撤回。从代码分析可见模型的框架工程（harness engineering）。

关键词： Claude 数据泄露 代码工程
来源： @Yuchenj_UW
链接： x.com/Yuchenj_UW/…

持续学习成为 AI 未来研究重点

持续学习（Continual Learning）被认为是 AI 发展的重要方向。相关学术会议 CoLLAs Conf 成为发表该领域前沿研究的主要学术平台，吸引了大量研究者投入。

关键词： 持续学习 CoLLAs 学术研究
来源： @hugo_larochelle
链接： x.com/hugo_laroch…

关注我，每天获取AI最新资讯。