AI 科技日报 (昆仑万维推出 AI 短剧创作平台:天工短剧工作台)
共收录 43 条资讯
AI模型
Holo3 模型在图形界面导航任务中超越大型闭源模型
华公司 AI 推出 Holo3 模型,在 GUI 导航任务上的性能超越了更大的闭源和开源模型。Holo3 基于 Qwen3.5,参数量 35B,已获得 transformers 官方支持,并采用免费许可证。展示了中等规模模型在特定任务上的竞争力。
关键词: Holo3 GUI导航 开源模型
来源: @mervenoyann
链接: x.com/mervenoyann…
Liquid AI 发布 LFM2.5-350M 智能体循环模型
Liquid AI 发布 LFM2.5-350M,一个 350M 参数的轻量级模型,专门针对可靠的数据提取和工具使用进行训练,能够执行智能体循环任务。展示了小参数模型在智能体应用中的可行性。
关键词: LFM2.5-350M 轻量级模型 智能体
来源: @lateinteraction
链接: x.com/lateinterac…
产品发布
Falcon Perception 和 Falcon OCR 开源发布
TII 团队开源发布 Falcon Perception(0.6B 多模态模型)和 Falcon OCR(0.3B OCR 模型),采用早期融合架构支持开放词表的指代表达式分割任务。两个轻量化的感知模型已可在 Hugging Face 获取。
关键词: Falcon Perception OCR 多模态模型 开源
来源: @mervenoyann
链接: x.com/mervenoyann…
Google开源时间序列基础模型TimesFM
Google开源了TimesFM,一个时间序列基础模型,可在任意数据上直接预测,无需特定数据集训练。该模型在100亿个真实世界时间点上训练,支持流量、天气、需求预测等场景,开箱即用。这为时间序列预测任务提供了通用的预训练方案。
关键词: 时间序列 基础模型 零训练 开源
来源: @hasantoxr
链接: x.com/hasantoxr/s…
Multica:AI Agent团队管理平台
Multica是一个多路复用信息计算Agent平台,让AI Agent成为一级团队成员。Agent可被分配任务、汇报进度、提出阻塞并交付代码。特别适合1-5人团队,统一管理散落在各个CLI中的Agent,任务、token消耗一目了然。这重新定义了人类和AI协作的工作模式。
关键词: Agent管理 团队协作 任务分配
来源: @jiayuan_jy
链接: x.com/jiayuan_jy/…
Claude Code新增团队模式体验优化
Claude Code团队模式新增tmux集成,提供更直观的UI界面。用户可轻松调整窗口大小和位置,相比原生tmux的复杂操作,体验有明显改进。这是Claude在AI编码辅助工具方面的持续优化。
关键词: Claude Code 团队协作 编码工具
来源: @nummanali
链接: x.com/nummanali/s…
AI Agent间实时通信能力发布
OpenAgents Workspace推出AI Agent间实时通信功能,允许多个Agent在同一工作空间内实时互相沟通。这解决了Agent协作中的通信障碍,支持更复杂的多Agent工作流。
关键词: 多Agent 实时通信 协作
来源: @hasantoxr
链接: x.com/hasantoxr/s…
CodePilot宠物助力功能上线
CodePilot推出宠物助力功能,完成度超过Claude Code。这是一个可成长的Agent工作流引导系统,帮助用户构建自己的Agent工作流程。相比现有方案,功能更完善。
关键词: CodePilot Agent工作流 编码助手
来源: @op7418
链接: x.com/op7418/stat…
AI原生游戏Dead Reckoning发布
AI原生游戏《Dead Reckoning: Reborn》在Yoroll AI平台上线。融合僵尸生存、动态故事和AI原生玩法,代表了游戏行业的新方向。
关键词: AI游戏 原生玩法 动态故事
来源: @CodeByPoonam
链接: x.com/CodeByPoona…
Qwen Opus 3.5 9B新版本发布
Qwen Opus 3.5 9B推出v3版本,可在8GB内存设备上运行,性能超过原生版本。这提升了小模型的部署灵活性。
关键词: Qwen 小模型 推理优化
来源: @leftcurvedev_
链接: x.com/ClementDela…
Hugging Face 发布 TRL v1,包含 75+ 训练方法
Hugging Face 正式发布 TRL v1,新增 75+ 种方法,包括 SFT、DPO、GRPO、异步 RL 等。该库从首次提交到现在用时 6 年,已成为大多数开源模型的后训练标准工具。新版本设计为面向未来,用户可通过 pip install trl 直接安装。
关键词: TRL 模型训练 开源工具
来源: @ClementDelangue
链接: x.com/ClementDela…
Claude Code 推出自动模式,现已支持企业和 API 用户
Anthropic 为 Claude Code 发布了自动模式(Auto mode),现已面向企业计划和 API 用户开放。用户可通过更新安装版本来使用该功能。这是 Claude 代码编辑能力的进一步增强。
关键词: Claude 代码编辑 自动模式
来源: @claudeai
链接: x.com/claudeai/st…
阿里通义实验室推出 Wan2.7-Image 图像模型
通义实验室发布 Wan2.7-Image 模型,支持 AI 图像生成与编辑功能。该模型进一步完善了阿里在 AI 视觉领域的能力,为用户提供更强大的图像处理工具。
关键词: 图像生成 图像编辑 Wan2.7
来源: ai-bot.cn
链接: mp.weixin.qq.com/s/Nyow0Ht8J…
世界模型研究进展:LeWorldModel 模型和数据集发布
Yann LeCun 团队推进世界模型研究,LeWorldModel 数据集和模型检查点现已在 Hugging Face 上线。配套代码已开源,包括 dino-wm 的实现版本。世界模型是构建具身 AI 的关键技术方向。
关键词: 世界模型 JEPA Hugging Face
来源: @ylecun
链接: x.com/ylecun/stat…
谷歌发布 Veo 3.1 Lite:视频生成成本降低超 50%
谷歌 DeepMind 发布了 Veo 3.1 Lite 视频生成模型,支持 4 至 8 秒视频生成,支持多种画幅和 1080p 输出。720p 分辨率起售价为每秒 0.05 美元,相比之前降低超 50%,进一步降低了视频生成技术的使用门槛,推动商业化应用。
关键词: 视频生成 Veo 3.1 Lite 谷歌 成本优化
来源: aibase.com
链接: news.aibase.com/zh/daily/26…
美团推出语音合成模型 LongCat-AudioDiT
美团 LongCat 团队推出语音合成模型 LongCat-AudioDiT,用于语音生成和音频处理任务。该模型是美团在音频生成领域的新进展,为内容创作和语音应用提供了新的技术方案。
关键词: 语音合成 LongCat-AudioDiT 美团 音频模型
来源: ai-bot.cn
链接: mp.weixin.qq.com/s/YaU20XkTS…
PixVerse 推出快应用、团队版和 CLI 工具
视频生成工具 PixVerse 发布了三项新功能:快应用便于快速上手,团队版支持协作工作,CLI 工具满足开发者需求。这些更新降低了使用门槛,扩展了应用场景。
关键词: PixVerse 视频生成 工具更新
来源: ai-bot.cn
链接: mp.weixin.qq.com/s/rCGvSj_8n…
昆仑万维推出 AI 短剧创作平台
昆仑万维发布天工短剧工作台,这是一个 AI 驱动的短剧创作平台。平台整合 AI 技术,面向内容创作者提供短视频剧本生成、素材制作等能力,降低短剧制作门槛。
关键词: 短剧创作 天工 昆仑万维 内容生成
来源: ai-bot.cn
链接: mp.weixin.qq.com/s/5crrr_94g…
研究论文
分子向量搜索展现新应用前景
研究表明向量搜索可应用于分子相似度匹配,使用嵌入向量替代传统分子指纹能发现隐藏的分子关系,甚至在 scaffold hopping(骨架跳跃)任务上有效。说明向量检索技术超越文本应用的广阔可能性。
关键词: 向量搜索 分子匹配 嵌入模型
来源: @qdrant_engine
链接: x.com/qdrant_engi…
LLM 在游戏关卡生成中的应用研究
研究团队展示了 LLM 在生成高质量游戏关卡方面的潜力,但需要提供充分的上下文和约束条件。该研究探索了大语言模型在创意内容生成领域的实际应用。
关键词: LLM 游戏关卡生成 内容创意
来源: @togelius
链接: x.com/togelius/st…
LLM越狱防御新方法:生物启发搜索
研究论文提出使用生物启发搜索算法来寻找LLM的越狱方法。这种方法受生物进化启发,能更高效地发现模型的安全漏洞,为改进模型安全防御提供了新思路。
关键词: LLM安全 越狱防御 生物启发
来源: @tom_doerr
链接: x.com/tom_doerr/s…
Stanford 和 MIT 论文:模型框架可产生 6 倍性能差异
Stanford 和 MIT 发布新论文研究模型框架(harness)的影响。研究表明,改变围绕固定 LLM 的框架可产生高达 6 倍的性能差异,说明工程设计在 AI 应用中的重要性。这对开发者定制化部署 AI 模型有重要启示。
关键词: 模型框架 性能优化 工程设计
来源: @omarsar0
链接: x.com/omarsar0/st…
Bonsai 模型:1.7B 到 8B 参数,1 比特量化压缩
研究展示了 1 比特权重量化技术的应用效果,Bonsai 模型可在参数量 1.7B 到 8B 的范围内,相比 bf16 精度实现 14 倍压缩。这对在资源受限的设备上部署 AI 模型意义重大。
关键词: 模型量化 1-bit 模型压缩
来源: @ClementDelangue
链接: x.com/ClementDela…
工具推荐
AutoClaw 本地优先智能体框架发布
新增的 Claw 风格智能体框架 AutoClaw 提供了本地优先的智能体运行环境,承诺完整的自主能力。为开发者提供了构建智能体应用的新选择。
关键词: AutoClaw 智能体框架 本地优先
来源: @TheTuringPost
链接: x.com/TheTuringPo…
代码库知识图谱自动生成工具
一个工具可自动为代码库生成Markdown格式的知识图谱,帮助开发者快速理解复杂项目结构。这对于代码导航和项目文档化很有实用价值。
关键词: 代码分析 知识图谱 文档化
来源: @tom_doerr
链接: x.com/tom_doerr/s…
自主AI Agent六周入门教程发布
发布了一份六周内构建自主AI Agent的完整教程,包含实战案例和最佳实践。适合想快速掌握Agent开发的开发者。
关键词: Agent开发 教程 入门
来源: @tom_doerr
链接: x.com/tom_doerr/s…
自主执行任务的AI终端工具
推出一个AI驱动的终端工具,能自主理解用户意图并执行任务。支持自然语言命令,降低了命令行操作的学习成本。
关键词: AI终端 自主执行 命令行
来源: @tom_doerr
链接: x.com/tom_doerr/s…
可靠AI Agent精选列表发布
发布了经过筛选的可靠AI Agent工具和框架列表,包含性能、安全性等关键指标。对需要选择Agent方案的开发者和企业很有参考价值。
关键词: Agent工具 精选列表 评测
来源: @tom_doerr
链接: x.com/tom_doerr/s…
AI Agent研究论文合集
整理汇总了深度研究Agent相关的论文集合,涵盖Agent架构、能力提升、多Agent协作等主题。为AI Agent研究和工程实践提供了学术参考。
关键词: Agent研究 论文合集 学术资源
来源: @tom_doerr
链接: x.com/tom_doerr/s…
Obsidian中编辑AI Agent技能
推出Obsidian插件,支持在笔记编辑器中直接编辑和管理AI Agent技能。将Agent开发集成到知识管理工作流中。
关键词: Obsidian Agent技能 编辑器
来源: @tom_doerr
链接: x.com/tom_doerr/s…
实时AI Agent仪表板工具
发布了一个实时监控和可视化AI Agent运行状态的仪表板。支持多Agent管理,展示任务进度、资源消耗、错误日志等信息。
关键词: Agent监控 仪表板 可视化
来源: @tom_doerr
链接: x.com/tom_doerr/s…
GitHub Issue分类Agent技能开发
开发了一个Agent技能来自动分类GitHub Issue。使用标签状态机进行智能化分类,帮助开发者快速组织和优先级排序任务。
关键词: GitHub自动化 Issue管理 Agent技能
来源: @mattpocockuk
链接: x.com/mattpococku…
行业动态
视频生成模型差异被过度夸大
分析对比了包括 Sora、Sora 2.0 等在内的多个 AI 视频生成模型,指出这些模型在输出效果上的差异被过度营销宣传。实际上在视频质量指标上,不同模型间的差距没有宣传中那么显著。
关键词: 视频生成 模型对比 Sora
来源: @fabianstelzer
链接: x.com/fabianstelz…
Claude Opus 4.6性能变化观察
开发者反馈Claude Opus 4.6近期表现与之前有显著差异,可能是推理参数调整或权重量化导致。值得关注模型性能的变化趋势。
关键词: Claude Opus 模型更新 性能
来源: @wey_gu
链接: x.com/wey_gu/stat…
API调用自动化迁移工作流
展示了使用AI Agent处理API破坏性更新的新工作流:转发更新给AI Agent,在10分钟内自动生成完整PR。大幅提升了代码维护效率。
关键词: API自动化 代码迁移 Agent工作流
来源: @elvissun
链接: x.com/elvissun/st…
AI编码平台首次公开安全审计
KiloClaw发布了首个AI编码平台的独立十日安全审计报告。这是业界首例公开审计,增加了用户对AI编码工具的信任。
关键词: AI安全 审计 代码安全
来源: @hasantoxr
链接: x.com/hasantoxr/s…
开源模型与闭源 API 比较需要公平评估
Hugging Face CEO 指出比较开源模型和闭源 API 产品时需要考虑差异。开源模型只是引擎或原材料,而 API 产品已包含完整的工程优化和处理流程。投入足够工程工作后,开源模型往往能达到更好的性价比。
关键词: 开源模型 API 模型部署
来源: @ClementDelangue
链接: x.com/ClementDela…
定制化模型已成为必需而非可选项
行业观察认为,对于许多应用场景,使用开箱即用的通用模型已不是最优方案。定制化模型训练正在成为 AI 应用的必然趋势,企业需要根据自身场景对模型进行微调和优化。
关键词: 定制模型 微调 应用优化
来源: @svpino
链接: x.com/svpino/stat…
RAG 技术远超搜索引擎概念
业内人士纠正对 RAG(检索增强生成)的常见误解。RAG 不仅是搜索引擎,而是深度集成知识检索和生成能力的技术方案,在企业应用中具有更广泛的价值。
关键词: RAG 检索增强生成 企业应用
来源: @svpino
链接: x.com/svpino/stat…
Claude Code 团队确认数据泄露源于人为错误
Anthropic Claude Code 团队确认昨日数据泄露事件源于人为错误。泄露代码已在 GitHub 获得 70k+ fork,分别有 Python 和 Rust 版本,无法完全撤回。从代码分析可见模型的框架工程(harness engineering)。
关键词: Claude 数据泄露 代码工程
来源: @Yuchenj_UW
链接: x.com/Yuchenj_UW/…
持续学习成为 AI 未来研究重点
持续学习(Continual Learning)被认为是 AI 发展的重要方向。相关学术会议 CoLLAs Conf 成为发表该领域前沿研究的主要学术平台,吸引了大量研究者投入。
关键词: 持续学习 CoLLAs 学术研究
来源: @hugo_larochelle
链接: x.com/hugo_laroch…
关注我,每天获取AI最新资讯。
