每日 AI 项目与应用实例

每日 AI 项目与应用实例

每日 AI 项目与应用实例

分享最新 AI 资讯，收集 AI 模型、工具、框架等开源项目。

等 115 人订阅共816篇文章创建于2024-11-02

机器人训练师狂喜！Infinite Mobility：上海AI Lab造物神器1秒生成可动家具，成本只要1分钱

上海AI Lab推出的Infinite Mobility采用程序化生成技术，可高效生成22类高质量可交互物体，单个生成仅需1秒且成本低至0.01元，已应用于机器人仿真训练等领域。

1年前
242
点赞
评论

机器人训练师狂喜！Infinite Mobility：上海AI Lab造物神器1秒生成可动家具，成本只要1分钱

微软开源Windows桌面智能体操作系统！UFO²：一句话调度多应用，自动协同工作

UFO²是微软推出的Windows桌面多智能体操作系统，通过中央HostAgent协调多个AppAgent实现跨应用任务自动化，结合GUI交互和原生API调用提升执行效率，支持虚拟桌面隔离运行。

1年前
566
点赞
评论

微软开源Windows桌面智能体操作系统！UFO²：一句话调度多应用，自动协同工作

让AI读懂K线图！ChatTS-14B：字节开源的时间序列理解和推理大模型，自然语言提问秒解趋势密码！

ChatTS-14B是字节跳动开源的时间序列专用大模型，基于Qwen2.5-14B微调优化，通过合成数据对齐技术显著提升分析能力，支持自然语言交互完成预测推理等复杂任务。

1年前
455
1
评论

让AI读懂K线图！ChatTS-14B：字节开源的时间序列理解和推理大模型，自然语言提问秒解趋势密码！

全球首款开源通用型AI智能体上线！Suna：自动处理Excel/爬数据/写报告等复杂任务一句话搞定

Suna是由Kortix推出的开源通用型AI智能体项目，通过自然语言交互实现浏览器自动化、文件管理、数据分析等复杂任务处理，支持自托管部署，为研究分析和日常工作提供智能辅助。

1年前
437
点赞
评论

全球首款开源通用型AI智能体上线！Suna：自动处理Excel/爬数据/写报告等复杂任务一句话搞定

Yuxi-Know：开源智能问答系统，基于大模型RAG与知识图谱技术快速构建知识库

Yuxi-Know是一个结合大模型RAG知识库与知识图谱技术的智能问答平台，支持多格式文档处理和复杂知识关系查询，具备多模型适配和智能体拓展能力。

1年前
532
点赞
评论

Yuxi-Know：开源智能问答系统，基于大模型RAG与知识图谱技术快速构建知识库

AI生成视频告别剪辑拼接！MAGI-1：开源自回归视频生成模型，支持一镜到底的长视频生成

MAGI-1是Sand AI开源的全球首个自回归视频生成大模型，采用创新架构实现高分辨率流畅视频生成，支持无限扩展和精细控制，在物理行为预测方面表现突出。

1年前
668
2
评论

AI生成视频告别剪辑拼接！MAGI-1：开源自回归视频生成模型，支持一镜到底的长视频生成

谷歌开源量化模型 Gemma 3 QAT：显存需求直降75%，消费级GPU轻松跑大模型！

Gemma 3 QAT是谷歌最新推出的量化优化开源模型，通过量化感知训练技术显著降低显存需求，同时保持高性能，使大模型能在消费级硬件上高效运行。

1年前
403
点赞
评论

谷歌开源量化模型 Gemma 3 QAT：显存需求直降75%，消费级GPU轻松跑大模型！

从虚拟到现实！Aether：上海AI Lab开源的生成式世界模型，4D动态重建+视觉规划全搞定

Aether是上海AI Lab开源的生成式世界模型，通过三维时空建模与生成式建模的深度融合，实现了4D动态重建、动作条件视频预测和目标导向视觉规划三大核心能力。

1年前
524
点赞
评论

从虚拟到现实！Aether：上海AI Lab开源的生成式世界模型，4D动态重建+视觉规划全搞定

快速生成商业级高清图！SimpleAR：复旦联合字节推出图像生成黑科技，5亿参数秒出高清大图

SimpleAR是复旦大学与字节Seed团队联合研发的自回归图像生成模型，仅用5亿参数即可生成1024×1024分辨率的高质量图像，在GenEval等基准测试中表现优异。

1年前
173
点赞
评论

快速生成商业级高清图！SimpleAR：复旦联合字节推出图像生成黑科技，5亿参数秒出高清大图

视觉分词器突破天花板！GigaTok：港大字节联手打造3B参数视觉分词器，突破图像生成瓶颈

GigaTok是香港大学与字节跳动联合研发的3B参数视觉分词器，通过语义正则化技术和创新架构设计，解决了图像重建与生成质量间的矛盾，显著提升自回归模型的表示学习能力。

1年前
248
点赞
评论

视觉分词器突破天花板！GigaTok：港大字节联手打造3B参数视觉分词器，突破图像生成瓶颈

只管提需求，AI来帮你修图！ImagePulse：魔搭开源图像处理神器！原子级数据集让AI秒懂修图指令

ImagePulse是魔搭社区推出的开源项目，通过构建原子能力数据集支持下一代图像理解与生成模型，包含修改、缩放、风格迁移等专项数据集。

1年前
462
1
评论

只管提需求，AI来帮你修图！ImagePulse：魔搭开源图像处理神器！原子级数据集让AI秒懂修图指令

这个AI能拍无限长电影！SkyReels-V2：昆仑万维开源无限时长电影生成模型！

SkyReels-V2是昆仑万维推出的突破性视频生成模型，基于扩散强迫框架和多模态大语言模型技术，支持生成理论上无限时长的连贯视频内容，在影视制作、广告创意等领域展现强大潜力。

1年前
471
点赞
评论

这个AI能拍无限长电影！SkyReels-V2：昆仑万维开源无限时长电影生成模型！

音乐人必看！OpenUtau：开源AI歌声合成神器，快速打造专业级虚拟歌手，中文日文无缝切换

OpenUtau是一款开源的歌声合成工具，兼容UTAU音源库和重采样器，支持多语言界面及预渲染功能，让音乐创作更加高效便捷。

1年前
1.8k
1
评论

音乐人必看！OpenUtau：开源AI歌声合成神器，快速打造专业级虚拟歌手，中文日文无缝切换

FastAPI开发者福音！FastAPI-MCP：将FastAPI秒变MCP服务器的开源神器，无需配置自动转换！

FastAPI-MCP是一款能将FastAPI应用端点自动转换为符合模型上下文协议(MCP)的开源工具，支持零配置自动发现接口并保留完整文档和模式定义。

1年前
377
点赞
评论

FastAPI开发者福音！FastAPI-MCP：将FastAPI秒变MCP服务器的开源神器，无需配置自动转换！

微软黑科技让《我的世界》自主探索！MineWorld：微软开源实时交互式世界模型，实时生成游戏画面!

MineWorld是微软研究院基于《我的世界》开发的实时交互式世界模型，采用视觉-动作自回归Transformer架构，通过创新的并行解码算法实现每秒4-7帧的生成速度，在视频质量、可控性和推理速度上

1年前
246
1
评论

微软黑科技让《我的世界》自主探索！MineWorld：微软开源实时交互式世界模型，实时生成游戏画面!

斯坦福黑科技让笔记本GPU也能玩转AI视频生成！FramePack：压缩输入帧上下文长度！仅需6GB显存即可生成高清动画

斯坦福大学推出的FramePack技术通过压缩输入帧上下文长度，解决视频生成中的"遗忘"和"漂移"问题，仅需6GB显存即可在普通笔记本上实时生成高清视频。

1年前
712
1
评论

斯坦福黑科技让笔记本GPU也能玩转AI视频生成！FramePack：压缩输入帧上下文长度！仅需6GB显存即可生成高清动画

基于DeepSeek R1改进的AI安全模型！MAI-DS-R1：微软开源AI安全卫士，敏感话题响应率高达99.3%

微软开源的MAI-DS-R1是基于DeepSeek R1改进的AI模型，通过后训练优化将敏感话题响应率提升至99.3%，同时将有害内容风险降低50%，保持原版推理能力并增强多语言支持。

1年前
286
点赞
评论

基于DeepSeek R1改进的AI安全模型！MAI-DS-R1：微软开源AI安全卫士，敏感话题响应率高达99.3%

用AI体验瞬息全宇宙！InstantCharacter：腾讯混元开源角色定制图像生成神器，一键打造你的专属角色

InstantCharacter是腾讯混元团队基于扩散Transformer架构开发的开源图像生成工具，通过可扩展适配器和大规模角色数据集实现高保真、角色一致性的图像生成，支持单图输入和文本控制。

1年前
439
点赞
评论

用AI体验瞬息全宇宙！InstantCharacter：腾讯混元开源角色定制图像生成神器，一键打造你的专属角色

AI视频生成也能自动补全！Wan2.1 FLF2V：阿里通义开源14B视频生成模型，用首尾两帧生成过渡动画

万相首尾帧模型是阿里通义开源的14B参数规模视频生成模型，基于DiT架构和高效视频压缩VAE，能够根据首尾帧图像自动生成5秒720p高清视频，支持多种风格变换和细节复刻。

1年前
640
点赞
评论

AI视频生成也能自动补全！Wan2.1 FLF2V：阿里通义开源14B视频生成模型，用首尾两帧生成过渡动画

数学编程视觉全能王！OpenAI 推出 o4-mini：视觉推理能力碾压前代，屠榜AIME

OpenAI最新推出的o4-mini小型推理模型在数学、编程和视觉任务中表现卓越，支持多模态推理和工具调用，性能超越前代的同时保持高性价比。

1年前
133
点赞
评论

数学编程视觉全能王！OpenAI 推出 o4-mini：视觉推理能力碾压前代，屠榜AIME