每日 AI 项目与应用实例

每日 AI 项目与应用实例

每日 AI 项目与应用实例

分享最新 AI 资讯，收集 AI 模型、工具、框架等开源项目。

等 115 人订阅共816篇文章创建于2024-11-02

科研论文翻译神器！BabelDOC：开源AI工具让PDF论文秒变双语对照，公式图表全保留

BabelDOC 是一款专为科学论文设计的开源AI翻译工具，采用先进的无损解析技术和智能布局识别算法，能完美保留原文格式并生成双语对照翻译。

1年前
501
点赞
评论

科研论文翻译神器！BabelDOC：开源AI工具让PDF论文秒变双语对照，公式图表全保留

音乐人狂喜！AbletonMCP：让AI帮你写歌，一句话生成专业编曲，Demo级作品秒出

AbletonMCP 是一个开源项目，通过模型上下文协议（MCP）将 Ableton Live 与 Claude AI 连接，实现 AI 辅助音乐制作，支持创建、修改 MIDI 和音频轨道等操作。

1年前
303
点赞
评论

音乐人狂喜！AbletonMCP：让AI帮你写歌，一句话生成专业编曲，Demo级作品秒出

AI做奥赛题能及格吗？OlympicArena：上海交大推出多学科认知推理基准测试框架，挑战AI极限

OlympicArena是由上海交大等机构联合推出的多学科认知推理基准测试框架，包含7大学科11,163道奥林匹克竞赛级题目，通过细粒度评估推动AI向超级智能发展。

1年前
159
点赞
评论

AI做奥赛题能及格吗？OlympicArena：上海交大推出多学科认知推理基准测试框架，挑战AI极限

这个模型让AI角色会说话还会演！MoCha：Meta联手滑铁卢大学打造对话角色视频生成黑科技

MoCha是由Meta与滑铁卢大学联合开发的端到端对话角色视频生成模型，通过创新的语音-视频窗口注意力机制实现精准的唇语同步和全身动作生成。

1年前
170
点赞
评论

这个模型让AI角色会说话还会演！MoCha：Meta联手滑铁卢大学打造对话角色视频生成黑科技

清华联合DeepSeek推出奖励模型新标杆！DeepSeek-GRM：让AI学会自我批评，推理性能越跑越强

DeepSeek-GRM是由DeepSeek与清华大学联合研发的通用奖励模型，采用点式生成式奖励建模和自我原则点评调优技术，显著提升了模型质量和推理扩展性。

1年前
449
点赞
评论

清华联合DeepSeek推出奖励模型新标杆！DeepSeek-GRM：让AI学会自我批评，推理性能越跑越强

Dolphin：40语种+22方言！清华联合海天瑞声推出的语音识别大模型，识别精度超Whisper两代

Dolphin是清华大学与海天瑞声联合研发的语音识别大模型，支持40种东方语言和22种中文方言，采用CTC-Attention混合架构，词错率显著低于同类模型。

1年前
589
2
评论

Dolphin：40语种+22方言！清华联合海天瑞声推出的语音识别大模型，识别精度超Whisper两代

EasyControl Ghibli：在线体验一键生成宫崎骏动画风，开源AI模型让你的照片秒变吉卜力

EasyControl Ghibli是基于扩散模型的AI工具，通过条件注入技术将普通照片转化为吉卜力动画风格，仅需100张训练样本即可精准还原标志性光影与色调特征。

1年前
351
点赞
评论

EasyControl Ghibli：在线体验一键生成宫崎骏动画风，开源AI模型让你的照片秒变吉卜力

OPPO联合港科大推出多模态推理优化框架 OThink-MR1：让AI学会『举一反三』，几何推理准确率暴增

OThink-MR1是OPPO与港科大联合研发的多模态优化框架，通过动态KL散度策略和奖励模型显著提升模型在视觉计数等复杂任务中的泛化能力。

1年前
146
点赞
评论

OPPO联合港科大推出多模态推理优化框架 OThink-MR1：让AI学会『举一反三』，几何推理准确率暴增

SWEET-RL：8B小模型暴打GPT-4？Meta开源强化学习黑科技，多轮任务成功率飙升6%

Meta最新开源的SWEET-RL框架通过优化多轮交互任务的信用分配机制，使Llama-3.1-8B模型在协作推理任务中的表现提升6%，性能达到顶尖大模型水平。

1年前
182
1
评论

SWEET-RL：8B小模型暴打GPT-4？Meta开源强化学习黑科技，多轮任务成功率飙升6%

WorldScore：斯坦福开源世界生成模型评估新标杆：3000样本+九维指标，视频/4D/3D模型一网打尽

WorldScore是斯坦福大学提出的首个统一评估世界生成模型的基准测试，通过基于相机轨迹的布局规范和3000个多样化样本，全面评测生成内容的可控性、质量与动态性。

1年前
233
点赞
评论

WorldScore：斯坦福开源世界生成模型评估新标杆：3000样本+九维指标，视频/4D/3D模型一网打尽

DreamActor-M1：字节跳动推出AI动画黑科技，静态照片秒变生动视频

DreamActor-M1是字节跳动研发的AI图像动画框架，通过混合引导机制实现高保真人物动画生成，支持多语言语音驱动和形状自适应功能。

1年前
440
1
评论

DreamActor-M1：字节跳动推出AI动画黑科技，静态照片秒变生动视频

Mini DALL·E 3：设计师福音！开源AI绘画神器：对话式修图+智能问答，草图秒变商业大作

Mini DALL·E 3是由北京理工大学联合多所高校开发的交互式文生图框架，通过多轮对话实现高质量图像生成与编辑，结合LLM和T2I模型技术，无需额外训练即可生成符合描述的图像。

1年前
197
点赞
评论

Mini DALL·E 3：设计师福音！开源AI绘画神器：对话式修图+智能问答，草图秒变商业大作

DeepSite：基于DeepSeek的开源AI前端开发神器，一键生成游戏/网页代码

DeepSite是基于DeepSeek-V3模型的在线开发工具，无需配置环境即可通过自然语言描述快速生成游戏、网页和应用代码，并支持实时预览效果，显著降低开发门槛。

1年前
1.7k
2
1

DeepSite：基于DeepSeek的开源AI前端开发神器，一键生成游戏/网页代码

PaperBench：OpenAI开源AI智能体评测基准，8316节点精准考核复现能力

PaperBench是OpenAI推出的开源评测框架，通过8316个评分节点系统评估AI智能体复现学术论文的能力，涵盖理论理解、代码实现到实验执行全流程。

1年前
380
点赞
评论

PaperBench：OpenAI开源AI智能体评测基准，8316节点精准考核复现能力

Cua：Mac用户狂喜！这个开源框架让AI直接接管你的电脑，快速实现AI自动化办公

Cua是一个结合高性能虚拟化与AI代理能力的开源框架，能在Apple Silicon上以接近原生性能运行虚拟机，并让AI直接操作系统应用。

1年前
1.5k
9
评论

Cua：Mac用户狂喜！这个开源框架让AI直接接管你的电脑，快速实现AI自动化办公

AutoAgent：无需编程！接入DeepSeek用自然语言创建和部署AI智能体！港大开源框架让AI智能体开发变成填空题

香港大学推出的AutoAgent框架通过自然语言交互实现零代码创建AI智能体，支持多模型接入与自动化工作流编排，在GAIA基准测试中表现优异。

1年前
451
1
评论

AutoAgent：无需编程！接入DeepSeek用自然语言创建和部署AI智能体！港大开源框架让AI智能体开发变成填空题

Text to Bark：让狗狗听懂人话！全球首个AI"狗语"生成器，137种狗狗口音任君挑选

ElevenLabs推出的Text to Bark是全球首个能将文本转换为逼真狗吠声的AI模型，支持多种犬种选择并适配智能家居设备，其核心技术基于深度神经网络训练。

1年前
451
点赞
评论

Text to Bark：让狗狗听懂人话！全球首个AI"狗语"生成器，137种狗狗口音任君挑选

Runway Gen-4：AI视频生成新纪元！高保真特效一键生成影视级内容

Runway Gen-4是新一代AI视频生成模型，通过参考图和文字指令即可生成具有物理真实感、叙事连贯性的高质量视频内容，支持与实拍素材无缝融合。

1年前
255
点赞
评论

Runway Gen-4：AI视频生成新纪元！高保真特效一键生成影视级内容

Amazon Nova Act：网页操作全自动！亚马逊黑科技把浏览器变AI机器人，请假/订餐/写邮件一键搞定

Amazon Nova Act是亚马逊AGI实验室推出的通用AI代理系统，通过原子化分解网页操作任务并配合Playwright实现高可靠性浏览器自动化，其配套SDK支持开发者快速构建智能体应用原型。

1年前
226
点赞
评论

Amazon Nova Act：网页操作全自动！亚马逊黑科技把浏览器变AI机器人，请假/订餐/写邮件一键搞定

Neo-1：全球首个原子级生成式AI模型！这个AI模型把10年药物研发周期压缩到1个月

VantAI推出的Neo-1是全球首个统一分子生成与原子级结构预测的AI模型，采用潜在空间扩散技术，结合大规模训练和定制数据集，显著提升药物研发效率。

1年前
221
点赞
评论

Neo-1：全球首个原子级生成式AI模型！这个AI模型把10年药物研发周期压缩到1个月