每日 AI 项目与应用实例

每日 AI 项目与应用实例

每日 AI 项目与应用实例

分享最新 AI 资讯，收集 AI 模型、工具、框架等开源项目。

等 115 人订阅共816篇文章创建于2024-11-02

Amodal3R：3D重建领域新突破！这个模型让残破文物完美还原，3D重建结果助力文物修复

Amodal3R是一种创新的条件式3D生成模型，通过掩码加权多头交叉注意力机制和遮挡感知层，能够从部分可见的2D图像中重建完整3D形态，仅用合成数据训练即可实现真实场景的高精度重建。

1年前
269
点赞
评论

Amodal3R：3D重建领域新突破！这个模型让残破文物完美还原，3D重建结果助力文物修复

OpenDeepSearch：搜索引擎革命！这个开源深度搜索工具让AI代理直接读懂网页，复杂问题一键拆解

OpenDeepSearch是基于开源推理模型的深度搜索工具，通过语义重排和多源整合优化检索效果，支持与AI代理无缝集成，提供快速和专业两种搜索模式。

1年前
690
2
评论

OpenDeepSearch：搜索引擎革命！这个开源深度搜索工具让AI代理直接读懂网页，复杂问题一键拆解

AReaL-boba：仅用200条数据复现32B模型效果！蚂蚁清华联手打造强化学习+数据蒸馏框架，7B模型数学推理碾压同级

AReaL-boba是蚂蚁技术研究院与清华大学联合推出的强化学习训练框架，通过集成SGLang推理框架和数据蒸馏技术，显著提升训练效率并降低资源消耗，其7B模型在数学推理任务中刷新同尺寸模型性能纪录。

1年前
164
点赞
评论

AReaL-boba：仅用200条数据复现32B模型效果！蚂蚁清华联手打造强化学习+数据蒸馏框架，7B模型数学推理碾压同级

Hi3DGen：2D照片秒变高精度模型，毛孔级细节完爆Blender！港中文×字节×清华联手打造3D生成黑科技

Hi3DGen是由香港中文大学、字节跳动和清华大学联合研发的高保真3D几何生成框架，通过法线图中间表示实现细节丰富的3D模型生成，其双阶段生成流程显著提升了几何保真度。

1年前
332
点赞
评论

Hi3DGen：2D照片秒变高精度模型，毛孔级细节完爆Blender！港中文×字节×清华联手打造3D生成黑科技

32B小模型竟能吊打百亿参数？GLM-4-Air-0414：智谱AutoGLM沉思背后的模型，智能体开发迎来新纪元

GLM-4-Air-0414是智谱公司推出的320亿参数开源基座模型，通过优化预训练数据和对齐策略，在工具调用、联网搜索和代码生成等智能体任务中展现出卓越性能。

1年前
181
点赞
评论

32B小模型竟能吊打百亿参数？GLM-4-Air-0414：智谱AutoGLM沉思背后的模型，智能体开发迎来新纪元

AutoGLM沉思：智谱AI推出首个能"边想边干"的自主智能体！深度研究+多模态交互，颠覆传统AI工作模式

AutoGLM沉思是由智谱AI推出的一款开创性AI智能体，它突破性地将深度研究能力与实际操作能力融为一体，实现了AI从被动响应到主动执行的跨越式发展。

1年前
406
点赞
评论

AutoGLM沉思：智谱AI推出首个能"边想边干"的自主智能体！深度研究+多模态交互，颠覆传统AI工作模式

Qlib：华尔街颤抖！微软开源金融AI量化投资神器，助力智能投研

Qlib是微软亚洲研究院推出的开源AI量化投资平台，提供从数据处理、模型训练到组合管理的全流程支持，内置高性能数据基础设施和多种机器学习模型。

1年前
1.6k
3
评论

Qlib：华尔街颤抖！微软开源金融AI量化投资神器，助力智能投研

FinGPT：华尔街颤抖！用股价训练AI，开源金融大模型预测股价准确率碾压分析师，量化交易新利器

FinGPT是基于Transformer架构的开源金融大模型，通过RLHF技术和实时数据处理能力，支持情感分析、市场预测等核心功能，其LoRA微调技术大幅降低训练成本。

1年前
574
1
评论

FinGPT：华尔街颤抖！用股价训练AI，开源金融大模型预测股价准确率碾压分析师，量化交易新利器

智谱推出深度思考模型 GLM-Z1-Air：推理速度相较DeepSeek-R1提升8倍，成本降低至1/30

GLM-Z1-Air是智谱公司基于GLM-4-Air-0414开发的深度思考模型，通过推理数据增强和对齐优化，在数理推理性能上达到顶尖水平，同时大幅提升推理效率并降低运行成本。

1年前
274
点赞
评论

智谱推出深度思考模型 GLM-Z1-Air：推理速度相较DeepSeek-R1提升8倍，成本降低至1/30

智谱AI新突破！GLM-Z1-Rumination：新一代沉思模型，推动AI助手进入"高智商+高自主"的新阶段

GLM-Z1-Rumination是智谱推出的新一代沉思模型，通过扩展强化学习训练实现长程推理能力，支持动态工具调用与自我验证机制，显著提升AI自主研究能力。

1年前
299
点赞
评论

智谱AI新突破！GLM-Z1-Rumination：新一代沉思模型，推动AI助手进入"高智商+高自主"的新阶段

AI-ClothingTryOn：服装店老板连夜下架试衣间！基于Gemini开发的AI试衣应用，一键生成10种穿搭效果

AI-ClothingTryOn是基于Google Gemini技术的虚拟试衣应用，支持人物与服装照片智能合成，可生成多达10种试穿效果版本，并提供自定义提示词优化功能。

1年前
425
1
评论

AI-ClothingTryOn：服装店老板连夜下架试衣间！基于Gemini开发的AI试衣应用，一键生成10种穿搭效果

RoboBrain：智源开源具身大脑模型，32B参数实现跨机器人协作

智源研究院推出的开源具身大脑模型RoboBrain，通过多阶段训练策略和模块化设计，在任务规划、可操作区域感知和轨迹预测等机器人核心能力上实现突破性进展。

1年前
225
点赞
评论

RoboBrain：智源开源具身大脑模型，32B参数实现跨机器人协作

Vibe Draw：涂鸦秒变3D模型！开源AI建模神器解放创意生产力

Vibe Draw 是一款基于AI技术的开源3D建模工具，通过Next.js和FastAPI构建，能将用户绘制的2D草图智能转化为3D模型，并支持文本提示优化和场景构建。

1年前
265
点赞
评论

Vibe Draw：涂鸦秒变3D模型！开源AI建模神器解放创意生产力

PhysGen3D：清华等高校联合推出，单图秒变交互式3D场景

PhysGen3D是清华等高校联合开发的创新框架，通过单张图像重建3D场景并模拟物理行为，实现从静态图像到动态交互的突破性转换。

1年前
198
点赞
评论

PhysGen3D：清华等高校联合推出，单图秒变交互式3D场景

PaddleSpeech：百度飞桨开源语音处理神器，识别合成翻译全搞定

PaddleSpeech是百度飞桨团队推出的开源语音处理工具包，集成语音识别、合成、翻译等核心技术，基于PaddlePaddle框架提供高性能解决方案。

1年前
413
1
评论

PaddleSpeech：百度飞桨开源语音处理神器，识别合成翻译全搞定

ChatAnyone：阿里通义黑科技！实时风格化肖像视频生成框架震撼发布

阿里巴巴通义实验室推出的ChatAnyone框架，通过高效分层运动扩散模型和混合控制融合技术，实现高保真度、自然度的实时肖像视频生成。

1年前
143
点赞
评论

ChatAnyone：阿里通义黑科技！实时风格化肖像视频生成框架震撼发布

OmniSQL：开源文本到SQL神器！自然语言秒转查询到复杂多表连接等SQL需求

OmniSQL是开源的文本到SQL转换模型，通过创新的数据合成框架生成250万条高质量样本，支持7B/14B/32B三种模型版本，能处理从简单查询到复杂多表连接等各种SQL需求。

1年前
225
1
评论

OmniSQL：开源文本到SQL神器！自然语言秒转查询到复杂多表连接等SQL需求

ObjectMover：港大联合Adobe打造图像编辑黑科技，移动物体光影自动匹配

香港大学与Adobe联合研发的ObjectMover模型，通过视频生成先验迁移技术，实现图像中物体的自然移动、删除和插入，自动保持光影一致性。

1年前
125
点赞
评论

ObjectMover：港大联合Adobe打造图像编辑黑科技，移动物体光影自动匹配

EmotiVoice：网易开源AI语音合成黑科技，2000+音色情感可控

EmotiVoice是网易有道开源的多语言语音合成系统，支持中英文2000多种音色，通过提示词控制情感输出，提供Web界面和API接口，具备语音克隆等先进功能。

1年前
309
点赞
评论

EmotiVoice：网易开源AI语音合成黑科技，2000+音色情感可控

Math24o：SuperCLUE开源的高中奥数推理测评基准，85.71分屠榜

Math24o是首个针对高中奥林匹克数学竞赛的中文大模型测评基准，采用2024年预赛真题实现自动化评估，为模型数学推理能力提供客观衡量标准。

1年前
287
点赞
评论

Math24o：SuperCLUE开源的高中奥数推理测评基准，85.71分屠榜