每日 AI 项目与应用实例

每日 AI 项目与应用实例

每日 AI 项目与应用实例

分享最新 AI 资讯，收集 AI 模型、工具、框架等开源项目。

等 115 人订阅共816篇文章创建于2024-11-02

LangBot：无缝集成到QQ、微信等消息平台的AI聊天机器人平台

LangBot 是一个开源的多模态即时聊天机器人平台，支持多种即时通信平台和大语言模型，具备多模态交互、插件扩展和Web管理面板等功能。

1年前
1.4k
4
评论

LangBot：无缝集成到QQ、微信等消息平台的AI聊天机器人平台

Sonic：自动对齐音频与唇部动作，一键合成配音动画！腾讯与浙大联合推出音频驱动肖像动画生成框架

Sonic 是由腾讯和浙江大学联合开发的音频驱动肖像动画框架，支持逼真的唇部同步、丰富的表情和头部动作、长时间稳定生成，并提供用户可调节性。

1年前
405
点赞
评论

Sonic：自动对齐音频与唇部动作，一键合成配音动画！腾讯与浙大联合推出音频驱动肖像动画生成框架

DeepRant：一款专为国际游戏玩家设计的翻译工具，一键翻译聊天对话，无需切出游戏

一款专为游戏玩家设计的多语言快捷翻译工具，支持多种翻译模式和主流语言，基于Tauri和React开发。

1年前
442
点赞
评论

DeepRant：一款专为国际游戏玩家设计的翻译工具，一键翻译聊天对话，无需切出游戏

FireRedASR：精准识别普通话、方言和歌曲歌词！小红书开源工业级自动语音识别模型

小红书开源的工业级自动语音识别模型，支持普通话、中文方言和英语，采用 Encoder-Adapter-LLM 和 AED 架构，实现 SOTA 性能。

1年前
1.3k
2
评论

FireRedASR：精准识别普通话、方言和歌曲歌词！小红书开源工业级自动语音识别模型

Ola：清华联合腾讯等推出的全模态语言模型！实现对文本、图像、视频和音频的全面理解

Ola 是由清华大学、腾讯 Hunyuan 研究团队和新加坡国立大学 S-Lab 合作开发的全模态语言模型，支持文本、图像、视频和音频输入，并具备实时流式解码功能。

1年前
177
1
评论

Ola：清华联合腾讯等推出的全模态语言模型！实现对文本、图像、视频和音频的全面理解

Hibiki：实时语音翻译模型打破语言交流障碍！支持将语音实时翻译成其他语言的语音或文本

Hibiki 是由 Kyutai Labs 开发的实时语音翻译模型，能够将一种语言的语音实时翻译成另一种语言的语音或文本，支持高保真度和低延迟。

1年前
453
点赞
评论

Hibiki：实时语音翻译模型打破语言交流障碍！支持将语音实时翻译成其他语言的语音或文本

Agno：18.7K Star！快速构建多模态智能体的轻量级框架，运行速度比LangGraph快5000倍！

Agno 是一个用于构建多模态智能体的轻量级框架，支持文本、图像、音频和视频等多种数据模态，能够快速创建智能体并实现高效协作。

1年前
1.7k
8
评论

Agno：18.7K Star！快速构建多模态智能体的轻量级框架，运行速度比LangGraph快5000倍！

Eino：字节跳动开源基于Golang的AI应用开发框架，组件化设计助力构建AI应用

Eino 是字节跳动开源的大模型应用开发框架，帮助开发者高效构建基于大模型的 AI 应用。支持组件化设计、流式处理和可视化开发工具。

1年前
3.2k
3
评论

Eino：字节跳动开源基于Golang的AI应用开发框架，组件化设计助力构建AI应用

exo：22.1K Star！一个能让任何人利用日常设备构建AI集群的强大工具，组成一个虚拟GPU在多台设备上并行运行模型

exo 是一款由 exo labs 维护的开源项目，能够让你利用家中的日常设备（如 iPhone、iPad、Android、Mac 和 Linux）构建强大的 AI 集群，支持多种大模型和分布式推理。

1年前
955
1
评论

exo：22.1K Star！一个能让任何人利用日常设备构建AI集群的强大工具，组成一个虚拟GPU在多台设备上并行运行模型

AstrBot：轻松将大模型接入QQ、微信等消息平台，打造多功能AI聊天机器人的开发框架，附详细教程

AstrBot 是一个开源的多平台聊天机器人及开发框架，支持多种大语言模型和消息平台，具备多轮对话、语音转文字等功能。

1年前
3.1k
5
评论

AstrBot：轻松将大模型接入QQ、微信等消息平台，打造多功能AI聊天机器人的开发框架，附详细教程

Lumina-Image 2.0：上海 AI Lab 开源的统一图像生成模型，支持生成多分辨率、多风格的图像

Lumina-Image 2.0 是上海 AI Lab 开源的高效统一图像生成模型，参数量为26亿，基于扩散模型和Transformer架构，支持多种推理求解器，能生成高质量、多风格的图像。

1年前
339
点赞
评论

Lumina-Image 2.0：上海 AI Lab 开源的统一图像生成模型，支持生成多分辨率、多风格的图像

BEN2：一键快速抠图！自动移除图像和视频中的背景，支持在线使用

BEN2 是由 Prama LLC 开发的深度学习模型，专注于从图像和视频中快速移除背景并提取前景，支持高分辨率处理和GPU加速。

1年前
899
2
评论

BEN2：一键快速抠图！自动移除图像和视频中的背景，支持在线使用

Repomix：8.1K Star！轻松将整个代码库打包为AI友好格式的开源工具，使代码库更易于AI理解

Repomix 是一款强大的工具，能够将整个代码库打包成AI友好的单个文件，支持多种输出格式和安全检查。

1年前
392
点赞
评论

Repomix：8.1K Star！轻松将整个代码库打包为AI友好格式的开源工具，使代码库更易于AI理解

LIMO：上海交大推出高效推理方法，仅需817条训练样本就能激活大语言模型的复杂推理能力

LIMO 是由上海交通大学推出的一种高效推理方法，通过极少量的高质量训练样本激活大语言模型的复杂推理能力。

1年前
394
点赞
评论

LIMO：上海交大推出高效推理方法，仅需817条训练样本就能激活大语言模型的复杂推理能力

AnythingLLM：34K Star！一键上传文件轻松打造个人知识库，构建只属于你的AI助手，附详细部署教程

AnythingLLM 是一个全栈应用程序，能够将文档、资源转换为上下文，支持多种大语言模型和向量数据库，提供智能聊天功能。

1年前
1.8k
3
1

AnythingLLM：34K Star！一键上传文件轻松打造个人知识库，构建只属于你的AI助手，附详细部署教程

JoyGen：用音频生成3D说话人脸视频，快速生成逼真的唇部同步视频

JoyGen 是京东和香港大学联合推出的音频驱动的3D说话人脸视频生成框架，支持多语言、高质量视觉效果和精确的唇部与音频同步。

1年前
512
点赞
评论

JoyGen：用音频生成3D说话人脸视频，快速生成逼真的唇部同步视频

DiffSplat：输入文本或图像，2秒内生成3D建模！北大联合字节开源3D建模生成框架

DiffSplat 是由北京大学和字节跳动联合推出的一个高效 3D 生成框架，能够在 1-2 秒内从文本提示或单视图图像生成高质量的 3D 高斯点阵，并确保多视图下的一致性。

1年前
237
1
1

DiffSplat：输入文本或图像，2秒内生成3D建模！北大联合字节开源3D建模生成框架

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

MNN-LLM App 是阿里巴巴基于 MNN-LLM 框架开发的 Android 应用，支持多模态交互、多种主流模型选择、离线运行及性能优化。

1年前
1.3k
2
评论

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

Open-Deep-Research：开源复现版 Deep Research，支持切换多种大模型，不再依赖 OpenAI o3

Open Deep Research 是一个开源的 AI 智能体，支持多种语言模型，具备实时数据提取、多源数据整合和AI推理功能。

1年前
851
1
评论

Open-Deep-Research：开源复现版 Deep Research，支持切换多种大模型，不再依赖 OpenAI o3

OpenDeepResearcher：开源 AI 研究工具，自动完成搜索、评估、提取和生成报告

OpenDeepResearcher 是一款开源 AI 研究工具，支持异步处理、去重功能和 LLM 驱动的决策，帮助用户高效完成复杂的信息查询和分析任务。

1年前
274
1
评论

OpenDeepResearcher：开源 AI 研究工具，自动完成搜索、评估、提取和生成报告