首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
每日 AI 项目与应用实例
蚝油菜花
创建于2024-11-02
订阅专栏
分享最新 AI 资讯,收集 AI 模型、工具、框架等开源项目。
等 102 人订阅
共816篇文章
创建于2024-11-02
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
MeetingMind:AI 会议助手,支持自动转录音频并提取会议中的关键信息
MeetingMind 是一款 AI 驱动的会议助手,能够自动转录音频并提取关键信息,帮助用户高效管理会议内容。
Amphion:开源的全能 AI 音频项目,支持音频、音乐和语音等多种生成和转换任务
Amphion 是一个开源的音频、音乐和语音生成工具包,支持多种生成任务,包括文本转语音、歌声合成、语音转换等,并提供经典模型的可视化功能。
Self-Lengthen:阿里千问开源提升 LLM 长文本生成能力的训练框架
Self-Lengthen 是一个创新的迭代训练框架,旨在提升大型语言模型生成长文本的能力,通过生成器和扩展器的协同工作,逐步训练模型处理更长的输出。
VirSci:开源多智能体协作平台,模拟科学家团队的合作过程加速科研创新
VirSci 是上海人工智能实验室推出的多智能体协作平台系统,旨在通过模拟科学家团队的合作过程加速科研创新,其性能超过传统单智能体系统。
10 万小时训练量!上海交大 F5-TTS:零样本克隆声音,让你的文字秒变逼真语音!
F5-TTS是由上海交通大学开发的开源文本到语音系统,支持零样本声音克隆、情感控制、多语言合成等功能,基于流匹配和扩散变换器技术,训练数据达10万小时,性能卓越,适用于有声读物、语音助手等领域。
复古胶片风!Filmfotos 胶片模拟技术,带你穿越时光的影像魔法
Filmfotos 是基于 Flux 架构的 LoRA 模型,专精于模拟和还原胶片质感效果,以低饱和度的日系胶片风格为特点,适用于多种场景,带来柔和、细腻的复古美感。通过深度学习和图像处理算法,实现了
Llama Tutor:开源 AI 个性化学习平台,根据主题自动制定学习计划
Llama Tutor 是基于 Llama 3.1 和 Together AI 的开源个性化学习平台,覆盖多学科,提供互动式学习体验。技术栈包括 Next.js 和 Tailwind CSS。
Moonshine – 颠覆性实时语音识别,低延时高准确,完胜 Whisper!
Moonshine 是一款专为资源受限设备优化的语音识别模型,提供快速且准确的实时语音转文本服务,适用于现场转录和语音命令识别,展现出比同类 Whisper 模型更低的词错误率。
SimpleQA:OpenAI 开源评估大模型事实性的基准测试
SimpleQA 能评估模型的事实性回答能力,能测量模型的“校准”程度,即模型对自己回答准确性的自我评估能力。SimpleQA 的数据集具有多样性,涵盖多个主题,包括历史、科学、艺术等,用在推动更可靠
顶尖高校联手打造!OpenR 开源框架:在推理过程中整合强化学习,显著提高模型的推理能力!
OpenR是由多所高校联合开发的开源框架,旨在提升大型语言模型的推理能力,整合搜索、强化学习和过程监督技术,应用于数学求解、代码生成等领域,显著提高推理效率和准确性。
清华力作!LongCite:让 LLM 实现细粒度引用,终结幻觉!
LongCite 是清华大学的开源项目,通过生成细粒度的句子级引用,提升 LLMs 在长文本问答中的可信度和可验证性,减少“幻觉”现象,广泛应用于学术、法律、金融等领域。
NotesGPT:开源 AI 语音笔记工具,实现自动多语言转录、总结和任务生成
NotesGPT 是一款开源 AI 语音笔记工具,支持多语言转录、自动总结和任务生成,基于 Convex、Next.js 等技术,适用于会议记录和个人备忘。
开源版“Her”!智谱 AI 开源 GLM-4-Voice:中英文实时交互语音模型
智谱 AI 推出并开源端到端语音模型 GLM-4-Voice,能理解和生成中英文语音,进行实时语音对话,并可根据用户指令改变语音属性。
Zamba2-2.7B:创新小型语言模型,秒速推理、低内存占用,边缘设备也能轻松驾驭!
Zamba2-2.7B 是一款结合了状态空间模型和 Transformer 的混合模型,具备高效推理和低内存占用特点,适用于边缘设备和消费级 GPU,主要功能包括语言理解和生成、图像描述等。
Chat2DB:AI 驱动数据库管理,自然语言轻松生成 SQL
Chat2DB 是一款 AI 驱动的数据库管理和分析工具,支持自然语言生成 SQL,简化操作。提供智能 SQL 编辑器、数据导入导出等功能,适用于多种场景,提升工作效率。
Moffee:一键将Markdown转换为专业PPT,支持多主题与实时预览
Moffee是一款开源Markdown转PPT工具,支持自动布局、多主题选择、实时预览和导出PDF/HTML。使用简单,适合快速制作专业幻灯片,助力内容创作。
Unbounded:一个无限生成式交互的角色生活模拟游戏
Unbounded 是一款由谷歌和北卡罗来纳大学教堂山分校共同推出的无限人生模拟游戏,利用生成模型如 LLM 和视觉生成模型,创造一个没有固定规则和边界的游戏体验。
DreamClear:中科院与字节联合推出!隐私安全优先的高性能图像修复技术
DreamClear 是一种高性能的图像修复技术,专注于隐私安全的数据集管理,能够将低质量图像恢复为高质量图像,同时确保数据隐私。
OpenSPG:蚂蚁与 OpenKG 联合推出多场景适用的智能知识图谱引擎
OpenSPG 是蚂蚁集团与 OpenKG 社区联合推出的知识图谱引擎,基于 SPG 框架,融合 LPG 结构性和 RDF 语义性,提供语义建模、知识构建、逻辑规则推理等功能。
ComfyUI EcomID: 阿里开源助力定制化个性图像生成,单图生成高相似度图像
ComfyUI EcomID 是一个基于 SDXL-EcomID 的开源项目,通过单个参考图像生成高度定制化的个性图像,广泛应用于虚拟现实、影视制作等领域。
下一页