后端 - 子瞳的收藏集 - 掘金

后端

更多收藏集

44篇文章 · 0订阅

🚀 2025 年 12 月 GitHub 十大热门项目排行榜 🔥

2025年12月GitHub十大热门：从claude-mem到CosyVoice，Agent持久记忆、可视化构建、终端开源替代、语音生成全面突破，2025年完美收官！

一点一木
1月前
7.1k
63
评论

🚀 2025 年 12 月 GitHub 十大热门项目排行榜 🔥

从SSE到打字机——AI场景下前端的实现逻辑与实践

随着Deepseek的横空出世，让每个人都有了构建自己AI知识库的机会，作为一个前端开发者，本篇文章从前端的角度出发，分析实现一个AI的交互页面能用到哪些技术，最后再去实现一个AI场景页面。

纸上的彩虹
7月前
858
10
评论

从SSE到打字机——AI场景下前端的实现逻辑与实践

【应用搭建】🎯使用本地部署大模型打造个人语音助手

在大模型火热发展的浪潮中，通过现有的技术打造一个完全本地运行的桌面 AI 语音助手来帮我处理日常任务，在心情不好时，还能让它给我讲讲笑话～

LHK
11月前
2.0k
6
2

【应用搭建】🎯使用本地部署大模型打造个人语音助手

CosyVoice:阿里最强语音克隆模型体验并封装API接口

在中文TTS技术上，最近一年涌现出众多优秀方案，如GPT-SoVITS、ChatTTS和Fish TTS等，阿里新推出的CosyVoice，效果最佳。

mortimer
1年前
7.6k
21
9

CosyVoice:阿里最强语音克隆模型体验并封装API接口

开源版“Her”！智谱 AI 开源 GLM-4-Voice：中英文实时交互语音模型

智谱 AI 推出并开源端到端语音模型 GLM-4-Voice，能理解和生成中英文语音，进行实时语音对话，并可根据用户指令改变语音属性。

蚝油菜花
1年前
726
1
评论

开源版“Her”！智谱 AI 开源 GLM-4-Voice：中英文实时交互语音模型

开源2天斩获3K标星！开源TTS新星Chatterbox盲测击败ElevenLabs！

文本转语音（TTS）技术近年来随着AI的快速发展突飞猛进，但要在真实感、情绪表达和实时性上达到顶尖水平，仍是巨大挑战。但零样本TTS和情感控制的兴起，涌现了一大批优秀的TTS模型，让语音合成进入了新

开源星探
8月前
480
点赞
评论

3B小模型吊打72B巨头！轻量级文档解析OCR，性能超Gemini，高效且精准！

在文档解析领域，传统方法要么依赖复杂多工具流水线，要么受限于大型多模态模型的低效性。近日，Yuliang-Liu团队在GitHub上开源了一款轻量级基于LLM的文档解析模型：MonkeyOCR。它

开源星探
8月前
584
2
评论

轻量级语音模型Vui开源，支持本地部署，笑声停顿全拟真，4万小时练出人类对话感！

在语音交互技术飞速发展的今天，打造一个自然、逼真的语音对话模型是许多开发者和AI语音团队的梦想。传统语音模型要么需要云端算力，要么缺乏语气词和情感，难以模拟真人对话。设备端轻量语音的兴起，像给AI装

开源星探
8月前
327
点赞
评论

12K+ Star的离线语音神器！50MB模型秒杀云端API，隐私零成本，20+语种支持！

云端语音 API 虽功能强，但痛点明显：网络依赖、高昂费用、隐私风险。如果有一款开源工具，既要轻量又能完全离线运行，还能识别人声，会不会让你的语音应用开发直接起飞呢。一款由Alpha Cephei

开源星探
8月前
795
9
评论

🚀 2024年12月 GitHub 十大热门项目排行榜 🔥

本文盘点了2024年12月 GitHub 十大热门项目，涵盖AI、翻译、TTS等多个领域，展示最新技术与创新，适合开发者和科技爱好者深入探索与贡献。

一点一木
1年前
13k
209
12

🚀 2024年12月 GitHub 十大热门项目排行榜 🔥