首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
后端
订阅
子瞳
更多收藏集
微信扫码分享
微信
新浪微博
QQ
44篇文章 · 0订阅
🚀 2025 年 12 月 GitHub 十大热门项目排行榜 🔥
2025年12月GitHub十大热门:从claude-mem到CosyVoice,Agent持久记忆、可视化构建、终端开源替代、语音生成全面突破,2025年完美收官!
从SSE到打字机——AI场景下前端的实现逻辑与实践
随着Deepseek的横空出世,让每个人都有了构建自己AI知识库的机会,作为一个前端开发者,本篇文章从前端的角度出发,分析实现一个AI的交互页面能用到哪些技术,最后再去实现一个AI场景页面。
【应用搭建】🎯使用本地部署大模型打造个人语音助手
在大模型火热发展的浪潮中,通过现有的技术打造一个完全本地运行的桌面 AI 语音助手来帮我处理日常任务,在心情不好时,还能让它给我讲讲笑话~
CosyVoice:阿里最强语音克隆模型体验并封装API接口
在中文TTS技术上,最近一年涌现出众多优秀方案,如GPT-SoVITS、ChatTTS和Fish TTS等,阿里新推出的CosyVoice,效果最佳。
开源版“Her”!智谱 AI 开源 GLM-4-Voice:中英文实时交互语音模型
智谱 AI 推出并开源端到端语音模型 GLM-4-Voice,能理解和生成中英文语音,进行实时语音对话,并可根据用户指令改变语音属性。
开源2天斩获3K标星!开源TTS新星Chatterbox盲测击败ElevenLabs!
文本转语音(TTS)技术近年来随着AI的快速发展突飞猛进,但要在真实感、情绪表达和实时性上达到顶尖水平,仍是巨大挑战。 但零样本TTS和情感控制的兴起,涌现了一大批优秀的TTS模型,让语音合成进入了新
3B小模型吊打72B巨头!轻量级文档解析OCR,性能超Gemini,高效且精准!
在文档解析领域,传统方法要么依赖复杂多工具流水线,要么受限于大型多模态模型的低效性。 近日,Yuliang-Liu团队在GitHub上开源了一款轻量级基于LLM的文档解析模型:MonkeyOCR。 它
轻量级语音模型Vui开源,支持本地部署,笑声停顿全拟真,4万小时练出人类对话感!
在语音交互技术飞速发展的今天,打造一个自然、逼真的语音对话模型是许多开发者和AI语音团队的梦想。 传统语音模型要么需要云端算力,要么缺乏语气词和情感,难以模拟真人对话。设备端轻量语音的兴起,像给AI装
12K+ Star的离线语音神器!50MB模型秒杀云端API,隐私零成本,20+语种支持!
云端语音 API 虽功能强,但痛点明显:网络依赖、高昂费用、隐私风险。 如果有一款开源工具,既要轻量又能完全离线运行,还能识别人声,会不会让你的语音应用开发直接起飞呢。 一款由Alpha Cephei
🚀 2024年12月 GitHub 十大热门项目排行榜 🔥
本文盘点了2024年12月 GitHub 十大热门项目,涵盖AI、翻译、TTS等多个领域,展示最新技术与创新,适合开发者和科技爱好者深入探索与贡献。