首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
hunter
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
171
文章 171
沸点 0
赞
171
返回
|
搜索文章
hunter
赞了这篇文章
刘悦的技术博客
python讲师 @v3u.cn
·
1年前
关注
持续进化,快速转录,Faster-Whisper对视频进行双语字幕转录实践(Python3.10)
Faster-Whisper是Whisper开源后的第三方进化版本,它对原始的 Whisper 模型结构进行了改进和优化。这包括减少模型的层数、减少参数量、简化模型结构等,...
17
1
分享
hunter
赞了这篇文章
刘悦的技术博客
python讲师 @v3u.cn
·
1年前
关注
Bert-vits2-2.3-Final,Bert-vits2最终版一键整合包(复刻生化危机艾达王)
近日,Bert-vits2发布了最新的版本2.3-final,意为最终版,修复了一些已知的bug,添加基于 WavLM 的 Discriminator(来源于 Style...
5
评论
分享
hunter
赞了这篇文章
coder_pig
🏆掘金签约作者 | 摸鱼王 @Android补全计划
·
1年前
关注
音视频转文字不求人,OpenAI Whisper来帮您
😀 一直有音视频转文字,然后做笔记或总结的习惯,两年前写了一个字幕提取工具,破解了第三方语音转文字APP的API,用脚本批量调接口来提取。当时掏了98买了两年服务,前阵子...
48
12
分享
hunter
赞了这篇文章
开源星探
Python后端开发工程师 @OPPO广东移动通信有限公司武汉分公司
·
1年前
关注
推荐5款本周 超火 的开源AI项目
1、AnimateAnyone AnimateAnyone 项目是由阿里巴巴智能计算研究院开发,你只需提供一个静态的角色图像(包括真人、动漫/卡通角色等)和一些动作、姿势(...
29
7
分享
hunter
赞了这篇文章
刘悦的技术博客
python讲师 @v3u.cn
·
1年前
关注
Bert-vits2新版本V2.1英文模型本地训练以及中英文混合推理(mix)
中英文混合输出是文本转语音(TTS)项目中很常见的需求场景,尤其在技术文章或者技术视频领域里,其中文文本中一定会夹杂着海量的英文单词,我们当然不希望AI口播只会念中文,Be...
5
评论
分享
hunter
赞了这篇文章
HelloGitHub
@公众号:HelloGitHub
·
2年前
关注
极简工作流「GitHub 热点速览」
原以为 LLM 很难,但其实可以很简单,比如 Flowise 拖拽拖拽就能出来一个 LLM 流程,非常简单你的 LLM 就可以 run 起来了。同样的 web-check ...
15
2
分享
hunter
赞了这篇文章
刘悦的技术博客
python讲师 @v3u.cn
·
1年前
关注
离线生成双语字幕,一键生成中英双语字幕,基于AI大模型,ModelScope
制作双语字幕的方案网上有很多,林林总总,不一而足。制作双语字幕的原理也极其简单,无非就是人声背景音分离、语音转文字、文字翻译,最后就是字幕文件的合并,但美中不足之处这些环...
8
评论
分享
hunter
赞了这篇文章
mortimer
端茶倒水 @大傻
·
1年前
关注
一文搞懂“视频翻译与配音工具”
一个开源的视频翻译和配音工具,可将一种语言和发音的视频,处理后变为另一种语言发音的视频,并嵌入该语言字幕。比如有一个英文电影,发音是英文,使用这个工具处理后,可以转成带中文...
5
6
分享
hunter
赞了这篇文章
程序的搬运工
项目经理 @启梦智造(鞍山)信息技术有限公司
·
1年前
关注
只要三分钟!使用OpenAI API构建语音对话聊天机器人
在这篇文章中,我们将深入探讨如何结合Gradio库和OpenAI API,创建一个功能丰富的音频处理应用。通过本指南,你将学会如何利用这些强大的工具,实现音频转文本、文本处...
5
评论
分享
hunter
赞了这篇文章
huxinxin32B
1年前
关注
Vue3+Go 仿抖音项目架构设计与实现
本文介绍了一个Web端短视频应用,致力于为用户提供交互友好、功能完备的短视频浏览体验和直播体验。 集成了Gorse推荐算法,旨在为用户提供更个性化的推荐视频流和更权威的热门...
84
5
分享
hunter
赞了这篇文章
刘悦的技术博客
python讲师 @v3u.cn
·
1年前
关注
中文语音识别转文字的王者,阿里达摩院FunAsr足可与Whisper相颉顽
君不言语音识别技术则已,言则必称Whisper,没错,OpenAi开源的Whisper确实是世界主流语音识别技术的魁首,但在中文领域,有一个足以和Whisper相颉顽的项目...
19
10
分享
hunter
赞了这篇文章
嚣张农民
公众号 @「前端嚣张农民」
·
2年前
关注
Whisper、React 和 Node 构建语音转文本 Web 应用程序
在本文中,我们将使用 OpenAI 的 Whisper 以及 React、Node.js 和 FFmpeg 构建一个语音转文本应用程序。该应用程序将获取用户输入,使用 Op...
11
1
分享
hunter
赞了这篇文章
HuggingFace
开发者社区 @HuggingFace
·
2年前
关注
使用 Transformers 为多语种语音识别任务微调 Whisper 模型
使用 🤗 Transformers 为多语种语音识别任务微调 Whisper 模型 本文提供了一个使用 Hugging Face 🤗 Transformers 在任意多...
9
1
分享
hunter
赞了这篇文章
码财同行
游戏服务器 @字节跳动
·
1年前
关注
【AIGC·真相】游戏人初摸AI配音:whisper语音识别
背景 之前和同事看到了 B 站上一些有关语音合成的视频,B 站的 up主演示了用自己的音频素材训练成特定模型,然后就可以自动给小说配音,效果还是挺不错的。 演示视频在这里:...
5
评论
分享
hunter
赞了这篇文章
机器之心
@机器之心
·
1年前
关注
两天star量破千:OpenAI的Whisper被蒸馏后,语音识别数倍加速
前段时间,「霉霉大秀中文」的视频在各个社交媒体走红,随后又出现了「郭德纲大秀英语」等类似视频。这些视频很多都出自一个名叫「HeyGen」的 AI 应用之手。不过,从 Hey...
3
评论
分享
hunter
赞了这篇文章
HuggingFace
开发者社区 @HuggingFace
·
1年前
关注
使用推测解码 (Speculative Decoding) 使 Whisper 实现 2 倍的推理加速
Open AI 推出的 Whisper 是一个通用语音转录模型,在各种基准和音频条件下都取得了非常棒的结果。最新的 large-v3 模型登顶了 OpenASR 排行榜,被...
5
1
分享
hunter
赞了这篇文章
阿李贝斯
前端工程师
·
1年前
关注
年终盘点AI:与前端技术结合产生的奇妙化学反应
前言 去年年底 ChatGPT 的横空出世,在极短的时间风靡全球。一时间,OpenAI 也因为开发并推出了 ChatGPT 成为了全球瞩目的公司。ChatGPT 就像是一条...
29
2
分享
hunter
赞了这篇文章
RustCoder
搬砖的 @宇宙在线
·
2年前
关注
Rust UI 框架:用 Rust 和 Slint 制作一个简易计算器(Live coding )
本文主要介绍 Rust UI 框架 Slint 的实践示例,使用 Rust 和 Slint GUI 套件制作一个小型 GUI 应用程序:一个简易计算器。...
37
2
分享
hunter
赞了这篇文章
Halifax
Android @ 微信号: fuqiang2020
·
2年前
关注
HarmonyOS玩转ArkUI动效 - 水母动画
喊上章鱼哥和蟹老板,我们一起去抓水母吧,“水母动画” 是我参加HarmonyOS【挑战赛第三期】的参赛作品。...
88
27
分享
hunter
赞了这篇文章
天工大模型
1年前
关注
昆仑万维开源「天工」13B系列大模型,0门槛商用
10月30日,昆仑万维宣布开源百亿级大语言模型「天工」Skywork-13B系列,并罕见地配套开源了600GB、150B Tokens的超大高质量开源中文数据集。...
22
6
分享
下一页
关注了
5
关注者
0
收藏集
32
关注标签
1
加入于
2017-03-15