首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
AI
mortimer
创建于2022-01-27
订阅专栏
AI/GPT/OpenCV
等 30 人订阅
共47篇文章
创建于2022-01-27
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
字节火山引擎大模型赠送5亿token要不要
大家都知道字节的豆包模型非常非常便宜,但还不知道5月15日至8月30日期间,字节赠送5亿token免费用量,不仅有豆包模型,还有月之暗面模型,相当大方了属于是,白嫖谁不嫖,不嫖白不嫖,简单说下白嫖流程
ChatTTS使用中的几个问题和技巧
ChatTTS火出圈了,然而文档语焉不详,尤其在语气、韵律、发音人具体控制方面,经过反复实测和踩坑,终于明白一点,记录如下。
搭了一个ChatTTS WebUI界面和api接口
最近几天,ChatTTS挺火,号称是专门为对话场景设计的文本转语音模型,拉下来玩了玩,开源版效果距离宣传视频还有不少差距,据说是故意限制。 马马虎虎至少能用,先来搭个web界面和懒人包,使用方便点。
基于ffmpeg.wasm创建一个在线视频处理工具箱
ffmpeg是一款强大的音频视频处理工具,使用非常广泛,几乎所有市面上常见的影音类 剪辑类软件都会集成该工具,同样视频翻译配音软件中也将其集成在内。
基于阿里Paraformer模型打造中文语音识别
openai-whisper是流行的语音识别解决方案,支持数十种语言,对中文支持效果也不错,不过在使用低于large尺寸的模型时,效果仍是略差。相比而言,国内阿里系专注于中文识别的模型效果就好了不少。
前端视频处理利器:ffmpeg.wasm网页中预览非mp4视频并嵌入字幕
借助ffmpeg的wasm版本,可以实现本地网页处理视频、预览非mp4格式的视频等,最近用到了视频中分离音频、预览视频、截取分割等功能,简单记录下。 获取 ffmpeg.wasm 首先需要执行npm以
白嫖edgeTTS 开发了一个在线文字合成语音web
根据输入文字和选项,组装 ssml 格式数据,然后创建websocket连接edge TTS服务器,得到返回音频数据后,合并创建mp3下载到本地。
月之暗面:一个免费好用的类chatGPT工具-可读取网页-上传文件图片
OpenAI的chatGPT是公认最强的大模型,国内的文心一言、通义千问还只是追赶者,相比有不小差距。最近国内又冒出来一个挺厉害的AI工具: Moonshot 中文名为 “月之暗面”,听着有点怪异
ChatGPT和DeepLx在API调用中的设置方法和常见错误
视频翻译配音软件中,支持使用ChatGPT和DeepLx作为翻译渠道,这两个翻译均需要额外设置,虽然已有几篇相关教程,但很多用户还是不会设置,本文再次讲述下如何使用。 使用ChatGPT,分两种情况
马斯克开源的大模型Grok-1是什么,能否个人部署
这两天马斯克在 GitHub 上开源了 Grok-1 大模型:一个GPT-4强有力的竞争者。 开源地址:https://github.com/xai-org/grok-1 开源一天就暴涨23k sta
一种在本地部署Qwen通义千问大模型的超简单方法-兼容OpenAi接口
有很多开源大模型都可以本地部署,用于替代 chatGPT 实现本地执行各种任务,比如国内较好的 通义千问Qwen1.5 全尺寸模型。在一般的翻译、文案创作、辅助编码等任务上,基本达到了ChatGPT3
视频翻译配音中几个高频问题解析与应对
声音、画面、字幕不同步 首先解释原因: 不同语言相互翻译后,字符长度数量是不同的,发音也是不同的,因此翻译前后的配音必然是有时长差异的,比如原中文配音是2秒,翻译为英文后配音可能是3s,定然导致声音、
在cloudflare上基于m2m100创建完全免费的翻译API服务
本文主要介绍下如何在cloudflare后台搭建一个可用的免费翻译api,使用 m2m100-1.2B 模型
在Coze国际版上使用 GPT-4
自从OpenAI推出GPT3以后,各种AI就层出不穷,然而到目前为止,最好用最强大的还得是GPT4。
腾讯云函数结合DeepLX:免费使用DeepL翻译API
在腾讯云平台上使用免费的云函数部署DeepLx。通过利用云函数动态IP的特性,能有效避免IP检测出现异常并被封锁的问题。
ChatGPT接入指南:快速获取与配置API密钥并填写到软件/工具中使用
本文简单说下如何使用OpenAI(openai.com)官方获取自己的api信息,以及如何使用第三方api中转服务,并填写到软件中使用(以视频翻译配音软件和沉浸式翻译为例)。
推荐2个分离人声和背景伴奏的工具:urv5和vocal-separate
在进行声音训练任务时,需要搜集一定数量的声音样本,比如自己的录音、从影音文件中截取的片段,而这些文件总避免不了存在背景噪声或者音乐伴奏等,如果不提前去除,会极大影响训练效果。 有的声音训练项目会自带背
详解各个功能及界面设置-一个开源视频翻译配音工具
本文主要介绍下“视频翻译配音软件”有哪些功能,以及界面中各个选项和按钮的涵义及设置。 软件介绍见:视频翻译与配音 该软件能实现将一种语言的视频,翻译为另一种语言的视频,处理后的新视频中的字幕和人类说话
提高视频翻译质量的几个方法
在使用“视频翻译配音工具VideoTrans”中,经常有用户抱怨翻译质量过差,本文讲一下提高翻译质量的技巧。 如果你还没有安装,可查看上篇文章。# 一文搞懂“视频翻译与配音工具”! 整个视频翻译配音软
看到没人讨论Sora,我先来水一篇
OpenAI最近又向公众展示了他们武器库里的一款新武器,仅凭一段文字即刻生成效果惊艳逼真视频的Sora。真不知道他们还藏着多少宝贝。 这款被命名为Sora的新工具,在日语中的意思是“天空”,标志着这家
下一页