首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
音频识别
订阅
视频转文字等
十点数据
更多收藏集
微信扫码分享
微信
新浪微博
QQ
10篇文章 · 0订阅
用java做一套离线且免费的智能语音系统,ASR+LLM+TTS
其实调用第三方接口完成一个智能语音系统是非常简单的,像阿里、科大讯飞、微软都有相关接口,直接根据官方文档集成就可以,但想要离线的就要麻烦一点了,主要是想不花钱,现在人工智能基本是python的天下,不
搞定语音识别,畅享高效处理 | 开源专题 No.78
语音识别技术的开源项目为我们提供了更多选择和可能性,包括基础工具包FunASR、高性能的Whisper.cpp、WhisperX具有单词级时间戳和说话人分离功能、AudioGPT用于理解和生成语音、音
Java实现抓取在线视频并提取视频语音为文本
一、 背景 最近在做大模型相关的项目,其中有个模块需要提取在线视频语音为文本并输出给用户。作为一个纯后端Jave工程师,搞这个确实是初次尝试。 二、 调研 基于上述功能模块,主要有三大任务:1、 提取
阿里云Funasr语音识别大模型本地部署,效果远超OpenAI的Whisper
前言 前段时间测试一下OpenAI的语音识别模型 当时发现效率很低,今天发现阿里有一个专注的语音识别大模型FunAsr 看介绍Funasr的中文识别能力应该比Whisper更强大: Funasr的模型
推荐5款本周 超火 的开源AI项目
1、AnimateAnyone AnimateAnyone 项目是由阿里巴巴智能计算研究院开发,你只需提供一个静态的角色图像(包括真人、动漫/卡通角色等)和一些动作、姿势(比如跳舞、走路),便可将其动
10K star!免费离线的语音转文字工具,远超垃圾付费软件
今天我们介绍的开源项目,可以免费进行视频/音频转录文字,也支持实时语音转文字,并且离线可用,帮助打工人提升效率,它就是:buzz
2023年的深度学习入门指南(24) - 处理音频的大模型 OpenAI Whisper
在这一讲之前,我们所用的大模型都是针对文本的。这一讲我们增加一个新的领域,即音频。我们将介绍OpenAI的Whipser模型。
如何使用whisper实现音频转文字
Whisper API 仅支持小于 25 MB 的文件,如果您有比这更长的音频文件,则需要将其分成 25 MB 或更小的块或使用压缩音频格式。
5、ChatGPT开源的whisper音频生成字幕,可本地搭建环境运行,效果质量很棒
开源组合llama+langchain助力开发者轻松使用whisper搭建本地环境,进行音视频的字幕生成和翻译,质量超级高,而且需求是转换为英语字幕,速度也是超级快的
音视频转文字不求人,OpenAI Whisper来帮您
😀 一直有音视频转文字,然后做笔记或总结的习惯,两年前写了一个字幕提取工具,破解了第三方语音转文字APP的API,用脚本批量调接口来提取。当时掏了98买了两年服务,前阵子过期了,按照我的使用频次