音频识别 - 十点数据的收藏集 - 掘金

音频识别

视频转文字等

更多收藏集

10篇文章 · 0订阅

用java做一套离线且免费的智能语音系统，ASR+LLM+TTS

其实调用第三方接口完成一个智能语音系统是非常简单的，像阿里、科大讯飞、微软都有相关接口，直接根据官方文档集成就可以，但想要离线的就要麻烦一点了，主要是想不花钱，现在人工智能基本是python的天下，不

北冥有鱼518
1年前
5.8k
44
16

搞定语音识别，畅享高效处理 | 开源专题 No.78

语音识别技术的开源项目为我们提供了更多选择和可能性，包括基础工具包FunASR、高性能的Whisper.cpp、WhisperX具有单词级时间戳和说话人分离功能、AudioGPT用于理解和生成语音、音

开源服务指南
1年前
1.5k
5
评论

Java实现抓取在线视频并提取视频语音为文本

一、背景最近在做大模型相关的项目，其中有个模块需要提取在线视频语音为文本并输出给用户。作为一个纯后端Jave工程师，搞这个确实是初次尝试。二、调研基于上述功能模块，主要有三大任务：1、提取

京东云开发者
2年前
3.7k
9
1

阿里云Funasr语音识别大模型本地部署，效果远超OpenAI的Whisper

前言前段时间测试一下OpenAI的语音识别模型当时发现效率很低，今天发现阿里有一个专注的语音识别大模型FunAsr 看介绍Funasr的中文识别能力应该比Whisper更强大： Funasr的模型

土圭垚墝
2年前
8.3k
16
3

阿里云Funasr语音识别大模型本地部署，效果远超OpenAI的Whisper

推荐5款本周超火的开源AI项目

1、AnimateAnyone AnimateAnyone 项目是由阿里巴巴智能计算研究院开发，你只需提供一个静态的角色图像（包括真人、动漫/卡通角色等）和一些动作、姿势（比如跳舞、走路），便可将其动

开源星探
2年前
3.2k
29
7

10K star！免费离线的语音转文字工具，远超垃圾付费软件

今天我们介绍的开源项目，可以免费进行视频/音频转录文字，也支持实时语音转文字，并且离线可用，帮助打工人提升效率，它就是：buzz

IT咖啡馆
2年前
8.9k
76
16

10K star！免费离线的语音转文字工具，远超垃圾付费软件

2023年的深度学习入门指南(24) - 处理音频的大模型 OpenAI Whisper

在这一讲之前，我们所用的大模型都是针对文本的。这一讲我们增加一个新的领域，即音频。我们将介绍OpenAI的Whipser模型。

旭伦
2年前
1.7k
1
评论

2023年的深度学习入门指南(24) - 处理音频的大模型 OpenAI Whisper

如何使用whisper实现音频转文字

Whisper API 仅支持小于 25 MB 的文件，如果您有比这更长的音频文件，则需要将其分成 25 MB 或更小的块或使用压缩音频格式。

zhouluyao
3年前
1.7k
5
评论

5、ChatGPT开源的whisper音频生成字幕，可本地搭建环境运行，效果质量很棒

开源组合llama+langchain助力开发者轻松使用whisper搭建本地环境，进行音视频的字幕生成和翻译，质量超级高，而且需求是转换为英语字幕，速度也是超级快的

那个曾经的少年回来了
3年前
2.9k
23
2

5、ChatGPT开源的whisper音频生成字幕，可本地搭建环境运行，效果质量很棒

音视频转文字不求人，OpenAI Whisper来帮您

😀 一直有音视频转文字，然后做笔记或总结的习惯，两年前写了一个字幕提取工具，破解了第三方语音转文字APP的API，用脚本批量调接口来提取。当时掏了98买了两年服务，前阵子过期了，按照我的使用频次

coder_pig
2年前
6.4k
49
13

音视频转文字不求人，OpenAI Whisper来帮您