首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
五四
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
996
文章 995
沸点 1
赞
996
返回
|
搜索文章
五四
赞了这篇文章
Peter湘草君
11月前
关注
FunASR模型微调实战指南:如何将准确率提升到98%!
注:本文为 声纹智界实验室 发表, 版权所有 ,转发请务必注明出处 嘿,小伙伴们!今天给大家分享一下如何用 FunASR 进行模型微调,并且通过特定的数据集,将模型的准确率...
1
评论
分享
五四
赞了这篇文章
土圭垚墝
土味工程师 @深圳
·
1年前
关注
阿里云Funasr语音识别大模型本地部署,效果远超OpenAI的Whisper
前言 前段时间测试一下OpenAI的语音识别模型 当时发现效率很低,今天发现阿里有一个专注的语音识别大模型FunAsr 看介绍Funasr的中文识别能力应该比Whisper...
16
3
分享
五四
赞了这篇文章
Cosolar
研究员 @极简软件股份有限公司
·
3月前
关注
FunASR 前端语音识别代码解析
这是基于Web技术的FunASR( 阿里巴巴达摩院 开源语音识别项目) 前端实现方案,支持麦克风实时录音识别与本地音频文件上传识别两大核心场景。整体功能围绕WebSocke...
12
评论
分享
五四
赞了这篇文章
奥德元
10月前
关注
ASR引擎测试:FunASR,必须给阿里点一个赞
原文:https://www.oddmeta.net/archives/165 前两天试了一下小红书开源出来的FireRedASR,整体感觉是小红书团队只是把关键的语音识别...
1
1
分享
五四
赞了这篇文章
刘悦的技术博客
python讲师 @v3u.cn
·
2年前
关注
Whisper对于中文语音识别与转写中文文本优化的实践(Python3.10)
阿里的FunAsr对Whisper中文领域的转写能力造成了一定的挑战,但实际上,Whisper的使用者完全可以针对中文的语音做一些优化的措施,换句话说,Whisper的“默...
7
评论
分享
五四
赞了这篇文章
刘悦的技术博客
python讲师 @v3u.cn
·
2年前
关注
中文语音识别转文字的王者,阿里达摩院FunAsr足可与Whisper相颉顽
君不言语音识别技术则已,言则必称Whisper,没错,OpenAi开源的Whisper确实是世界主流语音识别技术的魁首,但在中文领域,有一个足以和Whisper相颉顽的项目...
20
10
分享
五四
赞了这篇文章
蚝油菜花
1年前
关注
FunASR:阿里巴巴开源的语音识别工具包,提供预训练模型与详细教程,一键部署多场景应用.
FunASR是由阿里巴巴开源的语音识别工具包,支持语音识别、语音活动检测、标点恢复等功能。提供预训练模型和易用接口,可快速部署。本文介绍其功能、技术原理及安装教程,附运行示...
4
评论
分享
五四
赞了这篇文章
SimonKing
6月前
关注
一文搞定:SpringBoot集成语音识别模型FunASR
应粉丝朋友要求,我们一起学习搭建了一个语言识别模型,并集成SpringBoot项目中。在搭建过程中遇到不少问题,总结一下分享给其他需要的朋友。...
5
评论
分享
五四
赞了这篇文章
Livingbody
Big Boss @Sky Net Cor
·
7月前
关注
Whisper 使用简单实例教程【1】
一、Whisper 简介 Whisper 是 OpenAI 研发的自动语音识别(ASR)系统,它具备强大的多语言识别能力,能处理多种不同口音和背景噪音下的语音内容,将其准确...
2
3
分享
五四
赞了这篇文章
奇舞精选
前端 @奇虎360
·
4月前
关注
超越Siri的耳朵:ASR与Whisper零代码部署实战指南
引言:语音交互的进化之路 语音作为人类最自然的交流方式,正推动人机交互迈向智能化时代。传统语音助手(如Siri、小爱同学)依赖ASR→NLP→TTS三级技术栈,存在信息损耗...
3
评论
分享
五四
赞了这篇文章
货拉拉技术
货拉拉技术 @货拉拉集团
·
4月前
关注
揭秘语音交互的核心技术
AI语音拟人化三大技术:ASR精准识别语音,克服噪音方言;实时打断实现自然对话节奏,提升体验;TTS生成带情感的语音,消除机械感。三者融合,赋能智能客服与营销,显著降本增效...
4
1
分享
五四
赞了这篇文章
编程干货铺
前端开发工程师 @平安中心
·
3月前
关注
Vue 3.5 + WangEditor 打造智能笔记编辑器:语音识别功能深度实现
在上篇文章中,我使用了 node.js 封装了豆包模型的语音识别接口,接下来就在前端调用该接口,实现语音识别完整。这篇文章讲拆解如何在 Vue 3.5 框架与 WangEd...
9
1
分享
五四
赞了这篇文章
大猫兼续
前端工程师 @蚂蚁金服
·
2年前
关注
日拱一卒:浏览器端语音识别实现
要实现 AI 虚拟助手的对话功能,涉及到两个关键技术,一个是 speech2text 一个是 text2speech,也就是语音识别和文字转语音。...
2
评论
分享
五四
赞了这篇文章
MTB
1年前
关注
基于 Web Speech API 实现网页上的语音合成和语音识别功能
Web Speech API 包含语音识别和语音合成两部分,可实现语音转文本、文本转语音等功能。它基于 Web 技术,支持多语言,在现代浏览器中有良好的兼容性,被广泛应用于...
2
评论
分享
五四
赞了这篇文章
十八画生ovo
全干工程师
·
2年前
关注
超简单!WebSocket的使用指南
介绍 在现代互联网应用中,实时通信变得越来越重要。传统的 HTTP 协议在浏览器与服务器之间的通信中起着关键作用,但是它存在一些限制,特别是在实时性和双向通信方面。为了满足...
33
评论
分享
五四
赞了这篇文章
蜡笔小心_
公众号『猿来是前端』
·
1年前
关注
实时通信利器:WebSocket技术详解与实战应用
实时通信利器:WebSocket技术详解与实战应用 在现代Web开发中,实时通信变得越来越重要。WebSocket作为一种高效的通信协议,为开发者提供了一种在客户端和服务器...
12
1
分享
五四
赞了这篇文章
杨成功
全栈工程师 @公众号: 程序员成功
·
4年前
关注
前端架构师破局技能,NodeJS 落地 WebSocket 实践
本文从网络协议,技术背景,安全和生产应用的方向,详细介绍 WebSocket 在 Node.js 中的落地实践。...
296
23
分享
五四
赞了这篇文章
热心市民小岳
牛马
·
1年前
关注
React + konva +socket.io实现腾讯文档表格协作
1.技术栈说明 载体:此部分的代码在React Next都可以轻松迁移转换。 表格插件:利用konva实现,协作提示相关使用多层layer来展示。 服务端:Nest.js ...
133
9
分享
五四
赞了这篇文章
tigeriaf
Python全菜工程师
·
4年前
关注
Python多版本管理工具--pyenv
我们在平时的项目开发或者学习中,有可能使用不同的Python版本,如果服务器上存在多版本的环境,管理起来会非常困难,接下来就来介绍一个Python环境管理工具:pyenv。...
35
2
分享
五四
赞了这篇文章
Zioyi
后端搬砖
·
4年前
关注
管理 Python 多版本,pyenv 用起来|Python 主题月
学习使用pyenv在本地安装多个 Python 版本,这样既不影响工作,也不影响生活~ pyenv 可让你轻松地在多个 Python 版本...
28
评论
分享
下一页
个人成就
文章被点赞
28
文章被阅读
13,433
掘力值
568
关注了
106
关注者
15
收藏集
5
关注标签
5
加入于
2020-04-28