首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
AItools
订阅
AI tools
大勇
更多收藏集
微信扫码分享
微信
新浪微博
QQ
17篇文章 · 0订阅
AI视频自动剪辑已成现实!阿里这款免费开源的视频剪辑神器请收好,打工人福音!(附详细教程)
想象一下,假设老板给你布置了一项任务: 将一大段视频中的高光时刻或者重点部分,剪成一段短视频,你怎么做? 再比如,老板参加了一个访谈,访谈后让你把他说话的部分单独剪辑出来,你怎么做? 把视频 2 倍速
FunASR离线部署踩坑:修复离线加载与GUI集成的两大关键补丁
在当今的AI应用开发中,高质量的语音识别(ASR)技术是许多产品的核心竞争力。特别是对于中文场景,阿里达摩院开源的FunASR项目效果非常出色。 FunASR 并非单一的模型,而是一个功能全面的基础语
工业级ASR工具推荐:FunASR一键部署,音视频语音高效转文本
下面是简要介绍: FunASR 是一个基本的语音识别工具包,提供多种功能,包括语音识别ASR等 基于FunASR,有很多可以直接使用的学术和工业级预训练模型,具有准确率高、效率高、部署便捷等优点,支撑
使用Docker部署FunASR服务
使用Docker部署FunASR服务 说明: 首次发表日期:2024-08-26 https://github.com/modelscope/FunASR/tree/main
阿里云Funasr语音识别大模型本地部署,效果远超OpenAI的Whisper
前言 前段时间测试一下OpenAI的语音识别模型 当时发现效率很低,今天发现阿里有一个专注的语音识别大模型FunAsr 看介绍Funasr的中文识别能力应该比Whisper更强大: Funasr的模型
开箱即用!语音处理黑科技来袭!阿里巴巴开源超强语音处理神器,语音分离、音视频说话人提取等功能一站式解决。
对于语音处理技术爱好者来说,这可能是今年最让人兴奋的消息之一了。 阿里巴巴刚刚开源了 ClearerVoice-Studio,这款工具以其强大的语音增强、分离和说话人提取功能,迅速吸引了开发者和研究者
在本地 LLM 上运行MCP
无限制地使用本地LLM来实际检验MCP 学习生成式人工智能应用 上次我思考如何在本地设置LLM API时, 你将能够在应用程序开发中进行无限制的LLM实验. 如果我们能将LLM连接到提供的MCP(模型
如何将 39.3k 的开源知识库 Dify 接入微信
在渐渐熟悉 Dify 的各个功能后,我们已经不满足于只在 PC 端或者说需要打开网页才可以使用 Dify 了。我们更希望的是它可以和我们平时最常用的通讯软件相对接,比如微信。
使用 Python 简单几步去除 PDF 水印
在处理 PDF 文件时,水印有时会影响文件的可读性或美观性。幸运的是,Python 提供了多种库来操作 PDF 文件,其中 PyMuPDF(又名 fitz) 是一个强大的工具,可以用于去除 PDF 水
超简单!Python 为图片和 PDF 上去掉水印
这是我参与「掘金日新计划 · 6 月更文挑战」的第1天,点击查看活动详情 网上下载的 pdf 学习资料有一些会带有水印,非常影响阅读。比如下面的图片就是在 pdf 文件上截取出来的。 安装模块 PIL