首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
mortimer
掘友等级
端茶倒水
|
大傻
到处搬砖,微信公众号( pyvideotrans )
获得徽章 26
动态
文章
专栏
沸点
收藏集
关注
作品
赞
622
文章 544
沸点 78
赞
622
返回
|
搜索文章
最新
热门
Python + FFmpeg 视频自动化处理指南:从硬件加速到精确剪辑
在 Python 中调用 subprocess.run 执行 FFmpeg 命令是视频自动化处理的常见方案。然而,面对 Windows/Linux/macOS 的跨平台兼容性、NVIDIA/Intel
视频自动翻译里的“时空折叠”:简单实用的音画同步实践
做视频翻译,最容易被看到的难题是“翻译准不准”,但真正困扰工程实现的,往往是音画同步:不同语言的语速、信息密度差异巨大,导致生成的配音时长,总是和原视频“对不上”。 本文分享一种在 Python +
破局视频翻译【最后一公里】––从语音克隆到口型对齐的完整工程思路
ElevenLabs、HeyGen 等闭源服务已经把跨语言视频翻译体验推到近乎“完美”级别: 嘴型精准同步、音色自然还原、画面完整不失真,几乎就是工业标准。 但一旦涉及 私有化部署 或 开源落地,现实
从一句话扩展成完整的AI画图提示词【限制你的只有你的想象力】
很多人用AI“画不出来” 想象中的精美图像,不是不会写提示词,而是只会写一句“故事话”。 下面教你一个最实用、最稳定的扩展方法:把一句话拆成“五块积木”,再补齐画面细节。 第一步:写一句最朴素的需求
【实战复盘】 PySide6 + PyTorch 偶发性“假死”?由多线程转多进程
在开发 pyVideoTrans视频翻译工具 的过程中,我遇到了一个困扰已久的“玄学”Bug。 这个 Bug 最折磨人的地方在于:它不是必现的。 在开发环境下单独测试,甚至在处理前几个视频时,一切都丝
从零打造一款桌面实时语音转文字工具:PySide6 与 Sherpa-Onnx 的实践
最近,我一直在探索本地化、高性能的 AI 应用。今天分享我封装的一款极简桌面应用:一个支持中英混合的实时语音转文字(STT)工具。它完全在本地运行,延迟低,且能自动添加标点,非常适合会议、访谈记录或语
只需三步,动手搭建一个本地免费【实时语音转录】工具WhisperLiveKit
实时语音转文字,比如会议记录、课堂笔记,这类功能现在很常见,也是很多人感兴趣的热门方向。 那么想不想动手部署一个开源、好玩的实时转录项目 —— WhisperLiveKit。 它能让你在自己的电脑上轻
faster-whisper本地转录简单方案
如果你正在寻找一个完全免费、在自己电脑上运行、并且转录效果顶尖的语音转字幕工具,那么你来对地方了。 这份教程会手把手带你完成所有设置,过程非常简单! 第一部分:准备工作(如果已有uv和ffmpeg可跳
如何解决 uv run 因网络问题导致的 Python 下载失败
uv 是一个极其出色的 Python 项目和虚拟环境管理工具。通过简单的 uv run <你的脚本.py> 命令,它就能在后台自动下载所需的 Python 版本并配置好运行环境,整个过程丝滑流畅。 然
使用阿里AI模型去除背景噪音:单文件40行代码实现
是否曾为录音中的背景噪音而烦恼?上次介绍过使用ffmpeg一行命令进行降噪,虽然非常简单,但效果可能不尽如人意。 今天,再介绍一种更专业、更强大的降噪方案——利用阿里达摩院的AI大模型 speech_
下一页
个人成就
优秀创作者
文章被点赞
571
文章被阅读
376,289
掘力值
7,490
关注了
657
关注者
320
收藏集
90
关注标签
332
加入于
2016-09-13