首页
AI Coding
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
mortimer
掘友等级
端茶倒水
|
大傻
到处搬砖,微信公众号( pyvideotrans )
获得徽章 26
动态
文章
专栏
沸点
收藏集
关注
作品
赞
622
文章 544
沸点 78
赞
622
返回
|
搜索文章
mortimer
端茶倒水 @大傻
·
2天前
关注
视频自动翻译里的“时空折叠”:简单实用的音画同步实践
做视频翻译,最容易被看到的难题是“翻译准不准”,但真正困扰工程实现的,往往是音画同步:不同语言的语速、信息密度差异巨大,导致生成的配音时长,总是和原视频“对不上”。 本文分...
1
评论
分享
mortimer
端茶倒水 @大傻
·
8天前
关注
破局视频翻译【最后一公里】––从语音克隆到口型对齐的完整工程思路
ElevenLabs、HeyGen 等闭源服务已经把跨语言视频翻译体验推到近乎“完美”级别: 嘴型精准同步、音色自然还原、画面完整不失真,几乎就是工业标准。 但一旦涉及 私...
1
评论
分享
mortimer
端茶倒水 @大傻
·
13天前
关注
从一句话扩展成完整的AI画图提示词【限制你的只有你的想象力】
很多人用AI“画不出来” 想象中的精美图像,不是不会写提示词,而是只会写一句“故事话”。 下面教你一个最实用、最稳定的扩展方法:把一句话拆成“五块积木”,再补齐画面细节。 ...
0
评论
分享
mortimer
赞了这篇文章
聚客AI
AI大模型应用开发工程师
·
3月前
关注
🚀碾压传统方案!vLLM与TGI/TensorRT-LLM性能实测对比
随着大语言模型(LLM)在生成式AI产业中广泛应用,如何高效、经济地部署和推理这些庞大的模型,成为每一位开发者和企业面临的核心挑战。尤其是在构建真实的在线AI应用时,性能瓶...
3
评论
分享
mortimer
端茶倒水 @大傻
·
14天前
关注
【实战复盘】 PySide6 + PyTorch 偶发性“假死”?由多线程转多进程
在开发 pyVideoTrans视频翻译工具 的过程中,我遇到了一个困扰已久的“玄学”Bug。 这个 Bug 最折磨人的地方在于:它不是必现的。 在开发环境下单独测试,甚至...
1
评论
分享
mortimer
赞了这篇文章
程序员晚枫
开源作者,全网同名
·
16天前
关注
Python文件类型大全:从.py到.pyd,你见过几种?
大家好,我是程序员晚枫。 最近有了[AI编程],Python的热度降低了,我也终于有时间关注一直感兴趣的Python话题,而不是回答Python怎么安装这种入门问题了。 我...
1
评论
分享
mortimer
赞了这篇文章
AJi
9月前
关注
FFmpeg学习(四):硬件加速编解码
多媒体文件的便解码任务向来是个计算密集型任务,目前并没有统一的工业标准。FFmpeg尝试在框架层面来统一这些硬件加速方式,提供统一的接口,本文主要介绍在FFmpeg中使用硬...
1
评论
分享
mortimer
赞了这篇文章
站好了
3月前
关注
前端直接打开 AutoCAD DWG/DXF 文件的 Vue 3 组件来了
MlCadViewer 是基于 Vue 3 的纯前端高性能 CAD 组件,可直接在浏览器查看与编辑 DWG/DXF 文件,无需后端支持,提供可定制 UI、高性能渲染、多语言...
59
27
分享
mortimer
端茶倒水 @大傻
·
20天前
关注
从零打造一款桌面实时语音转文字工具:PySide6 与 Sherpa-Onnx 的实践
最近,我一直在探索本地化、高性能的 AI 应用。今天分享我封装的一款极简桌面应用:一个支持中英混合的实时语音转文字(STT)工具。它完全在本地运行,延迟低,且能自动添加标点...
1
评论
分享
mortimer
端茶倒水 @大傻
·
21天前
关注
只需三步,动手搭建一个本地免费【实时语音转录】工具WhisperLiveKit
实时语音转文字,比如会议记录、课堂笔记,这类功能现在很常见,也是很多人感兴趣的热门方向。 那么想不想动手部署一个开源、好玩的实时转录项目 —— WhisperLiveKit...
1
评论
分享
mortimer
端茶倒水 @大傻
·
22天前
关注
faster-whisper本地转录简单方案
如果你正在寻找一个完全免费、在自己电脑上运行、并且转录效果顶尖的语音转字幕工具,那么你来对地方了。 这份教程会手把手带你完成所有设置,过程非常简单! 第一部分:准备工作(如...
0
评论
分享
mortimer
端茶倒水 @大傻
·
23天前
关注
如何解决 uv run 因网络问题导致的 Python 下载失败
uv 是一个极其出色的 Python 项目和虚拟环境管理工具。通过简单的 uv run <你的脚本.py> 命令,它就能在后台自动下载所需的 Python 版本并配置好运行...
0
评论
分享
mortimer
端茶倒水 @大傻
·
24天前
关注
使用阿里AI模型去除背景噪音:单文件40行代码实现
是否曾为录音中的背景噪音而烦恼?上次介绍过使用ffmpeg一行命令进行降噪,虽然非常简单,但效果可能不尽如人意。 今天,再介绍一种更专业、更强大的降噪方案——利用阿里达摩院...
3
评论
分享
mortimer
端茶倒水 @大傻
·
25天前
举报
不愧是前端祖师爷哈
收起
查看大图
向左旋转
向右旋转
上班摸鱼
分享
评论
点赞
mortimer
端茶倒水 @大傻
·
26天前
关注
一键实现人声伴奏分离:基于 `uv`, `FFmpeg` 和 `audio-separator` 的高效解决方案
本文将分享一个用于音频源分离(特别是人声与伴奏分离)的自动化脚本和工作流。该方案利用了 audio-separator 库、FFmpeg 进行媒体预处理,并通过 uv 实现...
2
评论
分享
mortimer
端茶倒水 @大傻
·
27天前
举报
kimi-k2发布时一片欢腾,编程可以平替claude了!
GLM-4.6发布时又是同样一片欢腾!
然而当Trae AI真的被断供了claude,这些欢腾的人就开始琢磨退钱退会员换搭档了!
收起
查看大图
向左旋转
向右旋转
上班摸鱼
赞过
分享
2
1
mortimer
端茶倒水 @大傻
·
29天前
关注
视频翻译中的最后一公里:口型匹配为何如此难
AI视频翻译已自动化语音识别→翻译→语音合成→字幕嵌入,但口型不匹配的“违和感”仍会破坏沉浸。口型同步(Lip Sync),是视频翻译的“最后一公里”——看似短,却障碍重重...
1
评论
分享
mortimer
端茶倒水 @大傻
·
1月前
关注
搞懂FFmpeg中2个桀骜不驯的参数:CRF 与 Preset
无论你是视频创作者、后期工程师,还是仅仅想压缩一个网络视频,都无法回避视频编码。我们永远在**画质...
3
评论
分享
mortimer
端茶倒水 @大傻
·
1月前
举报
建议被删除的文章能自动回到草稿箱, 或者能让作者可以再次修改编辑,而不是直接彻底删除。
有时因为一张封面图不当直接被删了,连草稿都没,悲了催了。AI生成的美女图虽不露点但可能过于暴露
收起
查看大图
向左旋转
向右旋转
反馈 & 建议
分享
评论
点赞
下一页
个人成就
优秀创作者
文章被点赞
567
文章被阅读
360,795
掘力值
7,413
关注了
657
关注者
317
收藏集
90
关注标签
332
加入于
2016-09-13