导读: 沉浸式翻译你可能用过,但大概率没把它用到位。网页翻译只是入门,它还能搞定 PDF 排版还原、视频实时双语字幕、输入框一键翻译……这篇文章把它的核心功能挨个演示一遍,顺便聊聊最新上线的 BabelDOC 到底有多能打。
先说最基本的:网页双语对照
浏览器自带翻译功能基本够用,但有一个硬伤——它把原文干掉了,你没法对照。
沉浸式翻译不一样,它是原文和译文并排显示。原文在上,译文在下,两个语言都看得到。精读一篇英文文章的时候,遇到翻译不准的地方,你一眼就能对照出来,不用来回切换。
快捷键 Alt+A 一键触发,或者右键也有入口。
这是它当初火起来的原因,现在是 Chrome 2024 年度精选扩展,2000 万+ 用户,口碑一直在。
输入框翻译:这个才是生产力神器
说实话,这个功能我觉得比网页翻译更高频。
场景是这样的:你在 Gmail 写一封英文邮件、在 GitHub 提一个 issue、在 Slack 或者 Discord 回消息——你脑子里是中文思维,但要输出英文,通常要先在翻译器里打中文,翻成英文,再复制过来。
沉浸式翻译把这个流程缩到一步:在任何输入框里打中文,连按三下空格,直接变英文,就地翻译,不跳窗口。
Gmail、Notion、Discord、WhatsApp Web、GitHub……只要是网页上的输入框,全部支持。用过的人基本都说这个改变了工作习惯,不夸张。
视频双语字幕:看英文内容再也不费劲
YouTube 上大量教程、评测、演讲没有中文字幕,以前只能硬啃或者等搬运。
沉浸式翻译可以给这些视频实时加双语字幕,英文在上中文在下,100+ 个视频平台都支持,YouTube、Netflix 是其中最常用的。
X)上的视频没有原生字幕,沉浸式翻译有个"AI 字幕"模式,可以先识别视频里的语音,再翻译成双语字幕。还支持导出 SRT 字幕文件,直接丢进 Premiere 或者剪映用。
做视频的人应该懂这个的价值——找参考视频,不用手动转录了。
BabelDOC:把 PDF 翻译这件事真的做通了
重头戏来了。
PDF 翻译是个老大难:翻译出来的内容对了,但排版全崩了。公式跑飞、图表里的字没翻、多列变成一列、表格错位……要读还得先把内容拼回来。
BabelDOC 的解法是重新做一份。它先把整个 PDF 的结构解析出来——文字、图片、图表、公式的位置关系、字体、颜色、行间距全部记下来,翻译完之后不是往原文件里填字,而是参照原始布局重新渲染一份新 PDF。
所以出来的东西不像是"翻过的文件",更像是这份文档的中文版。
官方演示:多列排版和公式还原效果 实测:斯坦福 HAI 2025 年人工智能指数报告,456 页,各种多列排版、图表、脚注、彩色分区块。BabelDOC 全部处理正常,图表主副标题都翻了,角标没漏,带颜色的区块也对上了。
目前支持的复杂格式:多列排版、数学公式、表格、脚注、彩色分区块、多种字体混排。不支持的:扫描版 PDF(纯图片)、OCR 处理过的文档。
其他几个用得到的功能
图片翻译——截图里有英文?丢进来直接识别翻译,手写体也能搞,翻译后的文字融入原图背景,不破坏排版。
翻译后
漫画翻译——Pixiv 等漫画网站,点侧边的 M 按钮自动翻译,竖排文字支持,翻译结果不溢出气泡框。
翻译后
EPUB 电子书——直接上传翻译,可以导出双语版,一本书中英对照着读。
AI 术语库——法律、医学、游戏、科技等专业领域有专属词库,翻译专业文档更准确,还可以自己建词库。
隐私模式(OneAIFW)——比较少人知道这个。它会在本地先把敏感信息脱敏(姓名、银行卡号、密码等替换成占位符),脱敏后的内容才发到云端翻译,本地再还原回来。处理工作文档、合同的时候挺有用的。
免费能用到什么程度
核心功能全部免费,不需要注册,安装就能用:
网页翻译:不限次数 视频字幕:不限次数 输入框翻译:不限次数 普通 PDF 翻译:不限次数 BabelDOC 免费版:每月 50 万 Token(约 100 页) Pro 版每月 49 元(年付 588),换来的是高级 AI 引擎(DeepSeek、GPT、Gemini 等)、BabelDOC 每月 1000 页、漫画翻译、多设备同步这些进阶功能。
下载地址:immersivetranslate.com/zh-Hans/dow…
Chrome、Edge、Firefox、Safari 全支持,还有微信版本。
Chrome 2024 年度精选 参考链接
沉浸式翻译官网:immersivetranslate.com/zh-Hans/ BabelDOC 在线工具:app.immersivetranslate.com/babel-doc BabelDOC GitHub 开源仓库:github.com/funstory-ai…