🎬 引言
在全球化的工作环境下,跨语言交流变得越来越重要。日常工作中,非中同事有时也需要阅读我们发送的消息、写下的文档。为了降低跨语言沟通的成本,我们没有必要也无法为所有材料提供双语,甚至是更多种语言的版本。这时,机器翻译/AI 辅助翻译就有了用武之地。
计算机科学中有句俗语 —— Garbage in, garbage out. 低质量的输入一定会得到低质量的产出。这句话对机器翻译来说也不假。如果我们输入的源文本是垃圾,如何确保别人能看懂机器翻译后的文本呢?因此,尽管中文是我们的母语,我们仍然需要学习如何写好中文,如何写高质量的中文。本文将为你介绍一些提升中文文本准确性的方法,从而帮助机器翻译取得更好的效果。
🗣️ 内容为王
在写作中,我们的思想通过词语、句子、段落表达出来。或许曾经你也有过“每个字都认识,但就是看不懂”的体验。让我们先从语言表达出发,看看如何使写作更简洁明了。
✍️ 词语
- 不说黑话:使用常见的词语。除非很适合受众且没有合适的替换词,尽量少使用行话、专业度高的词语,不要用黑话“击穿读者的心智”。
- 使用表意确切的词语:避免使用模糊的词语,比如“一点、可能、稍微”。
- 首次使用缩写/首字母缩略词时下定义:很多缩写和缩略词都有不止一个含义,第一次提及时,应标注完整词语并提供定义,以确保这些词语不产生歧义。
- 术语保持一致:在使用术语时,除了要及时下定义,还需要在全文中保持一致的表达。如果用多个术语指代同一个事物,读者就可能产生困惑:前后说的究竟是不是同一个东西?此外,在机器翻译中有“术语库”的概念,它将术语多语种的表达形成严格的对应关系,此时,原文中术语保持一致也就能确保翻译后的术语也一定会得到相同的结果。
✍️ 句子
- 少用长句:你还记得被“长难句”统治的恐惧吗?不论是什么语言,冗长的句子都会影响阅读的效率和效果。因此,我们推荐缩短句子的长度。当一句话中信息过多时,可以考虑拆句。另外,字数是决定翻译成本的最关键要素,若能在写作阶段提炼对受众有价值的信息并精炼表达,则能够节省翻译阶段的成本。
- 使用主谓宾(SVO) 句式结构:句子应尽量采用主语 + 谓语 + 宾语结构,读者能更容易地拆分出主谓宾,并理解它们之间的关系。这同时也意味着有些时候我们需要补全句子成分,把省略的主语/宾语显化出来。
✍️ 段落
- 合理分段:根据内容的层次、逻辑进行分段,不要将所有内容都放在一段长文字中。合理的分段能够帮助读者快速定位到自己需要的部分,减轻阅读负担。
- 使用总起句:总起句能让文章的结构更加清晰。在每一段/每一章节的开头加入一句总起句,对接下来要介绍的内容进行总结,能大大提高读者的阅读效率。
🎨 形式也需跟上
对于文章来说,优质的内容是最重要的,但内容的呈现形式同样需要注意。
- 格式简洁,少使用图表、图片:是不是有点反直觉?图文并茂不是很好吗?其实不然,机器翻译很难识别到图片中的文字,就算格式在翻译中得到了保留,其中的文字极大可能也会原封不动地保留下来。这时,你的插图就丧失了传达信息的能力,反倒不如用文字把事情讲清楚。如确有需要,应保留不带文本的原图副本,避免翻译阶段需要重新制图、绘图。
- 使用标题、子标题、无序列表、有序列表:正确运用这些元素能让文章结构更清晰,也能让机器更好地识别不同的段落。
🌍 注意文化差异
注意文化差异,使用恰当的词汇和表达方式,避免产生歧义。
尽管机器翻译在不断进步,有些成语、俗语它还是看不懂!根据我们上面所说的简洁表达原则,这些成语、俗语应该用常见的表达替换,或是直接删除。这是比较明显的文化差异。
还有些文化差异在于小处,比如互联网公司中常用的“同学”这个说法,大多数机器翻译引擎都会翻成 “Fellow student/Classmate”,完全体现不出“同事”的意思。非中同事可能会感到疑惑:工作得好好的,怎么突然开始忆同学了呢?同样也不要让你的同事变成 Iron Man(老铁)了。
🧐 检查同样重要
在完成写作后,根据上述的原则进行自我检查。在完成机翻后,同样要对结果进行校对和审核,确保没有表达错误或不清的地方。
- 提供反馈,帮助达成更好的翻译效果:你可以将调整后的原文和译文存入翻译术语库、记忆库,也可以根据翻译中不足的地方调整和改进 prompt,从而在未来取得更好的翻译效果。
- 寻求专业译员进行译后编辑:如果你的文字需要面对大量非中受众,建议在发布前聘请专业译员进行检查来规避风险,译后编辑的价格比直接找翻译要低哦。
🥜 结语
工作中,不乏“上游发力,下游受益”的例子。写好中文,从而使机器翻译取得更好的效果,也是其中的一部分。你可以在日常的内容创作中有意识地应用上述策略,持续改进中文表达,从而更高效地获取更优质的多语言文本。希望可以在多语言的工作环境中帮助到你!