使用ChatGTP完成自动化翻译外刊

222 阅读2分钟

目前对于国外文献期刊,只有专业的人工翻译或者借助机器翻译加后期人工润色,这种工作在目前看来是很有技术水平的,但是随着chatGTP的应用领域拓展,我想到一个Idea,可以使用chatGTP代替这个重复工作。

下面是我的一些想法: 如果可以自动爬到文章的内容,可以把每次一爬到的文章内容数据丢给GTP API 或者 传统方法:翻译API的接口; 如果是GTP的话,只要能拿到内容数据,不管里面内容结构有多乱或者掺杂html元素,只要给他合适的promt来约束,比如我们在发送数据哪里给它尝试设计一个固定的请求规则:

rule: Please translate this article into Chinese completely and write fluently like an editing expert, and let each paragraph be natural 或 ‘翻译这篇文章为中文+‘获取到的内容数据content’’

就可以获取到返回消息保存到数据库,并且文章真的很通顺,比一部分人工翻译的都要好!

难点:

如何合法爬取多个网站,每个网站的结构都有所不同,无疑很复杂; 目前gtp3.5的接口对文字限制,完成不了太长的文章的翻译回复,只有gtp-4可能可以实现,而且gtp-4的收费标准也很高 (PT-4的API可以处理最多32,768个单词(约为16万个字符)的输入和输出,而GPT-3.5的API只能处理最多8,192个单词(约为4万个字符)的输入和输出),各位大佬有什么好的解决方案没?或者根据我这个想法有了更好的chatgtp应用领域idea?

11.png