方案思路
Task2的任务的主要的思路是使用RNN网络构建encoder,decoder,通过构建seq2seq的网络结构对文本进行相关翻译。
代码解读
运行命令创建文件夹放置后期的model和数据
安装相关的软件包
个别软件在线安装较慢,下载到本地然后上传到魔搭平台进行本地安装
获取中英文的tokenizer
对数据进行处理
数据tokenizer化
生成中英文的batch数据
load_data函数
Encoder函数
attention函数
Decoder函数
seq2seq函数
统计运行时间函数
训练函数
评估训练结果函数
对文本进行翻译函数
计算翻译效果的bleu值分数
主训练函数,多轮次进行训练,保存最好的模型到本地,评估训练中间的模型,打印训练的日志
设定相关参数,设置相关数据的时候注意相对路径
运行主程序进行训练
对训练好的模型在验证集上进行测试
生成测试结果