本篇内容教大家如何下载和使用!
一、预训练模型下载
ERNIE 2.0 英文Base 模型
ernie.bj.bcebos.com/ERNIE_Base_…
包含预训练模型参数、词典vocab.txt、模型配置ernie_config.json
ERNIE 2.0 英文Large 模型
ernie.bj.bcebos.com/ERNIE_Large…
包含预训练模型参数、词典vocab.txt、模型配置ernie_config.json
二、数据下载
中文数据:ernie.bj.bcebos.com/task_data_z…
英文数据:由于数据集协议问题,在这里无法直接提供英文数据集。GLUE 的数据下载方式请参考GLUE 主页(gluebenchmark.com/tasks)以及GLUE 提供的数据下载代码(gist.github.com/W4ngatang/6…)。
假设所有数据集下载放置的路径为$GLUE_DATA,将数据下载完毕后,执行sh ./script/en_glue/preprocess/cvt.sh $GLUE_DATA将完成所有数据的格式转换,默认转换后的数据会输出到文件夹./glue_data_processed/。
三、PaddlePaddle安装
本项目依赖于Paddle Fluid 1.5,请参考安装指南
(www.paddlepaddle.org.cn/#quick-star…)进行安装。
【重要】安装后,需要及时的将CUDA、cuDNN、NCCL2 等动态库路径加入到环境变量LD_LIBRARY_PATH 之中,否则训练过程中会报相关的库错误。具体的paddlepaddle配置细节请查阅:
www.paddlepaddle.org.cn/documentati…
如果您想了解更多的Paddle 的相关信息,例如针对实际问题建模、搭建自己网络等,这里有更多的来自官方的文档供您参考:
- 基本概念 :介绍了Fluid 的基本使用概念
- 准备数据 :介绍使用Fluid 训练网络时,数据的支持类型及传输方法
- 配置简单的网络: 介绍如何针对问题建模,并利用Fluid 中相关算子搭建网络
- 训练神经网络:介绍如何使用Fluid 进行单机训练、多机训练、以及保存和载入模型变量
- 模型评估与调试:介绍在Fluid 下进行模型评估和调试的方法
ERNIE的其他依赖列在requirements.txt文件中,使用以下命令安装
pip install -r requirements.txt
划重点!
查看ERNIE模型使用的完整内容和教程,请点击下方链接,建议Star收藏到个人主页,方便后续查看。
GitHub:github.com/PaddlePaddl…

版本迭代、最新进展都会在GitHub第一时间发布,欢迎持续关注!
也邀请大家加入ERNIE官方技术交流QQ群:760439550,可在群内交流技术问题,会有ERNIE的研发同学为大家及时答疑解惑。
