Datawhale AI冬令营 Task2练手

117 阅读2分钟

霸总小说养成记

1. 数据集导入

image.png

数据集这里用alpaca格式

image.png

以jsonl格式导入 image.png

2. 建立模型

image.png

根据需要调整超参数,超参数小一些(0.00001以下)比较稳定,但大一些收敛更快,训练速度快。

image.png

训练轮次也是重要的超参数,会影响最终效果和训练总时间,轮次越大,时间越长,但并不代表训练轮次越多效果越好。

image.png

3. 提交和训练

image.png

训练过程效果:

image.png

根据服务器负担,有时候需要排队。训练中发现问题可以停止训练,但真实环境会扣费。

image.png

这训练效率,扎心了...

image.png

为了快速看到初始效果,调高了学习率,调低了一次输入的长度。 12分钟后训练1个轮次完成,进度条显示并不是很均匀。

image.png

4. 创建应用,关联服务

通过讯飞开放平台创建应用,以备后面绑定刚刚训练好的模型服务。

控制台-讯飞开放平台

image.png

填写应用信息。

讯飞开放平台左侧用的图标不是很醒目,还是建议默认有个文字提示。

image.png

回到刚刚的模型,发布为服务,并选择刚刚建好的应用。

image.png

5. 发布和体验

点击“发布”后进行体验。

image.png

体验页面左侧,默认会选择刚刚训练好的模型服务,可以再选择一个或多个未经过我们的数据训练过的模型,好做对照。

image.png

输入提示词:

你是一个熟读各类小说的专家,请你根据要求写一段800字左右的小说。 现代励志故事,一个失业青年如何克服生活困境,终于实现自我突破,成为行业翘楚的心路历程。

可以看到训练(数据微调)前后的模型的输出有一些风格上的差异。

image.png

6. 总结

可以看到,通过收集、清洗、格式化之后的数据,能够将模型引导到与微调数据样本源域类似的空间,能够生成指定风格、目标的输出。