【Datawhale AI冬令营】零基础定制大模型

131 阅读2分钟

为什么要进行定制

自从ChatGPT掀起大模型的高潮以来,各种大模型此起彼伏,大模型的性能提升也是日新月异,既然有这么多的大模型可以直接使用,为什么还要做定制呢?

其实,上面那些都是通用大模型,解决的都是通用问题。在使用这些大模型时,为了得到期望的效果,往往都需要写比较复杂的提示词,比如期望的角色定位、输出风格、内容组织等内容。如果是在某专业领域长期使用,每次都加上相同的提示词,非常的重复和繁琐。

解决这个问题的方法之一,就是定制大模型。可以看到,现在有非常多的定制大模型的产品,比如小红书文案、朋友圈文案等,都可以算做定制大模型的一种。

定制的方法

通用大模型难以精准模仿特定的语言风格、情感表达和人物设定的任务,那么通过设定角色定位,投喂特定语料,将大模型的人设定好,然后进行微调,就可以生成特定的大模型了。

定制大模型≈指定数据集 + 开源大模型 + 微调平台

动手定制

教程使用:讯飞星辰Maas 微调平台进行定制。

基于《甄嬛传》剧本中的甄嬛台词 ,通过五个简单的步骤,不写一行代码,打造一个模仿甄嬛语气、风格的专属聊天模型—— Chat-嬛嬛 。

Step1 一键直达注册账号

讯飞星辰Maas

要完成一件事,先做好工具吧。

Step2 下载语料库

借用课程组提供的语料信息

数据来源:github.com/datawhalech…

Step3 创建定制模型

3.1 创建模型

image.png

3.2 选择基础模型 image.png

3.3 创建数据集

导入Step2下载的语聊。 image.png

3.4 提交训练 image.png

3.5 查看训练结果

直达 模型管理

image.png

3.6 发布服务

image.png

Step4 创建应用

直达 我的应用

image.png

Step5 体验成果

5.1 模型管理/[具体]模型点开

image.png

5.2 选择服务

这里有预置服务,也有刚才发布的服务,选择我的服务 image.png

5.3 试试效果

image.png