为什么要进行定制
自从ChatGPT掀起大模型的高潮以来,各种大模型此起彼伏,大模型的性能提升也是日新月异,既然有这么多的大模型可以直接使用,为什么还要做定制呢?
其实,上面那些都是通用大模型,解决的都是通用问题。在使用这些大模型时,为了得到期望的效果,往往都需要写比较复杂的提示词,比如期望的角色定位、输出风格、内容组织等内容。如果是在某专业领域长期使用,每次都加上相同的提示词,非常的重复和繁琐。
解决这个问题的方法之一,就是定制大模型。可以看到,现在有非常多的定制大模型的产品,比如小红书文案、朋友圈文案等,都可以算做定制大模型的一种。
定制的方法
通用大模型难以精准模仿特定的语言风格、情感表达和人物设定的任务,那么通过设定角色定位,投喂特定语料,将大模型的人设定好,然后进行微调,就可以生成特定的大模型了。
定制大模型≈指定数据集 + 开源大模型 + 微调平台
动手定制
教程使用:讯飞星辰Maas 微调平台进行定制。
基于《甄嬛传》剧本中的甄嬛台词 ,通过五个简单的步骤,不写一行代码,打造一个模仿甄嬛语气、风格的专属聊天模型—— Chat-嬛嬛 。
Step1 一键直达注册账号
要完成一件事,先做好工具吧。
Step2 下载语料库
借用课程组提供的语料信息
Step3 创建定制模型
3.1 创建模型
3.2 选择基础模型
3.3 创建数据集
导入Step2下载的语聊。
3.4 提交训练
3.5 查看训练结果
3.6 发布服务
Step4 创建应用
Step5 体验成果
5.1 模型管理/[具体]模型点开
5.2 选择服务
这里有预置服务,也有刚才发布的服务,选择我的服务
5.3 试试效果