今天学习了如何快速通过微调预训练模型搭建领域内定制的大模型。以下是摘抄的一些笔记
常见的微调数据集需要符合 Alpaca格式 ,此外,还有 ShareGPT 等格式
以下为Alpaca格式示例内容:
{
"instruction": "小姐,别的秀女都在求中选,唯有咱们小姐想被撂牌子,菩萨一定记得真真儿的——",
"input": "",
"output": "嘘——都说许愿说破是不灵的。"
}
instruction:任务的指令,模型需要完成的具体操作,一般可以对应到用户输入的 Prompt 。input:任务所需的输入内容。若任务是开放式的,或者不需要明确输入,可以为空字符串。output:在给定指令和输入的情况下,模型需要生成的期望输出,也就是对应的正确结果或参考答案。
步骤:
Step1:注册讯飞星辰Maas(点击打开官网)
Step2:下载 嬛嬛数据集
Step3:定制专属嬛嬛大模型!
Step4: 创建应用
Step5:体验AI嬛嬛