为什么要进行模型微调?
这里可以举一个简单的例子:
假设小明刚从新东方毕业,他每样菜都会做一点,但是每样菜都做的一般般
然后他进入了一家川菜馆,每天都做麻婆豆腐,边做还边练习,最后成了一个做麻婆豆腐的高手。
这里刚毕业的小明就是预训练的模型,边做边练习麻婆豆腐就是微调的过程!
所以,为了让预训练的模型具备更多的知识或者增强模型在某方面的能力来满足我们的需求,我们需要对模型进行微调。
LLaMA-Factory
LLaMA-Factory 是一个国内北航开源的低代码大模型训练框架,专为大型语言模型(LLMs)的微调而设计。不仅高效低成本,而且有UI界面,非常方便使用。今天我们就来介绍一下怎么使用LLaMA-Factory对预训练模型进行微调。
使用LLaMA-Factory微调llama-3-8b-Instruct-bnb-4bit
这里我们演示的是在Colab上开源的代码,Colab上有免费的GPU资源,足够我们学习使用,在本地微调的话就需要把所有代码在本地运行。
01.打开Colab地址
colab.research.google.com/drive/1d5KQ…
登录后点击“连接T4”,Colab上有免费的T4可以使用
免费 T4 申请教程:zhuanlan.zhihu.com/p/642542618
02.安装LLaMA Factory依赖
03.检查GPU环境
04.更新Identity Dataset
可以自由修改 NAME 和 AUTHOR 变量的内容。
05.打开微调UI界面
运行成功后会生成一个网址,打开就是微调界面
使用UI界面微调大模型视频教程: cdn-oss-prod.unlimiai.com/edu-prod/67…
更多AI知识请前往脑洞大开AI实验室官方网站
使用脑洞大开AI实验室AI对话功能,可访问
www.ai360labs.com/playground/…
点击底部分享、赞和在看,把好内容传递出去