AI产品经理必懂的3个大模型微调指标

109 阅读3分钟

哈喽,大家好!

我是阿星👋

天天听微调,什么微调是好,什么样的算失败呢?

怎么判断训练效果呢?

一般看下面三个指标(小白可读)——

(关于什么是微调可以看之前推过的)

1、训练损失Training Loss

可以先进行3轮学习,每次学完考试,可能会考原题,考的都是训练集里的题。所以当然和答案差距越小说明学的越好。训练损失考察的是依从能力,我们越来越朝着理想的训练结果走。😊

但是训练很多次后你可能发现数值没变,最常见的2个原因就是你数据质量不行,要么就是你数据太少了😭。因为你数据不给力,无法再继续提升了。

2、验证损失Validation Loss

验证损失这个指标,有点像让模型考非原题,我们可能会把训练集中的一部分题抽出来不去训练,等训练完了再坏坏地拿这些没有练过的题让模型回答😂

回答完了之后对比一下,和我们答案对比一下,相差越小成绩越好,说明模型没看所有答案(有一部分没提前学过)但是答对的确比较多🤔。所以验证损失考验的是模型的泛化能力。💪🏻

如果出现这种情

1、训练损失下降(说明答得还行),

2、验证损失没变(泛化没有提升)

又是怎么回事呢?🤔动动你的小脑筋

说明它的泛化能力下降了被阻止前进了,可能出现了过拟合的情况,过拟合的意思你可以理解为有点死脑筋,别的问题回答的没那么好,就针对训练集里的东西会得很。

这个时候唯一的办法就是增加训练集的丰富程度☁️🌧🌩。让它格局打开🚀

3、验证准确率 Validation Token Accuracy

验证准确率,你可以简单看成是验证损失的进一步计算。就是看数据集的prompt的输出结果,和验证集答案的相似度。

4、目前常见的微调工具

常用的有两种,如果你已经在关注微调,相信你已经有技术基础。

1、阿里云百炼

支持通义模型和开源模型

比较主流

成本较低 sft 7B 千条数据全参成本低于10元

图片

2、LLaMA-Factory

开源微调工具

支持大部分开源模型

支持所有微调方式

硬件要求较高,GPU必须有,至少你要要32GB内存以上

之前有写相关教程,小白可以上手体验~👇

零基础也能体验模型微调!魔塔+LLaMa Factory手把手教程

图片

5、图像生成微调

微大部分微调线上你可以用liblib、吐司、堆友都可以,开源的你可以选diffusers。所以看到这里大家应该对微调的基本指标有了一个最简单的了解。但是如果你仔细看我之前写过的文章,你就会发现它是有特定场景才需要微调的。