-
老师(大模型):比如一个复杂的AI模型,它很聪明但体积庞大(比如ChatGPT),运行需要很多算力,像一台超级计算机。
-
学生(小模型):一个更轻便的AI,比如手机上的APP里能用的模型,但直接训练的话,效果可能不如大模型。
-
“教”的过程:
- 老师先自己学习大量数据,变得很厉害。
- 然后老师不光告诉学生答案(比如“这是猫”),还会告诉学生它思考的细节(比如“90%像猫,10%像狗,因为耳朵尖”)。
- 学生通过模仿老师的“思考方式”,而不是死记硬背答案,最终也能达到接近老师的效果,但体积小、速度快。
举个栗子🌰:
老师看到一张猫的图片,会说:“这大概率是猫(90%),但也有点像狗(10%),因为耳朵形状不太典型。”
学生听了后,不仅记住“这是猫”,还学到了“耳朵形状是关键细节”。下次遇到类似的图,学生也能更聪明地判断。
好处:小模型变轻便了,但效果接近大模型,适合装在手机、智能手表等设备里。