MiniCPM:调参教科书

166 阅读1分钟

记得很多次模型无法收敛,最后都是通过调参来解决

调参绝不只是锦上添花,而是系统的关键之一

说调参是核心技术也不为过

再好的模型,若没有与之匹配的调参方法就没法发挥出其潜力

但调参也是最枯燥的工作之一,需要进行很多次对比实验

相信有一天,会出现一套标准调参方法适用于绝大多数的深度学习任务

MiniCPM:揭示端侧大语言模型的无限潜力