今天帮学长安装了可以在本地纯cpu 推理最高不超过8GB内存的模型外挂知识库版本,不过模型本身限制token太少以至于任务完成度不佳。
晚上还跑了datawhale 的baseline,时间序列模型使用三种树模型进行模型融合,因为设置的学习率太低收敛速度慢,想到是否可以动态调节学习率,学到了一些动态学习率衰减的方法,比如step decay等
展开
评论