大模型偏好对齐,包括偏好数据、奖励函数等工作

暂无订阅 共0篇文章 创建于2024-08-20