细数Bert的各种优化方案,包括针对MASK不一致性和独立性的优化,模型蒸馏,内存压缩,生成任务,中文任务,长文本建模等等

avatar
avatar
avatar
等 3 人订阅 共9篇文章 创建于2022-08-10