整理了学习transformer的不理解的地方,以及学习的结果。详细理解了各个变量的形状大小。

暂无订阅 共6篇文章 创建于2025-08-15