大语言模型(LLM)入门 - (10) 多头掩码自注意力机制

30 阅读1分钟

文章来自:大语言模型LLM小白自学入门项目TiaoYu-1 github.com/tiaoyu1122/…

项目优点:

  • 行行代码有注释
  • 全中文
  • 配套原理文档

10-多头掩码自注意力机制_00.png