NLP中的常用模型

NLP中的常用模型

NLP中的常用模型

收集，复现分享NLP中的典型模型。

暂无订阅共3篇文章创建于2022-07-16

Transformers源码分析-BERT(Pytorch)

Transofrmers版本4.21 这里只考虑预训练的代码，毕竟预训练才是最重要的，一通百通。即 BertForPretraining这个类获取类调用的关系图UML图图中左侧箭头对应NSP任务的

3年前
1.1k
1
评论

Transformer的自己实现

面试准备： Transformer 作为一种序列转换模型(sequence transduction)完全抛弃了RNN\CNN等传统的方案。

3年前
866
点赞
评论

ELMo模型理解

ELMO充分利用了Bi-LSTM的各层的所有输出以及Embdding层来解决了Word2vec存在的不支持一词多义的缺陷。

3年前
288
点赞
评论

Transofmer中的N个为什么

Transformer系列模型的面试常见问题和深入理解：为什么要除以d_k，残差和LaryNorm的先后对模型有什么影响？为什么要共享Embedding参数？可不可以不共享

3年前
168
点赞
评论