一起养成写作习惯！这是我参与「掘金日新计划 · 4 月更文挑战」的第12天，点击查看活动详情。

AUTOPROMPT详解

AUTOPROMPT算法

$x\_{inp}$ ：任务的原始输入

例如情感分析中输入的为一句话

为了构建提示，要区别输入到 MLM 的 $x\_{prompt}$ 和原始输入 $x\_{inp}$ 。
$x\_{trip}$ ：触发词

触发词构成触发集，所有输入都共享同一个触发集。通过预先的梯度搜索来确定，是 AUTOPROMPT 中的核心元素。

🤔AUTOPROMPT 方法的自动也主要就体现在这里了，通过预先梯度搜索训练从原输入中确定好触发词集，通过[MASK]标签构建一个人无法理解但是机器可以理解的模板来做后续的 MLM。其作用是方便后续计算概率，确定最终的预测结果。
$x\_{prompt}$ ：最终输入到 MLM 模型中的 Prompt

使用模板 $\lambda$ 将 $x\_{inp}$ 和 $x\_{trip}$ 构成 $x\_{prompt}$

⚠️注意：AUTOPROMPT 提供的模板并非人正常阅读理解的语义。
模板 $\lambda$

模板 $\lambda$ 定义了每个输入序列在提示中位置，以及任何附加标记的位置。

此外，模板 $\lambda$ 还必须定义一个特殊的 [MASK] token 的位置，用来让 MLM 填写（在模板中用 [P] 去标记，以区别于可能出现的其他 [MASK] 标记）。

将提示输入到 MLM 中会产生一个概率分布 $p(\[MASK]|x\_{prompt})$ ，用来描述哪些标记最有可能是填空的答案。