Deep or Simple Models for Semantic Tagging? It Depends on your Data

Jinfeng Li, Y uliang Li, Xiaolan Wang, Wang-Chiew Tan Megagon Labs

研究背景

语义标注在文本挖掘中有着广泛的应用，它预测给定的文本是否表达了给定语义标签的含义。语义标注的问题很大程度上是通过监督学习来解决的，如今，深度学习模型被广泛认为更适合语义标注。然而，没有全面的研究支持这一流行观点。相关从业者通常必须为每个语义标记任务训练不同类型的模型，以识别最佳模型。这个过程既昂贵又低效。

什么是语义标注问题？

许多用于处理文本的应用依赖于用语义信息标签来标记单词、短语或句子。例如，情感分析用一个情感标签来注释句子或短语，该标签指示该句子是否具有积极或消极的情感。下游应用程序利用这些情感标签来确定适当的动作。另一个例子是实体标记，它确定文本中的跨度是否指向现实世界的对象。一般来说，用语义标签标注文本的任务可以称为语义标签问题。更准确地说，语义标记器将一段文本和一个预定义的标记作为输入，并输出该文本是否传达了标记的语义。在这篇论文中，我们关注的是短文，它可以是一句话，或者一段话。我们也把短文笼统地称为句子。

为什么要研究此方向？

语义标注构成了许多任务的核心，包括情感分类、建议挖掘和幽默检测。然而，现有的研究仅在单个任务上比较深度和简单的模型。此外，它们没有提供数据集特征如何影响不同模型性能的见解。因此，很难将其模型选择标准推广到新任务或同一任务的新数据集。因此，给定一个新的数据集，仍然不清楚选择深度模型是否会带来最佳的标记性能。因此，本文要回答深度模型是所有语义标注任务的最佳执行模型吗？给定一个新的数据集，应该选择什么模型？

研究方案

Step 1(调查了一些应用中的标签)