基于spaCy与Prodigy的迭代式NLP方案构建

4 阅读1分钟

使用spaCy和Prodigy构建新的NLP解决方案 - Matthew Honnibal

PyData Berlin 2018

在本演讲中,我将讨论如何解决新自然语言处理(NLP)项目最可能失败的一些原因。我的主要建议是采用迭代式方法:不要假设自己清楚管线应该是什么样子,更不用说标注方案或模型架构了。

章节

  • 0:00 - 引言
  • 2:21 - NLP项目就像初创公司
  • 6:12 - 机器学习的需求层次
  • 11:45 - 做出简单、显而易见且错误的建模决策(问题 #1)
  • 17:05 - 将通用模型组合成新颖的解决方案(方案 #1)
  • 19:05 - 工作流 #1
  • 22:35 - 大型标注项目使证据收集变得昂贵(问题 #2)
  • 24:00 - 运行自己的小微实验(方案 #2)
  • 27:38 - 让薪资过低的人从事枯燥工作难以获得高质量数据(问题 #3)
  • 28:43 - 更小的团队,更好的工作流(方案 #3)FINISHED