使用spaCy和Prodigy构建新的NLP解决方案 - Matthew Honnibal
PyData Berlin 2018
在本演讲中,我将讨论如何解决新自然语言处理(NLP)项目最可能失败的一些原因。我的主要建议是采用迭代式方法:不要假设自己清楚管线应该是什么样子,更不用说标注方案或模型架构了。
章节
- 0:00 - 引言
- 2:21 - NLP项目就像初创公司
- 6:12 - 机器学习的需求层次
- 11:45 - 做出简单、显而易见且错误的建模决策(问题 #1)
- 17:05 - 将通用模型组合成新颖的解决方案(方案 #1)
- 19:05 - 工作流 #1
- 22:35 - 大型标注项目使证据收集变得昂贵(问题 #2)
- 24:00 - 运行自己的小微实验(方案 #2)
- 27:38 - 让薪资过低的人从事枯燥工作难以获得高质量数据(问题 #3)
- 28:43 - 更小的团队,更好的工作流(方案 #3)FINISHED