应用NLP:来自实战领域的经验
Peter Baumgartner | spaCy IRL 2019
今日议题
- 识别应用问题
- 交付有效的解决方案
- 分享您的工作与开拓新领域
什么是应用NLP?
使用现有的NLP技术,来解决新颖的商业问题,这些问题所使用的数据通常不在标准基准测试和已记录的例子范围内。
- 她使用BERT对带标签的数据进行分类,将开放式调查问卷的回答分为了六个类别。
- 那位数据科学家训练词嵌入模型来识别俚语词汇。
- 客户对使用命名实体识别技术从评论中删除个人姓名的做法感到满意。
我们使用过的一些数据类型
- 开放式(自由文本)调查问卷回答
- 期刊文章
- 新闻文章
- 电子健康记录
- 项目评审
- 访谈记录
- 电话摘要
- 社交媒体(推文,YouTube评论)
- 包装商品标签
问题对齐
如果没有NLP,您会如何解决这个问题?
安于现状的安迪不了解问题所在 需求:
- NLP示例
- 商业背景
- 数据评估
图省事的埃德想要其他选项 需求:
- 数据收集
- 数据管理
- 简单的解决方案
爱表现的莎拉想做“人工智能” 需求:
- 期望管理
- NLP示例
乐于助人的汉娜拥有结构化数据 需求:
- 数据管理
- 补充性分析
标签狂人拉里拥有“已标注”数据 需求:
- NLP/机器学习示例
- 数据管理
准备充分的帕姆理解问题和NLP 需求:
- 数据验证
项目交付
祝贺!您现在成为了: 项目经理、或技术负责人、或产品负责人、或者您向以上其中一位汇报。
NLP与机器学习项目的独特性
管理不确定性
- 实验日志
- 实验跟踪
- 效用信心
- 结果项目状态报告
- 沟通不确定性
构建隐喻
如何构建隐喻