精通spaCy:使用Python生态系统实现NLP应用的端到端实践指南
书籍概述
spaCy是一个工业级、高效的NLP Python库,提供各种预训练模型和即用型功能。《精通spaCy》为您提供spaCy功能的端到端覆盖和实际应用。
主要内容
入门基础
- 安装spaCy和下载模型
- 掌握spaCy的核心功能
- 原型化真实世界的NLP应用程序
可视化与模式匹配
- 熟悉spaCy流行的可视化工具displaCy
- 模式匹配的实际应用说明
- 进入词向量语义世界
信息提取与机器学习
- 统计信息提取方法的详细解释
- 结合spaCy特征创建真实世界NLP管道
- 实现情感分析、意图识别和上下文解析等ML模型
分类与框架集成
- 使用TensorFlow的Keras API与spaCy进行分类
- 涵盖意图分类和情感分析等热门主题
- 在流行数据集上应用并解释分类结果
技术特色
- 使用spaCy的高级形态和句法特征构建端到端工业级NLP模型
- 将基于规则的组件与spaCy统计模型相结合
- 构建自定义ML管道
- 应用所有知识使用spaCy设计聊天机器人
目标读者
本书适合想要在NLP领域取得卓越成就的数据科学家和机器学习工程师,以及想要掌握spaCy并使用它构建应用程序的NLP开发人员。想要使用Python和spaCy实践的语言和语音专业人士,以及想要使用spaCy快速原型化应用程序的软件开发人员也会发现这本书很有帮助。
要充分利用本书,需要具备Python编程语言的初级知识。对语言学(如解析、词性标签和语义相似性)的初级理解也将很有用。