《精通spaCy》:Python生态NLP应用构建实战指南

4 阅读3分钟

关于本书

构建端到端的工业级NLP模型,利用spaCy的高级形态和句法特性,轻松创建实际应用。

主要功能:

  • 概述spaCy为自然语言处理提供的功能
  • 学习spaCy各项功能的细节以及如何有效使用它们
  • 通过spaCy进行实践操作

书籍描述: spaCy是一个工业级的、高效的NLP Python库。它提供了各种预训练模型和即用型功能。《精通spaCy》为您提供了spaCy功能和实际应用的端到端覆盖。

您将从安装spaCy和下载模型开始,然后深入学习spaCy的功能和原型设计实际NLP应用程序。接下来,您将熟悉使用spaCy流行的可视化工具displaCy进行可视化。本书还为您提供了模式匹配的实践说明,并帮助您通过词向量进入语义世界。统计信息提取方法也得到详细解释。之后,您将涵盖一个交互式商业案例研究,该案例向您展示如何结合所有spaCy功能来创建真实的NLP管道。您将实现机器学习模型,例如情感分析、意图识别和上下文解析。本书进一步侧重于使用流行框架(如TensorFlow的Keras API)与spaCy一起进行分类。您将涵盖热门主题,包括意图分类和情感分析,并在流行数据集上使用它们并解释分类结果。

通过阅读本书,您将能够自信地使用spaCy,包括其语言特征、词向量和分类器,来创建自己的NLP应用程序。

您将学到什么:

  • 安装spaCy,轻松上手,并编写您的第一个Python脚本
  • 理解spaCy的核心语言操作
  • 发现如何将基于规则的组件与spaCy统计模型相结合
  • 熟练掌握命名实体和关键词提取
  • 使用spaCy构建您自己的机器学习管道
  • 应用所学所有知识,使用spaCy设计一个聊天机器人

本书读者对象: 本书适用于希望在NLP领域出类拔萃的数据科学家和机器学习者,以及希望掌握spaCy并使用它构建应用程序的NLP开发者。希望深入了解Python和spaCy的语言和语音专业人士,以及希望使用spaCy快速原型化应用程序的软件开发人员也会发现本书很有帮助。需要具备Python编程语言的初级知识才能充分利用本书。对解析、词性标注和语义相似性等语言学有初级理解也会有所帮助。

产品描述

关于作者

Duygu Altınok 是一位高级NLP工程师,在NLP的几乎所有领域拥有12年经验,包括搜索引擎技术、语音识别、文本分析和对话式AI。她曾在LREC和CLNLP等会议上的NLP领域发表了多篇论文。她还乐于从事开源项目,并且是spaCy库的贡献者。Duygu于2010年在安卡拉中东理工大学获得计算机工程学士学位,随后于2012年在安卡拉比尔肯特大学获得数学硕士学位。她目前是某机构的高级工程师,专注于语音助手的对话式AI。

  • 出版社:某机构
  • 出版日期:2021年7月9日
  • 语言:英语
  • 页数:356页
  • 尺寸:19.05 x 2.06 x 23.5 cmFINISHED