
特性介绍
Stanford CoreNLP 提供了一系列自然语言的分析工具,对于用户提供的一段文字,无论是公司名,人名还是时间日期、数量,它都能提供出每个词语的组成与语法,并且用短语、词汇间的依赖关系来标记出语句的组成结构,比如那些名词指代同一个事物,比如根据上下文的描述来分析观点与开放式的事物关系等。
Stanford CoreNLP 有以下特性:
- 一个完整独立的,且拥有一系列强大的语法分析功能的工具集
- 对任意文章段落都能快速分析,并且效果稳定可信赖
- 对文本整体化的分析保持高质量表现
- 支持多国语言
- API支持当下多种流行通用的开发语言
Stanford CoreNLP不仅是一个一体化的完备的框架,更有良好的灵活性与可扩展性,你可以很方便你的选择你需要使用或不使用的语言分析工具模块。Stanford CoreNLP整合了大量Stanford的自然语言处理工具,包括:
- 词性(part-of-speech POS)标记工具
- 命名实体解析器(NER)
- 解析器
- 相互引用解析系统(coreference resolution system)
- 情感分析
- bootstrapped模式学习工具
开发语言和操作系统
Stanford CoreNLP 是由Java开发的,目前的realease版本(3.6.0)需要Java1.8以上的版本。 至于如何使用它?放心,有很多种方式:
- 通过相应的程序语言的client API
- 通过命令行工具
- 通过调用CoreNLP的server服务
开发资源
官方网站:stanfordnlp.github.io/CoreNLP/
开源地址:github.com/stanfordnlp…