使用spaCy进行命名实体识别以检测编程语言

16 阅读1分钟

在这段新视频系列中,数据科学讲师 Vincent Warmerdam 开始使用 spaCy,这是一个用于 Python 自然语言处理的开源库。他的任务是:构建一个系统,用于自动检测大量文本中的编程语言。跟随他的过程,从最初的构思到原型,再到数据收集以及从头开始训练统计命名实体识别模型。

SPACY ● 网站: spacy.io ● GitHub: github.com/explosion/s… ● 免费在线课程: course.spacy.io ● 推特: /spacy_io

本视频 ● 代码: github.com/koaning/spa…... ● Stack Overflow 数据集: www.kaggle.com/stackoverfl…...

关于 VINCENT Vincent Warmerdam 是 PyData 阿姆斯特丹分会的联合创始人,也是一位经验丰富的数据科学讲师。在过去的 5 年里,他一直在推广数据和开源。您可能通过他的 PyData 视频认识他,在这些视频中,他试图捍卫数据科学中的常识而非炒作。

● 在推特上关注 Vincent: /fishnets88