在本系列新视频中,数据科学讲师Vincent Warmerdam 开始使用spaCy(一个用于Python语言的自然语言处理开源库)。其目标是:构建一个系统,以自动检测大量文本中的编程语言。视频记录了他从最初构思到原型开发,再到数据收集和从零开始训练统计命名实体识别模型的完整过程。
spaCy ● 网站: spacy.io ● GitHub: github.com/explosion/s… ● 免费在线课程: course.spacy.io ● Twitter: @spacy_io
本视频 ● 代码: github.com/koaning/spa…... ● Stack Overflow 数据集: www.kaggle.com/stackoverfl…...
关于 Vincent Vincent Warmerdam 是 PyData 阿姆斯特丹的联合创始人,也是经验丰富的数据科学讲师。过去五年中,他一直在积极推广数据和开源技术。他的 PyData 视频可能为人所熟知,在视频中他试图在数据科学领域倡导以常识对抗炒作。
● 在 Twitter 上关注 Vincent: @fishnets88
章节
- 0:00 介绍
- 1:37 数据源
- 2:24 入门指南
- 3:42 随机标题
- 4:17 Go语言
- 10:35 依赖关系图
- 13:10 文档
- 13:40 代码改进
- 27:52 结果
- 30:20 结论FINISHED