「深入理解 NLP 的中文分词:从原理到实践」封面
VIP
深入理解 NLP 的中文分词:从原理到实践
7.98
在中文的语言环境里,中文分词是 NLP 基础中的基础,核心中的核心,直接影响着各种 NLP 任务最后的结果质量。
推荐算法Leader @ 某知名出海互联网公司
学习群
首单券后价
首单券后价
¥ 19.95 立即购买
原价 ¥39.9
VIP借阅
免费试学
582 人加入学习
20 小节
·
约 103分55秒
介绍
目录
评论

作者介绍

周兴博,互联网行业十年从业者,出于对全栈工程师头衔的渴望,从事过多种技术岗位,信息安全、基础网络服务、服务端架构、机器学习、NLP等,积累了丰富的经验,对各种技术有着深刻理解,熟练使用Python,Golang,Java等开发语言,在亿级日活的互联网公司设计并开发过搜索系统、推荐系统。

小册介绍

随着人工智能技术的发展,越来越多的互联网公司开始重视机器学习在其业务中的价值。就拿近些年大火的字节跳动来说,其旗下的今日头条、抖音、西瓜视频,都是依靠着其强大的智能推荐系统,将海量的内容以个性化的方式分发给用户,最终赢得了大量的忠实用户,这背后自然是离不开NLP的功劳。

NLP是Natural Language Processing的缩写,中文意思是自然语言处理,是人工智能的一个子领域。由于深度学习的发展,机器在图像识别、语音识别方面已经取得了巨大的进步,达到了惊人的准确率。而让机器能够理解人类语言的这个问题上,还有很大的发展空间,所以掌握NLP的基础知识就非常有必要。

在中文的语言环境里,中文分词是NLP最基础,也是最核心的问题,几乎影响着所有NLP任务最后结果的质量。想必做过全文搜索、关键词挖掘的同学,都切身的感受过中文分词那满满的恶意,大量的专有名词切分不出来,或者切分出来很多的歧义词。这时候只能是无奈的手动一个一个往分词词典里添加或者调整词频,但这样不仅耗时耗力,而且治标不治本,无法跟上业务的发展速度。

本小册的核心是希望通过深入讲解中文分词的原理及实践经验,来帮助大家彻底掌握中文分词技术,以便能够灵活应对各种分词难题。同时中文分词背后所涉及到的算法和模型,都是机器学习最重要的基础,有助于大家从事其它机器学习的相关工作。

你会学到什么?

中文分词经历了20多年的发展,从最开始的蛮荒阶段,到现在的趋于成熟,过程中克服了种种艰难险阻,产生了大量思想和方法,我会取其精华,并深入浅出地讲述给大家,大家会学到:

  1. 少量的中文语言学,帮助理解中文分词所要面对的难题
  2. Python的编程知识,用于算法的实践和开源项目的源码讲解
  3. 统计学和信息论,中文分词的算法里使用了很多这两方面的知识
  4. 机器学习知识,主要涉及HMM、CRF、Word2vec等模型
  5. 业务案例分析,结合实际业务场景,介绍各种解决方案

适宜人群

  1. 渴望从事NLP相关工作的初学者
  2. 希望提高NLP基础理论知识和实践技巧的初中级开发者
  3. 对机器学习、NLP等技术感兴趣的爱好者

购买须知

  1. 本小册为图文形式内容服务,共计 20 节;
  2. 全部文章已更新完成;
  3. 购买用户可享有小册永久的阅读权限;
  4. 购买用户可进入小册微信群,与作者互动;
  5. 掘金小册为虚拟内容服务,一经购买成功概不退款;
  6. 掘金小册版权归北京北比信息技术有限公司所有,任何机构、媒体、网站或个人未经本网协议授权不得转载、链接、转贴或以其他方式复制发布/发表,违者将依法追究责任;
  7. 在掘金小册阅读过程中,如有任何问题,请邮件联系 xiaoce@xitu.io
推荐小册
京ICP备18012699号-3 ©版权所有 北京北比信息技术有限公司

公司地址:北京市海淀区信息路甲28号13层B座13B-5 | 公司座机:010-83434395